0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

RISC-V跑大模型(一)

perfxlab ? 來源:RVBoards ? 2023-07-10 10:07 ? 次閱讀

在我寫本文時,剛好是WAIC 2023舉行的時候,感覺無處不是大模型。

所以,RISC-V怎么能不刷刷大模型呢?廢話不多說,先上圖:

c726a22c-1d95-11ee-962d-dac502259ad0.png

去年,ChatGPT的出現(xiàn)震驚了全世界,在短短幾個月的時間內(nèi),ChatGPT的月活躍用戶達到了1億。ChatGPT的成功讓許多人第一次知道了大語言模型(Large Language Model)的概念,而今年Meta發(fā)布的LLaMA則在ChatGPT的基礎上又往前跨了一大步,它大大降低了LLM的使用難度,讓LLM真正“走進基層”。那LLaMA是什么呢?

1. LLaMA介紹

在介紹LLaMA之前,首先要介紹一下LLM(Large Language Model)。我們可以將LLM看成一位知識淵博的老師,在經(jīng)過大量的知識學習(大量文本數(shù)據(jù)的訓練)后,LLM會基于它的知識庫,給出問題的最佳答案,我們可以使用LLM來完成文本總結(jié)、翻譯、情感分析等工作。最近幾年,是LLM的高速發(fā)展期,很多科技巨頭都在LLM投入大量的資金。下面是這幾年LLM的成果圖:

c773fc48-1d95-11ee-962d-dac502259ad0.png

近年來現(xiàn)有大型語言模型(大小大于10B)的時間表

但對于個人研究者而言,LLM的使用是有一定的門檻,一般的LLM模型對硬件的要求比較高,而一些開發(fā)公司出于商業(yè)的目的,并不打算將項目的源碼進行開源,這都限制了個人研究者從更深的層次去了解LLM,在一定程度上這影響了LLM的發(fā)展(Android能有今天地位,離不開開源和方便使用,這為它后來的迅速發(fā)展打下了良好的基礎)。

好在今年Meta發(fā)布的LLaMA(Language Learning through Multimodal Autoregressive Models)給了對LLM感興趣的開發(fā)者另一個選項,相較于其他的LLM模型而言,LLaMA優(yōu)勢在于它足夠親民且開源。

從親民的角度來說,LLaMA的規(guī)模僅為ChatGPT的“十分之一”,但性能卻優(yōu)于OpenAI的GPT-3模型,而且LLaMA只是一個基礎模型,它完全可以使用公開的數(shù)據(jù)模型進行訓練,這都使得LLaMA的使用門檻被大大降低;從開源的角度來說,LLaMA可以說是被迫開源,因為技術方面的問題,Meta暫緩了開源過程,但在發(fā)布后的不久,LLaMA的模型文件就被泄露了,那么,問題來了,這究竟是故意的還是不小心的呢?

2. llama.cpp

llama.cpp是由保加利亞索非亞的Georgi Gerganov基于LLaMA模型開發(fā)的純C版本。Georgi Gerganov是一位資深的開源社區(qū)開發(fā)者,曾經(jīng)還為OpenAI的自動語音識別模型開發(fā)了whisper.cpp。llama.cpp可以讓使用者在沒有GPU的情況下也能運行LLaMA模型。

所以它一經(jīng)發(fā)布,就吸引了大量對LLaMA感興趣的人下載使用,很快就有人找到了在Windows上運行LLaMA的方法,之后又實現(xiàn)了在手機上的運行。llama.cpp大大降低了LLaMA的使用門檻,通過llama.cpp,LLaMA展現(xiàn)了它無與倫比的語言學習能力,為我們打開了一座探索語言世界的新大門。

值得一提的是,Georgi Gerganov在公布llama.cpp后的幾個月就自主創(chuàng)業(yè),成立了ggml.ai公司,這個公司的合伙人有GitHub前CEO Nat Friedman和Y-Combinator的Daniel Gross。ggml.ai的成立也引起了許多業(yè)內(nèi)大佬的注意,或許它之后會為AI的發(fā)展帶來一些不一樣的東西。

3. 硬件平臺簡介

3.1 RISC-V簡介

澎峰科技聯(lián)合創(chuàng)始人王軍輝說“2023年是RISC-V高性能計算元年”。因為2023年算能推出了全球第一顆已量產(chǎn)的RISC-V服務器級64核CPU,這意味RISC-V進入高性能計算領域的未來已經(jīng)不遠了。那么,RISC-V到底是什么? 簡單來說,RISC-V和我們熟悉的X86、ARM一樣,都是指令集架構,但X86屬于復雜指令集(CSIC),RISC-V和ARM屬于精簡指令集(RISC)。

雖然CISC指令豐富功能強大,但隨著CISC的逐步發(fā)展,過于復雜的指令不僅會導致指令使用率不均衡(效率低),也加大了超大規(guī)模集成電路實現(xiàn)的難度。相對的,RISC的優(yōu)勢在于指令簡單,使用率均衡,執(zhí)行效率高。同時,通?;赗ISC的芯片易于實現(xiàn)電路設計和大規(guī)模集成。

正如文章開篇所展示的,我在基于SG2042的RISC-V平臺上完成了LLaMA的移植。LLM和RISC-V都是近兩年比較熱門的東西,同時又有很大的空白供開發(fā)者們探索和建設,所以我覺得把兩者結(jié)合這是一件很有意思也很有意義的事情。下面簡單介紹一下我使用的開發(fā)平臺。

3.2 平臺

RISC-V服務器主板(搭載全球第一顆量產(chǎn)的服務器級64核RISC-V芯片SG2042)

3.3 基本配置

硬件平臺配置
CPU SG2042(64 Core@2.0GHz)
DDR 32GB 3200MHz
Local Storage 1T M.2NVMe SSD
操作系統(tǒng)配置
OS Ubuntu
Kernel Linux5.19.17







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4632

    瀏覽量

    128442
  • RISC-V
    +關注

    關注

    44

    文章

    2178

    瀏覽量

    45893
  • OpenAI
    +關注

    關注

    9

    文章

    1013

    瀏覽量

    6345
  • 澎峰科技
    +關注

    關注

    0

    文章

    46

    瀏覽量

    3150
  • ChatGPT
    +關注

    關注

    28

    文章

    1525

    瀏覽量

    7249

原文標題:RISC -V跑大模型(一)

文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    RISC-V 模型(二):LLaMA零基礎移植教程

    這是RISC-V模型系列的第二篇文章,主要教大家如何將LLaMA移植到RISC-V環(huán)境里。
    的頭像 發(fā)表于 07-17 16:16 ?1321次閱讀
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(二):LLaMA零基礎移植教程

    RISC-V 模型(三):LLaMA中文擴展

    這是RISC-V模型系列的第三篇文章,前面我們?yōu)榇蠹医榻B了如何在RISC-V下運行LLaMA,本篇我們將會介紹如何為LLaMA提供中文支持。
    的頭像 發(fā)表于 07-17 17:15 ?744次閱讀
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(三):LLaMA中文擴展

    有用risc-v芯片系統(tǒng)的嗎?

    risc-v芯片系統(tǒng)有什么需要注意的呢?
    發(fā)表于 03-29 21:52

    為什么選擇RISC-V?

    RISC-V種開放式ISA(指令集體系結(jié)構),為處理器體系結(jié)構的創(chuàng)新開創(chuàng)了新紀元。RISC-V基金會由325多家成員公司組成。這是該技術的主要優(yōu)勢。軟件架構師/固件工程師/軟件開發(fā)
    發(fā)表于 07-27 17:38

    什么是RISC-VRISC-V指令具有哪些特點應用?

    什么是RISC-V?RISC-V指令具有哪些特點應用?自己怎么才能設計出設計套指令集?
    發(fā)表于 10-14 09:05

    risc-v是什么意思

      risc-v是什么意思  RISC-V種指令集  RISC-V,般被念做:risk five。
    發(fā)表于 03-30 16:40

    RISC-VuCLinux或者NO MMU的Linux的項目嗎?

    RISC-VuCLinux或者NO MMU的Linux的項目嗎?
    發(fā)表于 04-03 17:54

    RISC-V規(guī)范的演進 RISC-V何時爆發(fā)?

    的最新進展。Mark說:“我們在2019年底的時候增加了些擴展指令集,會放到RVA20、RVM20中。RISC-V基金會的目標
    的頭像 發(fā)表于 02-11 10:10 ?3081次閱讀

    RISC-V學習筆記【1】RISC-V概述

    國產(chǎn)處理器芯片起步較晚,從2013年至今,集成電路每年的進口額均超過了 2000 億美元。RISC-V和AI(人工智能)芯片是我國最有希望突破的領域之RISC-V使用的領域還是對于生態(tài)依賴比較
    發(fā)表于 11-24 09:28 ?2534次閱讀

    RISC-V模型(二):LLaMA零基礎移植教程

    這是RISC-V模型系列的第二篇文章,主要教大家如何將LLaMA移植到RISC-V環(huán)境里。
    的頭像 發(fā)表于 07-10 10:10 ?1009次閱讀
    <b class='flag-5'>RISC-V</b><b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(二):LLaMA零基礎移植教程

    RISC-VRISC-V AI的未來(特邀講座)

    主題演講:RISC-VRISC-V AI的未來(特邀講座)ppt分享
    發(fā)表于 07-14 17:15 ?15次下載

    RISC-V設計支持工具,支持RISC-V技術的基礎

    RISC-V設計支持工具,支持RISC-V技術的基礎 ppt分享
    發(fā)表于 07-14 17:15 ?12次下載

    解鎖RISC-V技術力量丨曹英杰:RISC-V與大模型探索

    助力RISC-V開發(fā)等話題,多位業(yè)內(nèi)嘉賓發(fā)表了主旨演講。會上,時擎科技高級技術總監(jiān)曹英杰以“RISC-V與大模型探索”為題,將大模型作為切入點,探討了
    的頭像 發(fā)表于 04-16 08:16 ?568次閱讀
    解鎖<b class='flag-5'>RISC-V</b>技術力量丨曹英杰:<b class='flag-5'>RISC-V</b>與大<b class='flag-5'>模型</b>探索

    RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    沁恒在歷屆峰會上分享RISC-V在MCU領域的創(chuàng)新成果,和大家共同見證了本土RISC-V產(chǎn)業(yè)的成長。早在第RISC-V中國峰會上,沁恒就公開了青稞
    的頭像 發(fā)表于 08-30 18:18 ?1238次閱讀
    <b class='flag-5'>RISC-V</b> Summit China 2024  青稞<b class='flag-5'>RISC-V</b>+接口PHY,賦能<b class='flag-5'>RISC-V</b>高效落地

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !

    加入RISC-VAdvocate行列!我們正在尋找來自世界各地的RISC-V愛好者,通過全球推廣和參與,成為支持RISC-V進步的關鍵參與者。作為
    的頭像 發(fā)表于 09-10 08:08 ?233次閱讀
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來 !