0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RISC-V 跑大模型(三):LLaMA中文擴(kuò)展

澎峰科技PerfXLab ? 來(lái)源:澎峰科技PerfXLab ? 作者:澎峰科技PerfXLab ? 2023-07-17 17:15 ? 次閱讀

這是RISC-V跑大模型系列的第三篇文章,前面我們?yōu)榇蠹医榻B了如何在RISC-V下運(yùn)行LLaMA,本篇我們將會(huì)介紹如何為L(zhǎng)LaMA提供中文支持。

1.模型擴(kuò)充

以下步驟在X86下進(jìn)行:

1.1準(zhǔn)備工作

安裝最新版本的python和以下依賴庫(kù)。

pip install protobuf==3.20.0 結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)格式
pip install transformers 把原版模型轉(zhuǎn)換為HF格式
pip install sentencepiece 無(wú)監(jiān)督的文本標(biāo)記器和去標(biāo)記器
pip install peft 使用LoRA的工具

1.2模型下載

下載LLaMA原版模型和中文擴(kuò)充

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

中文擴(kuò)充:

https://huggingface.co/ziqingyang/chinese-alpaca-lora-7b

下載后的目錄如下:

wKgaomS1AoiAbJSYAACUfmvct_s083.pngwKgZomS1Ao6ACv0GAABF7DbXaIQ678.png

1.3合并模型

(1) 將LLaMA原版模型轉(zhuǎn)換為Huggingface格式。這一步需要借助transformers提供的腳本convert_llama_weights_to_hf.py。

下載鏈接:https://github.com/huggingface/transformers/blob/main/src/transformers/models/llama/convert_llama_weights_to_hf.py

請(qǐng)執(zhí)行以下命令:

python convert_llama_weights_to_hf.py --input_dir path_to_original_llama_root_dir --model_size 7B --output_dir path_to_original_llama_hf_dir

命令解釋:將原版LLaMA的tokenizer.model放在--input_dir指定的目錄,其余文件放在${input_dir}/${model_size}下。執(zhí)行以下命令后,--output_dir中將存放轉(zhuǎn)換好的Huggingface版權(quán)重。

(2) 合并LoRA權(quán)重,生成Huggingface全量模型,這一步需要借助:merge_llama_with_chinese_lora.py。

下載鏈接:

https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/merge_llama_with_chinese_lora.py

執(zhí)行命令:

python merge_llama_with_chinese_lora.py --base_model path_to_original_llama_hf_dir --lora_model chinese-alpaca-lora-7b --output_dir path_to_output_dir

命令解釋:這一步的參數(shù)可以參照上一步。

2.移植模型

在完成前面的步驟后會(huì)得到一個(gè)path_to_output_dir的目錄,目錄內(nèi)容如下:

wKgZomS1BGiAcPf6AAC6mGVvrpk862.png

將目錄下的consolidate.00.path和params.json上傳到RISC-V中的llama.cpp/models目錄下,這一步可以借助scp來(lái)實(shí)現(xiàn):scp “源文件路徑” 賬戶@地址:目的路徑。之后的步驟可以參考本系列的第二篇文章。鏈接如下:RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程

最后的運(yùn)行效果:

wKgZomS1BNiAJHVQAAIxHb8elDk082.png

3.結(jié)語(yǔ)

我們也為大家準(zhǔn)備好已經(jīng)擴(kuò)展了中文的LLaMA供大家使用,只要掃描下面的二維碼,進(jìn)群即可獲得下載地址。之后我們還會(huì)對(duì)LLaMA進(jìn)行優(yōu)化加速,敬請(qǐng)期待。

另外,RISC -V跑大模型系列文章計(jì)劃分為四期:

1.RISC -V跑大模型(一)

2.RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程

3.RISC-V跑大模型(三):LLaMA中文擴(kuò)充(本篇)

4.更多性能優(yōu)化策略。(計(jì)劃)

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19035

    瀏覽量

    228452
  • RISC-V
    +關(guān)注

    關(guān)注

    44

    文章

    2178

    瀏覽量

    45893
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2207

    瀏覽量

    2231
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    253

    瀏覽量

    285
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ISA ARM 對(duì)比 RISC-V

    、擴(kuò)展方式以及目標(biāo)應(yīng)用場(chǎng)景等方面有顯著差異。 要深入對(duì)比ARM和RISC-V的指令集,需要從指令集架構(gòu)(ISA)的設(shè)計(jì)原則、擴(kuò)展模塊、指令的復(fù)雜性、特性以及它們的實(shí)際性能表現(xiàn)來(lái)進(jìn)行討論。RIS
    的頭像 發(fā)表于 09-10 09:26 ?299次閱讀

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來(lái) !

    加入RISC-VAdvocate行列!我們正在尋找來(lái)自世界各地的RISC-V愛(ài)好者,通過(guò)全球推廣和參與,成為支持RISC-V進(jìn)步的關(guān)鍵參與者。作為一名RISC-VAdvocate,您將
    的頭像 發(fā)表于 09-10 08:08 ?232次閱讀
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來(lái) !

    RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    第二屆RISC-V中國(guó)峰會(huì)的南京會(huì)場(chǎng);青稞RISC-V的單雙線調(diào)試技術(shù),在第屆峰會(huì)上入選RISC-V新技術(shù)與新成果。
    的頭像 發(fā)表于 08-30 18:18 ?1238次閱讀
    <b class='flag-5'>RISC-V</b> Summit China 2024  青稞<b class='flag-5'>RISC-V</b>+接口PHY,賦能<b class='flag-5'>RISC-V</b>高效落地

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    量產(chǎn)芯片的關(guān)鍵技術(shù);公司籌備了第二屆RISC-V中國(guó)峰會(huì)的南京會(huì)場(chǎng);青稞RISC-V的單雙線調(diào)試技術(shù),在第屆峰會(huì)上入選RISC-V新技術(shù)與新成果。 02 連接聯(lián)網(wǎng)連世界 有核有根有
    發(fā)表于 08-30 17:37

    2024 RISC-V 中國(guó)峰會(huì):華秋電子助力RISC-V生態(tài)!

    第四屆RISC-V中國(guó)峰會(huì)(RISC-V Summit China 2024)于8月21日至23日在杭州盛大召開(kāi),成為RISC-V領(lǐng)域的一次重要盛會(huì)
    的頭像 發(fā)表于 08-26 18:33 ?714次閱讀
    2024 <b class='flag-5'>RISC-V</b> 中國(guó)峰會(huì):華秋電子助力<b class='flag-5'>RISC-V</b>生態(tài)!

    risc-v的發(fā)展歷史

    本的RISC-V指令集架構(gòu),即RISC-V v2.0。這個(gè)版本為32位和64位的RISC-V架構(gòu)定義了基本的指令集,并概述了未來(lái)的擴(kuò)展指令集
    發(fā)表于 07-29 17:20

    rIsc-v的缺的是什么?

    RISC-V作為一種開(kāi)源的指令集架構(gòu)(ISA),自其誕生以來(lái)就受到廣泛關(guān)注和應(yīng)用,但它也存在一些不足之處。以下是RISC-V架構(gòu)目前存在的主要缺點(diǎn): 1. 性能問(wèn)題 相對(duì)于專用ISA的性能差距:盡管
    發(fā)表于 07-29 17:18

    為什么要有RISC-V

    的,永遠(yuǎn)不會(huì)改變。這為編譯器編寫(xiě)者,操作系統(tǒng)開(kāi)發(fā)人員和匯 編語(yǔ)言程序員提供了穩(wěn)定的目標(biāo)。模塊化來(lái)源于可選的標(biāo)準(zhǔn)擴(kuò)展,根據(jù)應(yīng)用程序的需要,硬件可以包含或不包含這些擴(kuò)展。這種模塊化特性使得RISC-V具有了
    發(fā)表于 07-27 15:05

    RISC-V的MCU與ARM對(duì)比

    和實(shí)現(xiàn)。這意味著RISC-V具有高度的靈活性和可定制性,可以根據(jù)不同的應(yīng)用需求進(jìn)行優(yōu)化和擴(kuò)展。 ARM :ARM是一種專有的架構(gòu),任何想要使用ARM的指令集或?qū)崿F(xiàn)的設(shè)計(jì)者都必須向ARM公司支付版權(quán)費(fèi)
    發(fā)表于 05-27 15:58

    解鎖RISC-V技術(shù)力量丨曹英杰:RISC-V與大模型探索

    助力RISC-V開(kāi)發(fā)等話題,多位業(yè)內(nèi)嘉賓發(fā)表了主旨演講。會(huì)上,時(shí)擎科技高級(jí)技術(shù)總監(jiān)曹英杰以“RISC-V與大模型探索”為題,將大模型作為切入點(diǎn),探討了
    的頭像 發(fā)表于 04-16 08:16 ?566次閱讀
    解鎖<b class='flag-5'>RISC-V</b>技術(shù)力量丨曹英杰:<b class='flag-5'>RISC-V</b>與大<b class='flag-5'>模型</b>探索

    有用risc-v芯片系統(tǒng)的嗎?

    risc-v芯片系統(tǒng)有什么需要注意的呢?
    發(fā)表于 03-29 21:52

    RISC-V的迷人之處

    ,如果要調(diào)用處理器RISC-V,則必須遵循規(guī)則。名稱“ RISC-V”是商標(biāo),并且還有商標(biāo)的變體,子集,配置文件和擴(kuò)展名,這些變體,子集,配置文件和擴(kuò)展名均由總部位于瑞士的
    發(fā)表于 02-12 20:58

    什么是RISC-V

    siFive搞RISC-V 賽昉搞RISC-V 香山搞RISC-V 到底什么是RISC-V? 先不問(wèn)有什么用,RISC-V目前的能力來(lái)說(shuō),工
    發(fā)表于 02-02 10:41

    RISC-V開(kāi)放架構(gòu)設(shè)計(jì)之道|閱讀體驗(yàn)】RISC-V基礎(chǔ)整數(shù)指令集

    分支的B型,用于長(zhǎng)立即數(shù)的U型和用于無(wú)條件跳轉(zhuǎn)的J型。 下面是本章的思維導(dǎo)圖: RV32I是RISC-V的基礎(chǔ)指令集,后續(xù)會(huì)繼續(xù)拓展RISC-V的其它指令集擴(kuò)展。
    發(fā)表于 01-31 21:10

    賽昉科技重磅亮相RISC-V Summit 2023

    近日,賽昉科技重磅亮相RISC-VSummit2023(2023年RISC-V北美峰會(huì)),并連續(xù)年發(fā)表主題演講,展現(xiàn)賽昉科技推動(dòng)RISC-V軟件生態(tài)的最新成果。
    的頭像 發(fā)表于 11-22 08:19 ?527次閱讀
    賽昉科技重磅亮相<b class='flag-5'>RISC-V</b> Summit 2023