0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在英特爾酷睿Ultra7處理器上優(yōu)化和部署Phi-3-min模型

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2024-08-30 16:58 ? 次閱讀

作者:王一凡

英特爾邊緣計(jì)算創(chuàng)新大使

1Phi-3-mini模型簡介

2024年4月23日,微軟研究院公布Phi-3系列AI大模型,包含三個(gè)版本:mini(3.8B參數(shù))、small(7B參數(shù))以及medium(14B參數(shù))。phi-3-mini是一個(gè)擁有3.8B參數(shù)規(guī)模的模型,其訓(xùn)練數(shù)據(jù)集基于Phi-2所使用數(shù)據(jù)集的擴(kuò)大版本,由大量過濾后的網(wǎng)絡(luò)數(shù)據(jù)和合成數(shù)據(jù)組成,經(jīng)過3.3T tokens的訓(xùn)練,表現(xiàn)可以與Mixtral 8x7B和GPT-3.5等模型相媲美(例如,phi-3-mini在MMLU測(cè)試中達(dá)到了69%的準(zhǔn)確率,在MT-bench上的得分為8.38)。

wKgZombRieSATC6qAAHyCwYRvAE098.jpg

請(qǐng)用下面的命令把Llama3-Chinese-8B-Instruct模型的預(yù)訓(xùn)練權(quán)重下載到本地待用。

git clone https://www.modelscope.cn/LLM-Research/Phi-3-mini-128k-instruct.git

2英特爾 酷睿 Ultra處理器簡介

英特爾 酷睿 Ultra系列處理器是英特爾公司于2023年6月推出的一個(gè)高端處理器系列,其第一代產(chǎn)品代號(hào)為Meteor Lake。這款處理器標(biāo)志著英特爾在處理器設(shè)計(jì)上的重大革新,它采用了先進(jìn)的Intel 4制造工藝(先前稱為7nm),并利用了EUV(極紫外光刻)技術(shù),這帶來了顯著的性能提升和能效優(yōu)化。

英特爾 酷睿Ultra系列處理器內(nèi)置CPU、銳炫GPU和NPU,非常適合在端側(cè)運(yùn)行AI大模型。本文將在英特爾酷睿 Ultra 7 155H處理器上完成驗(yàn)證。

3搭建開發(fā)環(huán)境

首先,在https://www.anaconda.com/download下載并安裝Anaconda,然后創(chuàng)建并激活名為phi3的虛擬環(huán)境:

conda create -n phi3 python=3.11 #創(chuàng)建虛擬環(huán)境
conda activate phi3        #激活虛擬環(huán)境
python -m pip install --upgrade pip      #升級(jí)pip到最新版

然后,安裝Optimum Intel和其依賴項(xiàng)OpenVINO與NNCF:

python -m pip install "optimum-intel[openvino,nncf]"@git+https://github.com/huggingface/optimum-intel.git

最后,安裝構(gòu)建WebUI的工具包:

pip install gradio mdtex2html streamlit

4對(duì)Phi-3-mini-4k-instruct模型進(jìn)行INT4量化

optimum-cli是Optimum Intel自帶的跨平臺(tái)命令行工具,可以不用編寫量化代碼,實(shí)現(xiàn)對(duì)Phi-3-mini-4k-instruct模型的量化。

執(zhí)行命令將Phi-3-mini-4k-instruct模型量化為INT4 OpenVINO格式模型:

optimum-cli export openvino --model Phi-3-mini-4k-instruct --task text-generation-with-past --weight-format int4 --group-size 128 --ratio 0.8 --trust-remote-code phi3_ov

wKgaombRigSAfnfkAAN9KraL1fo798.jpg

5編寫Phi-3-Mini的WebUI對(duì)話程序

Phi-3-Mini推理程序的關(guān)鍵代碼,如下所示,主要實(shí)現(xiàn)載入Phi-3模型和對(duì)應(yīng)的分詞器,然后將提示詞Token化后輸入模型,最后解碼模型生成的Token序列。

完整代碼請(qǐng)參考:https://github.com/WangAria/OpenVINO/blob/main/phi3_webui.py

model_dir = "C:\Users\ASUS\phi3_ov" #Phi-3-mini-4k-instruct int4模型路徑
DEVICE = "GPU" #可更換為"CPU", "AUTO"...
# 編譯并載入Phi-3-mini-4k-instruct int4模型到指定DEVICE
ov_model = OVModelForCausalLM.from_pretrained(
  model_dir,
  device=DEVICE,
  ov_config=ov_config,
  config=AutoConfig.from_pretrained(model_dir, trust_remote_code=True),
  trust_remote_code=True,
)
# 實(shí)例化Phi-3-mini-4k-instruct int4模型的Tokenizer
tok = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)

運(yùn)行phi3_webui.py, 結(jié)果如下:

python phi3_webui.py

wKgaombRihqAKbGhAAHKNdPzHno071.png

6總結(jié)

Phi-3模型是微軟公司新近推出的一系列小型語言模型(SLM),旨在以更小的規(guī)模實(shí)現(xiàn)與大型語言模型(LLM)相媲美的性能,特別是在語言處理、推理、編碼和數(shù)學(xué)基準(zhǔn)測(cè)試方面;英特爾 酷睿 Ultra系列處理器是英特爾公司新近推出高端處理器,相對(duì)前代有顯著的AI性能提升和能效優(yōu)化;二者相互結(jié)合,使得廣大的端側(cè)設(shè)備都能受益于日益先進(jìn)的AI技術(shù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19029

    瀏覽量

    228442
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9814

    瀏覽量

    171111
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29350

    瀏覽量

    267631
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3055

    瀏覽量

    48569

原文標(biāo)題:在英特爾? 酷睿? Ultra7處理器上優(yōu)化和部署Phi-3-min模型丨開發(fā)者實(shí)戰(zhàn)

文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾CES發(fā)布i7處理器和VR體驗(yàn)技術(shù)

    CES 2017,英特爾將全方位展示塑造智能互聯(lián)世界的創(chuàng)新技術(shù),筆者之前看到的預(yù)報(bào)是i7
    發(fā)表于 01-05 09:15 ?1652次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>在</b>CES發(fā)布<b class='flag-5'>酷</b><b class='flag-5'>睿</b>i<b class='flag-5'>7</b><b class='flag-5'>處理器</b>和VR體驗(yàn)技術(shù)

    英特爾i3處理器詳解_i3處理器怎么樣

    英特爾i3處理器是inter2010年年初推出的一款芯片,
    發(fā)表于 09-14 15:04 ?7.9w次閱讀

    凌華科技發(fā)布兩款基于最新的英特爾? ?處理器的模塊化電腦

    多任務(wù)以及卓越的每瓦性能摘要:●基于第13代英特爾? ?處理器,具有先進(jìn)的混合架構(gòu),提供性能核心和能效核心,并優(yōu)化了功耗oExpress
    發(fā)表于 02-15 10:30

    支持嵌入式計(jì)算的基于英特爾I3 I3 I7處理器系列平臺(tái)

    本內(nèi)容介紹了支持嵌入式計(jì)算的基于英特爾I3 I3 I7
    發(fā)表于 12-07 14:11 ?36次下載
    支持嵌入式計(jì)算的基于<b class='flag-5'>英特爾</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b>I<b class='flag-5'>3</b> I<b class='flag-5'>3</b> I<b class='flag-5'>7</b><b class='flag-5'>處理器</b>系列平臺(tái)

    英特爾i9處理器助力打造極致的游戲和內(nèi)容創(chuàng)建體驗(yàn)

    除了推出面向移動(dòng)產(chǎn)品的全新英特爾 i9處理器以外,英特爾還發(fā)布了將第八代智能英特爾
    的頭像 發(fā)表于 04-12 09:02 ?9620次閱讀

    英特爾十代i7處理器也有TVB加速技術(shù)

    2018年,英特爾發(fā)布了8代H系列處理器,i9-8950HK支持了英特爾TVB加速技術(shù)(Thermal Velocity Boost),
    的頭像 發(fā)表于 04-14 14:37 ?6770次閱讀

    英特爾11代處理器將于3月16日登場(chǎng)

    大家對(duì)于英特爾11代處理器的興趣并沒有10代來得猛烈,畢竟相比較10代
    的頭像 發(fā)表于 03-03 16:49 ?5096次閱讀

    蘋果M3芯片和英特爾i9處理器哪個(gè)強(qiáng)

    蘋果M3芯片和英特爾i9處理器各有其優(yōu)勢(shì),難以簡單地說哪個(gè)更強(qiáng)。
    的頭像 發(fā)表于 03-08 15:29 ?6428次閱讀

    英特爾二季度對(duì)Ultra處理器供應(yīng)受限

    英特爾首席執(zhí)行官帕特·基辛格最新的財(cái)報(bào)電話會(huì)議透露,受晶圓級(jí)封裝產(chǎn)能限制,二季度Ultra
    的頭像 發(fā)表于 05-06 11:04 ?578次閱讀

    英特爾Ultra處理器突破500個(gè)AI模型優(yōu)化

    英特爾最新推出的英特爾? ? Ultra處理器
    的頭像 發(fā)表于 05-09 11:18 ?670次閱讀

    已有超過500款A(yù)I模型英特爾Ultra處理器上得以優(yōu)化運(yùn)行

    近日,英特爾宣布全新英特爾 Ultra處理器
    的頭像 發(fā)表于 05-11 09:31 ?615次閱讀

    英特爾Ultra處理器優(yōu)化部署YOLOv8模型

    英特爾 Ultra處理器英特爾公司推出的一個(gè)高端處理
    的頭像 發(fā)表于 05-30 17:16 ?1388次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>英特爾</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b><b class='flag-5'>處理器</b><b class='flag-5'>上</b><b class='flag-5'>優(yōu)化</b>和<b class='flag-5'>部署</b>YOLOv8<b class='flag-5'>模型</b>

    英特爾Ultra處理器出貨量預(yù)計(jì)飆升

    英特爾中國區(qū)董事長王銳近日透露,英特爾Ultra處理器自問世以來,已經(jīng)
    的頭像 發(fā)表于 06-20 09:23 ?644次閱讀

    如何將Llama3.1模型部署英特爾Ultra處理器

    本文從搭建環(huán)境開始,一步一步幫助讀者實(shí)現(xiàn)只用五行代碼便可將Llama3.1模型部署英特爾
    的頭像 發(fā)表于 07-26 09:51 ?1795次閱讀
    如何將Llama3.1<b class='flag-5'>模型</b><b class='flag-5'>部署</b><b class='flag-5'>在</b><b class='flag-5'>英特爾</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b><b class='flag-5'>處理器</b>

    英特爾Ultra 200V系列處理器發(fā)布

    英特爾近日隆重推出了其革命性的Ultra 200V系列處理器,這一全新x86處理器家族以超高
    的頭像 發(fā)表于 09-10 16:44 ?440次閱讀