0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三行代碼完成生成式AI部署

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2024-08-30 16:49 ? 次閱讀

作者:賈志剛

英特爾邊緣計算創(chuàng)新大使

01OpenVINO介紹

OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分為兩個安裝包分別是基礎(chǔ)包與生成式AI支持包,新發(fā)布的GenAI開發(fā)包支持C++Python語言接口調(diào)用,支持多種LLM加載與推理部署能力,實現(xiàn)了OpenVINO對CNN網(wǎng)絡(luò)、生成式模型、LLM網(wǎng)絡(luò)主流模型的全面推理支持。安裝包下載地址如下:

https://docs.openvino.ai/install

wKgaombRh8-AU8uhAAG1HPVlRwE861.png

02OpenVINO生成式AI支持

OpenVINO2024版本支持大量文本、圖像、音頻生成模型,如 Llama 2、MPT、OPT、Stable Diffusion、Stable Diffusion XL。這樣可以開發(fā)多模式應(yīng)用程序,從而實現(xiàn)一次寫入、隨處部署的功能。OpenVINO支持的生成式AI方式主要包括以下三種方式分別是:

Hugging Face:通過 Optimum Intel 擴展,使用 OpenVINO 作為 Hugging Face 框架(轉(zhuǎn)換器、擴散器)的后端。

OpenVINO GenAI 風格:使用 OpenVINO 生成式AI的APIs (Python and C++)

基礎(chǔ) OpenVINO:OpenVINO 原生 API(Python 和 C++)與自定義管道代碼一起使用

03三種部署方式好處與不同

Hugging Face API 易于學(xué)習,提供簡單的界面,并隱藏了模型初始化和文本生成的復(fù)雜性,以獲得更好的開發(fā)人員體驗。但是,它具有更多的依賴項、更少的自定義項,并且無法移植到 C/C++。

OpenVINO GenAI Flavor 通過自動管理文本生成循環(huán)、標記化和調(diào)度等基本任務(wù)來降低 LLM 實現(xiàn)的復(fù)雜性。原生 OpenVINO API 提供了更多的實踐體驗,需要手動設(shè)置這些功能。這兩種方法都旨在最大程度地減少依賴關(guān)系和整體應(yīng)用程序占用空間,并允許在 C++ 應(yīng)用程序中使用生成模型。

建議從擁抱臉框架開始,嘗試不同的模型和場景。然后,如果需要進一步優(yōu)化,該模型可以與 OpenVINO API 一起使用。Optimum Intel 提供的接口支持使用神經(jīng)網(wǎng)絡(luò)壓縮框架 (NNCF) 進行模型優(yōu)化(權(quán)重壓縮),并將模型導(dǎo)出為 OpenVINO 模型格式,以便在原生 API 應(yīng)用程序中使用。

wKgZombRh_6AW_VBAAPK1kFbWnQ942.jpg

04LLM推理支持

像 GPT 這樣的大型語言模型 (LLM) 是變革性的深度學(xué)習網(wǎng)絡(luò),能夠完成從文本生成到語言翻譯的廣泛自然語言任務(wù)。OpenVINO2024優(yōu)化了這些模型的部署,增強了它們的性能并集成到各種應(yīng)用中。下面的代碼展示了如何將 LLM 與 OpenVINO20204 結(jié)合使用,從模型加載和轉(zhuǎn)換到高級用例

wKgZombRh-CABNbmAAEmz0B_Io4161.jpg

Python版本開發(fā)包安裝

pip install openvino-genai==2024.2.0

pip install optimum-intel -i https://pypi.tuna.tsinghua.edu.cn/simple

安裝optimum

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple optimum auto-gptq

pip install openvino-tokenizers

OpenVINO加速支持

pip install --upgrade-strategy eager optimum[openvino,nncf]

export HF_ENDPOINT=https://hf-mirror.com

optimum-cli export openvino --model "TinyLlama/TinyLlama-1.1B-Chat-v1.0" --weight-format fp16 --trust-remote-code output

wKgZombRiBGAPQQqAAITU9-514E417.jpg

需要注意一下版本匹配問題,因為我之前安裝了optimum版本較低導(dǎo)致無法生成分詞得OpenVINO文件,所以直接推理掛,然后更新到最新版本就好,相關(guān)支持依賴包支持版本(親測有效)

wKgaombRiBKAcavnAAGfVSGDVxk852.jpg

如您所見,只需要幾行代碼就能建立一個LLM生成的流水線。這是因為從 Hugging Face Optimum-Intel 導(dǎo)出模型后,它已經(jīng)存儲了執(zhí)行所需的所有信息包括分詞器/反分詞器和生成配置,從而能夠獲得與 Hugging Face 生成匹配的結(jié)果。我們提供 C++ 和 Python API 來運行 LLM、最少的依賴項列表和對應(yīng)用程序的添加。

Python語言測試代碼:

wKgaombRiBKAU7xFAAFHsv33OrE633.jpg

C++語言測試代碼

wKgZombRiBKALibDAAGKiO8FVwg440.jpg

C++里面跑出來得結(jié)果:

wKgaombRiBKAQIwXAAG9TC_yoBQ754.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9814

    瀏覽量

    171111
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    472

    瀏覽量

    436
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    81

    瀏覽量

    155

原文標題:OpenVINO? 2024.2 - 三行代碼完成生成式AI部署 | 開發(fā)者實戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    急求教:能顯示三行字符的液晶有哪些

    能顯示三行字符(可以不是漢字)的液晶有哪些????
    發(fā)表于 05-31 10:02

    請問前三行是什么意思?

    create_page_table @ 設(shè)置頁表 bl mmu_init @ 啟動MMU ldr sp, =0xB4000000 @ 重設(shè)棧指針,指向SDRAM頂端(使用虛擬地址) ldr pc, =0xB0004000 @ 跳到SDRAM中繼續(xù)執(zhí)行第二部分代碼halt_loop: b halt_loop請問其中
    發(fā)表于 06-13 22:56

    請問這三行代碼是固定這樣寫的嗎?

    u8 IPRADDR=NVIC_Channel/4;//每組只能存4個,得到組地址 u8 IPROFFSET=NVIC_Channel%4;//在組內(nèi)的偏移 IPROFFSET=IPROFFSET*8+4; //得到偏移的確切位置這三行代碼是固定這樣寫的嗎???????
    發(fā)表于 10-24 21:34

    使用STM32CubeMX和X-CUBE-AI生成代碼

    神經(jīng)網(wǎng)絡(luò)模型部署到MCU 之 環(huán)境搭建教程前提工作:已經(jīng)搭建好了神經(jīng)網(wǎng)絡(luò)模型(tensorflow、keras),并進行了訓(xùn)練。目前工作:將網(wǎng)絡(luò)部署到單片機上,用到的是STM32的開發(fā)板,使用到了STM32CubeMX和X-CUBE-A
    發(fā)表于 11-01 06:17

    三行搞定獨立按鍵

    最近自己在做單片機的東西,準備參加比賽,偶然發(fā)現(xiàn)了獨立按鍵的神助攻——三行搞定獨立按鍵,看到網(wǎng)上很多描述的不清晰,自己又花時間整理了一下,話不多說先上代碼:void Key_Read(void
    發(fā)表于 12-07 11:05

    STM32之三行按鍵宏定義

    STM32之三行按鍵按鍵宏定義unsigned char ucTrg= 0;unsigned char ucCont = 0;unsigned char uckey_times = 0
    發(fā)表于 03-02 06:52

    什么是三行按鍵?有什么用

    三行按鍵從出生到現(xiàn)在已經(jīng)很多個年頭了,經(jīng)過幾代優(yōu)化,現(xiàn)在有兩個版本,今天分析一下,也在本論壇擴充一下資源。我在本論壇搜索三行按鍵,并沒有相關(guān)的帖子。首先說明一下什么是三行按鍵,有什么用,什么好處,以及...
    發(fā)表于 03-02 06:16

    國內(nèi)首家單芯片微波雷達供應(yīng)商“隔空智能”獲三行資本A輪數(shù)千萬投資

    隔空智能于今年7月獲得三行資本、君度資本的投資,完成A輪融資。
    的頭像 發(fā)表于 08-16 14:07 ?6605次閱讀

    三行代碼完成AI模型的部署!

    為了解決AI部署落地難題,我們發(fā)起了FastDeploy項目。FastDeploy針對產(chǎn)業(yè)落地場景中的重要AI模型,將模型API標準化,提供下載即可運行的Demo示例。相比傳統(tǒng)推理引擎,做到端到端的推理性能優(yōu)化。FastDepl
    的頭像 發(fā)表于 11-10 10:18 ?1225次閱讀

    圖為科技聯(lián)合百度飛槳、英偉達共同推出AI軟硬一體快速部署方案

    基于圖為科技邊緣計算機系列產(chǎn)品,僅用三行代碼就能搞定百度飛槳AI算法的部署;讓AI算法部署變得簡
    的頭像 發(fā)表于 12-20 11:01 ?1181次閱讀
    圖為科技聯(lián)合百度飛槳、英偉達共同推出<b class='flag-5'>AI</b>軟硬一體快速<b class='flag-5'>部署</b>方案

    什么是生成AI?生成AI的四大優(yōu)勢

    生成AI是一種特定類型的AI,專注于生成新內(nèi)容,如文本、圖像和音樂。這些系統(tǒng)在大型數(shù)據(jù)集上進行訓(xùn)練,并使用機器學(xué)習算法
    發(fā)表于 05-29 14:12 ?4390次閱讀

    Sweetviz讓你三行代碼實現(xiàn)探索性數(shù)據(jù)分析

    Sweetviz是一個開源Python庫,它只需三行代碼就可以生成漂亮的高精度可視化效果來啟動EDA(探索性數(shù)據(jù)分析)。輸出一個HTML。 如上圖所示,它不僅能根據(jù)性別、年齡等不同欄目縱向分析數(shù)據(jù)
    的頭像 發(fā)表于 10-17 10:59 ?402次閱讀
    Sweetviz讓你<b class='flag-5'>三行</b><b class='flag-5'>代碼</b>實現(xiàn)探索性數(shù)據(jù)分析

    來看看他們用代碼寫的“三行詩”

    往期精選 原文標題:來看看他們用代碼寫的“三行詩” 文章出處:【微信公眾號:宏景智駕】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
    的頭像 發(fā)表于 10-25 15:55 ?318次閱讀
    來看看他們用<b class='flag-5'>代碼</b>寫的“<b class='flag-5'>三行</b>詩”

    Sweetviz: 讓你三行代碼實現(xiàn)探索性數(shù)據(jù)分析

    Sweetviz是一個開源Python庫,它只需三行代碼就可以生成漂亮的高精度可視化效果來啟動EDA(探索性數(shù)據(jù)分析)。輸出一個HTML。 它不僅能根據(jù)性別、年齡等不同欄目縱向分析數(shù)據(jù),還能對每個
    的頭像 發(fā)表于 10-31 10:28 ?858次閱讀
    Sweetviz: 讓你<b class='flag-5'>三行</b><b class='flag-5'>代碼</b>實現(xiàn)探索性數(shù)據(jù)分析

    NVIDIA數(shù)字人技術(shù)加速部署生成AI驅(qū)動的游戲角色

    NVIDIA 在 GDC 2024 大會上宣布,Inworld AI 等領(lǐng)先的 AI 應(yīng)用程序開發(fā)者,正在使用 NVIDIA 數(shù)字人技術(shù)加速部署生成
    的頭像 發(fā)表于 04-09 10:08 ?585次閱讀
    NVIDIA數(shù)字人技術(shù)加速<b class='flag-5'>部署</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>驅(qū)動的游戲角色