日本免费高清一本视频,可莉吃旅行者的坤巴,久久青草国产免费频观看

作者：Yury Gorbachev 英特爾院士

翻譯：武卓英特爾AI軟件布道師；楊亦誠(chéng) 英特爾 AI軟件工程師

在過(guò)去的一年里，我們看到了生成式AI用例和模型的爆炸式增長(zhǎng)?，F(xiàn)在幾乎每周都會(huì)針對(duì)不同的領(lǐng)域發(fā)布新的值得注意的生成式模型，這些模型在不斷增加的數(shù)據(jù)集上訓(xùn)練，具有各種計(jì)算復(fù)雜性。使用像LoRA這樣的方法，可以在非常適度的訓(xùn)練加速器上微調(diào)大模型，這解鎖了對(duì)基礎(chǔ)模型的更多修改。由于資源消耗，部署這些模型仍然是挑戰(zhàn)，并且高度依賴(lài)于在云端部署模型。

隨著 OpenVINO 2023.1 版本的發(fā)布，我們希望將生成式 AI 的強(qiáng)大功能引入常規(guī)臺(tái)式機(jī)和筆記本電腦，讓這些模型可以運(yùn)行在在資源受限的本地環(huán)境中，并被您嘗試集成到自己的應(yīng)用程序中。我們?cè)谡麄€(gè)產(chǎn)品中針對(duì)這些場(chǎng)景進(jìn)行了優(yōu)化，實(shí)現(xiàn)了一些關(guān)鍵功能，并為我們的下一步工作計(jì)劃奠定了基礎(chǔ)。

也就是說(shuō)，我們的變化不僅限于生成式AI，我們還改進(jìn)了產(chǎn)品的其它部分，并希望它能使您的工作更輕松，并為您帶來(lái)額外的價(jià)值。讓我們來(lái)看看這些變化到底是什么。

生成式AI功能

大模型的整體堆棧優(yōu)化。來(lái)自生成式AI家族的模型有一個(gè)共同點(diǎn)——它們亟需資源。模型尺寸巨大，運(yùn)行它們所需的內(nèi)存量非常高，對(duì)內(nèi)存帶寬的需求也非常大。例如不必要的權(quán)重搬運(yùn)這樣簡(jiǎn)單的問(wèn)題，都可能會(huì)導(dǎo)致由于內(nèi)存不足而無(wú)法運(yùn)行模型。

為了更好地適應(yīng)這一點(diǎn)，我們已經(jīng)跨推理堆棧工作，包括 CPU 和 GPU（集成顯卡和獨(dú)立顯卡），目標(biāo)就是優(yōu)化我們使用這些模型的方式，包括優(yōu)化讀取和編譯模型所需的內(nèi)存，優(yōu)化如何處理模型的輸入和輸出張量以及其他內(nèi)部結(jié)構(gòu)，從而縮短模型執(zhí)行時(shí)間。

大型語(yǔ)言模型的權(quán)重量化。LLM 在執(zhí)行時(shí)需要大量的內(nèi)存帶寬。為了對(duì)此進(jìn)行優(yōu)化，我們?cè)?NNCF（神經(jīng)網(wǎng)絡(luò)壓縮框架）優(yōu)化框架和 CPU 推理中實(shí)現(xiàn)了 int8 LLM 權(quán)重量化功能。

使用此功能時(shí)，NNCF 將生成優(yōu)化的 IR 模型文件，與精度為 fp16 的常規(guī)模型文件相比，該文件能夠?qū)⒊叽鐪p小一半。IR 文件將在 CPU 插件中被執(zhí)行額外的優(yōu)化，這將改善延遲并減少運(yùn)行時(shí)內(nèi)存消耗。GPU 的類(lèi)似功能正在實(shí)施中，并將在后續(xù)發(fā)布的版本中提供。

更容易轉(zhuǎn)換模型。大多數(shù)LLM目前來(lái)自基于PyTorch的環(huán)境。要轉(zhuǎn)換這些模型，您現(xiàn)在可以使用我們的直接 PyTorch 轉(zhuǎn)換功能。對(duì)于LLM，與我們之前通過(guò)ONNX格式的路徑相比，這大大加快了轉(zhuǎn)換時(shí)間并減少了內(nèi)存需求。

總體而言，由于我們的優(yōu)化，我們能夠在CPU和GPU上均能提高 LLM 性能。[WZ1]此外，我們還按倍數(shù)級(jí)減少了運(yùn)行這些模型所需的內(nèi)存量。在某些情況下，新版本OpenVINO可以讓我們運(yùn)行那些以前由于內(nèi)存不足而失敗的模型。我們一直在數(shù)十個(gè)不同規(guī)模和不同任務(wù)的LLM上驗(yàn)證我們的工作，以確保我們的方法能夠很好地?cái)U(kuò)展到我們所有的平臺(tái)和支持的操作系統(tǒng)。

我們的轉(zhuǎn)換API和權(quán)重量化功能也集成到Hugging Face optimum-intel擴(kuò)展中，允許您使用OpenVINO作為推理堆棧運(yùn)行生成式模型，或以方便的方式將模型導(dǎo)出為OpenVINO格式。

簡(jiǎn)化您的工作流

不再需要開(kāi)發(fā)包，提供統(tǒng)一的工具。從 2023.1 版本開(kāi)始，我們不再要求您為運(yùn)行時(shí)和開(kāi)發(fā)環(huán)境分別安裝單獨(dú)的軟件包。我們一直致力于簡(jiǎn)化我們的工具，并將所有必要的組件集成到單個(gè) OpenVINO軟件包中。這也意味著模型轉(zhuǎn)換和推理可以通過(guò)所有OpenVINO分發(fā)機(jī)制以統(tǒng)一的方式獲得：pip，conda，brew和archive。

此外，從此版本開(kāi)始，OpenVINO Python API 可從所有支持最低要求 Python 版本（3.7）的軟件包中獲得。這意味著除了以前可用的 pip 之外，還有conda、brew和指定的 apt 版本。

更高效、更友好的模型轉(zhuǎn)換。我們正在推出OpenVINO模型轉(zhuǎn)換工具（OVC），該工具正在取代我們眾所周知的離線(xiàn)模型轉(zhuǎn)換任務(wù)中的模型優(yōu)化器（MO）工具。該工具以O(shè)penVINO包形式提供，依靠?jī)?nèi)部模型前端來(lái)讀取框架格式，不需要原始框架來(lái)執(zhí)行模型轉(zhuǎn)換。例如，如果您想將TF模型轉(zhuǎn)換為OpenVINO，則不需要安裝TensorFlow。同樣，如果您想簡(jiǎn)單地在 OpenVINO運(yùn)行時(shí)中讀取此模型以進(jìn)行推理而無(wú)需轉(zhuǎn)換，同樣也不需要 TensorFlow。

為了在 Python 腳本中轉(zhuǎn)換模型，我們進(jìn)一步改進(jìn)了convert_model API。例如，它允許將模型從 PyTorch 對(duì)象轉(zhuǎn)換為 OpenVINO模型，并編譯模型以進(jìn)行推理或?qū)⑵浔４娴?IR格式，請(qǐng)參見(jiàn)以下示例：

請(qǐng)注意，我們還簡(jiǎn)化了我們的Python API，可以直接從OpenVINO命名空間獲得這些API，因此這一切變得更簡(jiǎn)單了。您仍然可以從舊命名空間訪問(wèn)函數(shù)，如果您需要 mo 工具，可以安裝 OpenVINO-dev。這個(gè)工具本身也仍然可用，但我們建議遷移到 ovc 工具。

默認(rèn)切換到 fp16 IR。隨著轉(zhuǎn)換工具的變化，我們現(xiàn)在切換到使用 fp16 精度作為 IR 中的數(shù)據(jù)類(lèi)型。這允許將模型大小減小一半（相對(duì)FP32精度的模型），并且根據(jù)我們執(zhí)行的測(cè)試對(duì)準(zhǔn)確性沒(méi)有影響。值得一提的是，IR 精度不會(huì)影響硬件插件的執(zhí)行精度，默認(rèn)情況下，插件始終以最佳性能繼續(xù)執(zhí)行。

更好的PyTorch兼容性

前面已經(jīng)提到，直接轉(zhuǎn)換PyTorch模型的功能現(xiàn)在已經(jīng)成熟，該方案已經(jīng)被集成在我們的 HuggingFace optimum-intel中進(jìn)行模型轉(zhuǎn)換。因此，現(xiàn)在轉(zhuǎn)換模型更容易，因?yàn)槟@過(guò)了 ONNX 格式的額外步驟（我們?nèi)匀粺o(wú)限制地支持）。

為了使OpenVINO更接近PyTorch生態(tài)系統(tǒng)，我們引入了對(duì)torch.compile和相應(yīng)后端的支持。您現(xiàn)在可以通過(guò) OpenVINO堆棧運(yùn)行您的模型，方法是通過(guò)torch.compile編譯它并指定 OpenVINO 作為后端！

如下例所示：

此功能正在積極增強(qiáng)，我們期待更好的性能和操作覆蓋范圍，但它已經(jīng)在我們的集成中使用，例如Stable Diffusion WebUI。

令人興奮的新Notebook用例

為了展示您可以直接從筆記本電腦上試用的新功能，我們制作了一些Jupyter notebooks示例并更新了現(xiàn)有notebooks。以下是最令我們興奮的：

基于大語(yǔ)言模型的聊天機(jī)器人（LLM Chatbot）：

文生圖模型StableDiffusion XL：

文生圖模型 Tiny SD：

生成音樂(lè)模型 MusicGen：

生成視頻模型Text-to-video：

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

英特爾

英特爾

+關(guān)注

關(guān)注
60

文章
9825

瀏覽量
171141
AI

AI

+關(guān)注

關(guān)注
87

文章
29435

瀏覽量
267745
pytorch

pytorch

+關(guān)注

關(guān)注
2

文章
795

瀏覽量
13086
OpenVINO

OpenVINO

+關(guān)注

關(guān)注
0

文章
82

瀏覽量
156

原文標(biāo)題：介紹OpenVINO? 2023.1：在邊緣端賦能生成式AI｜開(kāi)發(fā)者實(shí)戰(zhàn)

文章出處：【微信號(hào)：英特爾物聯(lián)網(wǎng)，微信公眾號(hào)：英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

生成式AI的「七宗罪」！

面對(duì)生成式AI日漸增長(zhǎng)的「罪惡」，我們?cè)撊绾谓鉀Q問(wèn)題？

發(fā)表于 05-07 16:34 ?1690次閱讀

<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的「七宗罪」！

什么是生成式AI？生成式AI的四大優(yōu)勢(shì)

生成式AI是一種特定類(lèi)型的AI，專(zhuān)注于生成新內(nèi)容，如文本、圖像和音樂(lè)。這些系統(tǒng)在大型數(shù)據(jù)集上進(jìn)行訓(xùn)練，并使用機(jī)器學(xué)習(xí)算法

發(fā)表于 05-29 14:12 ?4419次閱讀

虹軟圖像深度恢復(fù)技術(shù)與生成式AI的創(chuàng)新生成式AI助力

當(dāng)前，生成式人工智能（AI）技術(shù)的快速發(fā)展令人矚目。它能夠理解人類(lèi)的描述，并在短時(shí)間內(nèi)生成逼真的圖像和視頻。在生成

發(fā)表于 06-21 09:06 ?422次閱讀

ChatGPT熱潮繼續(xù) 甲骨文將在其人力資源軟件中添加生成式AI功能

ChatGPT熱潮繼續(xù) 甲骨文將在其人力資源軟件中添加生成式AI功能 ChatGPT 這類(lèi) AI 工具已經(jīng)在科技行業(yè)掀起了一股熱潮，

發(fā)表于 06-29 15:54 ?555次閱讀

利用 NVIDIA Jetson 實(shí)現(xiàn)生成式 AI

近日，NVIDIA 發(fā)布了 Jetson 生成式 AI 實(shí)驗(yàn)室（Jetson Generative AI Lab），使開(kāi)發(fā)者能夠通過(guò) NVIDIA Jetson 邊緣設(shè)備在現(xiàn)實(shí)世界中探

發(fā)表于 11-07 21:25 ?855次閱讀

利用 NVIDIA Jetson 實(shí)現(xiàn)<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b>

生成式AI技術(shù)的應(yīng)用前景

生成式 AI（人工智能）與我們熟知的 AI 有何不同？這篇文章將為我們一探究竟！

發(fā)表于 11-29 12:20 ?1220次閱讀

Amazon Connect新增生成式AI功能

Connect Contact Lens為客戶(hù)互動(dòng)添加了AI生成摘要功能，幫助管理人員評(píng)估和優(yōu)化坐席表現(xiàn)； Amazon Connect中的Amazon Lex現(xiàn)已利用生成

發(fā)表于 12-18 17:34 ?494次閱讀

生成式AI對(duì)智能家居的影響

電子發(fā)燒友網(wǎng)站提供《生成式AI對(duì)智能家居的影響.pdf》資料免費(fèi)下載

發(fā)表于 01-02 14:50 ?17次下載

谷歌地圖引入生成式AI功能

谷歌近日宣布，在其廣受歡迎的谷歌地圖應(yīng)用中引入了全新的生成式AI功能。這一創(chuàng)新功能利用大型模型，深入分析了地圖上超過(guò)2.5億個(gè)地點(diǎn)的詳細(xì)信息

發(fā)表于 02-06 16:42 ?4859次閱讀

博世與微軟合作開(kāi)發(fā)生成式AI產(chǎn)品

全球知名科技公司博世與微軟聯(lián)合宣布，雙方已建立合作關(guān)系，共同致力于開(kāi)發(fā)先進(jìn)的生成式AI產(chǎn)品。這一合作的核心目標(biāo)在于通過(guò)利用生成式

發(fā)表于 03-05 11:17 ?776次閱讀

IBM與SAP深化生成式AI領(lǐng)域合作

近日，IBM與SAP宣布將進(jìn)一步擴(kuò)大他們的合作范圍，共同在生成式人工智能（AI）領(lǐng)域進(jìn)行深度探索。此次合作的核心在于，雙方將共同為SAP的RISE平臺(tái)構(gòu)建全新的生成

發(fā)表于 05-13 09:19 ?416次閱讀

榮耀新品將搭載谷歌AI功能，提升生成式AI體驗(yàn)

榮耀于5月22日宣布，將在新款智能手機(jī)上集成谷歌的AI功能，實(shí)現(xiàn)生成式AI體驗(yàn)。此外，新機(jī)還將得到谷歌云服務(wù)的支持。

發(fā)表于 05-23 08:51 ?401次閱讀

原來(lái)這才是【生成式AI】！！

隨著ChatGPT、文心一言等AI產(chǎn)品的火爆，生成式AI已經(jīng)成為了大家茶余飯后熱議的話(huà)題?？墒?，為什么要在AI前面加上“

發(fā)表于 06-05 08:04 ?290次閱讀

原來(lái)這才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】??！

生成式AI的基本原理和應(yīng)用領(lǐng)域

生成式人工智能（Generative Artificial Intelligence，簡(jiǎn)稱(chēng)Generative AI）是一種利用機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)技術(shù)，通過(guò)模擬人類(lèi)的創(chuàng)造性思維過(guò)程，生成

發(fā)表于 07-04 11:50 ?854次閱讀

NVIDIA AI助力SAP生成式AI助手Joule加速發(fā)展

在美國(guó)佛羅里達(dá)州奧蘭多舉行的 SAP Sapphire 大會(huì)上，NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的生成式 AI 合作成果，其為 S

發(fā)表于 09-09 09:37 ?332次閱讀

搜索歷史

生成式AI的功能簡(jiǎn)述