0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾OpenVINO?將全力助力極視角AI推理加速

英特爾物聯(lián)網(wǎng) ? 來(lái)源:極市平臺(tái) ? 作者:鄧富城博士 極視角 ? 2021-09-22 16:19 ? 次閱讀

在模型開(kāi)發(fā)和部署方面,極市平臺(tái)集成了最新版本的OpenVINO工具,助力開(kāi)發(fā)者在最小化代碼修改的條件下加速AI算法在各類生產(chǎn)環(huán)境中規(guī)模化部署應(yīng)用,尤其是在Intel豐富的硬件資源平臺(tái)上(CPUs、iGPUs、VPUs等等)。

本文重點(diǎn)介紹了極視角與英特爾開(kāi)發(fā)人員共同研發(fā)的OpenVINO最新功能,無(wú)縫集成TensorFlow框架,對(duì)于熟悉TensorFlow開(kāi)發(fā)的開(kāi)發(fā)者來(lái)說(shuō),在原有代碼的基礎(chǔ)上只需要添加幾行簡(jiǎn)單代碼就可以無(wú)痛實(shí)現(xiàn)模型精度不變的前提下推理加速1.34倍以上,避免了顯式地進(jìn)行OpenVINO轉(zhuǎn)換以及推理部分代碼的重新編寫(xiě),大大簡(jiǎn)化OpenVINO工具的使用,加速AI算法在生產(chǎn)環(huán)境中的應(yīng)用部署。

無(wú)痛實(shí)現(xiàn) 1.34 倍加速推理

我們先來(lái)看看本文方法在模型推理加速上具體表現(xiàn):

可以看到,在同一測(cè)試環(huán)境下,OpenVINO 與 TensorFlow 的集成實(shí)現(xiàn)了 1.34 的加速幾何平均值,同時(shí),模型的準(zhǔn)確性保持不變:

具體實(shí)操

OpenVINO 與 TensorFlow 的集成專為使用 OpenVINO 工具套件的開(kāi)發(fā)人員而設(shè)計(jì)——通過(guò)最少的代碼修改來(lái)提高推理應(yīng)用程序的性能。該集成為提高TensorFlow 兼容性提供以 OpenVINO 工具套件內(nèi)聯(lián)優(yōu)化和所需運(yùn)行時(shí),并加速了各種英特爾芯片上多類AI模型的推理。

通過(guò)將以下兩行代碼添加到 Python 代碼或 Jupyter Notebooks 中,就可以極大地加速你的 TensorFlow 模型的推理:

import openvino_tensorflowopenvino_tensorflow.set_backend(‘《backend_name》’)

OpenVINO 與 TensorFlow 的集成通過(guò)將 TensorFlow 圖巧妙地劃分為多個(gè)子圖,再將這些子圖分派到 TensorFlow 運(yùn)行時(shí)或 OpenVINO 運(yùn)行時(shí),從而實(shí)現(xiàn)最佳加速推理。

# 工作流概述

同時(shí),通過(guò) openvino_tensorflow ,我們能夠非常輕松地使用不同硬件:

更多的詳細(xì)信息可以前往 Github:

https://github.com/openvinotoolkit/openvino_tensorflow

# 在Extreme Vision notebooks中集成

在Extreme Vision IDE中可以直接將OpenVINO與TensorFlow集成。如下圖所示,你只需要簡(jiǎn)單地導(dǎo)入openvino_tensorflow,即可無(wú)縫加速 Jupyter Notebook 中在CPU上推理的所有 TensorFlow模型,同時(shí)可以繼續(xù)使用標(biāo)準(zhǔn)的TensorFlow API,而無(wú)需代碼重構(gòu)。

對(duì)推理加速更深的討論

從前文對(duì)推理加速上的結(jié)果展示中,我們可以看到通過(guò)添加 2 行代碼激活OpenVINO與 TensorFlow 的集成后,可以獲得最高達(dá) 10 倍的推理加速。但也有個(gè)別模型出現(xiàn)了異常情況,如Mask RCNN Atrous 和 SSD Mobilenet V2,因此我們對(duì)如何獲得最佳性能進(jìn)行了討論:

#01

OPENVINO_TF_MIN_NONTRIVIAL_NODES 變量

該變量設(shè)置了聚類中可以存在的最小操作數(shù)。如果操作數(shù)小于指定的數(shù)量,則聚類將回退到 TensorFlow。默認(rèn)情況是根據(jù)總圖大小計(jì)算的,但除非手動(dòng)設(shè)置,否則不能小于 6。另外,我們將此變量設(shè)置為 15 和 22 來(lái)觀察模型進(jìn)一步的性能增強(qiáng),并以此得到了最終的最佳推理性能。因此,在具體的開(kāi)發(fā)應(yīng)用中應(yīng)通過(guò)默認(rèn)值或?qū)嶒?yàn)來(lái)確定能夠?yàn)槟P吞峁┳罴研阅艿淖兞孔罴阎怠?/p>

#02

凍結(jié) Keras 模型以獲得最佳性能

一些 Keras 模型可能包含訓(xùn)練操作,這會(huì)導(dǎo)致 TensorFlow 產(chǎn)生控制流。由于 OpenVINO 工具套件不支持這些操作,因此圖形可能會(huì)被劃分為較小的聚類。因此,在使用 OpenVINO 與 TensorFlow 的集成時(shí),凍結(jié)模型可以避免這些操作并提高整體性能。

使用 Keras API 的 DenseNet121 推理應(yīng)用代碼示例:

import tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras.applications.densenet import DenseNet121# Add two lines of code to enable OpenVINO integration with TensorFlowimport openvino_tensorflowopenvino_tensorflow.set_backend("CPU")


model = DenseNet121(weights='imagenet')


# Run the inference using Keras API  model.predict(input_data)

下面是凍結(jié)和運(yùn)行 Keras 模型的一個(gè)示例代碼,通過(guò)這種方式,我們能夠優(yōu)化使用 OpenVINO 與 TensorFlow 的集成實(shí)現(xiàn)的最佳性能。

import tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras.applications.densenet import DenseNet121from tensorflow.python.framework.convert_to_constants import convert_variables_to_constants_v2# Add two lines of code to enable OpenVINO integration with TensorFlowimport openvino_tensorflowopenvino_tensorflow.set_backend("CPU")


model = DenseNet121(weights='imagenet')


# Freeze the model first to achieve the best performance# using OpenVINO integration with TensorFlow    full_model = tf.function(lambda x: self.model(x))full_model = full_model.get_concrete_function(tf.TensorSpec(model.inputs[0].shape,model.inputs[0].dtype, name=model.inputs[0].name))frozen_func = convert_variables_to_constants_v2(full_model)frozen_func.graph.as_graph_def()session = tf.compat.v1.Session(graph=frozen_func.graph)prob_tensor = frozen_func.graph.get_tensor_by_name(full_model.outputs[0].name)


# Run the inference on the frozen modelsession.run(prob_tensor, feed_dict={full_model.inputs[0].name : input_data})

#03

Mask RCNN Atrous和SSD Mobilenet

如上文的結(jié)果所示,OpenVINO與TensorFlow的集成可以加速大多數(shù)TensorFlow模型,但由于一些模型具有OpenVINO與TensorFlow集成尚不完全支持的工作組件(例如運(yùn)算符、層等),如Mask RCNN Atrous和SSD Mobilenet V2等一些模型仍在開(kāi)發(fā)完善中。

為了擴(kuò)大模型覆蓋范圍以及進(jìn)一步提升性能,極視角技術(shù)團(tuán)隊(duì)將會(huì)繼續(xù)測(cè)試和完善OpenVINO與TensorFlow的集成,以幫助更多使用TensorFlow開(kāi)發(fā)人員能夠更好地應(yīng)用極市平臺(tái)。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • API
    API
    +關(guān)注

    關(guān)注

    2

    文章

    1465

    瀏覽量

    61676
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    20

    文章

    2811

    瀏覽量

    116992
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29372

    瀏覽量

    267654
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4695

    瀏覽量

    68080

原文標(biāo)題:英特爾OpenVINO? 助力極視角AI推理加速

文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾CEO:AI時(shí)代英特爾動(dòng)力不減

    英特爾CEO帕特·基辛格堅(jiān)信,在AI技術(shù)的飛速發(fā)展之下,英特爾的處理器仍能保持其核心地位?;粮窆_(kāi)表示,摩爾定律仍然有效,而英特爾在處理器和芯片技術(shù)上的創(chuàng)新能力
    的頭像 發(fā)表于 06-06 10:04 ?335次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?439次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>助力</b>京東云用CPU<b class='flag-5'>加速</b><b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    華擎推出AI QuickSet軟件,支持英特爾銳炫Arc A系列顯卡

    今日,華擎宣布AI QuickSet軟件工具擴(kuò)展至英特爾銳炫Arc A系列顯卡,使其能夠便捷地安裝Stable Diffusion web UI OpenVINO,結(jié)合
    的頭像 發(fā)表于 05-11 10:58 ?568次閱讀

    簡(jiǎn)單兩步使用OpenVINO?搞定Qwen2的量化與部署任務(wù)

    英特爾 OpenVINO? 工具套件是一款開(kāi)源 AI 推理優(yōu)化部署的工具套件,可幫助開(kāi)發(fā)人員和企業(yè)加速生成式人工智能 (AIGC)、大語(yǔ)言模
    的頭像 發(fā)表于 04-26 09:39 ?1458次閱讀
    簡(jiǎn)單兩步使用<b class='flag-5'>OpenVINO</b>?搞定Qwen2的量化與部署任務(wù)

    Intel Vision 2024大會(huì): 英特爾發(fā)布全新軟硬件平臺(tái),全速助力企業(yè)推進(jìn)AI創(chuàng)新

    的下一代英特爾?至強(qiáng)?6處理器的全新品牌。 ?推出英特爾?Gaudi 3 AI加速器,其推理能力和能效均有顯著提高。多家OEM客戶
    的頭像 發(fā)表于 04-12 14:52 ?454次閱讀
    Intel Vision 2024大會(huì): <b class='flag-5'>英特爾</b>發(fā)布全新軟硬件平臺(tái),全速<b class='flag-5'>助力</b>企業(yè)推進(jìn)<b class='flag-5'>AI</b>創(chuàng)新

    簡(jiǎn)單三步使用OpenVINO?搞定ChatGLM3的本地部署

    英特爾 OpenVINO? 工具套件是一款開(kāi)源 AI 推理優(yōu)化部署的工具套件,可幫助開(kāi)發(fā)人員和企業(yè)加速生成式人工智能 (AIGC)、大語(yǔ)言模
    的頭像 發(fā)表于 04-03 18:18 ?1924次閱讀
    簡(jiǎn)單三步使用<b class='flag-5'>OpenVINO</b>?搞定ChatGLM3的本地部署

    英特爾升級(jí)AI PC加速計(jì)劃

    近日,英特爾公司正式推出“AI PC加速計(jì)劃”,旨在通過(guò)兩大新舉措進(jìn)一步推動(dòng)人工智能技術(shù)在個(gè)人電腦領(lǐng)域的應(yīng)用與發(fā)展。
    的頭像 發(fā)表于 03-28 11:46 ?610次閱讀

    英特爾宣布AI PC加速計(jì)劃新增兩項(xiàng)AI舉措

    首先,“AI PC 開(kāi)發(fā)者計(jì)劃”面向軟件研發(fā)人員和獨(dú)立軟件開(kāi)發(fā)商,為他們提供便捷的開(kāi)發(fā)環(huán)境,助力加速大規(guī)模運(yùn)用新型 AI技術(shù)。此計(jì)劃包含一系列全面的工具、優(yōu)化工作流方案、
    的頭像 發(fā)表于 03-27 16:03 ?311次閱讀

    英特爾酷睿Ultra通過(guò)全新英特爾vPro平臺(tái)AI PC惠及企業(yè)

    近日,英特爾在2024年世界移動(dòng)通信大會(huì)(MWC 2024)上宣布,全新英特爾?vPro?平臺(tái)AI PC的優(yōu)勢(shì)惠及商用客戶。
    的頭像 發(fā)表于 03-18 15:07 ?432次閱讀

    英特爾AI增效車用芯片,與氪汽車達(dá)成合作

    對(duì)此,英特爾汽車部門副總裁兼總經(jīng)理Jack Weast表示,英特爾以“整車”方式應(yīng)對(duì)行業(yè)挑戰(zhàn),創(chuàng)新的AI解決方案助力電動(dòng)車業(yè)轉(zhuǎn)型。收購(gòu)Silicon Mobility與其可持續(xù)發(fā)展目標(biāo)
    的頭像 發(fā)表于 01-10 10:39 ?644次閱讀

    英特爾專家為您揭秘第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器如何為AI加速

    % 1 ,AI 推理性能提升42% 2 。 這一系列性能提升的背后,存在著怎樣的創(chuàng)新與突破?第五代英特爾 至強(qiáng) 可擴(kuò)展處理器為什么要強(qiáng)調(diào)為AI加速
    的頭像 發(fā)表于 12-23 12:20 ?672次閱讀

    英特爾推出新一代強(qiáng)大產(chǎn)品, 加速實(shí)現(xiàn) “AI 無(wú)處不在 ”

    英特爾? 酷睿? Ultra 和第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器豐富了英特爾出色的AI產(chǎn)品組合,加速
    發(fā)表于 12-16 16:27 ?405次閱讀
    <b class='flag-5'>英特爾</b>推出新一代強(qiáng)大產(chǎn)品, <b class='flag-5'>加速</b>實(shí)現(xiàn) “<b class='flag-5'>AI</b> 無(wú)處不在 ”

    英特爾新處理器,掀AI PC戰(zhàn)火

    隨著ai時(shí)代的到來(lái),英特爾正在構(gòu)想新的酷睿Ultra處理器(代號(hào)Meteor Lake),這是英特爾的第一個(gè)基于npu的處理器,旨在在pc上應(yīng)用ai
    的頭像 發(fā)表于 12-11 11:26 ?875次閱讀

    oneAPI &amp; OpenVINO?聯(lián)合開(kāi)發(fā)者大會(huì)開(kāi)啟:英特爾持續(xù)開(kāi)源創(chuàng)新,助力AI開(kāi)發(fā)落地

    英特爾舉辦的以“創(chuàng)新加碼,加速開(kāi)發(fā)”為主題的oneAPI OpenVINO聯(lián)合開(kāi)發(fā)者大會(huì)正式啟動(dòng),眾多行業(yè)領(lǐng)先技術(shù)大咖與合作伙伴齊聚一堂,分享技術(shù)領(lǐng)域的最新成果,解讀前沿開(kāi)發(fā)趨勢(shì)。在這場(chǎng)全球性
    的頭像 發(fā)表于 11-04 16:00 ?536次閱讀
    oneAPI &amp; <b class='flag-5'>OpenVINO</b>?聯(lián)合開(kāi)發(fā)者大會(huì)開(kāi)啟:<b class='flag-5'>英特爾</b>持續(xù)開(kāi)源創(chuàng)新,<b class='flag-5'>助力</b><b class='flag-5'>AI</b>開(kāi)發(fā)落地

    #高通 #英特爾 #Elite 高通X Elite芯片或終結(jié)蘋果、英特爾的芯片王朝

    高通英特爾蘋果
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年10月27日 16:46:07