0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

把Transformer大模型部署在端側(cè),IPC SoC正在普惠AI

21克888 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2023-12-08 13:50 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)AI大模型襲卷而來,而如何讓終端產(chǎn)品插上AI的翅膀會是芯片廠商研發(fā)的方向和市場的機會。如今網(wǎng)絡(luò)攝像機作為智慧城市、智能家居等應(yīng)用的主流終端發(fā)展迅速,IPC SoC芯片是其核心之一。最近愛芯元智帶來的兩款I(lǐng)PC SoC新品在黑光全彩處理、適配Transformer大模型等方面表現(xiàn)十分亮眼,愛芯元智副總裁史欣也向媒體分享了公司對IPC SoC高清化、智能化發(fā)展的洞察。

兩款I(lǐng)PC SoC:AX630C和AX620Q




愛芯元智帶來的兩款新產(chǎn)品AX630C和AX620Q都搭載了最新的愛芯智眸AI-ISP4.0圖像處理引擎以及愛芯通元4.0高性能、低功耗的NPU引擎。這些技術(shù)的升級使得這兩款產(chǎn)品在視頻圖像效果、智能業(yè)務(wù)處理和分析等方面均達到了業(yè)界的領(lǐng)先水平。

愛芯智眸AI-ISP4.0對HDR、去噪、demosaic、銳化、去霧等算法做了升級,在暗光下的噪聲處理、色彩還原、運動拖影、清晰度等方面較上一代產(chǎn)品更優(yōu)秀,通過AI賦能ISP Pipeline里的關(guān)鍵模塊,在各種復(fù)雜應(yīng)用場景中全面提升成像效果,為后期智能處理提供高質(zhì)量的圖像、視頻素材。

愛芯通元混合精度NPU則通過減少數(shù)據(jù)搬運,在一定程度上減小了內(nèi)存墻和功耗墻的阻礙,提高整個NPU的效率,從而在端側(cè)邊緣側(cè)面積、功耗受限的情況下,以更高的有效算力支持更多的智能算法。

愛芯元智的“真黑光”技術(shù),則是通過愛芯智眸AI-ISP將畫面真實還原,后續(xù)再通過NPU進行優(yōu)化,進行更加準確的圖像處理,在極低照度下獲得超越人眼所見的黑光全彩效果。

AX630C具有高算力的特征,其CPU采用雙核A53@1.2G,配合3.2T@INT8的NPU以及硬化的CV算子模塊,可以對4K圖像進行實時的智能處理,提高客戶智能算法處理的精度和性能。同時,AX630C新一代的NPU引擎支持主流的Transformer網(wǎng)絡(luò)如ViT/DeiT/Swin/SwinV2/DETR等,可以解決訓(xùn)練數(shù)據(jù)集不足引起的算法精度下降,以及長尾場景下算法的泛化性問題。

據(jù)介紹,AX630C是愛芯元智面向智慧城市行業(yè)前端IPC市場推出的超高清智能SoC,可支持4K@30fps實時真黑光;AX620Q是愛芯元智面向模組與渠道行業(yè)前端IPC市場推出的高清智能SoC,可支持5Mp實時、4K非實時的真黑光。

從細節(jié)上看,為了實現(xiàn)黑光全彩的效果,愛芯智眸AI-ISP4.0集中對四個關(guān)鍵模塊進行了算法升級。史欣分析,傳統(tǒng)ISP由十幾個模塊組成,在算力足夠大的時候若不考慮成本可以用AI模型去增加每一個模塊。而愛芯元智結(jié)合了客戶的痛點需求和成本因素,對pipeline模塊中HDR、3DNR、RLTM、Demosaic等進行了增強,達到了色彩飽和度高、運動圖像無拖尾,以及噪聲、銳化、清晰度等效果的顯著提高。后續(xù),愛芯元智還將針對防抖、3A等模塊進行優(yōu)化。

這其中的另一個問題是AI的算力消耗,本質(zhì)上來說盡可能將模塊的精確度提高就能更少的消費算力。史欣舉例說,例如做人臉處理是對整個區(qū)域或者部分區(qū)域做降噪,消費的算力不一樣。原來在400萬分辨率的情況下需要1T做整個AI-ISP的處理,現(xiàn)在愛芯元智的第三、四代產(chǎn)品已經(jīng)降到了0.6甚至0.5T,接下來可以做到0.2T就可以完成3DNR降噪的算力消耗,既能降低芯片成本,又可以留出更多的算力讓客戶開發(fā)更多可能。

Transformer在智慧城市中的應(yīng)用


“Transformer應(yīng)用的一個典型場景是對信息特征的檢索,從最早期的后端處理、服務(wù)器處理,算法上云,到目前開始進入算法在邊緣側(cè)的部署等等,但始終沒有解決端側(cè)部署的問題。大的廠商能夠根據(jù)行業(yè)應(yīng)用來適配模型大小,而Transformer興起之后將帶來更多具象化的信息,使得檢索更容易、并縮減檢索的時間?!笔沸勒f道。

愛芯元智能夠幫助客戶把在服務(wù)器、云端訓(xùn)練好的算法在裁剪之后在端側(cè)部署。這里既有部署性包括帶寬、功耗、成本等的考慮,也有精度的要求。愛芯元智通過幾年來在NPU和算法工具鏈的迭代,IPC SoC能夠支持算法的快速部署、保證精度,具備端側(cè)部署的軟硬件條件。



不僅是Transformer大模型,愛芯元智還在適配國內(nèi)的DINOv2大模型,愛芯元智依托硬件NPU、軟件算法等技術(shù)并與合作伙伴共同推出算法部署國產(chǎn)化。

普惠AI


我們看到愛芯元智有一個非常明確的發(fā)展理念,即是普惠AI。AI不應(yīng)只在云端,更應(yīng)該讓消費、智慧城市、汽車等各個行業(yè)受惠。史欣談到,客戶希望能夠從To G或者To大B的業(yè)務(wù)部署向To小B,甚至To C的業(yè)務(wù)上進行部署。即便是家用攝像頭這個普及型消費電子產(chǎn)品,也需要AI-ISP加持,那么更需要像愛芯元智這樣具備軟硬件能力的廠商通過產(chǎn)品技術(shù)、性價比等去擁抱市場。

對于AI芯片的發(fā)展趨勢,史總給出預(yù)判,他認為端側(cè)AI的小型化將越來越多的落地,同時其性能要有前瞻性和較高的性價比。同時產(chǎn)品的易用性加強,芯片廠商的方案交付要更簡單。同時除了自身掌握關(guān)鍵技術(shù)之外,也需要生態(tài)合作伙伴做更豐富的算法和軟件,如此才能加快AI的普惠化,助力智能化產(chǎn)業(yè)升級。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29359

    瀏覽量

    267643
  • 智能城市
    +關(guān)注

    關(guān)注

    1

    文章

    169

    瀏覽量

    20731
  • 愛芯元智
    +關(guān)注

    關(guān)注

    1

    文章

    66

    瀏覽量

    4779
收藏 人收藏

    評論

    相關(guān)推薦

    四大廠商業(yè)績大漲背后,積極探索側(cè)AI SoC芯片創(chuàng)新迭代

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)近年來,模型技術(shù)的帶動下,AI應(yīng)用正在迅速往側(cè)遷移,產(chǎn)品形態(tài)
    的頭像 發(fā)表于 08-27 01:28 ?3894次閱讀
    四大廠商業(yè)績大漲背后,積極探索<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b> <b class='flag-5'>SoC</b>芯片創(chuàng)新迭代

    快速部署Tensorflow和TFLITE模型Jacinto7 Soc

    電子發(fā)燒友網(wǎng)站提供《快速部署Tensorflow和TFLITE模型Jacinto7 Soc.pdf》資料免費下載
    發(fā)表于 09-27 11:41 ?0次下載
    快速<b class='flag-5'>部署</b>Tensorflow和TFLITE<b class='flag-5'>模型</b><b class='flag-5'>在</b>Jacinto7 <b class='flag-5'>Soc</b>

    Yuan2.0千億大模型通用服務(wù)器NF8260G7上的推理部署

    巨量模型的智能生產(chǎn)力正在逐步滲透到各行各業(yè),但它們的部署和運行通常需要專用的AI加速卡,能否CPU上運行千億大
    的頭像 發(fā)表于 07-30 14:26 ?314次閱讀
    Yuan2.0千億大<b class='flag-5'>模型</b><b class='flag-5'>在</b>通用服務(wù)器NF8260G7上的推理<b class='flag-5'>部署</b>

    基于AX650N/AX630C部署側(cè)大語言模型Qwen2

    本文將分享如何將最新的側(cè)大語言模型部署到超高性價比SoC上,向業(yè)界對
    的頭像 發(fā)表于 07-06 17:43 ?2984次閱讀
    基于AX650N/AX630C<b class='flag-5'>部署</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>大語言<b class='flag-5'>模型</b>Qwen2

    后摩智能引領(lǐng)AI芯片革命,推出邊模型AI芯片M30

    人工智能(AI)技術(shù)飛速發(fā)展的今天,AI模型部署需求正迅速從云端向
    的頭像 發(fā)表于 06-28 15:13 ?572次閱讀

    Opera瀏覽器引領(lǐng)潮流,全球首接側(cè)AI模型

    昆侖萬維旗下海外平臺Opera宣布,其旗艦瀏覽器Opera One和游戲瀏覽器Opera GX將正式接入側(cè)AI模型,成為全球首個實現(xiàn)這一突破的主流瀏覽器。
    的頭像 發(fā)表于 06-03 09:18 ?611次閱讀

    模型側(cè)部署加速,都有哪些芯片可支持?

    小型化、場景化需求的增加,推理逐步從云端擴展向側(cè)。這種趨勢PC和手機等終端產(chǎn)品上尤為明顯。 ? 大模型
    的頭像 發(fā)表于 05-24 00:14 ?3759次閱讀

    模型裝進小盒子:這個小魔盒直擊側(cè)AIGC的痛點!

    私有本地化部署:智能硬件的未來隨著當下數(shù)字化的高速發(fā)展,今年將會迎來“大模型應(yīng)用爆發(fā)元年”。市面上不少大模型產(chǎn)品應(yīng)運而生,模型
    的頭像 發(fā)表于 05-10 08:33 ?301次閱讀
    <b class='flag-5'>把</b>大<b class='flag-5'>模型</b>裝進小盒子:這個小魔盒直擊<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AIGC的痛點!

    AI硬件大爆發(fā),這個小魔盒直擊側(cè)AIGC的痛點

    私有本地化部署AI硬件的未來隨著當下AI的高速發(fā)展,今年將會迎來“大模型應(yīng)用爆發(fā)元年”。市面上不少大模型產(chǎn)品應(yīng)運而生,
    的頭像 發(fā)表于 05-07 08:02 ?346次閱讀
    <b class='flag-5'>AI</b>硬件大爆發(fā),這個小魔盒直擊<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AIGC的痛點

    商湯發(fā)布業(yè)內(nèi)最快推理速度「日日新 5.0 側(cè)模型

    現(xiàn)在,就是AI模型側(cè)應(yīng)用的春天!
    的頭像 發(fā)表于 04-29 10:32 ?449次閱讀
    商湯發(fā)布業(yè)內(nèi)最快推理速度「日日新 5.0 <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>大<b class='flag-5'>模型</b>」

    使用CUBEAI部署tflite模型到STM32F0中,模型創(chuàng)建失敗怎么解決?

    看到CUBE_AI已經(jīng)支持到STM32F0系列芯片,就想拿來入門嵌入式AI。 生成的模型很小,是可以部署到F0上的,但是一直無法創(chuàng)建成功。 查閱CUBE
    發(fā)表于 03-15 08:10

    榮耀引領(lǐng)側(cè)AI新時代

    今年的MWC盛會上,榮耀宣布與高通、Meta攜手,將70億參數(shù)大模型引入側(cè),這一創(chuàng)新舉措預(yù)示著側(cè)
    的頭像 發(fā)表于 03-01 10:28 ?519次閱讀

    AI模型側(cè)加速落地已成必然趨勢,芯片廠商提前布局!

    普遍認為,2024年AI模型商業(yè)應(yīng)用會有極大突破。 ? “AI模型
    的頭像 發(fā)表于 12-29 00:47 ?2079次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>在</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>加速落地已成必然趨勢,芯片廠商提前布局!

    AI模型接入手機,行業(yè)迎來新一輪競賽

    選擇側(cè)部署,看上去最劃算 當前,AI模型接入手機存在兩種選擇:云端部署側(cè)
    發(fā)表于 12-05 10:11 ?649次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>接入手機,行業(yè)迎來新一輪競賽

    AI Transformer模型支持機器視覺對象檢測方案

    使用機器視覺進行對象檢測需要 AI 模型/算法 AI 芯片、FPGA 或模塊上運行。它們通常被稱為“人工智能引擎”。首次訓(xùn)練后,可以
    發(fā)表于 11-23 10:31 ?431次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>Transformer</b><b class='flag-5'>模型</b>支持機器視覺對象檢測方案