亚洲喷潮,亚洲综合无码一区二区三区

電子發(fā)燒友網(wǎng)報(bào)道（文/吳子鵬）2024年世界人工智能大會(huì)（以下簡(jiǎn)稱：WAIC 2024）依然是一場(chǎng)“百模大戰(zhàn)”，不過(guò)有一些很明顯的變化是：新推出的AI大模型更加注重用戶體驗(yàn)；邊側(cè)和端側(cè)承載AI大模型的方案越來(lái)越多。也就是說(shuō)，AI大模型不僅完成了從“能用”到“好用”的蛻變，也從高高在上的云端，走到更靠近應(yīng)用場(chǎng)景的邊側(cè)和端側(cè)，這給作為方案核心的推理芯片提出了非常高的要求。

在愛芯元智于WAIC 2024舉辦的“芯領(lǐng)未來(lái)丨智能芯片及多模態(tài)大模型論壇”上，愛芯元智創(chuàng)始人、董事長(zhǎng)仇肖莘在主旨演講中表示，大模型真正大規(guī)模落地需要云邊端三級(jí)緊密結(jié)合，而邊側(cè)和端側(cè)結(jié)合的關(guān)鍵在于高能效的邊端AI芯片。

愛芯元智創(chuàng)始人、董事長(zhǎng)仇肖莘

仇肖莘指出，目前基于愛芯元智AI芯片已經(jīng)完成非常多款A(yù)I大模型的適配，能夠支持的參數(shù)規(guī)模覆蓋0.3B-7B?！按钶dAI處理器的高效推理芯片將是大模型落地更合理的選擇，這也是推進(jìn)普惠AI的關(guān)鍵所在?！?br />
愛芯智眸AI-ISP和愛芯通元NPU
在AI芯片的研發(fā)上，愛芯元智打造了廣受業(yè)界認(rèn)可的愛芯智眸AI-ISP和愛芯通元混合精度NPU兩大自研核心技術(shù)。其中，愛芯智眸AI-ISP是將深度學(xué)習(xí)算法與傳統(tǒng)的ISP處理單元相結(jié)合，利用像素級(jí)AI處理技術(shù)，在各種復(fù)雜應(yīng)用場(chǎng)景中，全面提升成像效果，為后期智能處理提供高質(zhì)量的圖像、視頻素材，作為萬(wàn)物智能的“眼睛”感知更多信息，特別是暗光全彩的剛需。

愛芯通元混合精度NPU是以算子為原子指令集的AI計(jì)算處理器，采用多線程異構(gòu)多核設(shè)計(jì)，實(shí)現(xiàn)算子、網(wǎng)絡(luò)微結(jié)構(gòu)、數(shù)據(jù)流和內(nèi)存訪問(wèn)優(yōu)化，高效支持混合精度算法設(shè)計(jì)，原生支持Transformer網(wǎng)絡(luò)結(jié)構(gòu)，為大模型在邊緣側(cè)、端側(cè)的應(yīng)用提供良好的基礎(chǔ)。

仇肖莘談到，愛芯元智現(xiàn)階段奉行以“AIoT+ADAS”為主的一體兩翼戰(zhàn)略路線，在AI大模型進(jìn)入邊側(cè)和端側(cè)的過(guò)程中，智慧城市和智能汽車都是非常具有代表性的應(yīng)用場(chǎng)景?！澳壳岸藗?cè)大模型落地依然在前期探索階段，我認(rèn)為智能汽車、AI手機(jī)和AIPC將會(huì)是第一批落地的場(chǎng)景，智能駕駛之所以需要端側(cè)大模型原因在于汽車對(duì)實(shí)時(shí)性的要求更高?！?br />
愛芯智眸AI-ISP作為AI芯片的子系統(tǒng)，為解決很多端側(cè)場(chǎng)景圖像問(wèn)題提供了強(qiáng)力支持。比如在智能駕駛場(chǎng)景中，愛芯智眸AI-ISP提供AI星光全彩、AI HDR成像、AI多光譜融合、AI防抖、AI場(chǎng)景增強(qiáng)、AI多傳感器融合六大技術(shù)亮點(diǎn)，能夠幫助智能汽車在大雨、大霧、夜間和隧道等惡劣的駕駛環(huán)境中獲取清晰的圖像。

當(dāng)然，AI技術(shù)的發(fā)展也在推動(dòng)AI-ISP的創(chuàng)新。以愛芯智眸AI-ISP來(lái)說(shuō)，目前AI算法已經(jīng)取代了降噪模塊、防抖模塊。仇肖莘認(rèn)為，后續(xù)AI-ISP發(fā)展一個(gè)值得探索的方向是，AI-ISP是不是也能夠成為一個(gè)“黑盒式”的AI大模型，用AI算法取代更多ISP中的功能單元，使得AI-ISP能夠利用CMOS圖像傳感器的信號(hào)直接成像，讓用戶不必再去考慮ISP工作的中間環(huán)節(jié)。

在AI芯片的打造上，愛芯通元混合精度NPU的優(yōu)點(diǎn)不只是原生支持Transformer網(wǎng)絡(luò)結(jié)構(gòu)，還包括通過(guò)可編程數(shù)據(jù)流DSA架構(gòu)，能夠覆蓋目前用戶需要的基本算子，成本、效能和運(yùn)算效率都非常高。仇肖莘說(shuō)，“AI算法發(fā)展至今已經(jīng)非常成熟，進(jìn)入一個(gè)較為穩(wěn)定的狀態(tài)，因此用戶對(duì)于算子的需求不再有日新月異的變化，這是愛芯元智能夠打造通用AI處理器的關(guān)鍵。”

根據(jù)愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉的介紹，此次論壇上正式發(fā)布的愛芯通元AI處理器在高中低三檔算力中已完成布局，并在智慧城市和輔助駕駛兩個(gè)領(lǐng)域?qū)崿F(xiàn)了規(guī)?；慨a(chǎn)，能效比較GPGPU芯片提升了一個(gè)數(shù)量級(jí)，而在以文搜圖、通用檢測(cè)、以圖生文、AI Agent等通用大模型應(yīng)用中，愛芯通元AI處理器也可以讓AI開發(fā)者以更低的成本進(jìn)行高效開發(fā)。

愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉

讓端側(cè)更好地承載AI大模型 根據(jù)《2024年中國(guó)AI大模型產(chǎn)業(yè)發(fā)展報(bào)告》，截至2024年3月，國(guó)內(nèi)部署大模型的企業(yè)數(shù)量超243家，以通用大模型為主。不過(guò)，我們都知道AI大模型成功的關(guān)鍵在于行業(yè)大模型、端側(cè)、端云結(jié)合等多種模式并行。端側(cè)大模型的部署所面臨的挑戰(zhàn)和云端是完全不同的，需要克服能耗的限制，還需要在足夠小的參數(shù)下，做到大部分日常工作。在WAIC 2024上，愛芯元智在自己的展臺(tái)上也展示了其AI芯片在部署端側(cè)大模型方面的能力。

案例一是基于愛芯元智端側(cè)小芯片AX630C部署語(yǔ)言大模型——阿里云通義千問(wèn)Qwen2.0。AX630C提供3.2T的算力，通過(guò)運(yùn)載通義千問(wèn)Qwen2.0，可以流暢地實(shí)現(xiàn)人機(jī)對(duì)話，查詢信息、日常交流等任務(wù)。AX630C運(yùn)載通義千問(wèn)Qwen2.0每秒能處理超過(guò)10個(gè)信息單元，但功耗只有1.5瓦。

案例二是愛芯元智端AX650N結(jié)合CLIP模型可以實(shí)現(xiàn)以文搜圖的功能，只需要一個(gè)詞、一句話或一段文字，系統(tǒng)就能迅速準(zhǔn)確地從海量圖片中找到匹配項(xiàng)。

案例三是基于愛芯元智端AX650N運(yùn)轉(zhuǎn)多模態(tài)多維感知大模型OWL-ViT大模型，精準(zhǔn)完成對(duì)未知目標(biāo)檢測(cè)，實(shí)現(xiàn)圖像自動(dòng)標(biāo)簽化。

正如上文提到的，愛芯通元AI處理器提供完備的算子集合，因此對(duì)于市面上的大模型能夠提供非常好的支持，并且適配的速度是非?？斓摹１热?，今年4月份，Meta發(fā)布了Meta Llama 3系列語(yǔ)言模型（LLM），具體包括一個(gè)8B模型和一個(gè)70B模型。隨后不久，愛芯元智就宣布，愛芯通元AI處理器完成Llama 3和Phi-3大模型適配。在Llama 3模型的適配上，愛芯元智AX650N芯片適配了Llama 3 8B Int8版本，若采用Int4量化，每秒token數(shù)還能再翻一倍，能滿足正常的人機(jī)交流。仇肖莘強(qiáng)調(diào)，愛芯元智的AI芯片對(duì)INT2、INT4、INT8、INT16混合精度算力都可以支持。

結(jié)語(yǔ)
AI大模型的發(fā)展已經(jīng)進(jìn)入一個(gè)新階段，行業(yè)大模型以及云邊端結(jié)合的大模型是下一步發(fā)展重點(diǎn)。在端側(cè)運(yùn)轉(zhuǎn)大模型有不一樣的挑戰(zhàn)，能耗和參數(shù)規(guī)模都會(huì)受到限制，但用戶體驗(yàn)不能打折。愛芯通元AI處理器以及愛芯元智AX650N等AI芯片展示出了非常好的端側(cè)大模型支持能力，在普惠AI的道路上邁出了堅(jiān)實(shí)一步。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI芯片

AI芯片

+關(guān)注

關(guān)注
17

文章
1842

瀏覽量
34789
GPGPU

GPGPU

+關(guān)注

關(guān)注
0

文章
28

瀏覽量
4875
愛芯元智

愛芯元智

+關(guān)注

關(guān)注
1

文章
66

瀏覽量
4778
AI大模型

AI大模型

+關(guān)注

關(guān)注
0

文章
288

瀏覽量
263

評(píng)論

相關(guān)推薦

四大廠商業(yè)績(jī)大漲背后，積極探索端側(cè)AI SoC芯片創(chuàng)新迭代

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）近年來(lái)，在大模型技術(shù)的帶動(dòng)下，AI應(yīng)用正在迅速往端側(cè)遷移，產(chǎn)品形態(tài)包括大家熟知的AI手機(jī)、

發(fā)表于 08-27 01:28 ?3888次閱讀

四大廠商業(yè)績(jī)大漲背后，積極探索<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b> SoC<b class='flag-5'>芯片</b>創(chuàng)新迭代

Meta推出革命性3D Gen AI模型：1分鐘內(nèi)生成高質(zhì)量3D內(nèi)容

在科技日新月異的今天，Meta再次引領(lǐng)創(chuàng)新潮流，宣布了一項(xiàng)令人矚目的技術(shù)突破——3D Gen AI模型的誕生。這款先進(jìn)的模型以其前所未有的高效性與卓越品質(zhì)，重新定義了3D內(nèi)容創(chuàng)作的邊界

發(fā)表于 07-04 18:12 ?924次閱讀

后摩智能引領(lǐng)AI芯片革命,推出邊端大模型AI芯片M30

在人工智能（AI）技術(shù)飛速發(fā)展的今天，AI大模型的部署需求正迅速?gòu)脑贫讼?b class='flag-5'>端側(cè)和邊緣側(cè)設(shè)備遷移。這

發(fā)表于 06-28 15:13 ?567次閱讀

Opera瀏覽器引領(lǐng)潮流，全球首接端側(cè)AI大模型

昆侖萬(wàn)維旗下海外平臺(tái)Opera宣布，其旗艦瀏覽器Opera One和游戲?yàn)g覽器Opera GX將正式接入端側(cè)AI大模型，成為全球首個(gè)實(shí)現(xiàn)這一

發(fā)表于 06-03 09:18 ?611次閱讀

存內(nèi)計(jì)算WTM2101編譯工具鏈資料

工藝條件下將AI計(jì)算效率提升2個(gè)數(shù)量級(jí)，充分滿足快速發(fā)展的神經(jīng)網(wǎng)絡(luò)模型指數(shù)級(jí)增長(zhǎng)的算力需求。 witin_mapper是知存科技自研的用于神經(jīng)網(wǎng)絡(luò)映射的編譯軟件棧，可以將量化后的神經(jīng)網(wǎng)絡(luò)模型

發(fā)表于 05-16 16:33

開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

Lite的API接口實(shí)現(xiàn)主要功能； Mindspore Lite為Openharmony AI推理框架，為上層應(yīng)用提供統(tǒng)一的AI推理接口，可以完成在手機(jī)等端

發(fā)表于 04-11 16:14

通義千問(wèn)首次落地天璣9300移動(dòng)平臺(tái)！阿里云攜手MediaTek探索端側(cè)AI智能體

，實(shí)現(xiàn)手機(jī)AI體驗(yàn)的大幅提升。這是通義大模型首次完成芯片級(jí)的軟硬適配，僅依靠終端算力便能擁有極佳的推理性能及功耗表現(xiàn)，標(biāo)志著Model-on-Chip的探索正式從驗(yàn)證走向商業(yè)化落地新階

發(fā)表于 03-28 10:51 ?205次閱讀

防止AI大模型被黑客病毒入侵控制（原創(chuàng)）聆思大模型AI開發(fā)套件評(píng)測(cè)4

在訓(xùn)練一只聰明的AI小動(dòng)物解決實(shí)際問(wèn)題，通過(guò)構(gòu)建神經(jīng)網(wǎng)絡(luò)模型并進(jìn)行推理，讓電腦也能像人一樣根據(jù)輸

發(fā)表于 03-19 11:18

榮耀引領(lǐng)端側(cè)AI新時(shí)代

在今年的MWC盛會(huì)上，榮耀宣布與高通、Meta攜手，將70億參數(shù)大模型引入端側(cè)，這一創(chuàng)新舉措預(yù)示著端側(cè)

發(fā)表于 03-01 10:28 ?518次閱讀

AI大模型怎么解決芯片過(guò)剩?

AI大模型

電子發(fā)燒友網(wǎng)官方
發(fā)布于 :2024年01月02日 15:42:05

AI大模型在端側(cè)加速落地已成必然趨勢(shì)，芯片廠商提前布局！

普遍認(rèn)為，2024年AI大模型在商業(yè)應(yīng)用會(huì)有極大突破。 ? “AI大模型在端側(cè)的加速

發(fā)表于 12-29 00:47 ?2077次閱讀

清華電化學(xué)電容新突破，比容量高出電解電容兩個(gè)數(shù)量級(jí)

相對(duì)來(lái)說(shuō)，電化學(xué)電容器的比容量要比電解電容器高三個(gè)數(shù)量級(jí)，是微型化、集成化濾波電容的良好選擇，但受限于緩慢的離子遷移動(dòng)力學(xué)，電化學(xué)電容器無(wú)法做到濾波需求的高頻率響應(yīng)能力，因此電化學(xué)電容器往往需要以犧牲比容量的方式

發(fā)表于 12-06 15:39 ?706次閱讀

AI大模型接入手機(jī)，行業(yè)迎來(lái)新一輪競(jìng)賽

選擇端側(cè)部署，看上去最劃算當(dāng)前，AI大模型接入手機(jī)存在兩種選擇：云端部署和端側(cè)部署。目前，大多數(shù)廠商選擇在端側(cè)部署輕

發(fā)表于 12-05 10:11 ?649次閱讀

智能手機(jī)+端側(cè)生成式AI，聯(lián)發(fā)科天璣8300加速其普及

的陸續(xù)發(fā)布直接成為了端側(cè)生成式AI 的落地的助推器。 ? 天璣8300主打冰峰能效，超神進(jìn)化。天

發(fā)表于 11-22 16:07 ?1324次閱讀

與GPU能效齊平，低功耗AI公司的轉(zhuǎn)型

，硬件成本已經(jīng)成了AI發(fā)展的最大瓶頸。為了訓(xùn)練高質(zhì)量的AI模型，堆硬件數(shù)量幾乎是避無(wú)可避的。為此，越來(lái)越多的

發(fā)表于 10-23 09:03 ?1318次閱讀