0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型進手機,軟件、硬件、生態(tài)全部不可或缺!

科技數(shù)碼 ? 來源:量子位 ? 作者:量子位 ? 2023-11-17 10:56 ? 次閱讀

這年頭,安卓廠商沒個大模型,都不敢開手機發(fā)布會了。

前腳OPPO剛用大模型升級了語音助手,后腳vivo就官宣自研手機AI大模型;

小米發(fā)布會則直接將大模型當場塞進手機系統(tǒng)……其競爭激烈程度,不亞于搶芯片首發(fā)。

到底是怎么回事?

究其原因,還是智能終端已經(jīng)成為了各類AIGC應用的落地“新灘頭”。

先是圖像生成大模型接二連三地被塞進手機,從十億參數(shù)的Stable Diffusion,在手機上快速生成一只金毛小狗:

△圖源油管Android Authority

到手機上運行十五億參數(shù)的ControlNet,快速生成一張限定圖像結(jié)構(gòu)的AI風景照:

wKgZomVW1lKAOcDtAFa4lCUX1cY176.jpg

隨后,文本生成大模型們也爭先恐后地推出了手機新應用——

國內(nèi)有文心一言、智譜清言APP,國外則有OpenAI的移動版ChatGPT,Llama 2手機版也在加急準備中。

現(xiàn)在,這一波智能終端大模型熱潮之中,最底層的軟硬件技術(shù)齒輪開始轉(zhuǎn)動。

高通到蘋果,最新的芯片廠商發(fā)布會,無一不在強調(diào)軟硬件對機器學習和大模型的支持——

蘋果M3能運行“數(shù)十億參數(shù)”機器學習模型,高通的驍龍X Elite和驍龍8 Gen 3更是已經(jīng)分別實現(xiàn)將130億和100億參數(shù)大模型裝進電腦和手機。

并且這不僅僅是已支持或跑通的數(shù)字參數(shù),而是實實在在到了可落地應用的程度。

△高通現(xiàn)場演示和手機中的百億大模型對話

從十億到百億,更大參數(shù)的移動端AI模型暗示了更好的體驗,但也意味著一場更艱巨的挑戰(zhàn)——

或許可以將這樣機遇與挑戰(zhàn)并存的大模型時代,稱之為「模力時代」。

「模力時代」下,芯片廠商究竟要如何沖破大模型移植智能終端面臨的算力、體積和功耗等限制?

進一步地,大模型的出現(xiàn)又給底層芯片設計帶來了哪些改變?

是時候掰開揉碎,好好分析一番了。

「模力時代」,硬件圍繞AI而生

從大模型風暴刮起之初,算力就成為了科技圈的焦點話題。

就在最近,OpenAI還因為DevDay后“遠超預期”的大模型調(diào)用流量,出現(xiàn)了全線產(chǎn)品宕機的史上最大事故。

wKgZomVW1lSAFFa9AAGavEdGpwI154.png

相比于云端,移動終端的算力更為受限。想要把大模型裝進手機,算力問題自然構(gòu)成了第一重挑戰(zhàn)。

計算單元之外,有限的內(nèi)存單元,是大模型進手機面臨的第二道難關(guān):大模型推理需要大量計算資源做支撐,與此同時,內(nèi)存大小決定了數(shù)據(jù)處理速度的上限以及推理的穩(wěn)定性。

另外,在手機上跑大模型,也給電池帶來了更大的壓力。因此芯片能耗成為一大關(guān)鍵。

在各大廠商的最新探索之中,我們可以觀察到,解決之道目前分為軟、硬兩路。

先來看硬件部分。

高通最新推出的第三代驍龍8移動平臺,就被定位為高通“首個專門為生成式AI打造的移動平臺”:

能夠在終端側(cè)運行100億參數(shù)大模型,面向70億參數(shù)大語言模型,每秒能生成20個token。

較之前代產(chǎn)品,第三代驍龍8最重要的變化,就是驅(qū)動終端側(cè)AI推理加速的高通AI引擎。

這個AI引擎由多個硬件和軟件組成,包括高通Hexagon NPU、Adreno GPU、Kryo CPU傳感器中樞。

wKgZomVW1lWAIHk4AAqYcYBKW2I456.png

其中最核心、與AI最密切相關(guān)的,是Hexagon NPU。

高通公布的數(shù)據(jù)顯示,Hexagon NPU在性能表現(xiàn)上,比前代產(chǎn)品快98%,同時功耗降低了40%。

wKgaomVW1laAHe7LAA4z15SmTUU157.png

具體而言,Hexagon NPU升級了全新的微架構(gòu)。更快的矢量加速器時鐘速度、更強的推理技術(shù)和對更多更快的Transformer網(wǎng)絡的支持等等,全面提升了Hexgon NPU對生成式AI的響應能力,使得手機上的大模型“秒答”用戶提問成為可能。

Hexagon NPU之外,第三代驍龍8在Sensing Hub(傳感器中樞)上也下了功夫:增加下一代微型NPU,AI性能提高3.5倍,內(nèi)存增加30%。

wKgZomVW1laAc-h7AAwPa-2ft3o062.png

值得關(guān)注的是,官方提到,Sensing Hub有助于大模型在手機端的“定制化”。隨時保持感知的Sensing Hub與大模型協(xié)同合作,可以讓用戶的位置、活動等個性化數(shù)據(jù)更好地為生成式AI所用。

而在內(nèi)存方面,第三代驍龍8支持LPDDR5X,頻率從4.2GHz提高到了4.8GHz,帶寬77GB/s,最大容量為24GB。

更快的數(shù)據(jù)傳輸速度,更大的帶寬,也就意味著第三代驍龍8能夠支持更大更復雜的AI模型。

并且,此番高通在內(nèi)存和Hexagon NPU矢量單元之間增加了直連通道,進一步提高了AI處理效率。

恰逢驍龍峰會期間,SK海力士還特別宣布,其產(chǎn)品LPDDR5T已經(jīng)在高通第三代驍龍8上完成了性能及兼容性驗證,速度達到9.6Gbps。由此看來,搭載第三代驍龍8的手機在內(nèi)存方面還有更多的選擇。

wKgaomVW1leAXwgxABAklV5XGds897.png

除此之外,在CPU方面,第三代驍龍8采用“1+5+2”架構(gòu)(1個主核心、5個性能核心和2個能效核心),相較于前代的“1+4+3”,將1個能效核心轉(zhuǎn)換為性能核心。其中超大核頻率提升到3.3GHz,性能核心頻率提升到最高3.2GHz,能效核心頻率提升到2.3GHz。

新架構(gòu)下,Kryo CPU性能提高了30%,功耗降低了20%。

wKgZomVW1liAQ6HMAAeO9tVS3jE989.png

GPU方面,第三代驍龍8則在性能和能效方面均實現(xiàn)25%的提升。

值得一提的是,AI引擎之外,第三代驍龍8的ISP、調(diào)制解調(diào)器等其他模塊,也已根植AI基因。

現(xiàn)在,高通的認知ISP是醬嬸的:

支持多達12層的照片/視頻幀實時語義分割;

融合生成式AI技術(shù),支持聲控拍照和視頻編輯;

支持利用AI技術(shù)從視頻中刪除不需要的人和物;

支持AI擴展照片;

……

wKgaomVW1lmAaPx9ABF22M8Tgck605.jpg

調(diào)制解調(diào)器同樣有5G AI處理器的加持:通過分析信號完整性和信噪比,AI能夠改善無線帶寬、延遲等性能指標。

由此看來,在大模型進手機的過程中,行業(yè)領(lǐng)軍者的硬件解決之道可以從兩方面來總結(jié):

其一,是針對算力、內(nèi)存、能耗三要素的性能提升和功耗平衡。

其二,是用AI來定義硬件,跟AI技術(shù)本身做更深層的結(jié)合。

不過,雖說硬件技術(shù)能解決大模型移植到智能終端的關(guān)鍵難點,但要想讓它真正落地應用,仍需要邁過另外一重門檻。

降低大模型軟件開發(fā)門檻

這道門檻,具體可以分解為兩個問題:

技術(shù)更新、體積更大的模型,如何快速實時地裝進手機?

裝進手機后,又要如何快速裝進手機以外的智能終端?

要想解決這兩大問題,就不能僅僅從硬件側(cè)入手,而同樣要在軟件開發(fā)上做好準備。

首先,需要先增強智能終端對不同大模型的適配能力,即使是架構(gòu)算法存在差異也同樣能裝進手機。

即使最新大模型體積超出預期,也要能確保在不影響性能的情況下,將之應用到智能終端。

這里依舊以高通為例。

從最早在手機上運行10億參數(shù)Stable Diffusion,到快速基于驍龍8 Gen 3適配百億參數(shù)大模型,背后實際上還離不開一類軟件能力——

AI壓縮技術(shù)。

最新的AI壓縮技術(shù),從高通今年發(fā)表在AI頂會上的幾篇論文可以窺見一斑。

像是這篇被NeurIPS 2023收錄的論文,就針對當前大模型的“基石”Transformer架構(gòu)進行了量化相關(guān)的研究。

wKgZomVW1lmAFqLyAAG7ZJXK9mo920.png

量化是壓縮AI模型的一種經(jīng)典方法,然而此前在壓縮Transformer模型的時候,容易出現(xiàn)一些問題。

這篇論文提出了兩種方法來對Transformer模型進行量化,在確保壓縮效果的同時,進一步提升模型輸出性能,確保模型看起來“更小更好”。

然后,還需要增強大模型軟件在不同軟件終端之間的通用性,進一步加速落地。

對于大模型而言,從一個硬件設備遷移到另一個硬件設備,并沒有想象中那么容易。

不同的計算平臺之間,硬件的配置往往差異很大,電腦上能運行的大模型,放到手機上還真不一定就能立刻運行。

而這也正是阻礙大模型在種類繁多、部件繁雜的智能終端落地的另一重原因。

對此,高通的準備是一個“轉(zhuǎn)換器”一樣的角色:高通AI軟件棧。

這是一套容納了大量AI技術(shù)的工具包,全面支持各種主流AI框架、不同操作系統(tǒng)和各類編程語言,能提升各種AI軟件在智能終端上的兼容性。

不僅如此,這套軟件棧還包含高通AI Studio,相當于將高通的所有AI工具集成到一起,直接進行可視化開發(fā)。

其中,如AI模型增效工具包、模型分析器和神經(jīng)網(wǎng)絡架構(gòu)搜索(NAS)等都在里面。

AI軟件只需要在里面從設計、優(yōu)化、部署到分析“走一趟流程”,就能快速轉(zhuǎn)換成在其他操作系統(tǒng)和平臺上也可以運行的軟件產(chǎn)品。

wKgaomVW1lqAeHlHAAV5g6c4Pi0361.png

只需要一次開發(fā),甚至是大模型軟件的開發(fā),就能讓它在多個平臺運行,不需要擔心適配的問題,像Stable Diffusion就已經(jīng)部署到其中,其他平臺也同樣可以隨取隨用了。

這樣一來,不僅僅是將百億參數(shù)大模型塞進手機,甚至還能將它塞進汽車、XR、PC和物聯(lián)網(wǎng)

wKgZomVW1luACGvQAA39JxIXrwE205.png

原本的設備類型繁多的缺點也能化為優(yōu)勢,進一步加速大模型軟件的落地。

總結(jié)來看,大模型移植到智能終端所需的技術(shù),不僅是硬實力,軟件上也同樣需要有所儲備。

所以,對于在大模型時代下蓄勢待發(fā)的移動端軟硬件廠商而言,究竟如何才能抓住這次難得的機遇?

或者說,各廠商要如何提前做好準備,才能確保大模型時代依舊屹立于技術(shù)浪潮之巔?

大模型時代需要怎樣的終端芯片

一個時代有一個時代的計算架構(gòu)。

深度學習時代是如此,計算攝影時代是如此,大模型時代依舊如此——

無論軟硬件,「模力時代」下的智能終端芯片評判標準已經(jīng)悄然生變。

一方面,對于硬件性能而言,芯片已經(jīng)從單純的硬件性能對比、算力較量、功耗計算,逐漸轉(zhuǎn)變成對AI算力的比拼,甚至是對AI軟硬件技術(shù)能力的全面要求。

這種轉(zhuǎn)變,從大模型廠商巨頭的技術(shù)儲備棧變化可以窺見一斑。

以微軟為例,這家科技巨頭和云廠商,近期開始注重起AI軟硬件結(jié)合的技術(shù),如大模型訓練等。

在微軟前不久的一篇訓練研究中,就系統(tǒng)闡述了大模型在FP8精度下訓練的效果,能在同樣硬件成本下,訓練更大規(guī)模的大模型、同時確保訓練出來的模型性能。

wKgaomVW1luAH6wUAAHRzm-TdfM186.png

△圖源論文FP8-LM: Training FP8 Large Language Models

以AI算法研究著稱的OpenAI,則被曝出有造芯的意向,開始朝硬件方向的技術(shù)發(fā)力。

顯然,從不同科技巨頭最新研究中能看出,在這個技術(shù)日新月異的時代,手握一張底牌就能抓住機遇、打出自身價值的概率,正變得越來越低。

如果還停留在“硬件公司造好芯、軟件公司做好算法”的階段,勢必只會被其他虎視眈眈的廠商超過,在「模力時代」失去已有的競爭力。

反觀硬件場景有優(yōu)勢的芯片公司,亦是如此。

除了硬件性能的提升以外,與時俱進擴展軟件技術(shù)棧、提升軟硬件結(jié)合的AI能力,同樣不可或缺。

高通在前陣子推出的白皮書中就提到,將大模型部署到個人智能終端上,不僅要考慮硬件,也同樣需要考慮模型個性化、計算量等問題。

但相比等待大模型廠商去解決這些問題,高通選擇自己在軟件方面進行研究,最新成果也同樣實時寫成論文分享出來。

wKgZomVW1lyANzW6AALIdPJvfwQ945.png

只有這樣,才能更好地了解算法軟件側(cè)對于硬件的需求,從而更好地提升芯片的性能。

另一方面,對于算力更受限、用戶范圍更廣的終端而言,未來的趨勢必然是無縫互聯(lián)。這就意味著,跨平臺適用性會成為AI解決方案的關(guān)鍵。

這種動向,從今年的驍龍峰會上發(fā)布的Snapdragon Seamless技術(shù)就能窺見一斑。

像是將平板上的照片,用鼠標就能“一鍵平移”到PC,在電腦上進行快速處理:

wKgZomVW1l2AVad7AEhV5EFrtFA500.jpg

處理完畢后,還能將照片在另一個設備上打開,并用PC的鍵盤給它重命名:

wKgaomVW1l-AEGaZACJu8jMnMpk272.jpg

即使只有一個設備擁有鍵盤和鼠標,也能對各類設備進行無縫控制,甚至讓AI軟件也無障礙在各個設備之間連接使用。

對于數(shù)據(jù)傳輸延遲不是問題的未來而言,打通多終端協(xié)作和互聯(lián),勢必是智能終端的下一個未來:

不僅手機和PC等不同的終端設備之間可以共享數(shù)據(jù)、更可能讓同一套設備在不同的操作系統(tǒng)之間完成一系列流暢操作,像是手機和PC的音頻在耳機之間無縫切換:

wKgZomVW1mGAYvKEAB2I5Sk-vlg404.jpg

之前只有在手機上能使用的AI應用,有了這套系統(tǒng)就能擴展到千萬臺智能終端設備上,包括PC、XR、平板和汽車。

這樣一來,大模型就不再會受限于某一臺設備、或是某一個操作系統(tǒng),而是能快速將已經(jīng)在一類終端中實現(xiàn)的AI能力快速套用到更多設備中,最終實現(xiàn)“萬物皆可大模型”的操作。

總結(jié)來看,在大模型時代下,AI廠商不僅需要具備軟硬件結(jié)合的能力,更需要提前布局智能終端萬物互聯(lián)的未來,以「連接」技術(shù)加速大模型在場景下的落地應用。

高通已經(jīng)給出了自己的行動路徑。

對于其他不同企業(yè)而言,依舊要在場景中探索自身的價值,才可能在「模力時代」下找到新的出路。

(本文轉(zhuǎn)載自量子位公眾號)

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 手機
    +關(guān)注

    關(guān)注

    35

    文章

    6825

    瀏覽量

    157201
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2227

    瀏覽量

    2264
收藏 人收藏

    評論

    相關(guān)推薦

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?101次閱讀

    守護動力之源:揭秘電動機保護器的不可或缺

    在工業(yè)生產(chǎn)與日常生活中,電動機作為不可或缺的動力源泉,其穩(wěn)定運行直接關(guān)系到設備效率與安全。然而,電動機燒毀這一“熄火”現(xiàn)象時有發(fā)生,不僅影響生產(chǎn)進度,還可能帶來經(jīng)濟損失與安全隱患。那么,電動機燒毀
    的頭像 發(fā)表于 10-14 07:20 ?87次閱讀
    守護動力之源:揭秘電動機保護器的<b class='flag-5'>不可或缺</b>性

    多口適配器-現(xiàn)代生活中的不可或缺的一部分

    滿足現(xiàn)代人的使用習慣。在這種背景下,多口適配器應運而生,憑借其獨特的功能和優(yōu)勢,成為了現(xiàn)代生活中的不可或缺的一部分。 ? 多口適配器,顧名思義,是一種具備多個充電或數(shù)據(jù)傳輸接口的電子設備適配器。它的設計旨在讓用
    的頭像 發(fā)表于 07-28 16:08 ?541次閱讀
    多口適配器-現(xiàn)代生活中的<b class='flag-5'>不可或缺</b>的一部分

    無源低通濾波器:電力系統(tǒng)中不可或缺的諧波治理專家 維愛普濾波器

    在復雜的電力系統(tǒng)中,諧波污染是一個普遍存在的問題。諧波不僅會導致電力設備的效率降低、壽命縮短,還可能引發(fā)電力故障和安全事故。為了有效治理諧波污染,保障電力系統(tǒng)的穩(wěn)定運行,無源低通濾波器成為了不可或缺的諧波治理專家。
    的頭像 發(fā)表于 07-16 16:20 ?310次閱讀
    無源低通濾波器:電力系統(tǒng)中<b class='flag-5'>不可或缺</b>的諧波治理專家 維愛普濾波器

    庫克:Vision Pro已成為日常生活中不可或缺的一部分

    據(jù)知名科技媒體MacRumors援引的消息,蘋果公司首席執(zhí)行官蒂姆·庫克在近期接受《太陽報》專訪時,興奮地分享了他個人對蘋果最新力作——Vision Pro的深切體驗與高度評價。庫克透露,自這款創(chuàng)新產(chǎn)品登陸英國市場以來,Vision Pro已成為他日常生活中不可或缺的一部分,每天相伴左右。
    的頭像 發(fā)表于 07-15 15:29 ?567次閱讀

    RISC-V成為世界人工智能大會不可或缺的熱點元素

    7月4-6日,世界人工智能大會(WAIC)在上海隆重召開。RISC-V作為新興指令集的代表,也成為大會不可或缺的熱點元素。上海市經(jīng)濟和信息化委員會副主任湯文侃介紹,早在2015年,上海就有一批企業(yè)
    的頭像 發(fā)表于 07-10 08:37 ?338次閱讀
    RISC-V成為世界人工智能大會<b class='flag-5'>不可或缺</b>的熱點元素

    車載導航儀出口北美,F(xiàn)CC認證將是不可或缺的一環(huán)

    ,無疑是眾多制造商的首選。而對于希望將車載導航儀出口至北美的企業(yè)來說,了解并遵守當?shù)氐氖袌鰷嗜胍?guī)則至關(guān)重要,F(xiàn)CC認證正是其中不可或缺的一環(huán)。本篇內(nèi)容英利檢測講深入解
    的頭像 發(fā)表于 07-02 17:35 ?223次閱讀
    車載導航儀出口北美,F(xiàn)CC認證將是<b class='flag-5'>不可或缺</b>的一環(huán)

    干貨必讀|光隔離探頭為什么在雙脈沖測試中不可或缺

    技術(shù)至關(guān)重要。特別是在雙脈沖測試中,光隔離探頭不僅確保了測試的安全性,還提高了測試測量的準確性和可靠性。本文將深入探討光隔離探頭在雙脈沖測試中不可或缺的原因。  雙脈沖測試的作用  雙脈沖測試(DPT
    發(fā)表于 06-12 17:00

    8針M16接頭中不可或缺的關(guān)鍵組件

      德索工程師說道8針M16接頭作為電氣連接的重要組件,其內(nèi)部結(jié)構(gòu)和關(guān)鍵組件共同確保了其高效、穩(wěn)定的電氣連接性能。以下是對8針M16接頭中不可或缺的關(guān)鍵組件的詳細解析,結(jié)合參考文章中的相關(guān)數(shù)字和信息進行闡述:
    的頭像 發(fā)表于 06-11 18:05 ?212次閱讀
    8針M16接頭中<b class='flag-5'>不可或缺</b>的關(guān)鍵組件

    智能化和智慧化是智慧園區(qū)不可或缺的兩大要素

    智能化和智慧化是智慧園區(qū)不可或缺的兩大要素。智能化指的是通過智能化設備、系統(tǒng)和技術(shù),實現(xiàn)對園區(qū)的全面感知、分析和處理,提高園區(qū)的運營效率和舒適度。而智慧化則更注重人的智慧和知識的發(fā)揮,通過智能化
    的頭像 發(fā)表于 05-29 15:12 ?354次閱讀

    安全地毯是工業(yè)領(lǐng)域不可或缺的安全裝置

    機械保護裝置
    jf_18500570
    發(fā)布于 :2024年04月30日 13:49:57

    什么是工業(yè)軟件 工業(yè)軟件分類及代表廠商

    作為工業(yè)化長期積累的各類工業(yè)知識、機理模型和經(jīng)驗訣竅的結(jié)晶,工業(yè)軟件已經(jīng)從輔助工具演化為了工業(yè)化進程不可或缺的伴生物,是制造業(yè)的重中之重。
    發(fā)表于 03-25 09:31 ?2772次閱讀
    什么是工業(yè)<b class='flag-5'>軟件</b> 工業(yè)<b class='flag-5'>軟件</b>分類及代表廠商

    谷歌模型軟件怎么用手機下載

    要在手機上下載谷歌模型軟件,您可以遵循以下步驟。
    的頭像 發(fā)表于 02-29 18:16 ?921次閱讀

    電動自行車安全充電不可或缺的元件——NTC熱敏電阻器

    以監(jiān)測充電過程中的異常升溫,及時發(fā)現(xiàn)并阻斷異常充電過程,從而杜絕熱失控,釆用這兩款NTC熱敏電阻器可以最大程度減少電動自行車安全事故風險。所以,NTC熱敏電阻器是電動自行車充電過程中不可或缺的關(guān)鍵元件。
    的頭像 發(fā)表于 02-29 17:25 ?930次閱讀

    機器視覺在電子半導體行業(yè)的應用 ——倒裝焊技術(shù)不可或缺的“銳眼”

    隨著集成電路封裝密度的提高,傳統(tǒng)引線鍵合技術(shù)已經(jīng)無法滿足要求,倒裝焊技術(shù)的出現(xiàn)解決了該問題,并得到了廣泛應用。機器視覺系統(tǒng)作為倒裝焊設備的“利目銳眼”在這場封裝技術(shù)革命中發(fā)揮著不可或缺的重要作用
    的頭像 發(fā)表于 12-08 15:40 ?396次閱讀
    機器視覺在電子半導體行業(yè)的應用 ——倒裝焊技術(shù)<b class='flag-5'>不可或缺</b>的“銳眼”