0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT為何顯得如此“與眾不同”?

Cadence楷登 ? 來(lái)源:Cadence楷登 ? 2023-04-25 10:53 ? 次閱讀

隨著 ChatGPT 橫空出世,預(yù)訓(xùn)練大模型對(duì)千行百業(yè)的革新與改造潛力已盡顯無(wú)遺,甚至有業(yè)界大佬將其問(wèn)世譽(yù)為人工智能iPhone 時(shí)刻”,并預(yù)言這“只是更偉大事物的開(kāi)始”

ChatGPT 為何顯得如此“與眾不同”?

借用技術(shù)接受理論(TAM)提出者哈佛大學(xué)教授 Venky Narayanamurti 的總結(jié):有用性(usefulness)與易用性(ease of use)是一項(xiàng)新興技術(shù)擴(kuò)散的兩大基本前提。以這一標(biāo)準(zhǔn)衡量,2016 年的“AlphaGo vs 李世石”五番棋大戰(zhàn),堪稱完成了對(duì)人工智能“有用性”的全民科普,而 ChatGPT 則標(biāo)志著 AI 技術(shù)擴(kuò)散的另一必要條件——易用性已潛移默化滲入公眾心智。

基于此,外界有理由樂(lè)觀期待,人工智能產(chǎn)業(yè)的確已站在了巨擘預(yù)卜的宏偉藍(lán)圖新起點(diǎn)上。

成于算力 困于互連?

在不少“后見(jiàn)之明”的解讀中,GPT 家族往往被與 2017 年谷歌推出的 Transformer 模型相聯(lián)系。

基于自注意力機(jī)制的 Transformer,及其后谷歌 BERT 對(duì)各類文本任務(wù)的“屠榜”表現(xiàn)和驚人的泛化能力,的確堪稱為 GPT 做好了前置技術(shù)與工程方法的鋪墊。站在巨人的肩膀上,GPT 開(kāi)發(fā)者 OpenAI 團(tuán)隊(duì),最終憑借更敏捷的效率和更有力的執(zhí)行,完成了最后的一躍。

進(jìn)一步深入看,Transformer 較此前 MLPLSTM 等傳統(tǒng)深度學(xué)習(xí)模型,正是對(duì)硬件算力實(shí)現(xiàn)了更高效的運(yùn)用。

關(guān)于這一點(diǎn),2019 年深度學(xué)習(xí)泰斗、DeepMind 首席科學(xué)家 Richard Sutton 在其《苦澀的教訓(xùn)》一文中就曾感言,從 70 年 AI 研究中可以學(xué)到的最大教訓(xùn)是,利用計(jì)算的一般方法最終是最有效的,而且有很大的優(yōu)勢(shì),終極原因是摩爾定律,或者更確切地說(shuō),是它對(duì)每單位計(jì)算成本持續(xù)呈指數(shù)下降的概括,大多數(shù) AI 研究都是在可用算力恒定的情況下進(jìn)行的(在這種情況下,利用人類經(jīng)驗(yàn)將是提高性能的唯一方法),但是,在比典型研究項(xiàng)目稍長(zhǎng)的時(shí)間里,算力會(huì)大大增加,從長(zhǎng)遠(yuǎn)來(lái)看,唯一重要的是利用計(jì)算。

正如 Sutton 所預(yù)見(jiàn)的,近年來(lái),AI 硬件算力取得了突飛猛進(jìn)的發(fā)展。除了為人所熟知的 GPU 之外,谷歌 TPU(GPT 系列早期通過(guò) TPUv2 進(jìn)行訓(xùn)練)、微軟 Catapult 等 AI 加速芯片往往省去了傳統(tǒng)通用 CPU 微架構(gòu)中亂序、預(yù)取等高級(jí)控制措施,能夠?qū)崿F(xiàn)卷積神經(jīng)網(wǎng)絡(luò)最核心的乘加運(yùn)算單元設(shè)計(jì)最優(yōu)化,充分挖掘 SIMD 架構(gòu)并行計(jì)算能力。

算法、算力及其相結(jié)合的工程方法進(jìn)步,最終為 OpenAI“大力出奇跡”奠定了基礎(chǔ)。

完全可以預(yù)期,在 OpenAI 明星效應(yīng)下,全球科技巨頭未來(lái)一兩年必將推出一系列類 GPT 預(yù)訓(xùn)練大模型,也有望帶動(dòng)對(duì)數(shù)據(jù)中心 AI 算力集群的投資進(jìn)一步加速。

不過(guò)值得注意的是,盡管各大芯片廠商爭(zhēng)相推出 AI 加速芯片,算力參數(shù)不斷刷新記錄,但預(yù)訓(xùn)練大模型參數(shù)量動(dòng)輒上百億、千億乃至萬(wàn)億,其訓(xùn)練仍遠(yuǎn)遠(yuǎn)超出一兩張 GPU 等 AI 加速卡所能駕馭的范圍,往往必須通過(guò)網(wǎng)絡(luò)將多處理器互連、乃至進(jìn)一步組成 HPC 算力集群,實(shí)現(xiàn)算力資源的池化調(diào)度,如此方能滿足 AI 大模型的分布式、并行化訓(xùn)練。而在評(píng)估訓(xùn)練效率時(shí),單批數(shù)據(jù)(batch)的總訓(xùn)練用時(shí)也往往受通信時(shí)長(zhǎng)的顯著影響。

正因如此,隨著 AI 大模型揭示的全新想象空間出現(xiàn),算力集群這一基礎(chǔ)設(shè)施也將迎來(lái)投資熱潮,而在其面臨的配電、散熱、通信等一系列工程挑戰(zhàn)中,算力節(jié)點(diǎn)間的數(shù)據(jù)傳輸尤其堪稱制約硬件算力充分釋放的關(guān)鍵“瓶頸”。

破解互連瓶頸的“關(guān)鍵支點(diǎn)”

AI 訓(xùn)練、推理所面對(duì)的數(shù)據(jù)量指數(shù)增長(zhǎng),使得無(wú)論單服務(wù)器中多 GPU、CPU 間 C2C 通信,還是在多服務(wù)器間組網(wǎng),數(shù)據(jù)傳輸總體都呈現(xiàn)出高帶寬、低延遲的技術(shù)需求。

在算力集群通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)趨同的背景下,交換機(jī)接口日益成為打通“瓶頸”的重要突破口,并衍生出提升網(wǎng)卡速率、增加網(wǎng)卡數(shù)量、乃至應(yīng)用 RDMA 網(wǎng)絡(luò)直連等多種工程思路。

而在底層接口技術(shù)領(lǐng)域,與傳統(tǒng)并行接口相比,SerDes 串行接口由于其顯著的成本優(yōu)勢(shì),已然成為應(yīng)用主流,在 PCIe 6.0 等新標(biāo)準(zhǔn)中,更是在物理層進(jìn)一步引入對(duì) PAM4(四階脈沖振幅調(diào)變)編碼的支持,以進(jìn)一步提高 SerDes 數(shù)據(jù)傳輸速率。

不過(guò) SerDes 的應(yīng)用,也自然存在不少技術(shù)挑戰(zhàn),其中最嚴(yán)峻的,無(wú)疑首推信號(hào)完整性(SI)問(wèn)題。

例如在通過(guò)背板、連接器、PCB 板的中距離、長(zhǎng)距離互連場(chǎng)景中,SerDes 高速鏈路 TX、RX 端往往間隔著管腳、PCB 過(guò)孔、信號(hào)線乃至連接器、線纜等環(huán)節(jié),存在材料、工藝、布局等復(fù)雜原因引入的噪聲、串?dāng)_和信號(hào)衰減,以至于最終抵達(dá)接收器的電氣信號(hào)可能嚴(yán)重失真,很難恢復(fù)所傳輸信息時(shí)鐘和數(shù)據(jù)位,也局限了速率、距離上的設(shè)計(jì)空間。

新一代 56G、112G SerDes 應(yīng)用 PAM4 編碼,在提供更大網(wǎng)絡(luò)吞吐量的同時(shí),也因引入更多電平水平,帶來(lái)了信噪比損失、誤碼率(BER)惡化、前向糾錯(cuò)(FEC)延遲增加等問(wèn)題,需要進(jìn)行精細(xì)的權(quán)衡取舍。

從上面的分析不難看出,想要充分發(fā)揮 AI 硬件算力效能,接口技術(shù)是破解互連瓶頸的關(guān)鍵支點(diǎn),具有極大的杠桿效應(yīng),而其應(yīng)用則必須解決圍繞信號(hào)完整性的諸多挑戰(zhàn)。

目前,盡管大量硬件廠商聘請(qǐng)了專職 SI 工程師負(fù)責(zé)調(diào)試,不過(guò)其效果取決于千差萬(wàn)別的個(gè)人“手藝”,由于在芯片與系統(tǒng)設(shè)計(jì)各層面均需保證信號(hào)完整性,驗(yàn)證過(guò)程也往往曠日持久,只有技能十分熟練且模電領(lǐng)域經(jīng)驗(yàn)極其豐富的設(shè)計(jì)團(tuán)隊(duì)才能嘗試此類設(shè)計(jì),且測(cè)試驗(yàn)證周期漫長(zhǎng)。

正因如此,在芯片設(shè)計(jì)中,外購(gòu)高速接口 IP 幾乎成為行業(yè)“必選項(xiàng)”,也帶動(dòng)接口 IP 成為近年來(lái)增速最快的 IP 細(xì)分市場(chǎng),根據(jù)專業(yè)機(jī)構(gòu)預(yù)測(cè),接口 IP 甚至有望在 2025 年前后超越 CPU IP,成為第一大半導(dǎo)體 IP 品類。

授人以魚,更要授人以漁

接口 IP 市場(chǎng)機(jī)遇,也使之成為各大 IP HOUSE 競(jìng)爭(zhēng)熱點(diǎn)。Cadence 同樣推出了112G SerDes IP 設(shè)計(jì),面向高性能計(jì)算(HPC)數(shù)據(jù)中心 SOC 需求,適用于長(zhǎng)距離和中距離傳輸,已經(jīng)經(jīng)過(guò) 7nm 制程硅驗(yàn)證,擁有上佳的 PPA 表現(xiàn),插入損耗 >35dB。

值得一提的是,外購(gòu)接口 IP 只是從芯片到系統(tǒng)開(kāi)發(fā)及信號(hào)完整性測(cè)試的起點(diǎn),與工作流配套的工具是否完備、可及,也是影響開(kāi)發(fā)周期的重要因素,可以說(shuō)接口 IP 供應(yīng)商既要授人以魚,更要授人以漁。

作為 EDAIP 領(lǐng)域巨頭,Cadence 在這方面的實(shí)踐尤其具有代表性。在 SerDes 等成熟接口 IP 之外,該公司還提供了有機(jī)融合的完善設(shè)計(jì)工具和技術(shù),幫助芯片與系統(tǒng)設(shè)計(jì)人員應(yīng)對(duì)貫穿各層面的信號(hào)完整性挑戰(zhàn)。

例如在不同芯片間互連設(shè)計(jì)與仿真中,建模是必不可少的手段。目前,IBIS 和 AMI 是對(duì) SerDes 信道進(jìn)行建模的首選方式,IBIS-AMI 的出現(xiàn),使利用仿真模型快速且精確地模擬大量比特流成為了可能。Cadence 基于Sigrity Advanced IBIS 建模工具,用戶可自動(dòng)創(chuàng)建模型,借助向?qū)С绦蛏蓪?shí)用算法模型。

在基于 PCB 板/背板/連接器的中長(zhǎng)距離互連場(chǎng)景中,SerDes 高速接口開(kāi)發(fā)人員為了精準(zhǔn)可靠地分析信號(hào),還需要為總體設(shè)計(jì)進(jìn)行信號(hào)完整性(SI)、電源完整性(PI)以及電磁兼容性(EMC)協(xié)同仿真,開(kāi)發(fā)者往往需要透徹了解數(shù)據(jù)采集分析理論、精準(zhǔn)建立模擬器件特性模型。

針對(duì)這一痛點(diǎn),Cadence 的Clarity 3D Solver為 PCB、IC 封裝和 SoIC 關(guān)鍵互連設(shè)計(jì)提供了更好的工具選擇,基于其創(chuàng)建的高精度 S-參數(shù)模型,即使在 112G 數(shù)據(jù)傳輸速度下,也能實(shí)現(xiàn)與實(shí)驗(yàn)室測(cè)量相匹配的仿真結(jié)果。其有限元分析(FEM)過(guò)程實(shí)現(xiàn)了高度并行化,可極大縮短求解耗時(shí),并支持近乎線性的硬件算力可擴(kuò)展性。

此外,在分析鏈路信號(hào)完整性時(shí),通常隱含假設(shè)是電路板和連接器功能良好,但在極高頻率下,單獨(dú)分析連接器和電路板、然后再將它們“連接"在一起的假設(shè)不再適用。電路板和連接器之間交互過(guò)多,同樣需要 Clarity Solver 等全面的 3D 分析工具實(shí)現(xiàn)高質(zhì)量設(shè)計(jì),同時(shí)準(zhǔn)確預(yù)測(cè)成品性能。

結(jié)語(yǔ)

黃仁勛喊出人工智能“iPhone 時(shí)刻”后,短短幾十天以來(lái),預(yù)訓(xùn)練大模型及其下游應(yīng)用,已經(jīng)呈現(xiàn)出令人目不暇給的爆發(fā)態(tài)勢(shì)。可以想見(jiàn),在各大云計(jì)算巨頭的 AI 大模型“軍備競(jìng)賽”中,算力集群也將迎來(lái)一輪新的投資熱潮,通信網(wǎng)絡(luò)與接口技術(shù),也有望進(jìn)入發(fā)展加速期。此外,特斯拉 Dojo、Cerebras WSE-2 等走“超級(jí)單芯片”路線的廠商,也可能引領(lǐng)一條大模型訓(xùn)練的新路。

不過(guò)無(wú)論何種路徑,對(duì)接口 IP 的“剛需”都清晰可見(jiàn),在這一熱點(diǎn)、難點(diǎn)領(lǐng)域,Cadence 將帶來(lái)更多完整的解決方案,推動(dòng)互連瓶頸的緩解與松動(dòng),有力釋放預(yù)訓(xùn)練大模型無(wú)限可能,造福千行百業(yè)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46334

    瀏覽量

    236498
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3060

    瀏覽量

    48575
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1525

    瀏覽量

    7249

原文標(biāo)題:釋放 AI 大模型潛能,硬件算力亟待突破互連瓶頸

文章出處:【微信號(hào):gh_fca7f1c2678a,微信公眾號(hào):Cadence楷登】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    華納云:ChatGPT 登陸 Windows

    ChatGPT 現(xiàn)已在 Windows 上推出。 今天,OpenAI宣布已開(kāi)始預(yù)覽其 AI 聊天機(jī)器人平臺(tái)ChatGPT的專用 Windows 應(yīng)用程序。 OpenAI 表示, ChatGPT
    的頭像 發(fā)表于 10-18 15:50 ?112次閱讀

    空載時(shí)為何OPA454如此發(fā)燙,這個(gè)發(fā)燙是正?,F(xiàn)象嗎?

    Supply voltage, VS = (V+) – (V–) 120 V,是不是意味著我使用(V-)=-12V,(V+)=95V供電是在其允許范圍內(nèi)的?在空載時(shí)為何OPA454如此發(fā)燙,這個(gè)發(fā)燙是正?,F(xiàn)象么?
    發(fā)表于 08-02 10:08

    用launch pad燒錄chatgpt_demo項(xiàng)目會(huì)有api key報(bào)錯(cuò)的原因?

    我用launch pad燒錄chatgpt_demo項(xiàng)目問(wèn)題會(huì)有api key報(bào)錯(cuò);請(qǐng)問(wèn)用launch pad要如何設(shè)置api key和調(diào)試?還是只能通過(guò)idf?
    發(fā)表于 06-27 07:59

    使用espbox lite進(jìn)行chatgpt_demo的燒錄報(bào)錯(cuò)是什么原因?

    我使用espbox lite進(jìn)行chatgpt_demo的燒錄 我的idf是v5.1release版本的,espbox是master版本的 在編譯時(shí)似乎沒(méi)有什么問(wèn)題 在燒錄時(shí)報(bào)錯(cuò) 請(qǐng)問(wèn)這是什么原因
    發(fā)表于 06-11 08:45

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來(lái)了

    當(dāng)?shù)貢r(shí)間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強(qiáng)大基礎(chǔ)上,這種迭代擁有顯著的改進(jìn)。在發(fā)布會(huì)的演示中,OpenAI展示該模型的高級(jí)
    發(fā)表于 05-27 15:43

    RISC-V為何如此重要?

    什么讓RISC-V如此受歡迎,為什么從NVIDIA到微軟的每個(gè)人都在投資它?什么是RISC-V?RISC-V是一種指令集架構(gòu)(ISA)。ISA是CPU必須能夠解釋和處
    的頭像 發(fā)表于 04-29 08:28 ?296次閱讀
    RISC-V<b class='flag-5'>為何如此</b>重要?

    什么是邊緣計(jì)算?它為何如此重要?

    ,什么是邊緣計(jì)算?它為何如此重要?本文將對(duì)其進(jìn)行詳細(xì)的解析。 邊緣計(jì)算,簡(jiǎn)而言之,是指在靠近物或數(shù)據(jù)源頭的一側(cè),采用網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)、應(yīng)用核心能力為一體的開(kāi)放平臺(tái),就近提供最近端服務(wù)。它的核心思想是將計(jì)算任
    的頭像 發(fā)表于 04-22 15:25 ?343次閱讀

    在FPGA設(shè)計(jì)中是否可以應(yīng)用ChatGPT生成想要的程序呢

    當(dāng)下AI人工智能崛起,很多開(kāi)發(fā)領(lǐng)域都可看到ChatGPT的身影,F(xiàn)PGA設(shè)計(jì)中,是否也可以用ChatGPT輔助設(shè)計(jì)呢?
    發(fā)表于 03-28 23:41

    【國(guó)產(chǎn)FPGA+OMAPL138開(kāi)發(fā)板體驗(yàn)】(原創(chuàng))6.FPGA連接ChatGPT 4

    OMAP-L138(定點(diǎn)/浮點(diǎn)DSP C674x+ARM9)+ FPGA處理器的開(kāi)發(fā)板。 編寫一個(gè)用于FPGA訪問(wèn)ChatGPT 4的程序代碼是一個(gè)相當(dāng)復(fù)雜的任務(wù),涉及到硬件設(shè)計(jì)、網(wǎng)絡(luò)通信、數(shù)據(jù)處理等多個(gè)
    發(fā)表于 02-14 21:58

    ChatGPT原理 ChatGPT模型訓(xùn)練 chatgpt注冊(cè)流程相關(guān)簡(jiǎn)介

    ChatGPT注冊(cè)沒(méi)有外國(guó)手機(jī)號(hào)驗(yàn)證怎么辦? ChatGPT作為近期火爆網(wǎng)絡(luò)的AI項(xiàng)目,受到了前所未有的關(guān)注。我們可以與AI機(jī)器人實(shí)時(shí)聊天,獲得問(wèn)題的答案。但受ChatGPT服務(wù)器及相關(guān)政策
    的頭像 發(fā)表于 12-06 16:28 ?781次閱讀
    <b class='flag-5'>ChatGPT</b>原理 <b class='flag-5'>ChatGPT</b>模型訓(xùn)練 <b class='flag-5'>chatgpt</b>注冊(cè)流程相關(guān)簡(jiǎn)介

    最新ChatGPT詳細(xì)注冊(cè)圖文解說(shuō)教程 ChatGPT賬號(hào)注冊(cè)詳細(xì)步驟分析

    2024年注冊(cè)ChatGPT詳細(xì)教程,手把手教你完成ChatGPT的注冊(cè)
    的頭像 發(fā)表于 12-04 17:18 ?7684次閱讀
    最新<b class='flag-5'>ChatGPT</b>詳細(xì)注冊(cè)圖文解說(shuō)教程  <b class='flag-5'>ChatGPT</b>賬號(hào)注冊(cè)詳細(xì)步驟分析

    不到1分鐘開(kāi)發(fā)一個(gè)GPT應(yīng)用!各路大神瘋狂整活,網(wǎng)友:ChatGPT就是新iPhone

    這個(gè)說(shuō)法并不準(zhǔn)確。盡管ChatGPT等語(yǔ)言模型已經(jīng)在一定程度上改變了我們獲取信息、學(xué)習(xí)知識(shí)的方式,但它們并不能替代人類進(jìn)行創(chuàng)造性思考和創(chuàng)造性活動(dòng)。 雖然一些人可能會(huì)利用ChatGPT等語(yǔ)言模型快速
    發(fā)表于 11-19 12:06

    怎么和ChatGPT語(yǔ)音聊天?

    ChatGPT語(yǔ)音聊天免打字輸入、訓(xùn)練外語(yǔ)口說(shuō)能力的好幫手。 ChatGPT手機(jī)App的語(yǔ)音聊天功能是陸續(xù)開(kāi)放給全球Plus用戶,ChatGPT Plus用戶先確認(rèn)App是否已經(jīng)更新到最新版本,因
    的頭像 發(fā)表于 11-14 17:36 ?3073次閱讀
    怎么和<b class='flag-5'>ChatGPT</b>語(yǔ)音聊天?

    集成電路產(chǎn)業(yè)全國(guó)第二、全省第一,無(wú)錫為何如此大的能量?

    集成電路產(chǎn)業(yè)在全球被視為高精尖技術(shù)競(jìng)賽場(chǎng),很幸運(yùn),無(wú)錫就擁有這一“王牌產(chǎn)業(yè)”,無(wú)錫集成電路產(chǎn)業(yè)綜合實(shí)力雄踞全國(guó)第二、全省第一,小小無(wú)錫為何如此大的能量?
    的頭像 發(fā)表于 11-06 22:07 ?1171次閱讀
    集成電路產(chǎn)業(yè)全國(guó)第二、全省第一,無(wú)錫<b class='flag-5'>為何</b>有<b class='flag-5'>如此</b>大的能量?

    如何使用Rust創(chuàng)建一個(gè)基于ChatGPT的RAG助手

    如今,ChatGPT 已經(jīng)成為家喻戶曉的名字,每個(gè)開(kāi)發(fā)者都主動(dòng)或被動(dòng)地使用過(guò) ChatGPT 或者是基于 ChatGPT 的產(chǎn)品。ChatGPT 很好,但是應(yīng)用到實(shí)際工作與生活場(chǎng)景,
    的頭像 發(fā)表于 10-24 17:34 ?962次閱讀
    如何使用Rust創(chuàng)建一個(gè)基于<b class='flag-5'>ChatGPT</b>的RAG助手