国内精品久久久久久麻豆,九九精品视频免费久久99看

隨著 ChatGPT 橫空出世，預(yù)訓(xùn)練大模型對(duì)千行百業(yè)的革新與改造潛力已盡顯無遺，甚至有業(yè)界大佬將其問世譽(yù)為人工智能“iPhone 時(shí)刻”，并預(yù)言這“只是更偉大事物的開始”。

ChatGPT 為何顯得如此“與眾不同”？

借用技術(shù)接受理論（TAM）提出者哈佛大學(xué)教授 Venky Narayanamurti 的總結(jié)：有用性（usefulness）與易用性（ease of use）是一項(xiàng)新興技術(shù)擴(kuò)散的兩大基本前提。以這一標(biāo)準(zhǔn)衡量，2016 年的“AlphaGo vs 李世石”五番棋大戰(zhàn)，堪稱完成了對(duì)人工智能“有用性”的全民科普，而 ChatGPT 則標(biāo)志著 AI 技術(shù)擴(kuò)散的另一必要條件——易用性已潛移默化滲入公眾心智。

基于此，外界有理由樂觀期待，人工智能產(chǎn)業(yè)的確已站在了巨擘預(yù)卜的宏偉藍(lán)圖新起點(diǎn)上。

成于算力困于互連？

在不少“后見之明”的解讀中，GPT 家族往往被與 2017 年谷歌推出的 Transformer 模型相聯(lián)系。

基于自注意力機(jī)制的 Transformer，及其后谷歌 BERT 對(duì)各類文本任務(wù)的“屠榜”表現(xiàn)和驚人的泛化能力，的確堪稱為 GPT 做好了前置技術(shù)與工程方法的鋪墊。站在巨人的肩膀上，GPT 開發(fā)者 OpenAI 團(tuán)隊(duì)，最終憑借更敏捷的效率和更有力的執(zhí)行，完成了最后的一躍。

進(jìn)一步深入看，Transformer 較此前 MLP\LSTM 等傳統(tǒng)深度學(xué)習(xí)模型，正是對(duì)硬件算力實(shí)現(xiàn)了更高效的運(yùn)用。

關(guān)于這一點(diǎn)，2019 年深度學(xué)習(xí)泰斗、DeepMind 首席科學(xué)家 Richard Sutton 在其《苦澀的教訓(xùn)》一文中就曾感言，從 70 年 AI 研究中可以學(xué)到的最大教訓(xùn)是，利用計(jì)算的一般方法最終是最有效的，而且有很大的優(yōu)勢(shì)，終極原因是摩爾定律，或者更確切地說，是它對(duì)每單位計(jì)算成本持續(xù)呈指數(shù)下降的概括，大多數(shù) AI 研究都是在可用算力恒定的情況下進(jìn)行的（在這種情況下，利用人類經(jīng)驗(yàn)將是提高性能的唯一方法），但是，在比典型研究項(xiàng)目稍長的時(shí)間里，算力會(huì)大大增加，從長遠(yuǎn)來看，唯一重要的是利用計(jì)算。

正如 Sutton 所預(yù)見的，近年來，AI 硬件算力取得了突飛猛進(jìn)的發(fā)展。除了為人所熟知的 GPU 之外，谷歌 TPU（GPT 系列早期通過 TPUv2 進(jìn)行訓(xùn)練）、微軟 Catapult 等 AI 加速芯片往往省去了傳統(tǒng)通用 CPU 微架構(gòu)中亂序、預(yù)取等高級(jí)控制措施，能夠?qū)崿F(xiàn)卷積神經(jīng)網(wǎng)絡(luò)最核心的乘加運(yùn)算單元設(shè)計(jì)最優(yōu)化，充分挖掘 SIMD 架構(gòu)并行計(jì)算能力。

算法、算力及其相結(jié)合的工程方法進(jìn)步，最終為 OpenAI“大力出奇跡”奠定了基礎(chǔ)。

完全可以預(yù)期，在 OpenAI 明星效應(yīng)下，全球科技巨頭未來一兩年必將推出一系列類 GPT 預(yù)訓(xùn)練大模型，也有望帶動(dòng)對(duì)數(shù)據(jù)中心 AI 算力集群的投資進(jìn)一步加速。

不過值得注意的是，盡管各大芯片廠商爭(zhēng)相推出 AI 加速芯片，算力參數(shù)不斷刷新記錄，但預(yù)訓(xùn)練大模型參數(shù)量動(dòng)輒上百億、千億乃至萬億，其訓(xùn)練仍遠(yuǎn)遠(yuǎn)超出一兩張 GPU 等 AI 加速卡所能駕馭的范圍，往往必須通過網(wǎng)絡(luò)將多處理器互連、乃至進(jìn)一步組成 HPC 算力集群，實(shí)現(xiàn)算力資源的池化調(diào)度，如此方能滿足 AI 大模型的分布式、并行化訓(xùn)練。而在評(píng)估訓(xùn)練效率時(shí)，單批數(shù)據(jù)（batch）的總訓(xùn)練用時(shí)也往往受通信時(shí)長的顯著影響。

正因如此，隨著 AI 大模型揭示的全新想象空間出現(xiàn)，算力集群這一基礎(chǔ)設(shè)施也將迎來投資熱潮，而在其面臨的配電、散熱、通信等一系列工程挑戰(zhàn)中，算力節(jié)點(diǎn)間的數(shù)據(jù)傳輸尤其堪稱制約硬件算力充分釋放的關(guān)鍵“瓶頸”。

破解互連瓶頸的“關(guān)鍵支點(diǎn)”

AI 訓(xùn)練、推理所面對(duì)的數(shù)據(jù)量指數(shù)增長，使得無論單服務(wù)器中多 GPU、CPU 間 C2C 通信，還是在多服務(wù)器間組網(wǎng)，數(shù)據(jù)傳輸總體都呈現(xiàn)出高帶寬、低延遲的技術(shù)需求。

在算力集群通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)趨同的背景下，交換機(jī)接口日益成為打通“瓶頸”的重要突破口，并衍生出提升網(wǎng)卡速率、增加網(wǎng)卡數(shù)量、乃至應(yīng)用 RDMA 網(wǎng)絡(luò)直連等多種工程思路。

而在底層接口技術(shù)領(lǐng)域，與傳統(tǒng)并行接口相比，SerDes 串行接口由于其顯著的成本優(yōu)勢(shì)，已然成為應(yīng)用主流，在 PCIe 6.0 等新標(biāo)準(zhǔn)中，更是在物理層進(jìn)一步引入對(duì) PAM4（四階脈沖振幅調(diào)變）編碼的支持，以進(jìn)一步提高 SerDes 數(shù)據(jù)傳輸速率。

不過 SerDes 的應(yīng)用，也自然存在不少技術(shù)挑戰(zhàn)，其中最嚴(yán)峻的，無疑首推信號(hào)完整性（SI）問題。

例如在通過背板、連接器、PCB 板的中距離、長距離互連場(chǎng)景中，SerDes 高速鏈路 TX、RX 端往往間隔著管腳、PCB 過孔、信號(hào)線乃至連接器、線纜等環(huán)節(jié)，存在材料、工藝、布局等復(fù)雜原因引入的噪聲、串?dāng)_和信號(hào)衰減，以至于最終抵達(dá)接收器的電氣信號(hào)可能嚴(yán)重失真，很難恢復(fù)所傳輸信息的時(shí)鐘和數(shù)據(jù)位，也局限了速率、距離上的設(shè)計(jì)空間。

新一代 56G、112G SerDes 應(yīng)用 PAM4 編碼，在提供更大網(wǎng)絡(luò)吞吐量的同時(shí)，也因引入更多電平水平，帶來了信噪比損失、誤碼率（BER）惡化、前向糾錯(cuò)（FEC）延遲增加等問題，需要進(jìn)行精細(xì)的權(quán)衡取舍。

從上面的分析不難看出，想要充分發(fā)揮 AI 硬件算力效能，接口技術(shù)是破解互連瓶頸的關(guān)鍵支點(diǎn)，具有極大的杠桿效應(yīng)，而其應(yīng)用則必須解決圍繞信號(hào)完整性的諸多挑戰(zhàn)。

目前，盡管大量硬件廠商聘請(qǐng)了專職 SI 工程師負(fù)責(zé)調(diào)試，不過其效果取決于千差萬別的個(gè)人“手藝”，由于在芯片與系統(tǒng)設(shè)計(jì)各層面均需保證信號(hào)完整性，驗(yàn)證過程也往往曠日持久，只有技能十分熟練且模電領(lǐng)域經(jīng)驗(yàn)極其豐富的設(shè)計(jì)團(tuán)隊(duì)才能嘗試此類設(shè)計(jì)，且測(cè)試驗(yàn)證周期漫長。

正因如此，在芯片設(shè)計(jì)中，外購高速接口 IP 幾乎成為行業(yè)“必選項(xiàng)”，也帶動(dòng)接口 IP 成為近年來增速最快的 IP 細(xì)分市場(chǎng)，根據(jù)專業(yè)機(jī)構(gòu)預(yù)測(cè)，接口 IP 甚至有望在 2025 年前后超越 CPU IP，成為第一大半導(dǎo)體 IP 品類。

授人以魚，更要授人以漁

接口 IP 市場(chǎng)機(jī)遇，也使之成為各大 IP HOUSE 競(jìng)爭(zhēng)熱點(diǎn)。Cadence 同樣推出了112G SerDes IP 設(shè)計(jì)，面向高性能計(jì)算（HPC）數(shù)據(jù)中心 SOC 需求，適用于長距離和中距離傳輸，已經(jīng)經(jīng)過 7nm 制程硅驗(yàn)證，擁有上佳的 PPA 表現(xiàn)，插入損耗 >35dB。

值得一提的是，外購接口 IP 只是從芯片到系統(tǒng)開發(fā)及信號(hào)完整性測(cè)試的起點(diǎn)，與工作流配套的工具是否完備、可及，也是影響開發(fā)周期的重要因素，可以說接口 IP 供應(yīng)商既要授人以魚，更要授人以漁。

作為 EDA\IP 領(lǐng)域巨頭，Cadence 在這方面的實(shí)踐尤其具有代表性。在 SerDes 等成熟接口 IP 之外，該公司還提供了有機(jī)融合的完善設(shè)計(jì)工具和技術(shù)，幫助芯片與系統(tǒng)設(shè)計(jì)人員應(yīng)對(duì)貫穿各層面的信號(hào)完整性挑戰(zhàn)。

例如在不同芯片間互連設(shè)計(jì)與仿真中，建模是必不可少的手段。目前，IBIS 和 AMI 是對(duì) SerDes 信道進(jìn)行建模的首選方式，IBIS-AMI 的出現(xiàn)，使利用仿真模型快速且精確地模擬大量比特流成為了可能。Cadence 基于Sigrity Advanced IBIS 建模工具，用戶可自動(dòng)創(chuàng)建模型，借助向?qū)С绦蛏蓪?shí)用算法模型。

在基于 PCB 板/背板/連接器的中長距離互連場(chǎng)景中，SerDes 高速接口開發(fā)人員為了精準(zhǔn)可靠地分析信號(hào)，還需要為總體設(shè)計(jì)進(jìn)行信號(hào)完整性（SI）、電源完整性（PI）以及電磁兼容性（EMC）協(xié)同仿真，開發(fā)者往往需要透徹了解數(shù)據(jù)采集分析理論、精準(zhǔn)建立模擬器件特性模型。

針對(duì)這一痛點(diǎn)，Cadence 的Clarity 3D Solver為 PCB、IC 封裝和 SoIC 關(guān)鍵互連設(shè)計(jì)提供了更好的工具選擇，基于其創(chuàng)建的高精度 S-參數(shù)模型，即使在 112G 數(shù)據(jù)傳輸速度下，也能實(shí)現(xiàn)與實(shí)驗(yàn)室測(cè)量相匹配的仿真結(jié)果。其有限元分析（FEM）過程實(shí)現(xiàn)了高度并行化，可極大縮短求解耗時(shí)，并支持近乎線性的硬件算力可擴(kuò)展性。

此外，在分析鏈路信號(hào)完整性時(shí)，通常隱含假設(shè)是電路板和連接器功能良好，但在極高頻率下，單獨(dú)分析連接器和電路板、然后再將它們“連接"在一起的假設(shè)不再適用。電路板和連接器之間交互過多，同樣需要 Clarity Solver 等全面的 3D 分析工具實(shí)現(xiàn)高質(zhì)量設(shè)計(jì)，同時(shí)準(zhǔn)確預(yù)測(cè)成品性能。

結(jié)

語

在黃仁勛喊出人工智能“iPhone 時(shí)刻”后，短短幾十天以來，預(yù)訓(xùn)練大模型及其下游應(yīng)用，已經(jīng)呈現(xiàn)出令人目不暇給的爆發(fā)態(tài)勢(shì)。可以想見，在各大云計(jì)算巨頭的 AI 大模型“軍備競(jìng)賽”中，算力集群也將迎來一輪新的投資熱潮，通信網(wǎng)絡(luò)與接口技術(shù)，也有望進(jìn)入發(fā)展加速期。此外，特斯拉 Dojo、Cerebras WSE-2 等走“超級(jí)單芯片”路線的廠商，也可能引領(lǐng)一條大模型訓(xùn)練的新路。

不過無論何種路徑，對(duì)接口 IP 的“剛需”都清晰可見，在這一熱點(diǎn)、難點(diǎn)領(lǐng)域，Cadence 將帶來更多完整的解決方案，推動(dòng)互連瓶頸的緩解與松動(dòng)，有力釋放預(yù)訓(xùn)練大模型無限可能，造福千行百業(yè)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

硬件

硬件

+關(guān)注

關(guān)注
11

文章
3164

瀏覽量
66007
AI

AI

+關(guān)注

關(guān)注
87

文章
29383

瀏覽量
267679

評(píng)論

相關(guān)推薦

芯片、模型生態(tài)分散，無問芯穹、沐曦、壁仞談國產(chǎn)算力瓶頸破局之道

，而GPT-4之后的一段時(shí)間里，無論是OpenAI發(fā)布的新模型，還是其他大模型，整體算法能力進(jìn)入了放緩甚至是停滯的階段。夏立雪認(rèn)為，這其中，表面上看是大模型的發(fā)展放緩或者停止了，其實(shí)背后的邏輯卻是支撐算法的

發(fā)表于 07-07 11:14 ?4276次閱讀

芯片、<b class='flag-5'>模型</b>生態(tài)分散，無問芯穹、沐曦、壁仞談國產(chǎn)<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>瓶頸</b>破局之道

【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

國慶前就收到《大模型時(shí)代的基礎(chǔ)架構(gòu)》一書，感謝電子發(fā)燒友論壇。歡度國慶之余，今天才靜下心來體驗(yàn)此書，書不厚，200余頁，彩色圖例，印刷精美！當(dāng)初申請(qǐng)此書，主要是看到副標(biāo)題“大模型算力

發(fā)表于 10-08 10:40

名單公布！【書籍評(píng)測(cè)活動(dòng)NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

試用評(píng)測(cè)資格！前言不知不覺中，我們來到一個(gè)計(jì)算機(jī)科學(xué)飛速發(fā)展的時(shí)代，手機(jī)和計(jì)算機(jī)中各類便捷的軟件已經(jīng)融入日常生活，在此背景下，硬件特別是算力強(qiáng)勁的芯片，對(duì)于軟件服務(wù)起到不可替代的支撐作用。芯片的

發(fā)表于 09-02 10:09

大模型時(shí)代的算力需求

現(xiàn)在AI已進(jìn)入大模型時(shí)代，各企業(yè)都爭(zhēng)相部署大模型，但如何保證大模型的算力，以及相關(guān)的穩(wěn)定性和性能

發(fā)表于 08-20 09:04

芯耀輝科技解讀高速互連對(duì)于AI和大算力芯片而言意味著什么？

近年來，隨著人工智能技術(shù)的迅猛發(fā)展，大算力芯片已成為推動(dòng)AI技術(shù)創(chuàng)新的關(guān)鍵力量。然而，隨著芯片內(nèi)部計(jì)算單元數(shù)量的增加和任務(wù)復(fù)雜度的提升，互連已成為一個(gè)嚴(yán)重的

發(fā)表于 07-08 11:39 ?809次閱讀

AIGC掀算力需求革命，邊緣計(jì)算將不再“邊緣”

AI算力瓶頸下邊緣計(jì)算崛起

發(fā)表于 04-22 14:51 ?288次閱讀

液冷是大模型對(duì)算力需求的必然選擇？｜英偉達(dá) GTC 2024六大亮點(diǎn)

在這個(gè)以高性能計(jì)算和大模型推動(dòng)未來通用人工智能時(shí)代，算力已成為科技發(fā)展的隱形支柱。本文將重點(diǎn)探討算力的演進(jìn)，深入分析在不同領(lǐng)域中

發(fā)表于 04-10 12:57 ?427次閱讀

液冷是大<b class='flag-5'>模型</b>對(duì)<b class='flag-5'>算</b><b class='flag-5'>力</b>需求的必然選擇？｜英偉達(dá) GTC 2024六大亮點(diǎn)

一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò)，全面釋放AI時(shí)代算力

華為中國合作伙伴大會(huì) | 一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò)，以網(wǎng)強(qiáng)算，全面釋放AI時(shí)代算力

發(fā)表于 03-22 10:28 ?657次閱讀

一圖看懂星河<b class='flag-5'>AI</b>數(shù)據(jù)中心網(wǎng)絡(luò)，全面<b class='flag-5'>釋放</b><b class='flag-5'>AI</b>時(shí)代<b class='flag-5'>算</b><b class='flag-5'>力</b>

知達(dá)行業(yè)、繪就藍(lán)圖，澤塔云人工智能大模型“知繪”正式發(fā)布！

人工智能風(fēng)起云涌，新技術(shù)革命分新秒異，如何有效推動(dòng)大模型真正賦能行業(yè)，加快形成新質(zhì)生產(chǎn)力，是當(dāng)下破局之關(guān)鍵。在這場(chǎng)不斷探索、尋求突破與創(chuàng)新的征途中，澤塔云基于在GPU

發(fā)表于 03-20 17:30 ?333次閱讀

數(shù)據(jù)語料庫、算法框架和算力芯片在AI大模型中的作用和影響

數(shù)據(jù)語料庫、算法框架和算力芯片的確是影響AI大模型發(fā)展的三大重要因素。

發(fā)表于 03-01 09:42 ?848次閱讀

AI算力應(yīng)用中的光模塊產(chǎn)品

以ChatGPT為代表的AI大模型應(yīng)用普及將推動(dòng)算力需求快速增長，服務(wù)器產(chǎn)業(yè)鏈?zhǔn)瞧渲兄匾氖芤姝h(huán)節(jié)之一，AI計(jì)算的普及將推動(dòng)服務(wù)器產(chǎn)業(yè)鏈光模

發(fā)表于 01-02 15:32 ?437次閱讀

<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>應(yīng)用中的光模塊產(chǎn)品

弘信電子與AI算力服務(wù)器合資，助力國產(chǎn)算力芯片落地

此外，弘信電子近期在AI算力業(yè)務(wù)上取得了突破性進(jìn)展，這并非源自本土化的積累，而是依賴于團(tuán)隊(duì)敏銳的戰(zhàn)略眼光和強(qiáng)烈的創(chuàng)新動(dòng)力。此次投資是弘信電子在AI

發(fā)表于 12-25 09:30 ?714次閱讀

AGI時(shí)代的奠基石：Agent+算力+大模型是構(gòu)建AI未來的三駕馬車嗎？

AI Agent的訓(xùn)練離不開算力，服務(wù)器作為一個(gè)強(qiáng)大的計(jì)算中心，為AI Agent提供算力基礎(chǔ)，

發(fā)表于 12-21 13:34 ?1098次閱讀

淺談為AI大算力而生的存算-體芯片

大模型爆火之后，存算一體獲得了更多的關(guān)注與機(jī)會(huì)，其原因之一是因?yàn)榇?b class='flag-5'>算一體芯片的裸算力相比傳統(tǒng)架構(gòu)的AI

發(fā)表于 12-06 15:00 ?332次閱讀

PODsys：大模型AI算力平臺(tái)部署的開源“神器”

大模型是通用人工智能的底座，但大模型訓(xùn)練對(duì)算力平臺(tái)的依賴非常大。大模型算

發(fā)表于 11-08 09:17 ?793次閱讀

搜索歷史

行業(yè)資訊 | 釋放 AI 大模型潛能，硬件算力亟待突破互連瓶頸

評(píng)論

芯片、模型生態(tài)分散，無問芯穹、沐曦、壁仞談國產(chǎn)算力瓶頸破局之道

【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

名單公布！【書籍評(píng)測(cè)活動(dòng)NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

大模型時(shí)代的算力需求

芯耀輝科技解讀高速互連對(duì)于AI和大算力芯片而言意味著什么？

AIGC掀算力需求革命，邊緣計(jì)算將不再“邊緣”

液冷是大模型對(duì)算力需求的必然選擇？｜英偉達(dá) GTC 2024六大亮點(diǎn)

一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò)，全面釋放AI時(shí)代算力

知達(dá)行業(yè)、繪就藍(lán)圖，澤塔云人工智能大模型“知繪”正式發(fā)布！

數(shù)據(jù)語料庫、算法框架和算力芯片在AI大模型中的作用和影響

AI算力應(yīng)用中的光模塊產(chǎn)品

弘信電子與AI算力服務(wù)器合資，助力國產(chǎn)算力芯片落地

AGI時(shí)代的奠基石：Agent+算力+大模型是構(gòu)建AI未來的三駕馬車嗎？

淺談為AI大算力而生的存算-體芯片

PODsys：大模型AI算力平臺(tái)部署的開源“神器”

搜索歷史

行業(yè)資訊 | 釋放 AI 大模型潛能，硬件算力亟待突破互連瓶頸

評(píng)論

行業(yè)資訊 | 釋放 AI 大模型潛能，硬件算力亟待突破互連瓶頸