0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實(shí)現(xiàn)生成式AI的關(guān)鍵半導(dǎo)體技術(shù)

Rambus 藍(lán)鉑世科技 ? 來(lái)源:21ic ? 2023-08-25 15:15 ? 次閱讀

生成式AI最近在科技行業(yè)掀起了一股熱潮,ChatGPT、Bard和Einstein GPT等標(biāo)志性產(chǎn)品吸引了開(kāi)發(fā)者、企業(yè)和消費(fèi)者的目光。這些AI應(yīng)用能夠生成類似人類的文本、理解上下文,并以驚人的準(zhǔn)確性執(zhí)行翻譯、總結(jié)等任務(wù)。雖然這些例子已經(jīng)足以讓人信服生成式AI的力量,但我們目前仍然處于一個(gè)初始階段,還需要繼續(xù)不斷發(fā)展實(shí)現(xiàn)這一切的硬件技術(shù)。

隨著生成式AI的訓(xùn)練和應(yīng)用變得日益復(fù)雜,更加先進(jìn)的模型、更大規(guī)模的數(shù)據(jù)集和海量數(shù)據(jù)處理需求要求更低的時(shí)延、更高的帶寬、更多的存儲(chǔ)和內(nèi)存以及更強(qiáng)大的CPU算力。根據(jù)open.ai的數(shù)據(jù),“自2012年以來(lái),在運(yùn)行最大規(guī)模的AI訓(xùn)練過(guò)程中所使用的計(jì)算量已經(jīng)增加了30多萬(wàn)倍”。這一成就依托的是半導(dǎo)體行業(yè)幾個(gè)關(guān)鍵領(lǐng)域的技術(shù)發(fā)展和快速產(chǎn)品升級(jí)。

在訓(xùn)練和推理加速器中,HBM3和GDDR6這兩種內(nèi)存技術(shù)對(duì)于支持生成式AI的開(kāi)發(fā)至關(guān)重要。HBM是一種高性能的3D堆疊DRAM架構(gòu),最新的HBM3為內(nèi)存和處理單元之間的數(shù)據(jù)傳輸提供更高的帶寬和更低的功耗,同時(shí)還具有出色的延遲和緊湊的尺寸,因而成為AI訓(xùn)練硬件的絕佳選擇。而GDDR6是一種帶寬高、延遲低且實(shí)現(xiàn)成本更低的高性能圖形內(nèi)存技術(shù)。采用成熟制造工藝的GDDR6內(nèi)存具有非常出色的性價(jià)比,因此是AI推理應(yīng)用的最佳選擇。

HBM3和GDDR6均能在AI應(yīng)用中發(fā)揮更好的性能和效率,提升處理大型數(shù)據(jù)集的速度和效率,使生成式AI能夠獲得強(qiáng)大、高效的存儲(chǔ)系統(tǒng)支持,為大規(guī)模AI應(yīng)用提供必要的算力。

實(shí)現(xiàn)生成式AI的另一項(xiàng)關(guān)鍵技術(shù)是服務(wù)器的主內(nèi)存。這些服務(wù)器用于訪問(wèn)和轉(zhuǎn)換提供給先進(jìn)訓(xùn)練引擎的數(shù)據(jù),在保持訓(xùn)練流程的完整性方面起到了關(guān)鍵作用,而且對(duì)于找出實(shí)現(xiàn)高精度所需的最佳神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和數(shù)據(jù)格式的實(shí)驗(yàn)同樣至關(guān)重要。作為最新DDR內(nèi)存標(biāo)準(zhǔn),DDR5提供更高的數(shù)據(jù)傳輸速率、更低的功耗和更大的密度,幫助提升數(shù)據(jù)處理的速度和效率。DDR5 DRAM使新一代服務(wù)器系統(tǒng)能夠?yàn)槌笠?guī)模和企業(yè)數(shù)據(jù)中心提供巨大的算力,從而滿足高性能AI應(yīng)用的需求,比如需要大量存儲(chǔ)和算力的ChatGPT等。

CXL也在這方面起到至關(guān)重要的作用。Compute Express Link(CXL)是處理器和加速器、智能網(wǎng)卡及內(nèi)存設(shè)備之間的一種開(kāi)放、標(biāo)準(zhǔn)的高速緩存一致性互連技術(shù)。憑借內(nèi)存池、交換和“按需”內(nèi)存范式等先進(jìn)功能,CXL能夠部署新的內(nèi)存層,彌補(bǔ)主內(nèi)存和SSD存儲(chǔ)之間的延遲差距。新的內(nèi)存層將提升帶寬、容量和效率并降低總擁有成本(TCO)。這項(xiàng)技術(shù)對(duì)于需要實(shí)時(shí)處理大量數(shù)據(jù)的大規(guī)模AI應(yīng)用尤為關(guān)鍵。

除了上述眾所周知的技術(shù)之外,異構(gòu)計(jì)算也給生成式AI帶來(lái)了諸多好處。為了繼續(xù)提升性能,越來(lái)越多的服務(wù)器正在轉(zhuǎn)向異構(gòu)計(jì)算架構(gòu),通過(guò)專用的加速器為CPU分擔(dān)AI訓(xùn)練等專門(mén)的工作負(fù)載。這些加速器提供了這些應(yīng)用所需的專門(mén)算力,提高了處理速度與結(jié)果的準(zhǔn)確性。CXL也在這方面發(fā)揮了關(guān)鍵作用,通過(guò)內(nèi)存、緩存一致性使CPU和加速器之間能夠共享內(nèi)存資源。

Rambus是公認(rèn)的領(lǐng)先芯片和IP提供商,致力于實(shí)現(xiàn)數(shù)據(jù)中心的連接并解決內(nèi)存和處理之間的瓶頸,為數(shù)據(jù)中心、5G、汽車和物聯(lián)網(wǎng)領(lǐng)域AI的廣泛發(fā)展提供支持。Rambus的多款產(chǎn)品和解決方案都可以很好地服務(wù)于生成式AI應(yīng)用,促進(jìn)生成式AI的發(fā)展。

例如,Rambus內(nèi)存接口芯片、CXL內(nèi)存互聯(lián)計(jì)劃、互連IP和內(nèi)存IP——這些都能幫助滿足生成式AI的發(fā)展需求,有助于提供這類要求嚴(yán)苛的工作負(fù)載所需的速度、容量和連接性。同時(shí),Rambus還通過(guò)多層關(guān)鍵任務(wù)接口和安全I(xiàn)P解決方案實(shí)現(xiàn)基于硬件的加速器。隨著AI行業(yè)的不斷發(fā)展,Rambus在內(nèi)存接口芯片以及接口和安全I(xiàn)P解決方案領(lǐng)域的專業(yè)知識(shí)對(duì)于推動(dòng)AI和機(jī)器學(xué)習(xí)發(fā)展的邊界將變得越發(fā)重要。

ChatGPT、Bard和Einstein GPT等最近的生成式AI產(chǎn)品激發(fā)了人們的想象力,展示了AI可以帶來(lái)的各種新的可能性。為了使現(xiàn)在的AI繼續(xù)實(shí)現(xiàn)突破,來(lái)自先進(jìn)半導(dǎo)體技術(shù)的基礎(chǔ)支持至關(guān)重要。Rambus在開(kāi)發(fā)這些關(guān)鍵技術(shù)方面處于領(lǐng)先地位,并將繼續(xù)投入,進(jìn)一步推動(dòng)這些技術(shù)的發(fā)展,為未來(lái)的生成式AI產(chǎn)品帶來(lái)遠(yuǎn)超今天的新可能性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • DRAM
    +關(guān)注

    關(guān)注

    40

    文章

    2292

    瀏覽量

    183139
  • 半導(dǎo)體技術(shù)

    關(guān)注

    3

    文章

    237

    瀏覽量

    60650
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29401

    瀏覽量

    267701
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    472

    瀏覽量

    436

原文標(biāo)題:【媒體報(bào)道】實(shí)現(xiàn)生成式AI的關(guān)鍵半導(dǎo)體技術(shù)

文章出處:【微信號(hào):Rambus 藍(lán)鉑世科技,微信公眾號(hào):Rambus 藍(lán)鉑世科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    全球半導(dǎo)體行業(yè)迎來(lái)強(qiáng)勁復(fù)蘇,AI浪潮成關(guān)鍵驅(qū)動(dòng)力

    信號(hào)標(biāo)志著半導(dǎo)體市場(chǎng)在經(jīng)歷了一段時(shí)間的波動(dòng)與挑戰(zhàn)后,正式步入復(fù)蘇快車道。這一輪復(fù)蘇的背后,AI人工智能技術(shù)的蓬勃發(fā)展無(wú)疑扮演了至關(guān)重要的角色。隨著AI
    的頭像 發(fā)表于 09-05 11:29 ?211次閱讀
    全球<b class='flag-5'>半導(dǎo)體</b>行業(yè)迎來(lái)強(qiáng)勁復(fù)蘇,<b class='flag-5'>AI</b>浪潮成<b class='flag-5'>關(guān)鍵</b>驅(qū)動(dòng)力

    如何用C++創(chuàng)建簡(jiǎn)單的生成AI模型

    生成AI(Generative AI)是一種人工智能技術(shù),它通過(guò)機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)技術(shù),從
    的頭像 發(fā)表于 07-05 17:53 ?638次閱讀

    生成AI與傳統(tǒng)AI的主要區(qū)別

    隨著人工智能技術(shù)的飛速發(fā)展,生成AI(Generative AI)逐漸嶄露頭角,并與傳統(tǒng)AI
    的頭像 發(fā)表于 07-05 17:35 ?1396次閱讀

    生成AI的定義和特征

    行為,生成全新的、具有實(shí)際意義的數(shù)據(jù)或內(nèi)容。這種技術(shù)已經(jīng)在自然語(yǔ)言處理、圖像生成、音頻合成等多個(gè)領(lǐng)域展現(xiàn)出巨大的潛力和應(yīng)用價(jià)值。本文將詳細(xì)探討生成
    的頭像 發(fā)表于 07-05 17:33 ?702次閱讀

    生成AI的基本原理和應(yīng)用領(lǐng)域

    復(fù)雜性和創(chuàng)新性的內(nèi)容的技術(shù)。這種技術(shù)不僅限于文本生成,還廣泛應(yīng)用于圖像、音頻、視頻等多個(gè)領(lǐng)域。本文將詳細(xì)探討生成
    的頭像 發(fā)表于 07-04 11:50 ?847次閱讀

    原來(lái)這才是【生成AI】??!

    隨著ChatGPT、文心一言等AI產(chǎn)品的火爆,生成AI已經(jīng)成為了大家茶余飯后熱議的話題??墒牵瑸槭裁匆?b class='flag-5'>AI前面加上“
    的頭像 發(fā)表于 06-05 08:04 ?290次閱讀
    原來(lái)這才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】??!

    聯(lián)想攜手京東,緊扣大模型和生成AI技術(shù)

    聯(lián)想與京東攜手,緊扣大模型和生成AI技術(shù)帶來(lái)的產(chǎn)業(yè)機(jī)遇,在多個(gè)領(lǐng)域展開(kāi)深入合作。
    的頭像 發(fā)表于 04-12 10:27 ?571次閱讀

    半導(dǎo)體發(fā)展的四個(gè)時(shí)代

    代工廠來(lái)開(kāi)發(fā)和交付。臺(tái)積電是這一階段的關(guān)鍵先驅(qū)。 半導(dǎo)體的第四個(gè)時(shí)代——開(kāi)放創(chuàng)新平臺(tái) 仔細(xì)觀察,我們即將回到原點(diǎn)。隨著半導(dǎo)體行業(yè)的不斷成熟,工藝復(fù)雜性和設(shè)計(jì)復(fù)雜性開(kāi)始呈爆炸
    發(fā)表于 03-27 16:17

    NVIDIA生成AI研究實(shí)現(xiàn)在1秒內(nèi)生成3D形狀

    NVIDIA 研究人員使 LATTE3D (一款最新文本轉(zhuǎn) 3D 生成 AI 模型)實(shí)現(xiàn)雙倍加速。
    的頭像 發(fā)表于 03-27 10:28 ?414次閱讀
    NVIDIA<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>研究<b class='flag-5'>實(shí)現(xiàn)</b>在1秒內(nèi)<b class='flag-5'>生成</b>3D形狀

    半導(dǎo)體發(fā)展的四個(gè)時(shí)代

    交給代工廠來(lái)開(kāi)發(fā)和交付。臺(tái)積電是這一階段的關(guān)鍵先驅(qū)。 半導(dǎo)體的第四個(gè)時(shí)代——開(kāi)放創(chuàng)新平臺(tái) 仔細(xì)觀察,我們即將回到原點(diǎn)。隨著半導(dǎo)體行業(yè)的不斷成熟,工藝復(fù)雜性和設(shè)計(jì)復(fù)雜性開(kāi)始呈爆炸
    發(fā)表于 03-13 16:52

    NPU是什么?為何它是開(kāi)啟終端側(cè)生成AI關(guān)鍵?

    ),同時(shí)要利用異構(gòu)處理器組合,比如中央處理器(CPU)和圖形處理器(GPU)。通過(guò)結(jié)合NPU使用合適的處理器,異構(gòu)計(jì)算能夠實(shí)現(xiàn)最佳應(yīng)用性能、能效和電池續(xù)航,賦能全新增強(qiáng)的生成AI體驗(yàn)
    的頭像 發(fā)表于 03-07 11:25 ?1983次閱讀
    NPU是什么?為何它是開(kāi)啟終端側(cè)<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的<b class='flag-5'>關(guān)鍵</b>?

    安謀科技趙永超:生成AI加速落地,行業(yè)應(yīng)用創(chuàng)新從“芯”突破

    又到歲末年初時(shí),電子發(fā)燒友網(wǎng)策劃《2024半導(dǎo)體產(chǎn)業(yè)展望》專題,收到了數(shù)十位國(guó)內(nèi)外半導(dǎo)體創(chuàng)新領(lǐng)袖企業(yè)高管的前瞻觀點(diǎn)。此次電子發(fā)燒友網(wǎng)特別采訪了安謀科技智能物聯(lián)及汽車業(yè)務(wù)線負(fù)責(zé)人趙永超,解讀當(dāng)下生成
    的頭像 發(fā)表于 12-26 14:32 ?1181次閱讀
    安謀科技趙永超:<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>加速落地,行業(yè)應(yīng)用創(chuàng)新從“芯”突破

    生成AI技術(shù)的應(yīng)用前景

    生成 AI(人工智能)與我們熟知的 AI 有何不同?這篇文章將為我們一探究竟!
    的頭像 發(fā)表于 11-29 12:20 ?1217次閱讀

    利用 NVIDIA Jetson 實(shí)現(xiàn)生成 AI

    近日,NVIDIA 發(fā)布了 Jetson 生成 AI 實(shí)驗(yàn)室(Jetson Generative AI Lab),使開(kāi)發(fā)者能夠通過(guò) NVIDIA Jetson 邊緣設(shè)備在現(xiàn)實(shí)世界中探
    的頭像 發(fā)表于 11-07 21:25 ?852次閱讀
    利用 NVIDIA Jetson <b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b>

    生成 AI (1/4):一場(chǎng)產(chǎn)品開(kāi)發(fā)和用戶體驗(yàn)的雙重變革

    近來(lái),生成AI備受矚目、應(yīng)用廣泛,發(fā)展速度和影響力有目共睹。芯片和系統(tǒng)開(kāi)發(fā)領(lǐng)域自然也不例外;在半導(dǎo)體行業(yè),搭載生成
    的頭像 發(fā)表于 11-04 08:13 ?331次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> (1/4):一場(chǎng)產(chǎn)品開(kāi)發(fā)和用戶體驗(yàn)的雙重變革