0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

1.5T內(nèi)存挑戰(zhàn)英偉達(dá)!8枚芯片撐起3個(gè)GPT-4,華人AI芯片獨(dú)角獸估值365億

傳感器技術(shù) ? 來(lái)源:量子位 ? 2023-09-23 10:29 ? 次閱讀

高端GPU持續(xù)缺貨之下,一家要挑戰(zhàn)英偉達(dá)芯片初創(chuàng)公司成為行業(yè)熱議焦點(diǎn)。

8枚芯片跑大模型,就能支持5萬(wàn)億參數(shù)(GPT-4的三倍)。

這是獨(dú)角獸企業(yè)SambaNova剛剛發(fā)布的新型AI芯片SN40L——

型號(hào)中40代表是他們第四代產(chǎn)品,L代表專為大模型(LLM)優(yōu)化:高達(dá)1.5T的內(nèi)存,支持25.6萬(wàn)個(gè)token的序列長(zhǎng)度。

CEORodrigo Liang表示,當(dāng)前行業(yè)標(biāo)準(zhǔn)做法下運(yùn)行萬(wàn)億參數(shù)大模型需要數(shù)百枚芯片,我們的方法使總擁有成本只有標(biāo)準(zhǔn)方法的1/25。

SambaNova目前估值50億美元(約365億人民幣),累計(jì)完成了6輪總計(jì)11億美元的融資,投資方包括英特爾、軟銀、三星、GV等。

他們不僅在芯片上要挑戰(zhàn)英偉達(dá),業(yè)務(wù)模式上也說(shuō)要比英偉達(dá)走的更遠(yuǎn):直接參與幫助企業(yè)訓(xùn)練私有大模型。

目標(biāo)客戶上野心更是很大:瞄準(zhǔn)世界上最大的2000家企業(yè)。

1.5TB內(nèi)存的AI芯片

最新產(chǎn)品SN40L,由臺(tái)積電5納米工藝制造,包含1020億晶體管,峰值速度638TeraFLOPS。

與英偉達(dá)等其他AI芯片更大的不同在于新的三層Dataflow內(nèi)存系統(tǒng)。

520MB片上SRAM內(nèi)存

65GB的高帶寬HBM3內(nèi)存

以及高達(dá)1.5TB的外部DRAM內(nèi)存

831e8822-599c-11ee-939d-92fbcf53809c.png

與主要競(jìng)品相比,英偉達(dá)H100最高擁有80GB HBM3內(nèi)存,AMD MI300擁有192GB HBM3內(nèi)存。

SN40L的高帶寬HBM3內(nèi)存實(shí)際比前兩者小,更多依靠大容量DRAM。

Rodrigo Liang表示,雖然DRAM速度更慢,但專用的軟件編譯器可以智能地分配三個(gè)內(nèi)存層之間的負(fù)載,還允許編譯器將8個(gè)芯片視為單個(gè)系統(tǒng)。

83257e16-599c-11ee-939d-92fbcf53809c.png

除了硬件指標(biāo),SN40L針對(duì)大模型做的優(yōu)化還有同時(shí)提供密集和稀疏計(jì)算加速。

他們認(rèn)為大模型中許多權(quán)重設(shè)置為0,像其他數(shù)據(jù)一樣去執(zhí)行操作很浪費(fèi)。

他們找到一種軟件層面的加速辦法,與調(diào)度和數(shù)據(jù)傳輸有關(guān),但沒有透露細(xì)節(jié),“我們還沒準(zhǔn)備好向公布是如何做到這一點(diǎn)的”。

咨詢機(jī)構(gòu)Gartner的分析師Chirag Dekate認(rèn)為,SN40L的一個(gè)可能優(yōu)勢(shì)在于多模態(tài)AI。

GPU的架構(gòu)非常嚴(yán)格,面對(duì)圖像、視頻、文本等多樣數(shù)據(jù)時(shí)可能不夠靈活,而SambaNova可以調(diào)整硬件來(lái)滿足工作負(fù)載的要求。

目前,SambaNova的芯片和系統(tǒng)已獲得不少大型客戶,包括世界排名前列的超算實(shí)驗(yàn)室,日本富岳、美國(guó)阿貢國(guó)家實(shí)驗(yàn)室、勞倫斯國(guó)家實(shí)驗(yàn)室,以及咨詢公司埃森哲等。

業(yè)務(wù)模式也比較特別,芯片不單賣,而是出售其定制技術(shù)堆棧,從芯片到服務(wù)器系統(tǒng),甚至包括部署大模型。

為此,他們與TogetherML聯(lián)合開發(fā)了BloomChat,一個(gè)1760億參數(shù)的多語(yǔ)言聊天大模型。

BloomChat建立在BigScience組織的開源大模型Bloom之上,并在來(lái)自O(shè)penChatKit、Dolly 2.0和OASST1的OIG上進(jìn)行了微調(diào)。

訓(xùn)練過(guò)程中,它使用了SambaNova獨(dú)特的可重配置數(shù)據(jù)流架構(gòu),然后在SambaNova DataScale系統(tǒng)進(jìn)行訓(xùn)練。

8345a0ce-599c-11ee-939d-92fbcf53809c.png

這也是這家公司最大被投資者熱捧之外的最大爭(zhēng)議點(diǎn)之一,很多人不看好一家公司既做芯片又做大模型。

給每家大企業(yè)打造150個(gè)大模型

在與The Next Platform網(wǎng)站交流時(shí),CEO Rodrigo Liang表示:

用于大模型訓(xùn)練的公開數(shù)據(jù)已快耗盡,但對(duì)參數(shù)數(shù)量的追求還在不斷增加。

各種大模型的性能相差只有幾個(gè)百分點(diǎn),這不是大家應(yīng)該玩的游戲。

他認(rèn)為大模型與生成式AI商業(yè)化的下一個(gè)戰(zhàn)場(chǎng)是企業(yè)的私有數(shù)據(jù),尤其是大企業(yè)。

這些企業(yè)坐擁大量的數(shù)據(jù),但自己不知道其中大部分內(nèi)容是什么。

834f900c-599c-11ee-939d-92fbcf53809c.png

對(duì)于企業(yè)私有大模型的形態(tài),SambaNova也有與眾不同的觀點(diǎn)。

他們認(rèn)為最終企業(yè)內(nèi)部不會(huì)運(yùn)行一個(gè)GPT-4或谷歌Gemini那樣的超大模型,而是根據(jù)不同數(shù)據(jù)子集創(chuàng)建150個(gè)獨(dú)特的模型,聚合參數(shù)超過(guò)萬(wàn)億。

相當(dāng)于把GPT-4等大模型內(nèi)部的Mixture of Experts(專家混合)架構(gòu)擴(kuò)展到整個(gè)系統(tǒng),稱為Composition of Experts(專家合成)。

在企業(yè)運(yùn)轉(zhuǎn)的每個(gè)節(jié)點(diǎn)運(yùn)行一個(gè)完整且經(jīng)過(guò)專門調(diào)整的基礎(chǔ)模型,分別用法律語(yǔ)料庫(kù)、制造語(yǔ)料庫(kù)、風(fēng)險(xiǎn)管理語(yǔ)料庫(kù)、財(cái)富管理語(yǔ)料庫(kù)、客戶銷售語(yǔ)料庫(kù)、客戶支持語(yǔ)料庫(kù)等等不同數(shù)據(jù)訓(xùn)練。

這些專家模型之間通過(guò)一種軟件路由或負(fù)載平衡器聯(lián)在一起,收到推理請(qǐng)求后決定具體向哪個(gè)模型推送提示詞。

這一策略與GPT-4和谷歌Gemini等做法形成鮮明對(duì)比,巨頭大多希望創(chuàng)建一個(gè)能泛化到數(shù)百萬(wàn)個(gè)任務(wù)的巨型模型。

分析師認(rèn)為技術(shù)上可能谷歌的做法性能更強(qiáng),但SambaNova的方法對(duì)企業(yè)來(lái)說(shuō)更實(shí)用。

沒有任何一個(gè)模型或人能完整訪問(wèn)企業(yè)的所有數(shù)據(jù),限制每個(gè)部門能訪問(wèn)的專家模型,就能限制他們能訪問(wèn)的數(shù)據(jù)。

斯坦福系芯片公司,華人工程師主力

SambaNova成立于2017年,2020年之前都比較低調(diào)。

聯(lián)創(chuàng)3人都是斯坦福背景,連產(chǎn)品系列名Cardinal(深紅色)都是斯坦福的昵稱與代表顏色。

CEO Rodrigo Liang是前Sun/甲骨文工程副總裁,也有人將這個(gè)名字解讀為暗指甲骨文老對(duì)頭IBM的DeepBlue(深藍(lán))。

另外兩位聯(lián)合創(chuàng)始人都是斯坦福教授。

CTOKunle Olukotun是電氣工程教授,因多核芯片架構(gòu)方面的研究而聞名,開發(fā)了首批支持線程級(jí)推測(cè) (TLS) 的芯片之一。

Christopher Ré是計(jì)算機(jī)科學(xué)副教授,重點(diǎn)研究方向機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的速度和可擴(kuò)展性。

此外團(tuán)隊(duì)中還有不少華人工程師。

從官網(wǎng)公開信息來(lái)看,SambaNova的領(lǐng)導(dǎo)團(tuán)隊(duì)中,至少有3名華人。

Jonathan Chang,擁有UC伯克利的機(jī)械工程學(xué)士學(xué)位以及南加州大學(xué)的MBA學(xué)位。

他在構(gòu)建高增長(zhǎng)方面擁有20多年的經(jīng)驗(yàn)。加入SambaNova之前,Chang在特斯拉工作了近9年。

Marshall Choy,此前曾擔(dān)任甲骨文公司系統(tǒng)產(chǎn)品管理和解決方案開發(fā)副總裁,監(jiān)督了數(shù)十個(gè)行業(yè)的企業(yè)硬件和軟件產(chǎn)品的上市。

Penny Li,在EDA工具微處理器設(shè)計(jì)方面擁有超過(guò)27年的經(jīng)驗(yàn)。此前,她曾在IBM和甲骨文工作過(guò)。

如果去領(lǐng)英搜索還能發(fā)現(xiàn)更多華人團(tuán)隊(duì)成員。

目前SambaNova包含SN40L芯片的人工智能引擎已上市,但定價(jià)沒有公開。

根據(jù)Rodrigo Liang的說(shuō)法,8個(gè)SN40L組成的集群總共可處理5萬(wàn)億參數(shù),相當(dāng)于70個(gè)700億參數(shù)大模型。

全球2000強(qiáng)的企業(yè)只需購(gòu)買兩個(gè)這樣的8芯片集群,就能滿足所有大模型需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4647

    瀏覽量

    128489
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3689

    瀏覽量

    90536
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1846

    瀏覽量

    34804

原文標(biāo)題:1.5T內(nèi)存挑戰(zhàn)英偉達(dá)!8枚芯片撐起3個(gè)GPT-4,華人AI芯片獨(dú)角獸估值365億

文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI芯片巨頭英偉達(dá)漲超4% 英偉達(dá)市值暴增7500

    行業(yè)股票開始反彈,那么英偉達(dá)公司的股票將是個(gè)不錯(cuò)的選擇。還有瑞穗證券(Mizuho)也認(rèn)為英偉達(dá)公司的股價(jià)仍有很大的上漲空間。 ? ? ?美
    的頭像 發(fā)表于 08-13 15:33 ?1010次閱讀

    160,背靠國(guó)產(chǎn)傳感器首富,浙江誕生中國(guó)唯一民營(yíng)晶圓代工獨(dú)角獸

    此前,胡潤(rùn)研究院發(fā)布《2024全球獨(dú)角獸榜》,列出了全球成立于2000年之后,價(jià)值10美元以上的非上市公司。 ? 其中,來(lái)自浙江寧波的晶圓制造企業(yè)——榮芯半導(dǎo)體,160
    的頭像 發(fā)表于 08-02 08:44 ?1271次閱讀
    <b class='flag-5'>估</b><b class='flag-5'>值</b>160<b class='flag-5'>億</b>,背靠國(guó)產(chǎn)傳感器首富,浙江誕生中國(guó)唯一民營(yíng)晶圓代工<b class='flag-5'>獨(dú)角獸</b>

    2023年中國(guó)傳感器跑出9家獨(dú)角獸公司,總達(dá)1807?。ǜ饺麊危?/a>

    核聚變、GPU芯片、半導(dǎo)體材料、氫能、新型儲(chǔ)能、合成生物等領(lǐng)域加快涌現(xiàn)獨(dú)角獸企業(yè)。集成電路、清潔能源、商業(yè)航天等前沿科技領(lǐng)域獨(dú)角獸企業(yè)數(shù)量占比近七成(249家),新晉獨(dú)角獸企業(yè)中這一比
    的頭像 發(fā)表于 06-20 15:43 ?5063次閱讀
    2023年中國(guó)傳感器跑出9家<b class='flag-5'>獨(dú)角獸</b>公司,總<b class='flag-5'>估</b><b class='flag-5'>值</b><b class='flag-5'>達(dá)</b>1807<b class='flag-5'>億</b>?。ǜ饺麊危? />    </a>
</div>                            <div   id=

    200,這里崛起一個(gè)半導(dǎo)體超級(jí)獨(dú)角獸

    ,最終入局的包括了國(guó)家級(jí)基金、地方國(guó)資、半導(dǎo)體專業(yè)基金及券商系基金等陣容。根據(jù)增資比例計(jì)算,時(shí)代半導(dǎo)體超200,堪稱湖南年度最大獨(dú)角獸。 而透過(guò)這只
    的頭像 發(fā)表于 05-30 10:48 ?395次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    ,通過(guò)英偉達(dá)高帶寬接口(NV-HBI)將兩個(gè)最大可制造芯片合并為一個(gè)圖形處理器單元,支持10TB/s帶寬,形成高效的通信通道,提升整體性能。
    發(fā)表于 05-13 17:16

    東風(fēng)嵐圖以305入選《2024全球獨(dú)角獸榜》

    4月9日,胡潤(rùn)研究院發(fā)布《2024全球獨(dú)角獸榜》列出全球成立于2000年之后價(jià)值10美元以上的非上市公司
    的頭像 發(fā)表于 04-12 09:21 ?371次閱讀

    深蘭科技再次入圍《2024胡潤(rùn)全球獨(dú)角獸榜》

    4月9日,胡潤(rùn)研究院于廣州發(fā)布了《2024全球獨(dú)角獸榜》,榜單列出了全球成立于2000年之后,企業(yè)價(jià)值在10美元以上的非上市公司。深蘭
    的頭像 發(fā)表于 04-11 09:17 ?515次閱讀
    深蘭科技再次入圍《2024胡潤(rùn)全球<b class='flag-5'>獨(dú)角獸</b>榜》

    AI獨(dú)角獸Cohere尋求新一輪融資,目標(biāo)達(dá)50美元

    加拿大AI領(lǐng)軍企業(yè)Cohere,作為OpenAI的有力競(jìng)爭(zhēng)者,近日正在積極尋求新一輪的融資。據(jù)悉,該公司的目標(biāo)是以高達(dá)50美元的籌集5
    的頭像 發(fā)表于 03-26 11:25 ?553次閱讀

    英國(guó)AI芯片獨(dú)角獸Graphcore考慮出售

    近日,英國(guó)AI芯片領(lǐng)域的獨(dú)角獸企業(yè)Graphcore陷入財(cái)務(wù)困境,據(jù)傳正在考慮出售給海外買家以籌集新資金并彌補(bǔ)嚴(yán)重虧損。據(jù)外媒報(bào)道,Graphcore正與多家主要科技公司探討潛在交易,其中包括英國(guó)半導(dǎo)體IP巨頭Arm、日本軟銀集
    的頭像 發(fā)表于 02-19 13:46 ?546次閱讀

    禾多科技入選2023年中國(guó)新經(jīng)濟(jì)人工智能獨(dú)角獸

    」,致力于展現(xiàn)全球新經(jīng)濟(jì)行業(yè)最具成長(zhǎng)性和最具價(jià)值的未上市創(chuàng)新創(chuàng)業(yè)公司。 「獨(dú)角獸俱樂(lè)部」上榜公司要求企業(yè)最新在10美元及以上,或其新一輪融資額在2
    的頭像 發(fā)表于 01-23 18:43 ?1191次閱讀
    禾多科技入選2023年中國(guó)新經(jīng)濟(jì)人工智能<b class='flag-5'>獨(dú)角獸</b>

    新火種AI|被迫賣身、CEO下臺(tái)、高管出走,又一家AI獨(dú)角獸出事

    作者:文子 ? 編輯:小迪 曾經(jīng)爆火的獨(dú)角獸,如今被迫賣身。 40,Stability AI被曝賣身 ? 距離OpenAI政變才剛剛過(guò)
    的頭像 發(fā)表于 12-29 09:46 ?497次閱讀
    新火種<b class='flag-5'>AI</b>|被迫賣身、CEO下臺(tái)、高管出走,又一家<b class='flag-5'>AI</b><b class='flag-5'>獨(dú)角獸</b>出事

    鑄科技獲評(píng)2023江蘇省潛在獨(dú)角獸企業(yè)

    近日,江蘇省生產(chǎn)力促進(jìn)中心發(fā)布了“2023年江蘇獨(dú)角獸企業(yè)評(píng)估結(jié)果”,鑄科技獲評(píng)2023江蘇省潛在獨(dú)角獸企業(yè)。
    的頭像 發(fā)表于 12-25 15:13 ?625次閱讀
    <b class='flag-5'>億</b>鑄科技獲評(píng)2023江蘇省潛在<b class='flag-5'>獨(dú)角獸</b>企業(yè)

    新火種AI|成立僅半年20,歐洲AI獨(dú)角獸成OpenAI最大勁敵?

    作者:文子 編輯:小迪 從零到20美元,Mistral AI用短短半年演繹了一場(chǎng)創(chuàng)業(yè)奇跡。 ? 新晉AI
    的頭像 發(fā)表于 12-15 15:35 ?294次閱讀
    新火種<b class='flag-5'>AI</b>|成立僅半年<b class='flag-5'>估</b><b class='flag-5'>值</b>20<b class='flag-5'>億</b>,歐洲<b class='flag-5'>AI</b><b class='flag-5'>獨(dú)角獸</b>成OpenAI最大勁敵?

    踏歌智行入選“2023中國(guó)汽車獨(dú)角獸/隱形獨(dú)角獸100強(qiáng)榜單”

    近日,首屆中國(guó)汽車獨(dú)角獸大會(huì)以“汽車獨(dú)角獸催生新汽車”為主題在安徽馬鞍山市舉辦,“2023中國(guó)汽車獨(dú)角獸/隱形獨(dú)角獸100強(qiáng)榜單”于會(huì)議期間發(fā)布,踏歌智行作為礦區(qū)無(wú)人駕駛領(lǐng)域唯一上榜企
    的頭像 發(fā)表于 12-14 09:09 ?1288次閱讀

    英國(guó)芯片公司Graphcore退出中國(guó)市場(chǎng),并裁減大部分員工

    英國(guó)的ai芯片獨(dú)角獸“graphcore”于2016年作為生產(chǎn)名為英特爾處理器單元(ipu)的人工智能芯片的公司,向英偉
    的頭像 發(fā)表于 11-23 11:08 ?670次閱讀