0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

加速AI落地、推動邊緣計算應(yīng)用實踐——開放計算在中國行至高潮

張慧娟 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:張慧娟 ? 2019-06-26 12:22 ? 次閱讀

8年后,在中國再談開放計算,不論是技術(shù)原動力還是整個產(chǎn)業(yè)生態(tài),都有了翻天覆地的變化。

時間撥回2011年,F(xiàn)acebook 主導(dǎo)發(fā)起了OCP(Open Compute Project; 開放計算項目),旨在以開源開放的方式,重構(gòu)當(dāng)時的數(shù)據(jù)中心硬件,發(fā)展面向下一代數(shù)據(jù)中心的服務(wù)器、存儲、網(wǎng)絡(luò)、基礎(chǔ)設(shè)施等。
當(dāng)時,我國互聯(lián)網(wǎng)技術(shù)正以驚奇世界的姿態(tài)飛速發(fā)展著。軟件開源已經(jīng)成為趨勢,但如果你提到硬件開源,那年剛剛出現(xiàn)的從英文“Maker”翻譯過來的“創(chuàng)客”,會和你聊聊樹莓派,聊聊包括電路原理圖、設(shè)計圖在內(nèi)的開源許可。

但這并不是OCP的著眼點,IT基礎(chǔ)設(shè)施才是。

同年,阿里巴巴、百度、騰訊三家發(fā)起ODCC組織的前身“天蝎計劃”,并在同年年底確立了最初的技術(shù)規(guī)范。

百度從2011到2014年間,幾乎花了3年的時間與OCP社區(qū)進(jìn)行溝通,試圖推動在數(shù)據(jù)中心的分享與合作。但現(xiàn)實的反差是巨大的,由于國內(nèi)外數(shù)據(jù)中心的巨大差異、地區(qū)的差異、認(rèn)知的差異等限制,最終沒有達(dá)成共識。

時間來到2019年,國內(nèi)互聯(lián)網(wǎng)和泛互聯(lián)網(wǎng)產(chǎn)業(yè)取得長足發(fā)展,也使得更多的中國企業(yè)共同站在這個舞臺上面向未來進(jìn)行深入探討。今年也是繼2014年之后,百度重新回歸OCP。此時,OCP的成員企業(yè)大約達(dá)到200家,包括英特爾、谷歌、微軟、Facebook、LinkedIn以及中國的阿里巴巴、百度、騰訊、浪潮等,囊括了全球服務(wù)器采購量最大的企業(yè)用戶。

浪潮與OCP聯(lián)合主辦的首屆OCP China Day(開放計算中國日)6月25日在北京舉行,那么,現(xiàn)在在中國聊起開放計算,我們都在關(guān)注什么?

關(guān)注一:OAM——簡化AI基礎(chǔ)架構(gòu)設(shè)計,加速創(chuàng)新設(shè)計

AI是OCP China Day上多次被提及的話題之一。

伴隨著AI的火熱,有越來越多的AI芯片出現(xiàn)。但是在推動芯片落地時卻發(fā)現(xiàn)很大的問題,需要從零開始進(jìn)行板卡兼容等工作。AI加速器越來越多,技術(shù)更新也越來越快,AI硬件系統(tǒng)的技術(shù)挑戰(zhàn)和設(shè)計復(fù)雜度在增加,將加速器集成到系統(tǒng)中通常需要大約6-12個月。這種延遲阻礙了AI加速器的快速采用。

基于此,OCP社區(qū)在服務(wù)器項目組下設(shè)立了OAI(OpenAccelerator Infrastructure)小組,負(fù)責(zé)開發(fā)OAM(OCP Accelerator Module)規(guī)范,將加速器模塊標(biāo)準(zhǔn)化,簡化AI基礎(chǔ)架構(gòu)的設(shè)計,縮短硬件設(shè)計周期。OAM規(guī)范的內(nèi)容包括電源/冷卻,穩(wěn)健性,可維護(hù)性,配置,編程,管理和調(diào)試,以及模塊間通信,以擴(kuò)展和輸入/輸出帶寬。OAM目前仍在開發(fā)階段,已經(jīng)在3月14日公布了第一個非正式版本V0.85,4月30日公布了第二個非正式版本0.9。OAM標(biāo)準(zhǔn),就是針對上述問題設(shè)計的一套指導(dǎo)AI硬件加速模塊和系統(tǒng)設(shè)計的標(biāo)準(zhǔn),它集合定義了AI硬件加速模塊本身、主板、互聯(lián)拓?fù)?、機(jī)箱、供電、散熱以及系統(tǒng)管理等系列設(shè)計規(guī)范,主要目標(biāo)是通過模塊化、標(biāo)準(zhǔn)化來增強(qiáng)不同AI硬件加速模塊和系統(tǒng)的互操作性,加速新的AI硬件加速模塊的落地和應(yīng)用。

為什么需要OAM?

先從典型的AI加速系統(tǒng)設(shè)計來看,它通常由三部分構(gòu)成,包括承載多個OAI模塊的基板,控制整個系統(tǒng)執(zhí)行流程的CPU,連接AI芯片和CPU的PCIe開關(guān)。由于PCIe供電能力有限,無法很好地支持高速互聯(lián),所以出現(xiàn)了很多新的解決方案,這樣就出現(xiàn)了非標(biāo)準(zhǔn)系統(tǒng)。由于AI芯片之間和CPU之間需要互聯(lián)起來,由于計算節(jié)點的限制,包括對于存儲的需求、I/O互聯(lián)的需求不一樣,所以在設(shè)計PCIe拓?fù)涞臅r候有差異,導(dǎo)致硬件系統(tǒng)適應(yīng)新的需求比較困難。

同時,大規(guī)模的AI的爆發(fā)需要很強(qiáng)大的算力,一個節(jié)點不夠用時,需要更好的擴(kuò)展能力。有兩種典型方式:一是通過傳統(tǒng)的以太網(wǎng)交換機(jī)實現(xiàn)互聯(lián),但是這個license費用比較高,互聯(lián)的帶寬也是有限的;二是通過新興技術(shù)實現(xiàn)AI加速芯片之間私有的互聯(lián),這是一種更高速的互聯(lián),有更低的延時,可以大幅提升大規(guī)模訓(xùn)練的性能。從一個單機(jī)擴(kuò)展到多機(jī),構(gòu)建了典型的大規(guī)模訓(xùn)練系統(tǒng)。除此之外還有基礎(chǔ)設(shè)施,包括供電、散熱這些很有挑戰(zhàn)的問題。系統(tǒng)內(nèi)不同模塊之間的組合能夠?qū)崿F(xiàn)不同目標(biāo),取決于系統(tǒng)整體的權(quán)衡。

針對場景眾多的AI應(yīng)用,不論是系統(tǒng)本身的設(shè)計,還是在系統(tǒng)的擴(kuò)展方面,一家公司單槍匹馬攻克了一個目標(biāo)之后,下一個目標(biāo)可能又要重新設(shè)計方案。從這個角度看,長期快速跟進(jìn)甚至引領(lǐng)市場比較困難,所以需要協(xié)作,開放AI加速的基礎(chǔ)架構(gòu),采用模塊化的思路,增強(qiáng)不同的模塊與系統(tǒng)之間的互操作性,加速相關(guān)技術(shù)的創(chuàng)新,推動新的AI芯片快速落地。

在這一過程中,OCP定義了AI加速的基礎(chǔ)架構(gòu)規(guī)范,把相關(guān)模塊之間的邊界定義清楚,只要滿足相關(guān)接口都可以在系統(tǒng)中共存,這樣可以很好地將共性需求抽離出來,將特定的需求通過模塊化的形式去滿足,能夠更好地加速相關(guān)創(chuàng)新。

當(dāng)前公布的OAM標(biāo)準(zhǔn),是由參與OCP開放計算項目的百度、微軟、Facebook三家國際AI領(lǐng)先企業(yè)聯(lián)合定義,已經(jīng)得到包括Google、阿里、騰訊等互聯(lián)網(wǎng)企業(yè),英偉達(dá)、英特爾、AMD、高通、賽靈思等AI芯片企業(yè),Graphcore、Habana Labs等AI芯片及處理器初創(chuàng)企業(yè),以及IBM、浪潮等廠商的參與和支持。

關(guān)注二:邊緣計算的應(yīng)用實踐

伴隨著5G的到來,邊緣計算也來了。

目前看來,似乎只有自動駕駛、VR/AR等應(yīng)用場景提出了低延遲、高帶寬的需求,智慧城市、工業(yè)互聯(lián)網(wǎng)等提出了高帶寬、低延時以及安全方面的要求。在此基礎(chǔ)上,如何發(fā)展邊緣計算?如何滿足邊緣計算的需求?仍然不清楚。

針對邊緣計算的實踐,百度提出了“DEC”(Device、Edge、Cloud)算力部署,中國移動認(rèn)為運營商提供分流管道,邊緣計算業(yè)務(wù)由行業(yè)客戶自營。提到邊緣計算,勢必要考慮邊緣服務(wù)器的特性。它需要緊湊、可擴(kuò)展的功能,并且提供短期高溫環(huán)境。

但是,服務(wù)器的研發(fā)周期很長,從研發(fā)到批量供貨需要1年時間,此后還會難以避免的進(jìn)行部分升級換代,比如,主板升級、PCI-E模塊的升級等,這些升級很可能會帶來服務(wù)器主體設(shè)計的重構(gòu),很多時候不得不從頭開始研發(fā)新一代服務(wù)器。

對邊緣服務(wù)器的看法,中國移動主要看到三方面:業(yè)務(wù)需求、機(jī)房條件和本身的可維護(hù)性。可能在未來邊緣計算的大規(guī)模部署的時候,如果確定了一個比較具體的場景,會有一種模塊化的交付方式,使得能夠非??焖?,大批量的跟軟件一起來交付。

騰訊與浪潮研發(fā)的T-Flex2.0架構(gòu)就是為了解決上述問題,對空間進(jìn)行有效規(guī)劃, 通過I/O池化技術(shù)(支持PCI-E交換和Gen-z兩類互聯(lián)協(xié)議)支持未來模塊化迭代和靈活組合, 服務(wù)器可以單獨升級部分模塊并不影響其他模塊,T-Fle2.0x是一個更為靈活的架構(gòu)。

從前向后,T-Flex2.0高度為2OU,分為A、B、C等3個區(qū),每個區(qū)域可以放置不同的模塊,實現(xiàn)服務(wù)器的主體功能,覆蓋各類應(yīng)用場景,甚至可以去掉A區(qū)或者C區(qū),減少長度成為一款邊緣計算服務(wù)器。

作為OCP、Open19和ODCC全球三大開放計算標(biāo)準(zhǔn)組織的共同成員,浪潮從貢獻(xiàn)IP,參與開發(fā)標(biāo)準(zhǔn)到主導(dǎo)標(biāo)準(zhǔn)制定,在開放硬件社區(qū)中的參與度越來越高,先后貢獻(xiàn)了首批基于Open19標(biāo)準(zhǔn)的服務(wù)器、第一款OCP標(biāo)準(zhǔn)基于Intel Skylake平臺的主板、第一款Olympus四路服務(wù)器。同時,浪潮還參與了OCP OAM項目,牽頭成立了OpenRMC項目,開發(fā)完成了全球第一個基于OCP標(biāo)準(zhǔn)的整機(jī)柜管理架構(gòu)。

關(guān)注三:OpenRMC項目,下一代數(shù)據(jù)中心的管理框架

OpenRMC是OCP社區(qū)硬件管理項目組下的子項目組,由浪潮牽頭成立。該項目目標(biāo)是完成OpenBMC與Redfish的融合,形成下一代數(shù)據(jù)中心管理的統(tǒng)一框架。

OpenBMC是Facebook發(fā)起的開源項目,希望解決閉源的BMC(Baseboard Management Controller,基板管理控制器)以及相關(guān)的軟件包標(biāo)準(zhǔn)不一的問題,這個問題給數(shù)據(jù)中心統(tǒng)一管理帶來了很多技術(shù)障礙。DMTF(Distributed Management Task Force,分布式管理任務(wù)組)制定了下一代服務(wù)器管理技術(shù)標(biāo)準(zhǔn)Redfish,以取代當(dāng)前IPMI 2.0,Redfish具有擴(kuò)展性好、功能豐富、針對地址不同和供應(yīng)商不同的基礎(chǔ)設(shè)施向客戶提供規(guī)范化管理接口的優(yōu)點,能夠滿足現(xiàn)代數(shù)據(jù)中心的管理需求。

OpenRMC項目希望能夠解決兩個標(biāo)準(zhǔn)之間的互操作性等一系列問題,并建立協(xié)同機(jī)制,形成規(guī)范,推進(jìn)下一代數(shù)據(jù)中心管理技術(shù)和產(chǎn)業(yè)的發(fā)展。

未來,數(shù)據(jù)中心繼續(xù)充滿挑戰(zhàn),數(shù)據(jù)中心整合將繼續(xù)推進(jìn)。邊緣計算也將以更快的速度實現(xiàn)增長。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • OCP
    OCP
    +關(guān)注

    關(guān)注

    0

    文章

    76

    瀏覽量

    16336
  • 5G
    5G
    +關(guān)注

    關(guān)注

    1351

    文章

    48258

    瀏覽量

    562458
  • 邊緣計算
    +關(guān)注

    關(guān)注

    22

    文章

    3008

    瀏覽量

    48277
收藏 人收藏

    評論

    相關(guān)推薦

    浪潮信息趙帥:開放計算創(chuàng)新 應(yīng)對Scaling Law挑戰(zhàn)

    Scaling Law帶來的AI基礎(chǔ)設(shè)施Scale up和Scale out的挑戰(zhàn),數(shù)據(jù)中心需要以開放創(chuàng)新加速算力系統(tǒng)、管理和基礎(chǔ)設(shè)施的全向Scale進(jìn)程,推動
    的頭像 發(fā)表于 08-15 16:02 ?210次閱讀
    浪潮信息趙帥:<b class='flag-5'>開放</b><b class='flag-5'>計算</b>創(chuàng)新 應(yīng)對Scaling Law挑戰(zhàn)

    安富利Edgeboard AI Box解決方案推動邊緣智能落地

    全球數(shù)字化、智能化進(jìn)程地不斷加速,正在促使計算架構(gòu)向邊緣端下沉。與此同時,AI作為推動一切智能化的核心引擎,與
    的頭像 發(fā)表于 07-03 14:55 ?496次閱讀

    Imagination 引領(lǐng)邊緣計算AI創(chuàng)新,擁抱AI未來發(fā)展

    6月25日,2024“N+”AI互動創(chuàng)新論壇在南京舉辦,Imagination中國資深副總裁張曉波受邀出席。在主題演講中,張曉波表示,Imagination作為圖形、計算邊緣人工智能
    的頭像 發(fā)表于 06-28 08:28 ?467次閱讀
    Imagination 引領(lǐng)<b class='flag-5'>邊緣</b><b class='flag-5'>計算</b>和<b class='flag-5'>AI</b>創(chuàng)新,擁抱<b class='flag-5'>AI</b>未來發(fā)展

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計算盒子詳解

    近年來,隨著人工智能和邊緣計算的發(fā)展,一種名為AI邊緣盒子的新型設(shè)備正逐漸引起廣泛關(guān)注。作為一種集成了邊緣
    的頭像 發(fā)表于 05-29 14:24 ?756次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b><b class='flag-5'>計算</b>盒子詳解

    英特爾發(fā)布全新邊緣計算平臺,解決AI邊緣落地難題

    2030年,至少一半的邊緣計算部署將納入AI。 ? 英特爾全新商用邊緣計算平臺 ? 英特爾認(rèn)為,我們已經(jīng)進(jìn)入了
    的頭像 發(fā)表于 03-12 09:06 ?4195次閱讀
    英特爾發(fā)布全新<b class='flag-5'>邊緣</b><b class='flag-5'>計算</b>平臺,解決<b class='flag-5'>AI</b><b class='flag-5'>邊緣</b><b class='flag-5'>落地</b>難題

    什么是AI邊緣計算,AI邊緣計算的特點和優(yōu)勢介紹

    隨著人工智能的迅猛發(fā)展,AI邊緣計算成為了熱門話題。那么什么是AI邊緣計算呢?簡單來說,它是將人
    的頭像 發(fā)表于 02-01 11:42 ?755次閱讀

    邊緣計算的應(yīng)用場景介紹(邊緣計算在哪些領(lǐng)域能得到應(yīng)用)

    邊緣計算是世界上的一項備受關(guān)注的新興技術(shù),并且在近年來迅速崛起得到了很多應(yīng)用。邊緣計算是什么?就是通過將計算和存儲功能從云端轉(zhuǎn)移到網(wǎng)絡(luò)
    的頭像 發(fā)表于 02-01 10:47 ?907次閱讀
    <b class='flag-5'>邊緣</b><b class='flag-5'>計算</b>的應(yīng)用場景介紹(<b class='flag-5'>邊緣</b><b class='flag-5'>計算在</b>哪些領(lǐng)域能得到應(yīng)用)

    AI邊緣計算機(jī)應(yīng)用場景廣泛!大語言模型與數(shù)字人結(jié)合方案在邊緣側(cè)落地

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI邊緣計算機(jī)是一種人工智能和邊緣計算技術(shù)相結(jié)合的計算機(jī)設(shè)備。它可
    的頭像 發(fā)表于 01-16 01:11 ?4325次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>邊緣</b><b class='flag-5'>計算</b>機(jī)應(yīng)用場景廣泛!大語言模型與數(shù)字人結(jié)合方案在<b class='flag-5'>邊緣</b>側(cè)<b class='flag-5'>落地</b>

    加速計算卡與AI顯卡有什么區(qū)別?

    加速計算卡與AI顯卡有什么區(qū)別? 加速計算卡與AI顯卡是兩種不同的硬件設(shè)備,它們在設(shè)計和功能上有
    的頭像 發(fā)表于 01-09 14:10 ?1092次閱讀

    什么是邊緣計算,邊緣計算有哪些應(yīng)用?

    ,以降低數(shù)據(jù)傳輸延遲、減輕網(wǎng)絡(luò)壓力,同時提供更快速、更靈活的服務(wù)。邊緣計算在各個領(lǐng)域都有廣泛應(yīng)用,下面將詳細(xì)介紹邊緣計算的定義、原理以及各個應(yīng)用領(lǐng)域。
    的頭像 發(fā)表于 01-09 11:29 ?1489次閱讀

    邊緣計算平臺開源框架有哪些類型

    將詳細(xì)介紹幾種常見的邊緣計算平臺開源框架。 Akraino Edge Stack Akraino Edge Stack 是一個開放、輕量級、靈活的云邊緣平臺框架,它提供了一套標(biāo)準(zhǔn)和最佳
    的頭像 發(fā)表于 12-27 15:17 ?1077次閱讀

    邊緣計算框架有哪些

    應(yīng)用的需求。邊緣計算架構(gòu)的出現(xiàn),為各種行業(yè)提供了更高效、更靈活的計算和數(shù)據(jù)處理方式,有助于推動數(shù)字化轉(zhuǎn)型和智能化發(fā)展。本文將詳盡介紹邊緣
    的頭像 發(fā)表于 12-27 15:01 ?1235次閱讀

    加速場景智能化:華為行業(yè)感知出席2023計算產(chǎn)業(yè)生態(tài)大會

    產(chǎn)業(yè)健康可持續(xù)發(fā)展。 華為行業(yè)感知以“感知邊緣,加速邊緣場景智能化”為主題參與本次盛會, 并以“好望智能邊緣解決方案”榮獲“2023邊緣
    的頭像 發(fā)表于 12-15 16:05 ?692次閱讀
    <b class='flag-5'>加速</b>場景智能化:華為行業(yè)感知出席2023<b class='flag-5'>計算</b>產(chǎn)業(yè)生態(tài)大會

    算力強(qiáng)勁的AI邊緣計算盒子# 邊緣計算

    AI邊緣計算
    成都華江信息
    發(fā)布于 :2023年11月24日 16:31:06

    什么是邊緣計算盒子(AI算法盒子)?

    邊緣計算盒子是一種基于邊緣計算和人工智能技術(shù)的智能設(shè)備,它內(nèi)置了靈活可配的多樣化AI算法庫,所以也被稱為
    的頭像 發(fā)表于 10-31 14:29 ?2429次閱讀
    什么是<b class='flag-5'>邊緣</b><b class='flag-5'>計算</b>盒子(<b class='flag-5'>AI</b>算法盒子)?