0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

第三次AI浪潮革命,百萬倍算力挑戰(zhàn)大起底

獨愛72H ? 來源:劉林華 ? 作者:電子發(fā)燒友 ? 2019-02-05 13:55 ? 次閱讀

AI第三次浪潮革命是在算力激增的推動下發(fā)生的。Jeff Dean說我們需要超過現(xiàn)在100萬倍的算力,成為企業(yè)面臨的重大挑戰(zhàn)。本文通過硬件基礎(chǔ)、軟件基礎(chǔ)以及優(yōu)化框架和應(yīng)用加速4個方面,為您起底百萬倍算力挑戰(zhàn)。

AI這個詞,從第一次被創(chuàng)造出來至今,已經(jīng)經(jīng)歷了兩次浪潮。如今在算法、大數(shù)據(jù)、算力三大因素的驅(qū)動下,AI發(fā)展迎來第三次浪潮。

谷歌AI負責(zé)人Jeff Dean說:“事實證明,我們真正需要的是超過現(xiàn)在100萬倍的計算能力,而不僅僅是幾十倍的增長。”

算力為王的年代,企業(yè)需要滿足4個層次的需求:

硬件,一些計算平臺比如服務(wù)器、加速卡等。這是算力的物理根基,是滿足算力的第一步

軟件,構(gòu)建在硬件之上的開發(fā)管理套件,提供整體解決方案,可以讓用戶無需掌握高深的AI知識,直接根據(jù)需要進行開發(fā)

優(yōu)化主流框架,針對硬件和管理套件進行定制化,使得算力能夠更加快速穩(wěn)定

應(yīng)用加速,AI端到端的解決方案,將算力落地

這就給傳統(tǒng)企業(yè)帶來了前所未有的挑戰(zhàn)。一方面,越來越多的傳統(tǒng)企業(yè)需要盡快轉(zhuǎn)型AI;另一方面,傳統(tǒng)企業(yè)已經(jīng)無法應(yīng)對AI時代的算力挑戰(zhàn)。

提高整個AI計算系統(tǒng)的性能與效率迫在眉睫,而首當其沖的,就是服務(wù)器和加速卡。

解決算力需求的硬件基礎(chǔ):服務(wù)器和加速卡

企業(yè)的規(guī)模越大,數(shù)據(jù)的集中度就越高,對AI計算力的需求也就越高,對AI服務(wù)器的需求也就約旺盛。

根據(jù)國際調(diào)研公司IDC)全球季度服務(wù)器跟蹤報告,2018年第三季度全球服務(wù)器市場,供應(yīng)商收入達234億美元(約1581億人民幣),同比增長37.7%。全球服務(wù)器出貨量320萬臺,同比增長18.3%。

在全球服務(wù)器市場,排名前五的分別是:DELL EMC第一、HPE/New H3C Group第二、Inspur/Inspur Power第三、Lenovo第四、 IBM,Huawei和Cisco并列第五。

具體數(shù)據(jù)如下圖:

可以看到,在服務(wù)器市場TOP 5的7家廠商中,浪潮表現(xiàn)的最為亮眼,出貨量同比增長90.2%,營收增長達增長156.5%。

杭州的阿里,北京的京東、字節(jié)跳動(今日頭條)、百度,深圳的騰訊,都對當?shù)谹I計算力產(chǎn)生巨大的需求。

能夠勝任BAT算力要求的企業(yè)不多。在AI算力供應(yīng)商的問題上,BAT紛紛選擇了浪潮。

浪潮能夠連續(xù)多年成為BAT最主要的AI服務(wù)器供應(yīng)商,靠的是不斷提升計算能力的AI服務(wù)器:

AI超級服務(wù)器AGX-5,單機配置16顆NVIDIA Tesla V100 Tensor Core 32GB GPUs,AI計算性能高達每秒2千萬億次,可支持4倍超大規(guī)模深度神經(jīng)網(wǎng)絡(luò)模型,并將訓(xùn)練速度提高10倍。

AGX-2服務(wù)器,采用P100的Linpack浮點運算性能達29.33TFLOPS,在2U空間內(nèi)支持部署8塊NVLink或PCI-E。在AI深度學(xué)習(xí)模型訓(xùn)練上,采用TensorFlow框架和GoogLeNet模型,AGX-2處理速度為每秒1165幅圖片。

智能視頻分析服務(wù)器NF5280M5-V,在2U空間內(nèi)配置8片NVIDIA TESLA P4 GPU,單臺服務(wù)器即可完成96路高清攝像頭視頻數(shù)據(jù)的解碼及結(jié)構(gòu)化實時處理需求。同時最大可提供96TB本地存儲空間,可將視頻處理數(shù)據(jù)的保存周期最高延長至6個月。

彈性GPU服務(wù)器NF5468M5,專注于AI云??赏瑫r處理300路以上1080p高清視頻結(jié)構(gòu)化,支持288TB大容量存儲或32TB固態(tài)存儲,實現(xiàn)高達400Gbps通信帶寬和1us的超低延遲。

這些服務(wù)器,同時也在為科大訊飛、商湯、曠視、字節(jié)跳動、滴滴等AI領(lǐng)先公司,在語音、圖像、視頻、搜索、網(wǎng)絡(luò)等方面提供了算力支持。

除了AI服務(wù)器,浪潮還發(fā)布了全球首款集成HBM2高速緩存FPGA AI加速卡F37X,可在不到75W典型應(yīng)用功耗提供28.1TOPS的INT8計算性能和460GB/s的超高數(shù)據(jù)帶寬,實現(xiàn)高性能、高帶寬、低延遲、低功耗的AI計算加速。

有了AI服務(wù)器和加速卡,僅僅是解決了算力需求的第一步:硬件基礎(chǔ)設(shè)施。接下來,就需要管理套件的跟進,實現(xiàn)軟件平臺基礎(chǔ)。

解決算力需求的軟件基礎(chǔ):AI開發(fā)平臺

解決了算力的硬件基礎(chǔ),企業(yè)還需要解決快速構(gòu)建AI開發(fā)平臺,進行人工智能產(chǎn)業(yè)布局的難題。

這個時候,一套能夠?qū)崿F(xiàn)對計算、存儲、網(wǎng)絡(luò)等基礎(chǔ)資源的管理和調(diào)度的完整解決方案就非常必要了。

浪潮升級了AI高效開發(fā)管理平臺AIStation,致力于提供高效、易用的人工智能開發(fā)平臺。

同時AIStation還集成了主流的AI開源框架和深度學(xué)習(xí)模型,提供完整的AI開發(fā)工作流服務(wù)。

除了AIStation外,浪潮還發(fā)布了OpenStack AI云平臺。

根據(jù)工信部華信研究院提供的數(shù)據(jù)顯示,2018年OpenStack占據(jù)私有云60%的市場。

OpenStack AI云平臺可幫助行業(yè)AI用戶快速便捷的構(gòu)建CPU+GPU的彈性異構(gòu)云環(huán)境,并實現(xiàn)對異構(gòu)計算資源池的動態(tài)調(diào)度與分配,支撐數(shù)據(jù)管理、模型訓(xùn)練、模型部署等各類AI應(yīng)用場景。

通過對GPU虛擬機的支持,浪潮O(jiān)penStack AI云平臺能夠以多租戶的形式,按需分配異構(gòu)計算資源,從而實現(xiàn)AI敏捷開發(fā)。

同時,多租戶任務(wù)排隊策略、資源分組優(yōu)化策略、租戶資源配額集均衡策略以及GPU共享策略等精細化調(diào)度策略,也進一步提高了GPU資源的利用率。

有了管理套件后,接下來就應(yīng)該深入到更細節(jié)的框架優(yōu)化中了。

進一步提升算力方法:框架優(yōu)化

要滿足算力的不斷提升,舊有的計算框架已經(jīng)無法滿足新的性能需求,需要不斷的進行優(yōu)化。

目前使用比較廣的框架包括TensorFlow、PyTorch和Caffe。

TensorFlow是一款強大而成熟的深度學(xué)習(xí)框架,有強大的可視化性能,以及用于高水平模型開發(fā)的多個選項。它具備生產(chǎn)就緒的部署選項,支持移動平臺。

Caffe用來做計算機視覺,HPC和數(shù)值優(yōu)化的研究,加上產(chǎn)品線里的高效部署。

PyTorch用來做非常dynamic的研究加上對速度要求不高的產(chǎn)品

對于企業(yè)來說,由于TF和Caffe的高效部署選項,基于TF和Caffe的框架優(yōu)化就顯得更有意義。

浪潮針對TF和Caffe推出了Caffe-MPI, TensorFlow-Opt, FPGA計算加速引擎TF2等優(yōu)化方案。

Caffe-MPI

Caffe-MPI是全球首個集群并行版的Caffe深度學(xué)習(xí)計算開源框架,針對高性能計算系統(tǒng)設(shè)計使之具備良好的并行擴展性。

新版本在4節(jié)點16塊GPU卡集群系統(tǒng)上訓(xùn)練性能較單卡提升13倍,其每秒處理圖片數(shù)量是同配置集群運行的TensorFlow 1.0的近2倍。

Caffe-MPI設(shè)計了兩層通信模式,非常適合現(xiàn)在的高密度GPU服務(wù)器。同時Caffe-MPI還設(shè)計實現(xiàn)了計算和通信的重疊,提供了更好的cuDNN兼容性,用戶可以無縫調(diào)用最新的cuDNN版本實現(xiàn)更大的性能提升。

TensorFlow-Opt

TensorFlow-Opt已完成了ResNet-50、ResNet-101和VGG16(batch size=128 & 256)等多個網(wǎng)絡(luò)模型的測試。

其中,在ResNet-50網(wǎng)絡(luò)模型下(單卡batchsize=256),512塊GPU每秒可訓(xùn)練128336張圖片,即訓(xùn)練完成一個完整的ImageNet數(shù)據(jù)集(128萬張圖片)只需要約10秒時間,打破了AI訓(xùn)練性能世界紀錄。

FPGA計算加速引擎TF2

FPGA計算加速引擎TF2支持TensorFlow,可幫助AI客戶快速實現(xiàn)基于主流AI訓(xùn)練軟件和深度神經(jīng)網(wǎng)絡(luò)模型DNN的FPGA線上推理,并通過全球首創(chuàng)的FPGA上DNN的移位運算技術(shù)獲得AI應(yīng)用的高性能和低延遲。

TF2計算加速引擎提高了FPGA上AI計算性能,降低了FPGA的AI軟件實現(xiàn)門檻,將支持FPGA廣泛應(yīng)用于AI生態(tài)推動更多AI應(yīng)用落地。

經(jīng)過AI服務(wù)器提供算力的硬件基礎(chǔ),管理套件提供軟件平臺基礎(chǔ),優(yōu)化框架保證緊跟算力不斷增長的需求,最后就是為應(yīng)用提供加速。

實現(xiàn)算力需求的落地應(yīng)用:案例解析

目前,浪潮在智能視頻分析、醫(yī)療影像、電力設(shè)備巡檢、金融匯率預(yù)測、語音識別、AI云等應(yīng)用中,已經(jīng)有了很多成功案例。

成功案例一:智能安防

視頻科技領(lǐng)域AI應(yīng)用的場景化非常分散,需要提煉應(yīng)用場景,根據(jù)應(yīng)用規(guī)模,在解決方案中按需靈活組合各種產(chǎn)品。

浪潮人工智能專家團隊與大華合作建立了超強計算力為核心的計算平臺和計算集群單元。

在硬件上,使用AGX-2集群來處理視頻相關(guān)業(yè)務(wù)計算。在管理套件上,針對智能安防的應(yīng)用場景,定制開發(fā)了AIstation管理平臺。

優(yōu)化后的AIStation平臺,可以秒級構(gòu)建AI環(huán)境,實現(xiàn)GPU資源智能調(diào)度,整體效率大幅提升,降低運維成本。

目前大華股份與浪潮已經(jīng)在智慧城市、雪亮工程、平安城市等多個領(lǐng)域共同打造信息化聯(lián)合解決方案,共同促進智能物聯(lián)網(wǎng)行業(yè)智能化、信息化轉(zhuǎn)型升級和跨域發(fā)展。

成功案例二:首鋼園落地項目

北京首鋼自動化信息技術(shù)有限公司,采用了浪潮和百度聯(lián)合推出的ABC一體機3.0的鋼包質(zhì)檢解決方案后,10000張鋼材照片的整體缺陷識別分類準確率達到99%以上,比人工專業(yè)檢測的準確率更高。

成功案例三:語音識別一體機

浪潮與科大訊飛聯(lián)合發(fā)布了面向于語音識別、翻譯等AI應(yīng)用的16卡計算集群“AI Booster”,單套系統(tǒng)能夠?qū)崿F(xiàn)單精度240TFlops/s或Int8 752TFlops/s的計算性能。

雙方公布的實測數(shù)據(jù)顯示,在智能翻譯模型訓(xùn)練任務(wù)中,采用相同計算卡的“AI Booster”與傳統(tǒng)4卡服務(wù)器組成的16卡集群相比,AI計算加速比提升18%。

解決算力需求的長期戰(zhàn)略:人才培養(yǎng)

除了技術(shù)問題,傳統(tǒng)行業(yè)AI轉(zhuǎn)型還面臨AI人才的短缺。在培養(yǎng)人才問題上,浪潮也在積極提供解決方案。

去年在AICC人工智能計算大會上開辦集訓(xùn)營,提供了現(xiàn)場動手實踐的課程。

打比賽也是一個很好的吸引大學(xué)生投入AI學(xué)習(xí)中的方式。世界三大超算競賽之一的ASC,就是一個很好的例子。

目前ASC已經(jīng)吸引了超過7000名來自世界各地的選手,送出了近百萬的獎金。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29383

    瀏覽量

    267667
收藏 人收藏

    評論

    相關(guān)推薦

    三次諧波定子接地保護動作條件

    三次諧波定子接地保護是電力系統(tǒng)中一種重要的保護方式,主要用于保護發(fā)電機、變壓器等設(shè)備的定子繞組。 一、三次諧波定子接地保護的基本原理 1.1 三次諧波的產(chǎn)生 在電力系統(tǒng)中,由于非線性負載、變壓器鐵芯
    的頭像 發(fā)表于 07-25 14:57 ?677次閱讀

    三次諧波對注入式定子接地影響

    引言 隨著電力系統(tǒng)的快速發(fā)展,電力系統(tǒng)的諧波問題日益突出。三次諧波作為電力系統(tǒng)中常見的一種諧波,對電力系統(tǒng)的安全穩(wěn)定運行產(chǎn)生了一定的影響。特別是在注入式定子接地系統(tǒng)中,三次諧波的影響尤為明顯。 三次
    的頭像 發(fā)表于 07-25 14:55 ?446次閱讀

    IEEE1901.3標準工作組第三次會議在長沙召開,加速推進PLC雙模通信國際標準的制定

    4月11日,IEEE1901.3雙模通信國際標準第三次會議在長沙順利召開。會議由中國電力科學(xué)研究院主辦,國網(wǎng)湖南省電力公司和深圳合微承辦,IEEE1901.3工作組Oleg先生、南方電網(wǎng)公司、國網(wǎng)
    的頭像 發(fā)表于 04-13 08:08 ?485次閱讀
    IEEE1901.3標準工作組<b class='flag-5'>第三次</b>會議在長沙召開,加速推進PLC雙模通信國際標準的制定

    諧波和三次諧波區(qū)別 二諧波危害沒有三次諧波大?

    諧波和三次諧波區(qū)別 二諧波危害沒有三次諧波大? 在現(xiàn)代電力系統(tǒng)中,諧波問題逐漸引起人們的關(guān)注。諧波是指頻率是基波頻率的倍數(shù)的電流或電壓成分。二
    的頭像 發(fā)表于 04-08 17:11 ?4499次閱讀

    用cubeMX + STM32L0HAL庫1.12.1生成的自定義HID設(shè)備,接收后發(fā)送數(shù)據(jù)第三次開始會失敗卡死的原因?

    用cubeMX + STM32L0HAL庫1.12.1生成的自定義HID設(shè)備,在接收后發(fā)送數(shù)據(jù),第三次開始會失敗卡死,單獨接收和發(fā)送沒問題,用HAL庫1.12.0生成的沒問題
    發(fā)表于 03-21 08:05

    SpaceX星艦將第三次試飛

    SpaceX公司近日宣布,其巨型火箭星艦即將迎來第三次試飛,旨在進一步測試其性能極限。據(jù)悉,這次試飛計劃最早于3月14日進行,相比前兩,其任務(wù)目標更加宏大且復(fù)雜。
    的頭像 發(fā)表于 03-08 13:52 ?568次閱讀

    說說TCP三次握手的過程?為什么是三次而不是兩、四?

    說說TCP三次握手的過程?為什么是三次而不是兩、四? TCP三次握手是建立TCP連接的過程,確保數(shù)據(jù)的可靠傳輸。它是由發(fā)送端和接收端完成
    的頭像 發(fā)表于 02-04 11:03 ?526次閱讀

    SpaceX計劃2月份進行星際飛船系統(tǒng)第三次飛行測試

    SpaceX公司的高管近日宣布,美國聯(lián)邦航空局(FAA)計劃在今年2月份批準星際飛船系統(tǒng)進行第三次飛行測試。這意味著,星際飛船有望再次升空,繼續(xù)其太空探索之旅。
    的頭像 發(fā)表于 01-11 14:35 ?462次閱讀

    SpaceX 星艦計劃下月進行第三次試飛

    周二下午,NASA舉辦的電話會議中,SpaceX客戶運營及整合副總裁杰西卡·詹森(Jessica Jensen)透露,公司正積極爭取Starship第三次飛行審批,預(yù)計最快能在2月拿到許可。
    的頭像 發(fā)表于 01-11 13:43 ?474次閱讀

    衛(wèi)星通信序幕拉開,AI浪潮澎湃

    AI浪潮催生要求,基礎(chǔ)設(shè)施需求持續(xù)提升。AIGC帶來的超大需求拉動通信基礎(chǔ)設(shè)施建設(shè)及擴容
    發(fā)表于 01-03 10:22 ?307次閱讀
    衛(wèi)星通信序幕拉開,<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>浪潮</b>澎湃

    使用ARM對ADIS16480進行SPI數(shù)據(jù)讀取時,需要發(fā)送三次讀取指令才能讀取到數(shù)據(jù)是為什么?

    使用ARM對ADIS16480進行SPI數(shù)據(jù)讀取時,需要發(fā)送三次讀取指令,第三次才能讀到第一發(fā)送讀取數(shù)據(jù)指令所讀到的數(shù)據(jù),請問有人知道這個是什么地方配置出錯還是什么別的原因
    發(fā)表于 12-28 07:26

    AI數(shù)據(jù)中心的一些挑戰(zhàn)

    AI或者人工智能自1956年提出至今已有幾十年的歷史。過去的幾十年里面,人工智能的熱度經(jīng)歷了三次浪潮,第一提出人工智能之后出現(xiàn)一些新的技術(shù),也應(yīng)用到了工業(yè)生產(chǎn)上,但是很快大家發(fā)現(xiàn)所謂
    發(fā)表于 12-25 11:25 ?473次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>數(shù)據(jù)中心的一些<b class='flag-5'>挑戰(zhàn)</b>

    中微公司第三次榮登福布斯中國“中國創(chuàng)新力企業(yè)50強”榜單

    中微公司第三次榮登福布斯中國“中國創(chuàng)新力企業(yè)50強”榜單,企業(yè)綜合實力與創(chuàng)新能力再獲行業(yè)嘉獎與專業(yè)認可。
    的頭像 發(fā)表于 11-10 09:16 ?561次閱讀

    深圳市民政局開展第三次“國際組織服務(wù)日”交流活動

    為促進國際性產(chǎn)業(yè)與標準組織的健康有序發(fā)展,深圳市民政局國際產(chǎn)業(yè)與標準組織專責(zé)組定期開展上門服務(wù),并于11月9日上午委托深圳市共熵產(chǎn)業(yè)與標準創(chuàng)新服務(wù)中心(以下簡稱“本中心”)組織了第三次“國際組織服務(wù)
    的頭像 發(fā)表于 11-09 18:15 ?413次閱讀
    深圳市民政局開展<b class='flag-5'>第三次</b>“國際組織服務(wù)日”交流活動

    世紀華通季度總營收37.38億 積極發(fā)AI業(yè)務(wù)

    世紀華通季度總營收37.38億 積極發(fā)AI業(yè)務(wù) 根據(jù)世紀華通發(fā)布的季報數(shù)據(jù)顯示,世紀華
    的頭像 發(fā)表于 11-02 18:44 ?815次閱讀