作者:李衛(wèi)忠 文章來(lái)源:doit
超大規(guī)模云計(jì)算中心、電子商務(wù)和社交網(wǎng)絡(luò)數(shù)據(jù)中心,正面臨著數(shù)據(jù)類型復(fù)雜的工作負(fù)載加速之難題。
數(shù)據(jù)中心加速的主要途徑
傳統(tǒng)CPU處理能力的需要突破已經(jīng)成為共識(shí),目前的途徑主要有以下幾類:
途徑一,ASIC:經(jīng)歷了幾十年的發(fā)展演變,為專門目的而設(shè)計(jì)的ASIC,由于面向特定用戶的需求,在加速效率上可圈可點(diǎn)。但是,設(shè)計(jì)周期長(zhǎng)、成本貴、應(yīng)用范圍窄的通病,使ASIC僅適合于批量很大或者對(duì)產(chǎn)品成本不計(jì)較的場(chǎng)合。
途徑二,GPU:隨著近年來(lái)機(jī)器學(xué)習(xí)等領(lǐng)域的突飛猛進(jìn),GPU也早已經(jīng)不再局限于3D圖形處理,其在浮點(diǎn)運(yùn)算、并行計(jì)算等部分計(jì)算方面的特性已經(jīng)引起業(yè)界越來(lái)越多的關(guān)注,尤其是目前最大的獨(dú)立芯片生產(chǎn)銷售商N(yùn)VIDIA有些如日中天的感覺,但其在應(yīng)用廣度上的通用性仍然有待時(shí)間的檢驗(yàn)。
途徑三,F(xiàn)PGA:它作為半定制的ASIC而出現(xiàn),既解決了定制電路的不足,又在性能與應(yīng)用廣度上顯示出優(yōu)勢(shì),英特爾已經(jīng)積極布局,推出CPU+FPGA架構(gòu),賽靈思池化FPGA近期取得的一些新成果,也使FPGA進(jìn)入數(shù)據(jù)中心加速的主角地位。
賽靈思數(shù)據(jù)中心加速器取得重大進(jìn)展
日前,賽靈思在2016全球超算大會(huì)(SC 16)上宣布推出一套全新的技術(shù)——賽靈思可重配置加速堆棧方案,旨在幫助全球最大的云服務(wù)供應(yīng)商快速開發(fā)和部署加速平臺(tái)。通過賽靈思FPGA,該方案比x86服務(wù)器CPU提高40倍;比競(jìng)爭(zhēng)型FPGA方案提高了6倍。
賽靈思全球戰(zhàn)略高級(jí)副總裁Steve Glaser和云戰(zhàn)略總監(jiān)Andy walsh對(duì)賽靈思最新的FPGA動(dòng)態(tài)可重配置堆棧技術(shù)進(jìn)行了詳細(xì)的介紹。
超大規(guī)模工作負(fù)載中,賽靈思FPGA的單位功耗性能與CPU對(duì)比
與服務(wù)器CPU的性能對(duì)比,單位功耗性能在機(jī)器學(xué)習(xí)推斷方面提高了11倍;數(shù)據(jù)分析SQL查詢方面提升了33倍;視頻處理轉(zhuǎn)碼提高40倍;存儲(chǔ)壓縮提高40倍;網(wǎng)絡(luò)vSwitch可提高23倍。
在以計(jì)算效率和加速器利用率所組成的象限中,賽靈思池化FPGA的單位功耗性能實(shí)現(xiàn)了比Altera FPGA高2-6倍,相關(guān)產(chǎn)品將在明年上市。
數(shù)據(jù)中心加速主要途徑比較
問題一:賽靈思FPGA VS. 英特爾集成式MCM CPU+FPGA
賽靈思全球戰(zhàn)略高級(jí)副總裁Steve Glaser認(rèn)為,在代表應(yīng)用廣度的橫軸和加速器利用率的縱軸所組成的象限圖中,賽靈思池化FPGA在超大規(guī)模網(wǎng)絡(luò)應(yīng)用方面已經(jīng)遙遙領(lǐng)先;英特爾注意到FPGA的優(yōu)勢(shì),但其集成式MCM CPU+FPGA目前只能解決中小企業(yè)的問題。
問題二:賽靈思FPGA VS. 英偉達(dá)GPU
面對(duì)日益火爆的GPU,Steve指出,GPU和定制ASIC在應(yīng)用廣度方面與FPGA相比遠(yuǎn)遠(yuǎn)不足;
以機(jī)器學(xué)習(xí)加速為例,使用神經(jīng)網(wǎng)絡(luò)分類圖像、翻譯文本和語(yǔ)音、識(shí)別無(wú)結(jié)構(gòu)數(shù)據(jù)中的底層模式,需要“兩階段”法。
第一階段(培訓(xùn)),使用海量加標(biāo)記的樣本數(shù)據(jù)和計(jì)算培訓(xùn)神經(jīng)網(wǎng)絡(luò),英偉達(dá)GPU擅長(zhǎng)的這一領(lǐng)域只占機(jī)器學(xué)習(xí)5%的市場(chǎng)規(guī)模。
一旦網(wǎng)絡(luò)培訓(xùn)完成,便進(jìn)入第二個(gè)階段(推斷),通過受訓(xùn)的神經(jīng)網(wǎng)絡(luò)處理新數(shù)據(jù)樣本或查詢,以確定其可能的級(jí)別。這一占機(jī)器學(xué)習(xí)加速90%的市場(chǎng)正是賽靈思FPGA角逐的天下。
推斷是當(dāng)今最大規(guī)模數(shù)據(jù)中心中的一個(gè)巨大的工作負(fù)載,因?yàn)樗?fù)責(zé)實(shí)現(xiàn)廣泛的日益擴(kuò)展的重要應(yīng)用,例如語(yǔ)言翻譯、自然語(yǔ)言接口、照片和視頻內(nèi)容識(shí)別,以及網(wǎng)上產(chǎn)品選擇與促銷。其中兩個(gè)最大的人工智能市場(chǎng)分別是無(wú)人駕駛汽車和機(jī)器人。
而賽靈思池化FPGA將機(jī)器學(xué)習(xí)推斷計(jì)算效率提升了2-6倍。
近年來(lái)賽靈思在加速領(lǐng)域的里程碑事件回顧
回顧一下賽靈思在云計(jì)算加速領(lǐng)域的重要里程碑事件:
賽靈思近年來(lái)在加速領(lǐng)域的里程碑事件
2014~2015年,賽靈思與高通、IBM等公司展開合作,并在業(yè)界推出首款20納米和16納米數(shù)據(jù)中心產(chǎn)品,比競(jìng)爭(zhēng)對(duì)手提前了1年又1個(gè)季度。此外,賽靈思還積極推動(dòng)制定行業(yè)標(biāo)準(zhǔn)的CCIX聯(lián)盟的發(fā)展。
目前,全球七大超大規(guī)模云服務(wù)公司中,已有3家采用了賽靈思FPGA,其中:
百度采用了賽靈思技術(shù)作為數(shù)據(jù)中心的池化資源部署,以及用于無(wú)人汽車和語(yǔ)音的機(jī)器學(xué)習(xí);前不久,百度宣布利用賽靈思技術(shù)使序列分析提升了10倍。
微軟宣布,為實(shí)現(xiàn)服務(wù)器上的網(wǎng)絡(luò)加速,其數(shù)據(jù)中心已經(jīng)大規(guī)模部署賽靈思FPGA技術(shù)搭建加速器架構(gòu),以分配越來(lái)越高的工作負(fù)載。
亞馬遜不久前公布在彈性計(jì)算云上實(shí)現(xiàn)了FPGA即服務(wù)。保險(xiǎn)定價(jià)公司AON、基因序列測(cè)試公司edico genome、機(jī)器學(xué)習(xí)公司TERADEEP等亞馬遜合作伙伴都已經(jīng)宣布采用了AWS F1實(shí)例。
初創(chuàng)型技術(shù)公司也是賽靈思重要的用戶類型之一。
DEEPHI TECH是一家初創(chuàng)公司,攜手賽靈思推出用于機(jī)器學(xué)習(xí)推斷的FPGA平臺(tái),以及用于部署的超高效神經(jīng)網(wǎng)絡(luò),與GPU相比效能甚至提高了10倍。
使用賽靈思FPGA的單個(gè)服務(wù)器與整個(gè)機(jī)架的CPU性能對(duì)比
可重配置加速堆棧:行業(yè)標(biāo)準(zhǔn)的開發(fā)與部署
隨著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的大規(guī)模應(yīng)用,未來(lái)很多工作負(fù)載將是今天的我們所無(wú)法想象的。
行業(yè)標(biāo)準(zhǔn)的開發(fā)與部署
賽靈思云戰(zhàn)略總監(jiān)Andy walsh介紹,賽靈思可重配置加速堆棧的第一層平臺(tái)開發(fā)版在不久前已經(jīng)推出,主要用于超大規(guī)模數(shù)據(jù)中心部署,以及基于云的開發(fā)環(huán)境。
在中間的應(yīng)用開發(fā)層,賽靈思提供了集成框架;用于機(jī)器學(xué)習(xí)、分析和視頻的應(yīng)用函數(shù)庫(kù);以及針對(duì)UltraScale FPGA優(yōu)化的數(shù)學(xué)函數(shù)庫(kù)。
在上層,賽靈思對(duì)OpenStack提供了支持,可進(jìn)行云配置與管理;支持UltrascaleFPGA;2017年將推出Ocata 版。
賽靈思加速堆棧
“如果您是一家主攻機(jī)器學(xué)習(xí)推斷的公司,賽靈思池化FPGA是最佳的選擇?!盇ndy說。
點(diǎn)評(píng):
賽靈思的優(yōu)勢(shì)在于可編程,可優(yōu)化,可重新配置。
機(jī)器學(xué)習(xí)的訓(xùn)練在于浮點(diǎn)計(jì)算,這是GPU所增強(qiáng)的部分,但是這只占機(jī)器學(xué)習(xí)5%的工作,一旦進(jìn)入大規(guī)模應(yīng)用,GPU在推斷方面不足正是賽靈思FPGA的優(yōu)勢(shì),而這部分工作占了機(jī)器學(xué)習(xí)90%以上的工作量。在這一領(lǐng)域的成功,將為賽靈思帶來(lái)極高的市場(chǎng)地位。
在云計(jì)算與物聯(lián)網(wǎng)大爆炸的時(shí)代,隨著機(jī)器學(xué)習(xí)市場(chǎng)的逐步成熟,賽靈思的池化FPGA可重配置加速堆??芍^是如魚得水,讓超大型網(wǎng)絡(luò)公司可以輕松地解決掉80%的工作。除了初創(chuàng)型公司,賽靈思把目標(biāo)市場(chǎng)對(duì)準(zhǔn)亞馬遜、Facebook、谷歌、微軟、阿里巴巴、百度和騰訊等“七大超級(jí)”數(shù)據(jù)中心公司,且已經(jīng)獲得亞馬遜、微軟、百度等公司的認(rèn)可,可以說,賽靈思已經(jīng)在業(yè)界初步樹立起一流數(shù)據(jù)中心加速解決方案供應(yīng)商的地位。
評(píng)論
查看更多