0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思正式推出Versal Premium 可提供比當(dāng)前FPGA高達(dá)三倍的吞吐量

半導(dǎo)體動(dòng)態(tài) ? 來(lái)源:芯智訊 ? 作者:浪劍客 ? 2020-03-12 09:18 ? 次閱讀

2018年10月16日,FPGA大廠賽靈思(Xilinx)在北京的“Xilinx開(kāi)發(fā)者大會(huì) ”(XDF)上,發(fā)布了全球首款自適應(yīng)計(jì)算加速平臺(tái)(ACAP)芯片系列Versal,并發(fā)布了AI Core系列和Prime系列。去年,這兩個(gè)系列產(chǎn)品也已經(jīng)成功推向了市場(chǎng)。

今天(3月11日),賽靈思舉行線上發(fā)布會(huì),正式推出了Versal ACAP產(chǎn)品組合的第三大產(chǎn)品系列—— Versal Premium。

賽靈思認(rèn)為,隨著來(lái)自多元化應(yīng)用和工作負(fù)載(比如智能設(shè)備、視頻流、物聯(lián)網(wǎng)、企業(yè)等)的數(shù)據(jù)爆炸性增長(zhǎng),這也使得核心網(wǎng)正面臨巨大的壓力。

數(shù)據(jù)顯示,2019年區(qū)域流量容量提升了100倍,帶寬年復(fù)合增長(zhǎng)率達(dá)到了51%。

隨著數(shù)據(jù)的爆炸性增長(zhǎng),對(duì)于整個(gè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施提出了更高的要求,這也加速驅(qū)動(dòng)了網(wǎng)絡(luò)轉(zhuǎn)型。而在這個(gè)轉(zhuǎn)型過(guò)程當(dāng)中,我們可以看到三個(gè)趨勢(shì):

1、下一代核心網(wǎng)絡(luò)加速擴(kuò)展。

根據(jù)ABI Research數(shù)據(jù)顯示,2020年-2024年5G核心網(wǎng)年復(fù)合增長(zhǎng)率預(yù)計(jì)為313%。

2、安全已成為網(wǎng)絡(luò)運(yùn)營(yíng)商最高優(yōu)先級(jí)的問(wèn)題。

ISH Markit的研究顯示,對(duì)于網(wǎng)絡(luò)運(yùn)營(yíng)商來(lái)說(shuō),過(guò)去性能、擴(kuò)展性、成本一直是運(yùn)營(yíng)商主要關(guān)注的問(wèn)題,而現(xiàn)在,安全性已經(jīng)成為了網(wǎng)絡(luò)運(yùn)營(yíng)商最為關(guān)注的問(wèn)題。

3、隨著數(shù)據(jù)的增長(zhǎng),對(duì)于計(jì)算能力與帶寬的需求越來(lái)越高。

我們可以看到,現(xiàn)在網(wǎng)絡(luò)的帶寬的增長(zhǎng)非常的迅速,但是,隨著摩爾定律的放緩甚至是趨于消亡,芯片的計(jì)算能力越來(lái)越跟不上了。根據(jù)賽靈思的估算,2018年之時(shí),服務(wù)器端口速度的增長(zhǎng)已經(jīng)超過(guò)了摩爾定律對(duì)于服務(wù)器CPU性能所帶來(lái)的增長(zhǎng),并且差距正在進(jìn)一步擴(kuò)大。

在此背景之下,為了加速運(yùn)營(yíng)商的網(wǎng)絡(luò)轉(zhuǎn)型,賽靈思推出了Versal Premium ACAP系列產(chǎn)品,其具備了高度集成且功耗優(yōu)化的網(wǎng)絡(luò)硬核,是業(yè)界帶寬最高、計(jì)算密度最高的自適應(yīng)平臺(tái)。專為在散熱條件和空間受限的環(huán)境下運(yùn)行最高帶寬網(wǎng)絡(luò),以及需要可擴(kuò)展、靈活應(yīng)變應(yīng)用加速的云提供商而設(shè)計(jì)。

Versal Premium ACAP系列詳解

我們都知道,2018年賽靈思推出的Versal系列是業(yè)界首款自適應(yīng)計(jì)算加速平臺(tái)( ACAP ),是一個(gè)功能遠(yuǎn)超常規(guī)芯片架構(gòu)的革命性全新異構(gòu)計(jì)算器件類別。而據(jù)賽靈思介紹,其去年就已經(jīng)向客戶交付的Versal AI Core系列和Versal Prime系列,已經(jīng)獲得了幾百家客戶的采用,反響很好,目前正在加速生產(chǎn)。

而此次賽靈思推出的全新Versal Premium則是Versal Prime系列的升級(jí)款版,是針對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施推出的旗艦級(jí)產(chǎn)品,采用臺(tái)積電7nm工藝制程打造而成,融軟件可編程能力與動(dòng)態(tài)可配置硬件加速、預(yù)制連接和安全功能為一體,為加快產(chǎn)品上市進(jìn)程提供了強(qiáng)大引擎。

作為 Versal ACAP 的最新產(chǎn)品系列, Versal Premium 系列可提供比當(dāng)前FPGA高達(dá)三倍的吞吐量,且擁有高度集成的軟件/硬件平臺(tái),內(nèi)置了以太網(wǎng)接口、Interlaken和加密引擎,以打造快速、安全的網(wǎng)絡(luò)。該系列還提供了當(dāng)前部署主流 FPGA 兩倍的計(jì)算密度,同時(shí)還面向持續(xù)擴(kuò)展的多元化且不斷演進(jìn)的云工作負(fù)載及網(wǎng)絡(luò)工作負(fù)載,提供了靈活應(yīng)變的能力。

Versal Prime系列

具體來(lái)說(shuō),與之前的Versal Prime系列相比,Versal Premium系列在其原有的靈活多變的平臺(tái)(集成了Arm應(yīng)用處理器內(nèi)核和實(shí)時(shí)處理器內(nèi)核、自適應(yīng)硬件、DSP引擎、高速片上可編程網(wǎng)絡(luò)等等)上,突破性地集成了功耗優(yōu)化的網(wǎng)絡(luò)硬核(ASIC),包括:400G高速加密引擎、600G Interlaken硬核、600G以太網(wǎng)硬核、112G PAM4收發(fā)器、帶有DMA的PCIe 5.0、CCIX。

Versal Premium系列

據(jù)賽靈思介紹,Versal Premium系列所提供的網(wǎng)絡(luò)IP集成,提供了等效22個(gè)16nm FPGA的邏輯密度,極大縮減了開(kāi)發(fā)者在設(shè)計(jì)基礎(chǔ)架構(gòu)與連接上的投入,可以使得開(kāi)發(fā)者將更多的精力專注于差異化。

同時(shí),這也使得Versal Premium系列能夠超越摩爾定律的局限,實(shí)現(xiàn)新一代的帶寬與處理能力,并且能夠顯著降低資本支出與運(yùn)營(yíng)成本。

前面提到,Versal Premium系列所集成的一系列功耗優(yōu)化的網(wǎng)絡(luò)硬核,提供了等效22個(gè)16nm FPGA的邏輯密度,這也意味著Versal Premium系列可以釋放更多的邏輯用于個(gè)性化定制。

根據(jù)賽靈思公布的資料顯示,其Virtex UltraScale+ VU9P內(nèi)部的20萬(wàn)個(gè)LUT被用于了控制器、存儲(chǔ)器、PCIe接口等基礎(chǔ)設(shè)施(包括4個(gè)存儲(chǔ)器、4個(gè)控制器和一個(gè)PCIe+DMA),而相比之下,Versal Premium系列直接將這些作成了網(wǎng)絡(luò)硬核,使得其基礎(chǔ)設(shè)施對(duì)于內(nèi)部的LUT的消耗為0??梢詭椭蛻艚档彤悩?gòu)成本,更好的專注于差異化。

另外,在易用性方面,賽靈思面向各種類型的開(kāi)發(fā)人員提供了豐富的軟硬件集成平臺(tái),可以讓他們使用自己熟悉的框架和工具來(lái)進(jìn)行開(kāi)發(fā)。

對(duì)于數(shù)據(jù)科學(xué)家來(lái)說(shuō),可以通過(guò)TensorFlow、Caffe、PyTorch等同用框架來(lái)利用Versal Premium系列;軟件開(kāi)發(fā)者也可通過(guò)賽靈思去年推出的Vitis統(tǒng)一開(kāi)發(fā)平臺(tái)來(lái)使用Versal Premium系列;而硬件開(kāi)發(fā)者則可以通過(guò)VIVADO平臺(tái)來(lái)使用Versal Premium系列。

賽靈思表示,下一代基礎(chǔ)設(shè)施需要更大的帶寬密度,且方案受限于現(xiàn)有的外形尺寸、功耗和材料,另外,數(shù)據(jù)中心的占地面積也是有限的。這就要求,下一代的基礎(chǔ)設(shè)施需要功耗優(yōu)化的高吞吐量與計(jì)算量。

Versal Premium系列所集成的112G PAM4收發(fā)器、400G高速加密引擎、600G Interlaken硬核、600G以太網(wǎng)硬核、帶有DMA的PCIe Gen5&CCIX等硬核IP,不僅能夠提供功能優(yōu)化的高帶寬密度,提供自適應(yīng)硬件的靈活應(yīng)變性,還可適合AI和ML,可以幫助客戶系統(tǒng)適應(yīng)不斷變化的算法和安全威脅。

隨著 5G 網(wǎng)絡(luò)投入運(yùn)營(yíng),網(wǎng)絡(luò)流量大幅增長(zhǎng),導(dǎo)致現(xiàn)有空間和功耗范圍內(nèi)功耗優(yōu)化吞吐量與計(jì)算密度的需求不斷提高。為支持業(yè)界應(yīng)對(duì)這一挑戰(zhàn),Versal Premium 系列提供了高達(dá) 9Tb/s 的可擴(kuò)展、自適應(yīng)串行帶寬。具體方法是將 112G PAM4 收發(fā)器與集成的網(wǎng)絡(luò)功能模塊用于核心網(wǎng)、城域網(wǎng)和數(shù)據(jù)中心互聯(lián)( DCI )基礎(chǔ)設(shè)施,將每端口帶寬密度提高兩倍,并降低時(shí)延高達(dá) 50%。

另外,在當(dāng)前400G網(wǎng)絡(luò)的發(fā)展與部署上,58Gb/s的PAM4收發(fā)器就足以應(yīng)對(duì),而Versal Premium系列所集成的112Gb/s PAM4收發(fā)器則可在向下兼容的基礎(chǔ)上,同時(shí)可面向未來(lái)的單通道100G光通信和800G網(wǎng)絡(luò)基礎(chǔ)設(shè)施的發(fā)展需求。并且可兼容更具挑戰(zhàn)性的銅纜線和基板。

Versal Premium系列的通道化以太網(wǎng)硬核能夠以最小占板空間提供高達(dá)5Tb/s的可擴(kuò)展以太網(wǎng)吞吐量,可適用于下一代核心網(wǎng)400G和800G基礎(chǔ)設(shè)施,支持多速率、多標(biāo)準(zhǔn);支持1.8Tb/s現(xiàn)有的Interlaken協(xié)議下的芯片間的互聯(lián)通信;支持1.6TB/s加密線路速率吞吐量(擁有硬化的400G加密引擎),并支持 AES-GCM-256/128、MACsec 和 IPsec 。

Versal Premium系列是全球邏輯密度最高的7nm可編程邏輯平臺(tái),支持硬件差異化、標(biāo)準(zhǔn)演進(jìn)以及AI/ML。為開(kāi)發(fā)者提供了很大的差異化設(shè)計(jì)且與未來(lái)兼容:如帶內(nèi)網(wǎng)絡(luò)遙測(cè)、vRAN,且適應(yīng)各種標(biāo)準(zhǔn)與協(xié)議;擁有網(wǎng)絡(luò)異常檢測(cè)AI:支持入侵檢測(cè)、惡意軟件識(shí)別,應(yīng)對(duì)新興威脅的自適應(yīng)AI算法,賽靈思隨機(jī)森林算法IP;配置與網(wǎng)絡(luò)性能AI:自動(dòng)檢測(cè)與性能瓶頸糾正,自動(dòng)配置,最大限度延長(zhǎng)正常運(yùn)行時(shí)間。

根據(jù)賽靈思提供的數(shù)據(jù)顯示,Versal Premium系列擁有業(yè)界領(lǐng)先的多太比特吞吐量,相比賽靈思Virtex UltraScale+(VU13P)提升了5倍以上。

在能效方面,Versal Premium系列可以低于100瓦的功耗提供單芯片800G DCI(數(shù)據(jù)中心互聯(lián))吞吐量,與前代的Virtex UltraScale+相比,功耗降低了60%。在數(shù)據(jù)中心的應(yīng)用當(dāng)中,Versal Premium與前代的FPGA相比,可以提供2倍的帶寬密度,這也意味著,在帶寬相同的情況下,Versal Premium的機(jī)柜空間占用只有前代FPGA的一半。

與此同時(shí),Versal Premium系列還支持以嵌入式方式將預(yù)制連接與硬核集成到現(xiàn)有云基礎(chǔ)設(shè)施中。從基因組學(xué)、數(shù)據(jù)分析和視頻轉(zhuǎn)碼,到針對(duì)語(yǔ)音和圖像識(shí)別的 AI 推斷,Versal Premium 提供了高度集成的云就緒平臺(tái),為多元化的工作負(fù)載提供突破性能。

具體到AI性能方面,Versal Premium系列在NeatNet50(224 x 224)圖像分類模型下的性能是英偉達(dá)Tesla V100的1.6倍,是英偉達(dá)Tesla T4的2.3倍;在Yolov2(608×608)對(duì)象檢測(cè)模型下,性能分別是英偉達(dá)V100和T4的4.6倍和7.7倍;在異常檢測(cè)AI方面(隨機(jī)森林算法),性能是英特爾Xeon的65倍。

另外,存儲(chǔ)器也是計(jì)算加速的一個(gè)重要瓶頸。Versal Premium系列不僅擁有1Gb的緊密耦合的存儲(chǔ)器,可以改善性能,降低功耗和延時(shí),同時(shí)內(nèi)部還集成了LUTRAM、塊RAM、UltraRAM,以及高速片上網(wǎng)絡(luò)、硬化的內(nèi)存控制器,可以提供高達(dá)123TB/s的片上存儲(chǔ)器帶寬,分別是英偉達(dá)Tesla V100和T4 GPU的9倍和25倍。而將超過(guò)123TB/s 的片上存儲(chǔ)器帶寬與可定制存儲(chǔ)器層級(jí)相結(jié)合,能夠減少數(shù)據(jù)移動(dòng)從而消除相應(yīng)的關(guān)鍵瓶頸。

賽靈思表示,Versal Premium ACAP解鎖了GPU無(wú)法企及的性能。

產(chǎn)品與供貨

賽靈思Versal Premium系列提供了7款產(chǎn)品,系統(tǒng)邏輯單元從最小160萬(wàn)個(gè)到最高740萬(wàn)個(gè);自適應(yīng)引擎LUT數(shù)量從最低72萬(wàn)個(gè)到最高340萬(wàn)個(gè)。

據(jù)介紹,Versal Premium 系列將于 2021 年上半年開(kāi)始為早期用戶提供樣品。目前已提供文檔,客戶可立即使用 Versal Prime 評(píng)估套件開(kāi)始原型設(shè)計(jì)。Versal Prime 器件與 Versal Premium 器件擁有眾多相同的架構(gòu)模塊,支持引腳遷移至 Versal Premium。

責(zé)任編輯:wv

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1624

    文章

    21539

    瀏覽量

    600501
  • 賽靈思
    +關(guān)注

    關(guān)注

    32

    文章

    1794

    瀏覽量

    131081
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    TMS320VC5510 HPI吞吐量和優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《TMS320VC5510 HPI吞吐量和優(yōu)化.pdf》資料免費(fèi)下載
    發(fā)表于 10-16 09:35 ?0次下載
    TMS320VC5510 HPI<b class='flag-5'>吞吐量</b>和優(yōu)化

    TMS320C6474模塊吞吐量

    電子發(fā)燒友網(wǎng)站提供《TMS320C6474模塊吞吐量.pdf》資料免費(fèi)下載
    發(fā)表于 10-15 13:52 ?0次下載
    TMS320C6474模塊<b class='flag-5'>吞吐量</b>

    TMS320C6474通用總線架構(gòu)(CBA)吞吐量

    電子發(fā)燒友網(wǎng)站提供《TMS320C6474通用總線架構(gòu)(CBA)吞吐量.pdf》資料免費(fèi)下載
    發(fā)表于 10-15 10:29 ?0次下載
    TMS320C6474通用總線架構(gòu)(CBA)<b class='flag-5'>吞吐量</b>

    TMS320DM36x SoC架構(gòu)和吞吐量

    電子發(fā)燒友網(wǎng)站提供《TMS320DM36x SoC架構(gòu)和吞吐量.pdf》資料免費(fèi)下載
    發(fā)表于 10-14 10:51 ?0次下載
    TMS320DM36x SoC架構(gòu)和<b class='flag-5'>吞吐量</b>

    TMS320C6472/TMS320TCI6486的吞吐量應(yīng)用程序報(bào)告

    電子發(fā)燒友網(wǎng)站提供《TMS320C6472/TMS320TCI6486的吞吐量應(yīng)用程序報(bào)告.pdf》資料免費(fèi)下載
    發(fā)表于 10-14 09:27 ?0次下載
    TMS320C6472/TMS320TCI6486的<b class='flag-5'>吞吐量</b>應(yīng)用程序報(bào)告

    求助,關(guān)于使用iperf測(cè)量mesh節(jié)點(diǎn)吞吐量問(wèn)題求解

    我把esp-mesh-lite的no-route例程和iperf例程合在一起,想測(cè)試兩個(gè)mesh節(jié)點(diǎn)間tcp通信的吞吐量,實(shí)際過(guò)程中一開(kāi)始流量正常,數(shù)秒后客戶端發(fā)數(shù)據(jù)這邊monitor卡死沒(méi)有任何
    發(fā)表于 07-23 06:59

    用Iperf例程測(cè)試ESP32-C6的TCP通信,吞吐量很低的原因?

    為什么我用官網(wǎng)的Iperf例程測(cè)試ESP32-C6的TCP通信,吞吐量才0.33Mbps
    發(fā)表于 06-06 07:47

    FPGA flash操作原理

    FPGA flash操作原理分享
    的頭像 發(fā)表于 04-09 15:03 ?856次閱讀

    如何提高CYBT-243053-02吞吐量

    你好我們一直在使用“EZ-Serial Firmware: v1.4.13.13 Sep 22 2023 10:24:41”測(cè)試“CYBT-243053-02”,我們得到的吞吐量 PUART 高
    發(fā)表于 02-27 06:56

    GD32VW553吞吐量及場(chǎng)景功耗測(cè)試指南應(yīng)用說(shuō)明

    電子發(fā)燒友網(wǎng)站提供《GD32VW553吞吐量及場(chǎng)景功耗測(cè)試指南應(yīng)用說(shuō)明.pdf》資料免費(fèi)下載
    發(fā)表于 12-14 10:20 ?1次下載
    GD32VW553<b class='flag-5'>吞吐量</b>及場(chǎng)景功耗測(cè)試指南應(yīng)用說(shuō)明

    影響ATE電源系統(tǒng)吞吐量的關(guān)鍵因素

    從串行設(shè)備測(cè)試改變?yōu)椴⑿性O(shè)備測(cè)試可以顯著地增加測(cè)試系統(tǒng)吞吐量。測(cè)試執(zhí)行活動(dòng)的大部分可能涉及使用DC電源設(shè)置條件和進(jìn)行測(cè)量。配置測(cè)試系統(tǒng),使其能夠使用多個(gè)直流電源同時(shí)對(duì)多個(gè)設(shè)備執(zhí)行測(cè)試,是顯著提高測(cè)試吞吐量的一種經(jīng)濟(jì)有效的方法。
    發(fā)表于 11-29 12:36 ?321次閱讀
    影響ATE電源系統(tǒng)<b class='flag-5'>吞吐量</b>的關(guān)鍵因素

    如何顯著提高ATE電源吞吐量?

    作為一名測(cè)試工程師,你的工作并不容易。降低成本和提高系統(tǒng)吞吐量的壓力一直存在。本文中,我們將討論影響系統(tǒng)吞吐量的關(guān)鍵因素以及如何降低ATE測(cè)試成本。
    的頭像 發(fā)表于 11-08 14:59 ?628次閱讀
    如何顯著提高ATE電源<b class='flag-5'>吞吐量</b>?

    橙群微電子推出Stellar適用于新一代藍(lán)牙網(wǎng)關(guān)系統(tǒng)的高吞吐量 BLE 模塊

    來(lái)自橙群微電子令人振奮的消息!推出Stellar-適用于新一代藍(lán)牙網(wǎng)關(guān)系統(tǒng)的高吞吐量BLE模塊!應(yīng)對(duì)挑戰(zhàn):傳統(tǒng)BLE網(wǎng)關(guān)通常面臨吞吐量有限、無(wú)法高效掃描大量標(biāo)簽以及大型部署中的可擴(kuò)展性問(wèn)題等挑戰(zhàn)
    的頭像 發(fā)表于 11-03 09:34 ?378次閱讀
    橙群微電子<b class='flag-5'>推出</b>Stellar適用于新一代藍(lán)牙網(wǎng)關(guān)系統(tǒng)的高<b class='flag-5'>吞吐量</b> BLE 模塊

    全志R128 BLE最高吞吐量測(cè)試正確配置測(cè)試方法

    在R128使用前我們需要了解BLE的最高吞吐量,以方便評(píng)估相關(guān)功能的開(kāi)發(fā)。
    的頭像 發(fā)表于 10-27 17:17 ?1188次閱讀
    全志R128 BLE最高<b class='flag-5'>吞吐量</b>測(cè)試正確配置測(cè)試方法

    全志R128 BLE最高吞吐量測(cè)試正確配置測(cè)試

    在R128使用前我們需要了解BLE的最高吞吐量,以方便評(píng)估相關(guān)功能的開(kāi)發(fā)。 首先我們了解一下哪些因素會(huì)影響藍(lán)牙的吞吐量: 1、藍(lán)牙版本與PHY: 藍(lán)牙設(shè)備的版本和物理層(PHY)對(duì)于吞吐量有很大
    發(fā)表于 10-26 16:46