0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大串流時代,VPU的優(yōu)先級甚至高過GPU

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚 ? 2024-05-24 00:16 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚)無論是長視頻串流平臺,還是短視頻社交媒體,每日龐大的視頻上傳數(shù)據(jù)和訪問量都對其背后的硬件平臺提出了極高的要求,比如網(wǎng)絡(luò)帶寬、時延、視頻處理等,為了進(jìn)一步優(yōu)化成本,硬件的選擇成了一大難題。比如在視頻編解碼上,面臨效率較低的CPU軟件轉(zhuǎn)碼和成本較高的GPU硬件轉(zhuǎn)碼,不少公司決心改用更具性價比的VPU。

為什么我們需要VPU?

對于視頻流媒體網(wǎng)站而言,高效的編碼可以在有效節(jié)省帶寬成本的同時,保證視頻質(zhì)量不變,諸如H265、VP9和AV1等。然而,依賴軟件編碼雖然能夠帶來極高的畫面質(zhì)量,但對硬件占用和配置要求高,使得編碼效率極低,遠(yuǎn)不如FPGA、GPU之類的硬件加速。而基于ASIC的VPU,則進(jìn)一步提高了編碼效率,在成本上也要低于FPGA、GPU等硬件。無論是租用服務(wù)器還是采用本地服務(wù)器,都能使性價比成倍增長。

除了視頻串流之外,VPU在另一個云端應(yīng)用場景中同樣起到了至關(guān)重要的作用,那就是云游戲。對于云游戲而言,服務(wù)器內(nèi)部的GPU和CPU已經(jīng)貢獻(xiàn)出了一部分算力用于游戲的運行和圖形處理,如果再加上視頻編碼的工作,無疑會進(jìn)一步加重負(fù)載,這也就意味著同規(guī)格硬件的并發(fā)數(shù)會進(jìn)一步降低。這樣的改變反映到租用服務(wù)器的游戲廠商上,就等效于支持單個用戶的成本降低。

坐擁全球最大視頻網(wǎng)站,谷歌選擇了自研VPU

要論播放量、規(guī)模、地區(qū)覆蓋以及視頻質(zhì)量,排名第一的視頻網(wǎng)站自然是谷歌的Youtube。每分鐘500小時以上的視頻上傳量,超過19億的月活躍用戶,讓其成為獨一檔的視頻串流與分享平臺。然而,在各大視頻網(wǎng)站中,谷歌在圖像質(zhì)量上依然有著絕對的優(yōu)勢,這一方面歸功于谷歌的網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè),另一方面也與其自研的VPU脫不了干系。

從2015年起谷歌就開始研究獨立的視頻處理單元,從而用到更加高效的編碼,比如VP9。2021年,谷歌發(fā)布了首個自研的視頻處理單元,谷歌將其稱為Argos VCU。這個谷歌自研的ASIC芯片,對最高4K60fps的H.264和VP9編碼提供了完整的支持,同時支持單/多輸出轉(zhuǎn)碼、速度/質(zhì)量微調(diào)等。

wKgZomZPF-iAHLtLABQn0twAveY694.png
谷歌VPU / 谷歌

谷歌聲稱,相比在傳統(tǒng)服務(wù)器上使用經(jīng)過優(yōu)化的軟件轉(zhuǎn)碼方案,VCU給他們帶來了20到33倍的計算效率提升。與此同時,與谷歌的TPU一樣,谷歌已經(jīng)準(zhǔn)備好了硬件迭代的方案,比如增加對AV1編碼的支持、進(jìn)一步提高負(fù)載等。

第三方ASIC VPU,智能化成為趨勢

有了谷歌的前車之鑒,不少廠商都開始打起了VPU的主意,這也包括了不少第三方VPU設(shè)計廠商。以NETINT為例,他們推出了Codensity G5這一ASIC芯片,單芯片可以支持32個1080p30、8個4kp30和2個8kp30視頻流的實時編碼,時延僅有8ms。Codensity G5既支持H.264、HEVC、AV1的編碼,也支持H.264、HEVC和VP9等格式的解碼。

與此同時,基于Codensity G5打造的VPU模組還具備18TOPS的AI算力,可以用于視頻分析之類的AI從處理器,比如背景去除、畫面加強、面部檢測和物體檢測等。Codensity G5也可與不同架構(gòu)的CPU混合使用,比如x86的AMD EPYC處理器、Arm的Amepre Altra Max處理器等等。

wKgZomZPF_aAAWQMAAQCySQEh7g545.png
Alveo MA35D / AMD


除此之外,還有曾經(jīng)以FPGA媒體加速卡方案聞名的AMD/Xilinx,其Alveo U30就是一款混合了ASIC和FPGA設(shè)計的處理器。但從去年發(fā)布的Alveo MA35D媒體加速卡開始,就成了不折不扣的ASIC VPU方案。相比上一代Alveo U30,Alveo MA35D實現(xiàn)了4倍的通道密度和1.8倍的壓縮效率,編解碼除了支持主流格式外,也新增了AV1的編碼和VP9、AV1的解碼。同樣是4Kp60的視頻,相較于U30的32ms轉(zhuǎn)碼時延,MA35D也能做到與Codensity G5一樣的8ms。

寫在最后

對于多數(shù)視頻平臺而言,有關(guān)視頻處理類的工作也不僅僅是依賴VPU等硬件,還有一整套預(yù)處理管線等。但隨著視頻在社交媒體內(nèi)的占比越來越高,VPU能夠帶來的成本、部署時間優(yōu)勢將越來越明顯,尤其在帶寬費用寸土寸金的國內(nèi)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4639

    瀏覽量

    128468
  • vpu
    vpu
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    11752
收藏 人收藏

    評論

    相關(guān)推薦

    freertos中斷優(yōu)先級在哪設(shè)置

    FreeRTOS是一個流行的實時操作系統(tǒng),它廣泛應(yīng)用于嵌入式系統(tǒng)開發(fā)。在FreeRTOS中,中斷優(yōu)先級是一個重要的概念,因為它決定了中斷處理的順序和響應(yīng)時間。 1. 理解中斷優(yōu)先級 在討論如何設(shè)置
    的頭像 發(fā)表于 09-02 14:17 ?410次閱讀

    APS智能優(yōu)化排產(chǎn)軟件的優(yōu)先級應(yīng)用

    資源、訂單需求和約束條件,自動計算出最優(yōu)的生產(chǎn)計劃。在這個過程中,訂單排產(chǎn)的優(yōu)先規(guī)則起著至關(guān)重要的作用。1.交期優(yōu)先級交期優(yōu)先級是訂單排產(chǎn)中最基本的優(yōu)先規(guī)則。根據(jù)
    的頭像 發(fā)表于 06-26 17:43 ?286次閱讀
    APS智能優(yōu)化排產(chǎn)軟件的<b class='flag-5'>優(yōu)先級</b>應(yīng)用

    請問有什么方法降低WIFI中斷的優(yōu)先級?

    因為項目對時序輸出要求比較嚴(yán)格,WIFI中斷優(yōu)先級比硬件定時器中斷優(yōu)先級要高,在定時器中斷里面對GPIO管腳控制被延長執(zhí)行,請問有什么方法降低WIFI中斷的優(yōu)先級?
    發(fā)表于 06-19 07:37

    systick的中斷優(yōu)先級是否應(yīng)該設(shè)置為最高優(yōu)先級的嵌套中斷?

    最近在學(xué)習(xí)ucosii有這樣一個疑問,關(guān)于stm32的systick作為ucosii的基準(zhǔn)時鐘,systick的中斷優(yōu)先級是否應(yīng)該設(shè)置為最高優(yōu)先級的嵌套中斷。理由是什么?各位大俠求指教?。?!
    發(fā)表于 05-16 06:44

    創(chuàng)建了兩個task如果一個優(yōu)先級高 一個優(yōu)先級低,高優(yōu)先級的那個一直在做,什么時候會調(diào)度到低優(yōu)先級的呢?

    創(chuàng)建了兩個task如果一個優(yōu)先級高一個優(yōu)先級低, 我看到任務(wù)的函數(shù)都是用死循環(huán)做的,那個高優(yōu)先級的那個一直在做,什么時候會調(diào)度到低優(yōu)先級的呢?
    發(fā)表于 05-13 07:13

    STM32F103的寄存器NVIC_IPRx搶占優(yōu)先級和子優(yōu)先級是怎么設(shè)置的?

    STM32F103的寄存器NVIC_IPRx有些不明白,搶占優(yōu)先級和子優(yōu)先級是怎么設(shè)置的? 如果,中斷分組2,搶占優(yōu)先級3,子優(yōu)先級3 那下面這樣寫對嗎? SCB->AIR
    發(fā)表于 03-27 07:48

    Hightec對芯片中斷優(yōu)先級分配時,中斷號越高中斷優(yōu)先級越高嗎?

    請問大佬,Hightec對芯片中斷優(yōu)先級分配時,中斷號越高中斷優(yōu)先級越高嗎?看網(wǎng)上的帖子說中斷號越低優(yōu)先級越高。
    發(fā)表于 02-27 06:13

    RTTnano的用戶main函數(shù)中的優(yōu)先級是多少?

    RTTnano 的用戶main函數(shù)中的優(yōu)先級是多少?為什么會出現(xiàn)創(chuàng)建新的task之后,main函數(shù)會搶占掉低優(yōu)先級的task,例如RT_THREAD_PRIORITY_MAX設(shè)置為8 ,低于3
    發(fā)表于 02-26 08:01

    華為和思科默認(rèn)路由優(yōu)先級

    優(yōu)先級值不同,則優(yōu)先級值最小的為最優(yōu)路由(無論開銷值是否相同,另一種理解就是對不同路由來源或路由協(xié)議之間的比較)。
    的頭像 發(fā)表于 01-11 10:47 ?992次閱讀

    GD32如何配置中斷優(yōu)先級分組以及中斷優(yōu)先級

    使用GD32 MCU的過程中,大家可能會有以下疑問:中斷優(yōu)先級如何配置和使用?
    的頭像 發(fā)表于 01-10 10:30 ?2778次閱讀
    GD32如何配置中斷<b class='flag-5'>優(yōu)先級</b>分組以及中斷<b class='flag-5'>優(yōu)先級</b>

    python中運算符的優(yōu)先級大小

    Python中運算符的優(yōu)先級決定了表達(dá)式中各個運算符的計算順序。了解運算符的優(yōu)先級對于正確理解和編寫復(fù)雜的表達(dá)式非常重要。本文將詳細(xì)介紹Python中運算符的優(yōu)先級,并給出一些示例來幫助讀者更好地理
    的頭像 發(fā)表于 11-29 16:21 ?2629次閱讀

    python運算符優(yōu)先級順序口訣

    Python是一種非常流行的編程語言,具有廣泛的應(yīng)用領(lǐng)域。在Python中,運算符是進(jìn)行各種數(shù)學(xué)和邏輯運算的關(guān)鍵部分。了解運算符的優(yōu)先級順序?qū)τ谡_理解和書寫Python代碼至關(guān)重要。在本文中,我們
    的頭像 發(fā)表于 11-22 14:34 ?1946次閱讀

    單片機的中斷優(yōu)先級是怎么確定的?

    單片機的中斷優(yōu)先級是怎么確定的,如果設(shè)定優(yōu)先級后怎么確定設(shè)定的對不對?
    發(fā)表于 11-03 06:32

    單片機中斷優(yōu)先級應(yīng)用案例

    若單片機同時接收到幾個中斷請求時,單片機對中斷請求的響應(yīng)順序是如何確定的?實際上,單片機是通過中斷優(yōu)先級來確定中斷響應(yīng)順序的。
    發(fā)表于 10-31 14:42 ?1226次閱讀
    單片機中斷<b class='flag-5'>優(yōu)先級</b>應(yīng)用案例

    ucos怎么設(shè)置任務(wù)的優(yōu)先級

    這個優(yōu)先級怎么設(shè)置的
    發(fā)表于 10-30 06:18