亚洲Av无码一区,国产成人香蕉在线视频网站,年轻漂亮的人妻被公侵犯bd免费版

大家晚上好，非常榮幸參加LiveVideoStack線上公開課。首先自我介紹下，我是查勇，來自華為云，是媒體處理服務(wù)的研發(fā)負責(zé)人。近10年我一直是在從事視頻編解碼產(chǎn)品的開發(fā)和架構(gòu)設(shè)計工作，我本人是非常熱愛媒體處理相關(guān)技術(shù)的研究的。

參與此次公開課分享的目的主要有兩方面，一方面是想通過本次分享，為大家介紹華為云媒體處理服務(wù)在視頻AI轉(zhuǎn)碼領(lǐng)域的一些技術(shù)實踐；另一方面是想與更多專家交流，互相學(xué)習(xí)，以促進下一代視頻轉(zhuǎn)碼技術(shù)的快速發(fā)展，助力行業(yè)實現(xiàn)音視頻體驗升級。

本次分享的主題包括三個部分：首先介紹超高清視頻行業(yè)發(fā)展趨勢，以及這些趨勢為云轉(zhuǎn)碼帶來的機遇和挑戰(zhàn)；其次從技術(shù)層面分析一下，在超高清視頻時代，通過云轉(zhuǎn)碼提升音視頻體驗的一些關(guān)鍵技術(shù)點；最后從華為云媒體處理服務(wù)自身的實踐出發(fā)，詳細介紹一下華為云如何使用AI轉(zhuǎn)碼技術(shù)來打造視頻的超高清體驗，希望能給大家?guī)硪恍┦斋@和啟發(fā)。

01/超高清視頻行業(yè)發(fā)展的趨勢

在大視頻時代，隨著5G、AI以及云技術(shù)的發(fā)展，超高清視頻行業(yè)迎來了一個高速發(fā)展期。我們可以看到，在生產(chǎn)端，4K/8K超高清制播平臺正在加快建設(shè)中，超高清電視的制播模式也在不斷創(chuàng)新，當(dāng)前超高清內(nèi)容的生產(chǎn)能力得到了極大提升。在消費端，隨著芯片技術(shù)的發(fā)展，4K/8K電視和沉浸式終端的逐漸普及，消費端體驗超高清內(nèi)容的媒介也在不斷豐富。

在傳輸環(huán)節(jié)，5G高帶寬、低時延的特點，使得超高清內(nèi)容更容易獲取，互動性場景的體驗也越來越好。在處理環(huán)節(jié)，借助云端的強大算力和AI技術(shù)，我們可以實現(xiàn)超高清內(nèi)容的極致壓縮和畫質(zhì)增強，在提升播放體驗的同時，可以極大地降低分發(fā)和制作的成本。另外借助邊緣云計算的技術(shù)和能力也可以進一步地降低超高清視頻的制作和分發(fā)成本。

在應(yīng)用場景上，我們可以看到超高清視頻也逐步地在向直播、VR、多視角、自由視角等領(lǐng)域發(fā)展，應(yīng)用范圍正在逐步擴展。

總的來說，超高清視頻行業(yè)的基礎(chǔ)設(shè)施正在逐步完善，應(yīng)用場景也在逐步走向成熟。

大家都知道一個產(chǎn)業(yè)的快速發(fā)展，是和生態(tài)建設(shè)的成熟度息息相關(guān)的。下面我們一起看一下超高清視頻產(chǎn)業(yè)在標(biāo)準(zhǔn)生態(tài)建設(shè)以及政策方面的情況。

首先在組織層面，中國已經(jīng)成立了超高清產(chǎn)業(yè)聯(lián)盟。在標(biāo)準(zhǔn)方面，超高清視頻產(chǎn)業(yè)發(fā)展的白皮書和與之關(guān)聯(lián)的軟硬件諸多協(xié)議也都相繼出臺，這些都進一步促進了超高清視頻產(chǎn)業(yè)的健康有序發(fā)展。在政策方面，14省市發(fā)布了超高清視頻產(chǎn)業(yè)發(fā)展的行動計劃，為超高清產(chǎn)業(yè)消費體驗升級，行業(yè)創(chuàng)新提供指導(dǎo)意見。

在生態(tài)和政策的雙重驅(qū)動下，當(dāng)前多地已經(jīng)啟動了超高清項目實驗基地，如成都的超高清基地、青島高清視頻基地、廣州花果山基地以及馬欄山內(nèi)容基地等，超高清產(chǎn)業(yè)實現(xiàn)進一步向縱深發(fā)展。

根據(jù)權(quán)威機構(gòu)預(yù)測，2022年中國超高清視頻產(chǎn)業(yè)總值將達到4萬億元，超高清用戶總數(shù)也將達到2億。我們可以看到，當(dāng)前4K/8K電視已經(jīng)成為電視機廠商的旗艦標(biāo)配，消費者對視頻畫質(zhì)的關(guān)注度也越來越高，HDR、高幀率、寬色域、高色深，這些指標(biāo)都成為終端性能的一個新賣點。

另外隨著芯片技術(shù)的發(fā)展，沉浸式終端的種類也越來越多，消費者越來越追求高逼真、更加接近現(xiàn)實的視頻體驗，我們正面臨一個視頻消費體驗升級的時代。

超高清行業(yè)的高速發(fā)展以及消費體驗的升級，為云端視頻處理也帶來了更多的機會點：一是當(dāng)前超高清內(nèi)容的供給跟不上硬件發(fā)展的速度，為了讓市場上非超高清視頻內(nèi)容帶來超高清的體驗，我們可以使用云端視頻處理的技術(shù)來解決；二是視頻在采集、制作和壓縮環(huán)節(jié)都會引入噪聲或者失真，我們可以借助云端視頻處理的能力來降低引入專業(yè)設(shè)備和人工處理的成本。

但很多時候機遇與挑戰(zhàn)是并存的，通過云端視頻處理來提升音視頻體驗，也面臨著幾方面的挑戰(zhàn)：一方面，市場上存量的視頻內(nèi)容，例如老舊影片和電視劇，局限于當(dāng)時的采集設(shè)備和制作技術(shù)，畫質(zhì)是參差不齊的，涉及畫質(zhì)修復(fù)的種類和場景非常多；另一方面，影響視頻體驗的客觀指標(biāo)非常多，例如低分辨率、噪聲、模糊、低幀率、色彩灰暗、暗亮斑等等，當(dāng)前無法使用單一技術(shù)來完成所有場景的體驗提升，這對技術(shù)的積累要求非常高。

02/云轉(zhuǎn)碼打造視頻超高清體驗的關(guān)鍵技術(shù)點

那么云端視頻處理需要具備哪些關(guān)鍵技術(shù)點來提升視頻的畫質(zhì)呢？要具備超高清視頻的體驗，從一些低質(zhì)量視頻的表現(xiàn)出發(fā)我們可以總結(jié)出影響體驗的一些關(guān)鍵特征，比如低分辨率、噪聲、模糊、劃痕、閃爍、低幀率、色彩灰暗等等。對應(yīng)的我們在云端轉(zhuǎn)碼的系統(tǒng)，就可以針對這些低質(zhì)視頻的特征，使用相應(yīng)的技術(shù)來改善低質(zhì)視頻的畫質(zhì)，主要技術(shù)包括超分、降噪、修復(fù)、插幀、SDR2HDR。

2.1 超分算法

首先來看一下超分，也叫空間分辨率增強。超分本質(zhì)上是指在單位空間內(nèi)生成更多的像素，增大像素的密度，來增強圖像細節(jié)，提高視頻的清晰度。

在深度學(xué)習(xí)網(wǎng)絡(luò)應(yīng)用于超分之前，提升分辨率大多使用傳統(tǒng)的插值算法。如比較常用的雙線性插值，雙三次插值，lanczos插值等算法，我們在轉(zhuǎn)碼系統(tǒng)中經(jīng)常會用到這些算法做下采樣。如上圖（左）是一個雙三次插值的示例，該算法利用的是待采樣點周圍16個點的灰度值做三次差值，再通過選取適當(dāng)?shù)牟逯祷瘮?shù)來擬合數(shù)據(jù)。

從算法的描述上我們能看出，傳統(tǒng)的插值算法一般是要預(yù)定義一個插值基函數(shù)，也叫映射函數(shù)，考慮到計算量，我們的映射函數(shù)一般不會太復(fù)雜，因此傳統(tǒng)算法在這種場景的泛化能力是比較差的。另外因為大多是幀內(nèi)插值，我們插入的值與前后幀是無時間關(guān)聯(lián)性的，與鄰近像素點空間關(guān)聯(lián)性也相對較少，因此效果一般不會太好。

當(dāng)前要追求超分的效果，大家越來越傾向于選擇基于深度學(xué)習(xí)的超分算法。如圖（右）是一個簡單的超分網(wǎng)絡(luò) — SRCNN，大家都很熟悉這個網(wǎng)絡(luò)模型。隨著SRCNN的出現(xiàn)，我們真正地進入到了深度學(xué)習(xí)的超分時代，基本上每年都有一些新的研究方向出現(xiàn)，超分神經(jīng)網(wǎng)絡(luò)也變得越來越強大。相比于傳統(tǒng)的超分算法，基于神經(jīng)網(wǎng)絡(luò)的超分映射函數(shù)是多層非線性且可以學(xué)習(xí)的，插入的值在時間和空間維度能夠關(guān)聯(lián)更多的周邊像素，細節(jié)上的體現(xiàn)更加精確，在超高清領(lǐng)域應(yīng)用也越來越廣泛。

2.2 視頻插幀

除了空間分辨率會影響畫質(zhì)，時間分辨率也就是幀率對人的主觀體驗影響也很大。我們知道現(xiàn)在終端設(shè)備更新?lián)Q代的速度很快，支持的分辨率從480p、720p到1080p，再到現(xiàn)在的4K和8K。同樣的，終端支持的幀率也從25fps到60fps再到120fps甚至更高，高刷新率現(xiàn)在也是終端的一個重要賣點。

除了依賴采集的硬件來提高幀率，目前使用軟件的方法也逐步得到應(yīng)用。大家都體驗過, 在一些劇烈的運動場景下，低幀率會帶來明顯的卡頓感，影響人的視覺感受。視頻插幀算法，就是在原始的視頻幀之間合成不存在的幀來提高畫面的流暢度，簡單來說就是提高幀率。基于插幀算法的研究非常多，例如傳統(tǒng)的基于光流的插幀算法。

傳統(tǒng)算法有什么缺點呢，現(xiàn)實畫面中存在一些大的物體快速運動或者遮擋的場景，基于傳統(tǒng)的光流插幀難以解決這種場景帶來的問題，因此插幀的質(zhì)量在這些場景無法得到改善。想要提升效果的話，我們就回歸到了基于AI的思路上面。

目前AI插幀的思路方法一般都是預(yù)訓(xùn)練生成光流估計模型，算法實現(xiàn)上首先輸入兩幀，計算幀間的光流和提取特征金字塔，然后把warpping之后的圖、特征金字塔和原始圖像一起送入圖像合成網(wǎng)絡(luò)，生成插幀之后的圖像。目前這個方向上相關(guān)的論文也非常多，大家感興趣的可以去研究一下。

2.3 視頻降噪技術(shù)

接下來我們看一下視頻降噪技術(shù)，大家應(yīng)該都體驗過視頻中的噪聲，我們經(jīng)?？吹囊恍├掀械难┗ㄔ肼暫烷W爍噪聲是很明顯的，給人帶來的畫質(zhì)體驗是非常差的。我們知道在視頻采集到送顯的一個完整的周期內(nèi)，涉及到的各個階段都會引入不同種類的噪聲，最終都會反饋到消費環(huán)節(jié)的播放體驗中。正因為噪聲引入的來源是多樣且廣泛的，所以視頻降噪是非常必要的。

通過降噪技術(shù)，我們可以在保持原始信息完整性的同時，又能夠去除無用的一些信息。當(dāng)前各種圖像降噪算法非常多，比如基于空域像素特征去噪和變換域去噪的傳統(tǒng)降噪算法。傳統(tǒng)的降噪算法在降噪的同時往往會丟失圖像的一些細節(jié)或者邊緣信息，而且一般來說我們需要設(shè)置降噪參數(shù)，效果受參數(shù)的影響也比較大，因此在通用場景上難以廣泛應(yīng)用。

另一個快速發(fā)展的方向是基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)降噪算法，算法可以根據(jù)輸入圖像噪聲的級別，自適應(yīng)地調(diào)節(jié)降噪的強度，圖像的細節(jié)或邊緣信息損失也會相對較小，能夠最大程度的保留原始信息。

基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)降噪算法，同樣也有自身的缺點。比如由于訓(xùn)練的素材有限，場景無法全覆蓋，一些場景會超出網(wǎng)絡(luò)的學(xué)習(xí)能力，當(dāng)然這也是采用深度學(xué)習(xí)算法遇到的普遍問題。因為噪聲來源的場景會更廣泛，所以對算法的考驗也更大。

2.4 視頻修復(fù)技術(shù)

視頻修復(fù)分為狹義的修復(fù)和廣義的修復(fù)，狹義的修復(fù)是指針對視頻中存在的一些問題，比如劃痕、暗亮斑、閃爍等問題的針對性修復(fù)。廣義的修復(fù)是在修復(fù)視頻瑕疵的同時，對原視頻做一些增強。廣義的修復(fù)應(yīng)用范圍會更廣一些，主要應(yīng)用在老舊影片、老舊電視劇、一些低質(zhì)的UGC視頻等。

在AI智能修復(fù)老片技術(shù)出現(xiàn)以前，經(jīng)典老片修復(fù)通常是由人工逐幀修復(fù)的，效率低，許多大片修復(fù)的時間以年為單位。如果使用AI的智能修復(fù)技術(shù)框架，就可以基于海量的樣本去訓(xùn)練和自動學(xué)習(xí)，可以大幅的提升老片修復(fù)的質(zhì)量和效率。人工無法做到的修復(fù)效果，借助當(dāng)前的AI技術(shù)都可以輕松完成。

盡管目前可以使用AI技術(shù)修復(fù)老片，但修復(fù)經(jīng)典老片仍然不是一件容易的事情，最大的難度是在保留老片的藝術(shù)風(fēng)格和美感的同時還要處理不同的問題和瑕疵。

2.5 SDR2HDR

另外一個關(guān)鍵技術(shù)點，我們看一下近幾年發(fā)展較快的一項技術(shù)，SDR 2HDR 。HDR由于其相比SDR具有更高的亮度范圍、更廣的色彩范圍和更深的位深而被大家所熟知，對應(yīng)帶來的是視頻具有更豐富的細節(jié)，更寬廣的色域和更自然的色彩過渡。我們可以看到上圖中SDR和HDR的對比，在亮度、色彩飽和度以及對比度上，能明顯地感受到HDR的圖片帶來的視覺效果更好一些。另外，當(dāng)前HDR領(lǐng)域也出現(xiàn)了不同的標(biāo)準(zhǔn)，從圖表中可以看到這些標(biāo)準(zhǔn)在不同維度的差異。

03/華為云在視頻AI轉(zhuǎn)碼領(lǐng)域的技術(shù)實踐

下面我們一起來看一下，在超高清視頻時代，華為云是如何使用AI技術(shù)來提升視頻畫質(zhì)并改善播放體驗的。

針對視頻體驗提升，華為云推出了智享超清技術(shù)，它是一套完整的視頻增強和修復(fù)的解決方案，主要的技術(shù)包括我們上文提到的超分、倍幀，SDR2HDR、HDRVivid、2D轉(zhuǎn)3D以及畫質(zhì)修復(fù)等。華為云智享超清技術(shù)是完全基于華為自研AI算法，采用多任務(wù)AI增強方式，通過智能修復(fù)和智能增強技術(shù)來打造視頻的超高清體驗，能夠更好地服務(wù)直播、點播和互動文娛等場景。

3.1 華為云智享超清技術(shù)總體架構(gòu)

上圖是華為云智享超清技術(shù)的總體架構(gòu)：基于AI Deep Learning的一個多任務(wù)畫質(zhì)增強。前面講到單一任務(wù)是很難解決畫質(zhì)的所有問題的，我們綜合分析后采用了圖中的pipeline架構(gòu)，每一個增強模塊相當(dāng)于一個算法插件，可以自由組合，使用起來也相對靈活。在處理之前我們會做一些基本的預(yù)分析，比如說噪聲強度分析、畫面亮度分析、ROI區(qū)域檢測等等，這些分析結(jié)果會用于指導(dǎo)后續(xù)模塊的智能化處理。

從圖中可以看出，畫質(zhì)增強的整體解決方案主要包括：基礎(chǔ)層的修復(fù)，時域、空域的清晰度增強，亮度和顏色增強，3D增強等。在實際的處理中也可以做一些選擇性的修復(fù)，選擇性修復(fù)主要包括去劃痕、去亮斑、去閃爍等。在算法設(shè)計上我們會更強調(diào)自適應(yīng)能力，也就是在面對不同場景的畫質(zhì)損失時，視頻增強技術(shù)在盲修復(fù)時要有很強的泛化能力。

在實際應(yīng)用過程中，這些模塊并不都是順序處理的，因為這樣時間花費很大，為了提高效率，我們也會將多個視頻增強的任務(wù)進行聯(lián)合優(yōu)化處理。

3.2 面向混合失真的AI畫質(zhì)修復(fù)

眾所周知，真實的視頻源會包含多種混合失真，比如說噪聲、壓縮失真、模糊等等，并且這些失真程度會差異很大。如果僅考慮分辨率因素，假設(shè)我們對一個視頻進行超分，超分之后可能反而會引起瑕疵的放大，難以帶來顯著的視覺效果改善。

華為云智享超清技術(shù)通過構(gòu)建多任務(wù)的混合失真修復(fù)網(wǎng)絡(luò)，來實現(xiàn)更優(yōu)的主觀效果。我們使用了很多的步驟來模擬失真的視頻，通過多種途徑構(gòu)建生成更多用于畫質(zhì)修復(fù)的樣本，比如加上高斯噪聲，隨機加上一些運動模糊，加上一些彩色噪聲，降采樣來降低分辨率，壓縮時使用很高的壓縮率來產(chǎn)生壓縮噪聲等。構(gòu)建了這樣的一種數(shù)據(jù)集之后，我們通過混合失真的多任務(wù)視頻增強算法，自適應(yīng)地去估計各種失真，這樣就可以增強算法對不同質(zhì)量視頻的泛化能力。

當(dāng)然這里也會面臨許多挑戰(zhàn)，比如在失真估計模塊中如何估計噪聲強度，因為不同圖像的噪聲不同，同一圖像的不同區(qū)域噪聲也不同。我們提出了AI自適應(yīng)的降噪算法，對圖片不同區(qū)域主觀視覺的噪聲差異進行評估。首先會對噪聲明顯區(qū)域進行精準(zhǔn)的定位，然后綜合考慮時域和空域的噪聲強度差異，進行不同區(qū)域的噪聲強度估計。

還有一個很大的挑戰(zhàn)就是噪聲的模擬，上面提到的方法模擬出的噪聲與真實噪聲還是有差異的。我們使用了AI網(wǎng)絡(luò)例如CycleGAN來模擬真實的噪聲，這樣訓(xùn)練后我們就可以在畫面自然度和清晰度等維度實現(xiàn)一個更優(yōu)的主觀效果。

3.3 基于語義特征的視頻超分

我們再來看一下華為基于語義特征的視頻超分技術(shù)。對于畫質(zhì)的空間分辨率增強，我們提出了基于語義特征的視頻超分，即先根據(jù)語義對圖像進行分割，然后分區(qū)域進行處理，最后再對增強后的結(jié)果進行融合。例如針對大部分電影、電視劇中人眼關(guān)注較強的一些區(qū)域，像字幕、人臉、紋理等，基于人眼主觀的特點，使用單獨的算法模塊對這些關(guān)注區(qū)域進行重點處理，確保人眼關(guān)注區(qū)域可以達到比較好的增強效果，從多個局部最優(yōu)解獲得全局最優(yōu)解。

這種基于語義特征的視頻超分，一般可以獲得比盲超分更好的增強效果，因為它們具有較強的先驗，比如字幕增強，字幕和每個字大概是什么樣子是確定的；人臉增強，人臉都包含眼睛、嘴、鼻子、耳朵。我們可以收集很多字幕、紋理的數(shù)據(jù)庫，有了這種先驗，增強的效果會得到很大的提升。

3.4 基于耦合光流網(wǎng)絡(luò)的視頻插幀

大家應(yīng)該都有過這種體驗，普通20fps或者30fps的視頻在手機上看很流暢，一旦放到大屏上，運動被放大，卡頓就會比較明顯，所以我們需要對時域進行增強，提高視頻的幀率。

針對視頻插幀的任務(wù)，華為云提出了一種耦合光流網(wǎng)絡(luò)模型，這種光流網(wǎng)絡(luò)模型可以準(zhǔn)確地估計出前后兩幀之間的光流，在一些困難的場景，比如說小物體快速運動、遮擋等場景，光流估計都比較準(zhǔn)確。如圖是一個例子，左邊是目前比較先進的視頻插幀算法RIFE估計的光流，右邊是華為云自研算法估計的光流。大家可以不關(guān)注這些顏色代表的含義，僅從形狀上來看，可以看出右邊的光流模型估計出的光流會更細膩一些，細節(jié)會更豐富一些。

3.5 基于場景自適應(yīng)的SDR2HDR技術(shù)

大家都清楚從SDR到HDR轉(zhuǎn)換的時候會面臨許多挑戰(zhàn)，比如亮場景和暗場景，我們要使用不同的方案來實現(xiàn)場景的自適應(yīng)，實現(xiàn)最佳的亮度動態(tài)擴展；再比如說SDR中的綠色在轉(zhuǎn)換成HDR時，有時會出現(xiàn)綠色失真的問題；人臉的顏色可能因為背景色導(dǎo)致轉(zhuǎn)換后偏紅，這種情況需要做到色彩擴展的場景自適應(yīng)，在擴展色彩時控制色偏；再比如有些噪聲或者失真，在轉(zhuǎn)換成HDR時被放大了，或者更容易被感知到了，這種情況下，我們就應(yīng)該控制亮度提升導(dǎo)致的噪聲和失真。

華為云SDR2HDR的方案是基于AI技術(shù)來實現(xiàn)場景自適應(yīng)的轉(zhuǎn)換，舉個例子：對于一個待處理的原視頻，首先會進行一個場景識別，分類出比如人臉、風(fēng)景等類別，進行場景分類后，就可以實現(xiàn)自適應(yīng)場景的亮度擴展和自適應(yīng)場景的色彩擴展，對轉(zhuǎn)制過程中各場景的Tone Mapping算法進行優(yōu)化，來抑制8比特擴展到10比特后出現(xiàn)的失真。

在實際應(yīng)用時，我們會對大量轉(zhuǎn)換后的視頻進行主觀評測，會針對不同場景轉(zhuǎn)換后視頻出現(xiàn)的一些問題做針對性調(diào)優(yōu)，這樣做之后，算法當(dāng)前在影視劇和電視劇場景都有非常好的效果。

3.6 基于CUVA HDR標(biāo)準(zhǔn)的場景自適應(yīng)SDR2HDR技術(shù)

上面我們提到的華為云SDR2HDR技術(shù)轉(zhuǎn)換的是HDR10，前面的介紹中也列舉了HDR技術(shù)的不同標(biāo)準(zhǔn)。華為公司作為主要貢獻方深度參與了CUVA HDR技術(shù)標(biāo)準(zhǔn)的制定。HDR10采用的是靜態(tài)的色調(diào)映射，會有顯示設(shè)備兼容性的問題，比如原場景的亮度是1000nit，大于顯示屏500nit的最大亮度值，使用靜態(tài)的映射曲線映射后，視頻在500nit顯示屏上顯示時就容易出現(xiàn)過曝的問題，很多細節(jié)就消失了。

華為云當(dāng)前基于CUVA HDR標(biāo)準(zhǔn)的 SDR2HDR技術(shù)采用的是動態(tài)元數(shù)據(jù)方案，會適應(yīng)不同的亮度屏幕來達到最佳的顯示效果，能夠確保同一內(nèi)容在不同亮度屏上實現(xiàn)最優(yōu)的體驗，避免產(chǎn)生色彩變暗、過曝等問題。我們前面提到的場景自適應(yīng)技術(shù)同樣也適用在CUVA HDR轉(zhuǎn)換中，這種多技術(shù)結(jié)合的方案，能夠帶來更好的設(shè)備兼容性和場景適應(yīng)性。

04/總結(jié)

以上就是華為云媒體處理服務(wù)打造視頻超高清體驗的幾個關(guān)鍵技術(shù)。影響視頻體驗的指標(biāo)是很多的，但提升體驗的方向是基本明確的，雖然這里面有很多的困難和技術(shù)層面的挑戰(zhàn)，但相信我們技術(shù)人能夠直面挑戰(zhàn)，用技術(shù)上的創(chuàng)新給用戶帶來極致的體驗。超高清視頻的時代已然到來，要打造極致的體驗，云上技術(shù)創(chuàng)新只是其中重要的一環(huán)，唯有端管云協(xié)同服務(wù)、協(xié)同創(chuàng)新，才能給消費者帶來更真實的視頻感官享受。

本次分享全部內(nèi)容到此結(jié)束，謝謝大家。

Q&A

Q：HDRVivid標(biāo)準(zhǔn)的優(yōu)勢和前景在哪里？

HDR Vivid標(biāo)準(zhǔn)，是在現(xiàn)有HDR基礎(chǔ)上，通過增加動態(tài)元數(shù)據(jù)，為不同亮度顯示終端提供更加準(zhǔn)確的動態(tài)范圍映射方式，可以最大限度地還原HDR內(nèi)容原有藝術(shù)效果。因為采用的是動態(tài)元數(shù)據(jù)的方案，就可以有效解決SDR轉(zhuǎn)換成HDR后，在不同終端上顯示可能帶來的一些問題，比如暗場景產(chǎn)生色彩過暗，亮場景產(chǎn)生過曝的問題。HDR Vivid標(biāo)準(zhǔn)的呈現(xiàn)效果明顯優(yōu)于國際主流的靜態(tài)元數(shù)據(jù)HDR方案，在亮度適配和終端兼容性方面表現(xiàn)尤為出色。作為中國超高清視頻產(chǎn)業(yè)聯(lián)盟（CUVA）發(fā)布的中國首個高動態(tài)范圍視頻標(biāo)準(zhǔn)，提供了端到端媒體系統(tǒng)標(biāo)準(zhǔn)，并且采取了友好的知識產(chǎn)權(quán)政策，更容易推廣和產(chǎn)業(yè)化部署。

Q：在視頻增強和修復(fù)這塊，有沒有遇到一些比較有挑戰(zhàn)的點，具體是怎么解決的？

采用AI的技術(shù)遇到的問題和挑戰(zhàn)有時候會比傳統(tǒng)的算法更多，在視頻增強和修復(fù)這塊，最大的難題是如何做到場景自適應(yīng)。今天我們講解中提到最多的也是場景自適應(yīng)的技術(shù)，我們講神經(jīng)網(wǎng)絡(luò)的泛化能力，要做到全場景覆蓋是很難的。受限于訓(xùn)練數(shù)據(jù)總有一些場景效果是不滿足的，依賴我們對特殊場景做針對性的優(yōu)化。

Q：視頻插幀，1080p分辨率視頻，速度怎么樣？

華為云的視頻插幀算法也在不斷地做性能優(yōu)化，目前視頻插幀結(jié)合超分已經(jīng)在1080p分辨率視頻實現(xiàn)商用，端到端性能還是可以滿足客戶訴求的。針對這些AI增強算法我們使用了GPU加速，對于不同的算法我們也會通過調(diào)整或者簡化模型結(jié)構(gòu)來降低算法復(fù)雜度。

Q：華為云官網(wǎng)哪個服務(wù)開放了智享超清能力，可以試用嗎?

華為云媒體處理服務(wù)官網(wǎng)有智享超清能力的介紹和效果示例的，大家可以上我們的官網(wǎng)去看一下。智享超清只是我們云轉(zhuǎn)碼其中的一個子能力，我們?nèi)A為云媒體處理服務(wù)對外開放了豐富的媒體處理能力，比如標(biāo)準(zhǔn)轉(zhuǎn)碼、高清低碼、截圖、水印、加密等等。

Q：基于光流的插幀算法目前咱們有哪些應(yīng)用嗎？實際效果如何？

基于光流的插幀算法，目前我們已經(jīng)應(yīng)用到超高清轉(zhuǎn)制場景了，華為云媒體處理服務(wù)的智享超清特性里面就包含了基于AI的插幀能力，對于30fps及以內(nèi)的普通幀率高清影片，可以生成60fps甚至120fps的高幀率視頻，讓普通影片在大屏上也能流暢播放。大家手機上如果有華為視頻APP，可以觀看AiMax專區(qū)的影片，在大屏上播放效果特別好。

Q：請問下，F(xiàn)Fmpeg本身也有一些視頻修復(fù)算法，華為云使用了FFmpeg的AI修復(fù)算法嗎?

FFmpeg基于AI框架的能力，比如超分、去雨等，給了我們基于FFmpeg的框架如何去集成深度學(xué)習(xí)算法的一個指導(dǎo)，主要是一個技術(shù)牽引，這些FFmpeg開放出來的示例距離商用還是有一定的GAP的。我們有專業(yè)的AI算法團隊，可以在技術(shù)上做持續(xù)的積累。

Q：AR視頻源比如高清4K、8K，對這些高分辨率素材處理有什么加速建議嗎?

針對4K、8K的超高清片源，首先在編解碼上使用CPU已經(jīng)有了一定的性能瓶頸，我們會使用硬件編碼卡來做加速；其次在AI增強上，我們會使用GPU來加速，但不是所有的算法都使用GPU，其中一部分也使用了 CPU的能力，比如說噪聲強度檢測、亮度檢測等模塊，因為其本身對性能消耗是不大的，我們就可以基于CPU去處理。對于算法是基于CPU還是GPU處理，可以根據(jù)算法的復(fù)雜度來決定。

Q：華為云的轉(zhuǎn)碼耗時比現(xiàn)狀是多少，在轉(zhuǎn)多格式的情況下，怎么提升耗時比呢？

目前我們轉(zhuǎn)碼分為標(biāo)準(zhǔn)轉(zhuǎn)碼和高清低碼，在標(biāo)準(zhǔn)轉(zhuǎn)碼和高清低碼上都是支持一入多出的。

在做長視頻轉(zhuǎn)碼的時候，我們會做并行轉(zhuǎn)碼，先對長視頻進行切片，然后進行分布式并行轉(zhuǎn)碼，最后做轉(zhuǎn)碼后分片的合并。華為云轉(zhuǎn)碼提供的是倍速轉(zhuǎn)碼模式，在長視頻場景下這種切轉(zhuǎn)合的模式都能提供很高的轉(zhuǎn)碼效率。

Q：字幕增強更多是構(gòu)造字幕數(shù)據(jù)集嗎？模型上有沒有針對文字進行特殊的設(shè)計？

字幕數(shù)據(jù)集達到一定的覆蓋即可，也不是越多效果就會越好。我們會利用華為已經(jīng)獲得版權(quán)的一些電視劇和電影中的實際字幕文本來做訓(xùn)練集。因為字幕中的文字本身具有一定的先驗，而且文字結(jié)構(gòu)信息強，我們在模型上會針對文字結(jié)構(gòu)和loss函數(shù)進行針對性的設(shè)計。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

視頻

視頻

+關(guān)注

關(guān)注
6

文章
1925

瀏覽量
72719
AI

AI

+關(guān)注

關(guān)注
87

文章
29393

瀏覽量
267688
華為云

華為云

+關(guān)注

關(guān)注
3

文章
2387

瀏覽量
17205

原文標(biāo)題：査勇：華為云在視頻AI轉(zhuǎn)碼領(lǐng)域的技術(shù)實踐

文章出處：【微信號：livevideostack，微信公眾號：LiveVideoStack】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

華為云徐峰：AI 賦能應(yīng)用現(xiàn)代化，加速軟件生產(chǎn)力躍升

，分享了智能化應(yīng)用的行業(yè)實踐，并發(fā)布了華為云在應(yīng)用開發(fā)、運行、運維、集成領(lǐng)域的智能化新產(chǎn)品能力。在

發(fā)表于 10-14 09:45 ?239次閱讀

華為云：構(gòu)建AI原生思維，共贏智能未來

在第九屆華為全聯(lián)接大會(HUAWEI CONNECT 2024)上，華為常務(wù)董事、華為云CEO張平安圍繞"

發(fā)表于 09-26 11:47 ?213次閱讀

開啟全新AI時代智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

操作系統(tǒng)標(biāo)準(zhǔn)化的最新進展。華為計算產(chǎn)業(yè)戰(zhàn)略規(guī)劃總監(jiān)周明耀在論壇上做了“華為在AI軟硬件上積累及生態(tài)戰(zhàn)略”專題報告。周明耀介紹

發(fā)表于 08-30 17:24

華為云昇騰AI云服務(wù)可適配100多個大模型

在近日舉辦的華為開發(fā)者大會2024上，華為常務(wù)董事、華為云CEO張平安向全球開發(fā)者們宣布了一項重大進展——

發(fā)表于 06-24 10:49 ?616次閱讀

華為HDC 2024看點華為云盤古大模型5.0正式發(fā)布

、建筑設(shè)計、具身智能、媒體生產(chǎn)和應(yīng)用、高鐵、鋼鐵、氣象等領(lǐng)域的豐富創(chuàng)新應(yīng)用和落地實踐，持續(xù)深入行業(yè)解難題。此外，華為諾亞方舟實驗室主任姚駿、華為云

發(fā)表于 06-23 11:41 ?1200次閱讀

中國電信研究院發(fā)布業(yè)界首個RISC-V視頻轉(zhuǎn)碼卡TeleVPU

中國電信研究院于5月25日的2024智算云生態(tài)大會?智算云論壇中推出全球首款RISC-V視頻轉(zhuǎn)碼卡TeleVPU。

發(fā)表于 05-31 10:45 ?816次閱讀

阿里云視頻生成技術(shù)創(chuàng)新！視頻生成使用了哪些AI技術(shù)和算法

照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領(lǐng)域的創(chuàng)新 ? EMO（Emote Portrait Alive）是一個由阿里巴

發(fā)表于 05-08 00:07 ?3259次閱讀

廣東電信攜手華為斬獲“2023年度SDN、NFV、網(wǎng)絡(luò)AI最佳實踐案例”

在北京舉辦的2024年云網(wǎng)智聯(lián)大會上，廣東電信與華為聯(lián)手打造的《基于數(shù)字孿生技術(shù)打造云網(wǎng)預(yù)知系統(tǒng)實現(xiàn)網(wǎng)絡(luò)配置變更在線仿真與精準(zhǔn)評估》項目，一

發(fā)表于 04-14 10:23 ?709次閱讀

廣東移動攜手華為斬獲“2023年度SDN、NFV、網(wǎng)絡(luò)AI最佳實踐案例”

4月10日，在北京舉辦的2024年云網(wǎng)智聯(lián)大會上，廣東移動攜手華為共同申報的《基于通信大模型的IP網(wǎng)絡(luò)運維“數(shù)字專家”創(chuàng)新實踐》項目，斬獲SNAI“2023年度SDN、NFV、網(wǎng)絡(luò)

發(fā)表于 04-11 09:03 ?512次閱讀

華為云在人形機器人領(lǐng)域展開合作

華為云與人形機器人領(lǐng)域的創(chuàng)新企業(yè)樂聚機器人近日達成合作，共同致力于探索“華為盤古大模型+夸父人形機器人”的全新應(yīng)用場景。這是華為

發(fā)表于 03-25 10:49 ?526次閱讀

關(guān)于轉(zhuǎn)碼系統(tǒng)優(yōu)化原理與實踐

我們從轉(zhuǎn)碼系統(tǒng)切入。轉(zhuǎn)碼主要有三個目的：提高碼流的兼容性、改善畫質(zhì)和降碼率省帶寬。今天主要探討降低碼率相關(guān)的原理和實踐，因為帶寬成本是視頻公司最沉重的負擔(dān)之一。

發(fā)表于 01-16 10:11 ?564次閱讀

中軟國際精彩亮相泰國華為云AI峰會，成為泰國AI云智社區(qū)初創(chuàng)伙伴

技術(shù)發(fā)展，成為區(qū)域的AI中心樞紐。中軟國際作為華為云出海戰(zhàn)略伙伴受邀出席本次AI峰會，全面展示中軟國際在

發(fā)表于 12-20 20:25 ?511次閱讀

引領(lǐng)AI未來 | 軟通動力攜手華為云聯(lián)合成立泰國AI云智社區(qū)

12月18日，以“引領(lǐng)AI未來”為主題的華為云泰國首屆AI主題峰會在曼谷舉行，政企客戶、本地伙伴、中資伙伴、開發(fā)者等千人參會，圍繞“AI f

發(fā)表于 12-20 09:45 ?353次閱讀

華為云發(fā)布三大基礎(chǔ)方案和AI出海計劃加速大模型生態(tài)發(fā)展

今天，以“開放同飛，共贏行業(yè)AI新時代”為主題的華為云盤古大模型主題論壇·深圳站成功舉辦。華為云與多位不同行業(yè)的客戶和伙伴圍繞

發(fā)表于 11-23 11:25 ?452次閱讀

全域 Serverless+AI，華為云加速大模型應(yīng)用開發(fā)

日前，華為全聯(lián)接大會 2023 在上海召開。華為云 CTO 張宇昕在大會上發(fā)布了基于 Serverless 技術(shù)的大模型應(yīng)用開發(fā)框架，框架以

發(fā)表于 10-25 21:30 ?376次閱讀