0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AR下的RTC技術(shù)與應(yīng)用分享

LiveVideoStack ? 來(lái)源:LiveVideoStack ? 2023-02-16 17:56 ? 次閱讀

01 AR與RTC的應(yīng)用場(chǎng)景

我們先給大家簡(jiǎn)單的介紹一下在AR里我們的應(yīng)用場(chǎng)景有哪些。為什么會(huì)提這些點(diǎn)呢?我們?cè)?020年向國(guó)內(nèi)的客戶(hù)推AR眼鏡的時(shí)候,客戶(hù)是基本上是不太能理解的。因?yàn)槟菚r(shí)大家都不懂這個(gè)東西對(duì)企業(yè)能帶來(lái)什么價(jià)值?但是在國(guó)外,像德國(guó)本身就是工業(yè)起家的,尤其它們自己也在推工業(yè)互聯(lián)網(wǎng)4.0,它們就能夠反過(guò)來(lái)找我們談,找我們要AR眼鏡,這就是在早期時(shí)候的一些差距。到2021年的時(shí)候,國(guó)內(nèi)的客戶(hù)會(huì)主動(dòng)跟我們聊AR眼鏡對(duì)他們的幫助有哪些,因?yàn)榇蠹铱赡芨惺艿搅粟厔?shì),也更愿意去嘗試去了解AR眼鏡的用途。

67f8b020-a878-11ed-bfe3-dac502259ad0.jpg

我就以這一張圖簡(jiǎn)單的給大家說(shuō)一下AR上的應(yīng)用。Rokid是一家專(zhuān)注新一代人機(jī)交互技術(shù)的產(chǎn)品平臺(tái)公司,有自己的OS和云,基于這點(diǎn)我們會(huì)有自己的AR硬件,我們自己會(huì)對(duì)外輸出這些產(chǎn)品,已經(jīng)在淘寶、京東上可以看到的ToC的RokidAir眼鏡;有面向數(shù)字文化(博物館、景區(qū)等)的Rokid Air Pro,也有ToB的RokidGlass和面向重工業(yè)的X-Craft。同樣,我們也與一些硬件廠商合作,它們會(huì)集成我們的系統(tǒng),然后整個(gè)輸出一個(gè)硬件的產(chǎn)品。同時(shí),我們也對(duì)外推出Rokid Solution,包括針對(duì)各行各業(yè)輸出一些解決方案。當(dāng)然,也有其它的客戶(hù)基于我們的硬件跟軟件做第三方。

我們整個(gè)的應(yīng)用場(chǎng)景大概有三塊:一塊是數(shù)字文化相關(guān),展示文物以及教育知識(shí)等應(yīng)有的生動(dòng)形象,讓文物和文化遺產(chǎn)“活”起來(lái);第二塊是工業(yè),包括制造、汽車(chē)等,還有電力等,用AR賦能一線人員提升協(xié)作效率,打造“超級(jí)工人”;還有一塊是B端和G端上的公共服務(wù)等。那么,我們AR在行業(yè)應(yīng)用的一些點(diǎn),哪些是跟我們RTC相關(guān)的呢?我就以公司銷(xiāo)售端對(duì)外播放的一個(gè)視頻向大家展示。

視頻提到了幾個(gè)點(diǎn):

第一個(gè)是高清的音視頻。因?yàn)樵贏R尤其是在B端的應(yīng)用上很多,比如我們的客戶(hù)是在山區(qū)、海上或者是其它的煤礦這種弱網(wǎng)環(huán)境,我們?cè)趺礃幽軌蜃龅礁咔逡粢曨l這是其中一個(gè)點(diǎn);

另外一個(gè)點(diǎn)是面向B端的時(shí)候, 主要就是低碳出行和高效工作;所謂的低碳出行,以前出現(xiàn)什么現(xiàn)場(chǎng)問(wèn)題專(zhuān)家會(huì)立刻趕過(guò)去,現(xiàn)在就是減少飛機(jī)/火車(chē)等交通工具帶來(lái)的排放,線上解決問(wèn)題;至于高效工作,我們會(huì)有遠(yuǎn)程協(xié)作平臺(tái),平臺(tái)會(huì)允許專(zhuān)家端跟現(xiàn)場(chǎng)客戶(hù)以第一視角來(lái)連線,并且它會(huì)根據(jù)你這邊的現(xiàn)狀去做一些指導(dǎo),這個(gè)指導(dǎo)涉及AR的一些標(biāo)注。最右圖中紅色的跟綠色的是2D或3D的數(shù)字模型,是虛擬的數(shù)字內(nèi)容,它會(huì)告訴你這一塊需要怎么做或者一些東西扔過(guò)來(lái)會(huì)顯示在上面。這些數(shù)字的模型會(huì)根據(jù)SLAM的技術(shù),錨定在技師現(xiàn)場(chǎng),它是不會(huì)變的。專(zhuān)家端看到的東西都是現(xiàn)實(shí)世界的內(nèi)容疊加上數(shù)字世界的內(nèi)容,虛擬加上現(xiàn)實(shí)是融合在一起的,專(zhuān)家端可以始終以這個(gè)視角看到。

這里面還包括協(xié)作、共享。比如說(shuō)它遇到什么問(wèn)題隨時(shí)需要跟你說(shuō)明這個(gè)問(wèn)題怎么解開(kāi),從電腦端找任何的圖片、截圖、文字都會(huì)跟你協(xié)作發(fā)送過(guò)來(lái)。

這些都是AR下RTC的應(yīng)用。

680da250-a878-11ed-bfe3-dac502259ad0.jpg

AR下RTC遇到通訊的問(wèn)題:

第一個(gè)就是弱網(wǎng)的環(huán)境。剛才有提到,包括有一些電力的人是帶著頭盔爬桿上去,他的雙手是一直在操作的,而AR頭環(huán)是一直戴在眼睛上的。不管是山區(qū)、弱網(wǎng)還是海上油田等,弱網(wǎng)是最基本改變不了的;

第二個(gè)是嘈雜的環(huán)境,就是經(jīng)常通信起來(lái)專(zhuān)家端聽(tīng)不清,因?yàn)楣S的噪聲特別大。像核電現(xiàn)場(chǎng)的噪聲我們這邊需要做處理,各種化工區(qū)現(xiàn)場(chǎng)制造車(chē)間的嘈雜聲音,這些聲音都是影響我們RTC通信的;

視聽(tīng)的視野是什么意思呢?就是在AR音頻中Audio跟Video是典型不一樣的,Audio Focus有全局感受野,所以在360°的環(huán)境中,聲音是能夠全局捕獲到的,但是因?yàn)閂ideo是純球體360度,沒(méi)法瀏覽出Video的Focus,是需要依賴(lài)Audio的聲音來(lái)進(jìn)行感受野的切換。Audio可能此時(shí)出聲打游戲的時(shí)候有聲音來(lái)了,我可能會(huì)轉(zhuǎn)過(guò)來(lái)。所以這是它們一個(gè)大的不同點(diǎn),這也是我們會(huì)在AR的RTC上會(huì)講到,對(duì)Audio做一些處理的原因;

還有個(gè)是開(kāi)放式的喇叭,就是在AR上我們喇叭的出聲口和speaker是在耳朵上,大概離耳道口有3厘米的距離。其實(shí)這個(gè)距離下,比如說(shuō)本來(lái)弱網(wǎng)就使得聲音很糟糕,再離開(kāi)一點(diǎn)距離基本上就沒(méi)法聽(tīng)到更有效的聲音,所以這是我們現(xiàn)在在AR上做RTC試圖去解決的一些問(wèn)題。

02 AR RTC中的著力點(diǎn)

RTC的著力點(diǎn),是否不同的行業(yè)都需要卷RTC?其實(shí)做RTC的,不管是大廠,包括騰訊、頭條等,其實(shí)大家都做RTC。從我們自己的角度出發(fā),我們要做的不僅僅是RTC本身,那我們要做的點(diǎn)在哪?

68243d30-a878-11ed-bfe3-dac502259ad0.jpg

為什么我們不去講RTC本身,包括我們自己用一些合作伙伴的SDK,他們的SDK已經(jīng)可以做到從A端到B端不管是抖動(dòng)、時(shí)延還是抖動(dòng)本身時(shí)延的方法提升已經(jīng)很大。我們不試圖在這個(gè)基礎(chǔ)上卷網(wǎng)絡(luò)的優(yōu)化,卷一些云端的分發(fā)、鏈路。

683b8a8a-a878-11ed-bfe3-dac502259ad0.jpg

我們做的事就是里面核心的兩塊標(biāo)顏色的。我們從最外層講RTC有RTC的量度或者CDN的量度。一整套已經(jīng)有成熟的產(chǎn)品,靠近里面的不管是網(wǎng)絡(luò)傳輸上的重傳、FEC這些也不需要我們做,再到里面的網(wǎng)絡(luò)抖動(dòng),其優(yōu)化也有很多,像騰訊的SDK針對(duì)它專(zhuān)門(mén)做算法上的優(yōu)化。其實(shí)我們自己focus的點(diǎn)在于音視頻的數(shù)據(jù)最終到了工業(yè)頭盔等產(chǎn)品上還能怎樣進(jìn)行音質(zhì)、畫(huà)質(zhì)上的提升,這就是我們?cè)谧龅囊恍┦?,包括最里面的源泉是語(yǔ)音跟視頻發(fā)生了切切實(shí)實(shí)的數(shù)據(jù)丟失,更長(zhǎng)遠(yuǎn)一點(diǎn)就是在解碼上我們是否能夠做出一些改變,用我們的自己場(chǎng)景做優(yōu)化,這就是我們自己在做的,講RTC實(shí)際上是在收到數(shù)據(jù)之后。

03AR RTC中的技術(shù)應(yīng)用

下面,我從以下四個(gè)方面給大家介紹一下AR里面我們做的RTC的技術(shù)應(yīng)用點(diǎn)。

6852213c-a878-11ed-bfe3-dac502259ad0.jpg

第一塊是語(yǔ)音的降噪,就是我們剛才提到的工廠嘈雜噪聲;第二塊是超分,就是為了把弱網(wǎng)下工人或者技師端看到的一些小畫(huà)面進(jìn)行超分;第三塊涉及音頻的補(bǔ)償,對(duì)于一些確切發(fā)生丟包的數(shù)據(jù),我們會(huì)把它的語(yǔ)音數(shù)據(jù)進(jìn)行算法處理,使得它聽(tīng)起來(lái)會(huì)更順滑;第四塊是空間聲場(chǎng),其實(shí)我們解決的就是剛剛提到的在AR或者是VR里現(xiàn)在已經(jīng)是很現(xiàn)實(shí)的問(wèn)題,打游戲的時(shí)候全依賴(lài)聲音來(lái)切畫(huà)面進(jìn)行一些實(shí)時(shí)的渲染變更,包括編解碼上的處理。

686f3ca4-a878-11ed-bfe3-dac502259ad0.jpg

語(yǔ)音的降噪涉及到的模塊偏技術(shù)。整個(gè)語(yǔ)音降噪就是在于把一個(gè)帶噪的語(yǔ)音x(n)經(jīng)過(guò)一些濾波處理來(lái)得到預(yù)測(cè)的y(n),這個(gè)y(n) 其實(shí)就是預(yù)測(cè)出的干凈語(yǔ)音,通過(guò)和參考的d(n)比較,看差值是否能滿(mǎn)足迭代收斂的條件。從傳統(tǒng)的LMS,再到AP,發(fā)展到如今大家都是在用深度學(xué)習(xí)的方向去做這件事,因?yàn)樗梢葬槍?duì)不同工廠、不同場(chǎng)景下的噪聲做專(zhuān)門(mén)的處理和濾波。我們也是采用深度學(xué)習(xí)上的一些線路。

688e5d46-a878-11ed-bfe3-dac502259ad0.jpg

我們也是基于CRN加上復(fù)數(shù)卷積的方式進(jìn)行處理,包括對(duì)網(wǎng)絡(luò)本身去做一些端上跑,達(dá)到工廠噪聲、核電噪聲等,到最終消噪的目的來(lái)提升通信體驗(yàn)。我們自己在AR眼鏡終端上同時(shí)配合定向波束,加上降噪跟語(yǔ)音識(shí)別技術(shù),最終提升至95db的工業(yè)噪聲下到90+%的語(yǔ)音識(shí)別準(zhǔn)確率。當(dāng)然降噪本身是為了提升RTC,專(zhuān)家端聽(tīng)到的也可以更好。這里面的測(cè)試結(jié)果就是2021年的DNS測(cè)試數(shù)據(jù),外加核電工業(yè)噪聲后得到的PESQ的提升結(jié)果。就是降噪前后以及STOI的數(shù)據(jù)。

68a59146-a878-11ed-bfe3-dac502259ad0.jpg

圓桌會(huì)議是真實(shí)的應(yīng)用場(chǎng)景。我們用客戶(hù)的SDK,但是客戶(hù)的SDK在一些場(chǎng)景下嘯叫跟回聲解決不掉,那些垂直黃線其實(shí)就是噪聲,然后我們把自己的降噪用進(jìn)去,就可以一定程度上消除掉嘯叫。另外一個(gè)就是核電客戶(hù)現(xiàn)場(chǎng)的噪聲,本身聲音是有點(diǎn)吵的,整個(gè)平臺(tái)都是客戶(hù)現(xiàn)場(chǎng)機(jī)器噪聲,聽(tīng)不到語(yǔ)音內(nèi)容的;最后就是很普通的辦公室的這里面的聲音。

其實(shí)深度學(xué)習(xí)解決了傳統(tǒng)解決不了的一個(gè)問(wèn)題,就是傳統(tǒng)的信號(hào)處理只能解決一些平穩(wěn)的噪聲,對(duì)于非平穩(wěn)的“pia pia pia”或者是工廠巨大的機(jī)器噪聲收斂不了或者不停的收斂效果就會(huì)不好。

68b94a1a-a878-11ed-bfe3-dac502259ad0.png

超分是針對(duì)AR頭環(huán)端收到的一些數(shù)據(jù),數(shù)據(jù)本身視頻分辨率只有360P,在山區(qū)等弱網(wǎng)下收到RTC的數(shù)據(jù)后,我們會(huì)再做實(shí)時(shí)的超分。超分本身這件事就是從深度學(xué)習(xí)PixelShuffle后的時(shí)候開(kāi)始,基本上網(wǎng)絡(luò)結(jié)構(gòu)就是呈現(xiàn)到一個(gè)從低分辨率的LR再到HR的過(guò)程。Shuffle本身是視頻超分的一個(gè)恢復(fù)操作,非時(shí)流的經(jīng)歷過(guò)一些發(fā)展路線,大家都是換中間的一些骨架,包括ResBlock、SEBlock等,再到提出實(shí)時(shí)流的框架ECBSR,大家會(huì)基于NAS做實(shí)時(shí)檢索,自己做搜索找一個(gè)更達(dá)到目標(biāo)的東西,別人再?gòu)?a target="_blank">參數(shù)化去做。我們自己也是基于這個(gè)大的框架,只不過(guò)本身卷積Block就會(huì)根據(jù)端上的性能做一些裁剪使得它在端上能夠做到實(shí)時(shí)。

68d81530-a878-11ed-bfe3-dac502259ad0.jpg

除了框架之外,我們會(huì)同時(shí)把CPUGPU放一起,因?yàn)槲覀兊脑O(shè)備上有NPU加速,把這幾個(gè)流水線跑起來(lái)。其實(shí)一次性把很多東西放在GPU上去做,然后有一些東西在服務(wù)端可以直接走TensorRT的處理,在我們端上的話就直接走NPU的。我們會(huì)根據(jù)算法和硬件的性能去設(shè)計(jì)、調(diào)優(yōu)這個(gè)pipeline,我們把很多能在NPU上操作的全部移到4核NPU上,包括利用圖片的解碼,以及解碼的數(shù)據(jù)直接放在CPU上放著。NPU直接去獲取,減少CPU跟區(qū)間的通信,同時(shí)把CPU的資源利用起來(lái)做一些并行處理。

68f408da-a878-11ed-bfe3-dac502259ad0.jpg

圖中是工程加上模型塊達(dá)到的效果,頭盔上面是實(shí)時(shí)的四核的A73加上兩核的A53還有5 TOPS NPU,上面的算法性能就是大家做超分基本數(shù)據(jù)集的PSNR提升。如果我們把整個(gè)模型的input輸入比固定下來(lái)的時(shí)候,NPU的優(yōu)化程度會(huì)更高,它就能從28提升到38。 當(dāng)然,我們也在服務(wù)端的A30單卡上做了測(cè)試,把編解碼都算進(jìn)去大概1170fps,

這個(gè)是我們自己做的一個(gè)測(cè)試集視頻,左邊會(huì)是超分后的,右邊是沒(méi)超分的,一次下雨天測(cè)試錄的。

690bc880-a878-11ed-bfe3-dac502259ad0.jpg

開(kāi)放式的喇叭在弱網(wǎng)下本身聽(tīng)起來(lái)就會(huì)比較吃緊不清楚,如果再發(fā)生丟幀的話效果就會(huì)更差,所以我們針對(duì)這一點(diǎn)專(zhuān)門(mén)做了音頻的補(bǔ)償。當(dāng)然,音頻的補(bǔ)償其實(shí)本身的歷史也是從LPC技術(shù)切換到深度學(xué)習(xí)的方式做。Web RTC其實(shí)也改成用深度學(xué)習(xí)的方式,大家很多都在用GAN的方式去進(jìn)行丟包生成。我們本身的操作就是模擬丟包率在10%到30%之間,整個(gè)丟包時(shí)長(zhǎng)最長(zhǎng)的大概是120毫米之內(nèi),然后驗(yàn)證PESQ的效果。這個(gè)基于的是在DNS挑戰(zhàn)賽的模型上做優(yōu)化。

6920e6de-a878-11ed-bfe3-dac502259ad0.jpg

這里給大家放一下效果。最上面的是丟包處理之前的。第二個(gè)是處理后的聲音頻譜圖。第三個(gè)是最原始的聲音小的。從圖上可以看出來(lái),凡是豎線的就是丟數(shù)據(jù)造成的,凡是一整條豎線從上面畫(huà)下來(lái),修復(fù)之后就會(huì)少很多。圖像識(shí)別跟原始圖像很接近,就說(shuō)明你恢復(fù)的越接近。

69373aa6-a878-11ed-bfe3-dac502259ad0.jpg

剛才有提到AR、VR里Audio Focus是一個(gè)全局感受野。我們?cè)趺礃幽軌虬颜鎸?shí)聲音的方位感給還原出來(lái)?這是我們其中做的一件事,就是空間聲場(chǎng)。這里跟B端剛剛講的3個(gè)不一樣的點(diǎn)在于B端上的那些都是屬于真實(shí)有用的。而C端更偏向于使沉浸感更好。你要說(shuō)沒(méi)有它可不可以?可以。但擁有空間聲場(chǎng)的好處就在于,在真實(shí)RTC通信的時(shí)候,能使得語(yǔ)音到了之后能分清這個(gè)人在我的左邊還是右邊,以及在大概什么位置,把真實(shí)空間位置感還原出來(lái),包括轉(zhuǎn)頭轉(zhuǎn)向誰(shuí)說(shuō)話。轉(zhuǎn)向誰(shuí)說(shuō)話這個(gè)方向的聲音會(huì)大是一樣的。像在線教育、在線會(huì)議,尤其是在線的社交里面應(yīng)用會(huì)比較多一些。

聲音的發(fā)展情況,最開(kāi)始的空間表達(dá)上是單聲道、雙聲道,后來(lái)的5.1、7.1屬于平面上有五個(gè)喇叭加一個(gè)低音炮,再到5.1.x、7.1.x,就是空間布局上也會(huì)加喇叭,但這些還是個(gè)體不連續(xù)的。再發(fā)展到編碼的維度上來(lái)講就是我們從最開(kāi)始單聲道到面向?qū)ο蟮木幋a。比如大家經(jīng)常到電影院看 3D電影,把整個(gè)炮彈或者是其它的戰(zhàn)爭(zhēng)打起來(lái)的時(shí)候東西飛過(guò)來(lái)的聲音,整個(gè)朝你逼近過(guò)來(lái),你會(huì)感覺(jué)很真實(shí),因?yàn)樗前堰@個(gè)對(duì)象,不管是炮彈還是其它武器的發(fā)出的聲音按照空間喇叭的位置跟你以最接近的路線給你播出來(lái),所以你才會(huì)有真實(shí)感。再到后面就是面向場(chǎng)景的,像HOA的技術(shù)就意味著我盡可能地把任何東西都還原,不只是人為處理過(guò)的局部。從XR的角度來(lái)講,其實(shí)我們要做的就是把割裂的感覺(jué),1是1,2是2變成沉浸式的,所以從C端來(lái)講它的效果就是在往這個(gè)方向走。

6949f2e0-a878-11ed-bfe3-dac502259ad0.jpg

我們自己定義空間聲場(chǎng)是從產(chǎn)生再到傳播,整個(gè)傳播過(guò)程中因?yàn)樵贏R、VR里都會(huì)出現(xiàn),聲音出來(lái)之后,大家很多利用頭傳或者是其它方式模擬球體范圍內(nèi)聲音的產(chǎn)生,然后再到球體范圍之外的聲音該以平面波,還是以一維的波動(dòng)方程,還是該以三維的波動(dòng)方程去模擬、仿真的時(shí)候,每個(gè)人需要根據(jù)自己的算力去平衡去簡(jiǎn)化的,同時(shí)需要考慮傳播過(guò)程中涉及到的一些障礙物。我戴著AR眼鏡確實(shí)走到了另一個(gè)地方被一堵墻隔了聲音,要不要遮擋,怎么去遮擋?包括經(jīng)過(guò)那些東西的反射吸收了多少,還剩多少。這些都是去考慮的問(wèn)題,再到編解碼的模塊定義外面的一些全景聲能不能導(dǎo)到你這里進(jìn)行播放。這是對(duì)于模塊的一些定義。

整個(gè)空間聲場(chǎng)的難題在于聲場(chǎng)的仿真。波動(dòng)方程很多都沒(méi)有解析解,只有數(shù)值解,因?yàn)閷?shí)時(shí)計(jì)算出來(lái)的東西沒(méi)有固定的表達(dá)公式能夠所有位置都做到,它只能不停地迭代。包括開(kāi)放式喇叭帶來(lái)的效果,因?yàn)楝F(xiàn)在大家仿真生產(chǎn)的時(shí)候都是按頭傳去做的,先不說(shuō)投傳的精細(xì)度做到什么程度,它仿真出來(lái)的結(jié)果是建立在到你耳道里面的聲音,實(shí)際上AR的喇叭是在外面且還有30厘米,會(huì)導(dǎo)致聲音發(fā)塞很厲害,聽(tīng)出來(lái)的效果會(huì)下降很多。

另外還有一個(gè)就是RTC中的傳輸。在線社交就像麥克,輸出一些在線社交視頻大家純是在元宇宙里面跟你聊,但是你轉(zhuǎn)過(guò)來(lái),轉(zhuǎn)過(guò)去的語(yǔ)音都是可以通過(guò)RTC的方式過(guò)來(lái)。這種盡可能地模擬真實(shí)場(chǎng)景說(shuō)話的方式跟RTC的傳輸也有關(guān)系。

因?yàn)榭臻g聲場(chǎng)是喇叭。假設(shè)這里面有5.1個(gè)喇叭,其實(shí)都很難聽(tīng)出一個(gè)比較明顯的效果。這是虛擬的一個(gè)音響,你靠的近聲音會(huì)很大,你一旦背對(duì)著它聲音會(huì)越來(lái)越小,隔著門(mén)可以聽(tīng)到房間里的一個(gè)虛擬聲音在發(fā)聲,但是進(jìn)來(lái)把門(mén)推開(kāi)的時(shí)候聲音會(huì)變得很大。這就是傳播中的一個(gè)遮擋問(wèn)題。大家只要帶著同一個(gè)眼鏡,同一個(gè)東西你走到這都可以聽(tīng)到它。

04AR RTC的一些挑戰(zhàn)

最后跟大家說(shuō)一下AR下RTC的一些挑戰(zhàn)。

695f2e08-a878-11ed-bfe3-dac502259ad0.jpg

第一個(gè)就是極低功耗,這些功耗是算法本身性能跟資源消耗之間的一些balance。因?yàn)槲覀冏约旱脑O(shè)備都是AR終端,如何減少功耗、減少發(fā)熱、增加設(shè)備使用時(shí)常,始終是我們?cè)诮K端上做的一些探索。另外,音視頻到達(dá)設(shè)備之后,我還能夠用哪些手段把音頻的音質(zhì)增強(qiáng),視頻的畫(huà)質(zhì)增強(qiáng)呢?

第二塊涉及到弱網(wǎng)。大部分低端應(yīng)用的場(chǎng)景就是惡劣的環(huán)境,所以很多算法就是針對(duì)弱網(wǎng)優(yōu)化的,包括我們正在做的也會(huì)涉及到音頻的超分,也是解決同樣的問(wèn)題。

第三塊就是360度的超清高刷畫(huà)面。其實(shí)在VR里面它的刷新率目前最高可以到240Hz,分辨率是有在4K并且還是全方位的。在我們AR里面,比如FOV大幾十度,隨時(shí)切進(jìn)這么大的畫(huà)面就是對(duì)RTC的挑戰(zhàn)。實(shí)時(shí)視頻該怎么去編?因?yàn)橐郧耙曨l是實(shí)時(shí)基于上一幀、下一幀能夠進(jìn)行預(yù)測(cè)編碼,冗余度很強(qiáng),但是如果現(xiàn)在這樣隨時(shí)切該怎么做?不過(guò)當(dāng)下行業(yè)里也已經(jīng)都在思考這個(gè)問(wèn)題,推出新的3D編碼方式。

還涉及到一個(gè)點(diǎn)是虛擬模型里面通信的東西怎么跟RTC一起發(fā)走。比如RTC有時(shí)候這里還跟富媒體有關(guān)系,就是RTC更新的時(shí)候除了音頻、視頻、文字流之外,我們還有圖片、2D或者3D的模型,包括一些辦公文件。當(dāng)然這些東西不見(jiàn)得一定得進(jìn)RTC的協(xié)議里面,但是起碼我們實(shí)時(shí)處理的時(shí)候遇到了問(wèn)題。

以上就是我給大家?guī)?lái)的AR×RTC的一個(gè)分享,包括遇到的一些點(diǎn)跟針對(duì)這些點(diǎn)我們做的一些技術(shù)應(yīng)用與思考。謝謝大家!





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Ar
    Ar
    +關(guān)注

    關(guān)注

    24

    文章

    5066

    瀏覽量

    169045
  • 編解碼
    +關(guān)注

    關(guān)注

    1

    文章

    140

    瀏覽量

    19566
  • RTC
    RTC
    +關(guān)注

    關(guān)注

    2

    文章

    519

    瀏覽量

    66151
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1015

    瀏覽量

    45629

原文標(biāo)題:AR下的RTC技術(shù)與應(yīng)用

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    什么是RTC模塊?

    什么是“RTC”?“RTC”是實(shí)時(shí)時(shí)鐘的縮寫(xiě),它是一種測(cè)量時(shí)間的電子設(shè)備。什么是“RTC模塊”?“RTC模塊”是一個(gè)集成了RTCIC、振蕩器電路和主時(shí)鐘的單封裝模塊。無(wú)需自行設(shè)計(jì)振蕩器
    的頭像 發(fā)表于 07-24 14:14 ?299次閱讀
    什么是<b class='flag-5'>RTC</b>模塊?

    ar增強(qiáng)現(xiàn)實(shí)技術(shù)的特點(diǎn)是什么

    增強(qiáng)現(xiàn)實(shí)(Augmented Reality,簡(jiǎn)稱(chēng)AR技術(shù)是一種將虛擬信息與現(xiàn)實(shí)世界相結(jié)合的技術(shù),它通過(guò)計(jì)算機(jī)技術(shù)將虛擬的圖像、聲音、文字等信息疊加到現(xiàn)實(shí)世界中,使用戶(hù)能夠獲得更加豐
    的頭像 發(fā)表于 07-04 11:42 ?642次閱讀

    增強(qiáng)現(xiàn)實(shí)技術(shù)(AR)和虛擬現(xiàn)實(shí)技術(shù)(VR)的區(qū)別?

    增強(qiáng)現(xiàn)實(shí)技術(shù)(AR)和虛擬現(xiàn)實(shí)技術(shù)(VR)是兩種不同的技術(shù),它們?cè)谠S多方面都有明顯的區(qū)別。以下是對(duì)這兩種技術(shù)的介紹和比較。 定義 增強(qiáng)現(xiàn)實(shí)
    的頭像 發(fā)表于 07-04 11:40 ?824次閱讀

    AR眼鏡定制開(kāi)發(fā)方案_AR智能眼鏡與ChatGPT技術(shù)的融合

    AR眼鏡定制方案中,一款好的AR眼鏡需要有強(qiáng)大的算力、輕巧的設(shè)計(jì)、更長(zhǎng)的續(xù)航時(shí)間作為基礎(chǔ),AR眼鏡設(shè)計(jì)方案不僅在硬件、顯示技術(shù)方面有所突破,還要在用戶(hù)體驗(yàn)上取得進(jìn)展。過(guò)去
    的頭像 發(fā)表于 06-03 20:11 ?683次閱讀
    <b class='flag-5'>AR</b>眼鏡定制開(kāi)發(fā)方案_<b class='flag-5'>AR</b>智能眼鏡與ChatGPT<b class='flag-5'>技術(shù)</b>的融合

    EPSON愛(ài)普生RTC RA8900CE、RA8000CE 松下Panasonic電池組合

    RTC是一種實(shí)時(shí)時(shí)鐘,用于記錄和跟蹤時(shí)間,具有獨(dú)立供電和時(shí)鐘功能。在某些應(yīng)用場(chǎng)景中,為了保證RTC在斷電或者其他異常情況依然能夠正常工作,需要備份電池方案來(lái)提供穩(wěn)定的供電。本文將介紹EPSON
    發(fā)表于 05-27 16:54 ?0次下載

    STM8L052芯片在停機(jī)halt模式RTC還能夠正常運(yùn)行嗎?

    問(wèn)題:STM8L052芯片在停機(jī)halt模式RTC還能夠正常運(yùn)行嗎?現(xiàn)在的情況是運(yùn)行狀態(tài)RTC時(shí)鐘運(yùn)行正常,但是進(jìn)入停機(jī)狀態(tài)后發(fā)現(xiàn)定時(shí)沒(méi)有正常走。
    發(fā)表于 04-17 07:13

    RTC碰到LXTAL低頻晶振停振怎么辦?

    GD32F303的RTC模塊框圖如下圖所示,RTC時(shí)鐘源可選擇HXTAL/128、LXTAL或IRC40K,一般為了實(shí)現(xiàn)更精準(zhǔn)的RTC時(shí)間,MCU系統(tǒng)均會(huì)外掛32.768KHz LXTAL低頻晶振,
    的頭像 發(fā)表于 03-29 09:58 ?513次閱讀
    <b class='flag-5'>RTC</b>碰到LXTAL低頻晶振停振怎么辦?

    RTC電池壽命的評(píng)估考慮因素

    本案例是一個(gè)帶RTC功能的工業(yè)產(chǎn)品,RTC部分的供電電路如下下圖,產(chǎn)品發(fā)往市場(chǎng)半年以后,就提示更換RTC電池,遠(yuǎn)遠(yuǎn)低于設(shè)計(jì)壽命5年。
    發(fā)表于 03-15 10:29 ?516次閱讀
    <b class='flag-5'>RTC</b>電池壽命的評(píng)估考慮因素

    什么是ARar增強(qiáng)現(xiàn)實(shí)的技術(shù)支撐是什么

    標(biāo)定技術(shù):這是增強(qiáng)現(xiàn)實(shí)AR眼鏡的關(guān)鍵技術(shù)之一,用于確定人眼與跟蹤系統(tǒng)之間的相對(duì)位置關(guān)系,以及人眼的內(nèi)參數(shù),幫助用戶(hù)準(zhǔn)確地看到虛擬與真實(shí)世界的融合。
    的頭像 發(fā)表于 03-07 18:18 ?3170次閱讀
    什么是<b class='flag-5'>AR</b>?<b class='flag-5'>ar</b>增強(qiáng)現(xiàn)實(shí)的<b class='flag-5'>技術(shù)</b>支撐是什么

    CYT2B97低功耗模式RTC喚醒偶發(fā)性失敗的原因?

    Mcu使用CYT2B97 在M4核中實(shí)現(xiàn)低功耗RTC喚醒 軟件設(shè)置進(jìn)入DSM之前,先設(shè)置下次喚醒的時(shí)間,操作如下: 1.設(shè)置喚醒時(shí)間 Cy_Rtc
    發(fā)表于 02-02 07:20

    如何運(yùn)用AR技術(shù)提升制造效率?這里有答案!

    當(dāng)談及AR技術(shù)在工業(yè)領(lǐng)域的應(yīng)用,首先讓人想到的是它為企業(yè)帶來(lái)的巨大變革。從工業(yè)設(shè)計(jì)和制造到設(shè)備維護(hù)和維修,再到培訓(xùn)和技能傳承以及設(shè)備操作和監(jiān)測(cè),AR技術(shù)憑借其獨(dú)特的方式,幫助企業(yè)實(shí)現(xiàn)更
    的頭像 發(fā)表于 01-14 16:50 ?276次閱讀

    直播回顧 | 大普RTC技術(shù)交流會(huì)重點(diǎn)集錦

    11月17日,大普技術(shù)在電子發(fā)燒友直播平臺(tái)成功舉辦了一場(chǎng)“高精度RTC產(chǎn)品研討會(huì)”,CTO田學(xué)紅博士深入淺出為觀眾介紹了大普時(shí)鐘家族產(chǎn)品,重點(diǎn)分享了實(shí)時(shí)時(shí)鐘(RTC)全系列芯片、針對(duì)不同應(yīng)用場(chǎng)
    發(fā)表于 12-12 14:50 ?258次閱讀
    直播回顧 | 大普<b class='flag-5'>RTC</b><b class='flag-5'>技術(shù)</b>交流會(huì)重點(diǎn)集錦

    AR智能眼鏡雙目光波導(dǎo)/主板硬件技術(shù)

    AR眼鏡_AR智能眼鏡雙目光波導(dǎo)/主板硬件技術(shù)。光波導(dǎo)技術(shù)結(jié)合Micro OLED屏幕被視為AR眼鏡光學(xué)方案的黃金組合,具有輕薄、高清晰度、
    的頭像 發(fā)表于 11-25 15:43 ?1527次閱讀
    <b class='flag-5'>AR</b>智能眼鏡雙目光波導(dǎo)/主板硬件<b class='flag-5'>技術(shù)</b>

    STM8L051在wait mode低功耗的模式,RTC是否可以正常工作?

    請(qǐng)問(wèn)一大家,STM8L051在wait mode低功耗的模式,RTC是否可以正常工作,我現(xiàn)在用中斷喚醒休眠,但是RTC無(wú)法正常工作?(RTC
    發(fā)表于 11-08 06:21

    AR眼鏡硬件開(kāi)發(fā)技術(shù)AR/VR智能眼鏡安卓主板硬件芯片技術(shù)介紹

    AR眼鏡硬件開(kāi)發(fā)技術(shù)AR/VR智能眼鏡安卓主板硬件芯片技術(shù)介紹。MT8788芯片是一個(gè)多芯片分布式處理系統(tǒng),旨在在性能、功耗和尺寸之間取得平衡。這個(gè)解決方案對(duì)于產(chǎn)品的便攜性和能耗非常
    的頭像 發(fā)表于 11-07 19:29 ?1739次閱讀
    <b class='flag-5'>AR</b>眼鏡硬件開(kāi)發(fā)<b class='flag-5'>技術(shù)</b>|<b class='flag-5'>AR</b>/VR智能眼鏡安卓主板硬件芯片<b class='flag-5'>技術(shù)</b>介紹