0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出了一項(xiàng)新技術(shù),可以提高Duo通話的音頻質(zhì)量

倩倩 ? 來源:好嘿科技 ? 2020-04-15 15:32 ? 次閱讀

谷歌推出了一項(xiàng)新技術(shù),當(dāng)服務(wù)無法維持穩(wěn)定的WaveNetEQ連接時(shí),可以提高Duo通話的音頻質(zhì)量。它是基于谷歌的DeepMind部門的技術(shù),該部門的目標(biāo)是用人工噪音代替音頻抖動(dòng),這種噪音聽起來就像人類說話一樣,是通過機(jī)器學(xué)習(xí)產(chǎn)生的。

如果你曾經(jīng)在網(wǎng)上打過電話,那么你很有可能經(jīng)歷過音頻抖動(dòng)。當(dāng)作為調(diào)用的一部分發(fā)送的音頻數(shù)據(jù)包在傳輸過程中丟失,或出現(xiàn)延遲或順序錯(cuò)誤時(shí),就會(huì)發(fā)生這種情況。谷歌說99%的Duo呼叫都經(jīng)歷過數(shù)據(jù)包丟失:20%的丟失超過3%的音頻,10%的丟失超過8%。有很多音頻需要替換。

每個(gè)呼叫應(yīng)用程序都必須以某種方式處理這種丟包,但谷歌表示,這些丟包隱藏(PLC)過程可能很難填補(bǔ)60毫秒或更長(zhǎng)的空白,聽起來既不像機(jī)器人,也不重復(fù)。WaveNetEQ的解決方案是基于DeepMind的神經(jīng)網(wǎng)絡(luò)技術(shù),它已經(jīng)對(duì)來自48種不同語(yǔ)言的100多個(gè)使用者的數(shù)據(jù)進(jìn)行了訓(xùn)練。

將WaveNetEQ與NetEQ(一種常用的PLC技術(shù))進(jìn)行了比較。嘗試替換60ms丟包時(shí)的聲音。不過,這個(gè)系統(tǒng)可以替換的音頻是有限制的。谷歌的技術(shù)旨在取代短音,而不是完整的單詞。因此,120毫秒后,它會(huì)逐漸消失,并產(chǎn)生靜音。谷歌說,它對(duì)系統(tǒng)進(jìn)行了評(píng)估,以確保沒有引入任何重要的新聲音。另外,所有的處理都需要在設(shè)備上進(jìn)行,因?yàn)楣雀鐳uo調(diào)用默認(rèn)是端到端加密的。一旦通話的真實(shí)音頻恢復(fù),WaveNetEQ將無縫地回到現(xiàn)實(shí)中。

這是一個(gè)巧妙的小技術(shù),當(dāng)互聯(lián)網(wǎng)讓他們失望時(shí),打電話應(yīng)該更容易理解。由于Pixel 4手機(jī)在12月的功能下降,該技術(shù)已經(jīng)可以用于在Pixel 4手機(jī)上撥打Duo電話。谷歌表示,它正在將這項(xiàng)技術(shù)推廣到其他未命名的手機(jī)上。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6106

    瀏覽量

    104830
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4727

    瀏覽量

    100346
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ip網(wǎng)絡(luò)音頻終端是什么

    IP地址進(jìn)行通信。它們可以音頻信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),并通過局域網(wǎng)或因特網(wǎng)進(jìn)行傳輸,從而在不同地點(diǎn)之間實(shí)現(xiàn)高質(zhì)量音頻傳輸和通信。 二、主要功能 語(yǔ)音
    的頭像 發(fā)表于 10-08 14:52 ?125次閱讀

    谷歌推出Gemini Live,開啟AI語(yǔ)音聊天新紀(jì)元

    在萬眾矚目的Pixel 9系列手機(jī)發(fā)布會(huì)上,谷歌震撼宣布了一項(xiàng)創(chuàng)新服務(wù)——Gemini Live,該服務(wù)自今日起,率先向使用英語(yǔ)的Gemini Advanced訂閱用戶敞開大門。這舉措標(biāo)志著
    的頭像 發(fā)表于 08-15 17:29 ?622次閱讀

    星閃,一項(xiàng)迫于無奈的創(chuàng)新技術(shù)

    星閃(NearLink,舊稱SparkLink)是種短距離低功耗無線通信技術(shù),由華為于2020年9月牽頭成立的星閃聯(lián)盟(超過300多家會(huì)員單位)負(fù)責(zé)制定其標(biāo)準(zhǔn)和規(guī)范,于2022年11月發(fā)布星閃
    的頭像 發(fā)表于 07-30 18:39 ?2577次閱讀
    星閃,<b class='flag-5'>一項(xiàng)</b>迫于無奈的創(chuàng)<b class='flag-5'>新技術(shù)</b>

    谷歌推出Trillium AI芯片,性能提高近5倍

    谷歌推出了其最新的人工智能數(shù)據(jù)中心芯片——Trillium。這款芯片是谷歌的第六代產(chǎn)品,與上代TPU v5e相比,Trillium在每個(gè)芯片上的峰值計(jì)算性能
    的頭像 發(fā)表于 05-16 10:39 ?675次閱讀

    谷歌提出大規(guī)模ICL方法

    谷歌DeepMind團(tuán)隊(duì)近日取得了一項(xiàng)突破性的研究成果。他們提出了強(qiáng)化和無監(jiān)督兩種新型的ICL(In-Context Learning)學(xué)習(xí)方法,這創(chuàng)
    的頭像 發(fā)表于 05-14 14:17 ?298次閱讀

    谷歌DeepMind推出新一代藥物研發(fā)AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了款名為AlphaFold 3的全新藥物研發(fā)AI模型,這創(chuàng)新技術(shù)將為科學(xué)家們提供前所未有的幫助,使他
    的頭像 發(fā)表于 05-10 09:35 ?340次閱讀

    NVIDIA和谷歌云宣布開展一項(xiàng)新的合作,加速AI開發(fā)

    NVIDIA 和谷歌云宣布開展一項(xiàng)新的合作,以幫助全球初創(chuàng)企業(yè)加速創(chuàng)建生成式 AI 應(yīng)用和服務(wù)。
    的頭像 發(fā)表于 04-11 14:03 ?431次閱讀

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日發(fā)布了一項(xiàng)令人矚目的新功能,它是款能夠借助自然語(yǔ)言對(duì)話幫助用戶生成旅行行程和出游建議的AI工具。這款工具的推出,標(biāo)志著谷歌在人工智
    的頭像 發(fā)表于 03-29 11:08 ?581次閱讀

    谷歌推出多模態(tài)VLOGGER AI

    谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注,這項(xiàng)創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來并“說話”。用戶只需提供張人物肖像照片和
    的頭像 發(fā)表于 03-22 10:45 ?731次閱讀

    聆聽未來:藍(lán)牙Auracast? 廣播音頻技術(shù)

    公共場(chǎng)所,都能提供種全新的聽覺體驗(yàn)。Auracast廣播音頻技術(shù)是藍(lán)牙技術(shù)聯(lián)盟(BluetoothSIG)推出
    的頭像 發(fā)表于 03-22 08:19 ?884次閱讀
    聆聽未來:藍(lán)牙Auracast? 廣播<b class='flag-5'>音頻</b><b class='flag-5'>技術(shù)</b>

    NVIDIA即將推出一項(xiàng)新的生成式AI專業(yè)認(rèn)證

    NVIDIA 即將推出一項(xiàng)新的生成式 AI 專業(yè)認(rèn)證,助力開發(fā)者在這重要領(lǐng)域證明自身技術(shù)實(shí)力。
    的頭像 發(fā)表于 03-14 09:43 ?493次閱讀

    長(zhǎng)電科技推出了一項(xiàng)革命性的高精度熱阻測(cè)試與仿真模擬驗(yàn)證技術(shù)

    在芯片封裝技術(shù)日益邁向高密度、高性能的今天,長(zhǎng)電科技引領(lǐng)創(chuàng)新,推出了一項(xiàng)革命性的高精度熱阻測(cè)試與仿真模擬驗(yàn)證技術(shù)
    的頭像 發(fā)表于 03-08 13:33 ?418次閱讀

    無線麥克風(fēng)音頻方案

    無線麥克風(fēng)是音頻傳輸領(lǐng)域的一項(xiàng)重要技術(shù),廣泛應(yīng)用于演講、表演、會(huì)議等場(chǎng)合。而無線麥克風(fēng)的音頻方案中,無線芯片起著關(guān)鍵作用。下面將介紹無線麥克風(fēng)音頻
    的頭像 發(fā)表于 02-26 15:22 ?683次閱讀

    機(jī)器視覺缺陷檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的一項(xiàng)關(guān)鍵技術(shù)

    機(jī)器視覺缺陷檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的一項(xiàng)關(guān)鍵技術(shù)
    的頭像 發(fā)表于 02-22 13:59 ?467次閱讀
    機(jī)器視覺缺陷檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的<b class='flag-5'>一項(xiàng)</b>關(guān)鍵<b class='flag-5'>技術(shù)</b>

    新技術(shù)在生物樣本冷凍中的應(yīng)用案例分析

      、冷凍樣本的新技術(shù)應(yīng)用   1. 低溫離心   低溫離心是種比較先進(jìn)的生物樣本冷凍處理技術(shù),它可以在較低溫度下將樣本進(jìn)行離心,從而有
    發(fā)表于 12-26 13:30