0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聲加科技助力小米首款支持本地命令詞語(yǔ)音喚醒TWS耳機(jī)上市

測(cè)試測(cè)試測(cè)試 ? 來(lái)源:北國(guó)網(wǎng) ? 2019-09-26 15:00 ? 次閱讀

9 月 24 日,小米新一代真無(wú)線(xiàn)藍(lán)牙耳機(jī) Air 2正式亮相,在外形和功能上都較一代有了非常大的變化。小米官方海報(bào)廣告詞宣稱(chēng)“智能真無(wú)線(xiàn),輕松舒適戴”,并且將“智能語(yǔ)音喚醒,雙麥克風(fēng)降噪”作為其首條宣傳賣(mài)點(diǎn)。目前該產(chǎn)品已在小米商城開(kāi)放預(yù)約,9月27日正式上市。

小米Air2宣傳海報(bào),圖片來(lái)源于小米官網(wǎng)

Air2的語(yǔ)音喚醒到底有多智能呢?據(jù)本次算法技術(shù)支持方案商——聲加科技CEO邱鋒海介紹,此次小米Air2采用了聲加科技提供的耳機(jī)本地語(yǔ)音識(shí)別方案,與市面同類(lèi)產(chǎn)品最大的不同是能直接在Air2耳機(jī)端完成多命令詞語(yǔ)音識(shí)別,急速響應(yīng)命令——用戶(hù)在播放音樂(lè)時(shí)無(wú)需喚醒語(yǔ)音助手“小愛(ài)同學(xué)”,可直接向耳機(jī)發(fā)出語(yǔ)音指令“上一首/上一曲”,“下一首/下一曲”,迅速實(shí)現(xiàn)自由切歌,無(wú)需再等待語(yǔ)音助手喚醒手機(jī)進(jìn)行響應(yīng),大大提高了用戶(hù)使用體驗(yàn)。

小米Air2宣傳海報(bào),圖片來(lái)源于小米官網(wǎng)

邱鋒海表示,耳機(jī)搭載語(yǔ)音助手已經(jīng)成為目前TWS耳機(jī)的主流趨勢(shì),但目前市面上絕大部分產(chǎn)品使用的還是以基于手機(jī)的語(yǔ)音識(shí)別方案,用戶(hù)每一次的語(yǔ)音指令都要首先喚醒手機(jī)語(yǔ)音助手,造成響應(yīng)速度較慢(切換歌曲需要等待5~6秒),不少用戶(hù)因此放棄了語(yǔ)音喚醒功能,寧可使用手勢(shì)或按鍵,甚至只能拿出手機(jī)進(jìn)行操作,體驗(yàn)欠佳。其原因主要受限于耳機(jī)運(yùn)算能力較弱以及電池續(xù)航時(shí)間短,給耳機(jī)端進(jìn)行精確的語(yǔ)音識(shí)別造成了極高難度。而聲加科技的小資源關(guān)鍵詞喚醒(KWS)有限語(yǔ)音命令方案攻克了技術(shù)難點(diǎn),可實(shí)現(xiàn)喚醒低功耗計(jì)算方案,KWS啟動(dòng)和手機(jī)語(yǔ)音交互,有限語(yǔ)音命令實(shí)現(xiàn)切歌、調(diào)音量等基本操作。在算法所需資源消耗上,低至30Mips, 50KBytes memory的喚醒詞模型(m4f平臺(tái)),模型規(guī)??勺儯芨鶕?jù)產(chǎn)品計(jì)算資源快速調(diào)整模型,還能整合聲加自有前端語(yǔ)音增強(qiáng),優(yōu)化整體性能。

除此之外,耳機(jī)使用場(chǎng)景復(fù)雜且運(yùn)算資源受限,如果只依靠基于深度學(xué)習(xí)的小資源語(yǔ)音識(shí)別模型,在嘈雜環(huán)境下會(huì)存在誤識(shí)率高、識(shí)別率低的問(wèn)題。而Air2同時(shí)還搭載了聲加科技的雙麥SVE降噪技術(shù),如定向拾音、環(huán)境降噪(尤其是風(fēng)噪抑制)等,能有效降低通話(huà)時(shí)的環(huán)境噪聲,即使身處嘈雜環(huán)境,也能保障高清晰的語(yǔ)音識(shí)別以及通話(huà)質(zhì)量。

對(duì)小米Air2直接說(shuō)“下一首”,迅速切換歌曲

據(jù)了解,聲加科技成立于2018年1月,專(zhuān)注于通信聲學(xué)核心技術(shù),依托于中科院聲學(xué)所雄厚的人才和科研資源,打造產(chǎn)學(xué)研一體化。其SVE(Soundplus Voice Enhancement)降噪技術(shù)可以廣泛應(yīng)用于耳塞式耳機(jī)、半入耳式耳機(jī)、入耳式耳機(jī)、頭戴式耳機(jī)、掛耳式耳機(jī)等,是通過(guò)雙麥克風(fēng)陣列,精準(zhǔn)計(jì)算通話(huà)者說(shuō)話(huà)的方位,在保護(hù)主方向目標(biāo)語(yǔ)音的同時(shí),去除環(huán)境中的各種干擾噪聲,例如其他人的講話(huà)聲、交通工具產(chǎn)生的噪音、風(fēng)噪聲等等,有效抑制90%的反向環(huán)境噪聲,由此降低環(huán)境噪聲最高可達(dá)30dB,保證高品質(zhì)通話(huà)效果。讓使用者無(wú)論身處何種嘈雜環(huán)境,都可細(xì)語(yǔ)輕聊,無(wú)懼干擾。其核心技術(shù)包括:

回聲消除AEC:

支持單通道回聲抵消、雙通道立體聲回聲抵消,可在設(shè)備自身播放大音量時(shí)輕松喚醒,ERLE》30dB。

聲源定位Direction of arrival estimation:

支持多源定位;可在強(qiáng)混響及噪聲干擾情況下準(zhǔn)確定位目標(biāo)聲源;工作信噪比可低至0db以下;DOA分辨率《10°。

波束形成Beamforming:

保護(hù)目標(biāo)語(yǔ)音的同時(shí),去除噪聲干擾與散射噪聲,大幅提高語(yǔ)音識(shí)別率;穩(wěn)態(tài)噪聲抑量》30dB,非平穩(wěn)噪聲印制量》24dB。

關(guān)鍵詞喚醒、有限語(yǔ)音命令詞識(shí)別Key word spotting、command

基于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,根據(jù)前端算法進(jìn)行深度優(yōu)化,精確辨識(shí)關(guān)鍵詞,超低誤喚醒。消耗資源配置靈活(小模型超低資源占用;資源豐富時(shí)可實(shí)現(xiàn)高性能識(shí)別),可應(yīng)用于耳機(jī)、手環(huán)、手表等可穿戴智能設(shè)備。5米喚醒率》93%,3米喚醒率》97%,誤喚醒《2次/48H。

基于機(jī)器學(xué)習(xí)降噪/識(shí)別

已成功用于聲學(xué)建模,與標(biāo)準(zhǔn)GMM模型相比語(yǔ)音識(shí)別率實(shí)現(xiàn)了大幅改進(jìn),DNN是全連接神經(jīng)網(wǎng)絡(luò),解決了局部最優(yōu)解的問(wèn)題;卷積神經(jīng)網(wǎng)絡(luò)CNN降低模型體積,充分利用語(yǔ)譜中的局部信息;循環(huán)神經(jīng)網(wǎng)絡(luò)RNN可以對(duì)時(shí)間序列進(jìn)行建模,適合處理語(yǔ)音信號(hào)。對(duì)動(dòng)態(tài)/穩(wěn)態(tài)噪聲均有效(~30dB)同時(shí)保護(hù)語(yǔ)音成分,表現(xiàn)魯棒。

音效:

EQ均衡:通過(guò)對(duì)各種不同頻率的電信號(hào)的調(diào)節(jié)來(lái)補(bǔ)償揚(yáng)聲器和聲場(chǎng)的缺陷,補(bǔ)償和修飾各種聲源及其它特殊作用。

虛擬環(huán)繞聲:在雙聲道立體聲的基礎(chǔ)上,不增加聲道和音箱,把聲場(chǎng)信號(hào)通過(guò)電路處理后播出,使聆聽(tīng)者感到聲音來(lái)自多個(gè)方位。

SVE開(kāi)啟前后對(duì)比(公路噪聲):

此外,作為智能聽(tīng)覺(jué)的創(chuàng)新公司,聲加科技的耳機(jī)技術(shù)方案還應(yīng)用在了華為Flypods、小米Air、小米Air2、萬(wàn)魔EM001、萬(wàn)魔EM004、京東京魚(yú)座等產(chǎn)品上。目前,其團(tuán)隊(duì)?wèi){借十余年的技術(shù)積累,可為B端客戶(hù)提供復(fù)雜場(chǎng)景下的近場(chǎng)、中場(chǎng)、遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)方案,以及從芯片、模組、PCBA到工業(yè)設(shè)計(jì)的一站式產(chǎn)品方案。其回聲抵消、噪聲抑制、聲源定位、混響消除、波束形成、語(yǔ)音喚醒等性能在行業(yè)內(nèi)均名列前位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 小米
    +關(guān)注

    關(guān)注

    69

    文章

    14286

    瀏覽量

    143509
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    HLK-V20支持用戶(hù)修改喚醒詞和命令詞 海凌科語(yǔ)音定制后臺(tái)系統(tǒng)上線(xiàn)

    HLK-V20離線(xiàn)語(yǔ)音模塊首發(fā)即爆,在抖音上V20的單個(gè)視頻播放量過(guò)100萬(wàn)。關(guān)于這款產(chǎn)品用戶(hù)咨詢(xún)量最多的便是語(yǔ)音命令詞和喚醒詞的自定義問(wèn)
    的頭像 發(fā)表于 07-28 08:38 ?464次閱讀
    HLK-V20<b class='flag-5'>支持</b>用戶(hù)修改<b class='flag-5'>喚醒</b>詞和<b class='flag-5'>命令</b>詞 海凌科<b class='flag-5'>語(yǔ)音</b>定制后臺(tái)系統(tǒng)上線(xiàn)

    請(qǐng)問(wèn)ESP32-EYE開(kāi)發(fā)板例程支持修改語(yǔ)音喚醒命令嗎?

    請(qǐng)問(wèn)ESP32-EYE 開(kāi)發(fā)板例程支持修改語(yǔ)音喚醒命令嗎?該如何修改?
    發(fā)表于 06-28 16:23

    隆重呈現(xiàn)!拜雅開(kāi)放式耳機(jī)VERIO 200正式發(fā)布

    VERIO 200開(kāi)放式真無(wú)線(xiàn)耳機(jī)可直接使用耳機(jī)上的觸摸傳感器進(jìn)行操作。接聽(tīng)電話(huà)、調(diào)整音量或啟動(dòng)語(yǔ)音助手,一觸即達(dá)。beyerdynamic配合VERIO 200同時(shí)發(fā)布了一新開(kāi)發(fā)的
    的頭像 發(fā)表于 06-25 20:58 ?363次閱讀
    隆重呈現(xiàn)!拜雅<b class='flag-5'>首</b><b class='flag-5'>款</b>開(kāi)放式<b class='flag-5'>耳機(jī)</b>VERIO 200正式發(fā)布

    接近傳感芯片可延長(zhǎng)TWS真無(wú)線(xiàn)立體耳塞的播放時(shí)間

    TWS耳塞的基本工作原理是移動(dòng)裝置連接主耳機(jī),再由主耳機(jī)通過(guò)藍(lán)牙無(wú)線(xiàn)方式連接副耳機(jī)組成立體聲系統(tǒng),實(shí)現(xiàn)真正的藍(lán)牙左右聲道無(wú)線(xiàn)分離使用。
    的頭像 發(fā)表于 05-31 09:19 ?492次閱讀
    接近傳感芯片可延長(zhǎng)<b class='flag-5'>TWS</b>真無(wú)線(xiàn)立體<b class='flag-5'>聲</b>耳塞的播放時(shí)間

    TWS 藍(lán)牙耳機(jī) ESD EOS保護(hù)方案

    TWS 藍(lán)牙耳機(jī) ESD EOS保護(hù)方案
    的頭像 發(fā)表于 05-17 08:02 ?575次閱讀
    <b class='flag-5'>TWS</b> 藍(lán)牙<b class='flag-5'>耳機(jī)</b> ESD EOS保護(hù)方案

    飛利浦影音推出首AI會(huì)議降噪耳機(jī)飛利浦“8號(hào)”

    飛利浦影音近日重磅推出其AI會(huì)議降噪耳機(jī)——“8號(hào)”。這款產(chǎn)品的誕生,是飛利浦影音與小鹿文App深入合作的結(jié)晶,同時(shí)得到了“騰訊混元”語(yǔ)言大模型提供的強(qiáng)大AI技術(shù)
    的頭像 發(fā)表于 05-13 11:29 ?751次閱讀

    TWS 藍(lán)牙耳機(jī) ESD EOS保護(hù)方案

    ? 1. TWS 藍(lán)牙耳機(jī) TWS(True Wireless Stereo)藍(lán)牙耳機(jī)是指沒(méi)有傳統(tǒng)連接線(xiàn)的完全無(wú)線(xiàn)耳機(jī),通常由兩個(gè)分別放置在
    的頭像 發(fā)表于 05-04 21:19 ?487次閱讀
    <b class='flag-5'>TWS</b> 藍(lán)牙<b class='flag-5'>耳機(jī)</b> ESD EOS保護(hù)方案

    應(yīng)用在TWS真無(wú)線(xiàn)耳機(jī)領(lǐng)域中的數(shù)字紅外接近檢測(cè)模塊

    TWS是True Wireless Stereo(真無(wú)線(xiàn)立體)的縮寫(xiě),該技術(shù)是基于藍(lán)牙芯片的發(fā)展而出現(xiàn)。TWS耳機(jī)是將TWS技術(shù)應(yīng)用于藍(lán)牙
    的頭像 發(fā)表于 03-27 09:21 ?514次閱讀
    應(yīng)用在<b class='flag-5'>TWS</b>真無(wú)線(xiàn)<b class='flag-5'>耳機(jī)</b>領(lǐng)域中的數(shù)字紅外接近檢測(cè)模塊

    云知再次沖刺港交所上市

    備受矚目的“AI語(yǔ)音第一股”云知智能科技股份有限公司(簡(jiǎn)稱(chēng)“云知”)更新了其招股書(shū),并繼續(xù)穩(wěn)步推進(jìn)在港交所主板的上市進(jìn)程。此前,云知
    的頭像 發(fā)表于 03-19 14:59 ?806次閱讀

    iQOO發(fā)布iQOO TWS 2真無(wú)線(xiàn)耳機(jī)支持Snapdragon Sound驍龍暢聽(tīng)技術(shù)

    近日,iQOO發(fā)布iQOO TWS 2真無(wú)線(xiàn)耳機(jī),全新產(chǎn)品基于第二代高通?S3音頻平臺(tái)打造,支持Snapdragon Sound 驍龍暢聽(tīng)技術(shù),助力iQOO
    的頭像 發(fā)表于 03-05 15:52 ?834次閱讀

    探索TWS藍(lán)牙耳機(jī)的技術(shù)奧秘

    解決TWS耳機(jī)傳輸及音質(zhì)問(wèn)題的關(guān)鍵在于藍(lán)牙技術(shù)與音頻編解碼技術(shù)發(fā)展,這些通常集成在TWS耳機(jī)的主控藍(lán)牙芯片SoC內(nèi),因而藍(lán)牙SOC芯片對(duì)TWS
    的頭像 發(fā)表于 01-08 14:45 ?3892次閱讀

    Git命令本地分支與遠(yuǎn)程分支關(guān)聯(lián)和解除

    在實(shí)際的工作生活中,往往需要將本地的分支和遠(yuǎn)程分支關(guān)聯(lián),這樣我們就可以使用git pull命令來(lái)更新拉取最新的代碼,并使用git push命令將自己本地的修改推送到遠(yuǎn)程倉(cāng)庫(kù)。但是如果此
    的頭像 發(fā)表于 12-15 09:27 ?2680次閱讀
    Git<b class='flag-5'>命令</b>之<b class='flag-5'>本地</b>分支與遠(yuǎn)程分支關(guān)聯(lián)和解除

    TWS耳機(jī)上下游產(chǎn)業(yè)鏈技術(shù)分析

    電子發(fā)燒友網(wǎng)站提供《TWS耳機(jī)上下游產(chǎn)業(yè)鏈技術(shù)分析.pdf》資料免費(fèi)下載
    發(fā)表于 12-13 11:20 ?8次下載
    <b class='flag-5'>TWS</b><b class='flag-5'>耳機(jī)上</b>下游產(chǎn)業(yè)鏈技術(shù)分析

    語(yǔ)音識(shí)別能夠本地實(shí)現(xiàn)嗎?

    不依靠網(wǎng)絡(luò),本地實(shí)現(xiàn)語(yǔ)音識(shí)別,只需要特定的控制命令就可以。
    發(fā)表于 11-10 06:49

    AT32上實(shí)現(xiàn)關(guān)鍵詞語(yǔ)音識(shí)別(KWS)

    AT32上實(shí)現(xiàn)關(guān)鍵詞語(yǔ)音識(shí)別(KWS)本文基于此開(kāi)源模型和代碼,在AT32 MCU 上對(duì)KWS 效果進(jìn)行展示。
    發(fā)表于 10-26 07:45