0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音控制不是魔術(shù),而是設(shè)計

efwedfd ? 來源:efwedfd ? 作者:efwedfd ? 2022-07-14 16:10 ? 次閱讀

由于硬件和軟件的進(jìn)化突破,語音用戶界面或各種尺寸和價格點的支持 VUI 的產(chǎn)品現(xiàn)在都可以推向市場。與直到今天定義語音控制體驗的“對著麥克風(fēng)說話并等待”模型不同,新系統(tǒng)現(xiàn)在可以以最終用戶謹(jǐn)慎甚至不可見的方式嵌入到產(chǎn)品中,并具有即時響應(yīng)時間,而不是“ t 體驗云延遲。

在評估智能揚聲器和云的語音控制替代方案時,產(chǎn)品開發(fā)人員面臨著新的機(jī)遇和挑戰(zhàn)。開發(fā)人員必須考慮尺寸和位置,因為高度微型化的設(shè)備被嵌入到家具和電器中。將語音應(yīng)用程序與邊緣機(jī)器學(xué)習(xí)相結(jié)合對于讓產(chǎn)品隨著時間的推移變得更加智能是必要的。同時,設(shè)備也越來越依賴電池供電,需要開發(fā)人員進(jìn)行工程設(shè)計以實現(xiàn)最佳能源管理。最后,開發(fā)人員必須考慮用戶對功能的期望。對于消費者來說,精心設(shè)計的語音控制感覺無處不在,能夠聽到角落和穿墻的聲音。所有這些以及更多內(nèi)容匯集了在構(gòu)建支持 VUI 的產(chǎn)品時必須考慮的幾個設(shè)計元素。

語音控制 2.0 更自由的方面之一是可以自由地說出語音命令,而無需附近的智能揚聲器。集成在智能家居設(shè)備中的語音可以使整個家庭成為一個可聽區(qū)域,在識別喚醒詞或其他可定義的聲音時隨時可用。專門的硬件和軟件用于產(chǎn)生準(zhǔn)確的遠(yuǎn)場音頻捕獲。

設(shè)計技巧

為了在遠(yuǎn)場環(huán)境中有效地捕捉聲音,一些設(shè)計技術(shù)開始發(fā)揮作用,包括:端口方向:聲學(xué)端口是可以在沒有物理障礙的情況下接受音頻信號的地方。端口的位置(頂部或底部)由單個設(shè)備的外形尺寸決定。為了簡化設(shè)計,聲學(xué)端口通常位于麥克風(fēng)附近,如下所示。但是,端口孔應(yīng)與揚聲器和其他聲學(xué)噪聲源(例如電機(jī)放大器)足夠遠(yuǎn),以最大限度地減少麥克風(fēng)輸入處的不需要的信號。

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

圖 1. 頂部和底部加載聲學(xué)端口配置的橫截面(來源:Knowles)

麥克風(fēng)陣列和波束成形:使用多個麥克風(fēng)稱為“陣列”。在任何給定時刻,麥克風(fēng)陣列都會同時聽到來自各個方向的聲音。除了口頭命令外,他們還會聽到家中的其他聲音和動作。通過一種稱為波束成形的技術(shù),可以對麥克風(fēng)陣列進(jìn)行編程,以選擇性地捕獲來自一個方向的聲音,同時拒絕來自其他方向的聲音。波束成形算法的最終結(jié)果是選擇性地調(diào)諧出來自所需方向的信號以外的信號。波束成形是數(shù)字信號處理鏈中的第一步。

數(shù)字信號處理 (DSP) 算法:DSP 是任何語音控制系統(tǒng)的基石。這就是想要的音頻信息的意義——捕捉它、聚焦它、凈化它、放大它——這樣音素就可以發(fā)出文字、命令和噪音,而不會破壞這個過程。DSP 幾乎用于語音交互的所有階段,從音頻捕獲和語音增強(qiáng)到語音處理。

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

圖 2. 遠(yuǎn)場語音拾?。▉碓矗篔erry Lu)

以便利為設(shè)計理念

除了針對功能進(jìn)行設(shè)計之外,支持 VUI 的設(shè)備還需要針對便利性和可用性進(jìn)行設(shè)計。喚醒詞的兩個主要設(shè)計考慮圍繞能源管理和處理能力。由于 VUI 必須始終處于“偵聽”模式以等待喚醒詞,因此電池供電的 VUI 和 VCD 必須設(shè)計用于極低的能量消耗以及立即喚醒。此外,設(shè)備在過濾掉不需要的聲音的同時區(qū)分想要的語音命令的能力需要不可忽視的處理能力,這需要準(zhǔn)確性和即時性。包含強(qiáng)大音頻邊緣處理器的產(chǎn)品現(xiàn)在可以提供計算能力和低功耗、低延遲操作,從而實現(xiàn)即時用戶體驗。

即使在今天的早期階段,語音控制的爆炸式增長也充分證明了智能家居中語音控制的市場機(jī)會。智能家居的支柱任務(wù),包括安全、能源管理、娛樂和高級安全,都通過語音控制變得更簡單、更容易訪問。語音最終可以作為整個智能家居的統(tǒng)一控制器,從房子的任何房間發(fā)出命令……如果它們的設(shè)計考慮到用戶并利用語音控制技術(shù)的重大進(jìn)步。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 設(shè)計方法
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    9099
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    476

    瀏覽量

    28199
收藏 人收藏

    評論

    相關(guān)推薦

    什么是語音降噪?

    語音降噪就像一位技術(shù)“魔術(shù)師”,它能夠幫助我們從雜亂的背景噪音中提取出我們真正關(guān)心的聲音。想象一下,你正在嘈雜的宿舍里和家人視頻通話,宿舍里傳來了各種各樣的聲音,這時語音降噪就能幫你過濾掉這些雜音,讓對方聽到你清晰的聲音。
    的頭像 發(fā)表于 07-09 16:27 ?718次閱讀
    什么是<b class='flag-5'>語音</b>降噪?

    離線語音控制技術(shù)特點

    離線語音控制通過結(jié)合高性能的音頻前端處理算法和本地AI模型實現(xiàn)了高效的語音識別和控制能力,不依賴于互聯(lián)網(wǎng)連接,同時具備靈活的應(yīng)用擴(kuò)展性。這種解決方案為各種智能設(shè)備提供了穩(wěn)定、高效和多語
    的頭像 發(fā)表于 06-26 18:12 ?343次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>控制</b>技術(shù)特點

    語音控制模塊_雷龍發(fā)展

      1,串口   uart串口控制模式,即異步傳送收發(fā)器,通過其完成語音控制。 []()   圖中,GND表示單片機(jī)系統(tǒng)電源的參考地,TXD是串行發(fā)送引腳,RXD是串行接收引腳。發(fā)送uart將來
    發(fā)表于 06-14 17:18

    MCU配對簡化了語音控制接口設(shè)計

    意法半導(dǎo)體將其STM32微控制器(MCU)硬件和軟件與Sensory的語音控制技術(shù)相結(jié)合,以簡化可穿戴設(shè)備、物聯(lián)網(wǎng)(IoT)和智能家居應(yīng)用中基于語音的用戶界面的開發(fā)。 雖然Sensor
    的頭像 發(fā)表于 05-06 16:21 ?2058次閱讀

    ADXL354BEZ在測量振動時為什么不是平穩(wěn)的正弦波而是出現(xiàn)了包絡(luò)?

    ADXL354BEZ在測量振動時為什么不是平穩(wěn)的正弦波而是出現(xiàn)了包絡(luò)。
    發(fā)表于 12-27 07:04

    科大訊飛語音控制模塊怎么用

    科大訊飛語音控制模塊是一種人機(jī)交互技術(shù),它利用語音識別和語音合成技術(shù),使用戶可以通過語音指令來控制
    的頭像 發(fā)表于 12-25 13:58 ?1559次閱讀

    芯知識 | 什么是語音芯片的IIC控制模式?

    隨著科技的不斷發(fā)展,語音芯片作為現(xiàn)代電子產(chǎn)品中的重要組成部分,其功能和性能也在不斷提升。其中,IIC控制模式是一種常見的語音芯片控制方式,具有高效、靈活的特點。IIC,即
    的頭像 發(fā)表于 12-20 08:41 ?490次閱讀
    芯知識 | 什么是<b class='flag-5'>語音</b>芯片的IIC<b class='flag-5'>控制</b>模式?

    唯創(chuàng)知音WTK6900系列語音識別控制芯片用在循環(huán)風(fēng)扇語音

    控制芯片語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2023年11月28日 15:20:56

    方言離線語音控制場景解決方案

    情況下,留守老人和小孩說方言比較多,在雷龍離線語音模塊 自定義語音的幫助下,老人或小孩不再需要手動操作復(fù)雜的電子設(shè)備。他們只需對設(shè)備用方言說出自己的需求,即可實現(xiàn)設(shè)備的控制。這一功能對于老人和小孩來說
    發(fā)表于 11-17 17:57

    KT148A語音芯片的下載用的是串口,測試可以直接串口發(fā)指令控制嗎?

      KT148A語音芯片的下載用的是串口,那我實際測試是不是可以直接串口發(fā)指令測試控制?就不用單獨寫程序去模擬一線串口的時序了
    的頭像 發(fā)表于 11-14 14:21 ?622次閱讀
    KT148A<b class='flag-5'>語音</b>芯片的下載用的是串口,測試可以直接串口發(fā)指令<b class='flag-5'>控制</b>嗎?

    兩分鐘帶你了解雙高新技術(shù)企業(yè),離線語音控制方案 #企業(yè)宣傳片 #語音控制 #離線語音

    芯片語音控制
    輕生活科技語音模塊
    發(fā)布于 :2023年11月13日 14:51:38

    ADXL354BEZ在測量振動時為什么不是平穩(wěn)的正弦波而是出現(xiàn)了包絡(luò)?

    ADXL354BEZ在測量振動時為什么不是平穩(wěn)的正弦波而是出現(xiàn)了包絡(luò)。
    發(fā)表于 11-13 14:24

    離線語音識別和控制的工作原理及應(yīng)用

    、安防報警、汽車電子、多媒體、通信、電話錄音、工業(yè)自動化控制、玩具及互動消費類產(chǎn)品等。通過我們的專業(yè)知識和經(jīng)驗,我們能夠滿足各類產(chǎn)品的語音交互需求,讓用戶享受更加智能、便捷的使用體驗。
    發(fā)表于 11-07 18:01

    智能電飯煲語音控制

    電飯煲功能包括煮飯、燉湯、蒸菜、煮粥等,多功能電飯煲還可以進(jìn)行煲湯、烤肉等多種烹飪方式。智能電飯煲加入了語音功能,通過NRK3301語音識別芯片,用戶在廚房嘈雜環(huán)境下也能輕松操控電飯煲,通過語音
    的頭像 發(fā)表于 11-01 16:34 ?521次閱讀