0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

影響離線語(yǔ)音識(shí)別靈敏度的因素

嵌入式加油站 ? 來(lái)源:嵌入式加油站 ? 2024-10-25 17:13 ? 次閱讀

有用戶反饋離線語(yǔ)音識(shí)別不靈敏,跟著筆者一起分析原因吧。筆者知識(shí)能力有限,難免會(huì)誤,還請(qǐng)大家批評(píng)指正。

1 影響離線語(yǔ)音識(shí)別的因素

筆者分析離線語(yǔ)音識(shí)別不靈敏的原因有以下幾點(diǎn)

1.1 運(yùn)行硬件的算力限制

由于離線語(yǔ)音識(shí)別在本地MCU進(jìn)行,受限于MCU的計(jì)算能力和存儲(chǔ)空間,無(wú)法像在線識(shí)別那樣依賴云端的強(qiáng)大計(jì)算資源。此外,離線語(yǔ)音識(shí)別缺乏實(shí)時(shí)的數(shù)據(jù)更新和優(yōu)化,導(dǎo)致其對(duì)新詞匯和口音的適應(yīng)能力較弱?。雖然我們的S100D離線語(yǔ)音識(shí)別內(nèi)置高性能 主頻160Mhz的RISC-V CPU + NPU + DSP,在同類MCU里是性能很強(qiáng)了,但相較于服務(wù)器強(qiáng)大算力的GPU是弱的。離線語(yǔ)音識(shí)別IC,訓(xùn)練的模型語(yǔ)料庫(kù)也沒(méi)有運(yùn)行大模型的服務(wù)器那么豐富,一般只有精簡(jiǎn)的標(biāo)準(zhǔn)普通話。

1.2 固定詞條、識(shí)別率稍低

?離線語(yǔ)音識(shí)別技術(shù)將詞條儲(chǔ)存于本地設(shè)備中,由于本地存儲(chǔ)空間有限,設(shè)置的詞條內(nèi)容也會(huì)受到限制。例如,如果儲(chǔ)存的詞條只有“關(guān)燈”這個(gè)命令,那么用戶說(shuō)“把燈關(guān)了”則無(wú)法執(zhí)行,因?yàn)樵跀?shù)據(jù)庫(kù)中找不到對(duì)應(yīng)的詞條命令?

1.3 用戶使用環(huán)境影響

背景噪音、說(shuō)話人的距離和方位都會(huì)影響語(yǔ)音信號(hào)的質(zhì)量,從而降低識(shí)別率。在嘈雜的環(huán)境中,離線語(yǔ)音識(shí)別尤其容易受到干擾,導(dǎo)致識(shí)別不準(zhǔn)確?。

1.4 硬件問(wèn)題

上面說(shuō)了一些客觀原因,有人會(huì)說(shuō),筆者在找借口了。下面我們來(lái)分析一下主觀原因。

電源紋波,供電電路走線方式、Mic布線走線方式,也會(huì)影響識(shí)別效果,例如下面電路走線方式,就有點(diǎn)不合理,后面我們?nèi)绾魏侠碜呔€。

039390a2-9276-11ef-a511-92fbcf53809c.png

還有Mic增益和信噪比,也會(huì)影響識(shí)別率。增益小拾取聲音也小,增益大了,聲音大的同時(shí),噪聲也變大了。

1.5 語(yǔ)速和方言口音影響

語(yǔ)音太快或太慢,和方言口音都會(huì)影響語(yǔ)音識(shí)別,因?yàn)槲覀兊碾x線語(yǔ)音的模型是基于正常語(yǔ)速的標(biāo)準(zhǔn)普通話訓(xùn)練的。

2 改善語(yǔ)音識(shí)別策略

了解影響離線語(yǔ)音識(shí)別的因素,下面我們看看如何改善和提升識(shí)別率。

?2.1 優(yōu)化聲學(xué)模型和語(yǔ)言模型?

通過(guò)深度學(xué)習(xí)算法,聲學(xué)模型可以將語(yǔ)音信號(hào)轉(zhuǎn)換為音素序列,而語(yǔ)言模型則將音素序列轉(zhuǎn)換為文字。優(yōu)化這兩個(gè)模型可以提高識(shí)別的準(zhǔn)確性和靈敏度?。

?使用高性能的語(yǔ)音芯片?:高性能的語(yǔ)音芯片可以提供更快的處理速度和更高的識(shí)別精度,從而提升離線語(yǔ)音識(shí)別的靈敏度?。

?2.2 采用輕量級(jí)NLP技術(shù)?

例如“離線自然說(shuō)”,通過(guò)語(yǔ)義協(xié)議和語(yǔ)音識(shí)別構(gòu)圖結(jié)合,實(shí)現(xiàn)對(duì)指令的泛化理解,支持多種說(shuō)法,提高識(shí)別的靈活性和準(zhǔn)確性?。

3 離線語(yǔ)音識(shí)別的應(yīng)用場(chǎng)景和優(yōu)勢(shì)

離線語(yǔ)音識(shí)別技術(shù)在多個(gè)領(lǐng)域有廣泛應(yīng)用,如智能家居智能車載和智能物聯(lián)設(shè)備。其優(yōu)勢(shì)包括:

?3.1 獨(dú)立性?

不需要網(wǎng)絡(luò)連接,適用于無(wú)網(wǎng)絡(luò)或網(wǎng)絡(luò)不穩(wěn)定的場(chǎng)景?3。

3?.2 隱私保護(hù)?

數(shù)據(jù)不經(jīng)過(guò)云端,更好地保護(hù)用戶隱私?。

?3.3 實(shí)時(shí)性?

對(duì)需要即時(shí)反饋的應(yīng)用提供更好的用戶體驗(yàn)?。

4總結(jié)

通過(guò)以上方法和技術(shù)改進(jìn),可以有效提升離線語(yǔ)音識(shí)別的靈敏度和準(zhǔn)確性,滿足更多應(yīng)用場(chǎng)景的需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    146

    文章

    16812

    瀏覽量

    349442
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4639

    瀏覽量

    128473
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1705

    瀏覽量

    112432
  • 識(shí)別技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    201

    瀏覽量

    19664

原文標(biāo)題:智能離線語(yǔ)音識(shí)別不靈敏?

文章出處:【微信號(hào):嵌入式加油站,微信公眾號(hào):嵌入式加油站】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基站偵聽(tīng)口靈敏度和基站參考靈敏度有何區(qū)別?

    基站偵聽(tīng)口靈敏度和基站參考靈敏度有何區(qū)別?
    發(fā)表于 05-16 09:33

    如何合理的降低接收靈敏度?

    您好,我用CC2430組建的星狀網(wǎng)絡(luò),現(xiàn)在想減小主節(jié)點(diǎn)識(shí)別范圍(子節(jié)點(diǎn)發(fā)送接收指標(biāo)不變),想知道如何合理的降低主節(jié)點(diǎn)接收靈敏度?謝謝!
    發(fā)表于 06-21 02:57

    語(yǔ)音識(shí)別有哪些成本稍微低的解決方案,訊飛或百的能離線

    語(yǔ)音識(shí)別有哪些成本稍微低的解決方案,訊飛或百的能離線嗎如題 只識(shí)別命令
    發(fā)表于 07-07 14:50

    Multisim中的靈敏度分析方法,為什么沒(méi)有電容的靈敏度,另外靈敏度是怎么判斷的。

    在multisim中做靈敏度分析的時(shí)候,結(jié)果中沒(méi)有電容的靈敏度結(jié)果,不知道是為什么,并且結(jié)果中每一個(gè)器件后面的數(shù)字和靈敏度怎么對(duì)應(yīng)呢?
    發(fā)表于 10-24 20:34

    FRID電子標(biāo)簽的靈敏度和讀距與哪些因素有關(guān)?ACP導(dǎo)電膠對(duì)靈敏度有影響嗎?

    剛剛接觸RFID電子標(biāo)簽,有不少疑問(wèn),其中之一就是電子標(biāo)簽的靈敏度和讀距與哪些因素有關(guān)?網(wǎng)上找了找,說(shuō)的比較多的是天線和頻率,不過(guò)比較簡(jiǎn)單,沒(méi)什么內(nèi)容。希望達(dá)人可以解惑。另外,也想了解下:ACP導(dǎo)電膠對(duì)電子標(biāo)簽的靈敏度和讀距有影
    發(fā)表于 12-18 14:51

    語(yǔ)音識(shí)別】你知道什么是離線語(yǔ)音識(shí)別和在線語(yǔ)音識(shí)別嗎?

    差距的:離線語(yǔ)音識(shí)別:固定詞條,不需要連接網(wǎng)絡(luò),但是識(shí)別率稍低在線語(yǔ)音識(shí)別:詞條不固定,需要連接
    發(fā)表于 04-01 17:11

    離線語(yǔ)音識(shí)別及控制是怎樣的技術(shù)?

    、帶寬以及延遲等因素的影響,可以在各種情況下都提供穩(wěn)定可靠的識(shí)別服務(wù)。  4. 節(jié)省成本:離線語(yǔ)音識(shí)別不需要使用云服務(wù),可以避免云服務(wù)的使用
    發(fā)表于 11-24 17:41

    接收靈敏度的定義公式

    接收靈敏度的定義公式 摘要:本應(yīng)用筆記論述了擴(kuò)頻系統(tǒng)靈敏度的定義以及計(jì)算數(shù)字通信接收機(jī)靈敏度的方法。本文提供了接收
    發(fā)表于 04-25 09:42 ?1.5w次閱讀
    接收<b class='flag-5'>靈敏度</b>的定義公式

    什么是接收靈敏度

    什么是接收靈敏度 摘要:本應(yīng)用筆記論述了擴(kuò)頻系統(tǒng)靈敏度的定義以及計(jì)算數(shù)字通信接收機(jī)靈敏度的方法。本文提供了接收機(jī)靈敏度方程的逐步推
    發(fā)表于 05-08 10:46 ?4217次閱讀
    什么是接收<b class='flag-5'>靈敏度</b>

    藍(lán)牙的靈敏度

    藍(lán)牙的靈敏度   保證達(dá)到所要求的誤比特率的條件下,接收所需要的最小輸入功率。接收靈敏度一般用dBm來(lái)表示,它是以lmW光功率為基礎(chǔ)的絕對(duì)
    發(fā)表于 12-28 14:51 ?7322次閱讀

    接收器靈敏度測(cè)試

    GPS 測(cè)試中的一項(xiàng)重要因素是接收器的靈敏度。主要測(cè)試內(nèi)容是捕獲靈敏度和跟蹤靈敏度。一般而言,地基天線接收到的 RF(射頻)功率水平介于 -125dBm 至 -150dBm 之間,具體
    發(fā)表于 01-11 15:35 ?7284次閱讀
    接收器<b class='flag-5'>靈敏度</b>測(cè)試

    如何提高收音機(jī)的靈敏度

    提高收音機(jī)的靈敏度的工作可以分為兩個(gè)階段,一是設(shè)計(jì)者和生產(chǎn)廠家從電路、工藝、結(jié)構(gòu)等多因素入手來(lái)生產(chǎn)高靈敏度的收音機(jī)。另一方面是對(duì)于消費(fèi)者已經(jīng)買到手的收音機(jī)如何提高靈敏度問(wèn)題。
    的頭像 發(fā)表于 12-05 16:34 ?1.8w次閱讀

    無(wú)線模塊性能測(cè)試—靈敏度

    靈敏度在無(wú)線模塊中是一項(xiàng)非常重要的參數(shù),在無(wú)線通訊領(lǐng)域中,接收靈敏度就好比人類的聽(tīng)力一樣,提高信號(hào)的接收靈敏度可使無(wú)線產(chǎn)品具有更強(qiáng)地捕獲弱信號(hào)的能力。當(dāng)傳輸距離越遠(yuǎn)時(shí),信號(hào)就會(huì)越弱,這時(shí)靈敏度
    的頭像 發(fā)表于 09-13 11:33 ?3410次閱讀
    無(wú)線模塊性能測(cè)試—<b class='flag-5'>靈敏度</b>

    柔性傳感器的靈敏度多少算高?傳感器靈敏度大小與靈敏系數(shù)的關(guān)系

    柔性傳感器的靈敏度多少算高?傳感器靈敏度大小與靈敏系數(shù)的關(guān)系? 柔性傳感器的應(yīng)用范圍非常廣泛,靈敏度大小是衡量其性能優(yōu)劣的重要指標(biāo)之一。傳感器靈敏度
    的頭像 發(fā)表于 10-24 11:49 ?2058次閱讀

    澎湃微離線語(yǔ)音識(shí)別應(yīng)用實(shí)例

    完全在本地運(yùn)行,不需要聯(lián)網(wǎng)和后臺(tái)服務(wù)器,具有明顯的低成本、低功耗優(yōu)勢(shì)。本文分享一款基于MCU平臺(tái)的離線語(yǔ)音方案,具有識(shí)別靈敏度高、成本低廉和應(yīng)用方便等特點(diǎn),供大家參考。 廢話不多說(shuō),直
    發(fā)表于 03-15 14:11 ?319次閱讀
    澎湃微<b class='flag-5'>離線</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>應(yīng)用實(shí)例