0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

啟用語音的設(shè)備測試分步指南

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Keyur Shah ? 2022-10-26 09:57 ? 次閱讀

有人說,設(shè)備不能做人類能做的一切。然而,我們?nèi)粘I钪惺褂玫脑O(shè)備在過去幾十年中一直在發(fā)展。我們已經(jīng)看到它們?cè)诠δ埽B接性和大小方面的重大變化。然而,最大的挑戰(zhàn)之一是設(shè)備的尺寸,因?yàn)槿藗兺度肓烁嗟木韺?shí)現(xiàn)更小的外形尺寸。

幾年前,一個(gè)新的挑戰(zhàn)出現(xiàn)了:設(shè)備不能像人類一樣進(jìn)行通信。這導(dǎo)致獨(dú)立設(shè)備被轉(zhuǎn)換為具有附加語音操作的連接設(shè)備。

支持語音的設(shè)備如何幫助人類?

最初,需要人工觸摸才能在設(shè)備上執(zhí)行任何操作?,F(xiàn)在,借助支持語音的設(shè)備和物聯(lián)網(wǎng)技術(shù),人類可以通過語音發(fā)出命令來操作設(shè)備。這些新發(fā)明的設(shè)備將人聲轉(zhuǎn)換為設(shè)備動(dòng)作,通過互聯(lián)網(wǎng)向另一臺(tái)設(shè)備發(fā)送命令,并執(zhí)行所需的動(dòng)作。這些設(shè)備不僅可以與人類交互,還可以通過互聯(lián)網(wǎng)與其他設(shè)備進(jìn)行交互。

語音設(shè)備測試的主要挑戰(zhàn)

世界各地支持語音的設(shè)備的日常使用正在迅速增加。500 多個(gè)國家/地區(qū)支持 1000 多種語言,這些語言具有不同的口音、性別和基于年齡組的語音調(diào)制,這使得驗(yàn)證支持語音的設(shè)備變得具有挑戰(zhàn)性。在短時(shí)間內(nèi)用這么多不同的組合和排列來測試這些設(shè)備幾乎是不可能的。因此,讓我們看看如何自動(dòng)測試支持語音的設(shè)備。

自動(dòng)化支持語音的設(shè)備測試

為了避免手動(dòng)測試工作,我們需要設(shè)計(jì)一個(gè)自動(dòng)化解決方案,該解決方案可用于使用不同的語言測試這些設(shè)備。最簡單的選擇是使用框架,這些框架可以幫助開發(fā)具有此類語音集成設(shè)備的自動(dòng)化腳本。

截至目前,市場上沒有開源框架可以提供測試與語音設(shè)備集成所需的所有功能。此處的挑戰(zhàn)是如何以不同的語言向設(shè)備發(fā)出命令,如何從設(shè)備讀取響應(yīng)并測試預(yù)期的輸出。

要在沒有手動(dòng)操作的情況下向設(shè)備發(fā)出命令,需要以文本格式標(biāo)識(shí)命令。將文本轉(zhuǎn)換為音頻格式。

播放音頻,以便啟用語音的設(shè)備可以收聽和處理。

等待來自設(shè)備的響應(yīng),將其錄制在音頻文件中,最后一步您需要將此音頻轉(zhuǎn)換為文本以匹配預(yù)期的格式。

每個(gè)設(shè)備測試程序都有定制要求;因此,框架必須是模塊化的。為了獲得解決方案,我們需要設(shè)計(jì)一個(gè)模塊化和可擴(kuò)展的框架,其中該解決方案的每個(gè)步驟都可以由市場上可用的開源或付費(fèi)庫實(shí)現(xiàn)。

我們?cè)谝韵驴蚣苤性O(shè)計(jì)了4個(gè)模塊:

多語言文本:將文本從一種語言轉(zhuǎn)換為另一種語言

文本音頻模塊:將文本轉(zhuǎn)換為mp3

音頻文本模塊:將 wav 轉(zhuǎn)換為文本

音頻模塊:

使用音頻輸出設(shè)備播放 mp3 文件

使用麥克風(fēng)讀取音頻數(shù)據(jù)

將音頻數(shù)據(jù)保存到wav文件

詳細(xì)解決方案

1.準(zhǔn)備英文設(shè)備命令

a.使用多語言文本模塊將設(shè)備命令轉(zhuǎn)換為設(shè)備可以理解的語言。它使用Google提供的服務(wù)進(jìn)行翻譯,您可以在其中將文本從任何源語言翻譯成任何所需的語言。

2.為翻譯文本創(chuàng)建音頻文件

a.使用文本音頻模塊將文本轉(zhuǎn)換為音頻。生成的音頻可以在音頻輸出設(shè)備上播放。此模塊在后端使用谷歌文本到語音轉(zhuǎn)換服務(wù)。

3.播放音頻

a.使用音頻模塊將mp3文件播放到音頻輸出設(shè)備。

b.此步驟要求音頻輸出設(shè)備和啟用語音的設(shè)備靠近,以便在播放音頻時(shí),設(shè)備可以捕獲音頻并處理命令。

4.錄制音頻

a.此步驟是捕獲來自啟用語音的設(shè)備響應(yīng)所必需的。

b.使用音頻模塊從麥克風(fēng)捕獲錄音數(shù)據(jù)。您需要傳遞持續(xù)時(shí)間參數(shù)以提及您希望錄制多長時(shí)間,并且模塊返回音頻樣本數(shù)據(jù)

c.一旦示例數(shù)據(jù)可用,就需要將其另存為wav(音頻)文件。為了實(shí)現(xiàn)這一點(diǎn),可以使用save_audio_to_file方法。此方法獲取示例音頻數(shù)據(jù)并將其寫入 wav 文件,該文件以后可以使用音頻設(shè)備播放,也可以用于將其轉(zhuǎn)換為文本。

5.將捕獲的音頻轉(zhuǎn)換為文本

a.使用文本音頻模塊將 wav 文件轉(zhuǎn)換為文本內(nèi)容。這是使用語音識(shí)別器實(shí)現(xiàn)的。您應(yīng)該指定輸入 wav 文件和音頻內(nèi)容語言。

b.To 將音頻轉(zhuǎn)換為文本,則可以使用各種供應(yīng)商提供的第三方庫。

6.將上述文本翻譯成英語,并根據(jù)英語的預(yù)期結(jié)果進(jìn)行驗(yàn)證

使用上述4個(gè)模塊,一次就可以實(shí)現(xiàn)基于語音的集成設(shè)備的語音自動(dòng)化。

家庭自動(dòng)化產(chǎn)品端到端測試的真實(shí)場景

家庭自動(dòng)化系統(tǒng)由各種設(shè)備組成,這些設(shè)備可以使用REST服務(wù)通過網(wǎng)絡(luò)進(jìn)行操作。安全攝像頭,燈,恒溫器,傳感器和門鈴是家庭自動(dòng)化設(shè)備的幾個(gè)例子。例如,作為房主的最終用戶可以使用互聯(lián)網(wǎng)門戶遠(yuǎn)程打開或關(guān)閉燈。一些系統(tǒng)提供與Alexa,谷歌等第三方合作伙伴的集成。

公司提供的設(shè)備可以收聽人聲并執(zhí)行用戶請(qǐng)求的操作。因此,將Light視為家庭自動(dòng)化產(chǎn)品,將Alexa視為家庭自動(dòng)化系統(tǒng)提供商的第三方合作伙伴,我們希望測試是否可以通過Alexa打開/關(guān)閉燈光。

要自動(dòng)執(zhí)行 E2E 方案,我們需要使用上面討論的自動(dòng)化框架執(zhí)行以下步驟。

1.準(zhǔn)備Alexa命令以打開英語的燈。

a.“Alexa,開燈”

2.將上述命令轉(zhuǎn)換為mp3文件

3.使用連接到自動(dòng)化機(jī)器的揚(yáng)聲器在Alexa設(shè)備附近播放mp3文件。

4.在 wav 文件中記錄來自 Alexa 的響應(yīng)。

5.將音頻文件轉(zhuǎn)換為文本,可以是“確定,打開燈”或“燈已打開”。

6.使用預(yù)期的結(jié)果集驗(yàn)證轉(zhuǎn)換后的文本。

7.In 驗(yàn)證,只需提前一步,我們還可以使用以下方法驗(yàn)證實(shí)際的物聯(lián)網(wǎng)燈狀態(tài):

a.REST API可用于從家庭安全系統(tǒng)獲取光狀態(tài)

b.可以完成網(wǎng)絡(luò)安全門戶的Web自動(dòng)化以驗(yàn)證光照狀態(tài)

c.如果光照狀態(tài)存儲(chǔ)在云數(shù)據(jù)庫中,我們可以從數(shù)據(jù)庫獲取數(shù)據(jù)以驗(yàn)證狀態(tài)

結(jié)論

使用上述步驟,不僅可以僅使用一個(gè)支持語音的設(shè)備來測試系統(tǒng)集成或端到端測試,還可以通過組合多個(gè)客戶端或設(shè)備來測試系統(tǒng)。用戶可以使用Alexa對(duì)其中一個(gè)設(shè)備/產(chǎn)品執(zhí)行操作,并使用谷歌或門戶驗(yàn)證其狀態(tài),反之亦然。例如,用戶要求 Google 打開指示燈,然后使用 Alexa/客戶門戶獲取指示燈狀態(tài)。

對(duì)于需要從設(shè)備到應(yīng)用程序的全面測試覆蓋的產(chǎn)品公司來說,eInfochips是首選合作伙伴。eInfochips 通過測試自動(dòng)化、SDET(測試軟件開發(fā)工程師)、左移測試和 DevOps,節(jié)省了大量成本和工作量。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1752

    瀏覽量

    57333
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2899

    文章

    43822

    瀏覽量

    369352
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    掃地機(jī)語音方案WT588F02B-8S,OTA升級(jí)支持在線更換語音,快速開發(fā)

    ,隨著語音交互技術(shù)的日益成熟,越來越多的智能設(shè)備開始采用語音芯片來實(shí)現(xiàn)語音導(dǎo)航、提示和警報(bào)等功能。在這種背景下,掃地機(jī)加入語音芯片成為了一個(gè)
    的頭像 發(fā)表于 10-25 10:37 ?63次閱讀

    啟用多個(gè)TPS4019x設(shè)備

    電子發(fā)燒友網(wǎng)站提供《啟用多個(gè)TPS4019x設(shè)備.pdf》資料免費(fèi)下載
    發(fā)表于 10-10 10:58 ?0次下載
    <b class='flag-5'>啟用</b>多個(gè)TPS4019x<b class='flag-5'>設(shè)備</b>

    物聯(lián)網(wǎng)系統(tǒng)中音頻方案的“大腦”_語音芯片

    01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用語音芯片 物聯(lián)網(wǎng)系統(tǒng)中使用語音芯片的原因可以歸結(jié)為以下幾個(gè)方面: 1、提升用戶體驗(yàn) 語音交互:語音芯片使得物聯(lián)網(wǎng)設(shè)備
    的頭像 發(fā)表于 09-26 14:26 ?226次閱讀
    物聯(lián)網(wǎng)系統(tǒng)中音頻方案的“大腦”_<b class='flag-5'>語音</b>芯片

    CC256x測試指南

    電子發(fā)燒友網(wǎng)站提供《CC256x測試指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 09:40 ?0次下載
    CC256x<b class='flag-5'>測試</b><b class='flag-5'>指南</b>

    電池負(fù)載測試:綜合指南

    在當(dāng)今的現(xiàn)代世界中,電池為各種設(shè)備供電,從智能手機(jī)和筆記本電腦到汽車和工業(yè)機(jī)械。但是,隨著時(shí)間的推移,電池可能會(huì)失去容量和性能,從而導(dǎo)致潛在的問題和不便。這就是電池負(fù)載測試發(fā)揮作用的地方。本綜合指南將探討電池負(fù)載
    的頭像 發(fā)表于 07-15 07:26 ?463次閱讀
    電池負(fù)載<b class='flag-5'>測試</b>:綜合<b class='flag-5'>指南</b>

    智能設(shè)備中的語音是如何寫入語音芯片的

    語音寫入語音芯片需經(jīng)語音文件準(zhǔn)備、格式轉(zhuǎn)換、燒錄過程、燒錄方式選擇和調(diào)試測試。雖非直接通過電腦寫入,但電腦在其中扮演重要角色。
    的頭像 發(fā)表于 07-10 11:45 ?515次閱讀

    TC333LP使用MEMTEST寄存器啟用測試模式會(huì)導(dǎo)致總線錯(cuò)誤的原因?

    ,沒有出現(xiàn)任何問題。 當(dāng)我們要初始化 CPU0 的 DSPR SRAMS(DMEM 和 DMEM1)時(shí),情況就發(fā)生了變化。 使用 MEMTEST 寄存器啟用測試模式會(huì)導(dǎo)致總線錯(cuò)誤。 DMEM
    發(fā)表于 05-23 07:11

    stm32f0怎么不使用語音IC做合成語音?

    我這邊板子就一個(gè)功放電路,要求不使用語音IC做語音,我聽別人說去了解MP3這一方面,但我只找到MCU軟解碼,但我怎么不了解,不清楚怎么做成自己的語音,要的是語音,不是歌曲
    發(fā)表于 04-25 06:00

    智能聲控?zé)艟邞?yīng)用語音識(shí)別芯片AT6811

    AT6811是一款超低功耗的離線智能語音識(shí)別芯片,集成了先進(jìn)的語音活動(dòng)監(jiān)測(VAD)、聲紋識(shí)別、自動(dòng)消噪神經(jīng)網(wǎng)絡(luò),擁有高效的電源管理模塊、數(shù)字和模擬語音信號(hào)輸入接口以及ARMCortex-M0內(nèi)核,并且搭配了GPIO、UART、
    的頭像 發(fā)表于 02-28 16:41 ?550次閱讀
    智能聲控?zé)艟邞?yīng)<b class='flag-5'>用語音</b>識(shí)別芯片AT6811

    XMC1300在啟用定時(shí)器中斷時(shí)會(huì)進(jìn)入硬故障處理程序的原因?

    EVAL_IM_FLEX_ADAPTER_V1 DAVE? 中為 XMC 1300 編寫程序,其中包括 SPI 和 EEPROM。 我的程序在啟用定時(shí)器中斷時(shí)會(huì)進(jìn)入硬故障處理程序,所以我想知道為什么。 有人能給我一個(gè)分步教程如何找出原因嗎? 我知道我應(yīng)該看看 CFSR 登
    發(fā)表于 01-18 07:34

    科大訊飛語音控制模塊怎么用

    科大訊飛語音控制模塊是一種人機(jī)交互技術(shù),它利用語音識(shí)別和語音合成技術(shù),使用戶可以通過語音指令來控制設(shè)備或應(yīng)用程序。本文將詳細(xì)介紹科大訊飛
    的頭像 發(fā)表于 12-25 13:58 ?1554次閱讀

    32高效細(xì)分步進(jìn)驅(qū)動(dòng)器介紹

    32高效細(xì)分步進(jìn)驅(qū)動(dòng)器 TB67S581FNG,用于替代傳統(tǒng)的DRV8825,為您的機(jī)械設(shè)備帶來卓越的性能提升。
    的頭像 發(fā)表于 12-20 10:59 ?568次閱讀
    32高效細(xì)<b class='flag-5'>分步</b>進(jìn)驅(qū)動(dòng)器介紹

    使用LTC2937排序和監(jiān)督的分步指南

    電子發(fā)燒友網(wǎng)站提供《使用LTC2937排序和監(jiān)督的分步指南.pdf》資料免費(fèi)下載
    發(fā)表于 11-24 14:39 ?0次下載
    使用LTC2937排序和監(jiān)督的<b class='flag-5'>分步</b><b class='flag-5'>指南</b>

    方言離線語音控制場景解決方案

    選擇合適的設(shè)備。選擇的設(shè)備應(yīng)該具有語音識(shí)別功能且支持方言識(shí)別,以確保他們能夠順利地控制設(shè)備。此外,為了讓老人或小孩更快地上手操作,可以提供簡單的操作
    發(fā)表于 11-17 17:57

    語音識(shí)別技術(shù)在教育領(lǐng)域的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,教育領(lǐng)域也開始應(yīng)用語音識(shí)別技術(shù)來提高教學(xué)質(zhì)量和學(xué)習(xí)效果。本文將探討語音識(shí)別技術(shù)在教育領(lǐng)域的應(yīng)用以及面臨的挑戰(zhàn)。 二、語音識(shí)別技術(shù)在教育領(lǐng)域的應(yīng)用 1.在線學(xué)習(xí)
    的頭像 發(fā)表于 11-02 18:44 ?647次閱讀