0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用智能語音交互芯片實現(xiàn)模擬練習(xí)器的設(shè)計

科技觀察員 ? 來源:羅姆半導(dǎo)體社區(qū) ? 作者:羅姆半導(dǎo)體社區(qū) ? 2022-04-12 16:53 ? 次閱讀

伴隨高科技技能在軍事范疇的廣泛運用,武器裝備也逐步向高、精、尖方向發(fā)展。傳統(tǒng)的軍事練習(xí)時間長,訓(xùn)練費用高,訓(xùn)練場地狹小,訓(xùn)練效果往往達(dá)不到預(yù)想的效果,對現(xiàn)代軍事訓(xùn)練的要求已經(jīng)不適應(yīng)。為解決上述問題,模仿練習(xí)應(yīng)運而生。為了進(jìn)一步提高練習(xí)效果,本文利用智能語音交互芯片設(shè)計了一個模擬練習(xí)器的示教回放系統(tǒng)。教學(xué)演示系統(tǒng)通過給操作者生動的演示來規(guī)范操作者的操作流程和相應(yīng)的操作表現(xiàn),大大縮短了操作者的練習(xí)時間,提高了練習(xí)效果?;胤畔到y(tǒng)記錄操作練習(xí)過程中每一位操作者的口令、聲音強度、動作、瞬間、動作表象等,待操作練習(xí)結(jié)束后再重復(fù)練習(xí)過程,以便操作者及時糾正自己的錯誤。示教系統(tǒng)也可理解為對規(guī)范操作練習(xí)進(jìn)程的回放。該系統(tǒng)不需求虛擬現(xiàn)實技能的撐持,在小型的嵌入式系統(tǒng)上就能夠完結(jié)。

1系統(tǒng)原理

該模仿練習(xí)器由一臺測控計算機和多臺從設(shè)備構(gòu)成。如圖1所示。在此僅對一臺從設(shè)備進(jìn)行介紹,其硬件系統(tǒng)主要由測控計算機、Arduinomega2560操控器、語音辨認(rèn)單元、聲強檢測單元、語音組成單元、面板操控單元、儀器面板等構(gòu)成。面板操控單元較為復(fù)雜,包含多種操控電路,在模仿練習(xí)中擔(dān)任該從設(shè)備在Arduinomega2560操控器的操控下完結(jié)整個練習(xí)進(jìn)程,在示教與回放系統(tǒng)中完結(jié)對方才操作練習(xí)操作表象的重演,其詳細(xì)電路規(guī)劃在此不做介紹。

poYBAGJVPe2AETsFAADXPhq-QgY166.png

語音辨認(rèn)單元擔(dān)任辨認(rèn)操作人員的操作口令;聲強檢測單元擔(dān)任檢測聲強巨細(xì)并以此作為判別是哪臺從設(shè)備操作人員口令的依據(jù);Arduinomega2560操控器擔(dān)任監(jiān)督儀器面板各元件的狀況來辨認(rèn)操作人員的動作,然后完結(jié)對操作練習(xí)進(jìn)程的記載。各儀器的操作表象依據(jù)操作動作事前編制無需記載。在操作回放進(jìn)程中,測控計算機依據(jù)所記載的數(shù)據(jù),經(jīng)過操控相應(yīng)從設(shè)備的Arduinomega2560操控器重現(xiàn)所記載的操作進(jìn)程。

2單元系統(tǒng)規(guī)劃

2.1語音辨認(rèn)單元規(guī)劃

當(dāng)時,語音辨認(rèn)技能的開展十分迅速,依照辨認(rèn)目標(biāo)的類型能夠分為特定人和非特定人語音辨認(rèn)。特定人是指辨認(rèn)目標(biāo)為專門的人,非特定人是指辨認(rèn)目標(biāo)是針對大多數(shù)用戶,通常需求收集多自己的語音進(jìn)行錄音和練習(xí),經(jīng)過學(xué)習(xí),然后到達(dá)較高的辨認(rèn)率。

這篇文章選用的LD3320語音辨認(rèn)芯片是一顆依據(jù)非特定人語音辨認(rèn)(SpeakerIndependentAutomaticSpeechRecognition,SIASR)技能的芯片。該芯片上集成了高精度的A/D和D/A接口,不再需求外接輔佐的FLASH和RAM,即能夠完結(jié)語音辨認(rèn)、聲控、人機對話功用,供給了真實的單芯片語音辨認(rèn)解決方案。而且,辨認(rèn)的要害詞語列表是能夠動態(tài)編輯的。其語音識別過程如圖2所示。

pYYBAGJVPemAe6iZAAB9Po1wr6U348.png

語音辨認(rèn)單元選用ATmega168作為MCU,擔(dān)任操控LD3320完結(jié)一切和語音辨認(rèn)有關(guān)的作業(yè),并將辨認(rèn)成果經(jīng)過串口上載至Arduinomega2560操控器。對LD3320芯片的各種操作,都必須經(jīng)過寄存器的操作來完結(jié),寄存器讀寫操作有2種方法(規(guī)范并行方法和串行SPI方法)。在此選用并行方法,將LD3320的數(shù)據(jù)端口與MCU的I/O口相連。

語音辨認(rèn)流程選用中止方法作業(yè),其作業(yè)流程分為初始化、寫入要害詞、開端辨認(rèn)和呼應(yīng)中止等。MCU的程序選用ARDUINOIDE編寫,調(diào)試完結(jié)后經(jīng)過串口進(jìn)行燒錄,操控LD3320完結(jié)語音辨認(rèn),并將辨認(rèn)成果上載至Arduinomega2560操控器。其硬件連接圖如圖3所示。

poYBAGJVPeWANRFsAADH807a3bk940.png

2.2聲強檢測單元規(guī)劃

在進(jìn)行語音辨認(rèn)時需求判別是某一臺從設(shè)備操作人員的口令,為此規(guī)劃聲強檢測單元電路,該電路僅需能夠判別出相對聲強的巨細(xì),無需檢測聲級,對檢測精度需求較低。

電容式MIC聲響傳感器將外部聲響信號變換成電信號,經(jīng)NE5532擴大電路進(jìn)行擴大,將輸入的微弱音頻信號變換為具有一定幅值的電壓信號,該電壓信號經(jīng)AC/DC有效值變換電路進(jìn)行裝換后進(jìn)行再次擴大,最終由Arduinomega2560操控器的A/D進(jìn)行采樣。其間D1端接Arduinomega2560操控器的A/D,INT1端接Arduinomega2560操控器的外部中止1.當(dāng)外界聲響信號大于預(yù)設(shè)的閾值時,三極管導(dǎo)通INT1端由高電平變?yōu)榈碗娖桨l(fā)作外部中止,操控器呼應(yīng)中止并進(jìn)行A/D采樣,采樣數(shù)據(jù)經(jīng)均值濾波后保留,待測控計算機查詢時上載該聲強數(shù)據(jù)。

2.3語音組成單元規(guī)劃

TTS(TextToSpeech)文本轉(zhuǎn)語音技能是人機智能對話開展的趨勢。依據(jù)TTS技能的語音系統(tǒng)無需事前錄音就能夠隨時依據(jù)查詢條件查出并組成語音進(jìn)行播報,然后大大減少了系統(tǒng)維護(hù)的作業(yè)量。利用此技能,經(jīng)過MCU或許PC機就能操控語音芯片發(fā)音。

這篇文章選用SYN6658中文語音組成芯片進(jìn)行語音組成。SYN6658經(jīng)過UART接口或SPI接口通訊方法,接納待組成的文本數(shù)據(jù),完結(jié)文本到語音(或TTS語音)的變換。操控器和SYN6658語音組成芯片之間經(jīng)過UART接口銜接,操控器經(jīng)過串口通訊向SYN6658語音組成芯片發(fā)送操控指令和文本,SYN6658語音組成芯片把接納到的文本組成為語音信號輸出,輸出的信號經(jīng)LM386功率擴大器進(jìn)行擴大后銜接到喇叭進(jìn)行播映。

pYYBAGJVPeCAaI-6AABO1U2oE94941.png

SYN6658語音組成電路選用芯片硬件數(shù)據(jù)手冊供給的典型使用電路進(jìn)行規(guī)劃,在此不做介紹,功率擴大電路選用美國國家半導(dǎo)體出產(chǎn)的音頻功率擴大器LM386進(jìn)行擴大。

在進(jìn)行語音組成時首要進(jìn)行初始化,包含發(fā)音人挑選、數(shù)字處理策略、語速調(diào)理、語調(diào)調(diào)理、音量調(diào)理等。

因為該系統(tǒng)要模仿多人發(fā)音,所以不一樣的從設(shè)備設(shè)置不一樣的發(fā)音人及語調(diào)與語速以便于區(qū)別。初始化后等待測控計算機的語音組成指令,待收到指令后芯片會向上位機發(fā)送1字節(jié)的狀況回傳,上位機可依據(jù)這個回傳來判別芯片當(dāng)時的作業(yè)狀況。

poYBAGJVPdyABBkrAADE6eq9rug719.png

3系統(tǒng)軟件規(guī)劃

示教與回放系統(tǒng)的軟件規(guī)劃包含測控計算機的軟件規(guī)劃和各從設(shè)備Arduinomega260操控器的軟件規(guī)劃。

測控計算機是整個系統(tǒng)的操控中心,其軟件選用C#進(jìn)行編寫,在示教與回放系統(tǒng)中主要是對操作數(shù)據(jù)的記載以便依據(jù)所記載的數(shù)據(jù)對操作進(jìn)程進(jìn)行準(zhǔn)確回放,需求記載的數(shù)據(jù)包含:各從設(shè)備操作人員的操作口令,操作動作,口令及動作時刻,各操作對應(yīng)的操作表象。為簡化記載數(shù)據(jù),事前編制好各事情代碼,記載進(jìn)程只記載代碼,大大提高程序效率。建立結(jié)構(gòu)體如下:

poYBAGJVPdiASiooAACfLx5Gleo771.png

在操作練習(xí)進(jìn)程中測控計算機每隔50ms對下位機進(jìn)行操控及輪詢,并記載反應(yīng)數(shù)據(jù),在數(shù)據(jù)記載時以50ms為一個單位。選用定時器對時刻進(jìn)行操控。在回放進(jìn)程中首要比對當(dāng)時時刻和所記載的時刻,當(dāng)所記載的時刻與當(dāng)時時刻吻合時測控計算機操控下位機履行該事情,完結(jié)事情回放。

Arduinomega2560操控器擔(dān)任接納測控計算機的操控指令并履行指令,讀取語音辨認(rèn)成果,對聲強數(shù)據(jù)收集和處理,操控語音組成單元進(jìn)行語音組成等。Arduinomega2560操控器選用串口中止的方法進(jìn)行指令接納。

測控計算機一旦正確接收到指令,就會執(zhí)行并傳回結(jié)果。如果測控計算機在限定的時間內(nèi)沒有得到回傳結(jié)果,就會顯示出故障,測控計算機就需要重新發(fā)送指令。下面顯示了數(shù)據(jù)接收的流程。本文運用智能語音芯片對模擬練習(xí)器的示教與播放系統(tǒng)進(jìn)行了設(shè)計,該系統(tǒng)目前還不能支持當(dāng)前流行的虛擬現(xiàn)實技術(shù),僅能支持MCU操作。本系統(tǒng)還可用于小型便攜設(shè)備,具有出色的使用前景。

poYBAGJVPdCAR0TpAADSIiGLTII649.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    282

    瀏覽量

    27951
  • 智能語音芯片
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    6881
  • 智能語音交互
    +關(guān)注

    關(guān)注

    0

    文章

    20

    瀏覽量

    2798
收藏 人收藏

    評論

    相關(guān)推薦

    車載導(dǎo)航人機語音交互系統(tǒng)的實現(xiàn)

    利用小詞匯量的關(guān)鍵詞識別引擎實現(xiàn)大詞匯量POI名稱的識別,并且獲得了滿意的識別正確率,但是耗時較長。結(jié)語本文主要完成了車載導(dǎo)航人機語音交互系統(tǒng)的設(shè)計和
    發(fā)表于 08-15 21:27

    E2910A PCI總線練習(xí)器技術(shù)規(guī)格

    E2910A PCI總線練習(xí)器技術(shù)規(guī)格
    發(fā)表于 03-08 12:00

    車載導(dǎo)航人機語音交互系統(tǒng)的設(shè)計和實現(xiàn)

    的設(shè)計中,根據(jù)人機交互的需求,設(shè)計語音導(dǎo)航系統(tǒng)的硬件框架如圖 1所示。語音導(dǎo)航系統(tǒng)和用戶之間的人機交互接口由觸摸屏、按鈕、話筒、顯示屏和擴音
    發(fā)表于 05-07 07:00

    基于智能語音交互芯片模擬訓(xùn)練器示教與回放系統(tǒng)設(shè)計

    解決上述問題,模擬訓(xùn)練應(yīng)運而生。為進(jìn)一步提高訓(xùn)練效果,本文利用智能語音交互芯片設(shè)計了某
    發(fā)表于 07-01 08:07

    如何自制簡易MORSE練習(xí)器

    這個練習(xí)器電路比較簡單,全部用分離元件插接,不需要集成電路。電路完成后可以通過改變 R1 和 C1 來改變音調(diào),電源可以使用任何 3V 電源。制作過程中,需要的工具只有一把剪子、一個萬用表。
    發(fā)表于 05-10 06:18

    如何自制簡易摩爾斯碼MORSE練習(xí)器

    很多朋友對 MORSE 電碼有興趣,但是手里暫時沒有短波機,無法練習(xí)拍發(fā),這時候,有個 MORSE 練習(xí)器就方便多了。筆者用分立元件和面包板自制了一個 MORSE 練習(xí)器,不需要動烙鐵,只要電路布線
    發(fā)表于 05-24 07:05

    電碼練習(xí)器

    電碼練習(xí)器
    發(fā)表于 12-20 22:21 ?1155次閱讀
    電碼<b class='flag-5'>練習(xí)器</b>

    莫爾斯電碼練習(xí)器電路原理圖

    莫爾斯電碼練習(xí)器電路原理
    發(fā)表于 09-25 23:18 ?5174次閱讀
    莫爾斯電碼<b class='flag-5'>練習(xí)器</b>電路原理圖

    基于Internet的語音交互系統(tǒng)的設(shè)計和實現(xiàn)

     描述了實現(xiàn)Internet語音交互系統(tǒng)的關(guān)鍵技術(shù),即利用Windows的多任務(wù)機制,結(jié)合Windows MDK低層音頻服務(wù)、Windows Sockets和
    發(fā)表于 05-10 13:14 ?1406次閱讀
    基于Internet的<b class='flag-5'>語音</b><b class='flag-5'>交互</b>系統(tǒng)的設(shè)計和<b class='flag-5'>實現(xiàn)</b>

    壓電陶瓷雙工對發(fā)電碼練習(xí)器電路圖

    長短不同的電碼聲。如需兩人進(jìn)行較遠(yuǎn)距離的雙工對發(fā)報務(wù)練習(xí),每人可以各持一架電碼練習(xí)器,在輸出處用雙線插頭進(jìn)行連接,當(dāng)一方發(fā)信號時,另一方就會收到信號,反之亦然。在這個對發(fā)電碼練習(xí)器上是不需要振動什么其它選擇開關(guān)的,因而收
    發(fā)表于 08-25 21:15 ?1651次閱讀
    壓電陶瓷雙工對發(fā)電碼<b class='flag-5'>練習(xí)器</b>電路圖

    莫爾斯電碼練習(xí)器原理圖

    莫爾斯電碼練習(xí)器原理圖都是值得參考的設(shè)計。
    發(fā)表于 05-11 17:11 ?51次下載

    智能語音交互是怎么實現(xiàn)交互流程中的輸入輸出呢?

    智能語音交互是人工智能的分支,相當(dāng)于語音助手,屬于一款智能型的手機應(yīng)用,通過
    的頭像 發(fā)表于 03-13 15:49 ?1.2w次閱讀

    自制簡易MORSE練習(xí)器,morse Trainer

    自制簡易MORSE練習(xí)器,morse Trainer 關(guān)鍵字:自制簡易MORSE練習(xí)器 很多朋友對 MORSE 電碼有興趣,但是手里
    的頭像 發(fā)表于 09-20 19:13 ?1759次閱讀

    340秒語音芯片,輕松實現(xiàn)語音交互,暢享智能生活WTV380語音ic方案

    隨著智能家居、安防報警、寵物用品 等,智能設(shè)備的普及,語音交互技術(shù)正在逐漸成為人機交互的主要方式之一。而如何
    發(fā)表于 03-08 15:19 ?233次閱讀

    340秒語音芯片,輕松實現(xiàn)語音交互,暢享智能生活WTV380語音ic方案

    隨著智能家居、安防報警、寵物用品 等,智能設(shè)備的普及,語音交互技術(shù)正在逐漸成為人機交互的主要方式之一。而如何
    的頭像 發(fā)表于 03-08 16:55 ?573次閱讀
    340秒<b class='flag-5'>語音</b><b class='flag-5'>芯片</b>,輕松<b class='flag-5'>實現(xiàn)</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b>,暢享<b class='flag-5'>智能</b>生活WTV380<b class='flag-5'>語音</b>ic方案