0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文帶你全面熟悉智能語(yǔ)音之麥克風(fēng)陣列技術(shù)的原理

電子設(shè)計(jì) ? 來(lái)源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-12-13 14:06 ? 次閱讀

麥克風(fēng)陣列(Microphone Array),從字面上,指的是麥克風(fēng)的排列。也就是說由一定數(shù)目的聲學(xué)傳感器(一般是麥克風(fēng))組成,用來(lái)對(duì)聲場(chǎng)的空間特性進(jìn)行采樣并處理的系統(tǒng)。

早在20世紀(jì)70、80年代,麥克風(fēng)陣列已經(jīng)被應(yīng)用于語(yǔ)音信號(hào)處理的研究中,進(jìn)入90年代以來(lái),基于麥克風(fēng)陣列的語(yǔ)音信號(hào)處理算法逐漸成為一個(gè)新的研究熱點(diǎn)。而到了“聲控時(shí)代”,這項(xiàng)技術(shù)的重要性顯得尤為突出。

麥克風(fēng)陣列能干什么?

任何一項(xiàng)技術(shù)的發(fā)生發(fā)展都伴隨著問題的提出及解決,麥克風(fēng)陣列也是如此。那么它主要應(yīng)用在哪些場(chǎng)景下呢?又有著怎樣的功能!

◆【噪聲環(huán)境怎么破?】—— 語(yǔ)音增強(qiáng)(Speech Enhancement)

語(yǔ)音增強(qiáng)是指當(dāng)語(yǔ)音信號(hào)被各種各樣的噪聲(包括語(yǔ)音)干擾甚至淹沒后,從含噪聲的語(yǔ)音信號(hào)中提取出純凈語(yǔ)音的過程。所以DingDong在嘈雜環(huán)境下,也能準(zhǔn)確識(shí)別語(yǔ)音指令。

通過麥克風(fēng)陣列波束形成進(jìn)行語(yǔ)音增強(qiáng)示意圖

從20世紀(jì)60年代開始,Boll等研究者先后提出了針對(duì)使用一個(gè)麥克風(fēng)的語(yǔ)音增強(qiáng)技術(shù),稱為單通道語(yǔ)音增強(qiáng)。因?yàn)樗褂玫柠溈孙L(fēng)個(gè)數(shù)最少,并且充分考慮到了語(yǔ)音譜和噪聲譜的特性,使得這些方法在某些場(chǎng)景下也具有較好的噪聲抑制效果,并因其方法簡(jiǎn)單、易于實(shí)現(xiàn)的特點(diǎn)廣泛應(yīng)用于現(xiàn)有語(yǔ)音通信系統(tǒng)與消費(fèi)電子系統(tǒng)中。

但是,在復(fù)雜的聲學(xué)環(huán)境下,噪聲總是來(lái)自于四面八方,且其與語(yǔ)音信號(hào)在時(shí)間和頻譜上常常是相互交疊的,再加上回波和混響的影響,利用單麥克風(fēng)捕捉相對(duì)純凈的語(yǔ)音是非常困難的。而麥克風(fēng)陣列融合了語(yǔ)音信號(hào)的空時(shí)信息,可以同時(shí)提取聲源并抑制噪聲。

目前科大訊飛已經(jīng)實(shí)現(xiàn)了基于線性陣列、平面陣列以及空間立體陣列的波束形成和降噪技術(shù),效果均達(dá)到業(yè)界一流水平。

2013年科大訊飛車載降噪產(chǎn)品和國(guó)際競(jìng)爭(zhēng)對(duì)手效果對(duì)比

◆【說話人老是變幻位置怎么破?】——聲源定位(Source Localization)

現(xiàn)實(shí)中,聲源的位置是不斷變化的,這對(duì)于麥克風(fēng)收音來(lái)說,是個(gè)障礙。麥克風(fēng)陣列則可以進(jìn)行聲源定位,聲源定位技術(shù)是指使用麥克風(fēng)陣列來(lái)計(jì)算目標(biāo)說話人的角度和距離,從而實(shí)現(xiàn)對(duì)目標(biāo)說話人的跟蹤以及后續(xù)的語(yǔ)音定向拾取,是人機(jī)交互、音視頻會(huì)議等領(lǐng)域非常重要的前處理技術(shù)。所以麥克風(fēng)陣列技術(shù)不限制說話人的運(yùn)動(dòng),不需要移動(dòng)位置以改變其接收方向,具有靈活的波束控制、較高的空間分辨率、高的信號(hào)增益與較強(qiáng)的抗干擾能力等特點(diǎn),因而成為智能語(yǔ)音處理系統(tǒng)中捕捉說話人語(yǔ)音的重要手段。

混響產(chǎn)生原因示意圖

◆【室內(nèi)回聲太大怎么破?】——去混響(Dereverberation)

一般我們聽音樂時(shí),希望有混響的效果,這是聽覺上的一種享受。合適的混響會(huì)使得聲音圓潤(rùn)動(dòng)聽、富有感染力。混響(Reverberation)現(xiàn)象指的是聲波在室內(nèi)傳播時(shí),要被墻壁、天花板、地板等障礙物形成反射聲,并和直達(dá)聲形成疊加,這種現(xiàn)象稱為混響。

但是,混響現(xiàn)象對(duì)于識(shí)別就沒有什么好處了。由于混響則會(huì)使得不同步的語(yǔ)音相互疊加,帶來(lái)了音素的交疊掩蔽效應(yīng)(Phoneme Overlap Effect),從而嚴(yán)重影響語(yǔ)音識(shí)別效果。

影響語(yǔ)音識(shí)別的部分一般是晚期混響部分,所以去混響的主要工作重點(diǎn)是放在如何去除晚期混響上面,多年來(lái),去混響技術(shù)抑制是業(yè)界研究的熱點(diǎn)和難點(diǎn)。利用麥克風(fēng)陣列去混響的主要方法有以下幾種:

1、基于盲語(yǔ)音增強(qiáng)的方法(Blind signal enhancement approach),即將混響信號(hào)作為普通的加性噪聲信號(hào),在這個(gè)上面應(yīng)用語(yǔ)音增強(qiáng)算法。

2、基于波束形成的方法(Beamforming based approach),通過將多麥克風(fēng)對(duì)收集的信號(hào)進(jìn)行加權(quán)相加,在目標(biāo)信號(hào)的方向形成一個(gè)拾音波束,同時(shí)衰減來(lái)自其他方向的反射聲。

3、基于逆濾波的方法(An inverse filtering approach),通過麥克風(fēng)陣列估計(jì)房間的房間沖擊響應(yīng)(Room Impulse Response, RIR),設(shè)計(jì)重構(gòu)濾波器來(lái)補(bǔ)償來(lái)消除混響。

現(xiàn)在科大訊飛實(shí)現(xiàn)的基于麥克風(fēng)陣列的去混響技術(shù)能很好的對(duì)房間的混響情況進(jìn)行自適應(yīng)的估計(jì),從而很好的進(jìn)行純凈信號(hào)的還原,顯著的提升了語(yǔ)音聽感和識(shí)別效果,在測(cè)試對(duì)比中,多種混響時(shí)間下識(shí)別效果接近手機(jī)近講水平。

混響語(yǔ)音信號(hào)頻譜

經(jīng)過去混響后的語(yǔ)音信號(hào)頻譜

◆【說話人太多怎么破?】——聲源信號(hào)提取(分離)

家里人說話太多,DingDong聽誰(shuí)的呢。這個(gè)時(shí)候就需要DingDong聰明的辨別出哪個(gè)聲音才是指令。而麥克風(fēng)陣列可以實(shí)現(xiàn)聲源信號(hào)提取,聲源信號(hào)的提取就是從多個(gè)聲音信號(hào)中提取出目標(biāo)信號(hào),聲源信號(hào)分離技術(shù)則是將需要將多個(gè)混合聲音全部提取出來(lái)。

通過麥克風(fēng)陣列波束形成做語(yǔ)音提取和分離

利用麥克風(fēng)陣列做信號(hào)的提取和分離主要有以下幾種方式:

1、基于波束形成的方法,即通過向不同方向的聲源分別形成拾音波束,并且抑制其他方向的聲音,來(lái)進(jìn)行語(yǔ)音提取或分離:

2、基于傳統(tǒng)的盲源信號(hào)分離(Blind Source Separation)的方法進(jìn)行,主要包括主成分分析(Principal Component Analysis,PCA)和基于獨(dú)立成分分析(Independent Component Analysis,ICA)的方法。

進(jìn)擊的麥克風(fēng)陣列

麥克風(fēng)陣列技術(shù)雖然已經(jīng)可以達(dá)到相當(dāng)?shù)募夹g(shù)水平,但是總體上還是存在一些問題的,比如當(dāng)麥克風(fēng)和信號(hào)源距離太遠(yuǎn)時(shí)(比如10m、20m距離),錄制信號(hào)的信噪比會(huì)很低,算法處理難度很大;對(duì)于便攜設(shè)備來(lái)說,受設(shè)備尺寸以及功耗的限制,麥克風(fēng)的個(gè)數(shù)不能太多,陣列尺寸也不能太大。而分布式麥克風(fēng)陣列技術(shù)則是解決當(dāng)前問題的一個(gè)可能途徑。所謂分布式陣列就是將子陣元或子陣列布局到更大的范圍內(nèi),相互之間通過有線或者無(wú)線的方式進(jìn)行數(shù)據(jù)的交換和共享,并在此基礎(chǔ)上進(jìn)行廣義上的聲源定位、波束形成等技術(shù)實(shí)現(xiàn)信號(hào)處理。

相對(duì)于目前集中式的麥克風(fēng)陣列,分布式陣列的優(yōu)勢(shì)也是非常明顯的。首先分布式麥克風(fēng)陣列(尤其無(wú)線傳輸)的尺寸的限制就不存在了;另外,陣列的節(jié)點(diǎn)可以覆蓋很大的面積——總會(huì)有一個(gè)陣列的節(jié)點(diǎn)距離聲源很近,錄音信噪比大幅度提升,算法處理難度也會(huì)降低,總體的信號(hào)處理的效果也會(huì)有非常顯著的提升,因此分布式陣列有可能是未來(lái)智能家居和會(huì)議系統(tǒng)中的主流方案。

在萬(wàn)物互聯(lián)的今天,麥克風(fēng)陣列技術(shù)已經(jīng)深刻的走進(jìn)了我們的日常生活。在智能車載、智能家居、機(jī)器人、可穿戴設(shè)備等應(yīng)用熱潮正興起的時(shí)代,語(yǔ)音交互由于其便捷性,成了人機(jī)交互入口的第一選擇,麥克風(fēng)陣列自然也成為其中非常重要的前端技術(shù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于Amazon AVS 智能音箱麥克風(fēng)陣列立體聲開發(fā)方案

    適用于Amazon AVS的VocalFusion?立體聲開發(fā)套件具有緊湊的四麥克風(fēng)線性陣列,使開發(fā)人員和OEM能夠?yàn)橄M(fèi)電子產(chǎn)品和物聯(lián)網(wǎng)產(chǎn)品添加遠(yuǎn)場(chǎng)語(yǔ)音捕獲。線性設(shè)計(jì)經(jīng)過優(yōu)化,可集成到智能
    發(fā)表于 07-12 10:25

    為什么需要麥克風(fēng)陣列

    了某語(yǔ)音識(shí)別引擎在單麥克風(fēng)和四麥克風(fēng)環(huán)形陣列的識(shí)別率對(duì)比。另外也要提醒,語(yǔ)音識(shí)別率并非只有個(gè)W
    發(fā)表于 07-28 14:25

    科普麥克風(fēng)陣列原理

    1 麥克風(fēng)陣列麥克風(fēng)陣列,是組位于空間不同位置的全向麥克風(fēng)
    發(fā)表于 07-28 14:28

    麥克風(fēng)陣列介紹

    模型和遠(yuǎn)場(chǎng)模型的劃分沒有絕對(duì)的標(biāo)準(zhǔn),般認(rèn)為聲源離麥克風(fēng)陣列中心參考點(diǎn)的距離遠(yuǎn)大于信號(hào)波長(zhǎng)時(shí)為遠(yuǎn)場(chǎng);反之,則為近場(chǎng)。設(shè)均勻線性陣列相鄰陣元之間的距離(又稱
    發(fā)表于 08-08 18:43

    全球量產(chǎn)麥克風(fēng)陣列的陣型技術(shù)盤點(diǎn)

    知名產(chǎn)品的麥克風(fēng)陣型也多種多樣,即便相同的陣型,其陣元間距也會(huì)不同,為何會(huì)產(chǎn)生這個(gè)現(xiàn)象?1、麥克風(fēng)陣列技術(shù)首先從麥克風(fēng)
    發(fā)表于 08-08 18:55

    汽車 麥克風(fēng)陣列技術(shù)進(jìn)行詳述

    的就是車輛運(yùn)行過程中噪音比較大,當(dāng)然其噪音還不算很復(fù)雜,加入CNN神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等技術(shù)會(huì)有很好的除噪效果。 下面就麥克風(fēng)陣列技術(shù)進(jìn)行詳述。定義
    發(fā)表于 08-10 14:30

    基于麥克風(fēng)陣列語(yǔ)音盲信號(hào)分離DSP系統(tǒng)的信:本文構(gòu)建了基于

    本文構(gòu)建了基于麥克風(fēng)陣列語(yǔ)音盲信號(hào)分離DSP實(shí)驗(yàn)平臺(tái),重點(diǎn)介紹了麥克風(fēng)陣列的時(shí)分多路以及DMA結(jié)合McBSP的數(shù)據(jù)雙向傳輸
    發(fā)表于 05-09 13:20 ?34次下載

    麥克風(fēng)陣列語(yǔ)音增強(qiáng)技術(shù)及其應(yīng)用

    本文簡(jiǎn)要敘述了應(yīng)用麥克風(fēng)陣列進(jìn)行語(yǔ)音增強(qiáng)的原理及方法。且由于麥克風(fēng)陣列在實(shí)際語(yǔ)音處理時(shí)具有良好的
    發(fā)表于 09-08 10:20 ?52次下載

    結(jié)合麥克風(fēng)陣列及模型調(diào)整技術(shù)遠(yuǎn)距離語(yǔ)音

    本篇論文提出種可應(yīng)用于噪音環(huán)境下麥克風(fēng)陣列(Microphone Array)的語(yǔ)音辨識(shí)演算 法,其主要的目的在于克服傳統(tǒng)電腦語(yǔ)音辨識(shí)系統(tǒng)
    發(fā)表于 03-29 09:59 ?48次下載

    基于麥克風(fēng)陣列語(yǔ)音增強(qiáng)技術(shù)及應(yīng)用

    麥克風(fēng)陣列進(jìn)行語(yǔ)音處理的方法可以提高信噪比,解決環(huán)境噪聲,回聲和混響引起的語(yǔ)音識(shí)別性能降低的問題。
    發(fā)表于 03-29 10:54 ?94次下載

    麥克風(fēng)陣列原理與應(yīng)用

    麥克風(fēng)陣列原理與應(yīng)用
    發(fā)表于 08-08 11:43 ?63次下載

    沐渥科技詳解麥克風(fēng)陣列的原理、分類及作用

    從字面上看,麥克風(fēng)陣列指的就是麥克風(fēng)的排列。也就是將定數(shù)目的麥克風(fēng)按照定的規(guī)則形狀進(jìn)行布局形
    的頭像 發(fā)表于 07-11 17:22 ?1565次閱讀
    沐渥科技詳解<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>的原理、分類及作用

    全了解麥克風(fēng)陣列

    什么是麥克風(fēng)陣列? 想象一下一個(gè)小型音響部隊(duì)在你面前,它們站成排,用不同的麥克風(fēng)捕捉聲音。這就是麥克風(fēng)
    的頭像 發(fā)表于 09-03 16:03 ?876次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>全了解<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>

    主流的麥克風(fēng)陣列有哪些?

    麥克風(fēng)陣列在HiFi音頻解決方案中的重要性體現(xiàn)在它對(duì)音質(zhì)提升的全面貢獻(xiàn)。通過精準(zhǔn)的聲源定位、噪聲抑制、空間感增強(qiáng)和智能處理,麥克風(fēng)
    的頭像 發(fā)表于 10-08 20:52 ?379次閱讀
    主流的<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>有哪些?

    Sitara Linux ALSA DSP麥克風(fēng)陣列語(yǔ)音識(shí)別

    電子發(fā)燒友網(wǎng)站提供《Sitara Linux ALSA DSP麥克風(fēng)陣列語(yǔ)音識(shí)別.pdf》資料免費(fèi)下載
    發(fā)表于 10-10 09:13 ?0次下載
    Sitara Linux ALSA DSP<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b><b class='flag-5'>語(yǔ)音</b>識(shí)別