0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度解讀Gating類型自動混音技術(shù)(2)

嵌入式DSP ? 來源:未知 ? 作者:工程師飛燕 ? 2018-10-21 09:56 ? 次閱讀

在上一篇 “Gating自動混音器(一)“,我們已經(jīng)了解了Gating自動混音器是干什么用的,它主要解決的問題是什么。在有多個(gè)麥克風(fēng)的場景下,傳統(tǒng)的做法是將多個(gè)麥克風(fēng)混音輸出到音箱。這樣的做法不可取,它可能導(dǎo)致的問題是,一、及其容易產(chǎn)生嘯叫,因?yàn)?路信號混音,總輸出增加3dB,更何況多支呢。二、即使可以通過增益比例去控制每只麥克風(fēng)在總輸出中占的比例,以達(dá)到總輸出不增加的目的,也非常容易導(dǎo)致說話人說話的聲音太小,聽不清楚?;谝陨显颍艜凶詣踊煲舻某霈F(xiàn),自動混音徹徹底底地解決了根本問題。自動混音分為Gain-Sharing(增益共享)和Gating(門限)兩種類型,現(xiàn)在所講的是Gating類型自動混音。

上一期已經(jīng)講了Gating自動混音所應(yīng)具備的一些基本參數(shù)及含義,留下了一個(gè)關(guān)鍵點(diǎn),自適應(yīng)噪聲閾值如何獲取?在開始之前,先來看看為什么門限自動混音可以解決上邊提到的問題。

從圖中可以看出,每只麥克風(fēng)都有個(gè)Gate(門),當(dāng)麥克風(fēng)信號超過這個(gè)門限以后,才會導(dǎo)通信號。通過的信號和普通混音無異,混音之后通過一個(gè)由NOM(打開的麥克風(fēng)數(shù)量)控制的衰減因子,達(dá)到總輸出不變的目的。 在多只麥克風(fēng)的情況下,不會存在每個(gè)人都會在同時(shí)說話,正在同時(shí)說話的麥克風(fēng)只有那么1-3只而已。其他未說話的麥克風(fēng)將被關(guān)閉,不會被導(dǎo)通。這樣既可以保證總輸出不產(chǎn)生反饋,每只麥克風(fēng)說話的聲音又可以聽得清楚。

NOM:Number Of Open Mics. 算法實(shí)時(shí)計(jì)算打開的麥克風(fēng)數(shù)量,如果大于NOM Limits 設(shè)定的數(shù)量,新打開的麥克風(fēng)將從已經(jīng)打開的麥克風(fēng)中搶占優(yōu)先級最低的一個(gè), 如果沒有找到,該麥克風(fēng)不會被導(dǎo)通, NOM Limits起到一個(gè)限制作用。

在這里面,Gate是關(guān)鍵,如何保證麥克風(fēng)有信號的時(shí)候被打開,沒有人說話就不會被打開。簡單一點(diǎn),可以采用對每一只麥克風(fēng)設(shè)置一個(gè)開關(guān)閾值,信號超過閾值的時(shí)候就導(dǎo)通,小于閾值就關(guān)閉。 在很久以前,就是這么做的,并且使用了很長的一段時(shí)間。此方法不是特別的方便,環(huán)境噪音提高了,必須得手動去調(diào)整閾值。

在嘗試中,我考慮了2種方法:

1. 人聲檢測 , 只有說話的時(shí)候才被打開,不說話關(guān)閉 。

2. RMS電平檢測。

DSP系統(tǒng)中,除了能實(shí)現(xiàn)模塊功能,另一個(gè)最重要的就是資源了。這個(gè)算法占用的CPU資源類不應(yīng)超過5%, 人聲檢測不能采用太過復(fù)雜的基于統(tǒng)計(jì)模型的算法,一個(gè)麥克風(fēng)需要檢測一次,共有32個(gè)麥克風(fēng),這將勢必不可取。后來嘗試了短時(shí)過零率和短時(shí)能量等方法。結(jié)果不太理想,應(yīng)該來說檢測結(jié)果不太理想,有時(shí)說話了確不出聲,一句話的前面幾個(gè)字像被吃掉了一樣。 總結(jié)來說,短時(shí)過零率等方法并不能準(zhǔn)確判斷語音,第二個(gè)這類檢測方法都需要延時(shí)緩沖,大概10ms檢測數(shù)據(jù),吃字也是正常的。 被拋棄的想法就不細(xì)說了,有興趣的可以看看相關(guān)資料。

采用RMS檢測方法, RMS我們都知道,就是均方根嘛。相對來說算法簡單易實(shí)現(xiàn), 根據(jù)過去一段時(shí)間的RMS值作為該麥克風(fēng)的參考噪聲閾值。這里面最重要的就是時(shí)間的選取,要反應(yīng)的是過去的噪聲水平,而不是有信號的狀態(tài)。語音信號屬于非平穩(wěn)信號,利用這一特點(diǎn)應(yīng)取最小值。記為瞬態(tài)RMS, N取值30ms對應(yīng)的采樣值。 T為噪聲閾值,等于過去的K幀RMS最小值, K值根據(jù)實(shí)際情況調(diào)節(jié)。

K 取值依據(jù),應(yīng)大于說話尾音所能持續(xù)的時(shí)間,正常說話一個(gè)字也就100多ms,字與字之間會出現(xiàn)停頓,噪聲閾值的依據(jù)也就是停頓期間的噪聲水平。說一個(gè)情況,同事在測試期間,一個(gè)字不停的拖尾音,喂……….,持續(xù)10幾秒。這種情況導(dǎo)致算法提高了噪聲閾值,剛開始可以導(dǎo)通,之后的喂出不了聲。 那么這個(gè)K值應(yīng)取得更大,K*30ms 需要大于最大能持續(xù)的時(shí)間才能檢測到空隙。

根據(jù)測試情況,RMS方法可以作為自適應(yīng)噪聲閾值判斷的方法。在測試中,會存在另外一種情況,一只麥克風(fēng)說話時(shí),另一只麥克風(fēng)采集到了音箱擴(kuò)聲的信號被打開。如果NOM Limit設(shè)置成1,只允許一個(gè)麥克風(fēng)打開。采集信號的麥克風(fēng)就會搶占說話的麥克風(fēng),引起兩個(gè)麥克風(fēng)互相切換。此時(shí),應(yīng)調(diào)節(jié)2個(gè)參數(shù),一是保持時(shí)間,第二個(gè)靈敏度。

保持時(shí)間,停止說話后,該麥克風(fēng)保持多久才關(guān)閉,改時(shí)間要設(shè)置得比混響傳遞時(shí)間大一點(diǎn)。

靈敏度,實(shí)際上信號超過自適應(yīng)噪聲閾值+靈敏度才能判定為可以打開麥克風(fēng)。靈敏度需要設(shè)置高一點(diǎn),即使有反饋也不會輕易打開話筒。

以上就是Gating自動混音的全部內(nèi)容,代碼就不貼了,也沒什么意義,關(guān)鍵還是思路吧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 麥克風(fēng)
    +關(guān)注

    關(guān)注

    15

    文章

    630

    瀏覽量

    54718
  • 混音
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    7695
  • 混音器
    +關(guān)注

    關(guān)注

    2

    文章

    26

    瀏覽量

    13011

原文標(biāo)題:Gating 自動混音(二)

文章出處:【微信號:ddongcloud,微信公眾號:嵌入式DSP】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    我們?yōu)槭裁匆?b class='flag-5'>自動混音技術(shù)?

    自動混音技術(shù)并不是一項(xiàng)新技術(shù),從上個(gè)世紀(jì)70年代開始涌現(xiàn)各種類型自動
    的頭像 發(fā)表于 06-22 08:43 ?7509次閱讀

    clock-gating的綜合實(shí)現(xiàn)

    在ASIC設(shè)計(jì)中,項(xiàng)目會期望設(shè)計(jì)將代碼寫成clk-gating風(fēng)格,以便于DC綜合時(shí)將寄存器綜合成clk-gating結(jié)構(gòu),其目的是為了降低翻轉(zhuǎn)功耗。
    的頭像 發(fā)表于 09-04 15:55 ?1698次閱讀
    clock-<b class='flag-5'>gating</b>的綜合實(shí)現(xiàn)

    淺析clock gating模塊電路結(jié)構(gòu)

    ICG(integrated latch clock gate)就是一個(gè)gating時(shí)鐘的模塊,通過使能信號能夠關(guān)閉時(shí)鐘。
    的頭像 發(fā)表于 09-11 12:24 ?2141次閱讀
    淺析clock <b class='flag-5'>gating</b>模塊電路結(jié)構(gòu)

    【6.2】技術(shù)解讀(框架、場景案例解讀

    `技術(shù)解讀(框架、場景案例解讀)`
    發(fā)表于 06-04 17:12

    基于2n3904晶體管2通道混音器電路圖

      該2通道混音器電路基于2n3904晶體管,該晶體管形成2個(gè)前置放大器。2通道混音器電路的第一
    發(fā)表于 08-01 17:19

    基于數(shù)字語音教室的多路混音算法及應(yīng)用Multi-Point

    在研究音頻混音技術(shù)的基礎(chǔ)上,結(jié)合基于嵌入式技術(shù)的數(shù)字語音教室的實(shí)際情況,提出了一種應(yīng)用于數(shù)字語音教室的多路實(shí)時(shí)混音算法,并給出了在數(shù)字語音教室中利用多路
    發(fā)表于 05-26 13:50 ?58次下載

    汽車落水自動開門開窗技術(shù)解讀

    汽車落水自動開門開窗技術(shù)解讀
    發(fā)表于 01-26 11:14 ?7次下載

    深度解讀智能公交如何實(shí)現(xiàn)車路云協(xié)同

    CIDI究竟是如何運(yùn)用V2X技術(shù),做到車路云協(xié)同的呢?本文為大家?guī)鞢IDI V2X技術(shù)深度解讀
    的頭像 發(fā)表于 02-05 09:08 ?5754次閱讀

    調(diào)試混音?

    調(diào)試混音
    發(fā)表于 05-15 14:31 ?2次下載
    調(diào)試<b class='flag-5'>混音</b>?

    50個(gè)典型電路實(shí)例深度解讀

    50個(gè)典型電路實(shí)例深度解讀
    發(fā)表于 02-07 11:47 ?0次下載

    構(gòu)建一個(gè)簡單的模擬音頻混音

    混頻器是一種特殊類型的電子電路,它結(jié)合了兩個(gè)信號(周期性重復(fù)的波形)。混音器在音頻和射頻系統(tǒng)中得到了廣泛應(yīng)用,很少用作簡單的模擬“計(jì)算機(jī)”。有兩種類型的模擬音頻混音器——加法
    的頭像 發(fā)表于 08-23 16:10 ?6531次閱讀
    構(gòu)建一個(gè)簡單的模擬音頻<b class='flag-5'>混音</b>器

    深度解讀智能汽車車載傳感器標(biāo)定技術(shù)

    智能汽車是指集成了各種先進(jìn)技術(shù)的智能化交通工具,它不僅具有駕駛輔助和自動駕駛功能,還能實(shí)現(xiàn)智能聯(lián)網(wǎng)、智能感知和智能互動等多種功能。而車載傳感器作為智能汽車的重要組成部分,其標(biāo)定技術(shù)也顯得尤為重要。本文將
    的頭像 發(fā)表于 06-02 10:56 ?2275次閱讀

    低功耗設(shè)計(jì)基礎(chǔ):Clock Gating

    大多數(shù)低功耗設(shè)計(jì)手法在嚴(yán)格意義上說并不是由后端控制的,Clock Gating也不例外。
    的頭像 發(fā)表于 06-27 15:47 ?1657次閱讀
    低功耗設(shè)計(jì)基礎(chǔ):Clock <b class='flag-5'>Gating</b>

    AND GATE的clock gating check簡析

    一個(gè)cell的一個(gè)輸入為clock信號,另一個(gè)輸入為gating信號,并且輸出作為clock使用,這樣的cell為gating cell。
    的頭像 發(fā)表于 06-29 15:28 ?2867次閱讀
    AND GATE的clock <b class='flag-5'>gating</b> check簡析

    Clock Gating的特點(diǎn)、原理和初步實(shí)現(xiàn)

    當(dāng)下這社會,沒有幾萬個(gè)Clock Gating,出門都不好意思和別人打招呼!
    的頭像 發(fā)表于 07-17 16:50 ?3981次閱讀
    Clock <b class='flag-5'>Gating</b>的特點(diǎn)、原理和初步實(shí)現(xiàn)