0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聞聲識(shí)人——聲紋識(shí)別如何走過(guò)規(guī)模商用前夜?

張慧娟 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:張慧娟 ? 2019-10-09 07:26 ? 次閱讀

作為語(yǔ)音賽道一個(gè)重度垂直的領(lǐng)域,聲紋識(shí)別終于從“等風(fēng)來(lái)”,成為站在“風(fēng)口”上的技術(shù)。盡管同為生物識(shí)別技術(shù)的指紋、人臉識(shí)別已經(jīng)快速搶占了市場(chǎng),但隨著新一波人工智能技術(shù)的發(fā)展,聲紋識(shí)別有望因提升用戶體驗(yàn)、安全性等方面的獨(dú)到之處而迎來(lái)發(fā)展高潮。


聲紋識(shí)別近年來(lái)主要經(jīng)歷了哪些重大突破?發(fā)展主要受益于哪些驅(qū)動(dòng)因素?

首先是技術(shù)驅(qū)動(dòng)。近年來(lái),依托算法迭代、模型升級(jí)等優(yōu)化措施,識(shí)別準(zhǔn)確率有提升,并根據(jù)特定專題的研究,初步解決了穩(wěn)定性等問(wèn)題;更重要的,隨著抗時(shí)變、防錄音技術(shù)的進(jìn)步,大大提升了安全性和用戶體驗(yàn),打消了人們對(duì)聲紋識(shí)別可靠性的顧慮,使這項(xiàng)有潛力的技術(shù)真正走上規(guī)模商用的道路。

其次是政策驅(qū)動(dòng)。經(jīng)過(guò)中國(guó)建設(shè)銀行等第一波應(yīng)用單位的示范,金融行業(yè)逐漸認(rèn)識(shí)到聲音作為身份密碼是可行的。去年央行聲紋應(yīng)用標(biāo)準(zhǔn)的頒布,對(duì)行業(yè)基本面起到了較大的推動(dòng)作用,該標(biāo)準(zhǔn)明確傳遞出一個(gè)信息:生物識(shí)別技術(shù)的應(yīng)用在追求用戶體驗(yàn)時(shí)必須重視安全和隱私,其信息的傳導(dǎo)范圍遠(yuǎn)遠(yuǎn)超出了金融行業(yè),它使得現(xiàn)階段,技術(shù)和場(chǎng)景的匹配真正明確。

第三是用戶認(rèn)識(shí)觀念和使用習(xí)慣的變化。這一點(diǎn)得益于智能客服、智能音箱等以語(yǔ)音識(shí)別技術(shù)為主的消費(fèi)級(jí)應(yīng)用場(chǎng)景的普及,人們?cè)谡嬲w驗(yàn)到語(yǔ)音交互的便利之后,提出了更高的個(gè)性化需求和安全要求,可以說(shuō),語(yǔ)音識(shí)別技術(shù)幫助聲紋識(shí)別技術(shù)在C端快速完成了用戶教育。

聲紋識(shí)別可助智能設(shè)備“聞聲識(shí)人”

當(dāng)前熱門的智能設(shè)備,不論是百“箱”大戰(zhàn)的智能音箱,還是百“機(jī)”爭(zhēng)鳴的智能機(jī)器人,初期這些產(chǎn)品在交互方式上實(shí)現(xiàn)了一定程度上的智能,但在交流方式上卻有欠缺。所謂交流,即有明確的對(duì)象,與不同對(duì)象交流有不同的回應(yīng),才是更為智能的體驗(yàn)。聲紋識(shí)別——正是實(shí)現(xiàn)這種“聞聲識(shí)人”的技術(shù)手段。

以智能音箱這一典型產(chǎn)品為例,阿里的天貓精靈、京東的叮咚音箱二代,以及華為的小藝音箱等,紛紛加入了聲紋識(shí)別功能。這一功能可以使智能音箱在競(jìng)爭(zhēng)中體現(xiàn)出差異化的優(yōu)勢(shì),而不只是千篇一律地回答天氣查詢、搜索歌曲名和定鬧鐘等功能。它能夠根據(jù)不同聲音識(shí)別出不同的使用者,提供更為個(gè)性化的內(nèi)容回應(yīng),并且保證了安全性和私密性,特別是在進(jìn)行在線支付時(shí)操作更為便捷。HomePod是蘋果在2017年推出的智能音箱產(chǎn)品,在今年的全球開(kāi)發(fā)者大會(huì)上,蘋果也宣布在HomePod 加入了聲紋識(shí)別功能。

在CSDN組織編撰的《2018中國(guó)人工智能產(chǎn)業(yè)路線圖》中,曾將語(yǔ)音交互劃分為三個(gè)階段

L1階段:能以極高的準(zhǔn)確率,在典型環(huán)境下響應(yīng)用戶的語(yǔ)音輸入;
L2階段:能以極高的準(zhǔn)確率識(shí)別出交互的當(dāng)事人和環(huán)境,然后進(jìn)行個(gè)性化的交互;
L3階段:只要有數(shù)據(jù),語(yǔ)音交互系統(tǒng)的能力就可以無(wú)邊界擴(kuò)展(包括個(gè)性和能力)。

在L2階段體現(xiàn)的就是個(gè)性化,語(yǔ)音交互不再停留在千人一面的固定化模式中,而是實(shí)現(xiàn)千人千面的個(gè)性化交互體驗(yàn)。在這一階段,聲紋識(shí)別技術(shù)將成為新的標(biāo)配

“人臉識(shí)別”遭打臉,聲紋識(shí)別為什么變得重要?

聲紋識(shí)別為什么開(kāi)始得到關(guān)注?除了上文提到的進(jìn)一步提升用戶體驗(yàn)之外,在滿足高安全場(chǎng)景的訴求時(shí)也有獨(dú)到優(yōu)勢(shì)。

AI對(duì)抗AI的音視頻欺騙事件近來(lái)屢有發(fā)生,不論是被騙的人臉識(shí)別系統(tǒng),還是偽造聲音進(jìn)行的金融詐騙,這些事件給AI的發(fā)展前景蒙上一層陰影之外,也讓個(gè)人對(duì)于自己身上的“活”密碼(指紋、臉、聲音、瞳孔等)的安全性產(chǎn)生了擔(dān)憂。特別是前段時(shí)間一夜爆火的AI換臉“ZAO”,使得這種擔(dān)心達(dá)到極致。每個(gè)人獨(dú)一無(wú)二的生物特征,一旦暴露了該怎么辦?

事實(shí)上,指紋、人臉是靜態(tài)的生理特征,并不能體現(xiàn)出個(gè)體的動(dòng)態(tài)變化,因此很容易出現(xiàn)被盜用等安全問(wèn)題。而“聲紋”作為一種特殊的行為特征,每個(gè)人在說(shuō)話過(guò)程中所蘊(yùn)含的語(yǔ)音特征和發(fā)音習(xí)慣幾乎是不可替代的,即使是模仿,也難以改變說(shuō)話者最本質(zhì)的發(fā)音特性和聲道特征,它是一種“動(dòng)態(tài)”的識(shí)別,因此與其他靜態(tài)的生物識(shí)別方式相比,不僅具有特定性,也具有相對(duì)的穩(wěn)定性,它不容易丟失,可以做到“失聲(音)不失身(份)”,偽造起來(lái)也更為困難,因而被認(rèn)為認(rèn)證強(qiáng)度更高、更安全。

場(chǎng)景驅(qū)動(dòng)下的商用浪潮

事實(shí)上,聲紋識(shí)別雖然未在智能手機(jī)這樣的消費(fèi)級(jí)產(chǎn)品中普及,卻早已在金融、安防、公共服務(wù)等領(lǐng)域得到較為廣泛的應(yīng)用。

成立于2002年的得意音通屬于國(guó)內(nèi)較早布局聲紋識(shí)別領(lǐng)域的企業(yè)之一,形成了聲紋技術(shù)自主專利多層保護(hù),并與公安部、人民銀行、工信部共同主導(dǎo)了聲紋相關(guān)標(biāo)準(zhǔn)的制訂。以其“聲密?!睘楹诵?,可在手機(jī)銀行、聲紋身份認(rèn)證云、社保生存認(rèn)證、聲紋門禁、聲紋考勤等領(lǐng)域提供相應(yīng)的產(chǎn)品和服務(wù)。

為泛金融身份認(rèn)證護(hù)航

通過(guò)多年來(lái)的布局,得意音通在金融領(lǐng)域最早形成了規(guī)模應(yīng)用,其主導(dǎo)起草的《移動(dòng)金融基于聲紋識(shí)別的安全應(yīng)用技術(shù)規(guī)范》已于2018年10月9日由中國(guó)人民銀行頒布至各銀行、證券、保險(xiǎn)、基金,以及非銀行支付機(jī)構(gòu),成為我國(guó)金融領(lǐng)域第一個(gè)生物特征識(shí)別安全應(yīng)用技術(shù)標(biāo)準(zhǔn),大大推動(dòng)了聲紋的行業(yè)落地與應(yīng)用合規(guī)。

是什么樣的契機(jī)使聲紋識(shí)別技術(shù)最先在金融行業(yè)落地?得意音通CEO倪鳴介紹,金融領(lǐng)域因其豐富的場(chǎng)景、海量的數(shù)據(jù)、對(duì)可靠性的高要求和廣泛的用戶反饋等,一直是人工智能技術(shù)在民用領(lǐng)域(相較于公共安全領(lǐng)域)的理想試金石。

聲紋識(shí)別也不例外,在4G時(shí)代,金融行業(yè)催生了手機(jī)銀行這一形態(tài)并迅速普及,使得金融級(jí)遠(yuǎn)程身份認(rèn)證的需求激增,而聲紋識(shí)別剛好可以滿足這個(gè)需求。2016至2018年間,中國(guó)建設(shè)銀行、貴陽(yáng)銀行、蘭州銀行、西安銀行、中國(guó)銀聯(lián)、中國(guó)互金協(xié)會(huì)等多個(gè)金融單位和機(jī)構(gòu)都上線了聲紋識(shí)別身份認(rèn)證服務(wù),用于賬戶登錄、大額轉(zhuǎn)賬、無(wú)卡取款、密碼找回等業(yè)務(wù)場(chǎng)景。微信和支付寶也上線了基于聲紋動(dòng)態(tài)口令的登錄方式。此外,在信貸業(yè)務(wù)中引入聲紋識(shí)別技術(shù)作為反欺詐手段,還可有效降低冒用他人身份進(jìn)行騙貸以及多頭貸款等事件的發(fā)生率。

為公共服務(wù)提供便利

隨著語(yǔ)音技術(shù)的普及,越來(lái)越多的聲紋識(shí)別應(yīng)用場(chǎng)景還在不斷涌現(xiàn)。如利用1:1聲紋確認(rèn)技術(shù),可幫助居民領(lǐng)取養(yǎng)老金等社會(huì)保障金時(shí)足不出戶自證身份。

城鄉(xiāng)養(yǎng)老保險(xiǎn)是社會(huì)保障體系的重要組成部分,然而冒領(lǐng)養(yǎng)老金的事件時(shí)有發(fā)生,每年冒領(lǐng)總金額以億元計(jì),但若要求高齡老人親臨現(xiàn)場(chǎng)驗(yàn)明身份又非常不便。由于聲紋確認(rèn)技術(shù)具有很強(qiáng)的遠(yuǎn)程操控屬性,社保局通過(guò)預(yù)裝聲紋身份認(rèn)證系統(tǒng),便于進(jìn)行遠(yuǎn)程身份認(rèn)證,為長(zhǎng)期居住外地、高齡、重病等特殊情況的老年人提供了方便。同時(shí),由于聲紋可很好地防假冒攻擊,為社保體系防冒領(lǐng)提供了很好的技術(shù)保障手段。

去年,得意音通的“聲紋+”身份認(rèn)證云已在貴州省貴安新區(qū)落地,現(xiàn)已覆蓋貴州省金融、社保、公安等領(lǐng)域,隨著央行聲紋標(biāo)準(zhǔn)發(fā)布,以及中國(guó)電子政務(wù)網(wǎng)、內(nèi)蒙古社保、西北某省等項(xiàng)目的逐步落地,得意音通聲紋身份認(rèn)證技術(shù)的應(yīng)用逐漸北上。今年八月,與烏蘭察布市人民政府簽署了戰(zhàn)略合作協(xié)議,共同建設(shè)“草原云谷”“聲紋+”身份認(rèn)證云基地,以輻射周邊諸省。相鄰的內(nèi)蒙古自治區(qū)包頭市、黑龍江省牡丹江市等作為試點(diǎn)區(qū),已率先開(kāi)展了聲紋認(rèn)證領(lǐng)取養(yǎng)老金服務(wù)。

個(gè)性化語(yǔ)音交互場(chǎng)景正在涌現(xiàn)

聲紋識(shí)別還可完成個(gè)人日常生活中各種事物訪問(wèn)控制的授權(quán),比如智能手機(jī)鎖屏、各類網(wǎng)絡(luò)賬號(hào)的聲控密碼鎖、電腦聲控鎖、聲控安全門、汽車聲控鎖等。

利用1:N聲紋辨認(rèn)技術(shù),可在一定程度上防范電信網(wǎng)絡(luò)詐騙,還可支持智能音箱、智能語(yǔ)音助手等提供個(gè)性化服務(wù),如針對(duì)家庭用戶中的老年人、兒童等不同年齡段用戶,按照興趣推薦不同的歌曲、新聞,以及開(kāi)放特定的功能權(quán)限等;利用聲紋檢出和追蹤技術(shù),可取代人工完成會(huì)議紀(jì)要,通過(guò)語(yǔ)音識(shí)別和聲紋識(shí)別技術(shù)的結(jié)合,將會(huì)議錄音通過(guò)語(yǔ)音識(shí)別技術(shù)識(shí)別說(shuō)話內(nèi)容、通過(guò)聲紋識(shí)別技術(shù)標(biāo)注每段話所對(duì)應(yīng)的說(shuō)話人,即可輕松完成多人會(huì)議記錄,大大提高工作效率。

未來(lái)的爆發(fā)點(diǎn)和挑戰(zhàn)

對(duì)于聲紋技術(shù)爆發(fā)的關(guān)鍵點(diǎn),倪鳴認(rèn)為決定因素主要有二:一是在于技術(shù)和場(chǎng)景的最佳匹配;二是在于聲紋建庫(kù)的建立,也就是當(dāng)合法的聲紋模型數(shù)據(jù)積累到一定量,就會(huì)產(chǎn)生裂變。

有人將2017年看做智能語(yǔ)音交互元年,2018年則可以說(shuō)是聲紋應(yīng)用元年。2017年,各大品牌廠商打造的智能音箱紛紛上市,2018年語(yǔ)音交互落地突然加速,相關(guān)產(chǎn)品從智能音箱擴(kuò)展到其他品類,如電視盒子、鬧鐘、燈、智能馬桶等。這些應(yīng)用幾乎都產(chǎn)生了通過(guò)遠(yuǎn)場(chǎng)聲紋識(shí)別實(shí)現(xiàn)個(gè)性化語(yǔ)音交互的需求。倪鳴強(qiáng)調(diào),需要注意的是,這類面向未來(lái)物聯(lián)網(wǎng)應(yīng)用的新興需求大部分還處在探索階段

聲紋識(shí)別目前在商用落地以及下一步的發(fā)展方面還面臨哪些挑戰(zhàn)?有哪些主要的克服手段?倪鳴表示,從技術(shù)發(fā)展來(lái)看,聲紋識(shí)別當(dāng)前還存在以下兩大類挑戰(zhàn):

一是魯棒性挑戰(zhàn):

魯棒性是指聲紋識(shí)別抵抗其他因素干擾的能力。這些干擾可能來(lái)自:

1)說(shuō)話人自身。比如說(shuō)話人隨著身體狀況改變而發(fā)聲的聲音改變、隨著年齡增長(zhǎng)而發(fā)聲的聲音變化、不同情感、語(yǔ)氣、語(yǔ)速情況下的聲音變化。

2)也可能來(lái)自說(shuō)話人之外的環(huán)境。比如噪聲干擾、遠(yuǎn)場(chǎng)情況下收錄到的聲音發(fā)生的變化。如何在眾多干擾之下,精準(zhǔn)的對(duì)聲紋進(jìn)行識(shí)別,是一個(gè)重要的研究方向。

3)還有可能來(lái)自說(shuō)話的內(nèi)容。例如超短語(yǔ)音挑戰(zhàn)。短語(yǔ)音是指系統(tǒng)的識(shí)別性能對(duì)語(yǔ)音長(zhǎng)度的依賴性。較長(zhǎng)的語(yǔ)音會(huì)達(dá)到更高的精準(zhǔn)度,但顯然,過(guò)長(zhǎng)的語(yǔ)音會(huì)影響用戶體驗(yàn)。并且在一些特定場(chǎng)景下,比如司法應(yīng)用中,系統(tǒng)只能收集到有限長(zhǎng)度的語(yǔ)音。因此如何在較短語(yǔ)音長(zhǎng)度的情況下,提高系統(tǒng)的識(shí)別性能,也是一個(gè)重要的研究方向。

二是安全性挑戰(zhàn):

1)防攻擊能力。是指聲紋識(shí)別系統(tǒng)拒絕非真實(shí)說(shuō)話人的能力。這些嘗試進(jìn)入系統(tǒng)的聲音,可能是由人類模仿發(fā)聲的,也可能是機(jī)器偽造的,比如通過(guò)語(yǔ)音合成、聲音轉(zhuǎn)換以及錄音重放技術(shù),產(chǎn)生出和真實(shí)說(shuō)話人相近的聲音,嘗試進(jìn)入系統(tǒng)。如何阻止這些假冒語(yǔ)音通過(guò)系統(tǒng),是很重要的研究方向。

2)情感識(shí)別能力。相關(guān)問(wèn)題有兩個(gè):一是要做到不同情感下都能準(zhǔn)確識(shí)別,可稱為情感魯棒性;二是要能識(shí)別出用戶是否處于被脅迫或者處于焦慮狀況下等,可認(rèn)為是理解用戶的意圖真實(shí)性。而后者更為重要,所以將它歸為安全性挑戰(zhàn)之一。

由于較早將聲紋技術(shù)帶出實(shí)驗(yàn)室接受市場(chǎng)檢驗(yàn),這一先發(fā)優(yōu)勢(shì)造就了得意音通今天的市場(chǎng)地位。通過(guò)多年的積累,得意音通擁有“聲紋識(shí)別+動(dòng)態(tài)密碼”身份認(rèn)證方案的原始發(fā)明專利,還擁有與之相關(guān)的支撐技術(shù)和應(yīng)用技術(shù)國(guó)家發(fā)明專利10余項(xiàng),其中的國(guó)際發(fā)明專利已在日、韓、美等國(guó)獲得授權(quán)。圍繞這些核心專利,構(gòu)筑了完整的專利墻體系。在多項(xiàng)國(guó)際賽事中,例如國(guó)際音頻情感識(shí)別競(jìng)賽MEC 2017、國(guó)際自動(dòng)說(shuō)話人驗(yàn)證欺騙和對(duì)策挑戰(zhàn)賽ASVspoof 2019等,得意音通均榮獲冠軍。

多生物特征識(shí)別融合成為必然

一個(gè)值得關(guān)注的趨勢(shì)是——由于不同場(chǎng)景對(duì)生物特征的適應(yīng)性各有不同,多生物特征識(shí)別技術(shù)融合已經(jīng)成為必然。

針對(duì)金融交易驗(yàn)證,央行科技司司長(zhǎng)李偉最近就指出,部分機(jī)構(gòu)高估了弱隱私特征的識(shí)別作用,在網(wǎng)絡(luò)空間僅依靠人臉等單一特征進(jìn)行金融交易驗(yàn)證,存在嚴(yán)重隱患。他表示,不能簡(jiǎn)單地將人臉特征作為唯一的交易驗(yàn)證因素,須根據(jù)風(fēng)險(xiǎn)等級(jí)結(jié)合用戶口令等其他因素進(jìn)行多因素認(rèn)證。

而目前看來(lái),“聲紋+人臉” 的身份認(rèn)證產(chǎn)品,既解決了單一生物特征所具有的局限性,同時(shí)可覆蓋更多身份認(rèn)證場(chǎng)景,滿足用戶的多樣式要求。得意音通在“聲紋+”多維融合身份認(rèn)證解決方案方面投入已久,今年4月,推出了無(wú)感式“聲紋+人臉”方案。

倪鳴強(qiáng)調(diào),這一多維方案并不是聲紋與人臉識(shí)別簡(jiǎn)單的疊加,而是深度融合、一步完成、多重防偽,實(shí)現(xiàn)安全與體驗(yàn)的雙重提升。此外,還有情感識(shí)別、唇紋識(shí)別、唇語(yǔ)識(shí)別等眾多創(chuàng)新技術(shù),也在不斷開(kāi)發(fā)中。

“孤軍奮戰(zhàn)的日子一去不復(fù)返”

“聲紋開(kāi)始熱了,產(chǎn)業(yè)態(tài)勢(shì)已成,孤軍奮戰(zhàn)的日子一去不復(fù)返。再好的科研成果,只有從象牙塔里走出來(lái),放到實(shí)踐中去檢驗(yàn),才能發(fā)光發(fā)熱,造福社會(huì)。作為行業(yè)老兵,我們感到欣慰,因?yàn)檫@證明了我們當(dāng)初的判斷和堅(jiān)持是正確的”——這是清華大學(xué)人工智能研究院聽(tīng)覺(jué)智能研究中心主任、得意音通創(chuàng)始人、得意音通信息技術(shù)研究院院長(zhǎng)鄭方在《中國(guó)聲紋識(shí)別產(chǎn)業(yè)發(fā)展白皮書(shū)》發(fā)布時(shí)的感慨。

目前國(guó)內(nèi)主流聲紋識(shí)別企業(yè)主要背靠清華大學(xué)、廈門大學(xué)、中科院聲學(xué)所、自動(dòng)化研究所等高校和科研機(jī)構(gòu),得意音通則是清華系的典型代表。雙方建立了“產(chǎn)學(xué)研”合作生態(tài),清華以知識(shí)產(chǎn)權(quán)入股得意音通,得意音通投資反哺清華建立聯(lián)合實(shí)驗(yàn)室,從而保證了能夠不斷將最新的前沿研究成果運(yùn)用于產(chǎn)業(yè),同時(shí)建立起了穩(wěn)定的人才儲(chǔ)備梯隊(duì)。

從專利數(shù)量來(lái)看,2013 年起,國(guó)內(nèi)相關(guān)專利公開(kāi)數(shù)量呈大幅上升,5 年內(nèi)翻了 10 倍以上。相對(duì)專利公開(kāi)數(shù)量,專利授權(quán)數(shù)量相對(duì)增長(zhǎng)較緩,總數(shù)不超過(guò) 40 件。但是2018 年,不論是公開(kāi)數(shù)量還是授權(quán)數(shù)量,專利增幅均達(dá)到歷史峰值。

圖:國(guó)內(nèi)聲紋相關(guān)專利申請(qǐng)數(shù)量宏觀態(tài)勢(shì)
(來(lái)源:《中國(guó)聲紋識(shí)別產(chǎn)業(yè)發(fā)展白皮書(shū)》)
據(jù)前瞻產(chǎn)業(yè)研究院的分析,當(dāng)下全球生物識(shí)別產(chǎn)業(yè)規(guī)模龐大,僅語(yǔ)音生物識(shí)別(注:即聲紋識(shí)別)這一細(xì)分方向的市場(chǎng)規(guī)模就將近百億美元,預(yù)計(jì)2020年更是有望超過(guò)200億美元(合 1346億元人民幣),占整個(gè)生物識(shí)別市場(chǎng)的22.4%。

從網(wǎng)絡(luò)身份認(rèn)證應(yīng)用領(lǐng)域來(lái)看,據(jù)國(guó)外權(quán)威調(diào)研機(jī)構(gòu)MarketsandMarkets數(shù)據(jù)顯示,2019 年網(wǎng)絡(luò)安全市場(chǎng)預(yù)計(jì)增長(zhǎng)至1557.4億美元,其中,身份認(rèn)證信息安全市場(chǎng)規(guī)模將超過(guò)300 億美元。聲紋識(shí)別在其中也將扮演重要角色。

賽道開(kāi)始擁擠

<電子發(fā)燒友>根據(jù)公開(kāi)資料統(tǒng)計(jì)出如下聲紋識(shí)別企業(yè)。老牌企業(yè)往往掌握有深厚的技術(shù)積累和核心專利,特別是幾家有高校和科研機(jī)構(gòu)背景的企業(yè)。而對(duì)于AI初創(chuàng)企業(yè)來(lái)說(shuō),也在加強(qiáng)在技術(shù)深度和廣度上的布局。

思必馳的語(yǔ)音識(shí)別++技術(shù)可進(jìn)行超短時(shí)聲紋識(shí)別、性別識(shí)別、情緒識(shí)別、年齡識(shí)別等,可應(yīng)用于智能家居、智能車載等應(yīng)用,并與長(zhǎng)虹、美菱成立了實(shí)驗(yàn)室。

云知聲將聲紋識(shí)別技術(shù)引入到深度學(xué)習(xí)領(lǐng)域,聯(lián)手平安好醫(yī)生打造客戶端“聲紋登錄系統(tǒng)”,并與國(guó)家電網(wǎng)合作了會(huì)議系統(tǒng)聲紋識(shí)別項(xiàng)目。

騰訊云也在產(chǎn)品中引入聲紋識(shí)別,隨著云端大數(shù)據(jù)的不斷積累,在智能家居、金融交易、智慧建筑領(lǐng)域,已經(jīng)能夠根據(jù)個(gè)人屬性個(gè)性化地提供服務(wù)內(nèi)容,并進(jìn)一步提升安全性。

作為家電行業(yè)業(yè)較早涉及人工智能技術(shù)領(lǐng)域的企業(yè),長(zhǎng)虹在電視、空調(diào)中先后加入聲紋識(shí)別功能,使得家電也能夠智能識(shí)別用戶身份,開(kāi)啟私人訂制模式。

業(yè)內(nèi)觀察人士認(rèn)為,在AI+IoT的發(fā)展潮流下,聲紋識(shí)別技術(shù)有望推動(dòng)一些場(chǎng)景向高階化發(fā)展,在未來(lái)的人機(jī)交互過(guò)程中成為必要支撐,帶動(dòng)從硬件到軟件在更多商用場(chǎng)景中的發(fā)展。



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 生物識(shí)別
    +關(guān)注

    關(guān)注

    3

    文章

    1209

    瀏覽量

    52478
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    10

    文章

    771

    瀏覽量

    48657
  • 聲紋識(shí)別
    +關(guān)注

    關(guān)注

    3

    文章

    137

    瀏覽量

    21484
  • 智能音箱
    +關(guān)注

    關(guān)注

    31

    文章

    1781

    瀏覽量

    78385
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    物體識(shí)別桌 AR物體識(shí)互動(dòng)桌 電容屏實(shí)物識(shí)別漫游桌

    在這個(gè)科技發(fā)達(dá)的時(shí)代,AR增強(qiáng)技術(shù)也在迅速發(fā)展,在展廳展館中發(fā)光發(fā)熱,帶來(lái)了創(chuàng)意無(wú)限的互動(dòng)展示效果,AR技術(shù)結(jié)合物體識(shí)別技術(shù)打造的AR物體識(shí)別桌,讓游客有了全新的體驗(yàn),通過(guò)新穎的人機(jī)交互方式和趣味展示效果,能吸引人們的目光,吸引人們前來(lái)體驗(yàn)。
    的頭像 發(fā)表于 10-21 17:44 ?65次閱讀

    超高頻RFID設(shè)備的識(shí)讀距離受哪些因素影響?如何挑選RFID設(shè)備+天線

    在探討超高頻RFID設(shè)備的識(shí)讀距離時(shí),我們不得不深入分析影響其性能的多重因素,并據(jù)此指導(dǎo)如何有效挑選RFID設(shè)備及天線。超高頻RFID技術(shù)以其遠(yuǎn)距離識(shí)別、高速度數(shù)據(jù)傳輸?shù)葍?yōu)勢(shì),在物流、供應(yīng)鏈管理
    的頭像 發(fā)表于 09-19 15:17 ?216次閱讀
    超高頻RFID設(shè)備的<b class='flag-5'>識(shí)</b>讀距離受哪些因素影響?如何挑選RFID設(shè)備+天線

    基于鴻蒙Next模擬掃圖識(shí)物的一個(gè)過(guò)程

    一、功能介紹(基礎(chǔ)) 基于鴻蒙Next模擬掃圖識(shí)物的一個(gè)過(guò)程,掃描到圖片,提示出相關(guān)的圖片內(nèi)容,是一個(gè)什么東西。 二、使用場(chǎng)景(大類) 支付、社交、信息獲取、在線調(diào)查、教育學(xué)習(xí)等等。 三、實(shí)現(xiàn)步驟
    發(fā)表于 08-21 15:04

    商用清潔新紀(jì)元:為何商用清潔機(jī)器成為必選,及挑選指南

    在日新月異的商業(yè)環(huán)境中,每一處細(xì)節(jié)都關(guān)乎著品牌形象與顧客體驗(yàn)。隨著科技的深入滲透,商用清潔機(jī)器正逐步成為現(xiàn)代商業(yè)空間不可或缺的“清潔衛(wèi)士”。它們以高效、智能、環(huán)保的特性,引領(lǐng)著商用清潔領(lǐng)域的新風(fēng)尚
    的頭像 發(fā)表于 08-19 17:01 ?200次閱讀
    <b class='flag-5'>商用</b>清潔新紀(jì)元:為何<b class='flag-5'>商用</b>清潔機(jī)器<b class='flag-5'>人</b>成為必選,及挑選指南

    商用清潔賽道,普渡清潔機(jī)器如何玩出新花樣?

    商用清潔賽道,普渡清潔機(jī)器如何玩出新花樣? 前言 每次技術(shù)革命,都將對(duì)傳統(tǒng)模式帶來(lái)顛覆性改變。 目前,我國(guó)產(chǎn)業(yè)結(jié)構(gòu)正進(jìn)入快速升級(jí)階段,智能制造春潮涌動(dòng),各行各業(yè)正在經(jīng)歷一輪智能化轉(zhuǎn)型升級(jí)的變革
    的頭像 發(fā)表于 08-14 10:21 ?330次閱讀

    目標(biāo)檢測(cè)與識(shí)別技術(shù)有哪些

    視頻中識(shí)別并定位感興趣的目標(biāo),通常包括目標(biāo)的類別和位置信息。目標(biāo)識(shí)別(Object Recognition)是指對(duì)檢測(cè)到的目標(biāo)進(jìn)行分類,確定其具體類別。目標(biāo)檢測(cè)與識(shí)別技術(shù)的核心任務(wù)是準(zhǔn)確地識(shí)別
    的頭像 發(fā)表于 07-17 09:40 ?424次閱讀

    UWB技術(shù)迎來(lái)規(guī)模商用

    UWB技術(shù)商用研究白皮書(shū),詳情見(jiàn)附件。
    發(fā)表于 05-11 18:14 ?1次下載

    500輛九識(shí)智能產(chǎn)品在如皋“持證上崗”

    4月12日,九識(shí)智能獨(dú)家獲頒如皋市500張無(wú)人駕駛裝備碼,獲準(zhǔn)在當(dāng)?shù)亻_(kāi)放道路上進(jìn)行L4級(jí)自動(dòng)駕駛運(yùn)營(yíng),這為九識(shí)智能在如皋進(jìn)一步加快自動(dòng)駕駛產(chǎn)品規(guī)模化應(yīng)用落地提供了有力支持,與此同時(shí)如皋也成為全國(guó)率先
    的頭像 發(fā)表于 04-12 18:05 ?771次閱讀

    智能聲控?zé)艟邞?yīng)用語(yǔ)音識(shí)別芯片AT6811

    AT6811是一款超低功耗的離線智能語(yǔ)音識(shí)別芯片,集成了先進(jìn)的語(yǔ)音活動(dòng)監(jiān)測(cè)(VAD)、聲紋識(shí)別、自動(dòng)消噪神經(jīng)網(wǎng)絡(luò),擁有高效的電源管理模塊、數(shù)字和模擬語(yǔ)音信號(hào)輸入接口以及ARMCortex-M0內(nèi)核,并且搭配了GPIO、UART、SPI、I2C、I2S等片內(nèi)外設(shè)。
    的頭像 發(fā)表于 02-28 16:41 ?543次閱讀
    智能聲控?zé)艟邞?yīng)用語(yǔ)音<b class='flag-5'>識(shí)別</b>芯片AT6811

    SynSense時(shí)識(shí)科技戰(zhàn)略收購(gòu)瑞士iniVation

    SynSense時(shí)識(shí)科技(以下簡(jiǎn)稱“時(shí)識(shí)科技”),作為類腦感知及計(jì)算領(lǐng)域的頭部公司,近日正式宣布戰(zhàn)略收購(gòu)瑞士類腦視覺(jué)傳感器公司iniVation AG。這一收購(gòu)將進(jìn)一步強(qiáng)化時(shí)識(shí)科技在全球市場(chǎng)的影響力,并為其帶來(lái)更廣闊的發(fā)展空間。
    的頭像 發(fā)表于 02-01 16:54 ?772次閱讀

    測(cè)電源噪聲紋波時(shí)為什么選無(wú)源探頭

    在測(cè)量電源的噪聲紋波時(shí),采用無(wú)源探頭是一種常見(jiàn)的選擇。無(wú)源探頭是指在測(cè)量過(guò)程中不需要額外的電源供電的探頭。那么,為什么我們要選擇無(wú)源探頭呢?下面將詳細(xì)解釋這個(gè)問(wèn)題。 首先,無(wú)源探頭具有高頻
    的頭像 發(fā)表于 02-01 10:10 ?536次閱讀
    測(cè)電源噪<b class='flag-5'>聲紋</b>波時(shí)為什么選無(wú)源探頭

    識(shí)智能與東風(fēng)股份達(dá)成深度戰(zhàn)略合作,共同推進(jìn)中國(guó)智能商用車商業(yè)化落地進(jìn)程

    近日,九識(shí)智能與東風(fēng)股份達(dá)成深度戰(zhàn)略合作,并完成首批50臺(tái)智能商用車訂單的簽約!此次合作中,九識(shí)與東風(fēng)股份雙方將基于各自的技術(shù)和資源優(yōu)勢(shì),在中國(guó)智能商用車產(chǎn)品端和銷售端開(kāi)展合作,共同推
    的頭像 發(fā)表于 01-12 10:40 ?484次閱讀

    距離人形機(jī)器廣泛商用還要多久?

    根據(jù)業(yè)內(nèi)人士預(yù)期,人形機(jī)器要真正廣泛商用,尚需十年。
    的頭像 發(fā)表于 01-11 11:43 ?976次閱讀

    規(guī)模RedCap商用部署!5G-A助力萬(wàn)物智聯(lián)走向現(xiàn)實(shí)

    近日,廣東移動(dòng)攜手中興通訊在廣州、深圳、佛山等地完成全國(guó)首個(gè)超大規(guī)模的RedCap商用部署,截止11月底已開(kāi)通7千站以上,率先吹響了5G輕量化(RedCap)技術(shù)規(guī)模商用的號(hào)角,加速推
    的頭像 發(fā)表于 12-12 18:30 ?802次閱讀

    汽車多模態(tài)交互研究:大模型及多模態(tài)融合,推進(jìn)AI Agent上車

    語(yǔ)音交互方面:語(yǔ)音交互在AI大模型的賦能下,功能愈加智能化、情感化。唇動(dòng)識(shí)別聲紋識(shí)別等技術(shù)的上車,使語(yǔ)音交互精準(zhǔn)度得到進(jìn)一步提升,控制范圍也從車內(nèi)拓展至車外;
    的頭像 發(fā)表于 11-24 16:12 ?1343次閱讀
    汽車多模態(tài)交互研究:大模型及多模態(tài)融合,推進(jìn)AI Agent上車