近日,在美國(guó)波士頓舉行的Re-Work深度學(xué)習(xí)峰會(huì)上,美國(guó)高通公司的人工智能研究人員克里斯·洛特(Chris Lott)展示了其團(tuán)隊(duì)在語(yǔ)音識(shí)別系統(tǒng)方面的新進(jìn)展。
新語(yǔ)音識(shí)別系統(tǒng)識(shí)別單詞和短語(yǔ)的準(zhǔn)確率達(dá)到了95%,可在智能手機(jī)或其他便攜設(shè)備上運(yùn)行,包含兩個(gè)神經(jīng)網(wǎng)絡(luò):循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)。循環(huán)神經(jīng)網(wǎng)絡(luò)利用其內(nèi)存來(lái)處理輸入信息,而卷積神經(jīng)網(wǎng)絡(luò)則模仿人類大腦中神經(jīng)元之間的聯(lián)系方式來(lái)處理信息。
洛特稱,現(xiàn)在大多數(shù)語(yǔ)音識(shí)別系統(tǒng)在云端進(jìn)行運(yùn)算過(guò)程。手機(jī)中的麥克風(fēng)和芯片,智能音箱如谷歌Home和亞馬遜Echo,以及配置微軟Cortana 語(yǔ)音助手的Windows電腦,可以讓語(yǔ)音識(shí)別系統(tǒng)接傾聽(tīng)一些熱門詞匯,例如“OK Google”或Hey Cortana,從而接受一系列語(yǔ)音指令。但是,它們不會(huì)分析這些指令,而只是將這些指令傳輸?shù)竭\(yùn)行復(fù)雜機(jī)器學(xué)習(xí)算法的強(qiáng)大遠(yuǎn)程服務(wù)器上。
對(duì)于某些用戶來(lái)說(shuō),將其語(yǔ)音數(shù)據(jù)上傳到云端,這樣會(huì)讓他們擔(dān)心隱私方面的問(wèn)題。亞馬遜Alexa和谷歌Assistant均會(huì)錄制語(yǔ)音片段,然后將它們發(fā)送出去進(jìn)行分析。它們會(huì)一直保留這些語(yǔ)音片段,直到用戶選擇刪除它們。這兩家公司均表示,它們錄制語(yǔ)音是為了改善其服務(wù),提供更加個(gè)性化的語(yǔ)音回答。
但是,在某些情況下,錄制語(yǔ)音無(wú)法保護(hù)用戶的隱私。在2016年,亞利桑那州調(diào)查一宗謀殺案的偵探在被告人的同意下訪問(wèn)了一臺(tái)亞馬遜Echo智能音箱中的語(yǔ)音數(shù)據(jù)。
洛特稱,高通的這種語(yǔ)音識(shí)別系統(tǒng)直接在設(shè)備上處理數(shù)據(jù),這樣做除了可以保護(hù)用戶的隱私之外,還具有多方面的好處。由于它不必將數(shù)據(jù)上傳到云端,它對(duì)于指令的反應(yīng)速度更快。由于它不需要連接互聯(lián)網(wǎng),因此它變得更加穩(wěn)定。
“我們努力按照某種神經(jīng)網(wǎng)絡(luò)的形式來(lái)處理整個(gè)端到端系統(tǒng)?!彼f(shuō),“這樣可以讓用戶與設(shè)備的互動(dòng)變得更加自然?!?/p>
洛特的話不無(wú)道理。在2016年,谷歌開(kāi)發(fā)了一款離線語(yǔ)音識(shí)別系統(tǒng),它的速度是同時(shí)期其在線語(yǔ)音識(shí)別系統(tǒng)的7倍。這個(gè)離線語(yǔ)音識(shí)別系統(tǒng)利用語(yǔ)音數(shù)據(jù)進(jìn)行了大約2000個(gè)小時(shí)的訓(xùn)練,它的大小為20.3兆,在智能手機(jī)上運(yùn)行,準(zhǔn)確率為86.5%。
當(dāng)然,這種設(shè)備端語(yǔ)音識(shí)別系統(tǒng)也有自身的局限性。離線工作的算法無(wú)法連接互聯(lián)網(wǎng),并搜索問(wèn)題的答案。而且,它們無(wú)法像云端系統(tǒng)那樣隨著數(shù)據(jù)的積累不斷地改進(jìn)。
但是,洛特認(rèn)為,高通的解決方案是面向未來(lái)的?!艾F(xiàn)在很多計(jì)算過(guò)程發(fā)生在云端,但是我們認(rèn)為這個(gè)過(guò)程應(yīng)該直接在設(shè)備上進(jìn)行。”
-
高通
+關(guān)注
關(guān)注
76文章
7370瀏覽量
190074 -
語(yǔ)音識(shí)別系統(tǒng)
+關(guān)注
關(guān)注
0文章
18瀏覽量
10466
原文標(biāo)題:高通宣稱其語(yǔ)音識(shí)別系統(tǒng)準(zhǔn)確率高達(dá)95%
文章出處:【微信號(hào):robotmagazine,微信公眾號(hào):機(jī)器人技術(shù)與應(yīng)用】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論