其中,整理會(huì)議記錄絕對(duì)是最讓人無奈的加班原因之一。1個(gè)小時(shí)的講話內(nèi)容整理起來卻能耗費(fèi)3-4小時(shí)的時(shí)間,然后很多會(huì)議都是3小時(shí)起步的……
不要悲傷,不要哭泣,因?yàn)橛嶏w開放平臺(tái)已經(jīng)上線了訊飛聽見的明星產(chǎn)品——實(shí)時(shí)語音轉(zhuǎn)寫技術(shù)啦!
1讓信息錄入即時(shí)高效
信息爆發(fā)時(shí)代,有效率有質(zhì)量地整理視頻、音頻、文字等信息變得尤為重要。會(huì)議,培訓(xùn),采訪等場(chǎng)景均需要形成完整的文字記錄材料,音視頻文件也需要配有字幕。
訊飛實(shí)時(shí)語音轉(zhuǎn)寫技術(shù)通過WebSocket協(xié)議,建立應(yīng)用與語音轉(zhuǎn)寫核心引擎的長連接,將音頻流數(shù)據(jù)實(shí)時(shí)轉(zhuǎn)換成文字流數(shù)據(jù)結(jié)果。實(shí)現(xiàn)即時(shí)對(duì)語音內(nèi)容的識(shí)別,展現(xiàn)對(duì)應(yīng)文字內(nèi)容。
同時(shí),訊飛實(shí)時(shí)語音轉(zhuǎn)寫技術(shù)的識(shí)別引擎采用擁有科大訊飛自主研發(fā)全新推出的深度全序列卷積神經(jīng)網(wǎng)絡(luò)(DFCNN,Deep Fully Convolutional Neural Network)識(shí)別框架。使用大量的卷積層直接對(duì)整句語音信號(hào)進(jìn)行建模,更好的表達(dá)了語音的長時(shí)相關(guān)性,比學(xué)術(shù)界和工業(yè)界最好的雙向遞歸神經(jīng)網(wǎng)絡(luò)(BRNN,Bi-directional Recurrent Neural Network)的語音識(shí)別系統(tǒng)識(shí)別率提升了15%以上。同時(shí)結(jié)合訊飛的HPC平臺(tái)和多GPU并行加速技術(shù),訓(xùn)練速度也優(yōu)于傳統(tǒng)的雙向LSTM CTC系統(tǒng)。
借助訊飛聽見實(shí)時(shí)語音轉(zhuǎn)寫技術(shù),不僅能極大減輕開頭所說的整理會(huì)議內(nèi)容的耗時(shí)耗力問題,還能應(yīng)用在更多場(chǎng)景中:
學(xué)術(shù)講座:在嘈雜的現(xiàn)場(chǎng),讓演講者的話可視化;
課程培訓(xùn):重點(diǎn)內(nèi)容隨講隨記,幫助反應(yīng)理解;
電視直播:生成字幕,使得聽障人士可以了解畫面內(nèi)容;
客服電話:記錄客戶話語,幫助服務(wù)人員更好應(yīng)答。
2訊飛實(shí)時(shí)語音轉(zhuǎn)寫技術(shù)優(yōu)勢(shì)
在實(shí)時(shí)生成文字內(nèi)容的同時(shí),訊飛實(shí)時(shí)語音轉(zhuǎn)寫技術(shù)還能滿足你的四個(gè)愿望:
我希望有更高的準(zhǔn)確率
實(shí)時(shí)語音轉(zhuǎn)寫基于深度全序列卷積神經(jīng)網(wǎng)絡(luò)框架,語音識(shí)別技術(shù)全球領(lǐng)先,在安靜環(huán)境,普通話標(biāo)準(zhǔn)下轉(zhuǎn)寫準(zhǔn)確率可達(dá)95%以上。
我希望轉(zhuǎn)寫結(jié)果表達(dá)清晰
訊飛實(shí)時(shí)語音轉(zhuǎn)寫技術(shù)具有上下文糾錯(cuò)功能。在一句話結(jié)束之后,針對(duì)上下文進(jìn)行語義理解,將轉(zhuǎn)寫過程中的語音識(shí)別結(jié)果進(jìn)行智能糾錯(cuò),確保識(shí)別的準(zhǔn)確性。
我希望時(shí)間和數(shù)字等轉(zhuǎn)寫準(zhǔn)確
訊飛實(shí)時(shí)語音轉(zhuǎn)寫可以進(jìn)行文法格式智能轉(zhuǎn)換: 對(duì)結(jié)果中出現(xiàn)數(shù)字、日期、時(shí)間等內(nèi)容,將它們格式化成規(guī)整的文本,例如“五點(diǎn)三十”引擎會(huì)識(shí)別規(guī)整為“5:30”。
我希望文本斷句和加標(biāo)點(diǎn)更輕松
運(yùn)用超大規(guī)模的語言模型,讓訊飛實(shí)時(shí)語音轉(zhuǎn)寫技術(shù)可以智能預(yù)測(cè)語境,提供智能斷句和標(biāo)點(diǎn)符號(hào)的預(yù)測(cè)。
訊飛聽見APP實(shí)時(shí)語音轉(zhuǎn)寫
3訊飛實(shí)時(shí)語音轉(zhuǎn)寫技術(shù)案例
通過實(shí)時(shí)語音轉(zhuǎn)寫技術(shù),訊飛聽見為博鰲亞洲論壇、世界制造者大會(huì)、全球INS大會(huì)等大型會(huì)議、論壇的活動(dòng)內(nèi)容的記錄、整理提供了極大的支持。
訊飛聽見支持“博鰲論壇21世紀(jì)海上絲綢之路島嶼經(jīng)濟(jì)論壇”
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4726瀏覽量
100311 -
語音識(shí)別
+關(guān)注
關(guān)注
38文章
1703瀏覽量
112421
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論