0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

劍橋語音博士俞凱解讀智能語音技術(shù)

思必馳 ? 來源:djl ? 作者:思必馳 ? 2019-08-05 16:02 ? 次閱讀

1 智能語音技術(shù)發(fā)展與siri

智能語音技術(shù)發(fā)展過程可以理解為兩個階段,第一是輸入和輸出階段,即識別與合成,第二是理解和思考階段,即語義理解、對話系統(tǒng)、人工智能反饋。并且每一個細(xì)分領(lǐng)域均為單獨(dú)研究,例如語音識別、自然語言處理、聲紋處理,語義解析等等。

siri 目前最大的優(yōu)勢在于語義單項理解的算法,在一個限定的領(lǐng)域下,siri表現(xiàn)確實(shí)很好,但在整個語音領(lǐng)域內(nèi),尤其不限定領(lǐng)域和語音識別不穩(wěn)定的情況下,顯得有些后勁不足,這也與目前技術(shù)有關(guān)。而思必馳與siri不同的地方在與交互的理論,目前思必馳以任務(wù)型對話為目標(biāo),并專注于此。

2 一體化綜合解決技術(shù)增強(qiáng)用戶體驗

目前的智能語音基本是單獨(dú)模塊定義單獨(dú)的功能,例如語義理解、語音識別模塊,彼此之間沒有控制與調(diào)度,這也是造成目前語音延遲現(xiàn)象的部分原因,而造成延遲另外的原因是語音的處理、理解、交互系統(tǒng)設(shè)計方式。

用戶最希望的是智能語音界面能像人與人的交流一樣,語音能夠迅速反饋。但目前,雖然單獨(dú)語音識別很多單位都能做的很快,但組裝成交互系統(tǒng)之后就大都無法做到這一點(diǎn)了。目前思必馳推出的一體化解決方案,針對利于用戶體驗方面進(jìn)行優(yōu)化,達(dá)到端到端的用戶體驗,優(yōu)化整個控制流程,在識別的基礎(chǔ)上同時進(jìn)行輸出,達(dá)到一個快速智能反饋的效果。我們是面向終端用戶體驗去做語音交互優(yōu)化,而不僅僅提供一個模塊而已。

3 人性化交互的智能語音方向

未來的智能語音交互發(fā)展方向一定是混合發(fā)展模式,將以用戶為中心,綜合應(yīng)用全面的語音技術(shù),而不僅僅是單純的語音識別。第一,智能語音技術(shù)會與環(huán)境、語境自適應(yīng)的結(jié)合;第二,語音的發(fā)展在自然場景下應(yīng)用會越來越多,例如在高噪聲環(huán)境中的處理是未來的一個方向;第三,結(jié)合上下文的語義理解以及端到端的語音交互解決。目前單獨(dú)的識別以不能解決所有問題與滿足用戶需求,將識別、理解、對話的交互控制等融合,提供整套的解決方案才是最終的方向。

人工智能層面的語音技術(shù)中,單純的識別率是以科研指標(biāo)為中心,而人工智能角度與工程科研指標(biāo)在某些方面截然不同。而我們一直以用戶為中心,面向指標(biāo)是令人工智能語音真正人性化,在多類環(huán)境下準(zhǔn)確識別并反饋,以個性化色彩進(jìn)行交流。語音交互的未來應(yīng)當(dāng)是面向用戶,人性化的智能交互,而非過去模塊化的交互。

俞凱博士背景:擁有劍橋大學(xué)語音識別專業(yè)的學(xué)術(shù)背景,也是國內(nèi)學(xué)術(shù)界“青年***”里唯一一位來自智能語音技術(shù)行業(yè)領(lǐng)域的語音專家,曾多次獲得美國國家標(biāo)準(zhǔn)局和美國國防部語音識別評測冠軍,是國際最早的認(rèn)知型人機(jī)口語對話系統(tǒng)原型的主要實(shí)現(xiàn)者,在上海交通大學(xué)創(chuàng)建了智能語音實(shí)驗室。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46401

    瀏覽量

    236655
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    772

    瀏覽量

    48662
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    270

    瀏覽量

    14252
收藏 人收藏

    評論

    相關(guān)推薦

    車內(nèi)語音識別技術(shù)智能駕駛中的應(yīng)用與前景

    一、引言 隨著智能駕駛技術(shù)的快速發(fā)展,車內(nèi)語音識別技術(shù)逐漸成為智能駕駛領(lǐng)域的研究熱點(diǎn)。語音識別
    的頭像 發(fā)表于 02-19 11:46 ?718次閱讀

    語音合成技術(shù)智能駕駛中的創(chuàng)新與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機(jī)交互變得越來越重要。語音合成技術(shù)作為人機(jī)交互的重要手段,在智能駕駛中發(fā)揮著越來越重要的作用。本文將
    的頭像 發(fā)表于 02-01 18:09 ?571次閱讀

    語音數(shù)據(jù)集:智能駕駛中車內(nèi)語音識別技術(shù)的基石

    一、引言 在智能駕駛中,車內(nèi)語音識別技術(shù)發(fā)揮著越來越重要的作用。語音數(shù)據(jù)集作為這一技術(shù)的基石,其質(zhì)量和規(guī)模對
    的頭像 發(fā)表于 01-31 16:07 ?451次閱讀

    語音數(shù)據(jù)集在智能語音助手中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,智能語音助手已經(jīng)成為了人們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?b class='flag-5'>語音數(shù)據(jù)集在智能
    的頭像 發(fā)表于 01-18 15:46 ?332次閱讀

    語音數(shù)據(jù)集在智能語音搜索中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著互聯(lián)網(wǎng)的普及和移動設(shè)備的興起,智能語音搜索已經(jīng)成為人們獲取信息的重要方式之一。智能語音搜索通過語音交互的方式,為用戶提供更加便
    的頭像 發(fā)表于 01-18 15:09 ?488次閱讀

    語音數(shù)據(jù)集:智能語音技術(shù)的燃料與推動力

    隨著人工智能技術(shù)的不斷進(jìn)步,語音技術(shù)作為人機(jī)交互的重要方式,正在逐漸滲透到我們的日常生活中。而語音數(shù)據(jù)集作為智能
    的頭像 發(fā)表于 12-29 11:11 ?351次閱讀

    語音數(shù)據(jù)集:開啟智能語音技術(shù)的新篇章

    隨著人工智能技術(shù)的飛速發(fā)展,語音數(shù)據(jù)集在推動智能語音技術(shù)的進(jìn)步中發(fā)揮著越來越重要的作用。語音數(shù)據(jù)
    的頭像 發(fā)表于 12-29 11:06 ?556次閱讀

    語音數(shù)據(jù)集:推動人工智能語音技術(shù)的關(guān)鍵要素

    隨著人工智能技術(shù)的飛速發(fā)展,語音技術(shù)已成為人機(jī)交互領(lǐng)域的重要一環(huán)。語音數(shù)據(jù)集作為支撐語音技術(shù)研發(fā)
    的頭像 發(fā)表于 12-29 11:00 ?513次閱讀

    語音數(shù)據(jù)集:推動智能語音技術(shù)發(fā)展的關(guān)鍵驅(qū)動力

    隨著人工智能技術(shù)的不斷進(jìn)步,智能語音技術(shù)已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?b class='flag-5'>語音數(shù)據(jù)集作為智能
    的頭像 發(fā)表于 12-28 13:46 ?474次閱讀

    語音數(shù)據(jù)集:智能語音技術(shù)的基石與挑戰(zhàn)

    隨著人工智能技術(shù)的飛速發(fā)展,語音技術(shù)已成為人機(jī)交互領(lǐng)域的重要突破口。語音數(shù)據(jù)集作為支撐語音技術(shù)
    的頭像 發(fā)表于 12-28 11:28 ?653次閱讀

    離線語音智能床的應(yīng)用

    離線語音技術(shù),顧名思義,就是在沒有網(wǎng)絡(luò)連接的情況下,設(shè)備仍然能夠識別和處理用戶的語音指令。相比于在線語音技術(shù),離線
    的頭像 發(fā)表于 12-22 10:32 ?690次閱讀
    離線<b class='flag-5'>語音</b>在<b class='flag-5'>智能</b>床的應(yīng)用

    語音數(shù)據(jù)集在智能語音助手中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著智能設(shè)備的普及和人工智能技術(shù)的不斷發(fā)展,智能語音助手已經(jīng)成為人們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?b class='flag-5'>語音數(shù)據(jù)集在
    的頭像 發(fā)表于 12-14 15:07 ?690次閱讀

    語音數(shù)據(jù)集:AI語音技術(shù)的靈魂

    一、引言 在人工智能領(lǐng)域,語音技術(shù)被譽(yù)為“未來人機(jī)交互的入口”,而語音數(shù)據(jù)集則是AI語音技術(shù)的靈
    的頭像 發(fā)表于 12-14 14:33 ?907次閱讀

    語音數(shù)據(jù)集:推動AI語音技術(shù)的核心力量

    一、引言 隨著人工智能的快速發(fā)展,語音技術(shù)作為人機(jī)交互的重要手段,正發(fā)揮著越來越重要的作用。而語音數(shù)據(jù)集則是推動AI語音
    的頭像 發(fā)表于 12-12 11:32 ?615次閱讀

    離線語音識別及控制是怎樣的技術(shù)?

    引言:  隨著人工智能的飛速發(fā)展,離線語音識別技術(shù)成為了一項備受矚目的創(chuàng)新。離線語音識別技術(shù)能夠?qū)⑷说?b class='flag-5'>語
    發(fā)表于 11-24 17:41