0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

未來(lái)機(jī)器智能時(shí)代:如何讓機(jī)器聽懂世界

HOPE開放創(chuàng)新平臺(tái) ? 2017-12-08 10:55 ? 次閱讀

語(yǔ)言承載了人類文化,人類需要通過(guò)語(yǔ)言學(xué)習(xí)知識(shí)和傳遞信息,這是人類區(qū)別于動(dòng)物界最重要的特性之一。

因此,未來(lái)的機(jī)器智能時(shí)代,機(jī)器也必然需要通過(guò)語(yǔ)言實(shí)現(xiàn)與人類之間的交互,似乎最近的科幻片都已經(jīng)暗示了這個(gè)問(wèn)題。

現(xiàn)在的科幻就是未來(lái)的現(xiàn)實(shí),因此,讓機(jī)器聽懂世界,這是未來(lái)機(jī)器智能時(shí)代的關(guān)鍵問(wèn)題,也是人類一個(gè)更大的夢(mèng)想,但是,我們距離人類的這個(gè)夢(mèng)想還有多遠(yuǎn)呢?

01讓機(jī)器聽懂世界承載了人類千年夢(mèng)想

首先明確一個(gè)概念,讓機(jī)器聽懂世界,這里面其實(shí)蘊(yùn)含了多個(gè)歷程,包括聽懂人類語(yǔ)言,進(jìn)而聽懂動(dòng)物叫聲,甚至聽懂自然聲音,亦或類似地球的耳朵LIGO那樣聆聽宇宙的“聲音”。

所有這些都是極其復(fù)雜的過(guò)程,因?yàn)槲覀內(nèi)祟悓?shí)際上也沒有達(dá)到這種能力,但是我們期望機(jī)器能夠延伸人類的能力,從而實(shí)現(xiàn)人類的夢(mèng)想。所以語(yǔ)音智能事實(shí)上承載的是幾千年來(lái)人類的偉大夢(mèng)想。

那么,如何才能讓機(jī)器聽懂人類語(yǔ)言呢?這需要解決三個(gè)核心關(guān)鍵問(wèn)題:聽見、聽準(zhǔn)和聽懂,從技術(shù)角度來(lái)看,就是拾音、識(shí)別和理解三個(gè)關(guān)鍵技術(shù)環(huán)節(jié)。

拾音是最為基礎(chǔ)的環(huán)節(jié),必須保證讓機(jī)器聽得見聲音,這部分主要是聲學(xué)問(wèn)題;

識(shí)別是將符合要求的聲音轉(zhuǎn)化成文字,這部分主要是語(yǔ)音識(shí)別的問(wèn)題;

理解則是根據(jù)識(shí)別出來(lái)的文字,準(zhǔn)確理解人類的指令甚或情感。

鑒于語(yǔ)音智能設(shè)備已經(jīng)大量出現(xiàn)在我們生活場(chǎng)景之中,當(dāng)前技術(shù)的核心關(guān)鍵就是聲學(xué)問(wèn)題和語(yǔ)義理解。

02近場(chǎng)語(yǔ)音是機(jī)器聽懂人類的率先嘗試

近場(chǎng)語(yǔ)音交互主要是指人類距離機(jī)器不超過(guò)30厘米范圍的語(yǔ)音識(shí)別技術(shù),這項(xiàng)技術(shù)利用距離巧妙回避了真實(shí)場(chǎng)景下復(fù)雜的聲學(xué)問(wèn)題,可以理解為一種實(shí)驗(yàn)室理想環(huán)境下的語(yǔ)音交互技術(shù)。

近場(chǎng)語(yǔ)音識(shí)別從上世紀(jì)五十年代就開始研究,但是長(zhǎng)期沒有實(shí)質(zhì)性進(jìn)展,直到蘋果在2010年推出Siri的應(yīng)用,這才引起了全球的關(guān)注。到現(xiàn)在為止,近場(chǎng)語(yǔ)音交互技術(shù)已經(jīng)比較成熟,平均識(shí)別率可以達(dá)到95%以上。

但是近場(chǎng)語(yǔ)音交互受到了真實(shí)場(chǎng)景的巨大制約,并沒有展現(xiàn)出來(lái)語(yǔ)音交互可以解放雙手的先進(jìn)性,因此在很多場(chǎng)景中,事實(shí)上近場(chǎng)語(yǔ)音交互都是雞肋一般的存在,并沒有發(fā)揮出真正的威力。

直到遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)的出現(xiàn),成功解決了真實(shí)場(chǎng)景下的復(fù)雜聲學(xué)問(wèn)題以后,至少技術(shù)達(dá)到了用戶認(rèn)可的門檻,語(yǔ)音交互才真正出現(xiàn)了替代鍵盤鼠標(biāo)和觸摸屏的可能性。

03遠(yuǎn)場(chǎng)語(yǔ)音將語(yǔ)音智能落地到真實(shí)場(chǎng)景

遠(yuǎn)場(chǎng)語(yǔ)音交互主要解決30厘米到5米范圍內(nèi)的語(yǔ)音交互問(wèn)題,這個(gè)范圍事實(shí)上就是人類之間溝通交流的最佳距離,距離太近容易觸發(fā)自我保護(hù)意識(shí),而距離太遠(yuǎn)則會(huì)增大交流難度。

注意語(yǔ)音交互并非只是語(yǔ)音問(wèn)題,人類的交互其實(shí)是一個(gè)綜合的過(guò)程,包括了表情、眼神、肢體動(dòng)作等等一系列影響因素。

遠(yuǎn)場(chǎng)語(yǔ)音交互的歷史是比較短暫的,這項(xiàng)技術(shù)以前長(zhǎng)期沒有實(shí)質(zhì)性突破,直到2016年末,全球才真正開始重視這項(xiàng)技術(shù),并且短短一年時(shí)間,引領(lǐng)全球市場(chǎng)都進(jìn)入了激烈博弈的階段。

遠(yuǎn)場(chǎng)語(yǔ)音交互的代表產(chǎn)品自然就是智能音箱,盤點(diǎn)一下全球巨頭在智能音箱的布局就可窺得一二。亞馬遜的Echo發(fā)布四年已然影響深遠(yuǎn),谷歌的Home劍走偏鋒以技術(shù)做博弈,微軟的Invoke則仍然堅(jiān)持工程師定義產(chǎn)品的文化......

注意,這里還是特別強(qiáng)調(diào)智能音箱只是遠(yuǎn)場(chǎng)語(yǔ)音交互的突破口,并非什么語(yǔ)音的唯一入口,因?yàn)槲磥?lái)的機(jī)器智能時(shí)代,比如電視、冰箱、汽車都有可能成為重要入口。但是智能音箱又是非常重要的,因?yàn)椴还墚a(chǎn)品形態(tài)怎樣變化,其本質(zhì)的核心其實(shí)還是智能音箱的技術(shù)架構(gòu)。

04聽懂世界還有哪些必須解決的問(wèn)題?

若讓機(jī)器聽懂世界,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)也僅是個(gè)嘗試而已,事實(shí)上遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)本身也只是剛剛起步,即便5米以內(nèi),其噪聲抑制、回聲抵消、混響去除、遠(yuǎn)場(chǎng)喚醒和遠(yuǎn)場(chǎng)識(shí)別等核心技術(shù)還存在諸多缺陷。

但是技術(shù)一直在迭代發(fā)展,特別是當(dāng)技術(shù)落地場(chǎng)景以后,源源不斷的真實(shí)數(shù)據(jù)和客戶需求將帶動(dòng)技術(shù)更加快速的發(fā)展。

從技術(shù)層面來(lái)看,讓機(jī)器聽懂世界涉及了數(shù)學(xué)、物理學(xué)、語(yǔ)言學(xué)、醫(yī)學(xué)、計(jì)算機(jī)學(xué)等各學(xué)科的知識(shí),很難一一枚舉出來(lái),但是若從應(yīng)用場(chǎng)景來(lái)看,則相對(duì)比較簡(jiǎn)單,讓機(jī)器聽懂世界包括了人類語(yǔ)言、人類情感、動(dòng)物聲音和自然聲音。

讓機(jī)器聽懂世界的技術(shù)正在全球快速的演化,相信不久的將來(lái),我們肯定能看到更加智能的機(jī)器。

因此,既不要抨擊當(dāng)前的人工智能技術(shù),也不要盛贊現(xiàn)在的基礎(chǔ)科技技術(shù),保持一顆平靜的心,正確給予科技界和產(chǎn)業(yè)界的支持才是對(duì)于未來(lái)最大的投資。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27994

    瀏覽量

    205551
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46348

    瀏覽量

    236509
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    10

    文章

    771

    瀏覽量

    48657

原文標(biāo)題:讓機(jī)器聽懂世界,觸及人類夢(mèng)想還有多遠(yuǎn)?

文章出處:【微信號(hào):haierhope,微信公眾號(hào):HOPE開放創(chuàng)新平臺(tái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    星塵智能Astribot S1亮相世界機(jī)器人大會(huì)

    2024世界機(jī)器人大會(huì)在京盛大開幕,深圳星塵智能攜其新一代AI機(jī)器人助理Astribot S1驚艷登場(chǎng),成為展會(huì)焦點(diǎn)。Astribot S1不僅展現(xiàn)了在復(fù)雜環(huán)境中的卓越感知與認(rèn)知能力,
    的頭像 發(fā)表于 08-27 15:36 ?355次閱讀

    軟通動(dòng)力與智元機(jī)器人攜手亮相世界機(jī)器人大會(huì)

    北京2024年8月22日?/美通社/ -- 8月21日,以"共育新質(zhì)生產(chǎn)力?共享智能未來(lái)"為主題的2024世界機(jī)器人大會(huì)在北京開幕。作為數(shù)字技術(shù)產(chǎn)品和服務(wù)創(chuàng)新領(lǐng)導(dǎo)企業(yè)以及人形
    的頭像 發(fā)表于 08-22 13:12 ?238次閱讀
    軟通動(dòng)力與智元<b class='flag-5'>機(jī)器</b>人攜手亮相<b class='flag-5'>世界</b><b class='flag-5'>機(jī)器</b>人大會(huì)

    在用機(jī)器人與未來(lái)機(jī)器人并行推進(jìn)的權(quán)重關(guān)系

    在用機(jī)器人與未來(lái)機(jī)器人并行推進(jìn)的權(quán)重關(guān)系
    的頭像 發(fā)表于 08-01 08:14 ?407次閱讀
    在用<b class='flag-5'>機(jī)器</b>人與<b class='flag-5'>未來(lái)</b><b class='flag-5'>機(jī)器</b>人并行推進(jìn)的權(quán)重關(guān)系

    ROS機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    化的快速發(fā)展,智能機(jī)器人設(shè)備已成為工業(yè)自動(dòng)化體系的佼佼者,而智能機(jī)器人設(shè)備核心—ROS系統(tǒng),是機(jī)器人領(lǐng)域的集大成者,主要應(yīng)用于
    發(fā)表于 07-09 11:38

    特斯拉Optimus人形機(jī)器人再進(jìn)化,上海世界人工智能大會(huì)首秀引領(lǐng)未來(lái)

    在科技日新月異的今天,人工智能機(jī)器人技術(shù)的每一次飛躍都牽動(dòng)著全球的目光。近日,特斯拉官方宣布了一個(gè)振奮人心的消息:其精心研發(fā)的第二代Optimus人形機(jī)器人將于7月4日至7日在中國(guó)上海的世界
    的頭像 發(fā)表于 07-04 15:48 ?431次閱讀

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來(lái)?

    的提升和數(shù)據(jù)可獲取性的增加,大模型已經(jīng)成為人工智能研究和應(yīng)用的一個(gè)重要趨勢(shì)。 這些模型在處理復(fù)雜任務(wù)時(shí),尤其是在自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺、語(yǔ)音識(shí)別等領(lǐng)域,展現(xiàn)出非凡的能力。 大數(shù)據(jù)時(shí)代為訓(xùn)練復(fù)雜
    發(fā)表于 06-25 15:00

    其利天下技術(shù)·搭載無(wú)刷電機(jī)的掃地機(jī)器人的前景如何?

    于部分消費(fèi)者來(lái)說(shuō),掃地機(jī)器人仍然是一筆不小的開支。 4.掃地機(jī)器人的未來(lái)發(fā)展前景 展望未來(lái),搭載無(wú)刷電機(jī)的掃地機(jī)器人有望在多個(gè)方面實(shí)現(xiàn)突破
    發(fā)表于 05-05 15:03

    富唯智能:打造未來(lái)機(jī)器人教育新標(biāo)桿

    隨著科技的飛速發(fā)展,機(jī)器人教育正逐漸成為培養(yǎng)未來(lái)人才的重要領(lǐng)域。富唯智能,作為業(yè)內(nèi)領(lǐng)先的機(jī)器人技術(shù)提供商,近日推出了一款全新的機(jī)器人教育實(shí)踐
    的頭像 發(fā)表于 04-23 16:45 ?311次閱讀

    探索未來(lái)智能巡檢機(jī)器人在工業(yè)領(lǐng)域的應(yīng)用

    在當(dāng)今科技迅速發(fā)展的時(shí)代,智能巡檢機(jī)器人作為工業(yè)領(lǐng)域的新生力量,正逐漸成為工廠、倉(cāng)庫(kù)等環(huán)境中不可或缺的重要角色。那么,究竟什么是智能巡檢機(jī)器
    的頭像 發(fā)表于 04-15 17:48 ?1133次閱讀
    探索<b class='flag-5'>未來(lái)</b>:<b class='flag-5'>智能</b>巡檢<b class='flag-5'>機(jī)器</b>人在工業(yè)領(lǐng)域的應(yīng)用

    EPSON助力智能泳池清潔機(jī)器人導(dǎo)航

    與家用掃地機(jī)器人相同的部分是目前泳池清潔機(jī)器人主要還是隨機(jī)式行走,沒有加入路徑規(guī)劃部分,清潔效率較低,未來(lái)將很快步入規(guī)劃式時(shí)代。不同的部分是泳池內(nèi)的環(huán)境與家用掃地機(jī)
    的頭像 發(fā)表于 04-08 11:15 ?345次閱讀
    EPSON助力<b class='flag-5'>智能</b>泳池清潔<b class='flag-5'>機(jī)器</b>人導(dǎo)航

    AI算法的本質(zhì)是模擬人類智能,機(jī)器實(shí)現(xiàn)智能

    視覺等領(lǐng)域。 ? AI 算法的核心是實(shí)現(xiàn)智能化的決策和行為 ? AI算法的本質(zhì)在于模擬人類智能的能力,計(jì)算機(jī)能夠?qū)ΜF(xiàn)實(shí)世界進(jìn)行模擬和模仿,從而達(dá)到
    的頭像 發(fā)表于 02-07 00:07 ?5389次閱讀

    人形機(jī)器人產(chǎn)業(yè)發(fā)展機(jī)遇與挑戰(zhàn)并存

    隨著人工智能時(shí)代的到來(lái),“人形機(jī)器人+”正被視為未來(lái)數(shù)字化、智能化背景下,人工智能應(yīng)用的終極賽道
    發(fā)表于 12-25 10:45 ?288次閱讀

    基于智能制造的工業(yè)機(jī)器人應(yīng)用實(shí)踐

    工業(yè)機(jī)器人在智能制造時(shí)代的應(yīng)用趨勢(shì),并以在泰國(guó)某汽車零部件制造業(yè)企業(yè)的工業(yè)機(jī)器智能化應(yīng)用為例,詳細(xì)介紹了工業(yè)
    的頭像 發(fā)表于 12-22 17:28 ?1059次閱讀
    基于<b class='flag-5'>智能</b>制造的工業(yè)<b class='flag-5'>機(jī)器</b>人應(yīng)用實(shí)踐

    焊縫跟蹤未來(lái):人工智能機(jī)器學(xué)習(xí)的影響

    隨著科技的不斷進(jìn)步,焊接行業(yè)也在迎來(lái)一場(chǎng)革命性的變革。焊縫跟蹤技術(shù),作為焊接領(lǐng)域的關(guān)鍵創(chuàng)新之一,正在經(jīng)歷著人工智能機(jī)器學(xué)習(xí)的引領(lǐng)下迎來(lái)更加智能、高效的發(fā)展。本文將深入探討焊縫跟蹤技術(shù)未來(lái)
    的頭像 發(fā)表于 12-12 11:51 ?415次閱讀

    ROS機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    ,以及包管理。它也提供用于獲取、編譯、編寫、和跨計(jì)算機(jī)運(yùn)行代碼所需的工具和庫(kù)函數(shù)。圖1 隨著工業(yè)智能化的快速發(fā)展,智能機(jī)器人設(shè)備已成為工業(yè)自動(dòng)化體系的佼佼者,而智能
    發(fā)表于 11-30 16:01