0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度與科大訊飛的競爭正在從語音交互延伸到視覺交互等多模態(tài)技術(shù)上

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-03-22 09:28 ? 次閱讀

近兩年來,隨著人們越來越頻繁使用智能產(chǎn)品,所產(chǎn)生的數(shù)據(jù)越來越龐大,這些數(shù)據(jù)又被大公司所利用,龐大的數(shù)據(jù)也將催生“機器人大腦”。

目前市面上已經(jīng)誕生出越來越多的機器人產(chǎn)品,如:早教機器人、陪護機器人、商場機器人、銀行機器人、法務(wù)機器人等等,但是在實際的場景應(yīng)用中,機器人并不能帶來真正的智能。

最主要的功能就是體現(xiàn)在機器人大腦,用專業(yè)術(shù)語講就是“語義”,我們在語義的采集上還處在非常初級的階段,如果處理不了語義理解,那機器人在實際場景中的應(yīng)用就是一個“呆子”。

讓機器人開口說話,除了語義之外,語音也是關(guān)鍵的技術(shù),國內(nèi)科大訊飛在語音技術(shù)上的造詣,讓國內(nèi)很多做機器人的企業(yè)受惠,其語音處理技術(shù)基本上已經(jīng)能滿足人們?nèi)粘I钪械氖褂眯枨蟆?/p>

但是國內(nèi)機器人產(chǎn)業(yè)接下來的發(fā)展將會開始加速,在這次1號機器人網(wǎng)研討會上,不管是百度,還是科大訊飛所傳遞的信息就是已做好全面出擊的準(zhǔn)備。

雖然國內(nèi)語音語義的發(fā)展正在加速,但是對機器人企業(yè)而言,速度還不夠快,目前不管是百度,還是科大訊飛所提供的語音語義還是不能滿足機器人在實際應(yīng)用中的要求。

城市漫步總經(jīng)理李正說:“在人們與機器人對話的過程中,一些簡單的問題,機器人是可以回答,但是稍微復(fù)雜一些的問題,機器人就回答不了,BAT或科大訊飛所提供的語義,讓機器人處在小孩3歲左右的智力水平。對很多機器人企業(yè)而言,目前的瓶頸也是在這里,很難有所突破。”

科大訊飛銷售總監(jiān)廖凱說:“其實訊飛也很苦惱,語音助理已經(jīng)通過國家各種考試,很難說它的智力不行,訊飛高考機器人基于目前的成長速度,到2020年會考上一本,去年的數(shù)據(jù)顯示,語文考了90多分,數(shù)學(xué)考了110多分?!?/p>

只能說人們?nèi)粘=涣髦校w現(xiàn)的語言很復(fù)雜,目前的大數(shù)據(jù)還不能夠支撐人們復(fù)雜的日常交流。

百度自然語言技術(shù)開放負(fù)責(zé)人張晶晶說:“人工智能聰明程度其實很大程度上取決于數(shù)據(jù),百度為什么在人工智能領(lǐng)域國內(nèi)領(lǐng)先,因為背后是龐大的數(shù)據(jù),比如百度搜索,每天有60億次搜索,這些數(shù)據(jù)支撐百度深度語義理解,像這種過億用戶的APP,百度有14個,這些數(shù)據(jù)支撐了百度大腦每時每刻都在進化?!?/p>

“國內(nèi)各大平臺,如:百度UNIT、訊飛AIUI、小i機器人、思必馳等,其實各家的側(cè)重點不同,因此,最終的測試結(jié)果也會不同,像百度的對話效果只有達(dá)到95%以上才會放出來?!?/p>

但是在這次1號機器人網(wǎng)研討會上,機器人企業(yè)對各大平臺所提供的語義依然不是特別滿意。

或許國內(nèi)各大機器人企業(yè)過于依賴BAT等企業(yè),希望依靠BAT大企業(yè)的投入完善語音語義技術(shù),但是百度已經(jīng)在語音語義上投入了3億元,雖然技術(shù)積累很快,但是目前的瓶頸是依然還不能支撐機器人日常復(fù)雜的對話交流。

狗尾草聯(lián)合創(chuàng)始人張博說:“3至5歲小孩,同一個問題,在每個年齡段尋求的答案都不同,所以對語義的要求非常高,如果真要做好語義理解,就需要把語義理解做的足夠細(xì),再接入知識圖譜,如果是批量的知識圖譜,那就需要各大平臺開放知識庫,讓機器人企業(yè)去調(diào)用,滿足更高級開發(fā)的產(chǎn)品需求?!?/p>

從這次1號機器人網(wǎng)研討會上反饋,現(xiàn)階段讓各大平臺完全開放知識庫不現(xiàn)實,像百度、科大訊飛、小i機器人等投入巨資打造知識庫,機器人企業(yè)想調(diào)用深層次語義,就需要支付相應(yīng)的報酬。

當(dāng)然很多機器人企業(yè)對語音還是另有看法,比如AI與UI,明明很多場景直接通過UI就可以解決的事情,干嘛非要用語音,把簡單的事情復(fù)雜化。

這個問題的著重點在于,目前看來語音確實還不是最好用的產(chǎn)品,但是長遠(yuǎn)看語音將會是最便捷的交互方式。

當(dāng)汽車和火車剛發(fā)明的時候,跑起來還沒有馬車快,但是終究汽車和火車是發(fā)展方向。

科大訊飛廖凱說:“人與機器發(fā)生交互的時候,輸入輸出信息有兩種,我們從機器身上獲取的信息,最簡單的方式就是視覺,一目了然;但我們輸出的信息最自然的方式是語音。這是語音的特性,未來一定會顛覆傳統(tǒng)以鍵盤或觸屏的輸出方式。”

接下來,我們回到產(chǎn)品上來,對機器人企業(yè)而言,現(xiàn)階段就算依靠BAT等企業(yè)的語音語義技術(shù),也不能讓產(chǎn)品具備高智慧,充其量只能達(dá)到小孩3歲左右的智力水平。

所以未來的方向在于細(xì)分場景,比如:訂機票、訂酒店等,采用百度和科大訊飛的語音語義可以非常成熟的完成,讓用戶從查詢機票到預(yù)訂票到購買機票等全過程,期間進行的多輪復(fù)雜人機對話可達(dá)7層以上。

因此,在一些細(xì)分商用場景,語音已經(jīng)可以做到替代客服的工作,對機器人企業(yè)而言,如何讓機器人+語音語義+使用場景落地才是接下來重點思考的方向。

百度張晶晶認(rèn)為,通過百度大數(shù)據(jù)分析,兒童故事機的市場規(guī)模很大,目前正是更新?lián)Q代的時間節(jié)點,因此,百度對兒童領(lǐng)域的投入會有所加大。

科大訊飛廖凱說:“今年大型商用機器人會有所發(fā)展,目前訊飛曉曼機器人已經(jīng)入駐紅星美凱龍、居然之家,以及一些零售商場。曉曼機器人目前已經(jīng)可以做到導(dǎo)航領(lǐng)路、提供資訊、針對商場還提供了一套機器人營銷方案,通過大數(shù)據(jù)幫助商家提高客戶的轉(zhuǎn)化率?!?/p>

目前國內(nèi)大型商用機器人研發(fā)投入大,但是相對售價高、利潤高,很多機器人企業(yè)在大型商用機器人身上舍得投入,因此,對科大訊飛而言,也有更強的動力去做技術(shù)的迭代。

如果從競爭的角度去分析,目前百度和科大訊飛提供的語音語義方案是旗鼓相當(dāng)。

但是接下來的競爭將會更加深入,涉及到多模態(tài)技術(shù)交互。

科大訊飛在AIUI的構(gòu)架下,加入手勢識別、圖像識別,使得人機交互技術(shù)更加復(fù)雜;百度也是一樣,在提供語音交互的基礎(chǔ)上加入圖像識別,提供一站式服務(wù)。

因此,百度與科大訊飛的競爭正在從語音交互延伸到視覺交互等多模態(tài)技術(shù)上,對機器人企業(yè)而言,全新的時代即將來臨,在主流人工智能企業(yè)激烈的競爭下,能夠享受到的技術(shù)紅利是,可以以低成本的方案去創(chuàng)造一臺全新的機器人。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    210

    文章

    27990

    瀏覽量

    205547
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    778

    瀏覽量

    61086
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    279

    瀏覽量

    13309

原文標(biāo)題:百度與科大訊飛競爭將從語音擴散到視覺

文章出處:【微信號:robot-1hjqr,微信公眾號:1號機器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    2024科大全球1024開發(fā)者節(jié)官宣

    在這場屬于開發(fā)者的年度人工智能盛會上,不僅有產(chǎn)學(xué)研大咖現(xiàn)場分享,升級行業(yè)大模型及更多應(yīng)用產(chǎn)品,首發(fā)模態(tài)視覺交互及超擬人虛擬人交互能力,
    的頭像 發(fā)表于 10-14 10:01 ?466次閱讀

    科大將首發(fā)模態(tài)視覺交互及超擬人虛擬人交互

    近日,科大傳來喜訊,第七屆世界聲博會暨2024科大全球1024開發(fā)者節(jié)將于10月24日至
    的頭像 發(fā)表于 10-11 16:48 ?250次閱讀

    科大發(fā)布星火極速超擬人交互,重塑智能對話新體驗

    8月19日,科大震撼宣布了一項關(guān)于其明星產(chǎn)品——星火語音大模型的重大革新,即將推出的“星火極速超擬人交互”功能,預(yù)示著人機
    的頭像 發(fā)表于 08-20 16:46 ?272次閱讀

    科大發(fā)布星火大模型V4.0

    在科技創(chuàng)新的浪潮中,科大再度引領(lǐng)潮流,于北京隆重發(fā)布了星火大模型V4.0及其在領(lǐng)域的人
    的頭像 發(fā)表于 07-01 10:33 ?773次閱讀

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/模態(tài)交互/英語評測SDK合集)

    豐富外設(shè)配件 配套模態(tài)應(yīng)用示例,支持快速上手體驗大模型語音交互、智能視覺 AI 應(yīng)用 板載
    發(fā)表于 06-18 17:33

    科大華中總部已封頂 年內(nèi)交付使用

    科大華中總部已封頂 年內(nèi)交付使用 科大華中總部位于武漢經(jīng)開區(qū)車谷資本島,投資額50億;計
    的頭像 發(fā)表于 04-16 14:49 ?1356次閱讀

    【有獎】 百度智能云目推出首款模態(tài) AI 模組,應(yīng)用場景有獎?wù)骷?/a>

    他來了,他來了 大模型時代悄然到來 百度首款大模型落地的硬件產(chǎn)品 模態(tài)AI模組LUCA系列正式亮相 目LUCA深度集成
    的頭像 發(fā)表于 02-26 15:19 ?481次閱讀

    科大發(fā)布“星火V3.5”:基于全國產(chǎn)算力訓(xùn)練的全民開放大模型

    科大,作為中國領(lǐng)先的智能語音和人工智能公司,近日宣布推出首個基于全國產(chǎn)算力訓(xùn)練的全民開放大模型“
    的頭像 發(fā)表于 02-04 11:28 ?1402次閱讀

    科大發(fā)布星火語音大模型

    科大行業(yè)資訊
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年01月31日 09:17:28

    大模型星火V3.5,1月30日正式發(fā)布

    2024年1月30日14:00星火再升級;這一次首個基于全國產(chǎn)化算力平臺訓(xùn)練的全民開放大模型 星火V3.5正式發(fā)布邏輯推理、語言理解、文本生成、 數(shù)學(xué)答題、
    的頭像 發(fā)表于 01-23 09:06 ?742次閱讀

    華為智能座艙與百度地圖簽署生態(tài)合作協(xié)議 共創(chuàng)導(dǎo)航出行新體驗

    此次簽約,百度地圖和華為智能座艙將在智能座艙領(lǐng)域共同打造車機版百度地圖,將手機端百度地圖的豐富體驗延伸到車端,包括車道級導(dǎo)航、紅綠燈倒計時、實時停車場導(dǎo)航、個性
    的頭像 發(fā)表于 01-19 15:50 ?606次閱讀

    科技創(chuàng)新與智能助力:揭秘科大智能鍵盤D1的獨特魅力

    魅力,從多個功能角度進行介紹,并探討其適用于年會采購、企業(yè)送禮以及辦公采購場景。 ? 一、語音翻譯:打破語言壁壘 智能鍵盤D1搭載了科大
    的頭像 發(fā)表于 01-03 11:02 ?558次閱讀
    科技創(chuàng)新與智能助力:揭秘<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>智能鍵盤D1的獨特魅力

    語音識別技術(shù)最新進展:視聽融合的模態(tài)交互成為主要演進方向

    多種模態(tài)(聲學(xué)、語言模型、視覺特征)進行聯(lián)合建模,基于深度學(xué)習(xí)的模態(tài)語音識別取得了新進展。
    的頭像 發(fā)表于 12-28 09:06 ?3286次閱讀
    <b class='flag-5'>語音</b>識別<b class='flag-5'>技術(shù)</b>最新進展:視聽融合的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>成為主要演進方向

    科大語音控制模塊怎么用

    科大語音控制模塊是一種人機交互技術(shù),它利用語音識別和語音
    的頭像 發(fā)表于 12-25 13:58 ?1517次閱讀

    汽車模態(tài)交互研究:大模型及模態(tài)融合,推進AI Agent上車

    語音交互方面:語音交互在AI大模型的賦能下,功能愈加智能化、情感化。唇動識別、聲紋識別技術(shù)的上
    的頭像 發(fā)表于 11-24 16:12 ?1343次閱讀
    汽車<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>研究:大模型及<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>融合,推進AI Agent上車