0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在CES 2018上語音和人工智能應(yīng)用的大爆發(fā)

NJ90_gh_bee81f8 ? 2018-01-16 14:22 ? 次閱讀

在今年的國際消費(fèi)電子展(CES 2018)上,語音(voice)、連接(connectivity)和人工智能(AI)成為最受關(guān)注的焦點(diǎn)。如果說今年的CES能為我們帶來什么指標(biāo),那么這三項(xiàng)建構(gòu)模塊將是組成2018年及未來消費(fèi)電子設(shè)備缺一不可的神圣“三位一體”。

語音助理已經(jīng)準(zhǔn)備好進(jìn)入可穿戴設(shè)備、耳機(jī)、嬰兒監(jiān)視器、燈具、電視遙控器和車輛。DSP Concepts創(chuàng)辦人兼首席技術(shù)官Paul Beckmann在接受《EE Times》時(shí)說:“我們似乎正見證著一場圍繞著語音的‘寒武紀(jì)大爆發(fā)’?!?br />
DSP Concepts首席技術(shù)官Paul Beckmann

在CES上,被稱為“中國Google”的百度大力向開發(fā)商展示并開放其基于Duer OS的平臺(tái)。無論是其聲控臺(tái)燈或掛在天花板上的投影機(jī)和屏幕,都不需要Alexa或Google Assist。就像百度常掛在嘴邊的“中國速度”,越來越多的廠商開始朝向語音發(fā)展。

百度展示了一款整合臺(tái)燈功能的聲控智能喇叭(來源:Baidu)

消費(fèi)設(shè)備必須具備連接能力已經(jīng)是不爭的事實(shí)。Silicon Labs首席執(zhí)行官Tyson Tuttle強(qiáng)調(diào),接下來的必備功能是“混搭”不同的無線網(wǎng)絡(luò)。他解釋說,直接將原本為智能手機(jī)設(shè)計(jì)的連接芯片加進(jìn)物聯(lián)網(wǎng)(IoT)設(shè)備,已經(jīng)無法滿足要求了。系統(tǒng)需要?jiǎng)討B(tài)的多協(xié)議軟件,以及為不同的無線網(wǎng)絡(luò)劃分時(shí)間的能力。

盡管AI在高度自動(dòng)化汽車中占據(jù)主導(dǎo)地位,但Ceva首席執(zhí)行官Gideon Wertheizer告訴我們:“我看到AI開始擺脫幻想世界?!惫?yīng)商如今正試著“設(shè)置參數(shù),在隨機(jī)環(huán)境中使用AI來解決特定問題?!?br /> Ceva首席執(zhí)行官Gideon Wertheizer

換句話說,許多公司開始學(xué)習(xí)在小規(guī)模應(yīng)用中導(dǎo)入AI,并將其用于特定任務(wù),而非依靠AI來解決世界上的問題。

語音隨車上路

無論是在家庭或開車行駛中,語音都將至關(guān)重要。

博世(Robert Bosch)在CES宣布計(jì)劃將其語音助理設(shè)計(jì)在方向盤后方。博世管理董事會(huì)成員Dirk Hoheisel表示:“我們正致力于讓駕駛艙內(nèi)的按鈕亂象劃下句點(diǎn)?!盓lektrobit在CES上承諾,該公司將成為亞馬遜(Amazon) Alexa的第一批汽車軟件整合商之一。

Bosch開發(fā)“自然語言”車內(nèi)語音輔助系統(tǒng)(來源:Bosch)

百度宣布其基于Duer OS的Apollo 2.0平臺(tái)被稱為“自動(dòng)車輛的Android”,并稱語音輔助系統(tǒng)將成為該平臺(tái)的一部份。百度總裁兼COO陸奇表示:“家庭與車輛之間已經(jīng)不存在界限了。無論你在家中做什么,應(yīng)該也都可以在車子里實(shí)現(xiàn)?!?/p>

Wertheizer則指出,無論是在家中還是車內(nèi),隔離聲音以及直接向云端發(fā)送清晰的訊號(hào)都非常困難。 “我們的周遭充斥著噪音和噪聲著?!焙茏匀坏?,家庭和汽車的解決方案必須能夠因應(yīng)一連串完全不同的嘈雜環(huán)境。

語音算法缺少標(biāo)準(zhǔn)

讓問題變得更復(fù)雜的原因在于業(yè)界還沒有任何標(biāo)準(zhǔn)的語音算法。

Wertheizer表示:“每一家公司都有自家處理語音的專有算法?!?/p>

系統(tǒng)業(yè)者開始求助于學(xué)術(shù)界發(fā)表的技術(shù)論文,競相找出如何最有效隔離語音的解決之道。而當(dāng)他們使用不同的麥克風(fēng)和揚(yáng)聲器類型時(shí),還必須優(yōu)化其算法,以因應(yīng)不同的設(shè)置要求。

而在Ceva,Wertheizer說:“我們必須建立一個(gè)類似原子庇護(hù)所的工作室”,用于研究所有的選擇,并開發(fā)波束成形、遠(yuǎn)場和近場、回聲消除和環(huán)境降噪等算法。

Beckman也呼應(yīng)了這個(gè)觀點(diǎn)。就像人們喜歡語音作為自然的用戶接口一樣,他說:“遺憾的是,對(duì)于實(shí)際執(zhí)行的產(chǎn)品設(shè)計(jì)人員來說,它是最具挑戰(zhàn)的技術(shù)之一?!彼呀?jīng)看到了太多的語音項(xiàng)目出錯(cuò)了,最終得回到草圖階段重新開始。

Beckman曾經(jīng)在Bose Corp.擔(dān)任研究工程師長達(dá)9年,在2000年初成立了他的咨詢業(yè)務(wù)。當(dāng)他與客戶討論語音項(xiàng)目時(shí),他發(fā)現(xiàn)業(yè)界需要一套有效執(zhí)行的“完整軟件解決方案,以及能為其實(shí)現(xiàn)差異化的底層技術(shù)”。但是,最主要的關(guān)鍵在于賦予其能夠自行調(diào)整系統(tǒng)的能力。

隨著語音市場爆發(fā),Beckman的業(yè)務(wù)也隨之成長。DSP Concepts不再只是一家咨詢公司,現(xiàn)在還提供了一套完整的算法作為軟件庫和除錯(cuò)工具,有助于客戶調(diào)整系統(tǒng)。Beckman說:“我們提供調(diào)整、整合和驗(yàn)證工具?!?br />
語音UI解決方案需要一套完整的算法(來源:DSP Concepts)

DSP Concepts的語音用戶接口(UI)技術(shù)稱為Audio Weaver,它是第一家獲得亞馬遜(Amazon) Alexa產(chǎn)品認(rèn)證的第三方軟件公司。DSP Concepts共同創(chuàng)辦人兼首席執(zhí)行官Chin Beckmann展示一款A(yù)udio Weaver語音助理產(chǎn)品——相較于亞馬遜Echo使用了7支麥克風(fēng),Audio Weaver僅用了2支麥克風(fēng),據(jù)稱就能夠“聽”得比Echo或Google Home更清楚。

在邊緣實(shí)現(xiàn)AI

Wertheizer說,隔離語音是第一步,但接下來還有其他步驟:語音助理必須辨識(shí)語音的位置,而且必須能夠追蹤語音。而且,它必須能偵測以及辨識(shí)誰在房間里說話。

直到最近,云端才剛被認(rèn)為是處理和學(xué)習(xí)的地方。如今,這個(gè)假設(shè)將在2018年發(fā)生改變。

Wertheizer解釋說:“我看到人們對(duì)于AI的態(tài)度越來越務(wù)實(shí)。他們希望在邊緣設(shè)備執(zhí)行AI而非在云端進(jìn)行,以避免隱私、延遲和成本等問題。”

聯(lián)發(fā)科技(MedaTek)首席財(cái)務(wù)官顧大為對(duì)此表示認(rèn)同。相較于亞馬遜在其Echo設(shè)備中推動(dòng)云端到云端的服務(wù),聯(lián)發(fā)科看到了“邊緣和云端”融合模式的可能性。他在CES時(shí)告訴我們,語音助理競賽如今已經(jīng)著重于在本地增加“智慧”、區(qū)別人類與非人類的聲音分開、消除背景音樂、辨識(shí)聲音模式等。

Petcube Wi-Fi寵物照相在遠(yuǎn)程進(jìn)行機(jī)監(jiān)測并與寵物互動(dòng)(來源:Petcube)

Wertheizer說:“以Petcube設(shè)計(jì)的交互式Wi-Fi寵物相機(jī)為例,它能在主人不在家時(shí),透過雙向音訊和1080p高分辨率(HD)視頻攝影機(jī)進(jìn)行監(jiān)控,以及與狗或貓互動(dòng)”。Wertheizer說:“我不確定Petcube是否意識(shí)到這是一家物聯(lián)網(wǎng)公司。但是,像這樣的連網(wǎng)產(chǎn)品中,語音識(shí)別系統(tǒng)顯然必須能夠辨識(shí)狗吠聲,并且確定狗是處于壓力還是處于危機(jī)之中。換句話說,系統(tǒng)需要有智能才能進(jìn)行學(xué)習(xí)?!?/p>

Neupro低功耗AI處理器

雖然Ceva為語音系統(tǒng)的設(shè)計(jì)者提供了名為ClearVox的語音算法,但它也知道系統(tǒng)廠商需要的更多。系統(tǒng)制造商希望在其物聯(lián)網(wǎng)設(shè)備中整合學(xué)習(xí)和推論的能力,使其產(chǎn)品能夠持續(xù)變得更加智能化。

目前的市場上亟需AI處理器。為了滿足這一需求,Ceva在CES上推出了NuePro,這是一款“專用的低功耗AI處理器系列,用于在邊緣進(jìn)行深度學(xué)習(xí)”。NuePro是一款獨(dú)立的專用AI處理器,可廣泛用于物聯(lián)網(wǎng)、智能手機(jī)、安全監(jiān)控、汽車、機(jī)器人、醫(yī)療和工業(yè)等市場。
在CES 2018上語音和人工智能應(yīng)用的大爆發(fā)
Ceva推出AI處理器(來源:Ceva)

值得注意的是,Ceva并非深度學(xué)習(xí)領(lǐng)域的新手。據(jù)報(bào)導(dǎo),NeuPro是以Ceva在計(jì)算機(jī)視覺應(yīng)用深層神經(jīng)網(wǎng)絡(luò)方面的經(jīng)驗(yàn)為基礎(chǔ)。

Wertheizer說,NeuPro AI處理器是Ceva從頭開始研發(fā)的第一款“非DSP”技術(shù)。他在發(fā)布Neupro時(shí)說:“我有點(diǎn)緊張。但是你必須知道AI并不是訊號(hào)處理方面的問題?!?/p>

NeuPro處理器搭載兩個(gè)硬件——NeuPro引擎和NeuPro VPU (向量處理單元)。Wertheizer指出,雖然引擎處理定義良好的人工智能算法,如CNN、啟動(dòng)和規(guī)范層,但是,可編程的向量引擎NeuPro VPU是執(zhí)行專有AI算法的一種延伸?!拔覀冞x擇了這種硬聯(lián)機(jī)的建置方式,而不是使用GPUCPU,讓我們能夠增加AI處理器的利用率?!?/p>

Ceva聲稱,這款新的專用AI處理器系列帶來了“相當(dāng)高的性能提升,從入門級(jí)處理器的2TOPS到為最高階配置的12.5TOPS”。在CES 2018上語音和人工智能應(yīng)用的大爆發(fā)
NeuPro硬件模塊;Ceva首席執(zhí)行官Gideon Wertheizer強(qiáng)調(diào),“NeuPro VPU和NeuPro引擎之間的無縫切換至關(guān)重要”。 (來源:Ceva)

Ceva表示,NeuPro AI處理器將于2018年第二季向客戶提供授權(quán),并計(jì)劃在第三季全面發(fā)布。

同樣地,聯(lián)發(fā)科準(zhǔn)備推出一款由意騰科技(Intelligo Technology)設(shè)計(jì)的AI處理器和算法。Intelligo是2016年時(shí)從聯(lián)發(fā)科獨(dú)立而出的新創(chuàng)公司。

Intelligo設(shè)計(jì)的這款A(yù)I SoC被稱為“智能DNN語音處理器”應(yīng)用范圍較有限。聯(lián)發(fā)科表示,該處理器提供“可配置的深度神經(jīng)網(wǎng)絡(luò)和高效率推論引擎(每秒每瓦特1 TOPS運(yùn)算性能)”。

顧大為表示,聯(lián)發(fā)科正在尋找一種小型的AI加速器,為辨識(shí)20到30個(gè)關(guān)鍵詞而設(shè)計(jì)。另一方面,聯(lián)發(fā)科也正推廣其“分布式處理”的觀念,期望語音和AI功能不只是整合于像Echo或Google Home的智能音箱,而是更落實(shí)于廣泛的小型設(shè)備——如電燈開關(guān)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • CES
    CES
    +關(guān)注

    關(guān)注

    4

    文章

    1013

    瀏覽量

    70668
  • 語音
    +關(guān)注

    關(guān)注

    3

    文章

    381

    瀏覽量

    37950
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46397

    瀏覽量

    236619

原文標(biāo)題:語音和人工智能應(yīng)用在CES 2018上的爆發(fā)

文章出處:【微信號(hào):gh_bee81f890fc1,微信公眾號(hào):面包板社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺(tái),感謝作者。受益匪淺。 閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,無疑為讀者鋪設(shè)了一條探索人工智能(AI)如何深刻影響并推動(dòng)科學(xué)創(chuàng)新的道路。閱讀這一章后,我深刻感受到了人工智能技術(shù)科學(xué)領(lǐng)域的廣泛應(yīng)用潛力以及其帶來的革命性變化,以下是我個(gè)人的學(xué)習(xí)
    發(fā)表于 10-14 09:12

    risc-v人工智能圖像處理應(yīng)用前景分析

    RISC-V人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點(diǎn)。以下是對(duì)RISC-V人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點(diǎn)
    發(fā)表于 09-28 11:00

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評(píng)測活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    大力發(fā)展AI for Science的原因。 第2章從科學(xué)研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)、算法、算力)出發(fā),對(duì)AI for Science的技術(shù)支撐進(jìn)行解讀。 第3章介紹了
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國際)通用人工智能大會(huì)將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會(huì)暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識(shí)別案例_V2-20240506.pdf 人工智能 語音對(duì)話機(jī)器人案例 26分03秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識(shí)別案例.pdf 人工智能 語音對(duì)話機(jī)器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語音對(duì)話
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛嵌入式
    發(fā)表于 02-26 10:17

    CES 2024:三星展示一系列引領(lǐng)未來的人工智能應(yīng)用

    CES 2024,三星展示了一系列引領(lǐng)未來的人工智能應(yīng)用,將智能生活推向新的高度。
    的頭像 發(fā)表于 01-12 15:05 ?1393次閱讀

    語音數(shù)據(jù)集:推動(dòng)人工智能語音技術(shù)的關(guān)鍵要素

    隨著人工智能技術(shù)的飛速發(fā)展,語音技術(shù)已成為人機(jī)交互領(lǐng)域的重要一環(huán)。語音數(shù)據(jù)集作為支撐語音技術(shù)研發(fā)與應(yīng)用的基礎(chǔ)資源,對(duì)于推動(dòng)人工智能
    的頭像 發(fā)表于 12-29 11:00 ?513次閱讀

    語音數(shù)據(jù)集人工智能中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的快速發(fā)展,語音數(shù)據(jù)集各種應(yīng)用中發(fā)揮著越來越重要的作用。語音數(shù)據(jù)集是AI語音技術(shù)的基石,對(duì)于
    的頭像 發(fā)表于 12-14 15:00 ?604次閱讀

    身邊的人工智能有哪些

    應(yīng)用,并探討它們對(duì)我們的生活產(chǎn)生的影響。 一、智能手機(jī)中的人工智能 1. 語音助手: 智能手機(jī)中,我們常見的
    的頭像 發(fā)表于 12-07 16:32 ?3227次閱讀