個(gè)人機(jī)器人已經(jīng)從科幻變成現(xiàn)實(shí)——一部分已經(jīng)走向顧客,更多地蓄勢(shì)待發(fā)。我們現(xiàn)在的任務(wù)是讓它們變得更具競(jìng)爭(zhēng)力。
我最近參加了上海MWC上。機(jī)器人在會(huì)展上獨(dú)占鰲頭。我看到有數(shù)十家公司在尋找客戶(hù),他們的產(chǎn)品的應(yīng)用方式各不相同。以機(jī)器人護(hù)士Tug為例。它看起來(lái)并不像我們?cè)诳苹米髌分幸?jiàn)過(guò)的機(jī)器人,更接近《星球大戰(zhàn)》中的一些較實(shí)用的自動(dòng)機(jī)器。雖然它只是一個(gè)帶輪子的盒子,卻具有我們期待移動(dòng)機(jī)器人擁有的許多功能,包括導(dǎo)航和避障。它可以在醫(yī)院周?chē)顒?dòng),如果有人踩在它前面就它會(huì)停下,它還會(huì)繞過(guò)亂放的點(diǎn)滴支架;它也可以指揮電梯去另一層樓。 Tug的功能是向患者運(yùn)送藥物和食品,它已開(kāi)始在美國(guó)37家退伍軍人醫(yī)院服役。想象一下,它們能夠?yàn)槊β档?a target="_blank">candy-striper(志愿者助手)減少多少工作量。此外還有為老年護(hù)理、教學(xué)支持、餐館和酒店行業(yè)應(yīng)用設(shè)計(jì)的機(jī)器人助手。你可以將其視為繼智能揚(yáng)聲器之后私人助理領(lǐng)域的下一個(gè)重要產(chǎn)品(亞馬遜的倉(cāng)庫(kù)中已經(jīng)部署了10萬(wàn)多個(gè)工作機(jī)器人,顯然他正在研究作為Echo接班人的家用機(jī)器人)。
這不是科幻小說(shuō);家庭助理機(jī)器人已經(jīng)開(kāi)始走進(jìn)現(xiàn)實(shí)。
機(jī)器人健康助理
生產(chǎn)這種機(jī)器人存在明顯的技術(shù)挑戰(zhàn),這些挑戰(zhàn)與自動(dòng)駕駛問(wèn)題沒(méi)有太大不同,但存在一些明顯的差異。導(dǎo)航和避障是常見(jiàn)挑戰(zhàn),但清晰的行車(chē)道和交通管理的概念不適用于這些助理機(jī)器人;它面對(duì)的難題是如何在建筑物內(nèi)避障和導(dǎo)航(通過(guò)地圖重測(cè)繪繞過(guò)臨時(shí)不可移動(dòng)的障礙物)。雖然自然語(yǔ)言界面對(duì)于汽車(chē)而言是一種額外優(yōu)勢(shì),但對(duì)于機(jī)器人助手而言卻可能是必不可少的功能。當(dāng)藥房送錯(cuò)藥物或者當(dāng)餐館搞砸了你的訂單,誰(shuí)能耐心的按按鈕?
Gartner最近列出了機(jī)器人需要的10大人工智能和感應(yīng)功能,其中包括:
計(jì)算機(jī)視覺(jué)—— 場(chǎng)景分析、物體識(shí)別等
機(jī)器人內(nèi)置AI功能 —— 不僅依靠云端
會(huì)話界面 —— 語(yǔ)音識(shí)別和自然語(yǔ)言處理
位置感應(yīng) —— 我在哪里、我附近有什么/誰(shuí)
聲學(xué)場(chǎng)景分析—— 識(shí)別獨(dú)特的噪音,如狗吠或玻璃破碎聲
生物識(shí)別和身份驗(yàn)證—— 誰(shuí)在與我交談,是否允許他們下達(dá)這些命令
自主運(yùn)動(dòng) —— 能夠移動(dòng)到建筑內(nèi)的其他目標(biāo)位置,而不會(huì)與物體或人員發(fā)生碰撞
構(gòu)建擁有這些功能的系統(tǒng)的默認(rèn)方法的第一步是以多核GPU平臺(tái)為基礎(chǔ)給機(jī)器人創(chuàng)造一個(gè)內(nèi)置AI系統(tǒng)。這不難理解—— 產(chǎn)品構(gòu)建者可以使用現(xiàn)成的平臺(tái)設(shè)計(jì)解決方案的原型,而無(wú)需擔(dān)心ASIC細(xì)節(jié),就像他們將CPU開(kāi)發(fā)板用于更傳統(tǒng)的應(yīng)用一樣。但隨著產(chǎn)品數(shù)量的增加、成本和客戶(hù)滿意度/差異化變得越來(lái)越重要?,F(xiàn)成的解決方案價(jià)格昂貴、耗電量大,而且使用與其他人相同的平臺(tái)難以實(shí)現(xiàn)市場(chǎng)區(qū)分。這就是為什么大批量解決方案不可避免地轉(zhuǎn)向ASIC平臺(tái)的原因。你無(wú)需放棄對(duì)原型的所有投資,低成本的GPU平臺(tái)仍然可以構(gòu)成解決方案的一部分,但可以將大量的AI功能卸載到更具成本效益和集成度更高的平臺(tái)上。
在機(jī)器學(xué)習(xí)(ML)應(yīng)用中,DSP相對(duì)于GPU的每瓦特性能優(yōu)勢(shì)是眾所周知的,部分原因在于定點(diǎn)運(yùn)算取代浮點(diǎn)運(yùn)算、以及某些平臺(tái)的量化靈活性。而定制解決方案的價(jià)格優(yōu)勢(shì)(量產(chǎn)時(shí))是眾所周知的。這就是為什么你更有可能在數(shù)量/價(jià)格敏感的ML應(yīng)用中看到嵌入式DSP,而不是現(xiàn)成的GPU。
智能顯示器:一種不動(dòng)的機(jī)器人?
但它是否具備GPU的全部功能?事實(shí)證明,它能做相當(dāng)多的事情。以計(jì)算機(jī)視覺(jué)(定位、跟蹤、物體識(shí)別和手勢(shì)識(shí)別)為例。目前,在一些基于嵌入式DSP的平臺(tái)中,已經(jīng)可以完成這種級(jí)別的視覺(jué)處理?;蛞灾С直镜卦儆?xùn)練(無(wú)需前往云端)的自主運(yùn)動(dòng)為例。 DSP同樣具備支持這種智能的核心識(shí)別功能,在GPU上可以找到的相同功能。
語(yǔ)音識(shí)別/認(rèn)證和聲學(xué)場(chǎng)景分析的任務(wù)同樣可以轉(zhuǎn)移。這些例子(以及此處的其他示例)完美地說(shuō)明了為什么轉(zhuǎn)移非常有必要。這些智能操作都可分割為多個(gè)步驟,例如從語(yǔ)音拾取和方向分辨到基本單詞識(shí)別、甚至自然語(yǔ)言處理(NLP)。最后一步很難,可能需要求助于云端。但是之前的步驟嵌入式解決方案就能非常輕松地處理。有些應(yīng)用只需要識(shí)別有限的詞匯或者只需要檢測(cè)非語(yǔ)言提示(例如窗戶(hù)破裂聲),在這些情況下,你可能根本不需要云端(或本地GPU)。已經(jīng)有跡象表明,在不久的將來(lái),在邊緣就能處理有限的NLP。
CEVA在它的邊緣AI、前端語(yǔ)音處理和物聯(lián)網(wǎng)深度學(xué)習(xí)平臺(tái)中構(gòu)建了一系列廣泛的解決方案,用于支持這些使用AI的前端功能。在面臨擴(kuò)大規(guī)模難題時(shí),或者當(dāng)您想要繞過(guò)這些難題時(shí),請(qǐng)看看我們能提供什么幫助。
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
27994瀏覽量
205553 -
nlp
+關(guān)注
關(guān)注
1文章
483瀏覽量
21971
原文標(biāo)題:機(jī)器人私人助理距離我們比想象的更近
文章出處:【微信號(hào):CEVA-IP,微信公眾號(hào):CEVA】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論