0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三問AI手機(jī):什么意圖?怎么識(shí)別?何種框架?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-08-21 17:45 ? 次閱讀

wKgaombFt0eAHuGiAAl7lPiTCKs883.jpg

早在幾個(gè)月前,就有媒體同行問我:AI手機(jī)到底是什么?跟智能手機(jī)有什么本質(zhì)的不同?

試想一下,如果經(jīng)常跟科技企業(yè)、技術(shù)趨勢打交道的媒體人、分析師都對(duì)何謂AI手機(jī)云里霧里,更別提門店銷售和消費(fèi)者了。

2024被認(rèn)為是AI手機(jī)元年,但今天走進(jìn)線下門店,會(huì)發(fā)現(xiàn)店員和用戶都對(duì)手機(jī)里的AI有啥不一樣,感知并不明顯。

移動(dòng)互聯(lián)網(wǎng)時(shí)代,我們常說手機(jī)是人“肢體”的延伸,可以讓我們的“手”觸及更遠(yuǎn)的地方,“看”到更廣闊的事物。到了AI時(shí)代,手機(jī)是“大腦”的延伸,心念一動(dòng)、言出法隨,手機(jī)會(huì)根據(jù)我們的使用習(xí)慣和意圖,主動(dòng)提供有價(jià)值的服務(wù)。

所以,AI手機(jī)區(qū)別于智能機(jī)的一個(gè)更高階、更本質(zhì)的能力,就是“意圖識(shí)別”。

目前,蘋果陣營、華為鴻蒙陣營、榮耀OV安卓陣營,都將意圖識(shí)別作為重點(diǎn)。

蘋果CEO庫克在AI系統(tǒng)“Apple Intelligence”的發(fā)布會(huì)上重點(diǎn)強(qiáng)調(diào),在“蘋果智能(Apple Intelligence)”的支持下,Siri具備了精準(zhǔn)識(shí)別用戶真正意圖的能力。

而安卓和鴻蒙用戶,恐怕對(duì)此并不陌生。

華榮OV等國產(chǎn)手機(jī)廠商早就上線了相應(yīng)能力。榮耀在2023開發(fā)者大會(huì)上帶來了行業(yè)首個(gè)基于AI意圖識(shí)別的人機(jī)交互(IUI)操作系統(tǒng)——MagicOS 8.0;華為在HDC 2024上提出Harmony Intelligence,使得小藝能力大幅提升,能夠理解并預(yù)測用戶需求,并通過意圖框架與合作伙伴應(yīng)用場景整合。

OV雖然沒有明確推出意圖框架等平臺(tái),但也用行動(dòng)參與其中。將大模型融入系統(tǒng)的底層設(shè)計(jì)中,升級(jí)OriginOS、BlueOS,來實(shí)現(xiàn)復(fù)雜的意圖識(shí)別和推理決策。

那么用戶又該迷惑了,各家都在說“意圖識(shí)別”,到底有啥不一樣呢?

“意圖”是人心中所想,帶有模糊和不確定性,“識(shí)別”結(jié)果也就有了很大的自由闡釋空間,廠商如何避免自說自話,把“手機(jī)懂你”這件事落在實(shí)處?

就要依靠一個(gè)操作系統(tǒng)級(jí)的全局意圖感知、理解、決策技術(shù)體系。

我們不妨把“意圖識(shí)別框架”這一新概念詳細(xì)拆分開,看看每一個(gè)環(huán)節(jié)的準(zhǔn)入門檻是什么。

wKgaombFt0iASQcmAAJGPZz7Whc620.jpg

意圖識(shí)別的第一步,當(dāng)然是搞清楚什么是用戶的“意圖”,也就是手機(jī)廠商所說的“懂你”。

但“意圖”并不是什么新概念。

早在互聯(lián)網(wǎng)時(shí)代,意圖識(shí)別就被應(yīng)用于搜索引擎、廣告推薦等場景。比如用戶在搜索框輸入“抓娃娃”,底層的檢索策略要識(shí)別到這是電影需求,再去電影的數(shù)據(jù)庫里檢索,如果電影意圖識(shí)別失敗,返回的搜索結(jié)果中,根本沒有《抓娃娃》電影相關(guān)內(nèi)容,或者要翻好幾頁才顯示,都會(huì)導(dǎo)致很糟糕的用戶體驗(yàn)。所以,意圖識(shí)別很早是科技企業(yè)研究的對(duì)象。

那么,AI手機(jī)所謂的“意圖識(shí)別”,有啥特殊呢?

特殊在于,要游過深海。

今天手機(jī)所承載的“意圖”,有兩個(gè)特點(diǎn):

一是范圍廣。一個(gè)動(dòng)作或詞語可能對(duì)應(yīng)多個(gè)意圖。現(xiàn)代消費(fèi)電子設(shè)備的激增,帶來了豐富多樣的功能和服務(wù),幾乎涵蓋了我們生活的方方面面,終端設(shè)備的多元、服務(wù)的多樣,經(jīng)常會(huì)出現(xiàn)多種意圖,比如輸入“長城”,可能是景點(diǎn)、電影或者汽車,這就使手機(jī)的意圖識(shí)別更難做。

二是隱蔽性。傳統(tǒng)意圖識(shí)別可以根據(jù)用戶給出的query詞來進(jìn)行判斷,屬于相對(duì)明確的“顯性意圖”,但日常使用手機(jī)時(shí),還有大量隱性意圖,比如眼睛注視手機(jī)屏幕,可能是想看時(shí)間、看新消息通知或日程計(jì)劃;遺忘了出行計(jì)劃,可實(shí)際上航班時(shí)間應(yīng)該重點(diǎn)關(guān)注……這些是用戶真實(shí)需要,但自己很少意識(shí)到或清晰表達(dá)出來的“隱性意圖”,由于無法被清晰表達(dá),難以轉(zhuǎn)譯成計(jì)算機(jī)語言,自然也就難以滿足。

wKgZombFt0mASdMjAABGui_SUNI579.jpg

這些多且隱蔽的意圖,構(gòu)成了一片“意識(shí)深?!?,需要手機(jī)廠商跋涉而過,找到一條最短路徑。

由此,我們不難明確,AI手機(jī)意圖識(shí)別的意義:

首先是化繁為簡。通過洞察用戶真正的需求,簡化獲取服務(wù)的步驟。

比如榮耀的“任意門”功能,帶來了行業(yè)首個(gè)基于意圖識(shí)別的人機(jī)交互,只需一拖不到1秒即可完成以往8步10秒的操作流程。當(dāng)用戶收到一條信息,復(fù)制之后,系統(tǒng)會(huì)自動(dòng)分析語義并提煉關(guān)鍵內(nèi)容,預(yù)判接下來的需求和操作,自動(dòng)一步直達(dá)備忘錄、地圖等應(yīng)用。華為智慧搜索支持“一鍵場景直達(dá)”、OPPO的ColorOS 14系統(tǒng)中的“流體云”功能,能預(yù)測用戶行為,自動(dòng)接入相應(yīng)的使用場景……這些都簡化了操作步驟。

其次,多想一步。通過隱性意圖的識(shí)別和滿足,帶來超出用戶期望的驚喜體驗(yàn),構(gòu)建差異化優(yōu)勢。

華為曾在一次分享會(huì)中提到,HarmonyOS意圖框架可以通過長時(shí)間的學(xué)習(xí)訓(xùn)練,把人們自己都感覺不到的規(guī)律串聯(lián)起來,并通過端側(cè)的本地學(xué)習(xí)完成本地學(xué)習(xí)推薦,從而完成“超預(yù)期”的智慧搜索服務(wù)體驗(yàn)。

接下來,可以主動(dòng)服務(wù)。比用戶多想一步,就能將服務(wù)化被動(dòng)為主動(dòng),更快更恰當(dāng)?shù)厮偷接脩舻难矍爸讣狻?/p>

目前,鴻蒙系統(tǒng)的場景化入口,就可以根據(jù)意圖判斷,將不同服務(wù)融入實(shí)際場景中,比如搭乘飛機(jī),航班信息會(huì)優(yōu)先顯示在實(shí)時(shí)狀態(tài)欄,榮耀Magic Live也有類似的主動(dòng)服務(wù),在觀影、聽歌、走進(jìn)地鐵站等場景中,提前將取票、聽歌偏好、地鐵碼等原子化服務(wù)進(jìn)行推送。

基于意圖識(shí)別的人機(jī)交互,讓你最需要的服務(wù),涉過意識(shí)的深海。

wKgZombFt0qARAszAAHzAZbb15c100.jpg

洞察到了用戶的意圖,就能將服務(wù)精準(zhǔn)送達(dá)嗎?其實(shí)還要穿過一片AI的叢林。

有一個(gè)職場段子,老板讓秘書定一個(gè)航班,最低段位的秘書,就只會(huì)看那一班,而最高段位的,還會(huì)提供多個(gè)航班選擇,還考慮到出差需求,也把當(dāng)?shù)氐淖∷蕖⒉惋嫷榷继崆安楹脗溥x。

如果讓手機(jī)AI來應(yīng)聘做你的助理,你希望是哪一個(gè)段位呢?

最高段位的AI助理,要真正理解你說的話背后的真實(shí)意圖,并真正完成你想要的任務(wù),其實(shí)要拆分為幾個(gè)步驟。

步驟一:充分感知。一個(gè)優(yōu)秀的助理,并非“胡子眉毛一把抓”,什么事情都要提前安排,而是結(jié)合上下文背景和情境,來對(duì)用戶的潛在意圖進(jìn)行判斷。所以,充分感知場景和情境,就非常必要了。

蘋果高級(jí)副總裁Craig曾表示,Apple Intelligence的真正獨(dú)特之處是能理解個(gè)人情境。能夠根據(jù)你的個(gè)人數(shù)據(jù),你現(xiàn)在打開的頁面等背景,來理解需求。

比蘋果更早一些,榮耀在2016年第一代Magic上首發(fā)Magic Live智慧系統(tǒng),就能夠自動(dòng)感知判斷。

wKgaombFt0uAM2DLAABXjKB9NjY072.jpg

步驟二:分析判斷。

有了上下文背景,怎么推斷多個(gè)意圖的重要性和優(yōu)先級(jí)呢?這就涉及語義理解了。目前,檢索、問答等任務(wù),由于用戶有明確的檢索詞,利用大模型的自然語言理解能力,已經(jīng)可以很好地推斷用戶到底想干什么。

其中比較具有代表性的是Apple Intelligence蘋果智能+ GPT-4o大模型的方案。基于Apple Intelligence,蘋果為Siri引入了多模態(tài)交互能力,可以從輸入的自然語言中精準(zhǔn)地進(jìn)行用戶意圖識(shí)別,將任務(wù)拆分為多個(gè)任務(wù),作為生成回答的基石。

wKgZombFt0uAUcNlAADZEiQZWvc277.jpg

步驟三:精準(zhǔn)執(zhí)行。

我們可以把每一個(gè)服務(wù)和功能,想象成一個(gè)個(gè)智能體,每個(gè)智能體只有孤立的識(shí)別和輸出能力,要完成用戶需要的復(fù)雜任務(wù),需要對(duì)這些智能體進(jìn)行精巧地、自動(dòng)化地調(diào)取和編排,才能在意圖判斷之后,做出最恰當(dāng)?shù)膱?zhí)行反饋。

OPPO與IDC聯(lián)合發(fā)布的《AI手機(jī)白皮書》中提到,成熟的AI手機(jī)系統(tǒng)要內(nèi)嵌用戶定義的專屬智能體,不斷理解用戶習(xí)慣,自學(xué)習(xí)、直覺化。

在VDC開發(fā)者大會(huì)的一場技術(shù)論壇中,vivo的技術(shù)人員也透露,作為業(yè)內(nèi)首個(gè)推出手機(jī)大模型(藍(lán)心大模型)的廠商,他們很早就開始研究agent,對(duì)手機(jī)原生化服務(wù)組件的拆分很細(xì)、編排恰當(dāng)。

這樣看,從意圖到服務(wù)之間,還要經(jīng)過數(shù)據(jù)(感知)、算法(分析)、智能體(執(zhí)行)的一片AI森林,只有具備完整AI技術(shù)體系的廠商,才能順利跑通。

wKgaombFt0yAZ6U1AAJY4hU4hYQ695.jpg

從上述意圖識(shí)別的拆解中不難感受到,AI手機(jī)想做的“以人為中心”的主動(dòng)服務(wù),跨設(shè)備的數(shù)據(jù)流轉(zhuǎn)(全場景感知),跨應(yīng)用的服務(wù)觸達(dá),以及全局安全,是必不可少的。

如何將各層級(jí)、各終端、各系統(tǒng)、各應(yīng)用都整合在一起?

意圖框架,就是關(guān)鍵紐帶,具備操作系統(tǒng)平臺(tái)級(jí)的能力,可以讓AI貫穿從數(shù)據(jù)到服務(wù)的完整鏈路,帶來意圖識(shí)別的能力飛躍。

目前,榮耀、華為、蘋果都推出了自己的框架或平臺(tái)。

其中,Magic?Live智慧引擎是基于場景感知、用戶理解和意圖決策三大核心能力的平臺(tái)型AI解決方案,形成了一個(gè)能夠銜接各種軌跡和能力的“大腦”,實(shí)現(xiàn)了從單意圖到多意圖關(guān)聯(lián)的精準(zhǔn)意圖判斷。

蘋果也采用了“榮耀模式”,App Intent意圖框架包含了自學(xué)習(xí)引擎,實(shí)時(shí)學(xué)習(xí)用戶行為,并根據(jù)時(shí)間和空間信息,提供個(gè)性化服務(wù)。

華為HarmonyOS的意圖框架,則構(gòu)建全局意圖范式,基于鴻蒙系統(tǒng)的跨端互聯(lián)協(xié)作優(yōu)勢,實(shí)現(xiàn)多維系統(tǒng)感知,結(jié)合AI大模型、AI推理框架、端云協(xié)同等計(jì)算處理能力,將需求傳遞給服務(wù)方,拉起/執(zhí)行更恰當(dāng)?shù)姆?wù)。

總結(jié)一下榮耀、華為、蘋果的意圖框架,就是具備“地基”的能力。

為了更好的意圖理解,三家都進(jìn)行了深度的技術(shù)搭建,實(shí)現(xiàn)了操作系統(tǒng)級(jí)別、跨終端的意圖感知、理解,只有深入到系統(tǒng)層面,才能真正重構(gòu)手機(jī)AI體驗(yàn)。

同時(shí),意圖識(shí)別會(huì)涉及敏感數(shù)據(jù)的采集、共享和流動(dòng),在隱私安全方面,無論是一貫以隱私保護(hù)著稱的蘋果,還是榮耀的MagicGuard和MagicRing信任環(huán),華為HarmonyOS NEXT的原生安全,都說明唯有平臺(tái)級(jí)的AI能力,能在釋放智慧的同時(shí),守住安全的防線。

說到這里,你是不是有點(diǎn)疑惑,既然意圖識(shí)別這么難、需要改造和創(chuàng)新的地方這么多,效果也不是一時(shí)半會(huì)兒能體現(xiàn)出來的,主打一個(gè)“誰用誰知道”,要不還是先躺平算了。

確實(shí),意圖識(shí)別的每一關(guān)都不好過,但這正是競爭白熱化、同質(zhì)化的手機(jī)市場,廠商突圍的關(guān)鍵。

更何況,AI手機(jī)應(yīng)該是消費(fèi)電子市場最大的一個(gè)新蛋糕,華榮OV等一批國內(nèi)廠商又早已“上桌”,只要攻克一些技術(shù)難關(guān),就能成功分到大蛋糕,何樂而不為呢?

意圖識(shí)別框架上,正在醞釀一場從“以手機(jī)為中心”到“以人為中心”的交互之變,AI手機(jī)才剛剛萌芽。

wKgaombFt02AdwTjAAHYqZl45Ro270.jpg

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 框架
    +關(guān)注

    關(guān)注

    0

    文章

    397

    瀏覽量

    17298
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29055

    瀏覽量

    266574
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于迅為RK3588開發(fā)板的AI圖像識(shí)別方案

    迅為RK3568/RK3588開發(fā)板AI識(shí)別演示方案包括 01_官方模型測試 02_人臉識(shí)別 03_口罩檢測 04_工地防護(hù) 05_撲克牌識(shí)別 06_手掌關(guān)鍵點(diǎn)檢測 07_人臉特征點(diǎn)
    發(fā)表于 08-13 11:26

    中國AI長卷(二):框架立基

    AI框架可以看到,更強(qiáng)的產(chǎn)業(yè)化能力,就是中國AI的底色
    的頭像 發(fā)表于 07-24 12:27 ?2470次閱讀
    中國<b class='flag-5'>AI</b>長卷(二):<b class='flag-5'>框架</b>立基

    ai大模型和ai框架的關(guān)系是什么

    AI大模型和AI框架是人工智能領(lǐng)域中兩個(gè)重要的概念,它們之間的關(guān)系密切且復(fù)雜。 AI大模型的定義和特點(diǎn) AI大模型是指具有大量參數(shù)的深度學(xué)習(xí)
    的頭像 發(fā)表于 07-16 10:07 ?3.7w次閱讀

    AI大模型與AI框架的關(guān)系

    在探討AI大模型與AI框架的關(guān)系時(shí),我們首先需要明確兩者的基本概念及其在人工智能領(lǐng)域中的角色。AI大模型通常指的是具有極大規(guī)模、高度復(fù)雜性和強(qiáng)大能力的人工智能系統(tǒng),它們能夠處理復(fù)雜的任
    的頭像 發(fā)表于 07-15 11:42 ?647次閱讀

    CubeIDE生成的代碼框架會(huì)卡在MX_X_CUBE_AI_Process()函數(shù)中是怎么回事?

    當(dāng)我將網(wǎng)絡(luò)模型部署到STM32F407VGT6中時(shí),CubeIDE生成的代碼框架會(huì)卡在MX_X_CUBE_AI_Process()函數(shù)中是怎么回事?CUbeAI庫的版本是9.0。期待您的回復(fù),謝謝
    發(fā)表于 05-30 06:11

    玩轉(zhuǎn)大模型 企業(yè)AI著陸新正解 神州學(xué)AI原生賦能平臺(tái)正式發(fā)布

    智能未來的坦途。 ? 神州學(xué)——打造“一站式”AI原生賦能平臺(tái) 面對(duì)TOB業(yè)務(wù)復(fù)雜性和多樣性,神州學(xué)致力給出“一站式”解決問題的方式,將AI原生的場景賦能、知識(shí)治理、模型訓(xùn)練與管理
    的頭像 發(fā)表于 05-15 16:41 ?279次閱讀
    玩轉(zhuǎn)大模型 企業(yè)<b class='flag-5'>AI</b>著陸新正解 神州<b class='flag-5'>問</b>學(xué)<b class='flag-5'>AI</b>原生賦能平臺(tái)正式發(fā)布

    AI終端發(fā)展態(tài)勢:AI手機(jī)崛起,AIPC漸成主流

    百度內(nèi)核AI芯片推動(dòng)AI手機(jī)全面普及,2024年被視作“AI手機(jī)元年”。眾多手機(jī)廠商包括
    的頭像 發(fā)表于 04-23 09:37 ?465次閱讀

    李未可科技正式推出WAKE-AI多模態(tài)AI大模型

    文本生成、語言理解、圖像識(shí)別及視頻生成等多模態(tài)交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺+語音打造新一代 LLM-Based的自然交互,同時(shí)多模態(tài)問答技術(shù)的加持,能實(shí)現(xiàn)所見即所、所即所得的精準(zhǔn)服務(wù)。此外,融合了人類
    發(fā)表于 04-18 17:01 ?501次閱讀
    李未可科技正式推出WAKE-<b class='flag-5'>AI</b>多模態(tài)<b class='flag-5'>AI</b>大模型

    開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

    Lite的API接口實(shí)現(xiàn)主要功能; Mindspore Lite為Openharmony AI推理框架,為上層應(yīng)用提供統(tǒng)一的AI推理接口,可以完成在手機(jī)等端側(cè)設(shè)備中的模型推理過程;
    發(fā)表于 04-11 16:14

    數(shù)據(jù)語料庫、算法框架和算力芯片在AI大模型中的作用和影響

    數(shù)據(jù)語料庫、算法框架和算力芯片的確是影響AI大模型發(fā)展的大重要因素。
    的頭像 發(fā)表于 03-01 09:42 ?747次閱讀

    愛立信發(fā)布基于AI意圖驅(qū)動(dòng)運(yùn)營方案

    日前,愛立信宣布:在其托管服務(wù)交付平臺(tái)——愛立信運(yùn)營引擎(Ericsson Operations Engine)中,嵌入了基于AI賦能的意圖驅(qū)動(dòng)運(yùn)營方案,為消費(fèi)者和企業(yè)用戶提供差異化優(yōu)質(zhì)5G服務(wù)。
    的頭像 發(fā)表于 02-21 09:15 ?4810次閱讀

    榮耀發(fā)布MagicOS 8.0,首次實(shí)現(xiàn)意圖識(shí)別人機(jī)交互

    在科技圈掀起一股熱潮的榮耀正式發(fā)布了其自主研發(fā)的全新操作系統(tǒng)——MagicOS 8.0,并賦予其一個(gè)富有魔法的中文名字:魔法OS 8.0。這款新操作系統(tǒng)憑借其獨(dú)創(chuàng)的平臺(tái)級(jí)AI使能的意圖識(shí)別人機(jī)交互,重新定義了智能終端的交互方式。
    的頭像 發(fā)表于 01-12 14:50 ?776次閱讀

    新火種AI|星打響“AI手機(jī)”第一槍,2024會(huì)是AI終端元年嗎?

    作者:文子 ? 編輯:小迪 AI手機(jī),距離取代傳統(tǒng)手機(jī)不遠(yuǎn)了。 星新年第一炸,AI手機(jī)重磅來襲
    的頭像 發(fā)表于 01-06 09:59 ?517次閱讀
    新火種<b class='flag-5'>AI</b>|<b class='flag-5'>三</b>星打響“<b class='flag-5'>AI</b><b class='flag-5'>手機(jī)</b>”第一槍,2024會(huì)是<b class='flag-5'>AI</b>終端元年嗎?

    AI視覺識(shí)別有哪些工業(yè)應(yīng)用

    AI視覺識(shí)別涵蓋多種應(yīng)用,如人臉識(shí)別、目標(biāo)檢測和識(shí)別、圖像分割、行為識(shí)別、視頻分析等。本篇就簡單介紹一下
    的頭像 發(fā)表于 11-27 18:05 ?1041次閱讀
    <b class='flag-5'>AI</b>視覺<b class='flag-5'>識(shí)別</b>有哪些工業(yè)應(yīng)用

    【KV260視覺入門套件試用體驗(yàn)】Vitis AI Library體驗(yàn)之OCR識(shí)別

    Vitis AI Runtime,Vitis AI Library 有很多已經(jīng)封裝好的神經(jīng)網(wǎng)絡(luò)接口,直接拿來用即可。 OCR識(shí)別基于Vitis AI Library 的ocr_pt模型
    發(fā)表于 10-16 23:25