人妻被按摩到潮喷中文不卡,强迫警花戴乳环,无码少妇一区二区三区动漫免费看

“做AI 產(chǎn)品經(jīng)理太難了?！苯谀X極體的同事參加了一場(chǎng)開(kāi)發(fā)者大會(huì)，一位產(chǎn)品經(jīng)理向我們坦言：“AI時(shí)代，做產(chǎn)品的方法論沒(méi)變，但以往熟悉的東西幾乎都被清零了?！?/strong>

用戶需求被清零了，大模型到底能用來(lái)做什么，用戶自己是不清楚的，需求是空白的，需求調(diào)研、產(chǎn)品定義，就要花費(fèi)好幾個(gè)月的時(shí)間。

好不容易定義好了，基礎(chǔ)模型的一個(gè)更新，就有可能將前期所做的工作、功能規(guī)劃等推倒重來(lái)。

“比如GPT-4o出現(xiàn)之后，語(yǔ)音對(duì)話的能力是我們完全意想不到的，就又得把產(chǎn)品開(kāi)發(fā)過(guò)程再來(lái)一遍……”

而縱觀一年多來(lái)推陳出新的數(shù)百個(gè)大模型，GPT-4o可以說(shuō)是產(chǎn)品化程度非常高的一個(gè)了。

比如OpenAI發(fā)布會(huì)上展示的“AI視頻通話”，使用戶與AI進(jìn)行實(shí)時(shí)的、跟真人對(duì)話一樣自然的視頻交流。國(guó)內(nèi)模型廠商也很快推出了類(lèi)似的AI視頻通話功能，不少媒體和用戶都表示“體驗(yàn)炸裂”。

但半年時(shí)間過(guò)去，發(fā)現(xiàn)在最初的震驚與新鮮感過(guò)后，在真正的軟件生態(tài)里，還是沒(méi)有看到“AI視頻通話”被大規(guī)模、高頻率地用起來(lái)，更別提激活用戶的付費(fèi)欲望了。為什么會(huì)這樣？

我們就從“AI視頻通話”說(shuō)開(kāi)去，聊聊AI產(chǎn)品化、商業(yè)化到底要經(jīng)過(guò)哪些磨礪。

鉆石原礦被開(kāi)采出來(lái)，其實(shí)并不璀璨奪目，是經(jīng)由工匠們的切割打磨，被鑲嵌成鉆石首飾，包裝為“愛(ài)情象征”，才走進(jìn)大眾消費(fèi)市場(chǎng)，價(jià)值實(shí)現(xiàn)了百倍千倍攀升。

類(lèi)GPT-4o大模型就類(lèi)似于原礦，作為“交互天花板”，潛在商業(yè)價(jià)值很大，但必須經(jīng)過(guò)產(chǎn)品化的精細(xì)打磨與包裝，才能被大眾用戶廣泛接受，實(shí)現(xiàn)其真正的價(jià)值和應(yīng)用潛力。

而基于類(lèi)GPT-4o所誕生的“AI視頻通話”，雖然向產(chǎn)品化邁進(jìn)了一步，但依然屬于原型的基礎(chǔ)能力。

盡管OpenAI、智譜等模廠已經(jīng)針對(duì)“AI視頻通話”這一應(yīng)用，打磨了諸如響應(yīng)速度、具體用例等產(chǎn)品側(cè)的細(xì)節(jié)，并融入到ChatGPT、智譜清言APP等產(chǎn)品當(dāng)中。但作為一種軟件應(yīng)用來(lái)說(shuō)，這種與通用場(chǎng)景相結(jié)合的落地模式，還是比較粗陋。

首先，需求過(guò)于寬泛。

AI視頻通話，技術(shù)上相當(dāng)于讓AI擁有“眼睛”和“嘴”，具備察言觀色、跟真人對(duì)話的能力。這很容易就讓人想到AI陪伴，人與AI談天說(shuō)地、談情說(shuō)愛(ài)。

直接將AI視頻通話能力嫁接在聊天機(jī)器人上，本質(zhì)依然是AI聊天，能力升級(jí)，但無(wú)法解決chatbot商業(yè)價(jià)值低的核心問(wèn)題。

AI視頻聊天，用戶容錯(cuò)率高，不在乎AI偶爾犯錯(cuò)或出現(xiàn)幻覺(jué)，這也意味著對(duì)基礎(chǔ)模型能力要求不嚴(yán)苛，無(wú)法在技術(shù)層面拉開(kāi)差距。曾經(jīng)的智能音箱大戰(zhàn)、智能助手紅海，也會(huì)在AI視頻聊天領(lǐng)域出現(xiàn)，并且由于聊天并不能幫助用戶完成具體任務(wù)或解決問(wèn)題，用戶還得自己琢磨在視頻里跟AI聊什么，沒(méi)一會(huì)兒就只能跟AI面面相覷，難以帶來(lái)確定性的產(chǎn)品滿足和持久粘性，新鮮感過(guò)后就會(huì)流失。

而一些直接用途，想要普遍應(yīng)用，也有大量細(xì)節(jié)仍待填充。

比如基于AI視頻通話的無(wú)障礙功能，是一個(gè)非常直接的落地場(chǎng)景。AI視頻通話，可以將設(shè)備攝像頭作為“眼睛”，幫助人去理解物理世界，這對(duì)視障人群豈不是很友好？

但實(shí)際上，大模型APP的視頻通話功能，是無(wú)法直接被視障人群用起來(lái)的，還有大量的產(chǎn)品細(xì)節(jié)需要考慮。比如我們?cè)w驗(yàn)過(guò)實(shí)時(shí)圖像識(shí)別，AI只能認(rèn)出“面前有兩張卡”，但哪張是公交卡，哪張是銀行卡，是無(wú)法準(zhǔn)確識(shí)別的，這就需要基于視障群體出行接觸的高頻物體，進(jìn)行針對(duì)性地精調(diào)。

而且，在飛機(jī)、高鐵、地鐵等弱網(wǎng)、無(wú)網(wǎng)環(huán)境下，也要保證視障人群與AI視頻通話的實(shí)時(shí)性，就需要純端側(cè)運(yùn)行的多模態(tài)大模型，將模型做小、計(jì)算效率做高。

產(chǎn)品設(shè)計(jì)層面，還有大量的細(xì)節(jié)，還等待著填充，才能轉(zhuǎn)化為用戶可以方便使用的產(chǎn)品和服務(wù)。

可以看到，沒(méi)有更細(xì)致的產(chǎn)品化，盡管“AI視頻通話”這一基礎(chǔ)能力很厲害，卻不知道能用來(lái)干什么，很可能導(dǎo)致技術(shù)找不到市場(chǎng)，倒在了產(chǎn)品化變現(xiàn)的黎明到來(lái)之前。

這個(gè)“至暗時(shí)刻”會(huì)發(fā)生嗎？

欣慰的是，我們發(fā)現(xiàn) “AI視頻通話”能力，已經(jīng)開(kāi)始向行業(yè)輸送了，意味著這座AI基礎(chǔ)能力的“原礦”，終于開(kāi)始被打磨成晶光四射的鉆石。

我們就從“原礦”流向的應(yīng)用領(lǐng)域，來(lái)分享幾個(gè)“AI視頻通話”的產(chǎn)品化方向。

大模型怎么落地？智能體是方向。

智能體怎么服務(wù)？+AI視頻通話事半功倍。

如今，手機(jī)軟件承載著我們?nèi)粘５慕^大多數(shù)服務(wù)，在各個(gè)應(yīng)用中來(lái)回跳轉(zhuǎn)、操作是非常繁瑣的。

今年以來(lái)，榮耀、vivo等廠商都在基于智能體打造一系列創(chuàng)新功能體驗(yàn)，比如“一句話點(diǎn)奶茶”“一句話訂餐廳”等。用戶只需要向手機(jī)助手發(fā)出指令，手機(jī)智能體會(huì)自動(dòng)理解需求、拆解任務(wù)步驟、調(diào)取相關(guān)功能，一站到底地完成任務(wù)。

Agent手機(jī)就很好地解決了數(shù)字服務(wù)鏈路長(zhǎng)、操作繁瑣的問(wèn)題，但新的問(wèn)題又來(lái)了，那就是智能體還需要“看得懂”“能交流”。

舉個(gè)例子，在外賣(mài)小程序下單時(shí)，遇到廣告是常態(tài)，這時(shí)候需要智能體agent執(zhí)行準(zhǔn)確的操作，比如“點(diǎn)擊關(guān)閉”“跳過(guò)”等，來(lái)推進(jìn)到下一步。如果智能體無(wú)法識(shí)別相關(guān)內(nèi)容，必須用戶自己動(dòng)手操作，那整個(gè)鏈路就被打斷了，用戶體驗(yàn)會(huì)非常不好。有跟智能助手通過(guò)文字prompt交流的功夫，用戶自己就能點(diǎn)開(kāi)程序完成下單了。

Agent手機(jī)+視頻通話，就能用戶體驗(yàn)更進(jìn)一步。

比起打字的繁瑣、語(yǔ)音尷尬癥，在人機(jī)對(duì)話時(shí)，像跟真人面對(duì)面交流一樣，通過(guò)語(yǔ)音對(duì)話完成下單，更符合直覺(jué)，也更有被服務(wù)的舒適感。對(duì)話之后，大模型對(duì)視頻畫(huà)面進(jìn)行實(shí)時(shí)分析，指導(dǎo)智能體來(lái)自動(dòng)執(zhí)行，整個(gè)體驗(yàn)會(huì)從頭到尾絲滑無(wú)感。

目前，國(guó)內(nèi)終端廠商在端側(cè)智能體方面走得是更快的。腦極體在VDC 2024大會(huì)上了解到，藍(lán)河操作系統(tǒng)增添了視覺(jué)感知能力，讓系統(tǒng)像人類(lèi)一樣“聽(tīng)得懂”“看得清”。智能體能夠模擬人類(lèi)的智能，助力操作系統(tǒng)像人一樣進(jìn)行溝通、執(zhí)行智能任務(wù)。

如果說(shuō)，智能體可以讓人成為數(shù)字服務(wù)的最小參與者，那么在智能體手機(jī)中打磨的AI視頻通話，則讓人機(jī)交互朝著更理想、更符合直覺(jué)的體驗(yàn)靠近，讓數(shù)字生活管家走進(jìn)現(xiàn)實(shí)。

將AI視頻通話功能集成到垂直應(yīng)用軟件中，可以變成擬人化的垂域?qū)＜?，提供更?zhuān)業(yè)的服務(wù)，解決更具體的問(wèn)題，從而激活用戶的付費(fèi)意愿和模型API經(jīng)濟(jì)。

目前，OpenAI為GPT-4o預(yù)設(shè)了十幾個(gè)場(chǎng)景，清言視頻通話API上線智譜開(kāi)放平臺(tái)時(shí)，也列出了智能硬件（VR眼鏡）、教育培訓(xùn)AI私教、文旅場(chǎng)景AI向?qū)?、具身智能等落地方向。通過(guò)將AI視頻通話API開(kāi)放出來(lái)，鼓勵(lì)開(kāi)發(fā)者在產(chǎn)品中集成“AI視頻通話”功能。

9月24日，多鄰國(guó)（Duolingo）在第六屆全球分享大會(huì)上，推出了 AI 視頻通話（Video Call）。Duolingo Max 用戶可以與多鄰國(guó)的角色 Lily（拽姐）進(jìn)行視頻通話，進(jìn)行個(gè)性化的互動(dòng)練習(xí)。在對(duì)話中，AI會(huì)根據(jù)用戶的語(yǔ)言水平靈活調(diào)整內(nèi)容。

學(xué)習(xí)語(yǔ)言最難的就是高頻使用環(huán)境和開(kāi)口說(shuō)話的心理障礙，通過(guò)AI視頻通話提供實(shí)時(shí)的對(duì)話機(jī)會(huì)，可以讓小白初學(xué)者也能自信開(kāi)口，進(jìn)行有效聯(lián)系。據(jù)說(shuō)，多鄰國(guó)的這一新功能接入了OpenAI的高級(jí)語(yǔ)音API功能。

國(guó)內(nèi)頭部社交軟件Soul，也上線了AI聊天機(jī)器人“AI茍蛋”，可以主動(dòng)跟用戶找話題，并且年底將開(kāi)啟AI陪聊機(jī)器人的視頻通話服務(wù)。不同于泛泛聊天，Soul主打的是靈魂交友，平臺(tái)用戶傾向于開(kāi)展深層交流，探討深度話題，尋求心靈共鳴。

在這種較為成熟的社區(qū)氛圍下，用戶在使用AI視頻通話的預(yù)期、內(nèi)容也是較為明確的，不會(huì)出現(xiàn)不知道聊什么的情況。

各行各業(yè)都存在大量需要互動(dòng)的場(chǎng)景，可以跟“AI視頻通話”相結(jié)合提供擬人化體驗(yàn)。但用戶能否由此對(duì)應(yīng)用和AI視頻通話產(chǎn)生黏性，還需要行業(yè)伙伴把使用門(mén)檻降到最低，這不僅需要行業(yè)擁有產(chǎn)品開(kāi)發(fā)的能力與意愿，能夠洞察缺口與機(jī)遇，也需要模廠的生態(tài)支持。

從哆啦A夢(mèng)到阿童木、賈維斯、Her，這些讓人類(lèi)感覺(jué)友好溫暖的AI，都是擬人化的。也許說(shuō)明，我們更愿意跟更像人類(lèi)的AI打交道，而不是冰冷無(wú)形的機(jī)器。

一位智能機(jī)器從業(yè)者告訴我們，一開(kāi)始設(shè)計(jì)的新車(chē)只有虛擬的語(yǔ)音助手，用戶上車(chē)之后覺(jué)得跟空氣說(shuō)話很尷尬，激活率不高，所以設(shè)計(jì)了一個(gè)帶有屏幕的車(chē)載控件，可以跟車(chē)主打招呼、有表情，車(chē)主很喜歡跟它對(duì)話，逢年過(guò)節(jié)還會(huì)為它買(mǎi)各種裝飾物，把它當(dāng)作用車(chē)場(chǎng)景中的家庭一員。

從這個(gè)思路看，AI視頻通話其實(shí)可以被加入各種硬件當(dāng)中，與用戶展開(kāi)真人一般的對(duì)話，從而成為情感共同體，由此衍生的商業(yè)空間也非常充裕。

透過(guò)AI視頻通話，相信大家能夠感受到，無(wú)論是AI企業(yè)或普通大眾，對(duì)于AI產(chǎn)品化的需求越來(lái)越實(shí)質(zhì)。

模型技術(shù)只是能力，是原型，而遠(yuǎn)不到普遍可用的階段。唯有通過(guò)產(chǎn)品化的細(xì)致打磨，AI這座商業(yè)富礦，才能真正顯露出鉆石般的光芒。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
29342

瀏覽量
267627

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

評(píng)論

發(fā)布評(píng)論請(qǐng)先登錄

相關(guān)推薦

AI 大模型行業(yè)應(yīng)用：企業(yè)如何走出一條智能化蛻變之路？

隨著 chatGPT 的橫空問(wèn)世，我們對(duì)于人工智能在日常生活中的應(yīng)用場(chǎng)景逐漸了解，無(wú)論是搜索、問(wèn)答、文生圖還是文生視頻都出現(xiàn)了很多創(chuàng)意，甚至 AI 還可以做詩(shī)，輸入一條指令，就可以讓它當(dāng)場(chǎng)賦詩(shī)一首

發(fā)表于 09-27 18:16 ?320次閱讀

視頻3--場(chǎng)景自動(dòng)化AI助手

AI

草帽王路飛
發(fā)布于 :2024年07月22日 11:16:13

視頻2--場(chǎng)景自動(dòng)化AI助手

AI

草帽王路飛
發(fā)布于 :2024年07月22日 11:15:34

THS8136三路10位180 MSPS圖形和視頻DAC數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《THS8136三路10位180 MSPS圖形和視頻DAC數(shù)據(jù)表.pdf》資料免費(fèi)下載

發(fā)表于 07-09 09:28 ?0次下載

DigiKey 推出《數(shù)字化城市》第 4 季視頻系列，聚焦人工智能

全球供應(yīng)品類(lèi)豐富、發(fā)貨快速的現(xiàn)貨技術(shù)元器件和自動(dòng)化產(chǎn)品領(lǐng)先商業(yè)分銷(xiāo)商?DigiKey，日前宣布推出《數(shù)字化城市》視頻系列第 4 季《智能世界中的 A

發(fā)表于 07-02 15:32 ?862次閱讀

聚焦AI技術(shù)引領(lǐng)，智象未來(lái)全面賦能圖片及視頻內(nèi)容生產(chǎn)

當(dāng)前，AIGC浪潮不斷席卷各行各業(yè)，隨著其技術(shù)的不斷釋放，全新行業(yè)價(jià)值正在顯現(xiàn)，AI技術(shù)也在從產(chǎn)業(yè)化應(yīng)用向社會(huì)化應(yīng)用轉(zhuǎn)變，深刻影響著產(chǎn)品創(chuàng)新、內(nèi)容創(chuàng)作及商業(yè)模式的發(fā)展。聚焦技術(shù)引領(lǐng)，智

發(fā)表于 06-24 13:36 ?233次閱讀

大模型產(chǎn)品化，不過(guò)是三支舞

AI產(chǎn)品化的答案，才是AI商業(yè)化的起點(diǎn)

發(fā)表于 06-13 09:27 ?1848次閱讀

HDMI音視頻采集與H.264編碼?體化采集卡LCC260數(shù)據(jù)手冊(cè)

LCC260是靈卡技術(shù)研發(fā)的?款HDMI音視頻采集與H.264編碼?體化的采集卡。其輸入接口HDMI最高支持1920x1080p@60fps視頻輸入，輸出接口采用USB2.0，可同時(shí)輸出兩路

發(fā)表于 04-12 14:38 ?1次下載

具有三條 100mA 通道的低 EMI 汽車(chē) LED驅(qū)動(dòng)器TPS61193-Q1數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《具有三條 100mA 通道的低 EMI 汽車(chē) LED驅(qū)動(dòng)器TPS61193-Q1數(shù)據(jù)表.pdf》資料免費(fèi)下載

發(fā)表于 04-09 14:40 ?0次下載

鴻蒙開(kāi)發(fā)實(shí)戰(zhàn)【通話管理】

通話管理模塊主要管理CS（Circuit Switch，電路交換）、IMS（IP Multimedia Subsystem，IP多媒體子系統(tǒng)）和OTT（over the top，OTT解決方案）三種類(lèi)型的通話，負(fù)責(zé)申請(qǐng)

發(fā)表于 03-14 20:10 ?341次閱讀

Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

近日，業(yè)界領(lǐng)先的AI技術(shù)公司Stability AI與中國(guó)AI創(chuàng)業(yè)公司Morph AI達(dá)成重要合作。雙方宣布共同推出一款革新性的all-in-one（一體式）

發(fā)表于 03-05 10:44 ?768次閱讀

KS-PXIE6352三路DVI/HDMI視頻源板介紹

電子發(fā)燒友網(wǎng)站提供《KS-PXIE6352三路DVI/HDMI視頻源板介紹.pdf》資料免費(fèi)下載

發(fā)表于 03-04 10:05 ?0次下載

關(guān)于ADV7180三路CVBS輸入時(shí)的使用問(wèn)題

使用ADV7180做三路CVBS輸入，現(xiàn)在視頻已有清晰輸出，請(qǐng)教如下問(wèn)題： 1，輸出視頻中，紅色與藍(lán)色顯示正好反了（與實(shí)物輸入對(duì)比），請(qǐng)問(wèn)是那個(gè)寄存器控制色彩顯示？ 2，如果三路CVB

發(fā)表于 12-05 06:57

學(xué)習(xí)臺(tái)燈|AI攝像頭學(xué)習(xí)機(jī)_支持視頻通話方案

學(xué)習(xí)臺(tái)燈|AI攝像頭學(xué)習(xí)機(jī)_支持視頻通話方案。采用聯(lián)發(fā)科MTK平臺(tái)解決方案，內(nèi)置12nm四核Cortex-A53處理器，提供高效的性能支持。它配備了10.1英寸的高清屏幕，分辨率為1920*2000

發(fā)表于 11-28 18:26 ?810次閱讀

請(qǐng)問(wèn)18B20溫度傳感器的三條線最長(zhǎng)能接到多少米？

18B20溫度傳感器的三條線最長(zhǎng)能接到多少米？能不能接到10米左右！

發(fā)表于 11-02 07:46