電子發(fā)燒友網(wǎng)報道(文/李彎彎)日前,梅賽德斯-奔馳和微軟共同宣布,梅賽德斯-奔馳通過微軟的Azure OpenAI Service,將ChatGPT整合進(jìn)他們的MBUX語音助手。
測試計劃將于當(dāng)?shù)貢r間周五(6月16日)開始,在美90萬輛配備MBUX信息娛樂系統(tǒng)的車輛都可參與測試。車主可以通過登錄官方應(yīng)用程序“Mercedes me”,或在車內(nèi)使用語音命令“嘿梅賽德斯,我想加入測試計劃”,自愿注冊參與測試。
汽車是大模型最大的交互應(yīng)用場景
微軟公司發(fā)言人稱,這是ChatGPT產(chǎn)品第一次應(yīng)用在汽車環(huán)境中。據(jù)微軟介紹,車載ChatGPT能支持更動態(tài)的對話——不僅可以理解車主的語音命令,還可以進(jìn)行交互式對話,對話范圍可以涵蓋地點信息、菜譜,甚至是一些更加復(fù)雜的問題。
與普通的語音助手不同,車載ChatGPT可以處理完整的對話,比如追問,并且能保持對前后文的理解。駕駛員可以提出復(fù)雜的問題或進(jìn)行多輪對話,從語音助手那里收到詳細(xì)的回復(fù)。
微軟還在與梅奔探索ChatGPT的插件生態(tài)系統(tǒng),為第三方服務(wù)集成開辟可能性。駕駛員未來有望通過車載系統(tǒng),就能完成預(yù)訂餐廳、預(yù)定電影票等任務(wù),進(jìn)一步提高便利性和生產(chǎn)力。
近半年來,全球主要的互聯(lián)網(wǎng)公司、人工智能企業(yè)已經(jīng)推出眾多大模型產(chǎn)品,而接下來探索大模型的落地應(yīng)用是關(guān)鍵。
早前在上海車展上,阿里集團(tuán)副總裁、斑馬智行CEO張春暉談到,汽車是大模型最大的交互應(yīng)用場景,智能汽車操作系統(tǒng)將會被重塑。他表示,AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進(jìn)行測試,相關(guān)技術(shù)會率先在智己汽車上落地。
不僅阿里巴巴,眾多企業(yè)都在探索大模型在汽車上的應(yīng)用,包括百度、阿里、商湯等。此外,特斯拉、英偉達(dá)、毫末智行等都有這方面的探索。
此前,百度發(fā)布文心一言之后,長安汽車就官宣,旗下逸達(dá)將成為國內(nèi)首款搭載文心一言的量產(chǎn)車型,后續(xù)將通過軟件升級的形式搭載到新車上。除此之外,集度、吉利、嵐圖、紅旗、長城、東風(fēng)日產(chǎn)、愛馳、零跑、海馬等多家車企都確認(rèn)將內(nèi)測體驗并接入其相關(guān)能力,與百度共同打造針對汽車智能場景的大模型人工智能交互體驗。
5月份,百度Apollo汽車智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果,包括出行場景對話式交互、邏輯推理、策略規(guī)劃和知識問答等多項能力,還有在當(dāng)前智艙命令式交互下覆蓋全車多音區(qū)、毫秒級響應(yīng)、免喚醒全時交互的體驗。
百度阿波羅智艙業(yè)務(wù)部產(chǎn)品架構(gòu)師徐嘉南表示,大模型的能力給汽車加上了智商和情商,這是過去系統(tǒng)不具備的能力。
商湯此前推出的“日日新SenseNova”大模型體系擁有語言大模型以及數(shù)字人等多種生成式AI能力,可為車艙提供更智能和人性化的多模態(tài)人車交互體驗。在前不久的上海車展上,商湯科技就展示了其大模型在車艙智能化方面的實力。另外,在“日日新SenseNova”大模型體系的支持,其自動駕駛產(chǎn)品方案也獲得持續(xù)創(chuàng)新的能力。
此外,毫末智行此前也發(fā)布了首個基于大模型的自動駕駛算法DriveGPT。不久前馬斯克也被曝出緊急搶購1萬張GPU,創(chuàng)立X.AI,準(zhǔn)備開發(fā)TruthGPT。
英偉達(dá)也有這方面的探索,此前消息,英偉達(dá)與慕尼黑大學(xué)等院校的研究人員聯(lián)合發(fā)布了一篇有關(guān)視頻潛在擴(kuò)散模型的論文,該模型能夠?qū)⑽谋巨D(zhuǎn)換成視頻,實現(xiàn)高分辨率的長視頻合成。研究人員指出,該模型其中一大具有潛力的應(yīng)用領(lǐng)域,是駕駛數(shù)據(jù)的高分辨率視頻合成,能夠模擬特定駕駛場景,在自動駕駛領(lǐng)域中具有巨大的應(yīng)用潛力。
大模型賦能智能座艙和自動駕駛發(fā)展
大模型在汽車上的應(yīng)用主要是智能座艙和智能駕駛。當(dāng)前,隨著新能源汽車的快速滲透,汽車智能化的步伐也在加快。其中,智能座艙的滲透率增長態(tài)勢更為明顯。數(shù)據(jù)顯示,預(yù)計到2025年,在國內(nèi)市場,智能座艙的滲透率將突破76%。
根據(jù)調(diào)研,在智能座艙方面,智能化功能搭載率排名第一的是語音交互。所以各家大模型在智能座艙上的應(yīng)用來看,對語音交互的優(yōu)化是其首先要做的事。大家都知道,語音交互其實已經(jīng)發(fā)展很多年,但目前車載語音助手整體水平還停留在可能叫不醒、響應(yīng)慢、總出錯、聽不懂、不好用的階段。
而大模型能帶來的好處是,它可以通過深度學(xué)習(xí)等技術(shù),訓(xùn)練出更加準(zhǔn)確的語義和意圖理解模型,幫助車載系統(tǒng)更好地理解用戶的指令和意圖,并讓車載語音實現(xiàn)更深層次的個性化和自然擬人的交互。因此在大模型賦能下,車載助手將具備真正的智能化水平,更好地了解用戶的喜好,根據(jù)語義識別,理解用戶的環(huán)境和情緒狀態(tài)。
就如上述談到的,微軟的車載ChatGPT,能支持更動態(tài)的對話,可以理解車主的語音命令,還可以進(jìn)行交互式對話,與普通的語音助手不同,車載ChatGPT可以處理完整的對話,比如追問,并且能保持對前后文的理解。
再如百度推出的小度車載語音SDK,基于大模型本地化技術(shù),它的體驗更流暢,用戶可以在任何位置、任何時間直接交流,沒有交互屏障,不像原來要不斷進(jìn)行喚醒,真正做到全時免喚醒,不需要再喚醒。小度車載語音還支持多路同時交互,車內(nèi)每個位置都有專屬的服務(wù)語音交互,其背后比較大的挑戰(zhàn)就是拒識能力,具體來說就是區(qū)分人是不是在和車說話,如果是和車說話,就應(yīng)該有響應(yīng),如果不是和車說話,就應(yīng)該忽略。
近幾年,雖然眾多企業(yè)都在大力研究推進(jìn)自動駕駛的發(fā)展,然而其進(jìn)展卻相當(dāng)緩慢。而ChatGPT的出現(xiàn)讓業(yè)界似乎看到了新的希望。
業(yè)內(nèi)人士認(rèn)為,大模型可在算法、數(shù)據(jù)閉環(huán)、仿真等環(huán)節(jié)全面賦能自動駕駛。比如,在數(shù)據(jù)閉環(huán)和仿真環(huán)節(jié),大模型的精準(zhǔn)識別和數(shù)據(jù)挖掘以及數(shù)據(jù)生成能力可對數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注、以及仿真場景構(gòu)建賦能。再比如,在模塊化的算法部署模式下,感知算法、規(guī)控算法也可受到大模型的加強(qiáng)而實現(xiàn)感知精度和規(guī)控效果的提升。
小結(jié)
自從去年底ChatGPT出現(xiàn)以來,到目前為止,全球已經(jīng)涌現(xiàn)出眾多大模型產(chǎn)品,而接下來,該是拼落地應(yīng)用的時候了。目前而言,汽車被認(rèn)為是大模型一大重要的應(yīng)用場景,包括智能座艙和自動駕駛,從目前的情況來看,業(yè)界在這方面已經(jīng)有諸多嘗試。可見,大模型能否給智能座艙帶來升級、給自動駕駛帶來新的突破,估計不久的將來就能見分曉。
-
奔馳
+關(guān)注
關(guān)注
1文章
410瀏覽量
23264 -
ChatGPT
+關(guān)注
關(guān)注
28文章
1523瀏覽量
7247
發(fā)布評論請先 登錄
相關(guān)推薦
評論