0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

多模態(tài):智能座艙的新突破口

要長(zhǎng)高 ? 2024-10-12 15:24 ? 次閱讀

智能汽車(chē)產(chǎn)業(yè)蓬勃發(fā)展的當(dāng)下,智能座艙作為車(chē)輛的重要組成部分,正經(jīng)歷著前所未有的變革。清華大學(xué)智能綠色車(chē)輛與交通全國(guó)重點(diǎn)實(shí)驗(yàn)室的曹東璞教授在全球智能汽車(chē)產(chǎn)業(yè)大會(huì)(GIV 2024)上指出,國(guó)內(nèi)智能座艙的發(fā)展速度驚人,已經(jīng)從過(guò)去的落后狀態(tài)轉(zhuǎn)變?yōu)轭I(lǐng)先國(guó)際。這一轉(zhuǎn)變的背后,AI大模型起到了關(guān)鍵的推動(dòng)作用。

然而,隨著智能座艙市場(chǎng)的快速發(fā)展,頭部座艙企業(yè)已經(jīng)遇到了瓶頸。為了突破這一困境,多模態(tài)成為了智能座艙發(fā)展的新熱點(diǎn)。多模態(tài)是指通過(guò)不同的信息來(lái)源或形式(如文本、語(yǔ)音、圖像、視頻等)來(lái)傳遞和接收信息。相較于單一模態(tài),多模態(tài)能夠更全面、完整地反映真實(shí)世界的復(fù)雜性和多樣性,同時(shí)實(shí)現(xiàn)不同模態(tài)之間的交互和融合。

隨著技術(shù)的持續(xù)迭代和發(fā)展,AI大模型正在從單一模態(tài)向多模態(tài)演進(jìn)。咨詢(xún)公司Gartner預(yù)測(cè),建立在多模態(tài)大模型上的生成式AI應(yīng)用將在未來(lái)幾年內(nèi)實(shí)現(xiàn)快速增長(zhǎng)。智能汽車(chē)作為原生多模態(tài)大模型的絕佳落地場(chǎng)景,正引領(lǐng)著這一變革。

商湯絕影和GPT-4V等多模態(tài)大模型的發(fā)布,標(biāo)志著AI公司開(kāi)始在技術(shù)框架層將語(yǔ)言模型、視覺(jué)模型、聲音模型等進(jìn)行融合。這些模型通過(guò)跨模態(tài)數(shù)據(jù)的訓(xùn)練,實(shí)現(xiàn)了多模態(tài)的對(duì)齊和連接,從而能夠在更廣泛的場(chǎng)景中應(yīng)用。

商湯絕影將多模態(tài)大模型業(yè)務(wù)分為模型層、引擎層和業(yè)務(wù)層三層。模型層包括車(chē)端側(cè)和云端的模型,用于進(jìn)行多模態(tài)大模型的推理。引擎層則包括座艙大腦和全時(shí)駕駛輔助兩個(gè)產(chǎn)品,分別用于感知座艙內(nèi)的情況和車(chē)外場(chǎng)景。業(yè)務(wù)層則包括語(yǔ)音助手、ADAS系統(tǒng)、手機(jī)運(yùn)用以及娛樂(lè)功能等,與下面的模型層和引擎層進(jìn)行融合。

然而,多模態(tài)大模型在智能座艙中的應(yīng)用也面臨著諸多挑戰(zhàn)。首先,車(chē)端應(yīng)用大模型需要強(qiáng)大的算力支持,而如何更優(yōu)、更好地使用算力是一個(gè)亟待解決的問(wèn)題。其次,集中化跨模態(tài)的全鏈路數(shù)據(jù)打通和服務(wù)接口的標(biāo)準(zhǔn)化等方面也需要進(jìn)一步努力。此外,多模態(tài)大模型在實(shí)際應(yīng)用中的取舍也是一個(gè)重要問(wèn)題。一些新功能雖然看似炫酷,但可能并不符合用戶(hù)的實(shí)際需求,導(dǎo)致資源浪費(fèi)。

因此,智能座艙的發(fā)展需要回歸原點(diǎn),改變車(chē)內(nèi)場(chǎng)景的交互效率。百度智艙業(yè)務(wù)部總經(jīng)理李濤指出,如果一個(gè)功能頻繁被用戶(hù)使用,可能說(shuō)明整體車(chē)輛設(shè)計(jì)的智能化程度較低,無(wú)法理解用戶(hù)當(dāng)前所需。因此,智能座艙的發(fā)展應(yīng)該更加注重用戶(hù)體驗(yàn)和實(shí)際需求,通過(guò)多模態(tài)大模型等技術(shù)手段提高交互效率,為用戶(hù)帶來(lái)更加便捷、智能的出行體驗(yàn)。

綜上所述,多模態(tài)作為智能座艙的新突破口,正引領(lǐng)著智能汽車(chē)產(chǎn)業(yè)的發(fā)展。然而,要實(shí)現(xiàn)多模態(tài)大模型在智能座艙中的廣泛應(yīng)用,還需要克服諸多技術(shù)和市場(chǎng)挑戰(zhàn)。未來(lái),隨著技術(shù)的不斷進(jìn)步和市場(chǎng)的日益成熟,智能座艙將迎來(lái)更加廣闊的發(fā)展前景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29349

    瀏覽量

    267631
  • 智能汽車(chē)
    +關(guān)注

    關(guān)注

    30

    文章

    2732

    瀏覽量

    107034
  • 智能座艙
    +關(guān)注

    關(guān)注

    4

    文章

    888

    瀏覽量

    16197
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    利用OpenVINO部署Qwen2模態(tài)模型

    模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進(jìn)行融合,通過(guò)學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián),實(shí)現(xiàn)更加智能化的信息處理。簡(jiǎn)單來(lái)說(shuō),
    的頭像 發(fā)表于 10-18 09:39 ?134次閱讀

    Meta發(fā)布模態(tài)LLAMA 3.2人工智能模型

    Meta Platforms近日宣布了一項(xiàng)重要技術(shù)突破,成功推出了模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新模型不僅能夠深度解析文本信息,還實(shí)現(xiàn)了對(duì)圖像內(nèi)容的精準(zhǔn)理解,標(biāo)志著Met
    的頭像 發(fā)表于 09-27 11:44 ?304次閱讀

    云知聲推出山海模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,模態(tài)交互技術(shù)正成為引領(lǐng)未來(lái)的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心獨(dú)運(yùn)的山海
    的頭像 發(fā)表于 08-27 15:20 ?315次閱讀

    慕尼黑電子展回顧:?jiǎn)⒚髦秋@模態(tài)硬件智能體引領(lǐng)科技潮流

    在剛剛落幕的慕尼黑電子展上,啟明云端攜啟明智顯與觸覺(jué)智能兩家子公司,共同為全球觀眾呈現(xiàn)了一場(chǎng)科技盛宴。本次展會(huì),啟明智顯憑借其創(chuàng)新的模態(tài)硬件智能體及一系列前沿產(chǎn)品,贏得了廣泛關(guān)注與好
    的頭像 發(fā)表于 07-10 16:17 ?268次閱讀
    慕尼黑電子展回顧:?jiǎn)⒚髦秋@<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>硬件<b class='flag-5'>智能</b>體引領(lǐng)科技潮流

    智譜AI發(fā)布全新模態(tài)開(kāi)源模型GLM-4-9B

    近日,智譜AI在人工智能領(lǐng)域取得重大突破,成功推出全新開(kāi)源模型GLM-4-9B。這款模型以其卓越的模態(tài)能力,再次刷新了業(yè)界對(duì)于大型語(yǔ)言模型的認(rèn)識(shí)。
    的頭像 發(fā)表于 06-07 09:17 ?597次閱讀

    人大系初創(chuàng)公司智子引擎發(fā)布全新模態(tài)大模型Awaker 1.0

    人大系初創(chuàng)公司智子引擎近日震撼發(fā)布了新一代模態(tài)大模型Awaker 1.0,這一里程碑式的成果標(biāo)志著公司在通用人工智能(AGI)領(lǐng)域取得了重要突破。與前代ChatImg序列模型相比,A
    的頭像 發(fā)表于 05-06 09:59 ?525次閱讀

    蘋(píng)果發(fā)布300億參數(shù)MM1模態(tài)大模型

    近日,科技巨頭蘋(píng)果公司在一篇由多位專(zhuān)家共同撰寫(xiě)的論文中,正式公布了其最新的模態(tài)大模型研究成果——MM1。這款具有高達(dá)300億參數(shù)的模態(tài)模型系列,由密集模型和混合專(zhuān)家(MoE)變體組
    的頭像 發(fā)表于 03-19 11:19 ?783次閱讀

    2024年全球與中國(guó)7nm智能座艙芯片行業(yè)總體規(guī)模、主要企業(yè)國(guó)內(nèi)外市場(chǎng)占有率及排名

    7nm智能座艙芯片市場(chǎng)報(bào)告主要研究: 7nm智能座艙芯片市場(chǎng)規(guī)模: 產(chǎn)能、產(chǎn)量、銷(xiāo)售、產(chǎn)值、價(jià)格、成本、利潤(rùn)等 7nm智能
    發(fā)表于 03-16 14:52

    智能網(wǎng)聯(lián)汽車(chē)產(chǎn)業(yè)的區(qū)域布局動(dòng)因與趨勢(shì)分析

    我國(guó)汽車(chē)產(chǎn)銷(xiāo)總量已連續(xù)14年居全球第一,推動(dòng)量變轉(zhuǎn)向質(zhì)變成為要?jiǎng)?wù),智能網(wǎng)聯(lián)汽車(chē)正是突破口之一。
    的頭像 發(fā)表于 02-20 11:35 ?629次閱讀

    語(yǔ)音識(shí)別技術(shù)最新進(jìn)展:視聽(tīng)融合的模態(tài)交互成為主要演進(jìn)方向

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)所謂“模態(tài)”,英文是modality,用通俗的話(huà)說(shuō),就是“感官”,模態(tài)即將多種感官融合。模態(tài)交互技術(shù)是近年
    的頭像 發(fā)表于 12-28 09:06 ?3274次閱讀
    語(yǔ)音識(shí)別技術(shù)最新進(jìn)展:視聽(tīng)融合的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>交互成為主要演進(jìn)方向

    國(guó)內(nèi)MES的突破口

    從國(guó)內(nèi)MES的起步到現(xiàn)階段的突破性發(fā)展,清晰地展現(xiàn)了國(guó)內(nèi)MES系統(tǒng)技術(shù)在研究、應(yīng)用上的發(fā)展成果,同時(shí)也清晰的指出了國(guó)內(nèi)MES的突破口在于:深化應(yīng)用。發(fā)展證明:MES系統(tǒng)只有不斷深入研究、深入
    發(fā)表于 12-21 11:07 ?0次下載

    人工智能領(lǐng)域模態(tài)的概念和應(yīng)用場(chǎng)景

    隨著人工智能技術(shù)的不斷發(fā)展,模態(tài)成為了一個(gè)備受關(guān)注的研究方向。模態(tài)技術(shù)旨在將不同類(lèi)型的數(shù)據(jù)和信息進(jìn)行融合,以實(shí)現(xiàn)更加準(zhǔn)確、高效的人工
    的頭像 發(fā)表于 12-15 14:28 ?8049次閱讀

    大模型+模態(tài)的3種實(shí)現(xiàn)方法

    我們知道,預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就, 然而其明顯的劣勢(shì)是不支持其他模態(tài)(包括圖像、語(yǔ)音、視頻模態(tài))的輸入和輸出,那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息,讓其變得更強(qiáng)大、更通用呢?本節(jié)將介紹“大模型+
    的頭像 發(fā)表于 12-13 13:55 ?1526次閱讀
    大模型+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的3種實(shí)現(xiàn)方法

    探究編輯模態(tài)大語(yǔ)言模型的可行性

    不同于單模態(tài)模型編輯,模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點(diǎn)依然從單模態(tài)模型編輯入手,將單模態(tài)
    發(fā)表于 11-09 14:53 ?443次閱讀
    探究編輯<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大語(yǔ)言模型的可行性

    聚焦汽車(chē)智能化先鋒,中軟國(guó)際助力智能座艙成為“第三生活空間”

    布局, 目前已形成智能座艙系統(tǒng)架構(gòu)設(shè)計(jì)、智能座艙開(kāi)發(fā)、HMI用戶(hù)體驗(yàn)設(shè)計(jì)、智能駕駛數(shù)據(jù)標(biāo)注、智能
    的頭像 發(fā)表于 11-02 19:30 ?586次閱讀
    聚焦汽車(chē)<b class='flag-5'>智能</b>化先鋒,中軟國(guó)際助力<b class='flag-5'>智能</b><b class='flag-5'>座艙</b>成為“第三生活空間”