0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里AI打破視覺對話識別紀錄,AI的認知能力邁上新臺階!

PCB行業(yè)工程師技術(shù)交流 ? 來源:YXQ ? 2019-07-02 16:01 ? 次閱讀

近日, 在第二屆視覺對話競賽Visual Dialogue Challenge中,阿里AI擊敗了微軟、首爾大學等十支參賽隊伍,獲得冠軍。

(阿里AI在視覺對話競賽中得冠)

據(jù)了解,視覺對話競賽由美國佐治亞理工大學、Facebook人工智能實驗室(FAIR)等機構(gòu)聯(lián)合全球視覺技術(shù)領(lǐng)域頂級學術(shù)會議CVPR發(fā)起,是目前視覺對話領(lǐng)域最權(quán)威的競賽之一。

該競賽要求參賽的AI在看完近萬張圖片后,回答出人類對于任一圖片任一內(nèi)容的提問。競賽結(jié)果顯示,阿里AI以74.57%的準確率獲得冠軍,將上一屆比賽的紀錄提高了16.82%。在相同的數(shù)據(jù)集中,人類的準確率僅為64.27%。

傳統(tǒng)的視覺AI主要針對目標的檢測和識別,例如識別出圖片是否是一只貓,但對復雜場景中目標之間的邏輯關(guān)系理解、推理能力較弱,無法回答“這只貓旁邊的男生穿了什么顏色的衣服”等復雜問題,也難以將圖片信息轉(zhuǎn)化為人類理解的語言輸出。

阿里AI的突破在于提出了“遞歸探索對話模型”,綜合集成了圖像識別、關(guān)系推理與自然語言理解三大能力,它通過高效利用標注信息學習出模仿人類認知復雜場景的思維方式,能夠有效識別圖片里的實體以及它們之間的關(guān)系,推理出圖片所描述的事件內(nèi)容,并通過對上下文進行有效建模,理解人類提出的問題及真實意圖,給出自然準確的回復。

視覺對話是近年來快速崛起的AI研究方向,目的在于教會機器用自然語言與人類討論視覺內(nèi)容。如果說視覺識別技術(shù),讓機器具備了視覺能力;那么視覺對話技術(shù),則使得機器擁有了對真實視覺世界的理解與推斷能力,意味著AI的認知能力將邁上新的臺階。

據(jù)了解,這項技術(shù)未來將被應用在人機交互諸多場景:地震后在廢墟中尋找幸存者的救援機器人,能夠更加及時、高效地綜合指揮指令和場景信息作出行動;視障人士可以通過提問阿里AI,理解網(wǎng)絡照片中的內(nèi)容,了解自身所處的周圍環(huán)境;無人駕駛車輛對影響因子的意圖理解會更為準確,乘客的乘坐體驗更好。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29401

    瀏覽量

    267706
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1605

    瀏覽量

    47001

原文標題:不忘初心 奮勇當先——光華科技連續(xù)9年成為中國電子電路專用化學品民族企業(yè)No.1

文章出處:【微信號:ruziniubbs,微信公眾號:PCB行業(yè)工程師技術(shù)交流】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI大模型在圖像識別中的優(yōu)勢

    AI大模型在圖像識別中展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強大的計算能力、深度學習算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI大模型在圖像
    的頭像 發(fā)表于 10-23 15:01 ?131次閱讀

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    人們對AI for Science的關(guān)注推向了高潮。 2. 跨學科融合與科學研究新范式 AI與生命科學的結(jié)合,不僅推動了生命科學本身的進步,還促進了多個學科之間的交叉融合。這種跨學科的合作模式,打破
    發(fā)表于 10-14 09:21

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬
    發(fā)表于 09-09 15:36

    基于迅為RK3588開發(fā)板的AI圖像識別方案

    源源不斷的動力。 ■ 無與倫比的視覺盛宴最高支持8K編碼+8K解碼,能夠同時處理多路視頻流,確保每一幀畫面都流暢如絲,細膩入微。 ■ 智馭未來的AI力量RK3588內(nèi)置了6Tops(即每秒處理6萬億次
    發(fā)表于 08-13 11:26

    云開發(fā)AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 14:41:54

    基于瑞薩RZ/V2H AI微處理器的解決方案:高性能視覺AI系統(tǒng)

    復雜的實時物體識別及推理,同時功耗可與傳統(tǒng)的嵌入式MPU相媲美,無需冷卻風扇。這里介紹基于RZ/V2H的解決方案:高性能視覺AI系統(tǒng)。
    發(fā)表于 07-02 18:36 ?383次閱讀
    基于瑞薩RZ/V2H <b class='flag-5'>AI</b>微處理器的解決方案:高性能<b class='flag-5'>視覺</b><b class='flag-5'>AI</b>系統(tǒng)

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集)

    自定義大模型應用并接入到開發(fā)套件實現(xiàn)語音交互,由淺入深地展示如何開發(fā)自己的大模型助手。 離線AI能力示例SDK清單 序號AI 能力 1語音
    發(fā)表于 06-18 17:33

    梯云物聯(lián)|AI提高物聯(lián)網(wǎng)感知能力:讓電梯更智能、安全!

    在當今日新月異的科技浪潮中,人工智能(AI)與物聯(lián)網(wǎng)(IoT)的深度融合正在為各行各業(yè)帶來革命性的變化。特別是在電梯行業(yè)中,AI技術(shù)的引入不僅極大地提升了物聯(lián)網(wǎng)的感知能力,更讓電梯變得更加智能和安全。
    的頭像 發(fā)表于 06-03 11:49 ?435次閱讀
    梯云物聯(lián)|<b class='flag-5'>AI</b>提高物聯(lián)網(wǎng)感<b class='flag-5'>知能力</b>:讓電梯更智能、安全!

    【AIBOX快速入門】2步玩轉(zhuǎn)AI對話

    隨著目前AI的高速發(fā)展,大批量AI硬件應運而生,但使用門檻普遍較高。為了解決這類問題,F(xiàn)irefly開源團隊推出了基于Web的AI對話應用:FireflyChat,讓
    的頭像 發(fā)表于 05-30 08:02 ?468次閱讀
    【AIBOX快速入門】2步玩轉(zhuǎn)<b class='flag-5'>AI</b><b class='flag-5'>對話</b>

    開發(fā)者手機 AI - 目標識別 demo

    功能簡介 該應用是在Openharmony 4.0系統(tǒng)開發(fā)的一個目標識別AI應用,旨在從上到下打通Openharmony AI子系統(tǒng),展示Openharmony系統(tǒng)的
    發(fā)表于 04-11 16:14

    搭載星火認知大模型的AI鼠標:一鍵呼出AI助手,辦公更高效

    搭載星火認知大模型的AI鼠標:一鍵呼出AI助手,辦公更高效 在這個AI時代,如果你想在激烈競爭的職場中不被淘汰,訊飛AI鼠標AM30就是你的
    的頭像 發(fā)表于 03-25 11:52 ?420次閱讀
    搭載星火<b class='flag-5'>認知</b>大模型的<b class='flag-5'>AI</b>鼠標:一鍵呼出<b class='flag-5'>AI</b>助手,辦公更高效

    NanoEdge AI的技術(shù)原理、應用場景及優(yōu)勢

    硬件設計則是為了確保設備在執(zhí)行這些任務時能夠保持低能耗,從而提高其續(xù)航能力。 2、應用場景 NanoEdge AI 可以廣泛應用于各種物聯(lián)網(wǎng)設備和傳感器,如智能家居、工業(yè)自動化、智能交通、醫(yī)療健康
    發(fā)表于 03-12 08:09

    計算機視覺AI如何識別與理解圖像

    計算機視覺是人工智能領(lǐng)域的一個重要分支,它致力于讓機器能夠像人類一樣理解和解釋圖像。隨著深度學習和神經(jīng)網(wǎng)絡的發(fā)展,人們對于如何讓AI識別和理解圖像產(chǎn)生了濃厚的興趣。本文將探討計算機視覺
    的頭像 發(fā)表于 01-12 08:27 ?1275次閱讀
    計算機<b class='flag-5'>視覺</b>:<b class='flag-5'>AI</b>如何<b class='flag-5'>識別</b>與理解圖像

    新紫光集團全面賦能,紫光同創(chuàng)發(fā)展新臺階

    ,經(jīng)營業(yè)績、市場開拓及客戶服務也都新臺階! 近年來,得益于新一代信息通信、工業(yè)互聯(lián)網(wǎng)、新能源產(chǎn)業(yè)的發(fā)展熱潮,擁有“萬能芯片”之稱的FPGA芯片,因設計靈活、兼容性強、適用性廣與并行運算等優(yōu)勢,在多個領(lǐng)域展現(xiàn)出蓬勃
    的頭像 發(fā)表于 12-25 18:48 ?345次閱讀

    AI視覺識別有哪些工業(yè)應用

    AI視覺識別涵蓋多種應用,如人臉識別、目標檢測和識別、圖像分割、行為識別、視頻分析等。本篇就簡單
    的頭像 發(fā)表于 11-27 18:05 ?1114次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視覺</b><b class='flag-5'>識別</b>有哪些工業(yè)應用