0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟發(fā)布PhI-3-Vision模型,提升視覺AI效率

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-05-28 11:35 ? 次閱讀

5 月 28 日,微軟在 Build 2024 大會(huì)上推出了最新的 Phi-3 系列成員——Phi-3-vision。這一工具主打視覺應(yīng)用,能有效處理圖片文字信息,且在移動(dòng)設(shè)備上也能運(yùn)行自如。

Phi-3-vision 是一種小型多模式語言模型(SLM),主要適用于本地人工智能場景。其模型參數(shù)高達(dá) 42 億,上下文序列包含 128k 個(gè)符號(hào),可滿足各種視覺推理和其他任務(wù)需求。

Microsoft 通過一篇新發(fā)表的論文[PDF]展示了 Phi-3-vision 的強(qiáng)大實(shí)力。與其他模型如 Claude 3-haiku、Gemini 1.0 Pro 相比,Phi-3-vision 毫不遜色。

此外,Microsoft 還對(duì) Phi-3-vision 進(jìn)行了多項(xiàng)測試,并將其與其他競品模型進(jìn)行了比較,包括字節(jié)跳動(dòng)的 Llama3-Llava-Next(8B)、微軟研究院與威斯康星大學(xué)、哥倫比亞大學(xué)聯(lián)合開發(fā)的 LlaVA-1.6(7B)以及阿里巴巴通義千問 QWEN-VL-Chat 模型等。結(jié)果表明,Phi-3-vision 在多個(gè)項(xiàng)目中的表現(xiàn)均十分出色。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6542

    瀏覽量

    103829
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46411

    瀏覽量

    236656
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    492

    瀏覽量

    10230
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    在英特爾酷睿Ultra7處理器上優(yōu)化和部署Phi-3-min模型

    2024年4月23日,微軟研究院公布Phi-3系列AI模型,包含三個(gè)版本:mini(3.8B參數(shù))、small(7B參數(shù))以及medium(14B參數(shù))。
    的頭像 發(fā)表于 08-30 16:58 ?460次閱讀
    在英特爾酷睿Ultra7處理器上優(yōu)化和部署<b class='flag-5'>Phi-3</b>-min<b class='flag-5'>模型</b>

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評(píng)測SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 編輯 視覺語音大模型 AI 開發(fā)套件( CSK6-MIX )是圍繞 CSK6011A 芯片設(shè)計(jì)的具備豐富語音圖像功能
    發(fā)表于 06-18 17:33

    英特爾機(jī)器視覺AI解決方案助力生產(chǎn)力升級(jí)

    5月21日-22日,北京機(jī)器視覺助力智能制造創(chuàng)新發(fā)展大會(huì)在北京國際會(huì)議中心圓滿舉行。本次大會(huì)以“Vision+AI引領(lǐng)新質(zhì)生產(chǎn)力”為核心主題,聚焦“3D視覺與精準(zhǔn)成像、
    的頭像 發(fā)表于 05-30 17:14 ?446次閱讀
    英特爾機(jī)器<b class='flag-5'>視覺</b>與<b class='flag-5'>AI</b>解決方案助力生產(chǎn)力升級(jí)

    英特爾聯(lián)手微軟,推動(dòng)移動(dòng)設(shè)備低功耗計(jì)算及AI解決方案

    據(jù)報(bào)道,微軟于4月至5月間相繼推出了多款Phi-3小型語言模型(SLM),這些模型以其“輕便易攜且能在移動(dòng)設(shè)備中運(yùn)行”以及強(qiáng)大的視覺處理能力
    的頭像 發(fā)表于 05-27 15:59 ?326次閱讀

    微軟發(fā)布視覺AI模型Phi-3-vision

     據(jù)悉,Phi-3-vision 作為微軟 Phi-3 家族的首款多模態(tài)模型,繼承自 Phi-3-mini 的文本理解能力,兼具輕巧便攜特性
    的頭像 發(fā)表于 05-27 15:56 ?414次閱讀

    英特爾優(yōu)化AI產(chǎn)品組合,助力微軟Phi-3家族模型

    近日,英特爾宣布針對(duì)微軟Phi-3家族開放模型,成功驗(yàn)證并優(yōu)化了其跨客戶端、邊緣及數(shù)據(jù)中心的AI產(chǎn)品組合。這一重要舉措旨在提供更為靈活和高效的AI
    的頭像 發(fā)表于 05-27 11:47 ?608次閱讀

    英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型

    近日,英特爾針對(duì)微軟的多個(gè)Phi-3家族的開放模型,驗(yàn)證并優(yōu)化了其跨客戶端、邊緣和數(shù)據(jù)中心的AI產(chǎn)品組合。
    的頭像 發(fā)表于 05-27 11:15 ?502次閱讀

    微軟開發(fā)新AI語言模型MAI-1,挑戰(zhàn)行業(yè)巨頭

    據(jù)最新消息,微軟正積極開發(fā)一款新型AI語言模型MAI-1,以提升在快速發(fā)展的AI市場中的競爭力。
    的頭像 發(fā)表于 05-08 10:27 ?406次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個(gè)開源庫,用于優(yōu)化從 PC 到云端的 NVIDIA GPU 上運(yùn)行的大語言
    的頭像 發(fā)表于 04-28 10:36 ?446次閱讀

    微軟發(fā)布phi-3AI模型,性能超越GPT-3.5

    微軟稱,帶有38億參數(shù)的phi-3-mini經(jīng)過3.3萬億token的強(qiáng)化學(xué)習(xí),其基礎(chǔ)表現(xiàn)已經(jīng)超過Mixtral 8x7B及GPT-3.5;此外,該模型可在手機(jī)等移動(dòng)設(shè)備上運(yùn)行,并在phi
    的頭像 發(fā)表于 04-23 14:32 ?485次閱讀

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發(fā)效率提升10倍

    的潞晨科技Colossal-AI系統(tǒng),用戶可實(shí)現(xiàn)在本地算力平臺(tái)一鍵訓(xùn)練、微調(diào)、推理、部署大模型,將大模型開發(fā)效率提升10倍以上,并將算力
    的頭像 發(fā)表于 03-01 09:43 ?425次閱讀
    潞晨科技Colossal-<b class='flag-5'>AI</b> + 浪潮信息AIStation,大<b class='flag-5'>模型</b>開發(fā)<b class='flag-5'>效率</b><b class='flag-5'>提升</b>10倍

    微軟攜手法國AI初創(chuàng)企業(yè)Mistral推動(dòng)AI模型商業(yè)化

    微軟近日與法國人工智能初創(chuàng)企業(yè)Mistral達(dá)成合作協(xié)議,旨在推動(dòng)AI模型的商業(yè)化應(yīng)用。據(jù)悉,微軟將提供全方位支持,幫助這家成立僅10個(gè)月的公司將其先進(jìn)的
    的頭像 發(fā)表于 02-28 10:23 ?460次閱讀

    圖漾科技發(fā)布3D工業(yè)視覺應(yīng)用開發(fā)平臺(tái)Vision++

    2023年12月20日,全球領(lǐng)先的3D機(jī)器視覺企業(yè)圖漾科技發(fā)布3D工業(yè)視覺應(yīng)用開發(fā)平臺(tái)Vision
    的頭像 發(fā)表于 12-20 16:46 ?761次閱讀
    圖漾科技<b class='flag-5'>發(fā)布</b><b class='flag-5'>3</b>D工業(yè)<b class='flag-5'>視覺</b>應(yīng)用開發(fā)平臺(tái)<b class='flag-5'>Vision</b>++

    微軟宣布推出一個(gè)27億參數(shù)的語言模型Phi-2

    Phi-2 是微軟 “小語言模型(SLM)” 系列中的最新版本。第一個(gè)版本是擁有 13 億參數(shù)的 Phi-1,針對(duì)基本的 Python 編碼任務(wù)進(jìn)行了微調(diào)。
    發(fā)表于 12-15 09:46 ?232次閱讀
    <b class='flag-5'>微軟</b>宣布推出一個(gè)27億參數(shù)的語言<b class='flag-5'>模型</b><b class='flag-5'>Phi</b>-2

    微軟正式發(fā)布一個(gè)27億參數(shù)的語言模型Phi-2

    先后和 OpenAI、Meta 牽手推動(dòng)大模型發(fā)展的微軟,也正在加快自家小模型的迭代。
    的頭像 發(fā)表于 12-14 15:45 ?753次閱讀
    <b class='flag-5'>微軟</b>正式<b class='flag-5'>發(fā)布</b>一個(gè)27億參數(shù)的語言<b class='flag-5'>模型</b>—<b class='flag-5'>Phi</b>-2