0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

微軟新AI項目為文檔和電子郵件的圖像添加字幕

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2020-11-18 10:54 ? 次閱讀

微軟的一項新AI項目旨在自動為文檔和電子郵件中的圖像添加字幕,以便視覺障礙軟件讀取圖像。

微軟的研究人員在有關預印本存儲庫arXiv的論文中解釋了他們的機器學習模型的原理。

該模型使用可視語音詞匯預訓練(VIVO),它利用大量成對的圖像標簽數(shù)據(jù)來學習視覺詞匯。然后,使用帶有適當字幕的圖像的第二個數(shù)據(jù)以幫助教AI如何最好地描述圖片。

“理想情況下,每個人都應在文檔,網(wǎng)絡,社交媒體中為所有圖像添加替代文本,因為這可以使盲人訪問內容并參與對話。但是,可惜,人們卻沒有?!蔽④汚I平臺小組的軟件工程經(jīng)理Saqib Shaikh說。

總體而言,研究人員希望AI能夠提供Microsoft現(xiàn)有字幕系統(tǒng)兩倍的性能。

為了對新AI的性能進行基準測試,研究人員將其納入了“無上限”挑戰(zhàn)。在撰寫本文時,Microsoft的AI現(xiàn)在在其排行榜上排名第一。

“無上限的挑戰(zhàn)實際上是如何描述您在訓練數(shù)據(jù)中沒有看到的那些新穎的物體?”微軟研究實驗室的首席研究經(jīng)理王麗娟評論道。

希望使用Microsoft自動字幕AI來構建應用程序的開發(fā)人員已經(jīng)可以這樣做,因為Azure Cognitive Services的Computer Vision軟件包中提供了該功能。

微軟令人印象深刻的SeeingAI應用程序將使用新的AI進行更新,該應用程序使用計算機視覺描述視力障礙者的周圍環(huán)境。

“圖像字幕是可以實現(xiàn)廣泛服務的核心計算機視覺功能之一,”Azure AI認知服務的CTO黃表示。

黃繼續(xù)說:“我們AI的這一突破以Azure為平臺,以服務于更多客戶?!?“這不僅是研究上的突破;在Azure上將突破轉化為生產(chǎn)所需的時間也是突破?!?/p>

改進的自動字幕功能也有望在今年晚些時候在Outlook,Word和PowerPoint中使用。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6535

    瀏覽量

    103808
  • AI
    AI
    +關注

    關注

    87

    文章

    29364

    瀏覽量

    267647
收藏 人收藏

    評論

    相關推薦

    微軟新型專利實現(xiàn)電子郵件與聊天工具的無縫切換

     5 月 30 日消息,美國商標和專利局近日于 5 月 21 日公布授予微軟一項專利,該專利涉及一種全新的系統(tǒng)可實現(xiàn)從電子郵件至聊天工具的無縫切換。
    的頭像 發(fā)表于 05-30 15:31 ?378次閱讀

    微軟AI新成果:將不可編輯PDF轉化為可編輯文檔

    市面現(xiàn)有相關軟件雖能將PDF轉為可編輯版,但易喪失原始布局。微軟研究論文名為《從不可編輯文檔生成可編輯文檔的方法和系統(tǒng)》,其獨特之處在于運用AI技術保持了字體、色彩、布局及
    的頭像 發(fā)表于 05-30 10:11 ?540次閱讀

    微軟Office Outlook Lite服務升級,支持短信功能

    據(jù)報道,微軟于今日宣布更新 Outlook Lite 服務,使其支持 SMS 短信功能。微軟稱,通過此項升級,用戶現(xiàn)可整合管理電子郵件及 SMS 短信,有效提升溝通效率。
    的頭像 發(fā)表于 05-28 11:41 ?477次閱讀

    微軟網(wǎng)頁版PPT新增語音識別及字幕生成功能

    據(jù)報道,微軟計劃于今年六月份推出網(wǎng)頁版PowerPoint全新語音識別功能。此項功能將能夠監(jiān)控PowerPoint視頻中的聲音,進而自動生成字幕
    的頭像 發(fā)表于 05-16 14:36 ?319次閱讀

    微軟中國AI團隊或將整體搬遷至美國或澳大利亞

    5月15日,鈦媒體爆料稱,微軟公司已經(jīng)通過電子郵件形式,通知旗下中國區(qū)域負責人旗下AI研發(fā)團隊,包括C+AI團隊以及Azure ML團隊等,將全員遷移至美國或者澳大利亞。據(jù)悉,此次搬遷
    的頭像 發(fā)表于 05-15 16:29 ?799次閱讀

    谷歌Gmail將支持Gemini總結電子郵件內容

    谷歌透露,Gemini 將協(xié)助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內容。用戶可通過移動應用和網(wǎng)頁版 Gmail 使用 Gemini
    的頭像 發(fā)表于 05-15 11:11 ?471次閱讀

    微軟新版Outlook郵件應用提高垃圾郵件防御能力

    微軟稱,垃圾郵件即指收件箱中無意接收的、未經(jīng)許可的郵件信息,包括那些意圖推廣產(chǎn)品或服務的商家以及名為網(wǎng)絡釣魚的虛假郵件,這些郵件往往假扮成官
    的頭像 發(fā)表于 05-14 09:50 ?298次閱讀

    2024年第一季度電子郵件威脅報告:美國垃圾郵件數(shù)量居首,制造業(yè)受害較多

    具體而言,在各類被攻擊對象之中,制造業(yè)、政府部門以及IT行業(yè)成為了黑客的主要目標。該報告顯示,在2024年第一季度,制造業(yè)收到了43%的電子郵件,政府部門15%,IT行業(yè)11%的攻擊。
    的頭像 發(fā)表于 05-14 09:31 ?603次閱讀

    微軟Windows 11 AI探索者功能揭秘

    早前于 4 月 27 日,Xeno 曾詳細解釋過 Windows 11 AI Explorer 的主要功能,其中一大亮點在于能夠追蹤用戶在電腦上的全部操作活動,涵蓋了各類應用程序、電子郵件文檔、會議以及觀看電影等。
    的頭像 發(fā)表于 05-07 10:22 ?363次閱讀

    微軟發(fā)布金融聊天機器人,定價尚無確切消息

    在此之前,微軟已推出兩款相對應的產(chǎn)品——適用于Office應用及Outlook郵箱的Office 365 Copilot,以及專為銷售人員設計的Copilot for Sales,用以協(xié)助撰寫電子郵件和收集客戶信息等。
    的頭像 發(fā)表于 03-01 09:08 ?426次閱讀

    smtp服務器指啥 smtp服務器用于接收郵件

    SMTP(Simple Mail Transfer Protocol)是一種用于在網(wǎng)絡中發(fā)送電子郵件的協(xié)議。它定義了郵件的傳輸規(guī)則和相關的命令。SMTP服務器是負責接收、處理和傳遞郵件的服務器
    的頭像 發(fā)表于 02-02 10:56 ?1095次閱讀

    微軟推出Copilot安卓應用 類似ChatGPT功能

    微軟在安卓系統(tǒng)上的Copilot應用程序與ChatGPT非常相似,可以訪問聊天機器人功能,通過DALL-E 3生成圖像,并可以為電子郵件文檔起草文本。它還包括免費訪問OpenAI最新
    的頭像 發(fā)表于 12-28 16:59 ?965次閱讀
    <b class='flag-5'>微軟</b>推出Copilot安卓應用 類似ChatGPT功能

    Mdaemon保持網(wǎng)絡安全:如何發(fā)送安全電子郵件

    安全電子郵件有助于防止未經(jīng)授權訪問您的敏感信息,如個人身份信息(PII)、財務數(shù)據(jù)或機密業(yè)務信息。通過發(fā)送安全電子郵件,您可以保護您的隱私,并確保您的信息到達指定的收件人,而不會被攔截或篡改。
    的頭像 發(fā)表于 12-10 11:09 ?1045次閱讀
    Mdaemon保持網(wǎng)絡安全:如何發(fā)送安全<b class='flag-5'>電子郵件</b>

    如何使用Python編寫腳本來自動發(fā)送郵件

    發(fā)送電子郵件,我們需要使用smtplib和email模塊。smtplib模塊是Python標準庫中的一部分,用于發(fā)送電子郵件。email模塊用于創(chuàng)建電子郵件消息。 以下是一個Python自動發(fā)送
    的頭像 發(fā)表于 12-07 11:36 ?1192次閱讀

    微軟CEO登臺Open AI發(fā)布會、微軟687億美元收購暴雪......

    點亮在看,發(fā)現(xiàn)更多精彩 原文標題:微軟CEO登臺Open AI發(fā)布會、微軟687億美元收購暴雪...... 文章出處:【微信公眾號:微軟科技】歡迎
    的頭像 發(fā)表于 11-10 08:15 ?336次閱讀
    <b class='flag-5'>微軟</b>CEO登臺Open <b class='flag-5'>AI</b>發(fā)布會、<b class='flag-5'>微軟</b>687億美元收購暴雪......