0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Seeing AI幫助盲人和弱視用戶“看”世界

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 作者:胡薇 ? 2018-05-15 10:44 ? 次閱讀

導(dǎo)盲犬可以很好地幫助盲人或視障人士出行,但是如果想辨別出前面路口的標(biāo)識,或者想知道錢包里還有多少錢,導(dǎo)盲犬可就辦不到了。

由微軟AI研究小組開發(fā)的應(yīng)用程序Seeing AI為這個問題給出了解決方案。該應(yīng)用程序可為盲人和弱視用戶描述這個世界,使他們可以使用自己的智能手機(jī)來識別一切:包括單個物體、顏色、鈔票、文檔等。

自去年問世以來,這一應(yīng)用程序的下載量已突破15萬次,執(zhí)行任務(wù)500萬次,其中一些任務(wù)的服務(wù)對象還是全球知名的盲人。

“Stevie Wonder(美國知名藝人)每天都會用,這確實很令人振奮?!蔽④浉呒墧?shù)據(jù)科學(xué)家Anirudh Koul在3月于圣何塞舉行的GPU技術(shù)大會上發(fā)表演講時說道。

該應(yīng)用程序的現(xiàn)場演示就已展現(xiàn)出了其強(qiáng)大的功能。和Koul一同上臺的還有他的一位同事,當(dāng)他在自己的智能手機(jī)上運(yùn)行應(yīng)用程序,并將手機(jī)朝向他的同事時,應(yīng)用程序描述他看到的是“一位31歲、有著黑頭發(fā)、戴著眼鏡且看起來很開心的男士”。

如果這位同事在他的聯(lián)系人列表中,則有更佳的使用效果,因為Seeing AI可以與用戶的聯(lián)系人進(jìn)行整合,并能識別出朋友的名字。

Koul還分享了幾個令人嘆服的使用案例:一位盲人教師將運(yùn)行該應(yīng)用的手機(jī)面朝教室門口,這樣孩子們就不會因她是盲人而趁機(jī)偷偷進(jìn)出教室;另一位用戶在颶風(fēng)肆虐的地區(qū)穿行時,利用這款應(yīng)用程序避開了倒落的電線和其他障礙物。

Seeing AI的開發(fā)始于2014年2月,開發(fā)人員曾試圖創(chuàng)建一個能發(fā)現(xiàn)并識別周圍物體的卷積神經(jīng)網(wǎng)絡(luò)。但是其延遲時間達(dá)10秒,這樣的速度不能及時幫助人們快速作出決策。

第二年,微軟贊助了一場為期一周的黑客馬拉松,活動共吸引了13000人參與,并由此引發(fā)了第二次嘗試:在用戶的頭上配備手機(jī)。

在使用智能眼鏡進(jìn)行試驗后,Koul的團(tuán)隊開始著手于應(yīng)用程序本身的開發(fā)工作。網(wǎng)絡(luò)本地訓(xùn)練過程在NVIDIA GPU上進(jìn)行,而較為繁重的工作則交給了基于NVIDIA Tesla P100 GPU運(yùn)行的Azure云實例。通過逐幀分析確定每一部分訓(xùn)練的發(fā)生位置。

AI調(diào)優(yōu)

應(yīng)用程序需要辨別不同圖像,而圖像屬性具有不確定性,所以開發(fā)人員針對此特性對模型進(jìn)行了訓(xùn)練。例如,如果訓(xùn)練應(yīng)用程序識別貨幣,則需要向訓(xùn)練網(wǎng)絡(luò)內(nèi)輸入不清晰和無背景的貨幣圖片,以及貨幣某一極小部分放大后的圖片,再讓其識別出圖片的真實內(nèi)容。

該團(tuán)隊向志愿者征集,最終得到了各種類型的圖片,其中包括一張貓咪玩紙幣的圖片,以及紙幣被封在冰塊中的照片。通過這些變量對模型進(jìn)行訓(xùn)練,最終就能夠計算出識別圖片所需的最小參數(shù)。

Koul的團(tuán)隊對網(wǎng)絡(luò)進(jìn)行了調(diào)整,使其傾向于得出否定性分類或不分類的結(jié)果,而不是猜測結(jié)果(這樣可能將5元鈔票識別成10元),因為猜測很顯然會給盲人用戶造成麻煩。

隨著用戶人數(shù)的增多,這款應(yīng)用程序也將變得越好、越準(zhǔn)確。AI將會成為盲人和視障用戶的福音。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能手機(jī)
    +關(guān)注

    關(guān)注

    66

    文章

    18364

    瀏覽量

    179485
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29383

    瀏覽量

    267679

原文標(biāo)題:重見光明:深度學(xué)習(xí)幫助盲人“看”到世界

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    開發(fā)者大會成功舉辦 vivo用科技搭建人與數(shù)字世界的無障礙橋梁

    盲人協(xié)會主席李慶忠出席論壇,與資深用戶、合作伙伴們分享vivo信息無障礙建設(shè)最新成果,共同展望信息無障礙美好未來。 vivo副總裁、vvQ AI全球研究院院長周圍與中國殘疾人聯(lián)合會理事,中國
    發(fā)表于 10-12 14:18 ?60次閱讀
    開發(fā)者大會成功舉辦 vivo用科技搭建人與數(shù)字<b class='flag-5'>世界</b>的無障礙橋梁

    使用Google Play獲得安全可靠的AI體驗

    生成式 AI 的快速發(fā)展為開發(fā)者提供了機(jī)會,讓開發(fā)者能為世界各地用戶創(chuàng)造全新、引人入勝的沉浸式應(yīng)用體驗。在這個瞬息萬變的時代,我們很高興能繼續(xù)幫助開發(fā)者創(chuàng)建創(chuàng)新、優(yōu)質(zhì)的應(yīng)用,同時保持
    的頭像 發(fā)表于 09-09 15:53 ?325次閱讀

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗,擬按照要求準(zhǔn)備相關(guān)體會材料。
    發(fā)表于 09-09 15:36

    FMEA:解鎖AI用戶體驗新境界,直擊用戶心坎的智能鑰匙

    在復(fù)雜多變的AI系統(tǒng)中,F(xiàn)MEA不僅僅是傳統(tǒng)制造業(yè)中預(yù)防缺陷的工具,它更是一把解鎖AI用戶體驗新境界的鑰匙。通過系統(tǒng)地識別、評估AI系統(tǒng)可能面臨的失效模式及其對
    的頭像 發(fā)表于 09-05 11:02 ?155次閱讀

    昆侖萬維天工AI日活用戶超過100萬

    昆侖萬維集團(tuán)近日宣布,旗下天工AI的每日活躍用戶(DAU)已突破百萬大關(guān),標(biāo)志著其在人工智能領(lǐng)域的強(qiáng)大影響力和用戶基礎(chǔ)。天工AI智能體平臺匯聚了近百萬個
    的頭像 發(fā)表于 05-28 09:16 ?534次閱讀

    AI正通過智能家居幫助我們?nèi)朊?/a>

    不少企業(yè)已經(jīng)推出了個性化的睡眠方案,結(jié)合智能床墊和智能枕頭,通過智能分析和個性化設(shè)置,AI能夠根據(jù)用戶的睡眠習(xí)慣和偏好,自動調(diào)整睡眠環(huán)境,從而提供更加舒適和健康的睡眠體驗。 ? 要想實現(xiàn)這一技術(shù),與產(chǎn)品中的重要軟硬件是分不開的
    的頭像 發(fā)表于 04-12 00:08 ?3199次閱讀
    <b class='flag-5'>AI</b>正通過智能家居<b class='flag-5'>幫助</b>我們?nèi)朊? />    </a>
</div><div   id=

    AI芯片未來會控制這個世界嗎?

    AI芯片行業(yè)資訊
    芯廣場
    發(fā)布于 :2024年03月27日 18:21:28

    谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個充滿活力和交互性的虛擬世界。用戶可以在這個
    的頭像 發(fā)表于 03-04 14:02 ?650次閱讀

    谷歌發(fā)布AI基礎(chǔ)世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過單張圖像提示,生成一個可玩的、交互式的虛擬環(huán)境,從而開啟了一個全新的數(shù)字體驗時代。
    的頭像 發(fā)表于 02-28 17:41 ?701次閱讀

    Vitis AI用戶指南

    電子發(fā)燒友網(wǎng)站提供《Vitis AI用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 01-03 10:51 ?1次下載
    Vitis <b class='flag-5'>AI</b><b class='flag-5'>用戶</b>指南

    直線馬達(dá)觸覺模擬器助力盲人感受美好世界

    說到盲人,作為弱勢群體之一,他們無疑是不幸的,他們無法看到四季的變幻、無法看到親人的模樣,日常生活也是困難重重,但好在,隨著社會的發(fā)展和進(jìn)步,越來越多的人關(guān)注到他們,對他們伸出友愛援助之手,越來越多的設(shè)施設(shè)備給他們的生活提供便利,如導(dǎo)盲犬、盲道、觸覺模擬器等等。
    的頭像 發(fā)表于 12-09 09:14 ?704次閱讀

    大模型數(shù)據(jù)集:揭秘AI背后的魔法世界

    一、引言 在人工智能的奇幻世界中,大模型數(shù)據(jù)集如同神秘的魔法書,蘊(yùn)藏著無盡的智慧與力量。它們?yōu)?b class='flag-5'>AI注入了生命,使其具備了理解和改變世界的能力。今天,就讓我們一起揭開大模型數(shù)據(jù)集的神秘面紗,探索其背后
    的頭像 發(fā)表于 12-07 17:33 ?490次閱讀

    人類認(rèn)知如何幫助我們制造更好的AI系統(tǒng)?

    我們重點(diǎn)關(guān)注“一致性”問題,即AI系統(tǒng)思考和表征世界的方式與人類相比,有多大的一致性?我們需要做的是進(jìn)行更多的研究,找出AI系統(tǒng)擅長的事情,并幫助人們了解在哪些情況下可以與這些
    的頭像 發(fā)表于 11-15 16:34 ?349次閱讀

    #芯片 #AI 世界最強(qiáng)AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月15日 15:54:37

    對大家玩機(jī)器人和STM32有一些幫助

    電子發(fā)燒友網(wǎng)站提供《對大家玩機(jī)器人和STM32有一些幫助.rar》資料免費(fèi)下載
    發(fā)表于 11-10 16:11 ?0次下載
    對大家玩機(jī)器<b class='flag-5'>人和</b>STM32有一些<b class='flag-5'>幫助</b>