0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

膠囊機(jī)器人是如何完成深度學(xué)習(xí)與算法訓(xùn)練的?

新機(jī)器視覺 ? 來源:3D先臨三維數(shù)字化與3D打印 ? 作者:SHINING ? 2020-08-28 15:23 ? 次閱讀

一顆膠囊大小的胃腸道內(nèi)窺鏡機(jī)器人,被服下后,通過體外磁控的方式實現(xiàn)在消化道中的運(yùn)動,途經(jīng)食道、胃部、腸部,最后被人體排出。這個過程中,電腦可以同步顯示胃腸道的相關(guān)檢測數(shù)據(jù),從而讓醫(yī)生有依據(jù)地完成診斷。

(圖片來源:2018 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS))

聽起來好像很簡單,而實際上膠囊機(jī)器人在投入使用前,必須先經(jīng)過深度學(xué)習(xí)和訓(xùn)練。就像游戲玩家出發(fā)去升級打怪需要游戲裝備和地圖一樣,膠囊機(jī)器人需要通過深度學(xué)習(xí)技術(shù)改善密集地形重建和姿態(tài)估計算法,以及通過SLAM( Simultaneous Localization and Mapping)同步定位與地圖構(gòu)建的機(jī)器視覺技術(shù)實現(xiàn)檢測、識別能力。

通俗一點講,機(jī)器人不是人,它的視覺和決策能力,都需要研制者通過一些方法賦予給它。通過深度學(xué)習(xí)獲得的能力相當(dāng)于膠囊機(jī)器人的大腦,而通過SLAM機(jī)器視覺獲得的就相當(dāng)于膠囊機(jī)器人的“火眼金睛”。

2000年,以色列研制的第一個膠囊內(nèi)鏡獲得FDA批準(zhǔn)進(jìn)入臨床,當(dāng)時的膠囊機(jī)器人是隨消化道的自然蠕動而前進(jìn)的,由于沒有經(jīng)過深度學(xué)習(xí)訓(xùn)練,也沒有SLAM技術(shù)的加持,有點像盲人摸象,對于像胃這樣大的消化道器官,其觀察范圍十分有限,因此會造成相當(dāng)大的漏檢。

土耳其伊斯坦布爾的Bogazici大學(xué)的生物醫(yī)學(xué)工程專業(yè),有一個專業(yè)的生物醫(yī)學(xué)實驗室,其研究領(lǐng)域包括生物醫(yī)學(xué)儀器、生物電子學(xué)、生物力學(xué)、神經(jīng)信號分析、生物光子學(xué)、醫(yī)學(xué)成像、細(xì)胞成像和電生理學(xué)、機(jī)器人技術(shù)、醫(yī)療設(shè)備設(shè)計和測試,以及心理物理學(xué)等。

2020年,該實驗室的Mehmet Turan博士,通過TUBI TAK2232國際杰出研究人員研究金方案獲得了資金支持,開展了一項名為“磁性驅(qū)動的Al-Powered內(nèi)窺鏡膠囊機(jī)器人用于靶向藥物傳遞和多活檢操作”的研究項目。該項目旨在利用人工智能最新進(jìn)展,在無線膠囊內(nèi)窺鏡(WCE)機(jī)器人的機(jī)電一體化設(shè)計、遠(yuǎn)程磁控以及定位和映射算法方面進(jìn)行重大的科技創(chuàng)新。

在該項目中,研究人員基于1個膠囊內(nèi)鏡圖像的基礎(chǔ)SLAM數(shù)據(jù)集,1只Panda機(jī)械臂,1臺EinScan Pro 2X(先臨三維品牌的3D掃描儀),2個具有不同相機(jī)特性的商用膠囊機(jī)器人,對體外豬胃腸道的數(shù)據(jù)進(jìn)行了采集,并完成了算法測試和膠囊機(jī)器人的深度學(xué)習(xí)與訓(xùn)練。

研究人員把器官固定在六個支架上,創(chuàng)造出L形、Z形和O形三種胃腸道形態(tài),以模擬通過升結(jié)腸到橫結(jié)腸的GI-牽引路徑。EinScan Pro 2X的功能就是3D掃描獲取這六個器官形態(tài)的點云數(shù)據(jù)。所收集的數(shù)據(jù)結(jié)果,需要滿足兩點:使SLAM數(shù)據(jù)集適合于遷移學(xué)習(xí);此外,還可以對同一器官類型的具有不同紋理細(xì)節(jié)的組織進(jìn)行算法性能測試。

由于被掃描的物體本身明暗多變,柔軟易變形,一開始并不順利。先臨三維的技術(shù)人員在了解項目情況后,為研究人員及時提供了3D掃描儀的操作指導(dǎo),包括如何通過亮度調(diào)整應(yīng)對明暗變化,如何使用標(biāo)志點輔助數(shù)據(jù)高精度拼接,選擇哪一種無毒無害的醫(yī)用顯影劑可以幫助進(jìn)一步改善數(shù)據(jù)細(xì)節(jié),以及面對不同的情況如何選擇合適的掃描模式。

最終,我們很高興地看到,研究人員如愿以償獲取到了六組高精細(xì)的3D數(shù)據(jù),如實記錄了器官所有結(jié)構(gòu)、角落和深度。

然后,原始點云數(shù)據(jù)被進(jìn)一步編輯,得到了色譜圖。

這些數(shù)據(jù)都被用于膠囊機(jī)器人的深度學(xué)習(xí)和算法訓(xùn)練。Bogazici大學(xué)的研究人員使用膠囊內(nèi)鏡圖像的基礎(chǔ)SLAM數(shù)據(jù)集作為輸入,然后利用此次3D掃描獲取的三維模型在SLAM數(shù)據(jù)集中確定定位。

研究組的Mehmet Turan博士說:“在以前的一個研究項目中,我使用過另一個品牌的3D掃描儀。那款3D掃描儀也很好,但是與EinScan Pro 2X相比,在分辨率和點精度上存在技術(shù)差異。點精度是我們此次項目實現(xiàn)深度學(xué)習(xí)過程的最重要因素之一,這就是為什么團(tuán)隊最終決定依靠EinScan Pro 2X的能力來完成這個項目的原因?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4576

    瀏覽量

    92343
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    411

    瀏覽量

    31739
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5437

    瀏覽量

    120794

原文標(biāo)題:膠囊機(jī)器人是如何完成深度學(xué)習(xí)與算法訓(xùn)練的?EinScan Pro 2X帶你了解SLAM機(jī)器視覺

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    在NVIDIA Isaac Lab中訓(xùn)練四足機(jī)器人運(yùn)動

    由于涉及復(fù)雜的動力學(xué),為四足機(jī)器人制定有效的運(yùn)動策略是機(jī)器人領(lǐng)域面臨的重大挑戰(zhàn)。在現(xiàn)實世界中訓(xùn)練四足機(jī)器人上下樓梯可能會損壞設(shè)備和環(huán)境,因此,在學(xué)習(xí)
    的頭像 發(fā)表于 09-06 14:48 ?309次閱讀
    在NVIDIA Isaac Lab中<b class='flag-5'>訓(xùn)練</b>四足<b class='flag-5'>機(jī)器人</b>運(yùn)動

    FPGA在人工智能中的應(yīng)用有哪些?

    :FPGA在語音識別領(lǐng)域也有廣泛應(yīng)用。通過算法優(yōu)化和硬件自適應(yīng)能力,F(xiàn)PGA可以實現(xiàn)高效的語音信號處理和識別,提供低延時、高精度的語音識別系統(tǒng)。 機(jī)器人控制:FPGA在機(jī)器人控制方面扮演著重要角色。它可
    發(fā)表于 07-29 17:05

    利用Matlab函數(shù)實現(xiàn)深度學(xué)習(xí)算法

    在Matlab中實現(xiàn)深度學(xué)習(xí)算法是一個復(fù)雜但強(qiáng)大的過程,可以應(yīng)用于各種領(lǐng)域,如圖像識別、自然語言處理、時間序列預(yù)測等。這里,我將概述一個基本的流程,包括環(huán)境設(shè)置、數(shù)據(jù)準(zhǔn)備、模型設(shè)計、訓(xùn)練
    的頭像 發(fā)表于 07-14 14:21 ?1549次閱讀

    谷歌借助Gemini AI系統(tǒng)深化對機(jī)器人訓(xùn)練

    7月12日,國際科技界傳來新動態(tài),谷歌正借助其先進(jìn)的Gemini AI系統(tǒng),深化對旗下機(jī)器人訓(xùn)練,旨在顯著提升它們的導(dǎo)航能力和任務(wù)執(zhí)行能力。DeepMind機(jī)器人團(tuán)隊最新發(fā)布的研究論文,詳細(xì)闡述
    的頭像 發(fā)表于 07-12 16:29 ?564次閱讀

    Al大模型機(jī)器人

    豐富的知識儲備。它們可以涵蓋各種領(lǐng)域的知識,并能夠回答相關(guān)問題。靈活性與通用性: AI大模型機(jī)器人具有很強(qiáng)的靈活性和通用性,能夠處理各種類型的任務(wù)和問題。持續(xù)學(xué)習(xí)和改進(jìn): 這些模型可以通過持續(xù)的訓(xùn)練
    發(fā)表于 07-05 08:52

    深度學(xué)習(xí)模型訓(xùn)練過程詳解

    深度學(xué)習(xí)模型訓(xùn)練是一個復(fù)雜且關(guān)鍵的過程,它涉及大量的數(shù)據(jù)、計算資源和精心設(shè)計的算法訓(xùn)練一個深度
    的頭像 發(fā)表于 07-01 16:13 ?779次閱讀

    基于FPGA EtherCAT的六自由度機(jī)器人視覺伺服控制設(shè)計

    ,在 PS層運(yùn)行 蘇姆的裸機(jī)程序, 并將六自由度串聯(lián)機(jī)器人逆解算法移植到主站代碼里,進(jìn)行機(jī)器人末端位置對于視覺反饋的實時跟隨控制。 (4)通過實驗驗證了本設(shè)計的對物塊識別的準(zhǔn)確性和實時性,并使用自主
    發(fā)表于 05-29 16:17

    探訪ABB中壓開關(guān)柜智能機(jī)器人裝配流水線的奧秘

    ABB機(jī)器人為廈門ABB開關(guān)工廠提供的機(jī)器人工作站集成多項智能技術(shù):兩臺IRB 6700和一臺IRB 8700結(jié)合3D機(jī)器人視覺和基于神經(jīng)網(wǎng)絡(luò)的深度
    的頭像 發(fā)表于 04-30 11:54 ?839次閱讀

    廣和通發(fā)布機(jī)器人開發(fā)平臺

    廣和通近日隆重發(fā)布了其全新研發(fā)的具身智能機(jī)器人開發(fā)平臺——Fibot。該平臺旨在滿足客戶在驗證Mobile ALOHA協(xié)同學(xué)習(xí)與簡單示教操作數(shù)據(jù)方面的需求,通過深度學(xué)習(xí),使機(jī)械臂能夠習(xí)
    的頭像 發(fā)表于 03-29 09:34 ?514次閱讀

    生醫(yī)應(yīng)用的磁控膠囊機(jī)器人,實現(xiàn)多模態(tài)響應(yīng)與多功能集成

    膠囊機(jī)器人可以通過口服方式抵達(dá)胃腸道病灶區(qū)域?qū)嵤┽t(yī)療功能,為實現(xiàn)胃腸道疾病無痛無創(chuàng)診療和提高患者依從性提供了重要途徑。
    的頭像 發(fā)表于 03-14 15:36 ?893次閱讀
    生醫(yī)應(yīng)用的磁控<b class='flag-5'>膠囊</b><b class='flag-5'>機(jī)器人</b>,實現(xiàn)多模態(tài)響應(yīng)與多功能集成

    星動紀(jì)元開源人形機(jī)器人訓(xùn)練框架Humanoid-Gym

    星動紀(jì)元,這家專注于人形機(jī)器人技術(shù)的創(chuàng)新公司,近日宣布計劃將其訓(xùn)練框架Humanoid-Gym進(jìn)行開源。Humanoid-Gym是一個為人形機(jī)器人設(shè)計的訓(xùn)練框架,其開源將極大地推動人形
    的頭像 發(fā)表于 03-06 18:13 ?1776次閱讀

    LabVIEW的六軸工業(yè)機(jī)器人運(yùn)動控制系統(tǒng)

    LabVIEW開發(fā)六軸工業(yè)機(jī)器人運(yùn)動控制系統(tǒng) 本項目開發(fā)了一個高效的工業(yè)機(jī)器人控制系統(tǒng),重點關(guān)注于運(yùn)動學(xué)算法和軌跡規(guī)劃算法的實現(xiàn)和測試。LabVIEW作為一個關(guān)鍵技術(shù),在項目中扮演了核
    發(fā)表于 12-21 20:03

    深度學(xué)習(xí)如何訓(xùn)練出好的模型

    算法工程、數(shù)據(jù)派THU深度學(xué)習(xí)在近年來得到了廣泛的應(yīng)用,從圖像識別、語音識別到自然語言處理等領(lǐng)域都有了卓越的表現(xiàn)。但是,要訓(xùn)練出一個高效準(zhǔn)確的深度
    的頭像 發(fā)表于 12-07 12:38 ?1010次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>如何<b class='flag-5'>訓(xùn)練</b>出好的模型

    思靈機(jī)器人宣布完成機(jī)器人公司Franka Emika的收購

    全球領(lǐng)先的智能機(jī)器人獨(dú)角獸企業(yè)思靈機(jī)器人宣布完成機(jī)器人公司Franka Emika收購。
    的頭像 發(fā)表于 11-03 18:27 ?1207次閱讀

    Eureka!NVIDIA 研究突破為機(jī)器人學(xué)習(xí)注入新動力

    AI 智能體利用 LLM 自動生成獎勵算法訓(xùn)練機(jī)器人完成復(fù)雜任務(wù)。 NVIDIA Research 開發(fā)的一款名為 Eureka 的新型 AI 智能體可以教
    的頭像 發(fā)表于 10-25 15:55 ?221次閱讀
    Eureka!NVIDIA 研究突破為<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>注入新動力