0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新型transformer模型實現(xiàn)3D醫(yī)學(xué)圖像分析最新基準(zhǔn)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-08-15 15:01 ? 次閱讀

計算機視覺和模式識別會議( CVPR )上, NVIDIA 研究人員發(fā)表了 35 多篇論文。這包括對 移動窗口 UNEt TRansformers ( Swin-UNETR )的研究,這是第一個基于變壓器的預(yù)訓(xùn)練框架,專為 3D 醫(yī)學(xué)圖像分析中的自我監(jiān)督任務(wù)而設(shè)計。這項研究是創(chuàng)建用于數(shù)據(jù)注釋的預(yù)訓(xùn)練、大規(guī)模和自監(jiān)督三維模型的第一步。

作為一種基于 transformer 的計算機視覺方法, Swin UNETR 采用了 MONAI ,這是一種開源的 PyTorch 框架,用于深入學(xué)習(xí)醫(yī)療成像,包括放射學(xué)和病理學(xué)。使用這種預(yù)訓(xùn)練方案, Swin UNETR 為各種醫(yī)學(xué)圖像分割任務(wù)設(shè)定了新的最先進(jìn)的基準(zhǔn),并一致證明了其有效性,即使只有少量的標(biāo)記數(shù)據(jù)。

Swin UNETR 模型培訓(xùn)

Swin UNETR 模型在 NVIDIA DGX-1 集群 使用八個 GPUAdamW 優(yōu)化算法。對 5050 張來自健康和不健康受試者不同身體部位的公開 CT 圖像進(jìn)行預(yù)訓(xùn)練,以保持?jǐn)?shù)據(jù)集的平衡。

對于 3D Swin transformer 編碼器的自我監(jiān)督預(yù)訓(xùn)練,研究人員使用了各種借口任務(wù)。隨機裁剪的標(biāo)記使用不同的變換(如旋轉(zhuǎn)和剪切)進(jìn)行增強。這些標(biāo)記用于掩蔽體修復(fù)、旋轉(zhuǎn)和對比學(xué)習(xí),用于編碼器學(xué)習(xí)訓(xùn)練數(shù)據(jù)的上下文表示,而不會增加數(shù)據(jù)注釋的負(fù)擔(dān)。

pYYBAGL571-AKsH1AALchbVmfMI713.png

圖 1 :。預(yù)培訓(xùn)框架概述。輸入的 CT 圖像被隨機裁剪成子體積,并通過隨機內(nèi)部剪切和旋轉(zhuǎn)進(jìn)行增強,然后作為輸入饋送到 Swin-UNETR 編碼器

Swin UNETR 背后的技術(shù)

Swin Transformers 采用分層視覺 transformer ( ViT )進(jìn)行非重疊窗口的局部自我注意計算。這打開了為大型公司創(chuàng)建醫(yī)療專用 ImageNet 的機會,消除了創(chuàng)建醫(yī)療 AI 模型需要大量高質(zhì)量注釋數(shù)據(jù)集的瓶頸。

與 CNN 體系結(jié)構(gòu)相比, ViT 在從未標(biāo)記數(shù)據(jù)(數(shù)據(jù)集越大,預(yù)訓(xùn)練主干越強)進(jìn)行全局和局部表示的自監(jiān)督學(xué)習(xí)方面表現(xiàn)出非凡的能力。用戶可以在下游任務(wù)(例如,分割、分類和檢測)中使用極少量的標(biāo)記數(shù)據(jù)微調(diào)預(yù)訓(xùn)練模型。

這種體系結(jié)構(gòu)在本地窗口中計算自我注意,與 ViT 相比表現(xiàn)出更好的性能。此外, Swin Transformers 的層次性使其非常適合需要多尺度建模的任務(wù)。

繼領(lǐng)先的 UNETR 模型成功使用直接使用 3D 補丁嵌入的基于 ViT 的編碼器之后, Swin UNETR 使用了具有金字塔結(jié)構(gòu)的 3D Swin transformer 編碼器。

在 Swin UNETR 的編碼器中,由于計算簡單的全局自我注意對于高分辨率特征地圖是不可行的,因此在本地窗口中計算自我注意。為了增加局部窗口以外的感受野,使用窗口移位來計算不同窗口的區(qū)域相互作用。

Swin UNETR 的編碼器通過跳過連接以五種不同的分辨率連接到剩余的類似 UNet 的解碼器。它可以為密集的預(yù)測任務(wù)(如醫(yī)學(xué)圖像分割)捕獲多尺度特征表示。

Swin UNETR 模型性能

在對 CT 中的 13 個腹部器官和 醫(yī)學(xué)分段十項全能( MSD ) 數(shù)據(jù)集中的分割任務(wù)使用 超越顱穹窿( BTCV )分割挑戰(zhàn) 進(jìn)行微調(diào)后,該模型在公共排行榜上達(dá)到了最先進(jìn)的精度。

BTCV

在 BTCV 中, SwinUnetr 的平均骰子數(shù)為 0.918 ,優(yōu)于其他排名靠前的模型。

pYYBAGL572iAYS0KAAFJcNkiNbo915.png

圖 2 :。 BTCV 挑戰(zhàn)多器官分割排行榜骰子結(jié)果

對于較小的器官,如脾靜脈和門靜脈( 3.6% )、胰腺( 1.6% )和腎上腺( 3.8% ),與之前的最先進(jìn)方法相比,有了改進(jìn)小器官數(shù)據(jù)標(biāo)簽分割對于放射科醫(yī)生來說是一項極其困難的任務(wù)。

通訊簿標(biāo)簽

在 MSD 中, Swin UNETR 在腦腫瘤、肺、胰腺和結(jié)腸方面取得了最先進(jìn)的表現(xiàn)。心臟、肝臟、海馬、前列腺、肝血管和脾臟的結(jié)果具有可比性??偟膩碚f, Swin UNETR 在所有 10 項任務(wù)中的平均骰子率為 78.68% ,是最好的,并在 MSD 排行榜上排名第一。

pYYBAGL573OASYJ5AAUqdCVicy0245.png

圖 4 :。使用 MSD 數(shù)據(jù)集進(jìn)行肝血管分割任務(wù)的定性輸出。你可以看到, Swin UNETR 比 SOTA DiNTS 跑贏了 3% 。這一變化很重要,因為它會導(dǎo)致更準(zhǔn)確的分段輸出

與DiNTS(一種用于醫(yī)學(xué)圖像分割的強大AutoML方法)相比,Swin UNETR使用更少的訓(xùn)練時間,顯示出更好的分割性能。例如,肝血管分割任務(wù)的定性分割輸出證明了Swin UNETR能夠更好地建模長期空間依賴性。

pYYBAGL574GAYNO0AAIuPO-qS8I870.png

圖 5 :。 Swin UNETR 模型體系結(jié)構(gòu)由一個 Swin transformer 編碼器組成,該編碼器使用 3D 補丁,并通過不同分辨率的跳過連接連接到基于 CNN 的解碼器

結(jié)論

Swin UNETR 體系結(jié)構(gòu)在使用變壓器的醫(yī)療成像方面提供了急需的突破。鑒于醫(yī)學(xué)成像需要快速構(gòu)建準(zhǔn)確的模型, Swin UNETR 體系結(jié)構(gòu)使數(shù)據(jù)科學(xué)家能夠?qū)Υ罅课礃?biāo)記數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。這減少了放射科醫(yī)生、病理學(xué)家和其他臨床團隊進(jìn)行專家注釋的成本和時間。這里我們展示了用于器官檢測和自動體積測量的 SOTA 分割性能。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    44

    文章

    3557

    瀏覽量

    133844
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7305

    瀏覽量

    87562
收藏 人收藏

    評論

    相關(guān)推薦

    安寶特產(chǎn)品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠
    的頭像 發(fā)表于 08-07 10:13 ?284次閱讀
    安寶特產(chǎn)品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級<b class='flag-5'>分析</b>工具

    裸眼3D筆記本電腦——先進(jìn)的光場裸眼3D技術(shù)

    效果的用戶,這款筆記本電腦都能滿足你的需求。 一、卓越的3D模型設(shè)計能力 英倫科技裸眼3D筆記本電腦采用最新的光場裸眼3D技術(shù),使用戶無需佩戴3D
    的頭像 發(fā)表于 07-16 10:04 ?398次閱讀

    Transformer語言模型簡介與實現(xiàn)過程

    任務(wù),隨后迅速擴展到其他NLP任務(wù)中,如文本生成、語言理解、問答系統(tǒng)等。本文將詳細(xì)介紹Transformer語言模型的原理、特點、優(yōu)勢以及實現(xiàn)過程。
    的頭像 發(fā)表于 07-10 11:48 ?962次閱讀

    烘焙vs渲染:3D模型制作中的效率與質(zhì)量之爭

    3D建模和渲染領(lǐng)域,模型烘焙(Baking)和模型渲染(Rendering)是兩個經(jīng)常被提及的概念。盡管它們都與最終圖像的生成有關(guān),但它們在技術(shù)
    的頭像 發(fā)表于 05-12 08:27 ?353次閱讀
    烘焙vs渲染:<b class='flag-5'>3D</b><b class='flag-5'>模型</b>制作中的效率與質(zhì)量之爭

    ad19中3d模型不顯示?

    封裝庫導(dǎo)入3d模型不顯示,但導(dǎo)入3d模型后的封裝庫生成pcb文件時顯示3d模型,這是什么原因?qū)е?/div>
    發(fā)表于 04-24 13:41

    包含具有多種類型信息的3D模型

    三維視圖。事實上,AE可以在將3D BIM模型元素與時間因素聯(lián)系起來后創(chuàng)建4D模型,從而更廣泛地進(jìn)行產(chǎn)品的可視化預(yù)覽,更精確地分析建筑項目的
    發(fā)表于 03-28 17:18

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關(guān)注。此模型具備從單張圖像
    的頭像 發(fā)表于 03-22 10:30 ?719次閱讀

    Adobe提出DMV3D3D生成只需30秒!讓文本、圖像都動起來的新方法!

    因此,本文研究者的目標(biāo)是實現(xiàn)快速、逼真和通用的 3D 生成。為此,他們提出了 DMV3D。DMV3D 是一種全新的單階段的全類別擴散模型,能
    的頭像 發(fā)表于 01-30 16:20 ?759次閱讀
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!讓文本、<b class='flag-5'>圖像</b>都動起來的新方法!

    高分工作!Uni3D3D基礎(chǔ)大模型,刷新多個SOTA!

    我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GP
    的頭像 發(fā)表于 01-30 15:56 ?725次閱讀
    高分工作!Uni<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>基礎(chǔ)大<b class='flag-5'>模型</b>,刷新多個SOTA!

    如何搞定自動駕駛3D目標(biāo)檢測!

    可用于自動駕駛場景下基于圖像3D目標(biāo)檢測的數(shù)據(jù)集總結(jié)。其中一些數(shù)據(jù)集包括多個任務(wù),這里只報告了3D檢測基準(zhǔn)(例如KITTI 3D發(fā)布了超過
    發(fā)表于 01-05 10:43 ?514次閱讀
    如何搞定自動駕駛<b class='flag-5'>3D</b>目標(biāo)檢測!

    3D人體生成模型HumanGaussian實現(xiàn)原理

    3D 生成領(lǐng)域,根據(jù)文本提示創(chuàng)建高質(zhì)量的 3D 人體外觀和幾何形狀對虛擬試穿、沉浸式遠(yuǎn)程呈現(xiàn)等應(yīng)用有深遠(yuǎn)的意義。傳統(tǒng)方法需要經(jīng)歷一系列人工制作的過程,如 3D 人體模型回歸、綁定、
    的頭像 發(fā)表于 12-20 16:37 ?1421次閱讀
    <b class='flag-5'>3D</b>人體生成<b class='flag-5'>模型</b>HumanGaussian<b class='flag-5'>實現(xiàn)</b>原理

    CASAIM沙盤模型3D打印的優(yōu)勢和應(yīng)用

    模型3D打印的優(yōu)勢和應(yīng)用。 一、CASAIM沙盤模型3D打印的優(yōu)勢 1. 高精度:沙盤模型3D
    的頭像 發(fā)表于 12-19 16:44 ?505次閱讀
    CASAIM沙盤<b class='flag-5'>模型</b><b class='flag-5'>3D</b>打印的優(yōu)勢和應(yīng)用

    PADS VX2.7 下載安裝及3D模型導(dǎo)入的注意事項

    ://mentor.mr-wu.cn/ 安裝方式按照安裝包內(nèi)的指導(dǎo)完成即可。 破解注意事項:1.用最新版饅頭破解 2.必須關(guān)閉殺毒軟件,否則破解后不可用! 二:3D模型導(dǎo)入 1.從3D模型
    發(fā)表于 11-22 17:54

    HT for Web (Hightopo) 使用心得(4)- 3D 場景 Graph3dView 與 Obj 模型

    這里我們通過代碼建立一個 3D 場景并添加一個 Obj 模型來介紹一下 HT for Web 在 3D 場景和模型加載方面的使用。
    的頭像 發(fā)表于 11-20 11:05 ?687次閱讀
    HT for Web (Hightopo) 使用心得(4)- <b class='flag-5'>3D</b> 場景 Graph<b class='flag-5'>3</b>dView 與 Obj <b class='flag-5'>模型</b>

    上線一周就2.1k star!單張圖像直接轉(zhuǎn)為3D模型!

    最大的好處就是可以直接利用Stable Diffusion這種經(jīng)過數(shù)十億張圖像訓(xùn)練過的2D擴散模型,實際上相當(dāng)于引入了非常強的先驗信息。而且法線圖可以表征物體的起伏和表面幾何信息,進(jìn)而計算3D
    的頭像 發(fā)表于 11-06 16:13 ?1010次閱讀
    上線一周就2.1k star!單張<b class='flag-5'>圖像</b>直接轉(zhuǎn)為<b class='flag-5'>3D</b><b class='flag-5'>模型</b>!