0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Ariza部署了一個WebApp利用圖像分析技術診斷患者是否患有瘧疾

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-11-08 09:11 ? 次閱讀

編者按:機器學習本質(zhì)上是門工程學,把實驗室里的算法、技術帶入實際應用,這是很多科研人員、數(shù)據(jù)科學家的夢想。美國灣區(qū)有一個培訓機構insight,它專門招收名校PhD,通過短期強化課程把初出茅廬的學生培養(yǎng)成符合企業(yè)需求的數(shù)據(jù)工作者,而在這個過程中,這些接收培訓的學生也留下了一些非常有價值的應用。

本文介紹的Carlos Atico Ariza是2018年秋季的insight health研究員,在加入insight之前,他在一家公司擔任數(shù)據(jù)科學顧問,負責構建端到端機器學習解決方案,比如無需人為監(jiān)督的異常檢測系統(tǒng)。雖然從事的是數(shù)據(jù)方面的工作,但Ariza在大學獲得的學位是化學和生物工程博士,他一直想為醫(yī)學領域作出貢獻。

在insight培訓期間,Ariza部署了一個WebApp,能利用圖像分析技術診斷患者是否患有瘧疾,并列出治療優(yōu)先等級。這個應用成功讓臨床醫(yī)生的瘧疾診斷工作量降低了85%。

微小而致命的敵人

對世界上超過半數(shù)的人來說,蚊子遠不僅僅是一種滋擾:除了會引發(fā)皮膚瘙癢、敏感和失眠,它們也是瘧疾、登革熱等疾病的傳播媒介。以瘧疾為例,這是一種由瘧原蟲引起傳染病,當感染子孢子經(jīng)蚊蟲叮咬進入人體血液后,它們會在肝細胞內(nèi)進行裂體增殖,然后釋入血液感染紅細胞……借助蚊子強大的繁殖能力,2015年,全球已經(jīng)有2億多人新感染瘧疾,每年因此死亡的人數(shù)超過40萬!

瘧疾診斷的瓶頸

在諸多瘧疾診斷方法中,鏡檢法是許多醫(yī)院的支柱,它的具體流程是先把患者血液涂抹在載玻片上,用造影劑染色以區(qū)分血紅細胞內(nèi)的寄生蟲,然后經(jīng)專業(yè)訓練的臨床醫(yī)生再在100倍的顯微鏡下,從5000個細胞里一個個計數(shù)包含寄生蟲的血紅細胞數(shù)(WHO方案)。

厚血涂片制作流程

可以想象,手動計數(shù)5000個細胞絕對會是個緩慢的過程,這對醫(yī)療人員來說也是個沉重的負擔,尤其是在瘧疾爆發(fā)的地區(qū)。面對這種情況,Ariza認為圖像分析和機器學習會有很大的應用前景。

什么是F-beta

考慮到醫(yī)療領域?qū)z測準確率的嚴格要求,如果機器要自動化瘧疾診斷過程,它絕不能從看似不含寄生蟲的樣本中遺漏哪怕一個寄生蟲。為了降低誤診(假陰性)人數(shù),Ariza希望模型在輸出最終結果前,能重復進行三次檢查:如果第一遍沒發(fā)現(xiàn),每隔8小時再采集一份厚血涂片并計數(shù)細胞數(shù);如果三次都沒發(fā)現(xiàn)寄生蟲,則判定患者未受感染。

現(xiàn)在,這個任務就有了一個很直接的目標:減少假陰性。

事實上,假陰性不止能被作為降低誤診率的一個度量,它也能充當監(jiān)督機器的指標。試想一下,如果我們訓練了一個模型,它在實際進行圖像分析時準確率奇低,這時醫(yī)生就不得不需要抽更多時間來手動檢查機器預測結果。在機器學習領域,我們有一些能評估分類器分類性能優(yōu)劣的指標,這里我們先回顧兩個概念:

精確率(Precision):被分類器判定為正類的樣本中,真正屬于正類樣本的比例

召回率(Recall):被分類器正確判定為正類的樣本數(shù)占正類樣本總數(shù)的比例

精確率越高,召回率越低;反之,召回率越高,精確率越低。而平衡精確率和召回率的指標就是F-beta(Fβ)。這里β的取值意味著兩者在分類器性能評估中的相對重要性,在瘧疾診斷這個問題中,Ariza設β=2,即最小化假陰性的重要性是假陽性的2倍。

細胞開源數(shù)據(jù)

這個WebApp能成功的關鍵是Ariza幸運地找到了一個優(yōu)質(zhì)數(shù)據(jù)集,里面包含27,558幅經(jīng)醫(yī)學專家手動注釋的單細胞圖像,感染的/未感染的各占一半。這些細胞來自200名患者,每四名患者中有三名患有瘧疾。圖像都分割自顯微鏡視野原始圖像,而且都是手機拍攝,沒有用需要連接到顯微鏡的特制相機。

數(shù)據(jù)集地址:ceb.nlm.nih.gov/repositories/malaria-datasets/

可解釋的特征工程

有了任務目標,有了數(shù)據(jù)集,之后就是大家常常忽視的特征工程環(huán)節(jié)。提到構建圖像分類器,每一個學過機器學習的人都知道CNN是最好的。但是在實際應用中,構建模型的正確做法是先從一個簡單的模型開始,然后根據(jù)模型性能快速迭代。

所以Ariza首先做的是著眼于視覺上的顯著特征,用一個簡單模型測量特征與整體分類的相關性。

利用OpenCV API提取Blob特征:染色的寄生蟲為Blob

他設計了一系列能指示細胞顏色、面積、凸度和圓度的特征,還創(chuàng)建了一些用來確定寄生蟲是否在細胞中可見的特征。由于寄生蟲的顏色和細胞質(zhì)不一樣,這時它們可以被看作是圖像中的Blob。由于一個細胞內(nèi)可能有多個寄生蟲,每個細胞包含的Blob數(shù)可以被記入特征集。

所謂Blob,指的是圖像中的一組連接像素,它們共享一些共同屬性(例如灰度值)。OpenCV提供了一種檢測Blob的便捷方法,能按顏色、大小和形狀過濾我們想要的Blob類型,只需設置相應參數(shù)。

構建模型

完成特征工程后,Ariza保留了20%的數(shù)據(jù)用于測試,并對剩余的80%進行了3折交叉驗證。之后,他又比較了四個機器學習分類器,從中選了一個F2得分為0.8的隨機森林模型。

流程:從感染(藍)和未感染(橙)單細胞圖像中提取特征—訓練模型—比較模型—選擇

但這不是最終結果。之前我們提到了,CNN模型在圖像分類上的性能是最好的。Blob檢測雖然操作方便,但性能卻很一般,如下圖所示,它在細胞邊緣和周邊位置表現(xiàn)很差。再加有些寄生蟲可能沒有被造影劑徹底染色,這時它們和細胞的顏色差異微乎其微,會影響分類器的輸出結果。

被模型錯誤分類的感染細胞(假陰性),其中中間細胞的右下角有一個未被徹底染色的寄生蟲

此外,一些受感染的細胞在圖像上本身就難以表征。比如下面這幅圖,在人類專家眼里,左側這個細胞很可能被感染了,因為上面有很多奇怪的白色突起(藍圈),它們可能是感染細胞上才有的黏連結節(jié)(knob)。

但無論是不是黏連結節(jié),當前這個簡單分類器都難以提取這些指示寄生感染的微妙特征。于是Ariza放棄繼續(xù)手動添加特征,轉(zhuǎn)而用CNN生成特征。

讓事情變得更復雜

他選取的CNN是Inception v3。我們都知道,初始Inception v3已經(jīng)在ImageNet數(shù)據(jù)集上經(jīng)過訓練,能分辨什么是人,什么是狗,但它肯定沒法分類瘧疾感染細胞。為了進行重新設計,Ariza刪除了分類層,為每個圖像生成了2048個特征,之后又用PCA把特征降維到100個。在經(jīng)過3折交叉驗證訓練、測試和比較四種ML分類器后,他最后得到了一個F2得分為0.92的logistic regression分類器(L2正則)。這相比初代的隨機森林模型顯然是個巨大進步,而性能提升的關鍵就是用CNN做后端。

把CNN提取的圖像特征用于模型訓練

把模型變成WebApp

最后就是模型的部署——Ariza把它稱為“瘧疾英雄”。這個WebApp的潛在用戶是臨床醫(yī)生和患者,所以當他們上傳單個細胞圖像后,APP要返回每個細胞被歸類為感染或未感染的結果。我們可以用三個正則表達式從每個圖像中提取元數(shù)據(jù),包括患者ID號,然后將結果按患者分組并根據(jù)感染率分類。

“瘧疾英雄”界面

根據(jù)Ariza的個人體驗(在校期間培養(yǎng)干細胞時的數(shù)細胞經(jīng)驗),“瘧疾英雄”可以在診斷瘧疾時,為臨床醫(yī)生節(jié)省85%的診斷用時。這意味著按照朝九晚五的工作時長,每個醫(yī)生每月可以多接診1400名患者。

手動、自動速度對比

由于結果是根據(jù)感染率進行分類的,模型產(chǎn)生的結果也能幫助臨床醫(yī)生根據(jù)感染率對患者進行優(yōu)先排序,加快對病情加重的患者的治療。

考慮到瘧疾多發(fā)地都是經(jīng)濟欠發(fā)達區(qū)域,優(yōu)質(zhì)醫(yī)療資源非常受限,而“瘧疾英雄”使用的數(shù)據(jù)集圖像都是手機拍攝的,這個APP其實也為“移動問診”提供了可能性。只要臨床醫(yī)生能拍攝足夠清晰的單細胞圖像,他就能隨時隨地高效診斷。同時,一些新臨床醫(yī)生也能利用模型的結果,進一步提高自己的鏡檢水平。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8325

    瀏覽量

    132219
  • 數(shù)據(jù)集

    關注

    4

    文章

    1199

    瀏覽量

    24594
  • 圖像分析
    +關注

    關注

    0

    文章

    82

    瀏覽量

    18648

原文標題:瘧疾WebApp:用深度學習加快瘧疾診斷

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    機器學習能診斷病情,還能預測患者出院后的情況?

    行業(yè)應用AI也比較火熱,比如利用AI檢測癌癥、驅(qū)動新藥發(fā)現(xiàn)引擎、基因檢測等。而膿毒癥(Sepsis)是種醫(yī)療行業(yè)常見的并發(fā)癥,本文將使用機器學習預測膿毒癥患者的出院后情況。 膿毒癥是指因感染因素
    發(fā)表于 05-07 15:29

    醫(yī)療治病,人工智能解決什么問題?

    利用深度學習分析醫(yī)學圖像也是人工智能技術在醫(yī)療領域的重要應用之。在這方面英特爾已經(jīng)與業(yè)界合作伙伴合作,
    發(fā)表于 10-23 06:21

    利用電表診斷數(shù)據(jù)發(fā)揮部署AMI的全部潛能

    供出色的投資回報率。領先的電力公司在考慮部署新電表時需要考慮,在下代電表中增加電表內(nèi)診斷功能是否能提升其投資回報率。借助支持mSure的電表和ADI
    發(fā)表于 10-25 09:57

    三項顛覆性技術將改變牙科

    。新的先進技術改變了我們的日常生活,也使牙科發(fā)生了革命性變化。技術有可能自動化現(xiàn)有牙科治療決策工作流程,幫助牙醫(yī)做出精確診斷,也讓患者得到適當?shù)难揽谱o理。 以下是
    發(fā)表于 12-20 06:18

    利用符號模擬技術優(yōu)化錯誤診斷方法

    模型可以被擴展來定位多錯誤,并且可以用于解決時序電路的錯誤診斷。Shi-Yu Huang提出了利用符號模擬來優(yōu)化拜占庭式錯誤診斷的過程。Boppana介紹
    發(fā)表于 07-05 08:05

    如何利用CMOS圖像通道設計超聲診斷儀?

    1 引言隨著醫(yī)療診斷儀器小型化、便攜化的進程,高性能32位微處理器正在越來越多地應用于各類小型醫(yī)療影像設備中,但是如何利用這些微處理器傳送和處理實時圖像,卻是
    發(fā)表于 07-31 06:25

    如何利用RFID技術減少醫(yī)療差錯?

    患者從就診到得到治療需要經(jīng)過3步驟:醫(yī)生檢查患者得出初步診斷后開具醫(yī)囑,護士將醫(yī)囑轉(zhuǎn)抄到輸液或治療卡上并準備執(zhí)行,護士實施治療方案。這3
    發(fā)表于 08-07 07:16

    再見瘧疾!全球首款自動顯微瘧疾診斷設備面世

    Sight Diagnostics公司的龍頭產(chǎn)品Parasight平臺是全球首款自動顯微瘧疾診斷設備,選擇Trinamic的TMCM6110步進模塊來搭建Parasight平臺。
    的頭像 發(fā)表于 07-14 11:29 ?5346次閱讀

    類似折紙的傳感器能幫助烏干達農(nóng)村地區(qū)診斷瘧疾

    據(jù)外媒報道,近日種類似折紙的傳感器被用來幫助診斷烏干達的瘧疾。在烏干達的小學生測試組中進行測試后,其
    發(fā)表于 02-22 09:02 ?162次閱讀

    張紙能夠協(xié)助診斷世界疾病瘧疾

    在烏干達的小學生測試組中,張看起來像折紙樣的廉價紙條,卻能夠準確地檢測出正確率達到98%的瘧疾病例。雖然紙質(zhì)傳感器并不新鮮——最著名
    發(fā)表于 07-13 16:54 ?408次閱讀

    俄羅斯專家開發(fā)神經(jīng)網(wǎng)絡診斷系統(tǒng) 通過咳嗽聲實時判斷患者是否患有新冠

    1月19日消息 據(jù)俄媒 Vesti 報道,俄羅斯專家開發(fā)了種神經(jīng)網(wǎng)絡診斷系統(tǒng),能夠通過咳嗽聲實時判斷患者是否患有新冠肺炎。目前基于該
    的頭像 發(fā)表于 01-19 13:28 ?1699次閱讀

    科學家開發(fā)可診斷瘧疾的新型磁性技術

    據(jù)外媒報道,要確定一個是否患有瘧疾是很困難的,以至于許多甚至沒有患病的人最終都要接受治療。然而,種新的
    的頭像 發(fā)表于 02-19 11:30 ?1346次閱讀

    【世說芯品】Trinamic步進電機控制模塊助力抗擊瘧疾

    瘧疾是世界上最致命的傳染病之。這種疾病在亞洲、非洲和南美洲的熱帶地區(qū)十分常見,越早診斷,越能有效治療。標準瘧疾檢測需要由訓練有素的技術人員
    的頭像 發(fā)表于 06-28 11:21 ?308次閱讀
    【世說芯品】Trinamic步進電機控制模塊助力抗擊<b class='flag-5'>瘧疾</b>

    影像診斷技術包括哪些 影像診斷和影像技術的區(qū)別

    影像技術是用于獲取和生成醫(yī)學影像的各種技術和設備;而影像診斷利用醫(yī)學影像來診斷疾病、評估病情和指導治療的過程。影像
    發(fā)表于 07-21 15:11 ?3032次閱讀

    利用電表診斷數(shù)據(jù)發(fā)揮AMI部署的全部潛能

    電子發(fā)燒友網(wǎng)站提供《利用電表診斷數(shù)據(jù)發(fā)揮AMI部署的全部潛能.pdf》資料免費下載
    發(fā)表于 11-27 09:29 ?0次下載
    <b class='flag-5'>利用</b>電表<b class='flag-5'>診斷</b>數(shù)據(jù)發(fā)揮AMI<b class='flag-5'>部署</b>的全部潛能