Google 用 AI 檢測癌症,準確率 83% 超越人類

為了解決診斷時間有限和診斷結果不一致的問題, Google 研究室正在探索如何讓深度學習在數位病理學領域發揮作用,透過建立自動檢測演算法,在病理學家的工作中提供輔助。
評論
評論

原文作者為 Google 的技術主管 Martin Stumpe 和產品經理 Lily Peng,由 雷鋒網 AI 科技評論編譯,INSIDE 獲授權轉載。

為了解決診斷時間有限和診斷結果不一致的問題, Google 研究室正在探索如何讓深度學習在數位病理學領域發揮作用,透過建立自動檢測演算法,在病理學家的工作中提供輔助。

在檢查患者的生物組織樣品後, 病理學家的報告通常是許多疾病的黃金診斷標準。特別是對於癌症,病理學家的診斷對患者的治療具有深遠的影響。病理切片審查是一個非常複雜的任務,需要多年的培訓才能做好,豐富的專業知識和經驗也是必不可少的。

儘管都經過培訓,但不同病理學家對同一患者給出的診斷結果,可能存在實質性的差異,而這可能導致誤診。例如,在某些類型的乳腺癌診斷中,診斷結論一致性竟低至 48%,前列腺癌診斷的一致性也同樣很低。診斷缺乏一致性低並不少見,因為如果想做出準確的診斷,必須檢查大量的資訊。病理學家通常只負責審查一張切片上所有可見的生物組織。然而,每個患者可能有許多病理切片,假設以 40 倍的放大倍數進行數位化切片圖像,每個患者的圖像數據都超過 10 億個像素。想像一下,要遍歷 1 張 1 千萬像素的照片,並且必須對每個像素的判斷結果負責。不用說了,這裡有太多的數據需要檢查,而時間往往是有限的。

為了解決診斷時間有限和診斷結果不一致的問題,我們正在研究如何讓深度學習數位病理學領域發揮作用,透過建立一種自動檢測演算法,在病理學家的工作流程中提供輔助工具。 Google 研究室使用由 Radboud 大學醫學中心提供的圖像數據來訓練診斷演算法,這些圖片也在 2016 ISBI Camelyon Challenge 中使用,目前該演算法已被優化,用於定位出乳腺癌向乳房相鄰的淋巴結擴散。

在乳腺癌擴散定位任務中,使用現成的標準深度學習方法如 Inception(也稱為 GoogLeNet),表現也是相當不錯,雖然生成的腫瘤機率預測圖還是存在噪點。我們對這個訓練網路做了強化,包括用不同的放大倍數的圖片來訓練模型(非常像病理學家所做的),從訓練結果來看,我們有可能訓練出一個系統,它的能力可以相當於一個病理學家,甚至有可能超過病理學家的表現,並且它擁有無限的時間來檢查病理切片。

▲圖1 左圖是來自兩個淋巴結活檢的圖像,中圖是早期深度學習演算法檢測腫瘤的結果,右圖是我們目前的成果,注意第二個版本的可見雜訊(潛在誤判)已降低。
▲圖 1 左圖是來自兩個淋巴結活檢的圖像,中圖是早期深度學習演算法檢測腫瘤的結果,右圖是目前的成果,注意第二個版本的可見雜訊(潛在誤判)已降低。Photo credit: Google Reserch。

事實上,由該演算法產生的預測圖已經改善了很多,該演算法的定位得分(FROC)達到 89%,明顯超過沒有限時的病理學家表現,他們的得分僅為 73%。我們不是唯一一組認為這種方法是有希望的,其他組別的演算法模型在同一數據集中獲得了高達 81%的分數。對我們來說更令人興奮的是,我們的模型穩定性非常強,從不同的醫院使用不同的掃描儀獲得的圖像都可以識別。相關的詳細資訊,請參閱 Google 研究室的相關文章「在千兆像素病理圖像上檢測癌症轉移」。

▲圖2 淋巴結活檢的特寫鏡頭。組織包含乳腺癌轉移以及巨噬細胞,其看起來與腫瘤相似,但是是良性正常組織。Google 的演算法成功識別腫瘤區域(亮綠色),不會被巨噬細胞干擾。Photo credit: Google Research。
▲圖 2 淋巴結活檢的特寫鏡頭。組織包含乳腺癌轉移以及巨噬細胞,其看起來與腫瘤相似,但是是良性正常組織。Google 的演算法成功識別腫瘤區域(亮綠色),不會被巨噬細胞干擾。Photo credit: Google Research。

雖然這些結果看來振奮人心,但有幾個重要的注意事項需要考慮:

  • ·像大多數指標一樣,本地化的 FROC 分數並不是完美的。在這裡,FROC 分數定義是預設帶有少量假陽性的靈敏度,假陽性是指將正常組織錯判為腫瘤,靈敏度則是每個載玻片所檢測到腫瘤的百分比。但病理學家很少做假陽性的誤判,例如上述 73%的得分對應於 73%的靈敏度和零假陽性。相比之下,假設允許更多的假陽性個數,我們的演算法的靈敏度可以提升。如果每個載玻片允許有 8 個假陽性,我們的演算法的靈敏度可達到 92%。
  • 這些演算法在執行訓練過的任務時表現良好,但相比人類病理學家,還是缺少豐富的知識和經驗。人類病理學家可以檢測出模型還沒有訓練的異常分類,例如炎症過程、自身免疫疾病或其他類型的癌症。
  •  為了確保患者得到最佳的臨床結果,這些演算法需要成為病理學家的輔助工具,融入到他們的工作流程中。我們設想我們的演算法可以提高病理學家的診斷效率和診斷結果的一致性。例如,病理學家可以透過重點檢查最可能的腫瘤預測區域,以及每個載玻片多達 8 個假陽性區域,來降低其假陰性率,假陰性是指未檢出腫瘤的百分比。另外,這些演算法可以讓病理學家準確地測量腫瘤大小,這與腫瘤預測的結果相關。

訓練模型只是將有趣的研究轉化為真實產品的第一步。 從臨床驗證到監管批准,還有很多困難需要克服。但我們已經起了一個非常有希望的開頭,我們希望透過分享我們的工作,能夠加快這個領域的進步。


AWS For Data Web Day:5 / 25 免費線上研討會,帶領企業制定現代化數據戰略

AWS 將於 2022 年 5 月 25 日 下午 2:00~5:00 舉行線上研討會 AWS For Data Web Day,以「數據與分析」為本次活動主旨,幫助企業制定現代化數據戰略,除了精彩內容外,同時也邀請了 3 位知名產業經驗的客戶進行分享,讓您了解在產業實務上 AWS 如何協助企業進行轉型。
評論
評論

數位轉型是一段不斷學習與創新的過程。身為雲端服務龍頭,AWS 從過去到現在從未停止創新,且為了幫助企業客戶在數據為王的時代,能有效利用數據資料獲得深入洞察、搶得市場先機,AWS 將於 2022 年 5 月 25 日 下午 2:00~5:00 舉行線上研討會 AWS For Data Web Day,以「數據與分析」為本次活動主旨,幫助企業制定現代化數據戰略。

2022 年的關鍵任務:制定現代化數據戰略

在討論元宇宙拓荒、搶佔新興科技商機以前,企業是否已經紮穩腳步,建置完善的數據資料庫,建構業務創新的重要基礎?在邁向新時代的關鍵 2022 年,此刻最重要的任務之一,是制定現代化的數據戰略,幫助企業持續數位轉型。對此,AWS For Data Web Day 線上研討會內容,將包含 Amazon DynamoDB 的十年創新之旅,帶領參與者進行新功能重點探討,並且同步深入了解 AWS 現代化企業數據遷移實戰、現代化數據平台大戰略、數據創新與加速分析應用等。

除了詳細解說數據對您企業帶來的影響之外,也邀請到 AWS 實際企業客戶分享成功案例,加速了解如何運用數據與分析進行產業數位轉型。

如何透過 AWS 獲得成功?重量級客戶親自揭密

AWS For Data Web Day 線上研討會本次邀請了重量級來賓,成功企業包含全方位寵物管家 萬達寵物、大數據智能資料稽核與保護的專家 – Datiphy 以及企業數據資產整合專家 – eForce,以上三間知名企業,將親自講授他們是如何透過 AWS 獲得成功,並且在數位轉型上取得領先的地位。

本場研討會,在深入了解該如何提升數據分析的效能的同時,又能兼具成本效益高與安全性;適合對於如何靈活應用大數據、對數據分析有興趣、想要建構數據與分析基本功的所有受眾,例如:公司技術部門決策人、業務決策人、IT 主管及希望深入認識數據分析的任何人士。與會期間參與問答,還有機會抽中百元美食外送平台優惠券。

在 AWS For Data Web Day 中探討雲端數據資料庫的優勢與做法,包括:

  1. 20 萬多個資料湖在 AWS 上執行
  2. 使用 Amazon EMR 比標準 Apache Spark 快 3 倍
  3. 比其他雲端資料倉儲更實惠的價格效能達 3 倍
  4. 使用 Amazon OpenSearch Service 在單個叢集中儲存的資料量可達 3PB
  5. 節省 70% 資料湖中資料的儲存成本

AWS For Data Web Day 報名須知

  • 日期:2022 年 5 月 25 日(星期三)
  • 時間:2:00 PM~5:00 PM
  • 形式:線上研討會

建議在活動前免費註冊 AWS 帳號  ,新註冊戶可兌換精美好禮三合一數據線。若為首次參加線上研討會者,GoToWebinar 會自動偵測電腦配置,可在加入時自動安裝;若是使用手機登入此活動,則需安裝 GoToWebinar 手機應用程式。