深度學習:拆解健康密碼

Healthcare_3

早在 1880 年代,醫學界已使用內窺鏡和大腸鏡檢查人體內部情況,由專家分析醫療影像,但診斷有時會因人為錯誤和後台因素出錯。

隨全球城市人口增長,內科疾病個案數字急速上升,公眾對診斷專家的需求殷切,單在數量上培訓專家並不足夠。病理學家須長時間接受訓練、努力不懈,透過觀察顯微鏡和侵入性測試,方能辦別腫瘤組織。深度學習 (Deep Learning) 有助醫療觀測診斷的方法更上一層樓。

深度學習的底蘊

與一般機器學習 (Machine Learning) 相比,深度學習是更進一步模仿人類的思維方法。人類腦部神經元是相隔若干距離,仍然互相連結,迅速處理及傳遞訊息。人工神經網絡 (Artificial Neural Networks) 則利用層次組合、連結和方向,來傳遞數據。

每個人工神經網絡層,要負責不同工序。當數據由第一層出發,每層都進行一項工序,直到最後一層,數據就成為整個神經網絡輸出的洞見。在分析醫療影像的應用上,通常需要約100個這種神經網絡層,方能識別並分類來自數百萬圖像的特徵。

業界深知人工神經網絡在醫學應用上有巨大潛力,但要一部機器像人類一樣「思考」,須增加神經網絡的層數去處理數據,耗用龐大的運算資源。新的 IBM POWER Systems,為局面帶來轉機。最近,香港生產力促進局 (生產力局) 的汽車及電子部便引入有關系統,進行深度學習在醫學領域的研究。

POWER 推動機器學習

要使用數以十萬計醫療影像,去訓練一個人工神經網絡進行深度學習,工作一點不簡單,需要強大的影像處理組件、高容量記憶體,及穩定可靠的平台。

若使用區域性卷積神經網絡 (Regional Convolutional Neural Networks) ,處理不規則影像,每個影像會被分拆為數以千計的小區域,每區會產生數千項數據,讓系統計算它們之間是否相似。

若用非線性方法,拆解分析不規則的數據,需要強大的運算能力。尤其當病人性命攸關,更需要強大的系統,大幅縮短深度學習的訓練時間,由若干星期縮至若干小時內完成。

影像的處理同樣重要。生產力局的研究隊伍,使用大量人體異常組織的影像,例如已劃分區段的腺體組織影像,讓系統深度學習,判斷不同細胞的大小、形狀,及相對於其他細胞的位置,提高辨識能力。

今次使用的 IBM 平台,提供分散式系統,可同時支援多個圖形處理器 (GPU)。若有圖形處理器處於閒置狀態,資源可開放供機構其他同事使用,提高營運效益,讓他們同步處理多個不同項目。

平台穩定性十分重要,因為計劃目標是支援病理學家研究,不能在數據完整性、系統故障上帶來困擾。

加速架構致勝關鍵

生產力局所採用的 IBM S822LC 伺服器系統的高效能運算 (HPC) 平台由 IBM 開發,並運用了NVIDIA的 NVLink 圖像處理器 (GPU) 介面。

NVLink 技術在中央處理器 (CPU) 與圖形處理器之間,提供高頻寬、低延遲的連結,高容量頻寬是 PCIe 的2.5倍。四個 NVLink 圖形處理器,加上雙重 POWER8 中央處理器,為深度學習提供穩定可靠的平台。

這套尖端的深度學習系統經由 IBM Lab 部署安裝,讓生產力局研究隊伍採用更快的新方法,處理影像數據和深度學習,為協助香港醫療拆解健康密碼,邁出新的一步。

(英文原文)

jeff-hui-300

作者: IBM香港系統部總經理許旭煦

附加資料: IBM PowerAI 網頁

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s