清大哈佛跨國團隊發現 AI可辨分人種 且黑人醫學影像誤判率高 恐影響醫療不平等
記者曾芳蘭∕竹市報導
AI人工智慧竟發生種族歧視情形,新竹清華大學資工系助理教授郭柏志與麻省理工學院、哈佛大學跨國研究發現,當採用先進的AI深度學習演算法來判讀X光片及電腦斷層掃描時,電腦竟可以從這些醫學影像分辨出患者是黑人、白人或亞洲人,並影響判斷的準確率,科學家迄今還不明白AI是如何辦到的。
郭柏志指出,醫界近年大量引進人工智慧,研發醫療機器人、智慧診療、及醫學影像識別技術等,協助醫生更快速、準確地診斷,這本該是造福病患的好事;但這項研究也揭露其中的隱憂,提醒我們應該注意醫療倫理問題,並消弭引進人工智慧產生的醫療不平等現象。
這項橫跨4國的跨國研究團隊,還包括了史丹佛大學、多倫多大學等,與美國國家衛生院合作,分析超過20萬位病患的胸部、頸椎、手部X光及胸部電腦斷層掃描,揭露人工智慧也有歧視問題的驚人真相。這項研究成果最近登上了國際頂尖期刊《刺胳針數位健康》,並吸引外媒的重視報導。
美國食品藥物管理局(FDA)目前已核准醫院採用人工智慧輔助判讀X光片及電腦斷層掃描等醫學影像,準確率高達9成。
團隊中一名哈佛大學教授表示,當團隊成員告訴他AI可以從X光片來判斷人種,他簡直不敢置信,認為這真的太瘋狂,一定是哪裡出錯了。當愈來愈多的證據浮現,有團隊成員則直言感覺很「恐怖」。
郭柏志表示,團隊本來猜想AI可能是從骨質密度來判斷人種,因黑人的骨質密度高於白人,但後來發現並非如此。郭柏志出示1張手掌的X光片,顯示AI判讀人種的重點聚焦在中指與食指的第3指節,「團隊裡也有2、30年經驗的放射科醫師,但我們實在想不出來AI是怎麼判讀出人種的。」
更令研究團隊憂心的是,人工智慧的種族歧視也影響了醫學影像判讀的準確率。郭柏志表示,研究發現白人的醫學影像有問題卻沒被檢查出來的誤判率是1成7,但黑人的誤判率卻高達2成8,相差超過10個百分點。而醫學影像的誤判也會進一步影響急診、醫療給付等資源分配。
郭柏志說,我們原來以為人類才會歧視,電腦應該是最公平的,但沒想到電腦也默默地提取了人類沒教它的資訊,包括人種及性別等,「如何去除歧視,讓各族群的醫學影像判讀都有一致的準確率,是我們下一階段要努力的目標。」