近幾個月,在AI賦能未來醫療的思考特別多,受美國「WIRED連線」雜誌邀請撰寫了一篇專欄文章。我相信十幾年後,不少國家和地區的醫療體驗在AI賦能的作用下將發生根本性改變。
原文刊於「WIRED連線」雜誌英文官網:
Covid-19 Will Accelerate the AI Health Care Revolution
https://www.wired.com/story/covid-19-will-accelerate-ai-health-care-revolution/
中文翻譯來自創新工場微信公眾號 2020-5-22
新冠大流行將加速醫療AI革新
—————————————
2020年元旦前夜,一家位於加拿大多倫多市的人工智能(AI)企業BlueDot捕捉到一些異常:中國武漢市海鮮市場周邊出現多起罕見肺炎病例,BlueDot迅即反應,運用自然語言處理、機器學習等技術,結合大數據和定位追踪,迅速向合作的政府部門和公共衛生機構客戶傳送警報並報告擴散狀況。BlueDot所監測到的異狀,正是數月後撼動全球的新型冠狀病毒肺炎(Covid-19),這比世界衛生組織首度公開警示新冠病毒的時間還要早上9天。
BlueDot的AI平台示範了人工智能技術對重大疫情能起到早期預警的功用,過去幾個月裡,AI在這場全球抗疫戰的許多方面發揮了獨特作用:從疫情預測到篩檢,從接觸警示到快速診斷,從前線無人配送到實驗室藥物研發,人工智能助力防疫派上了不少用場,為特定場景應用賦能。
隨著疫情在全球蔓延,AI技術的創新應用也在各地相繼落地。在韓國,基於地理位置的信息傳遞已經成為控制病毒傳播的重要工具,當人們靠近確診病例時,就會收到基於位置的緊急信息提醒。在中國大陸,阿里巴巴推出的AI算法能夠在20秒內診斷出疑似病例(比人類檢測快了近60倍),準確率高達96%。無人配送車輛很快被投入到人類難以承受的場景,代替人類執行高傳染風險的運輸任務。湖北、廣東等省份的多家醫院相繼使用機器人為病人或被隔離家庭運送食物、藥品和物資。而在美國加州,電腦科學家正在研發能遠程檢測獨居老人健康情況的系統,一旦老人出現身體異常症狀,系統就會發出即時警報。
不過,目前人工智能在公共衛生體系的應用仍顯零散也未成體系。坦率說,過去四個月內,AI在抗疫之戰中的表現並不十分突出,我最多只能給它打分“B-”。新冠大流行暴露了我們的醫療系統的脆弱性:預警響應不充份、通報信息不精確、醫療物資分配不均、醫務人員超負疲憊、醫院病床緊繃、疫苗研發週期長等諸多痛點。當然,AI的零散表現也有客觀原因:醫療體系可說是現代社會各類運轉體系中最為複雜、陳舊不堪且難以變通的一種;且在新冠疫情襲來之前,我們並沒有真正意識到醫療體系問題的緊迫性,沒有提前採取相應的技術預防措施;最為關鍵的是,我們缺少建構AI解決方案所需的大數據。
把目光看向未來,我看到以下兩個AI賦能醫療的樂觀因素。
首先,作為AI燃料的醫療大數據已被激活。舉例來說,機器學習數據科學平台Kaggle組建了新冠病毒開放研究數據庫,名為CORD-19。它將相關數據進行彙編,並把最新研究集中收錄,匯總的格式可被機器讀取和解析,以便於AI進行機器學習。至今這個數據庫收錄了12.8萬篇包含Covid-19、冠狀病毒、SARS(非典型肺炎)、MERS(中東呼吸綜合症)等關聯術語的醫學專業學術文章。
其次,眼下全世界的醫學專家和電腦科學家都將精力集中在解決疫情問題。 X大獎基金會創始人彼得·戴曼迪斯(Peter Diamandis)估計,全球現在有多達兩億名的醫師、科學家、護士、技術專家和工程師投入防治冠狀病毒的相關研發中,他們正在進行數以萬計的實驗,並以「前所未有的透明度和速度」共享信息。
3月16日Kaggle發起「新冠病毒研究挑戰」,匯集與疫情相關的大量信息,包括病毒的自然歷史、傳播和診斷方法、以及從過往流行病學研究中汲取的經驗教訓,幫助全球各地衛生機構及時掌握最新情況,以做出基於數據的分析決策。該項目發布後的五天內被瀏覽超過50萬次,下載量逾1.8萬次。在大陸疫情爆發後不到一個月,阿里巴巴便推出了一種AI算法,該算法基於5000多個新冠肺炎確診病例進行訓練,並關聯到治療後續諸如肺部白色陰影縮小等的成效追踪。隨後,阿里巴巴將其云端AI平台向全球醫療專業人員開源,與合作夥伴聯手部署更大批量的匿名數據,推出包括疫情預測、CT影像分析、冠狀病毒基因組測序等模組。
據估計,現今全球醫療數據的規模每隔幾個月就翻一倍。 2019年一份覆蓋19個國家AI醫療市場的研究估計,AI醫療市場的年複合增長率為41.7%,從2018年的13億美元將增長至2025年的130億美元,主要分佈在六大領域:醫院工作流程、可穿戴設備、醫學影像和診斷、診療計劃、虛擬助手、以及最重要的藥物研發,新冠疫情期間浮現的種種需求,將加速AI賦能醫療的場景落地。
在後疫情時代,我期待AI將加速融入醫療體系,賦能並推動醫療改革。其中深度學習(Deep Learning),即以一種高效方法運算海量、多維數據的能力,是AI結合醫療最為可期的機遇之一。深度神經網絡(Deep Neural Networks)作為AI的一個子領域,已經被用於醫學掃描、病理切片、眼科檢查甚至結腸鏡檢查,以得出準確而快速的算法判讀。十幾年後,不少國家和地區的醫療體驗在AI賦能的作用下將發生根本性改變。
AI賦能醫療,首先能簡化及優化現有的醫療流程,例如醫院的作業流程,保險履約的繁複流程。將AI與RPA(Robotic Process Automation 機器人流程自動化)結合,可對某項工作流程進行智能拆解及優化,進而大大提高醫療系統的運營效率,預約看診、保險理賠及其他流程性工作都會得到效率提升。AI還能加快早期診斷信息的收錄並實現自動化,AI技術所能處理的文本、語言、數字的體量,無論在數量上還是精度上都是機器級別,遠非人類所及。
有了充份的醫療大數據作為基礎,AI還能為每個人或者每個群體建立健康數據基準量表。當我們掌握個體健康數據,就可以根據跟踪動態數據的波動變化,進行數據驅動的診斷,並對潛在大流行疾病的徵兆進行早期追踪研判。然而,再先進的技術系統要做到真正有效,勢必需要與既存的公共衛生警示和匯報機制形成高效鏈接,此類信息斷層即是新冠疫情在早期爆發期間存在的具體缺失。
再上一個層次的AI賦能體現在助力新藥研發、基因組測序、幹細胞、CRISPR(基因編輯)等醫學突破方面,AI模型和算法應用都有其用武之地。在製藥行業,研發一種新藥往往需要付出高昂的投入,某次成功前必有多次付諸流水的失敗試驗,也連帶消耗巨大的時間和金錢成本。現在,科學家們可使用AI機器學習來模擬上千個變量,測試它們的複合效應會對人類細胞反應產生何種影響,這類AI新藥研發的技術已被用於新冠病毒疫苗和其他療法。創新工場所投資總部位於香港的AI藥物研發公司Insilico Medicine是首批對新冠病毒快速響應的企業之一,這家公司利用生成式化學AI平台設計出新藥物小分子,以複製主要病毒蛋白為靶標,早在2月5日便公佈了這些小分子結構。 AI為新藥發明開闢了一個新時代,用人工智能技術來換取藥品研發週期的時間和成本,整個製藥行業勢將迎來翻天覆地的變革。
不久的將來,隨著醫療科學和電腦科學進一步融合,我們將進入一個全面自動化的AI時代,到時人們可以通過可穿戴設備、生物傳感器、智能家居檢測設備等來確保自身和家人的健康。可穿戴設備和其他物聯網設備的數據質量和多樣性大幅提高,將能產生一個有效的良性循環。穿越到未來,下一場疫情在大範圍蔓延之前就應該能夠被跟踪、追溯、攔截並消滅無踪。
或許再過15年,許多人的家裡都會有AI個人助理照料我們,幫著解決全家人的日常健康所需。機器人或者無人機負責把我們的藥品送上門,如果需要進行手術或者外科治療,通常會由機器人操作,或由機器人輔助人類外科醫師完成。在未來,醫生和護士將把更多的精力放在機器無法勝任的任務上,醫療專業人員及富有同情心的護理人員,將同時具備護士、醫療技師、社會工作者、甚至心理諮詢師的技能。他們會使用經AI強化的診斷工具和系統,但更多的時間會與患者溝通,安撫他們的傷痛,為他們提供情感扶持。在我的想像裡,15年後的醫療健康場景可能是這個樣子的:
***
2035年一個冬季早晨,我醒來後就覺得有點喉嚨痛。我起身去洗手間,刷牙的時候,洗手間的鏡子通過紅外傳感器測量了我的體溫。刷完牙後一分鐘,我的私人AI醫師助理發出了警報,顯示我的唾液樣本部分指數異常,並在輕微低燒。 AI醫師助理建議我在家進行指尖探針採血。我在泡咖啡時,醫師助理返回了分析結果,判斷我可能是得了這個季節正在流行的兩型流感其中一種。之後,我的AI醫師助理建議,如果我覺得有必要聯繫家庭醫生的話,有兩個時間空檔可以跟她視頻通話。通話之前,家庭醫生已經收到我所有症狀的詳細信息,她給我開了一種減充血劑和撲熱息痛,一會兒無人機就把藥品送到我家門口。
***
當然,凡涉及到患者的醫療記錄,就得談談隱私和數據保護的關鍵問題。我認為,任憑有用的數據各自孤島式的存在、不善加利用、不從中提煉有價值的信息、不用以推動社會進步,是相當不負責任的做法。技術產生的問題應該由技術解決。隨著AI技術浪潮而出現的諸如數據保護等問題,應該有更為創新的技術方法來應對。
好消息是,近年聯邦學習(也被稱為分佈式學習)已經在數據保護上取得了顯著的進展。基於聯邦學習技術,患者的數據將永遠不會離開所在的醫療機構、醫院或個人設備伺服器等原始存儲設備,機器學習模型將在獨立的數據庫基礎上進行訓練處理,再進行後續整合。聯邦學習、同態加密,結合可信硬體執行環境等技術,將進一步確保數據的計算、傳輸、存儲過程能夠適配不同的隱私偏好,以因應不同國家與文化對於隱私保護的需求差異。
這次新冠肺炎疫情還驗證了一個事實:整體人類命運是共同體,人們對未來運用AI等先進技術共度難關寄予一致的期盼。歷史上,國際合作曾消滅了全球延燒的天花,也幾乎根除了小兒麻痺症。公共衛生無國界,控制及消除流行病是個毋庸置疑的共同目標。在醫學領域,每個國家都能從他國的研究基礎上學習受益並攜手並進,全球化的數據科學,將進一步幫助人類獲取對健康和疾病最為深刻、最為全面的洞悉。
AI有潛力協助我們為下一次疾病大流行做更充份的準備。這需要醫學專家、AI科學家、投資者和決策者傾力協作,也需要關注醫療保健領域的投資人為聰明的創業者和科學家注入新一波動能。
經歷這次疫情,我們應清醒地意識到,要將人類醫療體系推往新的高度,著實需要傾盡全球之力。
創新工場董事長兼首席執行官
李開復博士
香港獨居老人數據 在 CUP 媒體 Facebook 的精選貼文
網絡幫拖計劃之三:善用網絡,打破政治困局(文:陳國榮)
網絡屢屢改變世界,歷史學家麥克尼爾父子所著《文明之網》一書將互聯網界定為人類第三次網絡交流,規模與影響空前至鉅,乃至今日世界在在可見網絡力量的形塑,遠有數年前的阿拉伯之春,近有台北市長大選。
選戰關鍵在於大數據
台北市長選舉,無黨籍柯文哲以八十二萬票告捷,不少分析指出,國民黨連勝文之所以慘敗,原因之一是傳統拉票方法落伍,對年輕一代效果不彰,不敵柯營的網絡動員模式。有一例子極具象徵意義:連勝文不喜選舉廣告被惡搞,決定只在電視宣傳,影片不放網上。此舉自曝連營對網絡運作毫無認識,漠視新世代的溝通媒介,等於放棄年輕人的選票;相反,柯營一反台灣選舉傳統,競選初期已聲明不以插旗宣傳(雖然市議會在選戰前通過禁止懸掛選舉旗幟),主打網絡,「線上捐款、理念傳播、活動募集,這都是一場網路主導的選戰。」柯文哲的當選如何「見證了網路世代的強大」?其一例子是「QSearch」──有謂「臉書最強大的中文搜尋引擎」。
QSearch 分析 facebook 大數據,據此製訂柯營的選戰策略,例如柯文哲受「MG149 案」(台大醫院外科病院涉貪指控)所苦,當時網上近六成就柯文哲的討論都與此有關,Qsearch 又從數據分析發現,柯文哲受歡迎的關鍵字乃「公開、透明、開放」,柯營於是改變冷處理的方針,開記者會回應事件,反擊之後,網絡上質疑柯文哲做法不當的聲音大跌七成(詳述見〈揭密柯文哲股份公司〉一文)。連營亦有社交媒體宣傳機器,不足之處,就在於以網絡 2.0(個人平台)硬撼網絡 3.0(大數據),資源用不得其所,宣傳淪為單向廣告,再次顯示出連營與時代脫節──奧巴馬於一二年競逐連任時就借助大數據以決定策略,包括調整電視廣告對象、梳理出「可說服度」排名的催票名單、根據目標選民的資訊統計以製訂廣告播放時間、追蹤催票選民聚集之處繼而在 Reddit(相當於高登論壇)與選民交流、甚至分析出女星 Sarah Jessica Parker 是最受歡迎的晚餐投標的對象。奧巴馬競選團隊的資料分析部門比以前擴充五倍,可見大數據於選舉之重要,需求甚殷。
走入議會的鍵盤戰士
就政治用途而言,與其爭論網絡 2.0 與 3.0 孰優孰劣,不如說各有司職。大數據用於統計及分析趨勢,適合選舉遊說,由上而下,因勢利導,屬於政治營銷策略;至於追求平等交流、團結理念的政治組織,似乎還須乞靈於互動網絡平台。成功例子有西班牙新興政黨 Podemos。
Podemos 以網上平台「圈子」(circle)為基地,成員在其網上論壇 Virtual Agora 討論,在應用程式上投票,最後決議(至今已決議逾四萬個議題),務求平等參與、組織透明、有大台而無騎劫。今日 Podemos 已有逾二十萬會員,位居西班牙第三大黨,去年更在歐洲議會奪下一成議席,聲勢日壯(詳述見明報〈參照西班牙政治超新星 Podemos〉)。
香港大可借鑑上述網絡運用的各種模式。雨傘運動清場之後,不應任由民氣潰散,反要重新凝聚同道中人,臉書也好論壇也好,發自網絡而不限於網絡,務求在現實發揮政治影響,其一方法,就是參照 Podemos 模式,成立「高登黨」(舉例),團結共同訴求,汲取運動經驗,盡力達致高效民主(以民主方式運作的大台),繼而參選區會和立會,比起佔路,此舉不致引起反感。網絡平台交流有其世代限制,較難爭取中老年選民支持,高登黨不妨利用前文介紹的網絡集資平台,提交社區民生方案並開放募捐,例如「組團探訪獨居老人」、「捐贈物資予有需要長者」、「維港反維穩騷」、「天氣咁凍,我想請北角公公婆婆食蛇宴」等等,絕對有助開拓選民基礎。及至選舉,則以數據分析為策略依歸,經費照樣網上募捐。以雨傘運動的動員規模加上政黨效應推算,高登黨大有可為。
網絡的出現,一方面拉低了種種門檻,一方面開啟了諸多可能,譬如成立政黨,善用網絡便是開源節流,而網絡潛能耗之不竭,影響無遠弗屆,鍵盤戰士加上一點行動力,也許就可以改變一個社會。
(文見 CLIP#36 專題故事「網絡幫拖計劃」)
網絡幫拖計劃之三:善用網絡,打破政治困局(文:陳國榮)
網絡屢屢改變世界,歷史學家麥克尼爾父子所著《文明之網》一書將互聯網界定為人類第三次網絡交流,規模與影響空前至鉅,乃至今日世界在在可見網絡力量的形塑,遠有數年前的阿拉伯之春,近有台北市長大選。
選戰關鍵在於大數據
台北市長選舉,無黨籍柯文哲以八十二萬票告捷,不少分析指出,國民黨連勝文之所以慘敗,原因之一是傳統拉票方法落伍,對年輕一代效果不彰,不敵柯營的網絡動員模式。有一例子極具象徵意義:連勝文不喜選舉廣告被惡搞,決定只在電視宣傳,影片不放網上。此舉自曝連營對網絡運作毫無認識,漠視新世代的溝通媒介,等於放棄年輕人的選票;相反,柯營一反台灣選舉傳統,競選初期已聲明不以插旗宣傳(雖然市議會在選戰前通過禁止懸掛選舉旗幟),主打網絡,「線上捐款、理念傳播、活動募集,這都是一場網路主導的選戰。」柯文哲的當選如何「見證了網路世代的強大」?其一例子是「QSearch」──有謂「臉書最強大的中文搜尋引擎」。
QSearch 分析 facebook 大數據,據此製訂柯營的選戰策略,例如柯文哲受「MG149 案」(台大醫院外科病院涉貪指控)所苦,當時網上近六成就柯文哲的討論都與此有關,Qsearch 又從數據分析發現,柯文哲受歡迎的關鍵字乃「公開、透明、開放」,柯營於是改變冷處理的方針,開記者會回應事件,反擊之後,網絡上質疑柯文哲做法不當的聲音大跌七成(詳述見〈揭密柯文哲股份公司〉一文)。連營亦有社交媒體宣傳機器,不足之處,就在於以網絡 2.0(個人平台)硬撼網絡 3.0(大數據),資源用不得其所,宣傳淪為單向廣告,再次顯示出連營與時代脫節──奧巴馬於一二年競逐連任時就借助大數據以決定策略,包括調整電視廣告對象、梳理出「可說服度」排名的催票名單、根據目標選民的資訊統計以製訂廣告播放時間、追蹤催票選民聚集之處繼而在 Reddit(相當於高登論壇)與選民交流、甚至分析出女星 Sarah Jessica Parker 是最受歡迎的晚餐投標的對象。奧巴馬競選團隊的資料分析部門比以前擴充五倍,可見大數據於選舉之重要,需求甚殷。
走入議會的鍵盤戰士
就政治用途而言,與其爭論網絡 2.0 與 3.0 孰優孰劣,不如說各有司職。大數據用於統計及分析趨勢,適合選舉遊說,由上而下,因勢利導,屬於政治營銷策略;至於追求平等交流、團結理念的政治組織,似乎還須乞靈於互動網絡平台。成功例子有西班牙新興政黨 Podemos。
Podemos 以網上平台「圈子」(circle)為基地,成員在其網上論壇 Virtual Agora 討論,在應用程式上投票,最後決議(至今已決議逾四萬個議題),務求平等參與、組織透明、有大台而無騎劫。今日 Podemos 已有逾二十萬會員,位居西班牙第三大黨,去年更在歐洲議會奪下一成議席,聲勢日壯(詳述見明報〈參照西班牙政治超新星 Podemos〉)。
香港大可借鑑上述網絡運用的各種模式。雨傘運動清場之後,不應任由民氣潰散,反要重新凝聚同道中人,臉書也好論壇也好,發自網絡而不限於網絡,務求在現實發揮政治影響,其一方法,就是參照 Podemos 模式,成立「高登黨」(舉例),團結共同訴求,汲取運動經驗,盡力達致高效民主(以民主方式運作的大台),繼而參選區會和立會,比起佔路,此舉不致引起反感。網絡平台交流有其世代限制,較難爭取中老年選民支持,高登黨不妨利用前文介紹的網絡集資平台,提交社區民生方案並開放募捐,例如「組團探訪獨居老人」、「捐贈物資予有需要長者」、「維港反維穩騷」、「天氣咁凍,我想請北角公公婆婆食蛇宴」等等,絕對有助開拓選民基礎。及至選舉,則以數據分析為策略依歸,經費照樣網上募捐。以雨傘運動的動員規模加上政黨效應推算,高登黨大有可為。
網絡的出現,一方面拉低了種種門檻,一方面開啟了諸多可能,譬如成立政黨,善用網絡便是開源節流,而網絡潛能耗之不竭,影響無遠弗屆,鍵盤戰士加上一點行動力,也許就可以改變一個社會。
(文見 clip#36 專題故事「網絡幫拖計劃」)