Nature：為高維度醫(yī)學成像設計可臨床轉變的人工自動體系

發(fā)布日期：2022-03-20 作者：WLT 點擊：

編譯 | 王曄

編纂 | 青暮

本文來自于《 nature machine intelligence》。作家Rohan Shad是Hiesinger試驗室氣度內科系博士后研發(fā)員。他和隊伍為心血管成像（超聲心動圖和心臟 MRI）建立新式計算機視覺體系，以及應用轉錄組學和蛋白質設計研發(fā)心臟病的潛在體制，為嚴重心力衰竭患者設計設施。

文中討論了高維臨床影像信息所面對的特有戰(zhàn)斗，并注重了開發(fā)機械學習體系所牽扯的部分技巧和倫理方面的參考，更好地表現(xiàn)了影像形式的高維本質。另外，他們認定嘗試處理可闡明性、不確認性和成見的方式應被視為一切臨床機械學習體系的中心構成一些。

2018年，美國國度衛(wèi)生研發(fā)院確認將人工自動歸入醫(yī)學成像將來成長的重點行業(yè)，以及為圖片收集、算法、信息規(guī)范化和可轉變的臨床抉擇追隨體系的研發(fā)制訂了根基線路。

報表中提到，雖然信息的可用性、對新式計算架構的需要和可闡明的人工自動算法等在過去幾年已然獲得了較大的進展，但現(xiàn)在仍舊是一個要害性問題。

另外，在初期的開發(fā)流程中，還必需參考到信息同享的轉變目的、為監(jiān)管部門核準而進行的功能驗證、可推行性并且加重無意的成見等問題。

1 主題

算力的提升、深度學習架構和顧問標志信息集的進步刺激了醫(yī)學影像人工自動（AI）體系的成長。

但是，運用人工自動體系來幫助完結臨床任務是十分擁有戰(zhàn)斗性的。機械學習算法的目標是減小臨床推理所需的時間。而在臨床中進行運用，有也許無意中會耽誤患者的治愈。當分開可操控的試驗室場景時，人工自動體系的終端客戶必需可以操控填寫品質，以及可以處理網(wǎng)絡延緩等問題，設計出將這類體系調整到既定臨床實踐中的方式。

初期對可轉換的臨床機械學習的嘗試標明，設計的體系要在既定的臨床工作過程中常態(tài)工作，就必需要在算法開發(fā)之初就做出少量的調整積極。由于在將來布置該體系時，迭代的機會十分有限。

緊隨開源機械學習軟件庫的逐漸增加和計算機功能的不停進步，研發(fā)職員越來越較易開發(fā)出高難的對于特定臨床問題的人工自動體系。除了探測重病診療的特點外，下一代人工自動體系必需參考訓練信息的體系成見，更為直觀地提示終端客戶預判中固有的不確認性，并容許客戶可以開拓妥協(xié)釋預判的體制。

該觀念以這類要害的率先行業(yè)為根基，以加快醫(yī)學行業(yè)的根基人工自動研發(fā)。咱們概括了信息集的細微差異和高維醫(yī)學成像機械學習的詳細架構注重事項，同時研討了這類體系的可闡明性、不確認性和誤差。在此流程中，咱們?yōu)橛信d致處理建立臨床可翻譯 AI 體系，所帶來的部分問題和戰(zhàn)斗的研發(fā)職員供應了一個模板。

2 高維醫(yī)學影像信息

咱們估計，在可預感的將來，可用的高端量 "AI-ready "注釋的醫(yī)學信息集將仍舊不可滿足需要。回過頭來分派臨床事實標簽須要臨床顧問投入少量的時間，況且將多機構的信息匯總起來公然公布也存在較大的阻礙。除了須要以在硬放射學真正標簽上訓練的模型為特點的“診療人工自動”之外，還須要依據(jù)潛在的更高難的臨床綜合結果目的訓練的 "重病預判人工自動 "。擁有規(guī)范化的圖片收集協(xié)定和臨床根本事實判決的前瞻性信息采集，是建立擁有配對臨床結果的大范圍多核心成像信息集的必須方法。

大范圍的多核心成像信息聚會構成不少隱私和責任問題，這類問題與文件中嵌入的潛在敏感信息相關。醫(yī)學數(shù)字成像和通信（DICOM）規(guī)范廣泛被拿來捕捉、存儲和供應醫(yī)學圖片的工作過程治理。成像文件（以.dcm文件或嵌套文件夾構造的形態(tài)存儲）含蓋像素信息和有關元信息。眾多的開源和專有工具能夠輔助對 DICOM 文件進行去辨認化。后端醫(yī)院數(shù)據(jù)學框架，如Google Healthcare API，是一類革除也許含蓋敏感數(shù)據(jù)的元信息域的方式，也通過 "安全列表 "追隨DICOM去標記化。

在面向客戶方面，MIRC 臨床實驗解決器匿名器是一類盛行的代替方式，雖然它須要應用某類遺留軟件。有據(jù)可查的Python軟件包（如pydicom）也可用來在應用或轉給協(xié)作機構此前解決DICOM文件。接著能夠提煉成像信息并以各類機械可讀體例存儲。這類信息集能夠快速變得巨大且蠢笨，固然信息存儲體例的細節(jié)超越了本觀念的研討范疇，但醫(yī)學成像 AI 的一個要害參考原因是圖片辨別率的保留。

智能去辨認方式或腳本時常被提及的一個毛病是受庇護的健康數(shù)據(jù)有也許被 "刻錄 "在影像文件中。雖然有DICOM規(guī)范，但生產商的不同，促使難以通過 MIRC 臨床實驗解決器等工具來形成簡潔的規(guī)則，以屏蔽也許位于受庇護健康數(shù)據(jù)的領域。咱們倡議應用一個簡潔的機械學習體系來屏蔽 "燒錄 "的受庇護健康數(shù)據(jù)。

以超聲心動圖為例，有一個預約義的掃描領域，在那邊能夠看見心臟。其余潛在的選取是基于機械學習的光學字符辨認工具，以辨認和屏蔽有印刷文本的領域。DICOM標簽自身可用來提煉掃描級數(shù)據(jù)和特定形式的標簽。比如，在超聲心動圖和心臟磁共振成像 (MRI) 的狀況下，能夠輕盈地從 DICOM 元信息中提煉首要的掃描級別數(shù)據(jù)，比如收集幀速度和日期或 MRI 序列 (T1/T2)。

圖1：基于云的合作式注釋工作過程?；谠频墓ぞ呖捎脕硇纬深檰栕⑨屝畔⒓?，并通過安全連通與臨床顧問進行評價。圖為MD.ai的一個施行計劃，此中臨床顧問進行各類 2D 探測以測評心臟性能。

針對牽扯人工自動體系與臨床醫(yī)師進行側面基準測驗的研發(fā)工作，或在臨床注釋者的輔助下計劃大型信息集，咱們倡議以DICOM體例存儲掃描的副本。如此就能夠通過可擴展和易于應用的云端注釋工具進行布置?，F(xiàn)在有幾種處理計劃用來分派掃描信息供臨床顧問評價。需要的范疇也許從簡潔的掃描級標簽到全面的特定行業(yè)的解剖學分隔掩碼。在咱們的機構，咱們布置了MD.ai (New York, New York)，這是一個基于云的注釋體系，可原生解決存儲在機構核準的云存儲供應商（谷歌云存儲或亞馬遜 AWS）上的 DICOM 文件。代替品供應相似的性能，如ePadLite（Stanford, California），它能夠免費應用?；谠频淖⑨尫绞降牧硪粋€優(yōu)勢是，掃描能夠持續(xù)遠古的辨別率和品質，實時合作模仿 "基于隊伍 "的臨床抉擇，注釋和標簽能夠較容易地導出用來下游解析。最首要的是，此中不少工具都能夠用任意網(wǎng)絡瀏覽器近程訪問，以及極易操控，極大地提升了客戶感受并加重了臨床協(xié)作者的技巧包袱。

最終，較新的機械學習訓練范式，如聯(lián)邦學習，也許有助于規(guī)避不少與信息同享有關的阻礙。Kaissis等人檢查了聯(lián)邦學習的準則、安全危害和施行戰(zhàn)斗。這類方式的首要特征是在每個機構都訓練本地算法副本，唯獨同享的數(shù)據(jù)是神經網(wǎng)絡在訓練流程中學習到的特點。在預約的時間間隔內，從每個機構的算法中學到的數(shù)據(jù)（訓練的權重）被集中起來并從新分派，高效地從一個大型的多核心信息集中學習，而不須要傳輸或分享任意醫(yī)學成像信息。這有助于迅速訓練算法，從胸部計算機斷層掃描中探測COVID-19的特點。

雖然在醫(yī)學成像行業(yè)已然有了聯(lián)合學習的順利示范，而在將這類方式用來常規(guī)臨床應用時，仍舊存在少量技巧戰(zhàn)斗。特別是在高維成像機械學習體系的布景下，從多個參加核心傳輸和刷新訓練的權重而引入的網(wǎng)絡延緩，變成訓練更大神經網(wǎng)絡的根本速度限定方法。研發(fā)職員還必需保證訓練后的權重在參加機構之間的傳輸是安全和加密的，這進一步加大了網(wǎng)絡延緩。另外，在設計研發(fā)時，假設不可訪問源信息，計劃信息集的品質和一致性也許極具戰(zhàn)斗性。不少概念上相似的聯(lián)合學習框架仍舊假設對源信息有絕對水平的訪問。

3 計算架構

當代臨床機械學習中應用的神經網(wǎng)絡架構，首要來自于那些對于大型照片或視頻辨認任務28進行優(yōu)化的架構?？v然在細粒度分類的其余戰(zhàn)斗性任務中，這類架構也十分穩(wěn)健，此中類擁有玄妙的類內差別（狗的品類），而不是擁有高類間差別的顯著不同目標（飛機與狗）。通過對大型信息集（比如ImageNet）進行十足的預訓練，這類 "現(xiàn)成 "架構的功能優(yōu)于為其量身定做的細粒度分類器。此中不少架構可用來盛行的機械學習框架，如TensorFlow和Pytorch。最首要的是，這類框架往往為各類不同的神經網(wǎng)絡架構供應ImageNet預訓練權重，使研發(fā)職員可以快速將它們從新用來專門的醫(yī)學成像任務。

不幸的是，絕大多數(shù)的臨床成像方法都不是簡潔的靜態(tài) "圖片"。比如，超聲心動圖是一類心臟的二維（2D）超聲影像。這類 "視頻 "能夠從多個不同的視角拍攝，進而能夠對心臟進行更廣泛的評價。CT和MRI掃描能夠被認定是一堆二維圖片，必需按圖片次序進行解析，不然醫(yī)師有也許錯過器官之間沿某一軸線的有價值的聯(lián)系。

因而，這類 "成像 "形式更相似于視頻。將其成為圖片拆開解析，也許會造成空間或時間布景的遺失。比如，將視頻每一幀成為獨立的圖片進行解析解決，會造成每一幀視頻之間時間數(shù)據(jù)的遺失。在借用超聲心動圖、CT和MRI掃描的各類任務中，基于視頻的神經網(wǎng)絡算法比其 2D 算法有相當大的改善，但集成多個不同的視圖平面帶來了額外的維度，很難將其歸入當下框架。

與全面的基于圖片的預訓練網(wǎng)絡庫不同，對視頻算法的追隨仍舊有限。對布置新架構感興致的研發(fā)職員也許須要自身在大型公然的視頻信息集（如Kinetics和UCF101（中佛羅里達大學101--動作辨認信息集））上施行預訓練方法。另外，視頻網(wǎng)絡的訓練計算本錢也許要高幾個數(shù)目級。固然應用大型自然景物信息集進行預訓練是開發(fā)臨床成像機械學習體系的一個公認的方略，但不可確保功能的提高。對于預訓練的功能改善的報表很常見，特別是在應用較小的信息集時，但緊隨訓練信息集的加大，其優(yōu)勢會漸漸減小。

在2018年美國國度衛(wèi)生研發(fā)院的線路圖中，缺少特定于醫(yī)學成像的架構被認定是一項要害戰(zhàn)斗。咱們進一步衍生，提出訓練這類架構的方式，對這類體系將轉變?yōu)楝F(xiàn)實方面闡揚側重要功效。咱們認定，下一代的高維醫(yī)學成像AI 將須要對更充足、更有布景意思的目的進行訓練，而不是簡潔的分類標簽。

現(xiàn)在，大多數(shù)醫(yī)學成像 AI 體系專注于從常態(tài)布景下診療個別重病。典型的方式是在訓練這類算法時分派一個數(shù)字標簽（重病：1；常態(tài)：0）。這與臨床受訓職員學習從成像掃描中診療不同的重病的方法有較大不同。為了供應更多的 "醫(yī)學常識"，而不是簡潔地對自然圖片或視頻進行預訓練，Taleb等人提出了一系列應用大型無標簽醫(yī)學成像信息集的新式自我監(jiān)督預訓練技巧，旨在幫助開發(fā)基于3D醫(yī)學成像的人工自動體系。

神經網(wǎng)絡首先通過施行一組 "署理任務 "來學習 "描繪 "成為填寫的成像掃描。比如，通過讓網(wǎng)絡像拼圖同樣 "從新組合 "填寫的掃描信息，它們能夠被訓練成 "解讀 "在各類病理和心理狀況下哪類解剖構造是互相一致的。將成像掃描的信息與放射學報表配對是另一個有趣的方略，基于胸部X射線的人工自動體系獲得了相當大的順利。

本著供應更細微的臨床布景并將更多的 "常識 "嵌入神經網(wǎng)絡的精神，報表中的文本通過最超前的自然話語機械學習算法進行解決，隨后訓練視覺網(wǎng)絡，以更好地解讀讓各類重病 "不同"的原因。但是，最首要的是，他們標明應用這類方式能夠將特定下游分類任務的標志信息量減小多達兩個數(shù)目級。因而，未標志的成像研發(fā)，不管是單獨的還是結合成對的文本報表，都能夠成為有效預訓練的根基。隨后，對較小的高端量根基實況信息樣件進行微調，以完結特定的監(jiān)督學習任務。

雖然這類方法有助于調節(jié)現(xiàn)有的神經網(wǎng)絡架構，使其應用于醫(yī)學成像，但為特定任務設計新的架構須要專業(yè)常識。模型架構相似于大腦，而訓練后的權重（訓練中優(yōu)化的數(shù)學函數(shù)）相似于頭腦。進化搜刮算法的進展借用機械學習方式來發(fā)掘為特定任務訂制的新架構，進而構成比人類建立的架構更高效和更高功能的架構。這類都為成像形式特定架構的成長供應了一個獨到的契機。

訓練深度學習算法依附圖形解決單元（GPU）來施行大范圍的并行矩陣乘法運算。云計算 "隨用隨付 "的GPU資源和擁有高內存容量的消費級GPU的可用性，都有助于減低對開發(fā)醫(yī)學成像機械學習體系感興致的研發(fā)職員的準入門坎。雖然有了這類進展，而在大型視頻信息集上訓練高難的當代網(wǎng)絡架構須要多個GPU持續(xù)運作數(shù)周。

臨床研發(fā)小組理應注重，固然在相對廉價的計算機上訓練單一模型也許是可行的，但要搜到最好功能的準確設置組合，幾乎一直須要應用專門的設備和計算集群來在合理的時間范疇內返回結果。強力的抽象層（比如，Pytorch Lightning）還容許研發(fā)小組創(chuàng)建內部規(guī)范，以模塊化的形態(tài)建立其代碼。采取如此的模塊化方式，神經網(wǎng)絡架構和信息集能夠較容易地被更換，有助于迅速將過去為臨床成像形式設計的體系從新用來新的用例。這類方式也有助于通過以新的方法集成子組件來擴展這類體系的性能。

4 時間-事情解析和不確認性量化

緊隨醫(yī)療人工自動體系從 "診療 "轉向更多的 "預后 "運用，時間到事情的預判（而不是簡潔的二進制預判）將在臨床場景中發(fā)掘更多的有關性。時間-事情解析的特征是可以預判成為時間函數(shù)的事情幾率，而二分類器只可供應一個預約時間的預判。與二元分類器不同的是，時間-事情解析參考到了信息的刪減，以參考到那些得到隨訪或在觀測時間范疇內沒有歷經有關事情的人。生存解析在臨床研發(fā)中很常見，也是制訂循證明踐指南的中心。

用基于圖片和視頻的機械學習來擴展傳統(tǒng)的生存模型，能夠對組織切片或醫(yī)學成像掃描中的特點的預后價值供應強有力的洞察力。比如，將Cox比率損失函數(shù)的擴展調整到傳統(tǒng)的神經網(wǎng)絡架構中，促使僅從組織病理學切片中預判癌關鍵果變成也許。咱們不主張應用此類視覺網(wǎng)絡來劃定怎樣進行護理，而是主張將其用作標志臨床醫(yī)師漏掉早期惡性腫瘤特點的病例的方式。

歸入時間-事情解析在臨床大將越來越首要，由于在重病不安穩(wěn)或初期階段擁有的可探測特點，在絕對時間后也許會快速成長。

比如，可診療為黃斑變性的視網(wǎng)膜特點通常須要數(shù)年時間才能表現(xiàn)出去。擁有早期重病特點的患者也許會被標志為“常態(tài)”，這讓神經網(wǎng)絡企圖預判將來產生黃斑變性并發(fā)癥的危害。歸入生存和檢查的概念也許有助于訓練體系更好地將常態(tài)人與那些輕度、中度和正在迅速成長中的重病個人分隔。一樣，訓練視覺網(wǎng)絡進行時間-事情解析也許會在用來肺癌篩查，有助于依據(jù)預料的侵略性擴散后勁進行危害分層。這類轉變工作的要害是要有強力的、經過十足驗證的Cox回歸的深度學習擴展。在過去的幾年里，已然描繪了少量Cox模型的深度學習實行。Kvamme等人提出了一系列的Cox模型的比率和非比率擴展，過去還描繪了更多的生存方式的實行，如DeepSurv和DeepHit46（圖2）。

圖 2：量化機械學習流出中的不確認性。

正如 Sensoy 等人所描繪的那樣，縱然在不準確的狀況下，應用規(guī)范方式訓練的機械學習模型也能夠十分自大。左圖：當一個數(shù)字被轉動180°時，體系自大地分派了一個從 "1 "到 "7 "的標簽。右圖：但是，用參考分類不確認性的方式，體系會分派一個不確認性分數(shù)，能夠輔助提示臨床醫(yī)師潛在的錯誤預判。

但是，從可操控的角度來看，時間-事情預判也許存在問題。在肺癌篩查的如果示例中，胸部計算機斷層掃描中的可疑結節(jié)也許會構成一個預判，即在有或沒有恰當?shù)闹斡深A的狀況下的中位生存率。對臨床醫(yī)師來說，理解機械學習體系對個人病人的預判的有多大的掌控也許是較有意義的。當對一項任務沒有掌控時，人類通常會謹嚴行事。機械學習體系也反映了這一點，此中流出是 0 到 1 范疇內的“類型幾率”或“準確的也許性”。但是，現(xiàn)在文獻中描繪的大多數(shù)醫(yī)學影像機械學習體系，當供應給模型的填寫信息超越散布范疇時，缺少說 "我不知曉 "的隱含本領。比如，縱然填寫圖片是貓的圖片，訓練用來從計算機斷層掃描（比如）預判肺炎的分類器在設計上也被逼迫供應流出（肺炎或非肺炎）。

在他們對于深度學習中的不確認性量化的論文中，Sensoy等人用一系列的損失函數(shù)來處理這類問題，這類損失函數(shù)分派了一個 "不確認性分數(shù)"，以此來以免錯誤的、但有掌控的預判。在項目標轉變階段，當人工自動體系被布置在與人類客戶一塊工作的場景中時，不確認性量化的益處就顯現(xiàn)了。信念度量是AlphaFold2的一個要害原因，該蛋白質折疊機械學習體系在第14屆蛋白質構造預判要害評價（CASP14）戰(zhàn)斗中獲得了無與倫比的確切性，給DeepMind研發(fā)隊伍供應了一類方式來掂量他們理應對正在形成的預判賦予多大的信賴。不少不確認性量化方式的實行全是在許可的狀況下進行的，以及與常用的機械學習框架兼容。歸入不確認性量化也許有助于提升高危害的醫(yī)學成像機械學習體系的可闡明性和牢靠性，并減小智能化誤差的也許性。

5 可闡明性人工自動和損害危害

除了量化某類機械學習體系的預判成效外，針對建立這類體系的工程師和應用它們的臨床醫(yī)師來說，他們更感興致的是理解這類機械學習體系是怎樣得出論斷的。明顯性圖和類激活圖實際上仍舊是闡明機械學習算法怎樣進行預判的規(guī)范。

Adebayo等人較近的研發(fā)標明，只是依附明顯性圖的視覺外表也許會構成誤導，縱然乍一看它們與布景有關。在一系列全面的測驗中，他們發(fā)掘，不少盛行的形成過后明顯性圖的方式并沒有從模型權重中獲取真實的意思，而是與 "邊界探測器"（簡潔映照像素強度之間的刺耳過渡領域的算法）沒有差別。另外，縱然這類可視化方式見效，除了機械學習算法正在尋找的 "位子 "之外，也幾乎不能破譯。在許多示例中，不管是準確還是錯誤的明顯性圖看起來幾乎是同樣的。當 "抱病 "狀況和 "常態(tài) "狀況之間的差別須要關心圖片或視頻的同一領域時，這類毛病就愈加顯著了。

圖3：過后模型闡明的誤導性。

a, Adebayo等人用MNIST信息集的真正標簽訓練的模型（上）和隨機噪聲訓練的模型（下）進行的試驗。當通過大多數(shù)可視化方式進行評價時，在隨機噪聲上訓練的模型仍舊構成圓形外形。b，超聲心動圖視圖平面的探測：錯誤的分類（左上）和準確的分類（右上）都構成相似的明顯性圖（下）。

臨床醫(yī)師理應注重，僅靠熱圖不夠以闡明 AI 體系的性能。在嘗試用如上圖所示的可視化方式來辨認故障形式時，必需謹嚴。一個更精致的方式也許牽扯到持續(xù)遮擋測驗，即在有意袒護臨床醫(yī)師拿來進行診療或預判的領域后，評價圖片的功能。這個思想十分直觀：在已知對診療某種重病很首要的領域被掩蔽的圖片上運作算法，比如，在企圖診療心力衰竭時掩蔽左心室，理應能夠看見功能的急劇下落。

這有助于確定人工自動體系正在關心有關行業(yè)。特別是在高維醫(yī)學成像研發(fā)的布景下，激活圖也許為視頻類成像研發(fā)的某類時間階段的相對首要性供應獨到的看法。比如，某類重病也許在心臟緊縮時表現(xiàn)出病理特點，而針對其余重病也許須要人們關心心臟疏松時的狀況。往往如此的試驗也許標明，機械學習體系從臨床醫(yī)師傳統(tǒng)上不會應用的圖片領域中辨認出潛在的數(shù)據(jù)特點。除了采集對于這類機械學習體系怎樣構成其流出的數(shù)據(jù)外，嚴酷的可視化試驗也許供應一個獨到的機會，能夠從被評價的機械學習體系中學習生物學的看法。

另一方面，激活與臨床上已知的首要領域的誤差也許預示著網(wǎng)絡正在學習非特同性的特點，使它們不太也許較好地歸納到其余信息集。

機械學習體系學習的特點也許取決于架構的設計。更首要的是，機械學習體系會依據(jù)供應給它的訓練信息和目的來學習和持續(xù)體系性的不平等。緊隨醫(yī)療保健人工自動體系不停向將來的重病預判成長，必需愈加謹嚴地參考到這類群體在獲取醫(yī)療保健和結果方面的較大差別。

在較近的評論中，Chen等人深入概括了從問題選取到布置后階段的潛在誤差來歷。在這里，咱們重點研討機械學習體系開發(fā)初期的潛在處理計劃。部分人主張用部分方式來闡明當代機械學習體系的其余 "黑箱 "預判，而其余人則主張一開啟就限定應用更可闡明的模型。除了在訓練全部 AI 體系時結合構造化信息的填寫之外，旁邊方式還牽扯應用黑盒模型訓練醫(yī)學成像神經網(wǎng)絡。

這能夠通過創(chuàng)建 "交融網(wǎng)絡 "來實行，此中表格信息被歸并到基于圖片或視頻的神經網(wǎng)絡中，或其余擁有相近根本目的的更超前的方式（形成組合信息的低維表達的智能編碼器）?？v然沒有將人口統(tǒng)計學填寫歸入高維視覺網(wǎng)絡，研發(fā)小組通過較為不異性別、種族、地域和收益群體的表現(xiàn)來核驗他們的模型也很首要。

機械學習體系也許會無意中學會進一步持續(xù)和鄙視個別民族和有色人種，因而在模型開發(fā)流程的初期理解這類成見是至關首要的。對機械學習體系的信賴針對更全面的采取至關首要，正如開拓特定的特點或變量怎樣并且為什么會造成預判同樣，通過結合明顯性圖和預計特點首要性的模型無關的方式。

另一類方式是在訓練邏輯中限定機械學習算法，保證產生優(yōu)化方法以操控感興致的人口統(tǒng)計學變量。這種似于多變量回歸模型，此中感興致的危害原因的牽連能夠獨立于基線人口統(tǒng)計學變量來研發(fā)。從技巧角度看，這將牽扯到在訓練循環(huán)中插入一個額外的責罰性損失，并緊記與稍低的模型功能的潛在掂量。比如，F(xiàn)airlearn 是用來評價傳統(tǒng)機械學習模型公道性的盛行工具包，以及已然開發(fā)了基于 Fairlearn 算法 (FairTorch) 的束縛優(yōu)化，這是在訓練流程中調整誤差調節(jié)的有期望的開拓性嘗試。有不少開源工具包能夠輔助研發(fā)職員確認不同變量和填寫流（圖片預判，并且類似性別和種族等變量）的相對首要性。這類技巧也許容許開發(fā)更公道的機械學習體系，乃至能夠發(fā)掘沒有預期到的暗藏成見。

6 總結

雖然計算架構和獲得高端量信息是建立優(yōu)良模型的要害，但為高維成像形式開發(fā)可轉換的機械學習體系方面還須要積極，以更好地代表信息的 "視頻 "本質。另外還須要在模型開發(fā)的初期階段創(chuàng)建有助于處理成見、不確認性和可闡明性的性能。對醫(yī)學成像和人工自動的質疑是有益的，況且在大多數(shù)狀況下?lián)碛薪^對道理。

咱們期望，通過創(chuàng)建容許研發(fā)職員評價臨床表現(xiàn)、醫(yī)院工作過程中的調整、與臨床醫(yī)師的互動并且社會人口損害的下游危害的性能，能夠在改進人工自動的交付方面邁出有意思的措施。咱們期望研發(fā)職員會發(fā)掘這個觀念較有用，由于它概括了在臨床布置方面續(xù)等他們的潛在戰(zhàn)斗，以及在處理此中部分問題時能夠闡揚引導性意思。

GAIR 2021大會首日：18位Fellow的40年AI光陰，一場技巧前端的傳承與舌戰(zhàn)

2021-12-10

致敬傳說：華夏并行解決四十年，他們從無人區(qū)開拓走到計算的黃金世紀 | GAIR 2021

2021-12-09

時間的力量——1991 人工自動大申辯 30 周年齡念：主義不再，共融互生｜GAIR 2021

2021-12-12

將來已來，元宇宙比你設想中來得更早丨GAIR 2021

2021-12-12

新聞分類