臨床預測模型這么火，它到底是什么？!

發(fā)布日期：2022-03-10 作者：WLT 點擊：

臨床預測模型既重要又復雜。

近年來，臨床預測模型在診療決策、患者預后管理和公共衛(wèi)生資源配置中的應用越來越重要，但臨床預測模型的建立是一項復雜的系統(tǒng)工程。本文回顧了相關的權威研究，總結了建立臨床預測模型的全過程，介紹了相關概念和重要原則。

建立臨床預測模型的五個階段

在個性化的醫(yī)學時代，對流行病或意外疾病的結果(診斷)或未來疾病進展(預后)的預測對于醫(yī)護人員的患者管理變得更加重要。臨床預測模型用于研究特定條件下患者未來或未知結局(終點)與基線健康狀態(tài)(起點)之間的關系。它通常結合多個參數(shù)來幫助醫(yī)生洞察模型中每個預測因子的相對影響。

該模型需要準確預測特定事件，并且相對簡單易用。一方面，如果預測模型對未來事件的估計不準確，會誤導醫(yī)療專業(yè)人士；另一方面，如果模型具有較高的可預測性，但難以應用(例如，計算復雜或不熟悉的問題/項目或單元)，耗時、成本高或相關性低(例如，對所有患者進行無差別篩查)，則不會在臨床上廣泛應用。因此，可預測性和可操作性之間的平衡是建立良好臨床預測模型的關鍵。

目前，雖然對預測模型的理想構建方法還沒有達成共識，但臨床研究領域的許多專家提出了許多方法來提高模型開發(fā)的質量和影響力?；谇叭说难芯砍晒?，本文將建立臨床預測模型的全過程歸納為五個主要階段:

建立臨床預測模型的五個階段

一個

第一階段:界定研究問題。

從統(tǒng)計技術的角度來看，臨床預測模型是臨床研究中比較先進的研究類型，但并不是所有的問題都適合用臨床預測模型來回答。例如，干預/暴露措施的效果估計和比較適合用傳統(tǒng)的統(tǒng)計假設檢驗或校正模型來回答，如T檢驗/方差分析、卡方檢驗和對數(shù)秩檢驗。臨床預測模型適用于回答與疾病的診斷或預后相關的問題，特別是如何通過預測因素的組合來準確估計疾病或事件發(fā)生的概率。臨床預測模型的本質是利用臨床數(shù)據(jù)集建立一個多元的、高精度的、有意義的預測模型。首先，我們需要明確幾個重要的研究問題:1)靶疾病領域的靶結果是什么？如糖尿病和心血管疾?。荒撤N并發(fā)癥，死亡。2)目標患者是誰？例如普通人群、65歲以上的老年人或二型糖尿病患者。3)預測模型的目標用戶是誰？例如疾病領域的其他醫(yī)生、健康相關組織、處于疾病風險中的群體和關注疾病的其他群體。根據(jù)以上問題的回答，結合患者選擇的目標區(qū)域和相關區(qū)域的數(shù)據(jù)集，目標用戶的類別將決定指標的選擇和處理過程，從而影響臨床預測模型的專業(yè)性和復雜性。

預測模型適用的問題類型。

第二階段:選擇數(shù)據(jù)集。

在融合的過程中，醫(yī)學教學、科研、管理的應用需要人才的聚集和產業(yè)生態(tài)的建立。自2013年成立以來，國內已有近百家領先的醫(yī)療研究機構(150強)和政府機構與醫(yī)療人工智能公司醫(yī)療都勻展開合作。醫(yī)學都勻在發(fā)展中，憑借其戰(zhàn)略國際化和文化多樣性，吸引了專業(yè)領域的世界知名科學家和人才。整合了跨越10余年的醫(yī)學信息進行醫(yī)院處理和整合，覆蓋40余種重大疾病，創(chuàng)建了3000余個?？萍膊∧Ｐ?，自主研發(fā)了醫(yī)學數(shù)據(jù)智能平臺。數(shù)據(jù)集是臨床預測模型最重要的組成部分之一。在現(xiàn)實中，需要搜索最合適的數(shù)據(jù)集并充分利用它。通常，您也可以選擇使用專業(yè)的臨床數(shù)據(jù)源輔助和管理工具來整理和建立包含研究終點和所有關鍵預測指標的主數(shù)據(jù)集。研究人員可以根據(jù)預測模型的目的，使用不同的方法提取不同的子數(shù)據(jù)集。不同的臨床預測模型問題適合用不同的研究設計數(shù)據(jù)來回答。對于診斷問題來說，預測因素和結果都在同一時間或短時間內，因此使用橫截面數(shù)據(jù)建立診斷模型是合適的。對于預后問題，預測因子和結果之間存在縱向時間邏輯，適合用隊列研究數(shù)據(jù)擬合預后模型。隨機臨床試驗可視為更嚴謹?shù)那罢靶躁犃?，因此也可用于建立預后模型，但外推法有限。不同類型的臨床預測模型的特征如下表所示:

不同預測模型的特點及數(shù)據(jù)選擇

對于數(shù)據(jù)集中樣本容量的最低要求，沒有絕對的共識。一般來說，較大且較新的數(shù)據(jù)集能更好地反映目標群體的特征，增強模型的相關性、可重復性和普及性，是建模的理想選擇。為了客觀地驗證建模結果，通常需要將研究數(shù)據(jù)分為訓練數(shù)據(jù)集和驗證數(shù)據(jù)集兩部分。根據(jù)研究者的具體目標，分割率可能有所不同，但一般來說，更多的研究對象應該被分配到開發(fā)數(shù)據(jù)集，而不是驗證數(shù)據(jù)集。臨床預測模型首先通過算法從訓練集中提取規(guī)則，其預測性能要根據(jù)驗證集在不同的組中進行評估。為了確定模型的可擴展性和健壯性，可以根據(jù)數(shù)據(jù)集格式，盡可能使用來自外部研究組或隊列的測試數(shù)據(jù)集進行外部驗證。

醫(yī)療大數(shù)據(jù)成為預測模型數(shù)據(jù)集的重要選擇。

三

第三階段:處理特征變量。

首先，需要對確定的數(shù)據(jù)集進行基本的清洗，包括檢查數(shù)據(jù)一致性、處理無效值和錯誤值等。因為數(shù)據(jù)集通常包含比最終預測模型中使用的變量更多的變量，所以在建立模型之前，需要評估和選擇最可預測和最敏感的預測因子。一般來說，特征變量的評價主要有三個方面:1。要求檢查員處理丟失的數(shù)據(jù)。在大多數(shù)數(shù)據(jù)分析中，數(shù)據(jù)缺失是一個長期的問題，丟失的原因各不相同，包括不收集、不可用或不適用、被調查者拒絕，或者“不知道”。為了解決這個問題，研究人員可以考慮使用插值技術將答案分為“是”和“其他”，或者允許“未知”作為單獨的類別，以盡可能提高數(shù)據(jù)填充率。

2.需要專家對之前發(fā)現(xiàn)的顯著預測因子進行判斷，通常應將其作為候選變量，如糖尿病風險評分中的糖尿病家族史。應該注意的是，并非所有重要的預測因素都需要包括在最終模型中，例如P

3.要求數(shù)據(jù)科學家對變量編碼分類變量和連續(xù)變量有不同的處理方法。對于分類變量，我們可以根據(jù)臨床實際意義和數(shù)據(jù)特點，對類別進行組合或重新分類。比如，在基本的人口特征中，教育程度往往分為小學、初中、高中、大專、本科、研究生、博士等。根據(jù)分析和以往研究的需要，高中畢業(yè)與否可能是一個重要的分界點，可以重新劃分為小學、中學、本科及以上。這樣可以相對平衡其他人的數(shù)量，避免過度細分。連續(xù)變量的相對影響由模型中使用的測量尺度決定。例如，空腹血糖水平對心血管疾病風險的影響可以解釋為，每10 mg/dl通常比每1 mg/dl對結果的影響更大。在對特征變量進行求值和處理后，由于不同的算法需要不同的數(shù)據(jù)類型，所以需要對數(shù)據(jù)和算法進行適配。通常情況下，連續(xù)變量通常比分類變量承載更豐富、更準確的信息，但同時也可能增加模型的復雜性和難度或者外行人難以理解。研究者可以通過觀察建模過程中的一些預測因素，進一步調整變量類型，從而優(yōu)化模型。

加工特征變量的工作比例

四

第四階段:預測模型的建立。

雖然在選擇預測目標變量和確定預測模型方面沒有全行業(yè)一致的指南，但我們可以借鑒統(tǒng)計分析的概念。根據(jù)預期用途，將問題求解方法定義為分類預測模型、線性預測模型和風險預測模型。建立臨床預測模型的幾點建議:

所有的候選變量都包含在模型中，一些不重要的候選變量可以通過逆向淘汰或逐步選擇的方法去除。包含所有候選變量可以避免過度擬合和選擇偏差。模型的擬合程度可以通過參考赤池信息準則(AIC)和貝葉斯信息準則(BIC)來檢查。AIC是模型擬合的一個指標。通常，AIC值越低，模型擬合越好。有人認為AIC涉及解釋，而BIC涉及預測，其中BIC可視為貝葉斯算法的相應指標。如果研究人員對高級算法比較熟悉，可以考慮用機器學習算法進行模型擬合。根據(jù)響應變量(因變量Y)的類型，可以分配不同的建模算法。類似研究中常用的算法如下。

常見算法和特征

五

第五階段:模型評估與驗證(內部/外部)模型生成后，研究人員應使用獨立的測試數(shù)據(jù)集來評估其提出的模型的預測能力。不同類型的問題有不同的評價指標，可以反映模型不同方面的特點。下面分別列出分類問題和回歸問題的評價指標。在實際的建模工作中，還需要了解各個指標的含義，并對這些指標進行合理的解讀。

分類問題中的指標

回歸問題中的指標

預測模型的驗證及應用方向

由于模型開發(fā)的復雜性，咨詢數(shù)據(jù)科學家和統(tǒng)計專家可以提高預測模型研究的有效性和整體質量。在開發(fā)模型之后，在使用模型之前，我們應該使用盡可能多的外部數(shù)據(jù)集，并有效地傳播給相關方。臨床預測模型的應用場景不限于醫(yī)療機構?；谥袊壳暗那闆r，Web或智能移動應用程序可以更好地成為向公眾宣傳和普及預測模型的重要渠道。希望本文的內容能夠幫助醫(yī)生和研究人員對臨床預測模型有一個初步的了解，并能夠支持實際的科學研究。在未來的推文中，我們將詳細介紹預測模型中使用的回歸方法和算法的主題。

參考文獻:moonskg，Royston P，Vergouwe Y，格羅布·比德，奧特曼DG。預后和預后研究:什么、為什么和如何？BMJ 2009；338:b375。Hemingway H，Croft P，Perel P，Hayden JA，Abrams K，Timmis A，等。預后研究策略(進展)1:研究臨床結果的框架。BMJ青奧會；346:e5595。Greenland S .對成本效益預測重新定位的需要:對M. J. Pencina等人的“評估一種新標記物從ROC曲線下面積到重新分類及以后的額外預測能力”的評論，醫(yī)學統(tǒng)計學(DOI: 10.1002/sim.2929)。統(tǒng)計醫(yī)學2008；27:199-206.格里芬SJ，小PS，黑爾斯CN，金月AL，韋勒姆新澤西州。糖尿病風險評分:全科醫(yī)療中二型糖尿病的早期檢測。糖尿病代謝研究2000年修訂版；16:164- 71.小戈夫·DC、勞埃德·瓊斯、貝內特·G、科亞迪·S、達戈斯蒂諾·RB、吉本斯·R等，2013年美國心臟病學會/美國心臟協(xié)會心血管風險評估指南:美國心臟病學會/美國心臟協(xié)會實踐指南工作組報告。循環(huán)2014；129 (25補編第2號):S49-73。邁向更好的臨床預測模型:發(fā)展的七個步驟和驗證的ABCD。歐洲心臟雜志2014；35:1925-31.我們驗證一個預后模型意味著什么？統(tǒng)計醫(yī)學2000；19:453-73.斯特耶伯格。臨床預測模型:開發(fā)、驗證和更新的實用方法。紐約:斯普林格；2009.Steyerberg EW，Moons KG，van der Windt DA，Hayden JA，Perel P，Schroter S，等。預測研究策略(進展)3:預測模型研究。PLoS Med 201310:e1001381。柯林斯GS，賴茨馬JB，奧特曼DG，月亮KG。個體預后或診斷多變量預測模型的透明報告(TRIPOD):TRIPOD聲明。Ann實習生Med 2015162:55-63.李YH，邦H，樸YM，Bae JC，李BW，康ES，等。非酒精性脂肪性肝病的非實驗室自我評估篩查評分:發(fā)展，驗證和與其他評分的比較。PLoS One 20149:e107584。Bang H，Edwards AM，Bomback AS，Ballantyne CM，Brillon D，Callahan MA，等。糖尿病風險患者自我評估評分的開發(fā)和驗證。Ann實習生Med 2009151:775-83.Kotronen A，Peltonen M，Hakkarainen A，Sevastianova K，Bergholm R，Johansson LM，等.利用代謝和遺傳因素預測非酒精性脂肪性肝病和肝臟脂肪.胃腸病學2009；137:865-72.回歸建模策略:應用于線性模型、邏輯回歸和生存分析。紐約:斯普林格；2001.主要血管手術后心臟事件的預測因素:臨床特征、多巴酚丁胺超聲心動圖和β-受體阻滯劑治療的作用JAMA 2001285:1865-73.解釋還是預測？統(tǒng)計科學2010年:289-310。Heikes KE，Eddy DM，Arondekar B，Schlessinger L .糖尿病風險計算器:檢測未診斷糖尿病和糖尿病前期的簡單工具。2008年糖尿病護理；31:1040-5.統(tǒng)計建模:兩種文化(作者有評論和反駁)。統(tǒng)計學家Sci 200116:199-231.Steyerberg EW，Vickers AJ，Cook NR，Gerds T，戈寧M，Obuchowski N，等,《評估預測模型的性能:傳統(tǒng)和新方法的框架》。流行病學2010；21:128-38.一種新的肝脂肪變性診斷評分的開發(fā)、外部驗證和比較評估。美國胃腸病學雜志2014；109:1404-14.Hilden J .評論:關于NRI、IDI和“好看”的統(tǒng)計數(shù)據(jù)，下面什么也沒有。2014年流行病學；25:265-7.

欣賞醫(yī)學的美好，快樂學習生活。歡迎關注微信官方賬號【樊棋醫(yī)學BioSCI】。微信官方賬號專注于生物醫(yī)學研究、科研項目設計、SCI論文寫作等領域的知識梳理和數(shù)據(jù)分享。，為醫(yī)務工作者提供了方便。