《npj Digital Medicine》:KT-LLM: an evidence-grounded and sequence text framework for auditable kidney transplant modeling
編輯推薦:
為解決腎移植領域長期存在的縱向隨訪數據與文本臨床規則脫節問題,研究人員開發了KT-LLM框架,通過檢索增強生成技術將Banff病理分類、OPTN/SRTR政策文檔與移植受者隨訪序列相結合。該系統包含SRTR-MambaSurv(離散時間競爭風險預測)、OPTN-BlackClust(黑人受者亞型聚類)和Policy-Ops(政策合規檢查)三個可審計智能體,在OPTN/UNOS隊列中顯著提升了證據溯源準確性和預測校準度,為多中心標準化診療提供可驗證的決策支持。
在腎移植臨床實踐與研究中,結構化隨訪數據與文本化臨床規則如同兩條平行線,難以有效協同。移植受者隨訪系統(TRF)要求術后6個月、1年及每年定期提交數據,而Banff移植病理分類通過中央數據庫動態更新診斷標準,SRTR項目特異性報告(PSR)每半年發布中心質量評估結果。這種割裂導致報告一致性差、合規性難以追溯,尤其面對黑人受者結局異質性、種族中性eGFR(估算腎小球濾過率)計算規則變更等復雜場景時,傳統模型缺乏將政策條文轉化為可執行檢查機制的能力。
為解決這一難題,廣東人民醫院腎移植團隊在《npj Digital Medicine》發表研究,提出KT-LLM框架。該框架通過檢索增強生成(RAG)技術將Banff中央庫、OPTN/UNOS政策手冊、SRTR方法學文檔等權威知識源嵌入系統,構建可驗證的決策流水線。其核心創新在于協調三個專業智能體:Agent-A(SRTR-MambaSurv)采用線性時間Mamba模型處理TRF對齊的離散時間序列,預測移植腎失功與死亡的競爭風險;Agent-B(OPTN-BlackClust)通過深度嵌入聚類識別黑人受者臨床亞型;Agent-C(Policy-Ops)將OPTN提交時限、SRTR報告周期等規則編譯為可執行檢查表。通過覆蓋約束解碼與證據指針機制,系統確保每個結論均錨定版本化來源。
關鍵技術方法上,研究基于OPTN STAR(標準移植分析與研究)文件與SRTR SAF(標準分析文件)2015-2019年數據,采用離散時間競爭風險模型處理非等距隨訪序列。Mamba架構通過輸入依賴的狀態更新實現線性復雜度推理,顯著降低長序列計算開銷。政策規則通過術語感知重新加權與交叉編碼器重排序實現精準檢索,而深度聚類模塊結合IDEC(改進深度嵌入聚類)目標函數與共識選擇保證亞型穩定性。
研究結果
證據溯源的問答性能提升
在Banff-QA與Policy-QA測試中,KT-LLM的精確匹配率分別達91.8%與82%,證據命中率提升至83.5%。相比傳統檢索模型(BM25+BERT:72.5%)與醫學大語言模型(Med-PaLM 2:86.7%),其優勢主要體現在多條款融合與閾值符號化驗證能力。
長序列生存預測精度優化
SRTR-MambaSurv在移植腎失功與死亡的C指數分別達到0.82與0.80,較最佳基線(Dynamic-DeepHit:0.79/0.77)提升0.03。時間依賴性AUC在1年死亡預測中達0.84,3年移植腎失功預測為0.82,集成Brier分數降至0.136,顯示更優的校準度。
黑人受者亞型識別有效性
OPTN-BlackClust在2015-2019年黑人受者隊列中發現穩定聚類(NMI=0.58,ARI=0.45),Gray檢驗顯示集群間移植腎失功風險差異顯著(-log10p=4.6)。聚類輪廓系數(0.25)與自助法杰卡德穩定性(0.79)均優于傳統方法(K-means:0.14/0.56),證實其捕捉異質性的能力。
政策規則引擎執行效能
Policy-Ops將OPTN Policy 18規定的60/90天TRF提交窗口、種族中性eGFR閾值等編譯為可執行規則,規則觸發一致率達88%。通過對齊PSR數據凍結期(發布前6個月),系統自動標記時間軸偏差超30天的異常記錄。
研究結論表明,KT-LLM通過將文本規則轉化為可計算檢查表、隨訪序列轉化為可校準表征、治理時鐘轉化為可操作約束,實現了腎移植證據模型的審計閉環。其意義在于首次建立政策版本、病理術語與生存預測的同步機制,支持多中心時代公平性監測。未來可擴展至個體化隨訪調度、實時政策對齊等場景,但需持續跟蹤Banff分類更新與OPTN政策迭代,通過滾動再校準保持系統時效性。