《Scientific Reports》:DINO-EYE: self-supervised learning for identification of different optic disc phenotypes in primary open angle glaucoma
編輯推薦:
本研究針對(duì)原發(fā)性開角型青光眼(POAG)視盤表型分類存在觀察者間差異大、主觀性強(qiáng)的問題,開發(fā)了基于DINO視覺Transformer的自監(jiān)督學(xué)習(xí)模型DINO-EYE。該模型利用850張視盤照片,通過數(shù)據(jù)增強(qiáng)生成10,493張圖像,提取2048維潛在特征,實(shí)現(xiàn)了六種視盤表型的精準(zhǔn)分類(準(zhǔn)確率達(dá)92.1%),其注意力圖譜與臨床特征高度吻合,為青光眼個(gè)體化診療提供了可靠的AI決策支持工具。
青光眼作為一種慢性進(jìn)展性視神經(jīng)病變,是全球不可逆性盲的主要病因之一。最新meta分析預(yù)測(cè),到2040年全球青光眼患者將達(dá)1.118億人。早期診斷對(duì)于阻止疾病進(jìn)展至關(guān)重要,而視盤照片(ODPs)作為傳統(tǒng)且經(jīng)濟(jì)的檢查手段,在青光眼篩查和隨訪中發(fā)揮著重要作用。臨床實(shí)踐中,研究者根據(jù)視盤形態(tài)特征將原發(fā)性開角型青光眼(POAG)劃分為不同表型,包括彌漫性變薄、局灶性變薄、獲得性視神經(jīng)凹陷(APON)、傾斜視盤、廣泛性視盤周圍萎縮(PPA)和廣泛性變薄等。這些表型與特定的人口統(tǒng)計(jì)學(xué)特征和臨床表現(xiàn)相關(guān),有助于實(shí)現(xiàn)個(gè)體化治療。
然而,這種表型分類方法在臨床應(yīng)用中面臨嚴(yán)峻挑戰(zhàn)。不同醫(yī)師之間由于經(jīng)驗(yàn)、培訓(xùn)背景和主觀判斷差異,對(duì)視盤表型的判定存在顯著不一致。研究表明,即使引入第三名醫(yī)師進(jìn)行仲裁,三名專家之間的完全不一致率仍高達(dá)30%。這種觀察者間差異嚴(yán)重影響了表型分類的可靠性和臨床應(yīng)用價(jià)值。
隨著人工智能技術(shù)的快速發(fā)展,自監(jiān)督學(xué)習(xí)(SSL)為醫(yī)學(xué)圖像分析帶來了新的機(jī)遇。特別是在青光眼診斷領(lǐng)域,深度學(xué)習(xí)模型能夠從大量圖像中自動(dòng)學(xué)習(xí)特征,減少人為偏差。然而,現(xiàn)有研究多集中于青光眼與非青光眼的二分類問題,對(duì)于更精細(xì)的表型區(qū)分研究尚屬空白。
為此,來自加州大學(xué)洛杉磯分校(UCLA)Jules Stein眼科研究所的研究團(tuán)隊(duì)開發(fā)了DINO-EYE自監(jiān)督學(xué)習(xí)框架,專門用于POAG視盤表型的自動(dòng)識(shí)別。該研究近期發(fā)表在《Scientific Reports》雜志,為青光眼的精準(zhǔn)診斷提供了新的技術(shù)路徑。
研究團(tuán)隊(duì)采用了幾項(xiàng)關(guān)鍵技術(shù)方法:收集850例POAG患者的視盤照片,通過旋轉(zhuǎn)、縮放和高斯噪聲等數(shù)據(jù)增強(qiáng)技術(shù)解決類別不平衡問題;使用DINO視覺Transformer作為主干網(wǎng)絡(luò),通過自蒸餾框架學(xué)習(xí)圖像表征;提取2048維潛在特征用于隨機(jī)森林和XGBoost分類器訓(xùn)練;生成注意力圖譜進(jìn)行模型可解釋性分析;采用UMAP進(jìn)行降維可視化,并通過無監(jiān)督聚類探索潛在新表型。
Phenotype Demographics and Dataset Augmentation
研究人群以女性為主(58.2%),高加索人種占比最高(57.6%)。傾斜表型組中亞洲人群比例最高(41.9%),平均年齡最低(65歲)。通過數(shù)據(jù)增強(qiáng),最終獲得10,493張?jiān)鰪?qiáng)圖像,按8:2比例劃分為訓(xùn)練集和測(cè)試集。
Model Training and Feature Extraction
研究采用批量大小為32,使用預(yù)訓(xùn)練的"dino_vits16"作為主干模型,隱藏層維度384,學(xué)習(xí)率0.001,最大訓(xùn)練輪數(shù)250輪。DINO-Eye成功從原始圖像中學(xué)習(xí)到2048維特征表示。
Phenotype Classification Using SSL Features
在2,209張測(cè)試圖像上,隨機(jī)森林分類器對(duì)六種表型的分類準(zhǔn)確率達(dá)到91%,XGBoost為90.5%。考慮到APON與局灶性變薄在臨床和病理上的高度重疊性,研究將兩者合并后重新訓(xùn)練,分類準(zhǔn)確率提升至92.1%。
Attention Map Interpretability
注意力圖譜分析顯示,不同注意力頭專注于特定表型特征:注意力頭1與傾斜表型相關(guān),注意力頭2與廣泛性PPA相關(guān),注意力頭3與彌漫性變薄相關(guān),注意力頭4與廣泛性變薄相關(guān)。這種特征聚焦模式與臨床專家的診斷標(biāo)準(zhǔn)高度一致。
Comparison with RETFound Model
與RETFound基礎(chǔ)模型對(duì)比發(fā)現(xiàn),DINO-Eye在相同測(cè)試集上的表現(xiàn)更優(yōu)(準(zhǔn)確率92.1% vs 89%)。這表明針對(duì)特定任務(wù)進(jìn)行端到端訓(xùn)練的領(lǐng)域?qū)S媚P停赡鼙韧ㄓ没A(chǔ)模型具有更好的性能。
研究結(jié)論表明,DINO-Eye框架成功從視盤照片中提取了具有臨床意義的特征,能夠準(zhǔn)確分類POAG視盤表型。該模型在性能和可解釋性方面均優(yōu)于現(xiàn)有SSL模型,為青光眼臨床決策支持和個(gè)體化治療規(guī)劃提供了有力工具。盡管無監(jiān)督聚類未能發(fā)現(xiàn)新的表型,但觀察到的連貫分組提示在更大樣本中可能存在新的表型變異。
該研究的創(chuàng)新之處在于將自監(jiān)督學(xué)習(xí)應(yīng)用于青光眼表型分類這一精細(xì)任務(wù),而非常規(guī)的疾病檢測(cè)。通過注意力圖譜提供可視化解釋,增強(qiáng)了模型的可信度和臨床接受度。未來研究方向包括擴(kuò)大多中心驗(yàn)證、優(yōu)化類別不平衡處理策略,以及將模型與大型語言模型結(jié)合,構(gòu)建多模態(tài)青光眼診療系統(tǒng)。
值得注意的是,研究存在單中心數(shù)據(jù)、樣本量有限等局限性,且表型標(biāo)簽本身存在主觀性。然而,作為少數(shù)將SSL應(yīng)用于青光眼表型分類的研究之一,DINO-Eye為降低臨床醫(yī)師主觀偏差、提高診斷一致性提供了有效解決方案,有望在基層醫(yī)療和醫(yī)師培訓(xùn)中發(fā)揮重要作用。