《Scientific Reports》:Application of a novel approach for dementia prevalence prediction in Taiwan
編輯推薦:
本研究針對全球老齡化背景下癡呆患病率快速上升的公共衛生挑戰,以臺灣地區1998-2023年健保數據庫的年度癡呆確診數據為基礎,提出了一種新型飛鵝優化算法(FGOA)優化的支持向量回歸(SVR)模型FGOASVR。通過與ARIMA、HWETS、LSTM等8種傳統及機器學習模型對比,FGOASVR在男女性別組分別取得平均MAPE 3.17%/3.42%和RMSE 0.69/0.96的最優預測精度,證實其能有效捕捉癡呆患病非線性趨勢,為公共衛生資源規劃提供可靠工具。
隨著全球人口老齡化進程加速,癡呆癥已成為席卷各國的"灰色海嘯"。這種慢性神經退行性疾病不僅侵蝕患者的記憶、判斷力和日常生活能力,更對家庭、醫療系統乃至社會經濟造成巨大負擔。世界衛生組織數據顯示,全球癡呆患者已超過5500萬,到2050年預計將突破1.39億,年經濟成本超過萬億美元。在老齡化程度突出的臺灣地區,65歲以上人口占比超過17%,目前約有31萬癡呆患者,預計2041年將突破50萬大關。面對這場迫在眉睫的公共衛生危機,精準預測患病趨勢成為制定防控策略的關鍵。
傳統預測方法如自回歸綜合移動平均(ARIMA)和霍爾特-溫特斯指數平滑(HWETS)雖被廣泛應用,但其線性假設難以捕捉癡呆患病數據的復雜波動。而支持向量回歸(SVR)雖能處理非線性關系,卻對超參數配置極為敏感。為此,臺灣成功大學團隊在《Scientific Reports》發表最新研究,創新性地從大雁V形編隊飛行現象中汲取靈感,開發出飛鵝優化算法(FGOA),并與SVR結合構建了FGOASVR預測模型。
研究團隊利用臺灣健保研究數據庫(NHIRD)1998-2023年共26年的癡呆確診數據,按性別和6個年齡組(60-64歲至85歲及以上)分層分析。通過模擬雁群協作的四大機制——團隊協作(利用領航雁產生的上升氣流提升群體效率)、相互鼓勵(通過適應性激勵因子調整搜索強度)、同伴支持(對落后個體實施定向輔助)和輪換領導(動態更換領航雁避免早熟收斂),FGOA能智能優化SVR的懲罰參數C、核寬度σ和ε不敏感損失參數。該方法在80%訓練集上采用10折交叉驗證,最終在2016-2023年測試集上與其他三類模型對比:統計模型(ARIMA、HWETS)、深度學習模型(LSTM)和混合模型(PSOSVR、DESVR等)。
4.3 不同方法預測癡呆病例數的比較
FGOASVR展現出全面優勢。在男性組預測中,其平均MAPE(3.17%)和RMSE(0.69)顯著低于傳統ARIMA(6.90%,1.13)和LSTM(9.73%,1.39);在女性組預測中同樣保持領先(MAPE 3.42%,RMSE 0.96)。特別在70-74歲女性組,DESVR和HHOSVR的MAPE分別高達37.07%和13.29%,而FGOASVR穩定在2.94%,體現出對數據異常波動極強的魯棒性。
4.4 年齡組數據分析
模型在各年齡段的預測曲線與真實值高度吻合。以85歲以上群體為例,女性患病數從1998年的2.57萬激增至2023年的68.17萬,FGOASVR準確捕捉到2016年后的加速拐點,而ARIMA和HWETS則出現系統性偏差。這種優勢在較年輕組(60-64歲)同樣明顯,說明模型能同步適應低基數平穩增長和高基數爆發式增長模式。
研究的創新點在于將生物群體智能行為轉化為數學優化策略,首次驗證了FGOA在公共衛生預測領域的適用性。相比粒子群優化(PSO)和鯨魚優化算法(WOA)等傳統智能優化算法,FGOA通過多機制協作有效平衡全局探索與局部開發,避免陷入局部最優。值得注意的是,盡管LSTM在85歲以上組表現良好(MAPE 4.15%),但其在年輕組波動較大,反映出深度學習模型對數據量和參數調校的敏感性。
當然研究也存在局限:基于臺灣單一支付方醫保數據的結果,其外推性需在不同醫療體系下驗證;年度數據粒度可能掩蓋季節性波動;未提供預測誤差的置信區間也一定程度影響結果解讀。但毫無疑問,這項研究為應對老齡化社會的健康挑戰提供了重要方法論支持。隨著算法進一步優化,FGOASVR框架有望擴展至其他慢性病預測領域,成為公共衛生決策的"智能導航儀"。
最終研究表明,融合群體智能的機器學習方法能顯著提升癡呆趨勢預測精度。在老齡化不可逆轉的當下,這種數據驅動的預見性分析不僅能為醫療資源調配提供科學依據,更提醒我們:應對癡呆危機,需要像雁群一樣——既要有領航者的遠見,也離不開社會整體的協同支持。