注目論文:大規模言語モデルを用いた免疫関連有害事象の高精度検出に関する比較研究

呼吸器内科
免疫チェックポイント阻害薬(ICI)治療における免疫関連有害事象(irAE)の正確な把握は重要な課題です。本研究では、後ろ向き研究において、大規模言語モデル(LLM)を用いたirAEの検出が、従来のICD(国際疾病分類)コードによる方法と比較して優れた感度を示すことが報告されました。
Enhancing Precision in Detecting Severe Immune-Related Adverse Events: Comparative Analysis of Large Language Models and International Classification of Disease Codes in Patient Records
患者記録における重症免疫関連有害事象の検出精度向上:大規模言語モデルと国際疾病分類コードの比較分析
Sun VH, Hadzic I, Raghu VK, et al.
J Clin Oncol. 2024 Dec 10;42(35):4134-4144.
https://pubmed.ncbi.nlm.nih.gov/39226489/
背景:
大規模後ろ向き研究において免疫関連有害事象(irAE)を正確に特定する現行のアプローチには限界があります。大規模言語モデル(LLM)は自然言語理解タスクにおいて高い性能を示しており、この課題に対する潜在的な解決策となる可能性があります。

研究デザイン:
2011年2月5日から2023年9月5日までの期間に、単一施設で免疫チェックポイント阻害薬(ICI)治療を受けた患者の入院について、irAEの有無を個別に評価しました。電子カルテからICI誘発性大腸炎、肝炎、肺炎(頻発するirAE)およびICI誘発性心筋炎(最も致死的なirAE)を検出するため、ICDコードと検索拡張生成を備えたLLMを適用しました。手動判定を基準として、ICDコードとLLMの性能を感度と特異度で比較しました。外部検証は、2018年6月1日から2019年5月31日までの第二施設からの入院データセットを用いて実施されました。

結果:
ICI治療を受けた患者の7,555件の入院のうち、2.0%がICI誘発性大腸炎、1.1%が肝炎、0.7%が肺炎、0.8%が心筋炎と判定されました。LLMはICDコードと比較して高い感度(94.7% vs 68.7%)を示し、ICI誘発性肝炎(P<0.001)、心筋炎(P<0.001)、肺炎(P=0.003)で有意差が認められ、特異度は同程度でした(93.7% vs 92.4%)。LLMは1症例あたり平均9.53秒で判定を行い、手動判定の推定15分と比較して効率的でした。検証コホート(1,270例)では、LLMの平均感度は98.1%、特異度は95.7%でした。大規模言語モデルは免疫関連有害事象の検出において有用なツールであり、感度と効率性の面でICDコードによる判定を上回ることが示されました。
ページトップに戻る