注目論文:大規模言語モデルを用いた胸水の臨床的特徴からの結核性胸水診断

呼吸器内科
胸水の診断において、結核性胸水(TPE)の診断は時に困難です。本研究では大規模言語モデル(LLM)であるChatGPT-4を用いて、胸水の各種臨床所見からTPEの診断を試みています。従来の機械学習モデルと同等の診断精度を示し、Python packageとして公開されており、今後の臨床応用が期待されます。
The large language model diagnoses tuberculous pleural effusion in pleural effusion patients through clinical feature landscapes
大規模言語モデルによる胸水患者における臨床的特徴を用いた結核性胸水の診断
Wu C, Liu W, Mei P, Liu Y, Cai J, Liu L, Wang J, Ling X, Wang M, Cheng Y, He M, He Q, He Q, Yuan X, Tong J.
Respir Res. 2025 Feb 12;26(1):52.
https://pubmed.ncbi.nlm.nih.gov/39939874/
背景:
結核性胸水(TPE)は結核の肺外発現の一つであり、従来の診断方法は侵襲的な手術を必要とし、時間がかかります。機械学習や統計モデルによる診断方法が提案されていますが、データ処理の複雑さや特徴の統合が困難という制限があります。本研究では、大規模言語モデル(LLM)であるChatGPT-4を用いたTPE診断モデルを開発し、従来の機械学習モデルとの性能比較を行いました。

研究デザイン:
横断研究として、TPE患者109名と非TPE患者54名の臨床データを収集し、600以上の変数から73の特徴を選択しました。LLMの性能を、ロジスティック回帰や機械学習モデル(k近傍法、ランダムフォレスト、サポートベクターマシン)と、ROC曲線下面積(AUC)、F1スコア、感度、特異度を用いて比較しました。

結果:
LLMは機械学習モデルと同等の性能を示し、感度、特異度、全体的な診断精度においてロジスティック回帰を上回りました。アデノシンデアミナーゼ(ADA)レベルや単球比率などの重要な特徴がモデルに効果的に統合されました。また、臨床データに基づく迅速なTPE診断のためのPythonパッケージ(https://pypi.org/project/tpeai/)も開発されました。
LLMを用いた診断モデルは、非侵襲的で正確かつコスト効果の高い早期TPE診断方法を提供します。開発されたPythonパッケージは、臨床医が使いやすいツールとなっており、より広い使用が期待されます。ただし、臨床応用の最適化には、より大規模なデータセットでの検証が必要です。