千葉大医学部研究グループ ChatGPT活用で医学文献検索時間を10分の1に短縮 診療GLの作成に活用も
公開日時 2024/07/10 04:51
千葉大学は7月9日、ChatGPTなどの大規模言語モデル(LLM)を活用することで、医学文献検索にかかる膨大な作業時間を従来の方法の10分の1以下まで短縮できるとの研究結果を発表した。生成AIを診療ガイドライン(GL)作成の一部に用いることで、ガイドライン作成に必要な文献を膨大な医学情報の中から高い精度で見つけ出せることも確認した。同研究は、日本版敗血症診療GL2024作成委員会の取り組みの一環として行われたもので、医学雑誌 JAMA Network Openに2024年7月8日(現地時間)に掲載された。
同研究は、千葉大学医学部附属病院救急集中治療医学の大網毅彦講師、同大学院医学研究院の中田孝明教授、国立シンガポール大学Duke-NUS Medical Schoolの岡田遥平研究員らの研究チームが行ったもの。日本版敗血症診療GLの作成において、診療GLの中から5つの臨床疑問(CQ)に関する文献スクリーニングデータを使用し、GPT-4 Turboがそれぞれの CQ に関連するキーワードをもとに抽出された数多くの文献の中から、CQに含まれる患者/集団/問題、介入、比較、および研究デザインに合致する文献を正確に選び出すことができるかを検証した。
◎コマンドプロンプトの修正で「正しく患者を見つけ出す感度」が上昇
その結果、5つのCQにおける主要解析では、LLMを用いたスクリーニングで「正しく患者を見つけ出す感度」は0.75(95%信頼区間 CI、0.43–0.92)、「病気でない人を正しく除外する特異度」は0.99(95% CI, 0.99–0.99)だった。LLM の特徴として、人間が入力する命令文(コマンドプロンプト)によって LLM の作業内容が変化すると報告されている。同研究では、LLMにおける作業の質が向上するようコマンドプロンプトを修正したところ、「感度」は0.91(95% CI, 0.77–0.97)に上昇。「特異度」はほとんど低下しなかった(0.98;95% CI, 0.96–0.99)。
◎「システマティックレビューの効率を向上させ、作業負担を軽減する可能性がある」
この結果について研究チームは、「LLM を用いた文献スクリーニングはある程度の正確性を有していること(許容できる感度と非常に高い特異度)が分かった」と強調。また、「文献スクリーニングにかかる時間を大幅に短縮した。この新しい文献スクリーニングの方法は、システマティックレビューの効率を向上させ、作業負担を軽減する可能性がある」と評価した。
研究チームはまた、「今回検討したのは敗血症の分野のみの文献検索だった。その他の医学分野においても LLM を用いた文献スクリーニングの応用が期待される」とし、「医療従事者の作業負担を減らしながら、より良い診療ガイドラインを作成するために、今後もAI を活用した作業の効率化につながる取り組みを続けていきたい」とした。