医療LLM

医療AI・医療×LLMの研究開発：これまでの自身の取り組み

医療に関連する自然言語処理分野において, ドメイン特化AIを開発する取り組みの成果を紹介します。

[実績] 新しい順.

EQUES | 経産省NEDO　GENIAC「薬学分野・製薬業務に特化したLLMの開発」
岡山大学AI研究会
東大松尾研LLM講座
覚醒プロジェクト | 7B パラメタの日本語医療LLMの作成, NeurIPS WS 2024
覚醒プロジェクト | 医療LLMのベンチマークの作成
東大病院 | 70Bパラメタの日本語医療LLM開発
東大病院 | OpenCALM(7B)・Llama2(70B)の日本語医療適応, NeurIPS WS 2023
東大病院 | 心電図から心疾患や年齢予測を行うAIモデル, NeurIPS WS 2022

[記事]

医療LLMやデータセットの一覧作成（随時更新）

主要なLLMリリースの最新ニュースをまとめた一覧表の公開. 主に性能が良いとされているものや将来性がありそうなモデルを取り上げている.

JMedData4LLM:Curation of Japanese Medical Data Sources for LLM development
Awesome latest LLMs
- ページ後半に医療ドメイン特化について記載しています.
SpeakerDeck「医療分野に特化したLLM　研究紹介」

（関連）経産省NEDO　GENIAC「薬学分野・製薬業務に特化したLLMの開発」

株式会社EQUESの事業として、統括として、国内初（世界でも事例わずか）の製薬領域に特化したLLMの開発に挑戦しました。本事業の一環で、特化モデルだけではなく、薬剤師国家試験・名寄せ・齟齬点検の３種類のベンチマークを独自に構築しました。成果の大部分はパブリックに公開し、GENIACコミュニティおよびライフサイエンス業界の発展に貢献していきます。本プロジェクトはNEDOの支援を受けています。

岡山大学AI研究会招待講演

医療LLMの研究動向や自身の取り組みについて紹介させていただきました。

第13回岡山大学AI研究会招待講演

東大松尾研LLM講座医療LLM回担当講師

医療LLM関連の研究について講義を行いました。

7B パラメタの日本語医療LLMの作成

最新のベースモデルを利用し, 日本語医療テキストを用いた学習を施した7BパラメタLLMの作成.    
本取り組みは産総研「覚醒プロジェクト」の支援を受けています.

論文：Development and bilingual evaluation of Japanese medical large language model within reasonably low computational resources

医療LLMのベンチマークの作成

医療LLMのベンチマーク評価プログラムとリーダーボードの作成. 日英対訳の医学質問応答の正答率を評価する目的. プロンプトで容易に出力や精度が変化したりすることもあり, フェアな評価手法については議論の余地が多分にあります. 
本取り組みは産総研「覚醒プロジェクト」の支援を受けています.

論点
・Q&Aの５択問題を解かせるので良いのか. 国家試験でいいのか.
・Q&Aの５択問題の正解率を評価するにはどうするのが良いか. ← 最近はhuggingface等を通して統一的になりつつある.

医療LLM評価用ベンチマーク / Japanese Medical Language Model Evaluation Harness
- 特徴１：推論にvllmを利用し高速化を図る
- 特徴２：プロンプトテンプレートをオプションで指定できる
- 特徴３：回答と正答のゲシュタルト距離をもとに選択肢を１つ選んだと"みなす"

70B パラメタの日本語医療LLM開発

東工大よりリリースされた日本語70BモデルであるSwallowの医療チューニング. 結果, 日本医師国家試験の正答率が50%近くまで到達. 一方で, GPT-4は8~9割正答できるという報告があり, まだまだ発展の余地しかない状況.

OpenCALM(7B)・Llama2(70B)の日本語医療適応

2023年の取り組み. 日本で初めてLLMの医療チューニングへの挑戦.

心電図から心疾患や年齢予測を行うAIモデル

12誘導心電図を入力とし症状の有無を判定する分類器の作成. 東大病院の患者約13万件の心電図データでMasked AutoEncoderの事前学習も実施しました. 今回, 左室収縮機能障害は心エコーにおけるEF値の低下と定義しています. このように, 心電図を入力, 心エコー所見を出力として学習することで, より手軽な心電図検査のみで症状有無の予測が可能となることを目指しています.

ISSEY SUKEDA

ISSEY SUKEDA

医療LLM

医療LLMやデータセットの一覧作成（随時更新）

（関連）経産省NEDO　GENIAC「薬学分野・製薬業務に特化したLLMの開発」

岡山大学AI研究会招待講演

東大松尾研LLM講座医療LLM回担当講師

7B パラメタの日本語医療LLMの作成

医療LLMのベンチマークの作成

70B パラメタの日本語医療LLM開発

OpenCALM(7B)・Llama2(70B)の日本語医療適応

心電図から心疾患や年齢予測を行うAIモデル

ISSEY SUKEDA

ISSEY SUKEDA

医療LLM

医療LLMやデータセットの一覧作成（随時更新）

（関連）経産省NEDO GENIAC「薬学分野・製薬業務に特化したLLMの開発」

岡山大学AI研究会 招待講演

東大松尾研LLM講座 医療LLM回 担当講師

7B パラメタの日本語医療LLMの作成

医療LLMのベンチマークの作成

70B パラメタの日本語医療LLM開発

OpenCALM(7B)・Llama2(70B)の日本語医療適応

心電図から心疾患や年齢予測を行うAIモデル

（関連）経産省NEDO　GENIAC「薬学分野・製薬業務に特化したLLMの開発」

岡山大学AI研究会招待講演

東大松尾研LLM講座医療LLM回担当講師