生成AI「チャットGPT」が日本の医師国家試験を受けたら 研究グループが試行錯誤して262問に挑戦 その結果は
コメント
注目のコメント
学生の段階からこういった研究に取り組めるのは素晴らしい事だと思います。せっかくの研究結果なので、論文で発表できると更に良いですね。
現時点でのChatGPTは、人間側からの入力、いわゆるプロンプトによって得られる回答が大きく変わるので、今回もその部分に苦労されたのだと思います。
ChatGPTはすでに米国の医師国家試験には合格しており、性能としては日本の医師国家試験も当然合格できるレベルでしょう。ChatGPT3.5で合格できたなら、4.0であればもっと優れた結果になりそうです。
人間の意思よりも共感される様な文章を作り、正確性も高いので、電子カルテに導入されれば一気に医療界の変革が起こるでしょう。
臨床現場での活用にも大いに有効で、私自身も自分の中の引き出しを出してもらうのに非常に有効な実感があります。
私は、現時点で、ChatGPTありきで物事を行う様にしており、新しい時代に適応して行く準備を進めています。日本の医師国家試験に対するチャットGPTの回答結果というのは、先に日米の共同チームからの報告がありました。
【読売新聞の報道】
https://www.yomiuri.co.jp/science/20230509-OYT1T50319/
5年分の国家試験でいずれも合格ラインを超えていたことが報告されています。知見としての新規性は乏しいかもしれません。
またこちら米国でも医師国家試験で合格したことが報告されています。
【共同通信の報道】
https://nordot.app/996514296582684672?c=113147194022725109
オンライン健康相談の世界では、回答の質や共感性で勝る可能性も示唆され始めています。
【トピックスでの紹介記事】
https://newspicks.com/topics/yuji-yamada/posts/64
一医師として、医師の業務負担を減らすソリューションになる、ひいては患者さんのメリットにつながる日が1日も早く来ることを待ち望んでいます。ChatGPTは米国の医師国家試験では医学生の平均点程度の成績を取り合格ラインを上回ることがこれまでの研究で示されてきましたが、日本の医師国家試験でも同様の結果が出たと言えます。ポイントは、ChatGPTは医療に特化した学習をしているというわけではないにも関わらず、これだけの結果を出したということです。
これまで医療分野でのAIの活用は、放射線画像や病理画像など、画像検査で主に発達してきました。症状から診断を導く、「診断AI」も近年発達してきていますが、いまだに医師の精度には達するまでには至らず、現場での活用も限定的です。診断AIの精度がそれほど上昇してこなかったのは、以下のような理由があります。
・ 重要度の高い順に重み付けができない
・ 併存疾患に対応できない
・ 病気の時系列を考慮できない場合がある
・ 社会的な患者背景を考慮できない
しかしながら、ChatGPTを始めとした大規模な言語モデルを組み込んだ人工知能の発達により、今後数年間で飛躍的に精度が向上し、AIが医師に取って代わる日も来るのかもしれません。