新着Pick

AIドクター誕生近い? 米医師試験、合格ライン

共同通信
【ワシントン共同】米企業が開発した人工知能(AI)に米国の医師資格試験問題を解かせたところ正解率は5...
119Picks
Pick に失敗しました

人気 Picker
米医師国家試験は、日本のそれとは異なり、Step 1から3までの3段階で成り立つ試験であり、最終的には全ての試験に合格する必要がありますので、AIドクターの誕生はまだ先のようです。選択式の問題は比較的クリアが早そうですが、Step 3に登場する複雑なシナリオを解決していく問題にどの程度対応できるのかは関心があります。

また、パンデミックで現在は無期限中止となっていますが、医師としての診察スキルや節度などの評価を受けるClinical skillsと呼ばれる試験にも合格する必要があったため、コロナ前の規定では、医師免許の取得はそもそも不可能だったでしょう。

個人的にはむしろ、合格ラインギリギリの点数であったことは逆の意味で驚きでした。それだけインターネット上の間違った情報の影響も受けているということなのでしょう。過去の私の成績が上回っており、自信にもなりました。
発表された論文はこちらです。
https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000198

これまで医療分野でのAIの活用は、放射線画像や病理画像など、画像検査で主に発達してきました。症状から診断を導く、「診断AI」も近年発達してきていますが、いまだに医師の精度には達するまでには至らず、現場での活用も限定的です。診断AIの精度がそれほど上昇してこなかったのは、以下のような理由があります。
・ 重要度の高い順に重み付けができない
・ 併存疾患に対応できない
・ 病気の時系列を考慮できない場合がある
・ 社会的な患者背景を考慮できない

しかしながら、Chat GPTを始めとした大規模な言語モデルを組み込んだ人工知能の発達により、今後数年間で飛躍的に精度が向上し、AIが医師に取って代わる日も来るのかもしれません。
英国のバビロン社は、精度はともかくとしてすでに承認をとってGPドクターに選べるようになってます。
この新しいテクノロジーでさらに高い精度になれば、社会実装していくことは既定路線のような気がします。GAFAMのヘルスケア事業への熱意も高いですしね。
疾病領域別の正答率が知りたいですね。ChatGPTを使ったのであれば、患者数が多くて一般の方でも耳にしたことがある病気の正答率が低く、患者数が少なく特に専門的な病気の正答率が高そうな気がします。

対象となる患者さんの数が多いが故に、不確かな情報量が相対的に多い、よくある病気での正答率が低いのであれば、臨床の現場に持ち込むのはリスクが高いですし、ましてや一般の方が安易に利用するのはお勧めできません。(規制の話は横に置いといて…)
オープンAIの「チャットGPT」が合格ラインとされる60%前後に達したとのことです。

expert reaction to study on ChatGPT almost passing the US Medical Licensing Exam
https://www.sciencemediacentre.org/expert-reaction-to-study-on-chatgpt-almost-passing-the-us-medical-licensing-exam/
人が担うべきところは医者が、AIが代替できるところについてはどんどんAI医者が増えていくと思います。
まだあまり想像はつきませんが、それほど遠くない未来なのではないでしょうか。
正直、ろくに話も聞かないで薬を出す内科医とかいるしその辺から置き換わって欲しい。