医学知識をどうプロンプトエンジニアリングで評価するか?
データセットの種類
https://scrapbox.io/files/65d46d086b036c002557f39a.png
2024年2月現在、データセットは大体以下がある。
方針
現在調整中...
メジャーの診療科(循環器、呼吸器、消化器、神経、代謝/内分泌、腎臓、血液、感染症、アレルギー、膠原病)の問題を以下の基準で問題をピックアップ。
実臨床に直結しそうなこと
難易度が簡単すぎないこと
すべての分野の問題が1-3問入り、合計20-30問の量になるように調整。