本リポジトリは,日本語の医学研究概要から作成した多肢選択式問題(MCQ)データと,一般読者による正誤(0/1)の回答ログ(匿名化)を公開します。
研究内容の「目的・方法・結果・解釈・結論・限界・語彙」の要素ごとに,理解の難しさを分析できることを目的としています。
This repository provides a dataset of multiple-choice questions (MCQs) generated from Japanese medical research summaries, along with anonymized correctness logs (0/1) from general readers.
The dataset is designed to analyze comprehension difficulty at the component level (Purpose, Methods, Results, Interpretation, Conclusion, Limitations, Vocabulary).
MCQ/: MCQ JSON files (one file per source)answers/public_correctness.csv: anonymized correctness logs
Columns:respondent_pseudo_id,question_id,is_correct
respondent_pseudo_idは元のIDを復元できない形で匿名化されています。- 公開データには個人を特定可能な情報(生のID、詳細なタイムスタンプ等)を含めません。
CC BY 4.0