12月28日消息,某机构宣布正式开源国内首个医疗专科推理数据集 RJUA-QA。
该数据集由相关医疗团队联合研发,基于医生临床经验,通过构造模拟病例数据,推出了首个中文医疗专科问答推理数据集 RJUA-QA,也是业内首个临床专科数据集。
数据集分为训练、验证、测试三部分,包含2132个问答对。每对问答由医生基于临床经验提出的问题、专家给出的回答,以及用于辅助推理的上下文构成,覆盖泌尿科就诊人群的97.6%以上,能够真实复刻诊疗场景。该数据集有助于提升大型模型在医疗诊断推理方面的能力,并可作为严肃可控场景中的评测基准。