蚂蚁集团:开源国内首个医疗专科推理数据集

蚂蚁集团正式开源了国内首个医疗专科推理数据集。为了解决通用型语言模型在医疗问诊中缺乏对症状的反复探讨、幻觉问题和推理能力不足等难题,蚂蚁集团与上海仁济医院泌尿科专家团队联合研发了这一数据集,基于医生团队的临床经验,通过构造模拟病例数据的方式推出了中文医疗专科问答推理数据集RJUA-QA,这也是业内首个临床专科数据集。该数据集包含训练、验证和测试三部分,共包含2132个问答对,每个问答对由医生编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了97.6%以上的泌尿科就医人群,能够真实复刻诊疗场景。

搜索