谷歌官方新闻稿,谷歌近日与斯坦福大学医学院合作,收集了涵盖各种肤色、身体部位皮肤疾病照片,整合而成一款用于 AI训练的“SCIN 数据集”,该数据集号称“完全使用志愿者利用网络提交的照片”,因此号称可以“反映出人们常见的皮肤问题”。
▲ 图源 谷歌官方新闻稿(下同)
谷歌提到,业界许多医疗专用的皮肤科影像数据集中通常为“重大疾病”,例如人们常见的皮疹、过敏、感染等照片通常不会在数据集中,因此对于应擅长判定人们日常疾病的 AI模型使用业界常用的医疗专业数据集做训练反而有所缺憾。
而谷歌目前推出的 SCIN 数据集收录了超过 1 万张皮肤、指甲、头发状况的照片,这些照片由志愿者提供,同时拥有专业皮肤科医师标注信息,因此更适合用于模型测试和训练。
SCIN 数据集主要包含常见的过敏、发炎和感染性疾病,大部分图像均为“皮肤病早期性状”,超过一半的皮肤病状在照片拍摄一周内出现,甚至有 30%的症状是在图像拍摄不到一天内出现,因此相关数据集也可以用于皮肤病提前检测。