Recent advances in deep learning and on-device inference could transform routine screening for skin cancers. Along with the anticipated benefits of this technology, potential dangers arise from unforeseen and inherent biases. A significant obstacle is building evaluation datasets that accurately reflect key demographics, including sex, age, and race, as well as other underrepresented groups. To address this, we train a state-of-the-art generative model to generate synthetic data in a controllable manner to assess the fairness of publicly available skin cancer classifiers. To evaluate whether synthetic images can be used as a fairness testing dataset, we prepare a real-image dataset (MILK10K) as a benchmark and compare the True Positive Rate result of three models (DeepGuide, MelaNet, and SkinLesionDensnet). As a result, the classification tendencies observed in each model when tested on real and generated images showed similar patterns across different attribute data sets. We confirm that highly realistic synthetic images facilitate model fairness verification.


翻译:深度学习和设备端推理的最新进展有望变革皮肤癌的常规筛查。伴随这项技术带来的预期益处,潜在风险源于不可预见和固有的偏见。一个重大障碍在于构建能够准确反映关键人口统计学特征(包括性别、年龄和种族)以及其他代表性不足群体的评估数据集。为此,我们训练了一个先进的生成模型,以可控方式生成合成数据,用于评估公开可用的皮肤癌分类器的公平性。为验证合成图像是否可作为公平性测试数据集,我们构建了一个真实图像数据集(MILK10K)作为基准,并比较了三个模型(DeepGuide、MelaNet和SkinLesionDensnet)的真阳性率结果。结果表明,在不同属性数据集上测试时,各模型在真实图像与生成图像上观察到的分类趋势呈现相似模式。我们证实高度逼真的合成图像能够有效促进模型公平性验证。

0
下载
关闭预览

相关内容

国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员