随着自动化系统的发展,机器学习正日益融入决策过程,并在诸如简历筛选、投资组合配置、贷款风险评估和保险审批等应用中为人类决策者提供支持。在本论文中,我探讨了将机器学习与决策过程结合时所面临的各类挑战,重点关注数据偏差、鲁棒性、公平性、异构数据源以及面向决策的建模等问题。在每一章中,我从不同角度研究这些问题,并提出相应的定制算法加以解决。 论文的第一部分聚焦于面向决策的训练,即在预测模型训练过程中将最终决策结果纳入优化目标。研究表明,端到端学习问题的最优解对应于能引导至贝叶斯最优行为的预测结果。 第二部分则转向处理预测系统输出对人类生活产生实际影响的情形,特别是与公平性相关的问题。关于公平性的第一章研究了集中式环境下的群体公平(Group Fairness),并提出了一种包含无偏梯度估计的公平性正则项。这一方法简化了收敛速率和泛化误差界的构建,为在群体公平至关重要的现实应用中提供了一种可扩展的保障手段。 另一个与人类相关的数据问题是,出于隐私考虑,这些数据通常无法集中传输至服务器。第二章在此基础上,将公平学习方法扩展至联邦学习环境,其中不同客户端持有数据集的不同部分。基于函数追踪机制,该章节提出了一种适用于全局层面的群体公平性正则项,可与现有多数联邦学习算法结合使用,且在计算与通信开销方面要求较低。 论文的最后一部分再次回到决策问题,提出了一种方法,用于在目标领域中整合来自不同(可能存在偏差的)参考分布的信息以做出决策。该方法通过在各个参考分布周围构造最优传输球(Optimal Transport Balls),并对其交集进行优化,从而使决策者能够在所有参考分布一致的最坏情况分布下做出鲁棒决策。 关键词:机器学习、优化、面向决策的学习、公平学习、分布式鲁棒优化

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【博士论文】在缺失数据情况下的深度自监督学习
专知会员服务
32+阅读 · 2024年12月27日
【ETHZ博士论文】机器学习代码: 安全性与可靠性
专知会员服务
19+阅读 · 2024年10月25日
【CMU博士论文】经典方法对现代机器学习的改进
专知会员服务
27+阅读 · 2024年8月16日
SFFAI报告 | 常建龙 :深度卷积网络中的卷积算子研究进展
人工智能前沿讲习班
11+阅读 · 2018年10月22日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
169+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
461+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
168+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员