广泛使用机器学习不仅仅是它是否有效的问题 - 即使它工作得很好,也很难信任这些模型。当我们的生命、健康或金钱受到威胁时,社会自然会对机器学习持谨慎态度。随着生成型人工智能的突然出现,人们也可能发现很难对生成的内容建立信任。
随着机器学习技术在实际产品和解决方案中的应用,出现了新的挑战。模型在分布发生细微变化时出乎意料地无法泛化;有些模型被发现利用了可能对某些人群造成不公平对待的敏感特征;模型对从未见过的新数据往往表现出过高的自信,或者模型不能有效地与最终用户(如医疗人员)交流其决策背后的理由,从而最大化人机协同的效果。总的来说,我们面临着对当前机器学习技术的信任度问题。目前大部分机器学习研究都致力于扩展“值得信赖的机器学习”(Trustworthy Machine Learning, TML)的研究边界。自2020年以来,TML已成为ICML会议征文的明确主题,还出现了其他与TML主题相关的相对较新的会议,如FAccT和AIES。
此TML教材是图宾根大学同名课程的最终成果,该课程首次提供是在2022/23年的冬季学期。该书覆盖了TML关键主题的理论和技术背景以及潜在的直觉。我们对与相关主题有关的重要的经典和现代研究论文进行了批判性的审查。本书旨在成为一个独立的产品,并伴随有代码片段以及指向TML主题的其他资源的多个指针。 本书的目标是为读者准备批判性地阅读、评估和讨论TML的研究工作。通过提供的代码片段,读者将获得实现基本TML技术的技术背景,并最终在TML中进行自己的研究。 本书有以下先决条件: • 熟悉Python和PyTorch编码。 • 对机器学习概念和深度学习的基本知识。 • 基础数学:多元微积分、线性代数、概率、统计和优化。
本书涵盖的主题如下:
我们没有涵盖的主题,但也是值得信赖的机器学习的核心部分:
作者: