题目: A Hierarchy of Limitations in Machine Learning
简介:
“所有模型都是错误的,但有些模型是有用的,”乔治·E·普·博克斯(George E. P. Box)(1979)说。 机器学习专注于概率模型在社会系统中进行预测的有用性,但是直到现在才掌握了这些模型错误的方式以及这些缺点的后果。 本文尝试对机器学习模型在应用于社会时的特定概念,过程和统计局限性进行全面,结构化的概述。 机器学习建模者本身可以使用所描述的层次结构来识别可能的故障点,并思考如何解决这些故障点,并且机器学习模型的使用者在面对有关是否,在何处以及如何应用机器学习的决策时可以知道要问什么。 局限性从量化本身固有的承诺到显示未建模的依存关系如何导致交叉验证作为评估模型性能的方式过于乐观的局限性。
目录: