http://www.math.arizona.edu/∼hzhang/math574.html
随着信息技术的飞速发展,在各个领域产生了大量的科学和商业数据。例如,人类基因组数据库项目已经收集了千兆字节的人类遗传密码数据。万维网提供了另一个例子,它拥有由数百万人使用的文本和多媒体信息组成的数十亿Web页面。
本课程涵盖了现代数据科学技术,包括基本的统计学习理论及其应用。将介绍各种数据挖掘方法、算法和软件工具,重点在概念和计算方面。将涵盖生物信息学、基因组学、文本挖掘、社交网络等方面的应用。
本课程着重于现代机器学习的统计分析、方法论和理论。它是为学生谁想要实践先进的机器学习工具和算法,也了解理论原理和统计性质的算法。主题包括回归、分类、聚类、降维和高维分析。