来自:程序员书库(ID:OpenSourceTop)
人工智能这几年的飞速发展我们都有目共睹,随着技术进步和产业化的推进,越来越多的程序员转向这个领域
但是,人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。挑战还是很大的,因此,选择一份适合自己的学习资料也很重要。
近日,猿哥偶然发现一份非常不错的 AI 资源 ——《AI 算法工程师手册》,而且这份资料是开源的,可以免费在线阅读
作者是华校专,曾任阿里巴巴资深算法工程师、智易科技首席算法研究员,现任腾讯高级研究员,他还是《Python大战机器学习》的作者,这是一本讲述机器学习的算法和Python 编程实践。
今天和大家分享的《AI 算法工程师手册》,是作者多年以来学习总结的笔记,经整理之后开源于世。目前还有约一半的内容在陆续整理中,已经整理好的内容放置在此。 曾有出版社约稿,但是考虑到出版时间周期较长,而且书本购买成本高不利于技术广泛传播,因此作者采取开源的形式。
本书主要分为以下5大部分:
数学基础
统计学习
深度学习
自然语言处理
工具
数学基础
关于数学基础知识方面,本书着重介绍了以下4点内容:
线性代数基础
概率论基础
数值计算基础
蒙特卡洛方法与 MCMC 采样
统计学习
这部分内容可以说是本书的重点,占据了大量的篇幅,主要介绍机器学习中一些主要的算法
机器学习简介
线性代数基础
支持向量机
朴素贝叶斯
决策树
knn
集成学习
梯度提升树
特征工程
模型评估
降维
聚类
半监督学习
EM算法
最大熵算法
隐马尔可夫模型
概率图与条件随机场
边际概率推断
主题模型
和大多书籍一样,开篇先讲述原理,由此带入示例讲解,不过原理不会占据太大篇幅:
深度学习
第三部分主要介绍深度学习神经网络的基本知识和模型:
深度学习简介
深度前馈神经网络
反向传播算法
正则化
最优化基础
卷积神经网络
CNN之图片分类
循环神经网络
工程实践指导原则
自然处理
这一部分只讲一个内容——词向量。
工具
这部分主要介绍了 AI 常用工具和函数库,这部分内容也是比较重要的,用好工具也是学习人工智能的重要一项内容,而且这部分内容更侧重于实践方面,有较多的代码示例:
CRF
lightgbm
xgboost
scikit-learn
spark
numpy
scipy
matplotlib
pandas
我们截取深度学习中的线性代数的一小部分内容为例:
综合以上介绍可以看出,这本书的内容十分全面,理论知识和实战都兼顾了。附上书籍地址:http://www.huaxiaozhuan.com/
此外,作者在 github 上也有一些内容:
"《算法导论》的C++实现"代码:https://github.com/huaxz1986/cplusplus-_Implementation_Of_Introduction_to_Algorithms
《Unix 环境高级编程第三版》笔记:https://github.com/huaxz1986/APUE_notes
●编号834,输入编号直达本文
●输入m获取文章目录
程序员书库