3招打破机器学习工程师的边界

2020 年 3 月 11 日 CVer

本文约1791余字,阅读需要约5分钟;

系统资料领取见文末;

关键词:人工智能,机器学习,深度学习,数学,学习建议


01.机器学习工程师的边界是什么?


大多数的事物都是有边界的。那机器学习的边界又是什么呢?

对,就是数学。掌握了数学这个机器学习的底层基础,不仅可以加深对算法的理解,还能在模型优化阶段更加游刃有余。



02.如何打破边界?

希望以下的内容能给你参考思路。


   机器学习中的数学基础

方法建议:将实际意义与兴趣赋予看似枯燥的学习之后,尽量死磕最少必要知识。



上图是个使用逻辑回归判断一个男生是否是一位合适的女婿的例子。


其中,Y=w1*身高+w2*品德+w3*财富+w4*颜值+w5*就可以表达为多项式Y=w1*x1+w2*x2+w3*x3+w4*x4+w5*5,通过Sigmoid函数后,转化为该男生可能成为优秀女婿的概率问题。


这里会涉及sigmoid函数、求导算法、梯度下降、正则项控制过拟合等数学知识。遇到问题解决问题,死磕关键点,才不会钻入牛角尖,陷入数学知识的汪洋大海中孤立无援。


•   机器学习中的线性代数

方法建议:尽量将线性代数与现实意义结合起来


对于线性代数,理解它与机器学习的关键在于:理解线性代数与现实世界的巧妙的耦合。



上图中的x,y可以分别代表观察事物的2个维度。


x,y各自有大量的线性组合,意味着事物的2个维度有大量不同的看法,


将这些看法用机器来进行计算、归纳、演绎,并组合大量个别的看法,抽离出符合大多数的平衡点,从而得出普遍适用的结论。这不就是一件奇妙的巧妙而耦合的事件嘛~


•   机器学习中的概率统计

方法建议:尽量将看似无味的概率统计知识与感兴趣的话题结合起来理解


隐马尔科夫(HMM)算法是机器学习中的一个概率图模型,也是很多算法岗位面试中的考察难点。来自知乎的王蒟蒻,就用一个游戏的场景清楚的解释了隐马尔科夫(HMM)算法的原理。

https://www.zhihu.com/question/20962240/answer/33614574(链接)


我是一战士,修炼出了三种战斗形态,分别为暴怒态,正常状态和防御态。同时我也会三个被动技能,分别是普通平A,爆击(攻击伤害翻倍),吸血(生命汲取)。


我在暴怒状态下打出暴击的概率是80%,打出吸血概率为5%;
在平衡形态下,打出暴击的比率为30%,打出吸血的概率是20%;
在防御形态下,暴击成功概率为5%,吸血概率为60%。


总结一下,战士在不同状态下能打出技能的概率不一样。


本来,战士这个职业在暴怒态时,身边会有一圈红光环;防御态时,会有一圈蓝光环。但是,现在我正在玩游戏,游戏突然出了个bug:有个傻x程序员改了游戏的代码,他给写崩了,从此战士身边光环都看不见了。那我没法通过看脚下的光环知道战士在爆什么状态了。


话说,现在问题来了:由于看不到脚下光环,我只能估计“战士”在爆什么状态;但我现在打一boss,砍10次,发现8次都是暴击,血哗哗地翻倍在掉,你觉得我这战士最可能是爆了什么状态?


所以,通过自己感兴趣的话题来理解深奥的概率问题,就轻松很多了。

 


03.打破边界的误区


也许你早已意识到高等数学、线性代数、概率统计对做机器学习的重要性,也在积极补课中,于是一头扎进大学的教材中。但埋头死磕了好多次,每次都半途而费,学了很多,学到的很少。


因为教材始终更偏向理论。优点是每一步都可靠,逻辑严谨;但缺点就是很难理解。


古语有云:“独学而无友则孤陋而寡闻”,多人学习,协作学习能较快认识到打破机器学习边界的误区,尽可能的使用合适的学习方法。


推荐网易云课堂推出的人工智能系列微专业课程,由知名企业一线人工智能专家打造,结合工业界应用经验设计学习路径,并且有讲师助教为你答疑解惑,真正带你从入门到精通。


以下福利限时免费:


PART 1

免费直播课

直播主题

《一节课带你理清卷积神经网络中的1x1卷积核》

3月11日 周三 20:00


直播大纲

1. 原理阐述:深度学习之卷积神经网络

2. 代码展示:基于Python实现卷积核

3. 案例分析:源于盗梦空间的Inception网络 


扫码添加微信,预约免费直播



PART 2

课程录像

《机器学习案例实战》


课程大纲

1.问题:解决样本不均衡的数据方案

2.方法:模型评估和标准化分析

3.解析:逻辑回归模型应用案例

4.操作::策略对比方案实战

PART 3

人工智能学习资料包


AI行业报告


随堂作业


领取方式

扫码即可预约直播

获取所有免费福利

登录查看更多
0

相关内容

打怪升级!2020机器学习工程师技术路线图
专知会员服务
99+阅读 · 2020年6月3日
少标签数据学习,54页ppt
专知会员服务
199+阅读 · 2020年5月22日
最新《Deepfakes:创造与检测》2020综述论文,36页pdf
专知会员服务
63+阅读 · 2020年5月15日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
231+阅读 · 2020年5月2日
【教程】自然语言处理中的迁移学习原理,41 页PPT
专知会员服务
96+阅读 · 2020年2月8日
【强化学习】深度强化学习初学者指南
专知会员服务
182+阅读 · 2019年12月14日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
94+阅读 · 2019年11月13日
目标检测中边界框的回归策略
极市平台
17+阅读 · 2019年9月8日
博客 | MIT—线性代数(下)
AI研习社
6+阅读 · 2018年12月20日
从数学入手,3招打破机器学习工程师的边界
机器学习算法与Python学习
4+阅读 · 2018年10月9日
学界 | 终结吧!机器学习的数学焦虑
大数据文摘
9+阅读 · 2018年9月14日
不!机器学习不是美化后的统计学
论智
4+阅读 · 2018年7月13日
机器学习各种熵:从入门到全面掌握
AI研习社
10+阅读 · 2018年3月22日
如何成为一名自然语言处理工程师
人工智能头条
3+阅读 · 2018年1月18日
【人工智能】人工智能的应用边界
产业智能官
4+阅读 · 2018年1月9日
BAT机器学习面试1000题系列(第46~50题)
七月在线实验室
7+阅读 · 2017年10月7日
机器学习(16)之支持向量机原理(二)软间隔最大化
机器学习算法与Python学习
6+阅读 · 2017年9月8日
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Arxiv
6+阅读 · 2018年1月29日
Arxiv
7+阅读 · 2017年12月26日
VIP会员
相关VIP内容
打怪升级!2020机器学习工程师技术路线图
专知会员服务
99+阅读 · 2020年6月3日
少标签数据学习,54页ppt
专知会员服务
199+阅读 · 2020年5月22日
最新《Deepfakes:创造与检测》2020综述论文,36页pdf
专知会员服务
63+阅读 · 2020年5月15日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
231+阅读 · 2020年5月2日
【教程】自然语言处理中的迁移学习原理,41 页PPT
专知会员服务
96+阅读 · 2020年2月8日
【强化学习】深度强化学习初学者指南
专知会员服务
182+阅读 · 2019年12月14日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
94+阅读 · 2019年11月13日
相关资讯
目标检测中边界框的回归策略
极市平台
17+阅读 · 2019年9月8日
博客 | MIT—线性代数(下)
AI研习社
6+阅读 · 2018年12月20日
从数学入手,3招打破机器学习工程师的边界
机器学习算法与Python学习
4+阅读 · 2018年10月9日
学界 | 终结吧!机器学习的数学焦虑
大数据文摘
9+阅读 · 2018年9月14日
不!机器学习不是美化后的统计学
论智
4+阅读 · 2018年7月13日
机器学习各种熵:从入门到全面掌握
AI研习社
10+阅读 · 2018年3月22日
如何成为一名自然语言处理工程师
人工智能头条
3+阅读 · 2018年1月18日
【人工智能】人工智能的应用边界
产业智能官
4+阅读 · 2018年1月9日
BAT机器学习面试1000题系列(第46~50题)
七月在线实验室
7+阅读 · 2017年10月7日
机器学习(16)之支持向量机原理(二)软间隔最大化
机器学习算法与Python学习
6+阅读 · 2017年9月8日
Top
微信扫码咨询专知VIP会员