上半年最后一次《强化学习实战特训营》即将开课

2018 年 5 月 7 日 炼数成金订阅号

炼数成金从2016年底开始北上广深等地举办了15次地面课程,包括《机器读心术之深度学习特训营》《机器读心术之计算机视觉实战特训营》《机器读心术之自然语言处理与知识图谱实战特训营》等,2018年,我们全新推出《机器读心术之强化学习实战特训营》,这是在全国首次推出经过知识体系化梳理并带有实战内容的强化学习课程,课程口号“两天抵两年”,通过讲师深入浅出的讲解,将需要很长时间才能理解的深涩技术用最简单通俗直击核心的方式呈现,经过两天14小时的学习效果,相当于学员自学2年时间,知识传授效率极高。同时重视实战,提供数据,代码,学员参与动手,收获极具商业价值易于变现的成果满载而归!炼数成金开设的课程,几乎都是全国首例,引领技术潮流,通过给学员传授的技术热点知识,使其短时间内占领技术制高点,在激烈的竞争环境中占有先机。
本特训营是地面课程,主要面向在炼数成金有一定学习经历(例如已经按照数据分析-机器学习线路进行了长时间学习)或具备同等能力,决心将来从事此领域的朋友。课程旨在为企业培养具有扎实基本功和开阔前瞻视野,掌握前沿技术的人才,他们将成为数据分析团队和人工智能团队的带头人和核心骨干,百万年薪指日可待。

本课程参加者,老师提供大约3小时基础知识视频教学,学习完毕后基本能达到可听懂地面授课内容的程度,如果想把基础打得更加扎实,对课程知识吸收更好,可以参加《机器读心术之神经网络与深度学习》,深度学习框架tensorflow等课程,特训营报名者参加这几门在线课程可以获得大幅度折扣。需要在开课前预备知识全部到位,我们提供特训营专用的微信群(报名后由助理邀请加入)作为交流使用,这样老师可以随时提供贴身指导。 如果对学习路线有疑惑的,老师可以提供学习路线的规划指导。

关于课程

过去10年,基于大数据基础实现“可微分编程”的深度学习技术红遍全世界,对AI技术发展起到重要促进作用。但深度学习涉及庞大的人工神经网络,待训练参数数百万计,要训练这样复杂的系统,训练数据也需要有相应的规模。像Imagenet比赛,图像识别涉及上千个分类,训练集和测试集包含数百万张图片,使用的典型网络结构,AlexNet,VGGNet,Inception等,需要训练的权值有数百万以上。即使对于互联网公司,要积累如此规模的数据,都是不容易的事情。对于广大中小企业,更是可望而不可及。空有漂亮的技术,却因缺乏数据而无法有效应用,这是企业在实施人工智能项目时普遍遇到的问题(例如,在医学影像处理领域,某些疾病几十年来积累的阳性样本也就几百张图片而已)。

强化学习是一种典型的“小数据学习”技术,典型的方法是通过左右互搏式的自我对抗不断提升本身的智能程度。Alphazero没有使用任何人类棋手对弈数据,仅用了DQN,蒙特卡洛树搜索等强化学习算法,即可轻易战胜人类顶尖棋手。如果说深度学习体现的是在海量数据中挖掘智能的计算暴力的话,那么强化学习似乎才更加符合“人工智能”这个术语的内涵本质。当前,人工智能的竞争,正逐渐从算法模型领域的研发竞争,转向数据和数据质量的竞争,而算法的发展方向,则更趋向于不要求海量数据也能达到工业级精准要求,具有更高数据利用率的模型。“小数据学习”正在成为新的热点,以迁移学习,强化学习为代表的小数据学习技术,更能体现人工智能的未来之路。炼数成金在过去几年为人工智能技术的普及做了很多知识推动的工作,2018年,我们课程的主题将聚焦到“小数据学习”,围绕“知识图谱”“迁移学习”“强化学习”等领域展开人工智能线路的新课程,将制作一系列相关线上课程和地面课程,满足技术发展一线的需求,同时配合我们正在研发的智慧医疗领域,智能运维领域的各项产品,把算法模型技术与具体产品实践相结合,和大家一起为把我们国家的人工智能应用水平提升至世界一流水平而共同努力!

本轮次课程是2018年炼数成金的唯一一次关于强化学习的授课,不再另行安排网络课程,下半年预计特训营将以“智能运维(AIOps)”作为主要讲授内容

课程内容

第1天 掌握强化学习

基础篇:强化学习从入门到精通(3小时)
马尔科夫决策过程及其动态规划实现(0.5小时)
值函数(0.5小时)
蒙特卡洛树搜索(0.5小时)
时间差分(0.5小时)
策略梯度(0.5小时)
DQN等(0.5小时)

框架篇:强化学习框架机制及其适用场景(3.5小时)
Attention与Memory机制(1小时)
Auxilary learning机制(0.5小时)
GAN生成式对抗网络(1小时)
迁移强化学习(0.5小时)
Learn to learn(0.5小时)

第2天 掌握工具与应用场景实战

工具篇:掌握两种常用实战软件(1.5小时)
玩转OpenAI实现强化学习模型(1小时)
玩转Tensorflow实现强化学习模型(0.5小时)

应用实战篇:(5小时)
RL在视频游戏中的应用:围棋?太low,我们去玩转星际争霸!(1小时)
RL统治机器人的智能:关于机器人寻径和遍历算法(1小时)
应用于自然语言处理:设计如同真人般的智能自动问答系统和实现自动写作,自动编写音乐,自动编写股评(1小时)
让深度学习专家也要失业:自动设计深度神经网络结构,自动寻找最优结构(1小时)
应用于电子商务:设计高效能的推荐系统(1小时)

报名后我们组成微信群,大家也可以互动讨论提议一些课程内容,老师尽量满足大家的要求
        
课程特色:
本课程不是孤立的,它是一整条学习链条中的一环。以后“在线-特训营-在线”的模式会在炼数成金更多地被使用。特训营课程不光可以传授更高深专业,需要面授讨论的知识,提供更多干货。更重要的是通过特训营的实际人际交流,可以建立在机器学习人工智能领域的人脉圈子,待以时日当同学们大多都成为总监级,经理级,老板级人物的时候,这个圈子就会迸发巨大的力量。对于老师来说,这只是重复了当年创建ITPUB的事情(后来从ITPUB起家的朋友圈,几乎统治了整个中国的数据库行业)。

老师全程提供手机端(微信)的互动联络支持,且相关微信群永久有效。
1 老师提供学习路线指导和学习效果监测,知识点答疑
2 微信群内互动决定产生课程部分内容,使学生能得到自己最心仪的知识
3 参营学员可以在社区获得徽章标识“精英学员”身份,在社区里设立专门的讨论板块,放置特训营的资料和问题讨论
4 互动讨论列入的内容,但最后没被选入课程的,老师将会酌情会将其中一部分讲解录制为视频以网络方式传授,争取不让任何一位同学失望!

课程讲师:
黄志洪(tigerfish),数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。知名数据库网站ITPUB创始人,知名数据分析网站炼数成金创始人。ITPUB在其十几年历史中为中国IT业特别是数据库行业输送了大量人才,其中不乏今天在行业里叱咤风云的佼佼者,因此被誉为数据库业的黄埔军校。后来创建炼数成金,言传身教,亲自讲授大数据,数据库,数据分析,人工智能等方面的几十门课程,本身也在华南著名学府中山大学任教多年,桃李满天下。引领无数弟子进入业界,朋友圈遍及业界重要人士,广受尊重。

培训时间: 

广州特训营:2018.05.12-05.13(周六日,两天共约15学时)


授课形式:
精品小班,面授课程(老师将面对面对同学精心辅导,考虑到老师辅导精力有限,每个班级仅只收20个学生) 
因导师精力有限,特训营目前仅在北京、上海、广州、深圳等地区举办,每城市每年举办1-2次,全国每年培养人数限制在200人以内。 
         
参训特享七大福利:

1、赠送校长新课:1月22日-1月31日报名特训营赠送《机器读心术之迁移学习》课程

2、赠送道具卡:《机器读心术之神经网络与深度学习》快班免固定学费道具卡

3、赠送VIP礼券:赠送价值500元数据中国VIP年费抵价券
4、专享技能检测:授课老师辅导进行技术能力检测,并给予学习建议
5、专享职业规划:授课老师将根据学员基础和学员的技术梦想,给予切合实际的技术学习路线规划
6、专属微信群:专属微信交流群,与老师近距离沟通,群永久存在,不解散
7、享良好学习环境:课程均会安排在星级酒店会议室中进行且包含午餐 


培训流程: 
1、报名缴费:
2、进微信群:提供学员信息,客服查核后将会把你请进课程专属微信群 
3、微信互动:在微信中与老师及同学之间互动交流,对课程授课内容抒发建议,探讨技术等 
4、老师辅导:老师讲通过微信与您沟通检测技能以及技术指导 
5、现场听课:开课当日,前往现场听课 
        
培训FAQ 
Q:涉及的实战部分讲得细致吗?
A:会讲到代码级 ,听众必须携带电脑参与课程以便参与动手实践,我们在课程会公布统一实验环境要求
        
Q:学习这个课程需要什么基础?怎么确定我是否具备这个基础?
A:理论上不需要很多基础,达到炼数成金《机器学习》课程内容水平即可,在报名后老师会对参与者进行辅导,基础完全不是问题。 
        
Q:我不在北上广深,有机会参加学习吗?能改成网络授课或者直播吗?
A:很抱歉由于时间精力的制约,不可能在太多城市巡回讲授,现在高铁等交通很方便,课程时间特意安排在周末两天,建议就近选择大城市参加学习。课程的内容(特别商业案例的部分)涉及一定的商业内幕(你懂的),所以不会在网络上公开直播或作为逆向收费式课程讲授讲授

点击下方二维码或阅读原文报名:

登录查看更多
2

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
212+阅读 · 2020年4月26日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
111+阅读 · 2020年4月12日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
118+阅读 · 2020年1月15日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
Python量化投资实训营
量化投资与机器学习
11+阅读 · 2018年1月30日
知识图谱实战
炼数成金订阅号
65+阅读 · 2017年12月6日
广州“自然语言处理与知识图谱”精品小班特训营
炼数成金订阅号
3+阅读 · 2017年11月22日
知识图谱实战新课上线啦!
炼数成金订阅号
22+阅读 · 2017年11月16日
课程 | 从零开始精通深度学习
机器之心
10+阅读 · 2017年10月24日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Arxiv
5+阅读 · 2018年9月11日
Stock Chart Pattern recognition with Deep Learning
Arxiv
6+阅读 · 2018年8月1日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
8+阅读 · 2018年6月19日
Arxiv
7+阅读 · 2018年1月18日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
相关资讯
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
Python量化投资实训营
量化投资与机器学习
11+阅读 · 2018年1月30日
知识图谱实战
炼数成金订阅号
65+阅读 · 2017年12月6日
广州“自然语言处理与知识图谱”精品小班特训营
炼数成金订阅号
3+阅读 · 2017年11月22日
知识图谱实战新课上线啦!
炼数成金订阅号
22+阅读 · 2017年11月16日
课程 | 从零开始精通深度学习
机器之心
10+阅读 · 2017年10月24日
相关论文
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Arxiv
5+阅读 · 2018年9月11日
Stock Chart Pattern recognition with Deep Learning
Arxiv
6+阅读 · 2018年8月1日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
8+阅读 · 2018年6月19日
Arxiv
7+阅读 · 2018年1月18日
Arxiv
5+阅读 · 2015年9月14日
Top
微信扫码咨询专知VIP会员