BERT or XLNet,NLP巅峰烧钱大战。技术发展太快,如何才能跟得上节奏?

2019 年 8 月 22 日 深度学习与NLP


在过去的几个月时间里,Google和Facebook在一场别样的大战上打得火热,自从Google的XLNet横空出世战胜了BERT的记录,Facebook就开始默默憋大招了。 上周剧情再次翻转,改进版BERT-RoBERTa登上了GLUE排行榜榜首。 这场没有想要的技术攻坚战,在短短一个月内持续发酵。
为了迎合这种变化,我们的课程也在不断迭代更新,保证不错过 任何2周之内出现的重要技术 自然语言处理无非是目前最大的风口,从Word2Vec、ElMo、GPT、Bert到XLNet, 我们见证了这个领域的高速发展以及未来的前景。互联网中的大量的文本以及IOT时代赋予我们的全新交互带来了这个领域的爆发。
这次我们迎来了第五期NLP的招生,千万不要觉得这是一个对标其他线上课程的普通的训练营。由于内容的专业性以及深度,在过去吸引了大量的全球顶级名府的学员,这里不乏来自CMU, Columbia, USC, UCSD等美国顶级名校和清北上交等国内名校学员,还有很多准一线的工程师。


我们训练营的特色可以概括为:

体系化、专业性、深度、精细化讲解

最重要的一点是可以帮助你看到里面的本质、而且能够把零零散散的知识点串起来

我们只做AI教育,因为这是我们最擅长的领域! 


另外,我们配备相应的教材,越早加入就有更多预习准备的时间!


课程大纲

第一阶段 算法与机器学习基础



【核心知识点】
. 时间复杂度,空间复杂度分析
. Master's Theorem,递归复杂度分析
. 动态规划以及Dynamic Time Warpping
. Earth Mover's Distance
. 维特比算法
. LR、决策树、随机森林、XGBoost
. 梯度下降法、随机梯度下降法、牛顿法
. Projected Gradient Descent
. L0, L1, L2, L-Infinity Norm
. Grid Search, Bayesian Optimization

. 凸函数、凸集、Duality、KKT条件
. Linear SVM、Dual of SVM
. Kernel Tick, Mercer's Theorem
. Kernelized Linear Regression、Kernelized KNN
. Linear/Quadratic Programming
. Integer/Semi-definite Programming
. NP-completeness/NP-hard/P/NP
. Constrained Relaxation、Approximate Algorithm
. Convergence Analysis of Iterative Algorithm

【部分案例讲解】:
. 基于Sparse Quadratic Programming的股票投资组合优化策略编写
. 基于Earth Mover's Distance的短文本相似度计算
. 基于Projected Gradient Descent和非负矩阵分解的词向量学习
. 基于Linear Programming的机票定价系统
. 基于DTW的文本相似度分析

第二阶段 语言模型与序列标注



【核心知识点】
. 文本预处理技术(tf-idf,Stemming等)
. 文本领域的特征工程
. 倒排表、信息检索技术
. Noisy Channel Model
. N-gram模型,词向量介绍
. 常见的Smoothing Techniques
. Learning to Rank
. Latent Variable Model
. EM算法与Local Optimality
. Convergence of EM
. EM与K-Means, GMM
. Variational Autoencoder与Text Disentangling
  .有向图与无向图模型
. Conditional Indepence、D-separation、Markov Blanket
. HMM模型以及参数估计
. Viterbi、Baum Welch
. Log-Linear Model与参数估计
. CRF模型与Linear-CRF
. CRF的Viterbi Decoding与参数估计

【部分案例讲解】:
. 基于无监督学习方法的问答系统搭建
. 基于监督学习的Aspect-Based 情感分析系统搭建
. 基于CRF、LSTM-CRF、BERT-CRF 的命名实体识别应用 
. 基于语言模型和Noisy Channel Model的拼写纠错

第三阶段 信息抽取、词向量与知识图谱



【核心知识点】

. 命名实体识别技术
. 信息抽取技术
. Snowball, KnowitAll, RunnerText
. Distant Supervision, 无监督学习方法
. 实体统一、实体消歧义、指代消解
. 知识图谱、实体与关系
. 词向量、Skip-Gram、Negative Sampling
. 矩阵分解、CBOW与Glove向量
. Contexualized Embedding与ELMo
KL Divergence与Gaussian Embedding
. 非欧式空间与Pointcare Embedding
. 黎曼空间中的梯度下降法
. 知识图谱嵌入技术
. TransE, NTN 的详解
. Node2Vec详解
. Adversial Learning与KBGAN
【部分案例讲解】:
. 利用非结构化数据和信息抽取技术构建知识图谱
. 任务导向型聊天机器人的搭建
. 包含Intent与Entity Extraction的NLU模块实现
. 基于SkipGram的推荐系统实现(参考Airbnb论文)

第四阶段 深度学习与NLP



【核心知识点】
Pytorch与Tensorflow详解
. 表示学习,分布式表示技术
. 文本领域中的Disentangling
. 深度神经网络与BP算法详解
. RNN与Vanishing/Exploding Gradient
. LSTM与GRU
. Seq2Seq与注意力机制
. Greedy Decoding与Beam Search
. BI-LSTM-CRF模型
. Neural Turing Machine
. Memory Network
. Self Attention,Transformer以及Transformer-XL.
. Bert的详解
. BERT-BiLSTM-CRF
. GPT,MASS,  XLNet
. Low-resource learning
. 深度学习的可视化
. Laywer-wise Relevance Propagation
* 由于此领域的飞速发展,我们会在课程进行过程中也会及时更新,确保2周之内新出的重要技术第一时间可以理解并使用。
【部分案例讲解】:
. 利用纯Python实现BP算法
. 基于Seq2Seq+注意力机制、基于Transformer的机器翻译系统
. 基于Transformer的闲聊型聊天机器人
. 基于BI-LSTM-CRF和BERT-BiLSTM-CRF在命名实体中的比较
. 利用Laywer-wise RP可视化端到端的机器翻译系统

第五阶段 贝叶斯模型与NLP



【核心知识点】


概率图模型与条件独立
. Markov Blanket 
. Dirichlet分布、Multinomial分布
. Beta分布、Conjugate Prior回顾
. Detail Balance
. 主题模型详解
. MCMC与吉布斯采样
. 主题模型与Collapsed Gibbs Sampling
. Metropolis Hasting, Rejection Sampling
. Langevin Dyamics与SGLD
. 分布式SGLD与主题模型
. Dynamic Topic Model 
. Supervised Topic Model
. KL Divergence与ELBO
. Variantional Inference, Stochastic VI
. 主题模型与变分法
. Nonparametric Models
. Dirichlet Process
. Chinese Restarant Process
. Bayesian Deep Neural Network 
. VAE与Reparametrization trick
. Bayesian RNN/LSTM
. Bayesian Word2Vec
. MMSB

【部分案例讲解】:
利用Collapsed Gibbs Sampler和SGLD对主题模型做Inference
. 基于Bayesian-LSTM的命名实体识别
. 利用主题模型做文本分类在 
. LDA的基础上修改并搭建无监督情感分析模型

第六阶段 开放式项目 (Optional)



【项目介绍】


开放式项目又称为课程的capstone项目。作为课程中的很重要的一部分,可以选择work on一个具有挑战性的项目。通过此项目,可以深入去理解某一个特定领域,快速成为这个领域内的专家,并且让项目成果成为简历中的一个亮点。

 

【项目流程】: 
Step 1: 组队 
Step 2:立项以及提交proposal 
Step 3: Short Survey Paper 
Step 4: 中期项目Revie
Step 5: 最终项目PPT以及代码提交 
Step 6: 最终presentation 
Step 7: Technical Report/博客
【输出结果】:
完整PPT、代码和Conference-Style Technical Report 最为项目的最后阶段,我们将组织学员的presentation分享大会。借此我们会邀请一些同行业的专家、从业者、企业招聘方、优质猎头资源等共同参与分享大会。
课程设计紧密围绕学术界最新进展以及工业界的需求,涵盖了所有核心知识点,并且结合了大量实战项目,培养学员的动手能力,解决问题能来以及对知识的深入理解。




部分课程项目




课程适合谁?

  • 有良好的机器学习基础,有较强的编程能力

  • 对数据结构与算法比较熟悉

  • 之后想从事相关研究工作、或者之后想申请国外名校读相关专业的硕士/博士

  • 追求技术细节,对背后的why感兴趣,不希望仅仅停留在使用工具层面的学员

  • 已经在AI领域从事工作,但技术上感觉遇到了瓶颈,想进一步突破的学员

  • 希望在工作中可以根据业务需求能够提出新的模型,做一些创新

  • 对NLP领域最新知识体系想有更深入的学习

  • 想转型到一线做AI工程师的学员


课程特色


  • 内容上包含了作为AI顶级工程师必备的核心技术体系

  • 内容上包含了大量最前沿的技术

  • 具备一定的挑战性和深度,区别于市面上的其他同类的课程。 

  • 理论与实战的结合,所有的理论会本质层面讲起,而且非常通俗易懂,即便很难理解的BERT, Bayesian NN也会让你能够听得懂并且能够理解。每一个重要的知识点会配备实战讲解以及核心代码review.

  • 包含具有挑战性的课程项目作业和理论作业,这些会帮助你更深入地理解学过的知识点

  • 配备顶尖讲师团队,均在NLP和机器学习领域有很深的研究和工作经验


教学模式


我们主要采用直播的方式,一周4-5次的直播教学, 包括2次的main lectures, 1-2次的discussion session (讲解某一个实战、必备基础、案例或者技术上的延伸), 1次的paper reading session (每周会assign一篇必备论文,并且直播解读)。教学模式上也参考了美国顶级院校的教学体系。 以下为其中一周的课程安排,供参考。 



报名方式


请扫描下面的二维码咨询课程


服务体系


看完被吓着了?这玩意学不会可咋整啊?

大魔头是不会让你以智商为理由逃跑的,
我们为大家配备了全一线工程师的助教团队,
严防死守以学不会为由的逃兵出现!



  • 全职助教实时答疑



看视频的时候:"诶?这步怎么推导出来的呢?"
编程跑项目实践的时候:"诶?这段代码是干嘛的呢?"
看论文的时候:"诶?为什么好像看懂了,又不知道在讲什么呢?"
不管你在学习过程中遇到多少阻碍,你都可以通过以下4种方式解决:
  • 直接在线问导师;

  • 或者记录到共享文档中,等待每日固定时间的直播答疑;

  • 学习社群中全职助教,24h随时提问答疑

  • 共同的问题在Review Session里面做讲解


注:每次答疑,班主任都会进行记录,以便学员实时查阅。


来自师兄师姐的疑问:




  • 编写一些技术类文章



通过在知乎上发表相关技术文章进行自我成果检验,同时也是一种思想碰撞的方式,导师会对发表的每一篇文章写一个详细的评语。万一不小心成为一个大V了呢?
虽然写文章的过程万分痛苦,学习群里半夜哀嚎遍野,但看一看抓着头发写出来的文章结果还是非常喜人的!看着自己收获的点赞数,大家都默默地感谢起大魔头的无情!






这种满满的成就感,让大家一篇接一篇写了下去!

个个都立刻变身成了知乎大牛~


  • Project项目



除了文章,算法工程师立命的根本--项目代码,大魔头更是不会放过的。每次在Gitlab上布置的作业,大魔头都会带领助教团队会予以详细的批改和反馈。并逼着你不断的优化!








课程导师

看了这么多,是不是非常崇拜设计出如此地狱式学习计划的大牛,那就来正式认识一下这位训练营中人人听了都闻风丧胆,但又让人崇拜+喜爱+欲罢不能的训练营大魔头:

李文哲

NLP、知识图谱领域专家


美国南加州大学博士,曾任凡普金科(爱钱进)首席科学家,美国亚马逊/高盛高级工程师,AI量化投资公司首席科学家兼投资总监。在AAAI, KDD, AISTATS等顶会上发表过15篇以上论文,其中3篇获得Best Paper Award,累计数百次引用。


毕业标准


进去企业敲门砖的”毕业证“如何得到?
大魔头之所以是大魔头不单单因为技术牛,更因为他同时掌管着训练营学员的生杀大权!光学习是怎么可以的,我们的训练营是有考核的!
大魔头给学习成果定义了充分的可量化标准。贪心学院红头文件晒给你看:




  • 考核机制


我们也有严格的考核机制,包括项目作业的完成度、直播到课率、文章写作等要素。而且根据这些考核来确定毕业生以及优秀毕业生。针对于优秀毕业生,我们会提供很丰厚的激励机制。
再被大魔头折磨了多个日日夜夜后,大家不但没有放弃学习,而且很快乐地学习着,随便截几个图:



我确定了我们的魔鬼训练营没有误人子弟,我们的课程真的帮助到大家有人实质的技能提升或帮助大家拿到offer。今年九月,大魔头携带着他的第五期《NLP自然语言处理集中营》再度回归了。





2019NLP能这么骚,就要看你了~ 
这个被全网尊称为能找到的
最体系化,
最有挑战的,
实践性最强的,
最烧脑的,
AI自然语言处理训练营等着你们!
勇士们让我看到你们的双手~

报名方式



请扫描下面的二维码咨询课程


我们是谁?我们是一家专注于人工智能领域的在线教育公司,由一群有情怀的硅谷科学家来创办。我们提供最专业的AI课程以及每月4-5期的免费AI类公开课。关注此公众号(“贪心科技”)可以获得相关的信息。

登录查看更多
3

相关内容

条件随机域(场)(conditional random fields,简称 CRF,或CRFs),是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。 如同马尔可夫随机场,条件随机场为具有无向的图模型,图中的顶点代表随机变量,顶点间的连线代表随机变量间的相依关系,在条件随机场中,随机变量 Y 的分布为条件机率,给定的观察值则为随机变量 X。原则上,条件随机场的图模型布局是可以任意给定的,一般常用的布局是链结式的架构,链结式架构不论在训练(training)、推论(inference)、或是解码(decoding)上,都存在效率较高的算法可供演算。
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
临床自然语言处理中的嵌入综述,SECNLP: A survey of embeddings
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
120+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
学习自然语言处理路线图
专知会员服务
137+阅读 · 2019年9月24日
无惧秋招,您的地狱级NLP算法工程师训练计划请查收
夕小瑶的卖萌屋
3+阅读 · 2019年9月19日
【NLP】万字长文概述NLP中的深度学习技术
产业智能官
18+阅读 · 2019年7月7日
最流行的6大开源自然语言处理库对比
大数据技术
8+阅读 · 2018年8月14日
Python量化投资实训营
量化投资与机器学习
11+阅读 · 2018年1月30日
AI 技术人才成长路线图 | CSDN重磅发布
人工智能头条
4+阅读 · 2018年1月17日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
Word2Vec 与 GloVe 技术浅析与对比
LibRec智能推荐
25+阅读 · 2017年5月15日
Arxiv
21+阅读 · 2019年3月25日
The Evolved Transformer
Arxiv
5+阅读 · 2019年1月30日
Arxiv
6+阅读 · 2018年4月24日
VIP会员
相关VIP内容
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
临床自然语言处理中的嵌入综述,SECNLP: A survey of embeddings
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
120+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
学习自然语言处理路线图
专知会员服务
137+阅读 · 2019年9月24日
相关资讯
无惧秋招,您的地狱级NLP算法工程师训练计划请查收
夕小瑶的卖萌屋
3+阅读 · 2019年9月19日
【NLP】万字长文概述NLP中的深度学习技术
产业智能官
18+阅读 · 2019年7月7日
最流行的6大开源自然语言处理库对比
大数据技术
8+阅读 · 2018年8月14日
Python量化投资实训营
量化投资与机器学习
11+阅读 · 2018年1月30日
AI 技术人才成长路线图 | CSDN重磅发布
人工智能头条
4+阅读 · 2018年1月17日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
Word2Vec 与 GloVe 技术浅析与对比
LibRec智能推荐
25+阅读 · 2017年5月15日
Top
微信扫码咨询专知VIP会员