首发于MLNLP
MLNLP第二次学术研讨会圆满结束!

MLNLP第二次学术研讨会圆满结束!

MLNLP(机器学习算法与自然语言处理)是国内外最大的自然语言处理社区之一,汇聚超过50w订阅者,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步。

2021年12月19日上午9点,MLNLP第二期学术研讨会于线上正式召开。

MLNLP 2021学术研讨会是由MLNLP(机器学习算法与自然语言处理)社区和中国中文信息学会青年工作委员会联合举办的学术活动,该活动邀请国内外机器学习与自然语言处理领域知名青年学者进行报告交流,旨在加强国内外同学们之间的交流。第二期学术研讨会程序委员会主席由MLNLP学术委员会委员清华大学博士生庞天宇和MLNLP学术委员会委员德州农工大学博士生杜梦楠共同担任。我们还非常荣幸邀请到佐治亚理工学院助理教授杨笛一老师作开场致辞,并担任大会主席;斯坦福大学博士生、ICLR2021杰出论文奖获得者宋飏,中国人民大学高瓴学院助理教授、CCF优博得主李崇轩,南洋理工大学博士、Adobe研究科学家顾久祥,弗吉尼亚大学博士生、CAPWIC2021最佳海报奖陈涵洁作报告。感谢智源社区的支持。

开幕式上,程序委员会主席庞天宇首先分别介绍了MLNLP社区的性质与主要活动和中国中文信息学会青工委。感谢中国中文信息学会青年工作委员会以及智源社区的支持。

程序员委员会主席庞天宇发言

随后,佐治亚理工学院助理教授杨笛一老师进行开幕致辞,笛一老师高度肯定了MLNLP学术研讨会的意义,认为这对于同学们来说是一次非常好的学习机会,鼓励MLNLP社区越办越好。也透露了课题组常年招生,感兴趣的同学可以直接联系。 接下来笛一老师介绍了会议上将要进行报告的四位讲者。

特邀嘉宾,大会主席杨笛一老师致词
斯坦福大学博士生宋飏进行报告

第一场报告由斯坦福大学博士生,ICLR2021 杰出论文奖得主宋飏进行,报告主要内容如下:深度生成式模型是机器学习中的一样核心任务,有着从语音合成、文字生成到艺术创作的广泛应用。该报告介绍研究深度生成式模型的一个新方向。通过估计数据分布的梯度函数,我们可以构建新型的生成式模型,获得当前最佳的样本质量,似然函数,以及自由控制样本生成的过程。

中国人民大学高瓴人工智能学院助理教授李崇轩

第二场报告由中国人民大学高瓴人工智能学院准聘助理教授,CCF优博得主李崇轩老师带来,报告主要内容如下:生成模型旨在刻画数据本身的不确定性,特别适合无监督、弱监督学习环境。随着神经网络的发展,近十年来,深度生成模型在若干人工智能相关领域取得了令人瞩目的进展。本次报告将围绕建模、学习和推断这三个基本问题,从一个统一的视角阐述深度生成模型的原理,并将介绍生成对抗网络、流模型和能量函数模型等方向的前沿研究。特别地,本次报告会重点介绍如何用控制理论稳定GAN的训练、如何考虑结构化先验、如何用隐函数定义表达能力强的流模型等工作。最后,本次报告会系统地比较不同模型的优劣和适用场景。

程序员委员会主席杜梦楠发言

会议下半场由德州农工大学博士生杜梦楠主持。

第三场报告由南洋理工大学博士,Adobe研究科学家顾久祥博士进行,报告主要内容如下:文档智能可以自动从文档中提取信息并能支持许多商业应用。最近在大规模无标签文档数据集上的自我监督学习方法,为通过自我监督的目标训练模型来减少注释工作是一个非常好的方向。然而,大多数现有的文档预训练方法仍然是以语言为主导。该报告提出了一个新的统一的文档理解预训练框架。实验可以证明这种统一预训练框架可以学习到更好的联合表征,并导致下游任务的改进。

第四场报告由弗吉尼亚大学计算机科学系博士研究生陈涵洁博士进行,报告神经网络模型在对抗样本的攻击下表现出易损性和不可靠性。在自然语言处理中,这些对抗样本可通过替换同义词生成,在维持原文本语义信息不变的同时误导模型做出错误的判决。为了提高模型的鲁棒性,一种常用的方法是对抗训练,即收集对抗样本,扩充原数据集,并训练模型以保证其在原样本和对抗样本上的判决一致且正确。然而,仅关注模型的判决结果是不够的,无法保证模型在原样本和对抗样本上的预测行为一致,这样的模型在遇见未知的对抗样本时仍存在出错的风险。本报告介绍一种基于解释的对抗训练方法,保证模型在原样本和对抗样本上的预测行为一致,并做出相同的判决,最终有效提高模型的鲁棒性。

闭幕式上,杜梦楠宣布本届研讨会圆满结束,同时感谢各位讲者所做出的辛苦准备和精彩演讲、感谢组委会各位同学对于筹办本次预讲会的无私奉献,并宣布MLNLP的定期学术研讨会将继续举办,期待下次再聚!

Slides地址

链接:pan.baidu.com/s/1Z_-MLz 提取码:ocpy

关于我们

MLNLP(机器学习算法与自然语言处理) 是由国内外自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外最大的自然语言处理社区之一,汇聚超过50w订阅者,旗下包括万人顶会交流群、AI臻选汇、AI英才汇以及AI学术汇等知名品牌,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。

社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

编辑于 2021-12-19 22:59