第十六届中国中文信息学会暑期学校暨《前沿技术讲习班》(CIPS ATT)在京召开

2021 年 7 月 28 日 哈工大SCIR

声明:本文转载自 中国中文信息学会 公众号


2021年7月22日-25日,庆祝中国中文信息学会成立40周年系列活动 - 第十六届中国中文信息学会暑期学校暨《前沿技术讲习班》第二十三期和第二十四期在京举行。本届讲习班主题为:预训练语言模型的基础理论与方法及其典型应用。讲习班吸引了来自全国各高校及科研院所的专家、学者、学生、产业界研发人员等近400人参加。


哈尔滨工业大学车万翔教授、清华大学刘知远副教授、中国科学院自动化研究所张家俊研究员担任本届讲习班的学术主席。刘知远副教授和车万翔教授分别致开幕辞,先后介绍了讲习班的课程内容和特邀讲者,并欢迎学员们来京参会!


讲习班邀请了哈尔滨工业大学车万翔教授、科大讯飞崔一鸣研究员、微软亚洲研究院董力研究员、百度公司孙宇研究员、清华大学刘知远副教授、循环智能杨植麟博士、复旦大学邱锡鹏教授、上海交通大学赵海教授、字节跳动王明轩研究员、清华大学黄民烈副教授、中国人民大学赵鑫副教授和陈旭助理教授、中科院计算所郭嘉丰教授和范意兴助理研究员、清华大学兰艳艳研究员、中科院自动化所刘康研究员和中科院软件所韩先培研究员在不同的方向作了系统深入的讲解,并对预训练模型及其各领域的应用提出了未来的研究方向。


7月22日,车万翔教授和崔一鸣研究员作题为《自然语言处理:基于预训练模型的方法》的报告,重点介绍基于预训练模型的自然语言处理技术,包括基础知识、预训练词向量和预训练模型三大部分。基础知识部分介绍自然语言处理和深度学习的基础知识和基本工具;预训练词向量部分介绍静态词向量和动态词向量的预训练方法及应用方法;预训练模型部分介绍几种典型的预训练语言模型和应用,以及预训练模型的最新进展。除理论知识外,还结合具体代码进行深入介绍,达到理论和实践的统一。 

                车万翔教授作题为《自然语言处理:基于预训练模型的方法》的报告


崔一鸣研究员作题为《自然语言处理:基于预训练模型的方法》的报告


7月23日上午,董力研究员作题为《跨语言预训练模型》的报告,主要介绍跨语言预训练的最新研究进展与趋势,对当前跨语言预训练方法、微调技术进行梳理;同时,还介绍了跨语言文本理解与生成的常用评测方式。此外,对当前跨语言预训练研究面临的挑战进行了探讨。


孙宇研究员作题为《跨模态预训练模型》的报告,融合跨模态知识、跨模态对抗训练、多个模态统一建模等是跨模态预训练的新思路。报告针对语言-视觉、语言-语音跨模态预训练,介绍该领域最新的进展和趋势。


董力研究员作题为《跨语言预训练模型》的报告


孙宇研究员作题为《跨模态预训练模型》的报告


下午,刘知远副教授作题为《知识指导的预训练语言模型》的报告,作为典型的数据驱动方法,以预训练语言模型为代表的深度学习仍然面临可解释性不强、鲁棒性差等难题,如何将人类积累的大量语言知识和世界知识引入模型,是改进深度学习性能的重要方向,同时也面临很多挑战。报告系统介绍了知识指导的预训练语言模型的最新进展与趋势。


杨植麟博士作题为《面向生成的预训练模型》的报告,探讨如何在纷繁复杂的任务体系和架构体系当中寻找统一的解决方案,其中将重点讨论「生成理解一体化」的思想,讨论基于生成的方式如何统一预训练和微调任务。同时,报告还讨论了基于生成的思想在少样本学习、知识探测、诗歌生成等下游任务的应用,以及基于生成的预训练模型在工业界对话理解场景的落地案例。


刘知远副教授作题为《知识指导的预训练语言模型》的报告


杨植麟博士作题为《面向生成的预训练模型》的报告


7月24日上午,邱锡鹏教授作题为《预训练模型在NLP基础任务中的应用》的报告,介绍预训练模型在NLP基础任务上的应用,包括中文分词、词性标注、命名实体识别、文本分类等。主要内容为1)如何在下游任务精调预训练模型;2)在NLP基础任务上的应用;3)重点介绍了一种统一生成框架,可以用来解决众多NLP基础任务。


赵海教授作题为《预训练模型在机器阅读理解任务中的应用》的报告,主要探讨语言模型、表示对于机器阅读理解的技术性影响,包括技术演化的时间线、现状和挑战,特别是最近一年的最新进展和一些个人新的思考。


邱锡鹏教授作题为《预训练模型在NLP基础任务中的应用》的报告


赵海教授作题为《预训练模型在机器阅读理解任务中的应用》的报告


下午,王明轩研究员作题为《机器翻译的预训练方法》的报告,报告围绕单语预训练、多语言预训练、多模态预训练三个方面来介绍机器翻译中利用预训练提升的最新进展。预训练在机器翻译中需要达到三个目标:设计有效目标从而适应翻译任务;充分利用大量单语和有限双语、文本和不同模态数据;拉近跨语言跨任务表示。通过预训练和细调方法,在双语翻译,多语言联合翻译(包括zero-shot场景),语音翻译,图像辅助翻译等不同翻译场景都取得了显著提升。


黄民烈副教授作题为《基于预训练模型的对话系统》的报告,报告围绕基于预训练模型的对话系统,阐述其中重要的问题、挑战,以及最新的方法,特别是大数据、大模型下的框架和任务设计。


王明轩研究员作题为《机器翻译的预训练方法》的报告


黄民烈副教授作题为《基于预训练模型的对话系统》的报告


7月25日上午,赵鑫副教授和陈旭助理教授作题为《预训练模型在推荐系统中的应用》的报告,聚焦预训练模型在推荐系统领域的应用,对最近几年的相关研究进行简要梳理和回顾,主要内容包括:1)基础背景:预训练模型和推荐系统的相关背景知识;2)预训练模型在推荐系统中应用的动机和挑战:为什么预训练模型在推荐系统领域受到广泛关注,应用过程中的主要难点是什么;3)预训练模型在推荐系统中的应用策略和相关方法:如何更好地利用推荐系统中用户的行为数据、设计更好的模型架构和学习算法;4)预训练模型在推荐系统中应用的未来展望:该领域亟待解决的问题和未来的发展方向。


郭嘉丰研究员和范意兴助理研究员作题为《预训练模型在信息检索中的应用》的报告,聚焦预训练模型在信息检索中的应用,对最近几年的相关研究进行系统的梳理和回顾。主要内容包括:1)基础背景:信息检索的相关背景知识介绍;2)预训练模型在检索召回阶段的应用:包括预训练模型在传统稀疏检索框架下的应用以及基于预训练模型的稠密检索方法;3)预训练模型在重排序阶段的应用:包括基于预训练模型的表示学习、交互学习建模方法与模型加速,以及基于生成模型的排序建模等;4)面向信息检索的预训练模型设计:如何构建满足信息检索任务需求的自监督学习任务,进一步提升信息检索的性能。


赵鑫副教授作题为《预训练模型在推荐系统中的应用》的报告


陈旭助理教授作题为《预训练模型在推荐系统中的应用》的报告


郭嘉丰研究员作题为《预训练模型在信息检索中的应用》的报告


范意兴助理研究员作题为《预训练模型在信息检索中的应用》的报告


下午,兰艳艳研究员作题为《学术论文写作的一些体会》的报告,结合个人研究背景和经历,主要介绍了学术论文写作的一些体会,包括逻辑的重要性,3W2H写作法则,论文的润色技巧,复盘与提高等。


刘康研究员和韩先培研究员作题为《Research:the Good, the Bad and  the Ugly》的报告,介绍两位讲者在多年的科研经历中遇到过、看到过、听到过的Good、Bad、Ugly的科研方法(包括但不限于其中的故事、心态、理念、方法等),希望对于同学们的学习、科研和生活有所帮助。


兰艳艳研究员作题为《学术论文写作的一些体会》的报告


刘康研究员和韩先培研究员作题为《Research:the Good, the Bad and  the Ugly》的报告


会场照片


本期责任编辑:冯骁骋

本期编辑:冯   晨



哈尔滨工业大学社会计算与信息检索研究中心

理解语言,认知社会

以中文技术,助民族复兴

登录查看更多
2

相关内容

中国中文信息学会成立于1981年6月。钱伟长、甄健民、安其春等为主要发起人。

中国中文信息学会是依法成立并经中国科学技术协会接纳的科学技术工作者的学术性群众团体,是具有独立社团法人资格的国家一级学会。

学会的宗旨是提倡辨证唯物主义,坚持实事求是的科学态度,贯彻“百花齐放,百家争鸣”的方针,充分发扬民主,开展学术上的自由讨论。团结中文信息处理学科的广大科技工作者及海外学术界朋友,为促进学科发展、繁荣我国中文信息处理事业而努力。

中国中文信息学会是党领导下的科技工作者的群众组织,是党和政府联系科技工作者的桥梁和纽带。在不断深化改革,继续拓展新的工作领域的同时,进一步树立学术交流主渠道、科普工作主力军、国际民间科技交流重要代表和“科技工作者之家”的鲜明社会形象,努力建成具有中国特色的科技工作者自己的组织。

学会的学术研究内容是利用计算机对汉语的音、形、义等语言文字信息进行的加工和操作,包括对字、词、短语、句、篇章的输入、输出、识别、转换、压缩、存储、检索、分析、理解和生成等各方面的处理技术。中文信息处理学科是在语言文字学、计算机应用技术、人工智能、认知心理学和数学等相关学科的基础上形成的一门新兴的边缘学科。

学会始终把开展国内外学术交流作为中心工作,并开展技术咨询服务、办好学会刊物,编辑出版学术书刊等。中国中文信息学会和挂靠单位中国科学院软件研究所联合主办的学术刊物是《中文信息学报》。

2011年12月产生学会第七届理事会:

理事长:李生
      副理事长:黄河燕 刘庆峰 刘迎建 施水才 孙乐 孙茂松 吾守尔•斯拉木 徐 波 张桂平
      秘书长:孙 乐

2006年11月产生学会第六届理事会:

理事长:倪光南
      副理事长:曹右琦(女,常务副理事长) 陈肇雄 李 生 刘迎建 孙茂松 徐 波 赵 琛
      秘书长:孙 乐

【动态】2021年全国心理测试技术与微表情研究高峰论坛成功举办
中国图象图形学学会CSIG
0+阅读 · 2022年1月11日
SMP 2021 前沿讲习班
哈工大SCIR
0+阅读 · 2021年7月12日
新闻 | 第二届THUNLP & HIT-SCIR学术联谊会成功举办
哈工大SCIR
2+阅读 · 2021年6月3日
国家自然科学基金
3+阅读 · 2018年6月30日
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
2+阅读 · 2015年5月31日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
0+阅读 · 2012年9月30日
国家自然科学基金
0+阅读 · 2012年8月29日
国家自然科学基金
1+阅读 · 2012年3月31日
国家自然科学基金
6+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
13+阅读 · 2022年1月20日
Arxiv
11+阅读 · 2018年1月15日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
3+阅读 · 2018年6月30日
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
2+阅读 · 2015年5月31日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
0+阅读 · 2012年9月30日
国家自然科学基金
0+阅读 · 2012年8月29日
国家自然科学基金
1+阅读 · 2012年3月31日
国家自然科学基金
6+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员