第二届中国自然语言处理学生研讨会(The China Student Symposium on Natural Language Processing, CSSNLP 2021)将于2021年11月26日于线上举办,会议主办单位为中国中文信息学会(CIPS)青年工作委员会。本次会议包含特邀报告、博士生论坛、前沿论坛和学生研讨会等四个环节,主要目的是为自然语言处理研究领域内的中国青年学者提供一个学术交流平台。同时鼓励更多的青年学者关注自然语言处理前沿研究,展示最新科研成果,促进国内青年学者的思想交流和学术合作,进而推动自然语言处理在中国的发展。本次研讨会邀请了黄民烈、兰艳艳、苏劲松、魏忠钰等著名学者担任特邀嘉宾进行学术分享,并且邀请了多位优秀博士生分享研究成果和科研心得。 本次会议中的所有报告的著作权/版权由报告人所有,论文的版权/著作权遵从相关会议的约定,也提醒大家尊重作者和会议的相关权利。整个会议报告人和听众均自愿参与,主办方仅承担议程协调和会务组织工作。 感谢社区支持伙伴智源社区,及媒体支持伙伴PaperWeekly、MLNLP(机器学习算法与自然语言处理)社区的大力支持。
兰艳艳清华大学教授 报告题目:AI4Science: Opportunity and Challenge报告摘要:Artificial Intelligence has revolutionized a wide array of scientific disciplines and solved a serious of important scientific problems, such as predicting gravitational wave, tackling climate change, authomating material and chemical molecular design. In this talk, I will introduce several scientific problems we concerned in Tsinghua AIR, and how NLP techniques have been used in these research studies, e.g., Protein Structure Prediction, AI for Drug Discovery, and Genomic Regulatory Analysis. Furthermore, I will discuss about the opportunities and challenges in this new research direction.个人简介:兰艳艳,2011年博士毕业于中国科学院数学与系统科学研究院,获得概率论与数理统计专业理学博士学位,师从著名数学家马志明院士。2011年7月至2021年2月,她在中国科学院计算技术研究所工作,任研究员,2021年2月加入清华大学智能产业研究院任教授。兰艳艳博士的研究方向为信息检索,机器学习和自然语言处理,在人工智能和机器学习领域重要国际期刊和会议上发表论文100余篇。2012年获得SIGIR最佳学生论文奖,2017年获得CIKM最佳论文Runner-Up奖。入选微软学者,微软铸星计划,中国科学院青年创新促进会优秀会员,北京市智源人工智能研究院青年科学家,获得中文信息学会钱伟长中文信息处理科学技术奖一等奖。兰艳艳博士目前的团队方向为AI4Science,具体包括人工智能驱动的药物设计,人工智能辅助蛋白质结构预测和抗体设计等,近期兰艳艳博士率领的GeneBert团队提出了一个多模态自监督基因预训练模型,在致病性分析和剪切预测等任务中取得了显著提升,并获得了DeeCamp2021比赛的医疗赛道冠军和总冠军两个奖项。 苏劲松厦门大学教授 报告题目:多模态神经机器翻译报告简介:近年来,随着多模态自然语言处理研究的兴起,多模态神经机器翻译成为了神经机器翻译的重要研究方向之一。在本次报告中,报告人将首先介绍多模态神经机器翻译的任务定义和科学研究问题,然后从研究和产业应用两个维度对目前多模态神经机器翻译的研究现状进行梳理,并且对当前研究存在的问题进行总结,最后对未来的发展趋势进行了展望。个人简介:苏劲松,男,厦门大学信息学院人工智能系教授,博士生导师。2011年毕业于中国科学院计算技术研究所,获得工学博士学位。主要研究方向是自然语言处理,机器翻译,文本生成。共发表CCF-A/B论文70余篇,获得2020年钱伟长中文信息处理科学技术奖—汉王青年创新奖,2020年福建省杰出青年基金资助; 魏忠钰复旦大学副教授 报告标题:言行结合的议员建模方法研究报告摘要:议员建模是计算政治学的重要研究课题,它旨在使用量化的方法对议员的行为进行刻画。当前议员建模的研究很大程度上依赖投票数据,学者们基于议员的历史投票行为对他们的政治立场进行学习和估计。基于投票数据的建模方法存在两大问题。第一,缺乏对建模结果的证据支撑,没有途径获取议员行为背后的原因,无法捕捉其政治观点。第二,缺乏对一般性话题的泛化能力,模型无法对议员在大众话题的立场进行推理。针对这两个问题,讲者的课题组提出了结合投票行为和公开言论的议员建模框架,并探索言行结合的建模方法。在本次报告中,讲者将分享他们在这个方向已经发表的工作和正在进行的研究。个人简介:复旦大学大数据学院副教授,智能复杂体系实验室双聘研究员,博士生导师,复旦大学数据智能与社会计算实验室(Fudan DISC)负责人,香港中文大学博士,美国德州大学达拉斯分校博士后。现任中文信息学会情感计算专委会副秘书长,社交媒体处理专委会常务委员兼秘书,青年工作委员会执行委员。在自然语言处理、人工智能领域的国际会议、期刊如CL,ACL,SIGIR,EMNLP,ICML, ICLR, AAAI,IJCAI等发表学术论文70余篇。担任多个重要国际会议及期刊评审,是EMNLP 2020 多模态领域主席,EMNLP 2021 论辩挖掘与情感计算领域主席,IJCAI 2021年程序委员会高级委员(SPC)。曾获得2017年度上海市青年扬帆计划,2019年度中国中文信息学会社会媒体处理新锐奖,2020年度华为技术优秀成果奖,2021年上海市启明星计划等。