CNCC技术论坛|自然语言生成:机器写作背后的技术

2018 年 9 月 19 日 中国计算机学会

除了理解人类的语言,机器开始用自然语言生成对话、报道、诗歌、甚至议论文。本论坛旨在揭秘支撑人工智能文字创作背后的技术。


时间:2018年10月26日13:30-17:30

地点:杭州国际博览中心会议区二层新闻发布厅A


随着深度计算的发展,自然语言生成获得了新的发展机遇。从 2015 年开始,腾讯、今日头条、南方都市报等先后采用写稿机器人,单篇成文的速度可达到0.5秒。2014年以来,自然对话也被认为是下一代人机交互的关键技术获得了长足发展,开放域聊天机器人(如微软小冰)和客服型机器人(如阿里小蜜)均有上线的产品和海量的用户。对话生成近年来也在自然语言处理会议上逐渐升温。除此之外,研究人员对其他文体也做出尝试。2017年人类历史上第一本百分之百人工智能创作的诗集《阳光失了玻璃窗》正式出版,作者正是微软小冰。这个论坛,我们有幸请到了从事自然语言生成的一线科学家们,为大家揭秘支撑人工智能对话和写作的关键技术。

论坛主席




万小军


万小军,北京大学计算机科学技术研究所研究员,博士生导师,语言计算与互联网挖掘研究室负责人。研究方向为自然语言处理与文本挖掘,研究兴趣包括自动文摘与文本生成、情感分析与语义计算等。担任计算语言学顶级国际期刊Computational Linguistics编委,TACL常务评审,多次担任自然语言处理与人工智能领域一流国际会议领域主席(Area Chair) 或高级程序委员(SPC),包括ACL、NAACL、EMNLP、IJCAI、AAAI等。荣获ACL2017杰出论文奖、IJCAI 2018杰出论文奖、2017年吴文俊人工智能技术发明奖、CCF NLPCC青年新锐奖等多项荣誉或奖励。


报告题目:机器写作:从学术研究到落地应用的荆棘之路


报告摘要:机器写作近年来受到学术界和产业界的热捧,我们能看到各类研究方法和落地应用的兴起。本次讨论将探讨机器写作领域学术研究与产业应用之间的巨大鸿沟及其背后的原因,同时总结学术研究成果在实际落地应用过程中面对的困难以及可能的解决办法。

特邀嘉宾





秦  兵


秦兵,哈尔滨工业大学计算机学院教授、博士生导师。哈尔滨工业大学社会计算与信息检索中心副主任。中国中文信息学会理事、中国中文信息学会语言与知识计算专委会副主任,中国计算机学会中文信息技术专委会委员。主要研究方向:文本生成、知识图谱、情感分析等。在ACL、IJCAI、AAAI、IEEE TKDE、IEEE TASLP等国内外顶级会议及重要期刊上发表论文80余篇,主持多项国家基金委项目和国家科技部863项目,在NLPCC2018情感对话生成评测获的第二,主持开发了863项目语文卷答题系统。同时和多家互联网企业开展合作,多项研究成果进入企业产品。获中文信息学会钱伟长中文信息处理科学技术奖一等奖、黑龙江省技术发明一等奖、黑龙江省技术发明二等奖。


报告题目:高考作文中的议论文自动题意分析及生成


报告摘要 :文本生成是目前的人工智能研究热点,高考议论文相比于其他文本生成任务,更加侧重于篇章的论点分析及篇章生成的内容组织。本次讨论重点关注高考作文中的立意分析、根据题意分析获得的论点及分论点以及进一步在此基础上生成议论文技术。




范  欣


范欣,腾讯新闻产品技术部算法中心总监,专家研究员。目前负责腾讯新闻的内容理解、个性化推荐和创新业务的算法。腾讯新闻写稿机器人Dreamwriter的技术负责人。2007年毕业于中科大-微软联合培养博士项目,有多年的搜索和个性化推荐的产品和研究经验。


报告题目:资讯内容理解和辅助创作


报告摘要:本次讨论将分享腾讯新闻在个性化推荐的背景下,完善资讯内容理解和兴趣表征的构建,并利用文本、图像、视频多模态内容分析,简化内容生产流程、提升内容产出效率和质量。以及算法在事实报道、简报、短视频等领域的自动创作的探索。从而分析研究如何更加有效地和一线产品业务结合,进行业务驱动下的研究结果落地。



     

武  威


武威,现任微软首席科学家,他于2012年加入微软亚洲研究院自然语言计算组,并于2016-2017年担任主管研究员。他于2007年在北京大学数学科学学院获得理学学士学位,并于2012年于北京大学数学科学学院概率统计系获得博士学位。他的研究兴趣包括自然语言处理,机器学习,以及信息检索。武威博士在ACL, EMNLP, AAAI, IJCAI, WSDM, CIKM, 以及JMLR等自然语言,人工智能,信息检索,以及机器学习的顶级会议期刊上发表超过25篇文章,并长期担任NIPS,ICML,AAAI, IJCAI, SIGIR,WWW,WSDM,KDD,ACL等顶级会议的程序委员会成员。他目前的研究的重心是自然人机对话。他为微软小冰第二代到第六代对话引擎贡献了核心算法。他最近的成就是带领团队研发了第五代小冰的生成模型以及第六代小冰的共感模型。


报告题目:开放域对话生成及在微软小冰中的实践


报告摘要:自然人机对话是自然语言以及人工智能的基本问题之一。近几年,随着深度学习以及强化学习的理论实践发展,基于人工神经网络的对话生成模型受到了学界和工业界的广泛重视。本报告主要介绍基于人工神经网络的开放域对话生成模型。报告内容涵盖开放域对话生成所面临的基本问题,针对这些问题的一些解决方案,以及报告人在微软小冰产品上的一些实践经验。



黄民烈


黄民烈,清华大学计算机系副教授,博士生导师,人工智能研究所副所长。研究兴趣主要集中在自然语言处理如自动问答、对话系统、情感与情绪智能等。已超过60篇CCF A/B类论文发表在ACL、IJCAI、AAAI、EMNLP、ACM TOIS等国际顶级或主流会议及期刊上。获得IJCAI-ECAI 2018杰出论文奖,获得NLPCC 2015最佳论文,其关于情绪化聊天机器人的工作被MIT Technology Review、NVIDIA、英国卫报(The Guardian)、参考消息、新华社等媒体广泛报道。曾担任多个国际顶级会议的领域主席或高级程序委员,如AAAI2019、IJCAI2018、IJCAI2017、ACL2016、EMNLP2014/2011等。


报告题目:语言生成中的一致性和逻辑问题


报告摘要:语言生成是自然语言处理中重要、且极具挑战性的问题,需要语义、知识、逻辑等综合性的信息。我讲以对话生成为例,探索如何生成一致性、逻辑性更好的自然语言文本,特别是在语言生成中如何有效地利用知识。




宋睿华


宋睿华,微软(亚洲)互联网工程院小冰首席科学家。2003年于清华大学获得学士硕士学位后,加入微软亚洲研究院,曾任主管研究员,主要研究方向为信息检索和数据挖掘。2011年,她获得了上海交通大学计算机系的博士学位。2017年,她加入了微软(亚洲)互联网工程院,任微软小冰首席科学家,主攻方向为文本生成和人工智能。其主导研发的跨模态文本生成技术已用于人类历史上第一本百分百人工智能创作的诗集《阳光失了玻璃窗》。她曾任和现任国际数据挖掘会议CIKM的领域主席,国际信息检索会议SIGIR和国际万维网会议WWW的资深程序委员,国际信息检索、数据挖掘、人工智能方面多个国际会议(如KDD,AAAI,WSDM等)的程序委员,也曾任国际信息评价会议EVIA的主席,在国际会议和期刊上发表学术论文50余篇。


报告题目:图像激发灵感的诗歌生成


报告摘要 :2017年5月19日,湛庐文化出版了人类历史上第一本百分百人工智能(微软小冰)创造的诗集《阳光失了玻璃窗》,2017年7月到2018年8月,小冰已经为超过一千二百万的图片创作现代诗歌。本次讨论将重点介绍小冰是如何从图像生成诗歌的技术细节和我们在研究跨模态生成的最新发现。



除了特邀报告之外,论坛还安排了圆桌讨论环节,届时还有多位重量级神秘嘉宾出场,畅谈自然语言生成的难点和趋势,敬请期待。

2018中国计算机大会(CNCC2018)

[早鸟票]倒计时2天!


2018中国计算机大会(CNCC2018)将于10月25-27日在杭州国际博览中心(G20会场)举行,大会主题为「大数据推动数字经济」(Big Data Drives the Digital Economy)。届时将邀请十余位国内外计算机领域知名专家、企业家到会做特邀报告。同时还有60场技术论坛,20场活动,100个展位。


更多信息详见大会官网:http://cncc.ccf.org.cn


即日起至9月21日,报名且缴费成功即可按优惠价格参加CNCC2018! CCF会员参会、参展可享优惠。


请扫描二维码报名参会


咨询电话:010-6260 0336   邮箱:cncc_pr@ccf.org.cn


中国计算机学会 

微信号:ccfvoice           

长按识别二维码关注我们

CCF推荐

精品文章


点击“阅读原文”报名参会



登录查看更多
6

相关内容

自然语言生成(NLG)是自然语言处理的一部分,从知识库或逻辑形式等等机器表述系统去生成自然语言。这种形式表述当作心理表述的模型时,心理语言学家会选用语言产出这个术语。自然语言生成系统可以说是一种将资料转换成自然语言表述的翻译器。NLG出现已久,但是商业NLG技术直到最近才变得普及。自然语言生成可以视为自然语言理解的反向: 自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统须要决定如何把概念转化成语言。
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
【CCL 2019】结合规则蒸馏的情感原因发现方法
专知会员服务
21+阅读 · 2019年11月27日
【CCL 2019】刘康、韩先培:做失败科研的10个方法
专知会员服务
27+阅读 · 2019年11月12日
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
CNCC技术论坛 | 知识图谱引领认知智能+
中国计算机学会
22+阅读 · 2019年9月15日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
CCAI 2019|视觉语音语言多模态论坛嘉宾介绍
中国人工智能学会
12+阅读 · 2019年9月3日
CNCC技术论坛 | 计算机视觉行业的挑战与契机
中国计算机学会
6+阅读 · 2018年10月21日
CNCC技术论坛 | 知识图谱赋能数字经济
中国计算机学会
4+阅读 · 2018年9月28日
CNCC2017技术论坛 | 知识图谱遇见社交媒体
中国计算机学会
7+阅读 · 2017年11月8日
报名 | 知识图谱前沿技术课程(暨学术交流)
PaperWeekly
17+阅读 · 2017年7月10日
Arxiv
15+阅读 · 2019年6月25日
Arxiv
6+阅读 · 2018年11月1日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
10+阅读 · 2018年2月9日
VIP会员
相关VIP内容
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
【CCL 2019】结合规则蒸馏的情感原因发现方法
专知会员服务
21+阅读 · 2019年11月27日
【CCL 2019】刘康、韩先培:做失败科研的10个方法
专知会员服务
27+阅读 · 2019年11月12日
相关资讯
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
CNCC技术论坛 | 知识图谱引领认知智能+
中国计算机学会
22+阅读 · 2019年9月15日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
CCAI 2019|视觉语音语言多模态论坛嘉宾介绍
中国人工智能学会
12+阅读 · 2019年9月3日
CNCC技术论坛 | 计算机视觉行业的挑战与契机
中国计算机学会
6+阅读 · 2018年10月21日
CNCC技术论坛 | 知识图谱赋能数字经济
中国计算机学会
4+阅读 · 2018年9月28日
CNCC2017技术论坛 | 知识图谱遇见社交媒体
中国计算机学会
7+阅读 · 2017年11月8日
报名 | 知识图谱前沿技术课程(暨学术交流)
PaperWeekly
17+阅读 · 2017年7月10日
Top
微信扫码咨询专知VIP会员