多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术

2022 年 3 月 14 日 机器之心


在日常工作中,Excel 表格随处可见;在 APP 或网页中,表格是清晰友好的信息传递方式;在企业中,关系型数据库无所不在。由于表格数据结构清晰、易于维护,并且对人类理解和机器理解都比较友好,表格 / 关系型数据库是各行各业应用最普遍的结构化知识存储形式。


但在表格知识的查询交互中,门槛却不低:对话系统或搜索引擎并不能很好地将表格知识作为答案查询出来,而关系型数据库的查询更需要专业技术人员撰写查询语句(如 SQL 语句)来完成,对大多数用户来讲门槛更高。在这种背景下,表格问答技术(TableQA)通过将自然语言转换为 SQL 查询语言,允许用户使用自然语言与表格知识直接交互,为表格知识的大规模交互使用铺平了道路。


近些年来,TableQA 任务得到了学术界及工业届的共同关注,并取得了飞速的发展。而 Text-to-SQL 作为 TableQA 的核心技术 ,学术界推出了包括单表单轮 WikiSQL、多表单轮 Spider、多表多轮 SParC 和对话式 CoSQL 等四个权威的国际公开数据集及榜单。面向这四大榜单,达摩院提出了 SDSQL、S²SQL、R²SQL 等一系列工作,先后在这四大国际权威榜单上取得第一,相关论文已经被 AAAI、ACL 等顶级会议接收。同时,达摩院致力于将 TableQA 技术落地为产品,在阿里云智能客服中开始规模化推广,成为具备差异化竞争力的新产品。


在机器之心 3 月 16 日的技术分享中,阿里巴巴达摩院算法工程师惠彬原将为读者详细解读他们在 TableQA 技术方向上的探索与创新。


分享主题:四大榜单第一名、首个中文预训练表格模型开源,达摩院 TableQA 技术让表格说话


分享嘉宾:惠彬原,阿里巴巴达摩院算法工程师。他 15 岁考入大学,硕士期间在达摩院智能对话团队实习一年,毕业后加入团队成为正式员工。研究领域为自然语言处理,具体方向包括语义解析、智能对话、大规模预训练模型等。他曾在 ACL / AAAI 等顶会上发表多篇论文并多次担任 ACL / EMNLP / NAACL / AAAI 等会议审稿人。


分享摘要:在过去两年时间里,阿里达摩院对话智能团队(Conversational AI)围绕 TableQA 做了一系列探索,先后在四大国际权威榜单(WikiSQL、Spider、SParC、CoSQL)上取得第一,相关论文已经被 AAAI、ACL 等顶级会议接收,并且开源了首个中文预训练表格模型。本次分享将对达摩院在 TableQA 技术方向的体系化创新进行详细介绍。


相关链接:

  • https://ojs.aaai.org/index.php/AAAI/article/view/17550

  • https://github.com/alibaba/AliceMind/blob/main/SDCUP/README.md


直播时间:3 月 16 日 19:00-20:00


直播间:关注机动组视频号,3 月 16 日开播。

直播群:识别下方二维码,即可加入本次直播交流群。

如群已超出人数限制,请添加机器之心小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「表格」即可加入。


招聘贴:达摩院对话团队启动了校招实习生招聘,面向 2022.11 – 2023.10 毕业的博士 / 硕士。感兴趣的小伙伴请踊跃报名哦

实习生的主要任务为前沿对话技术的研究和探索,研究方向(包括但不限于)如下:


1. 多模态对话系统构建

2. 大规模预训练对话模型

3. 有温度有情感的对话

4. 开箱即用的对话系统

5. 问答对话一体的系统


工作地点在北京望京,需要现场实习(非远程)。


团队简介:达摩院对话智能(Conversational AI)团队成立于 2014 年,专注于 Conversational AI 的前沿研究和大规模应用,打造了任务型对话开发平台 Dialog Studio 以及 KBQA、TableQA、FAQs、Doc2bot 等智能问答技术,在 ACL/EMNLP/AAAI/IJCAI/WWW/CIKM 等顶会发表多篇论文。基于上述技术打造的阿里云智能客服(即云小蜜),在国内智能客服领域处于领先位置,在中国移动、中国人寿、政务 12345 热线等企业或组织大规模应用。 面对新冠疫情,我们打造了全国最大的智能疫情外呼机器人平台,服务全国 27 省份,免费拨打 1800 万通电话,获得人民网「人民战疫」一等奖。


联系方式:binyuan.hby@alibaba-inc.com


机器之心 · 机动组 


机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。

  • 点击阅读原文,访问机动组官网,观看往期回顾;
  • 关注机动组服务号,获取每周直播预告。
登录查看更多
1

相关内容

关系数据库 ,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。
专知会员服务
54+阅读 · 2021年2月2日
达摩院基于元学习的对话系统
专知会员服务
24+阅读 · 2021年1月1日
【北京大学冯岩松】基于知识的自然语言问答
专知会员服务
44+阅读 · 2020年11月15日
美团NLP中心算法实习生招聘
夕小瑶的卖萌屋
0+阅读 · 2021年12月1日
2019语言与智能技术竞赛报名开启
中国计算机学会
16+阅读 · 2019年2月26日
深度 | 复旦肖仰华:基于知识图谱的问答系统
全球人工智能
27+阅读 · 2017年9月7日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月16日
Arxiv
30+阅读 · 2021年7月7日
VIP会员
相关VIP内容
专知会员服务
54+阅读 · 2021年2月2日
达摩院基于元学习的对话系统
专知会员服务
24+阅读 · 2021年1月1日
【北京大学冯岩松】基于知识的自然语言问答
专知会员服务
44+阅读 · 2020年11月15日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员