在日常工作中,Excel 表格随处可见;在 APP 或网页中,表格是清晰友好的信息传递方式;在企业中,关系型数据库无所不在。由于表格数据结构清晰、易于维护,并且对人类理解和机器理解都比较友好,表格 / 关系型数据库是各行各业应用最普遍的结构化知识存储形式。
但在表格知识的查询交互中,门槛却不低:对话系统或搜索引擎并不能很好地将表格知识作为答案查询出来,而关系型数据库的查询更需要专业技术人员撰写查询语句(如 SQL 语句)来完成,对大多数用户来讲门槛更高。在这种背景下,表格问答技术(TableQA)通过将自然语言转换为 SQL 查询语言,允许用户使用自然语言与表格知识直接交互,为表格知识的大规模交互使用铺平了道路。
近些年来,TableQA 任务得到了学术界及工业届的共同关注,并取得了飞速的发展。而 Text-to-SQL 作为 TableQA 的核心技术 ,学术界推出了包括单表单轮 WikiSQL、多表单轮 Spider、多表多轮 SParC 和对话式 CoSQL 等四个权威的国际公开数据集及榜单。面向这四大榜单,达摩院提出了 SDSQL、S²SQL、R²SQL 等一系列工作,先后在这四大国际权威榜单上取得第一,相关论文已经被 AAAI、ACL 等顶级会议接收。同时,达摩院致力于将 TableQA 技术落地为产品,在阿里云智能客服中开始规模化推广,成为具备差异化竞争力的新产品。
在机器之心 3 月 16 日的技术分享中,阿里巴巴达摩院算法工程师惠彬原将为读者详细解读他们在 TableQA 技术方向上的探索与创新。
分享主题:四大榜单第一名、首个中文预训练表格模型开源,达摩院 TableQA 技术让表格说话
分享嘉宾:惠彬原,阿里巴巴达摩院算法工程师。他 15 岁考入大学,硕士期间在达摩院智能对话团队实习一年,毕业后加入团队成为正式员工。研究领域为自然语言处理,具体方向包括语义解析、智能对话、大规模预训练模型等。他曾在 ACL / AAAI 等顶会上发表多篇论文并多次担任 ACL / EMNLP / NAACL / AAAI 等会议审稿人。
分享摘要:在过去两年时间里,阿里达摩院对话智能团队(Conversational AI)围绕 TableQA 做了一系列探索,先后在四大国际权威榜单(WikiSQL、Spider、SParC、CoSQL)上取得第一,相关论文已经被 AAAI、ACL 等顶级会议接收,并且开源了首个中文预训练表格模型。本次分享将对达摩院在 TableQA 技术方向的体系化创新进行详细介绍。
相关链接:
https://ojs.aaai.org/index.php/AAAI/article/view/17550
https://github.com/alibaba/AliceMind/blob/main/SDCUP/README.md
直播时间:3 月 16 日 19:00-20:00
直播间:关注机动组视频号,3 月 16 日开播。
直播群:识别下方二维码,即可加入本次直播交流群。
如群已超出人数限制,请添加机器之心小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「表格」即可加入。
招聘贴:达摩院对话团队启动了校招实习生招聘,面向 2022.11 – 2023.10 毕业的博士 / 硕士。感兴趣的小伙伴请踊跃报名哦
实习生的主要任务为前沿对话技术的研究和探索,研究方向(包括但不限于)如下:
1. 多模态对话系统构建
2. 大规模预训练对话模型
3. 有温度有情感的对话
4. 开箱即用的对话系统
5. 问答对话一体的系统
工作地点在北京望京,需要现场实习(非远程)。
团队简介:达摩院对话智能(Conversational AI)团队成立于 2014 年,专注于 Conversational AI 的前沿研究和大规模应用,打造了任务型对话开发平台 Dialog Studio 以及 KBQA、TableQA、FAQs、Doc2bot 等智能问答技术,在 ACL/EMNLP/AAAI/IJCAI/WWW/CIKM 等顶会发表多篇论文。基于上述技术打造的阿里云智能客服(即云小蜜),在国内智能客服领域处于领先位置,在中国移动、中国人寿、政务 12345 热线等企业或组织大规模应用。 面对新冠疫情,我们打造了全国最大的智能疫情外呼机器人平台,服务全国 27 省份,免费拨打 1800 万通电话,获得人民网「人民战疫」一等奖。
联系方式:binyuan.hby@alibaba-inc.com
机器之心 · 机动组
机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。