声明:本文转载自公众号 社媒派SMP。
欢迎来到SMP机器人群聊比赛(SMP Multi-bot Conversation Challenge, )。
人机对话技术是人工智能领域的一个重要研究方向,从手机智能助手,到闲聊陪护型聊天机器人,再到各种面向场景的任务型对话系统平台和智能家居,人机对话系统渐渐融入人类社会的日常运行中,促进了将来人机共融社会的发展。然而,目前的人机对话仅限于人机双方的对话模式,而更具挑战的人机多方混合对话乃至机器人多方群聊的任务在研究和应用上鲜有涉及。
SMP机器人群聊比赛()由中国中文信息学会社会媒体处理专委会社交机器人工作组主办,天津大学新媒体与传播学院承办。本次比赛旨在促进人机对话技术在多方对话场景上的发展,充分挖掘人机对话技术在各种应用场景下的潜力,为人机对话技术相关的学术界研究人员和产业界从业人员提供一个良好的沟通平台。在此,我们诚邀各个单位参加SMP机器人群聊比赛()!
任务描述
在机器人群聊场景中,已知群聊主题和历史消息记录,要求生成符合群聊主题和上下文逻辑的回复。所生成的回复需要流畅且与群聊对话主题相关。
任务说明
群聊主题
在任务中,我们会给定群聊主题,在每个主题下进行轮对话(N表示参与群聊机器人总数)。其中,主题包括但不限于医疗、交通、教育、金融等。
轮转策略
在某个群聊主题下,我们将按一定策略初始化机器人回复顺序,确保所有机器人的回复优先级总体相同。而在其他群聊主题中,我们将多次轮番调换机器人回复顺序,以保证最终评分环境的公平性。
消息决策
在评测任务中,当我们向每个机器人请求回复时,会提供当前群聊主题和历史消息记录。参赛队伍需要根据群聊主题和历史消息记录进行相关决策,以生成合理的回复。
接口设定
参赛队伍需要提供聊天机器人的接口API,我们将使用该接口API进行群聊评测。需要注意的是,接口API的阻塞时间为10s。若超时未回复,则标记回复失败,多次回复失败将影响最终评测得分。
接口API的交互数据格式如下:
1# 数据编码格式均为UTF-8
2
3# 输入消息数据格式
4data = {
5 # 当前群聊id
6 "group_id": group_id,
7 # 当前群聊主题
8 "topic": topic,
9 # 自该机器人上次回复之后的消息记录(按时间先后顺序)
10 "msgs":[
11 {
12 "from_id": robot_id,
13 "msg": msg
14 },
15 ...
16 ]
17}
18
19# 回复消息数据格式
20resp = {
21 # 当前群聊id
22 "group_id": group_id,
23 # 回复机器人id
24 "from_id": robot_id,
25 # 回复消息
26 "msg": msg
27}
训练数据
参赛队伍可以使用包括但不限于医疗、交通、教育、金融等主题的多方对话数据进行模型训练。
自动评价
初赛阶段采用自动评价指标,参赛队伍需提交自己的聊天机器人接口API。机器人在群聊中的性能表现将会作为排名依据。
自动评测所使用的指标包括:
Topic:评估输出回复和群聊主题的相关程度。
Perplexity:评估输出回复的流畅性。
Distinct:评估输出回复的多样性。
BLEU:评估输出回复相对于参考回复的N-gram重合度。
部分指标说明:
Topic:设生成回复, 群聊主题,主题分类模型,则有用于计算回复的主题相关程度。
BLEU:设输入消息集合, 我们将使用相关技术手段获得的参考回复集合,然后计算和的N-gram重合度。
我们将综合考虑四个指标来进行初赛排名。
人工评价
决赛阶段,我们将选取初赛排名靠前的聊天机器人进行人工评估,使用众包的方式对群聊中每个机器人的回复在如下三个方面进行评价:
Topic:生成的回复是否符合当前群聊主题(考虑主题)。
Fluency:生成回复的表达是否流畅,无语法错误(考虑句子)。
Appropriateness:生成的回复是否符合人们的日常交流习惯(考虑上下文语境)。
其中,在每个指标上至少有5个人进行评价,每个指标评分取值集合为,0表示差,1表示一般,2表示好。
决赛排名将以人工评估结果为依据。
注:此次比赛中我们将采取匿名评测,即对外只公布参赛队伍的代号和评测成绩,不公布参赛队伍的具体信息。
有意向参加的单位机构请直接填写在线报名表(可点击原文链接,也可扫描下方二维码)。
报名存在任何问题,请联系评测会务组:smp_mcc@163.com
以下所有时间点为北京时间(GMT+8)11:59 PM。
时间 | 任务 | 形式 |
---|---|---|
2019年6月28日-2019年8月28日 | 报名 | 在线 |
2019年8月31日 | 发布群聊主题 | 在线 |
2019年9月1日-2019年11月15日 | 参赛队伍系统开发 | codalab在线 |
2019年10月15日 | 预评测(开发集) | codalab在线 |
2019年11月16日 | 正式评测(初赛) | codalab在线+直播 |
2019年11月17日-2019年11月31日 | 人工评测(复赛) | 人工标注评测 |
2019年12月14日 | 召开论坛 | 参赛队伍技术报告+主题报告 |
组织委员会: 张洪忠(北京师范大学)、黄民烈(清华大学)、张伟男(哈尔滨工业大学)、王赞(天津大学)
如果有任何与本次评测相关的问题,请随时联系会务组。
评测会务组邮箱:smp_mcc@163.com
主办方:中国中文信息学会社会媒体处理专委会社交机器人工作组
承办方:天津大学新媒体与传播学院
天津大学新媒体与传播学院(新传学院)成立于2019年,学院依托天津大学的学术资源,联合优质社会力量,探索新文科与新工科交叉的建设模式,以贯通“理工文管”为理念,坚持技术驱动和学科交叉,找准大数据及人工智能等技术与新闻传播学科的结合点,高起点建设“中国特色、世界一流、天大品格”的新媒体交叉学科平台。
截至目前,学院共聘任专兼职教师25人,在自然语言处理、文本挖掘、社会化媒体与政治传播等领域开展交叉学科研究。新媒体研究院作为学院的内设机构,首批研究生已入校,并已完成2019级硕士研究生招生复试工作。学院在学校新老校区均具有独立办学空间,并建有融媒体大数据分析平台。
未来,新传学院将继续引进新闻传播与计算领域高端学者,培养本、硕、博复合型新闻传播人才,贡献高水平的新媒体研究成果和智库服务,努力建成智能时代下的新媒体与传播学院。
本期责任编辑:崔一鸣
本期编辑:刘元兴
“哈工大SCIR”公众号
主编:车万翔
副主编: 张伟男,丁效
责任编辑: 张伟男,丁效,刘一佳,崔一鸣
编辑: 李家琦,吴洋,刘元兴,蔡碧波,孙卓,赖勇魁
长按下图并点击 “识别图中二维码”,即可关注哈尔滨工业大学社会计算与信息检索研究中心微信公共号:”哈工大SCIR” 。