在人工智能和大数据竞赛领域,由中国计算机学会举办的CCF大数据与计算智能大赛(CCF BDCI)一直是众多开发者追逐的顶级赛事。
本届大赛值得关注的是,百度和清华大学在算法赛道贡献了“千言:多技能对话”赛题。不仅如此,大赛在原有赛道外,首度设立了全新的“自主平台”赛道,百度首发 “遥感影像地块分割” 赛题,飞桨作为该赛题的指定深度学习平台为选手提供技术支持。两道赛题总奖池达15万。无论你是CV还是NLP方向的开发者,这里都有你展示的舞台!
百度工程师为你答疑解惑
AI Studio练习场助你冲榜
本届大赛的赛题由来自清华和百度自然语言处理部的资深工程师亲手打造,赛题及数据均来自一线产业实践场景。
百度大脑AI Studio同步开放了【千言:多技能对话】和【遥感影像地块分割】练习场。并为各位参赛者带来了如下几大福利:
额外测试提交机会:练习场为参赛选手提供A榜阶段每天附加1次的提交机会,助力你更好地验证模型效果,【千言:多技能对话】任务更是在排行榜中公布具体评测指标得分,助力选手进一步提升成绩。
免费GPU算力:百度大脑AI Studio练习场为参赛选手额外发放100小时GPU Tesla V100算力卡,报名即可在数据下载页获得算力码申请地址。
官方基线系统:报名即可在数据下载页获得可一键Fork的基线系统。
练习赛附加奖项:除主赛场奖池外,在练习赛中排名前50的队伍可获得飞桨纪念品一份。
百度工程师亲授解题思路:来自百度的出题老师已对赛题进行了详尽讲解,直播录像整理中,届时会在赛题讨论群中发出。同时,出题老师也将会在群内为大家答疑解惑。快快扫码进群吧!
【千言:多技能对话】讨论群
【遥感影像地块分割】讨论群
目前,【千言:多技能对话】和【遥感影像地块分割】赛题已经正式对外发布,快来一探究竟吧!
千言:多技能对话
百度X清华强强联合 多技能多领域综合评判
近年来,人机对话技术受到了学术界和产业界的广泛关注。学术上,智能人机对话是人工智能领域中最具挑战的技术难题之一,涵盖任务式对话与开放域对话,其发展影响及推动着语音识别与合成、自然语言理解、对话管理以及自然语言生成等研究的进展;产业上,众多产业界巨头相继推出了人机对话技术相关产品,并将人机对话技术作为其公司的重点研发方向。极大地推动了人机对话技术在学术界和产业界的发展。
作为智能人机对话的重要子课题,开放域对话技术旨在建立一个开放域的多轮对话系统,使得机器可以流畅自然地与人进行语言交互,既可以进行日常问候类的闲聊,又可以完成特定功能,以使得开放域对话技术具有实际应用价值,例如进行对话式推荐,或围绕一个主题进行深入的知识对话等。
目前,学术界已经公开了多个面向开放域对话建模的开源数据集。但大多数研究工作仅关注模型在单一或少量数据集上的效果。尽管一些模型在单一数据集上取得了很好的效果,但缺乏在多个不同技能、不同领域数据上的评价,与真正很好的解决开放域对话这一技术挑战还有一定距离。因此,本次竞赛数据基于千言数据集(https://www.luge.ai)及清华开放数据集(https://github.com/thu-coai/CDial-GPT)进行构建,这个数据集收集了一系列公开的开放域对话数据,并对数据进行了统一的整理以及提供了统一的评测方式,期望从多个技能、多个领域的角度对模型效果进行综合评价。
其中,“千言”是百度联合中国计算机学会、中国中文信息学会共同发起的,由来自国内多家高校和企业的数据资源研发者共同建设的中文开源数据集及评测项目。本次竞赛数据集旨在为研究人员和开发者提供学术和技术交流的平台,进一步提升开放域对话的研究水平,推动自然语言理解和人工智能领域技术的应用和发展。
本次竞赛的开放域对话数据集包含多个数据,涵盖了多个功能场景:包括日常闲聊对话,知识对话、推荐对话等。我们旨在衡量开放域对话模型在各个不同技能上的效果和模型通用性。
遥感影像地块分割
多源异构遥感数据 真实场景语义分割
在刚刚过去的夏天里,我国南方诸多地区遭遇洪涝灾害,对大家的经济生活造成了重大损失。自然灾难无情,但我们却逐渐有了更多的技术能力,在洪涝灾害预测、抗洪救灾等方面发挥作用,遥感技术便是其中之一。
通过对典型涉灾区域的基础地理数据集以及受灾前后的遥感数据集进行分析,遥感技术能够为地方政府、减灾机构和科研院所提供大量科学的数据支撑和信息保障,帮助把灾害损失降至最低,也能加速灾后重建。
此外,对遥感影像进行像素级内容解析,业界人士可以对遥感影像中感兴趣的类别进行提取和分类。遥感影像地块分割不仅在防汛救灾领域体现出极高的实用价值,在城乡规划、工业领域也受到了广泛关注。
本次大赛希望选手能够利用人工智能技术,对多来源、多场景的异构遥感影像数据进行充分挖掘,打造高效、实用的算法,提高遥感影像的分析提取能力。具体来看,需要考察选手基于飞桨打造的遥感影像语义分割模型在建筑、耕地、林地、水体、道路、草地6个类别上的效果。
在复赛阶段,测评指标会加入区域连续性等评判标准。由于遥感影像的特殊性,道路、河流分割一直是遥感领域的一大难题。道路、河流这类区域在遥感图像上宽度一般不超过10个像素,使用视觉算法进行分割时,往往不能保证这类区域被完整、连续地分割出来。复赛阶段就是针对这类实际难题展开角逐。
本次比赛数据来自中科北纬(北京)科技有限公司提供的真实遥感数据,中科北纬是一家集应用软件研发、技术服务于一体的科技创新型企业,也是测绘地理信息全产业链的解决方案提供商。参赛队可以基于这些数据构建自己的语义分割模型,解决实际问题。
海阔凭鱼跃,天高任鸟飞。作为国内AI及大数据方面的大型比赛擂台,CCF BDCI的规模与影响力均属行业顶级,同时赛题全面、评审专业、奖品丰厚。如果你也想要一展身手,与各路大神同台竞技,那么千万不要错过哦!
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。