近日,地平线同时登上自然语言推理领域三个重要数据集SNLI、MultiNLI ,及Quora Question Pair 的榜首,斩获三个世界第一。根据以上数据平台公布的测评数据显示,地平线的自然语言推理准确率最高已达88.9%,这也代表了自然语言推理的世界顶尖水平。
自然语言理解历来被认为是人工智能的核心问题之一。近年来随着深度学习的广泛使用,一些相对简单的自然语言理解问题取得了重大突破,但在语义理解、推理上的进展还不尽如人意。为了推进相关研究,一些机构发布了面向语义理解、推理的数据集,其中最具有代表性的便是Stanford Natural Language Inference(SNLI)、Multi-GenreNatural Language Inference (MultiNLI)与Quora Question Pair。
SNLI由斯坦福大学创办,在此数据集上发表的论文会被作为基础研究内容收录到包含斯坦福在内的各大高校自然语言理解课程中,其在学术界的影响力可见一斑。Quora Question Pair由美国知名问答网站Quora发布,MultiNLI则出自纽约大学。这三大数据集数年间吸引了包括Google、IBM、香港中文大学、中国科学院大学等大批世界范围内顶级团队的关注,在推动自然语言推理的快速发展上功不可没。
(SNLI数据集榜单)
(MultiNLI数据集榜单)
(Quora数据集结果)
地平线作为人工智能初创企业,始终保持对AI最前沿领域的关注和技术研发投入。此次地平线自然语言推理的新突破,由算法实习生宫一尘主导完成,地平线主任架构师张健,高级算法研究员罗恒博士指导。宫一尘提出了一种新的网络框架用来在交互空间中提取层次化语义特征,这种新的框架大大增加了模型的灵活性,一举在这三大数据集上显著地超越了之前的最好结果。(查看完整论文请点击阅读原文)
地平线此次同时在三大数据集上夺冠,除了在前沿技术研究上长期扎实的投入外,更得益于对算法人才培养的高度重视。宫一尘作为实习生,不仅可以参与公司重要技术开发项目,还可根据个人意愿选择前沿技术研究方向。由联合创始人兼算法副总裁黄畅博士带领的核心算法团队,在实习生的研究项目、论文撰写等方面也会给予细致耐心的指导。此外地平线也为宫一尘提供了强大的基础架构上的支持,使得其在短短的三个月时间里,能够探索各种灵活的网络架构,在多个具有挑战性的数据集上验证自己的想法。
(论文第一作者:宫一尘)
地平线成立至今,得益于开放务实、以人为本的人才培养理念,逐渐汇聚了一大批战绩辉煌的顶尖人才。目前280+正式员工中40%具有海外经验,拥有博士学位的更是高达14%,平均工业界经验5年以上。团队成员在人工智能领域权威数据集中获得过多项世界第一,如KITTI、TRECVID、ImageNet等。地平线始终坚信技术和创新的价值,坚信人工智能可以让世界更美好。在砥砺前行的道路上,我们也希望越来越多有梦想,敢拼搏的人加入,一起打造万物智能的世界。