阿里提供中文搜索新选项!AI引擎+达摩院黑科技,你要试试吗?

2020 年 6 月 16 日 量子位
晓查 发自 凹非寺
量子位 编辑 | 公众号 QbitAI

最近中文搜索引擎市场又突然热了起来,一家巨头的入场让外界充满期待。

6月9日,阿里向外界确认成立智能搜索业务部,隶属阿里创新业务事业群,由UC事业部总经理、书旗事业部总经理吴嘉担任负责人。

阿里人事变动,莫非要进军搜索引擎市场?其实阿里的产品早已先行。

今年4月,一款名为“夸克”的智能搜索App首次苹果应用商店排名超越百度,并首次跻身前20。

其实早在2018年,夸克就开始发力智能搜索,2019年1月,夸克发布3.0版,在自主订制的AI搜索引擎、搜索直达、指令控制等方面实现了重要升级。

搜索引擎诞生已有20余年,无论国内外,市场似乎早已尘埃落定,阿里为何如此“头铁”,夸克为何近两年来越来越进击智能搜索?

这恐怕与近年来AI成熟落地密不可分,也不得不从搜索行业的变化开始说起。

多模态搜索的变革

PC时代,我们以文字作为主要的搜索形式。移动互联网兴起后,手机端的搜索引擎App依然如此。

后来,智能手机开始普及,说一段话、拍一张图变得容易起来,各大搜索引擎公司又加入了语音、图片搜索。

如果我们仔细思考就会发现,现阶段大多数语音、图片搜索,其实本质上还是把多媒体信息转变成文字,然后再进行搜索。

这类搜索只是理解用户输入的信息,实际上对另一端抓取的信息是没有理解的。夸克要做的就是跳出这种机械文本检索的围墙,改变搜索引擎。

在吴嘉看来,这次的转变是一场搜索引擎的真正变革。

吴嘉认为,今天的内容生态有很大的变化,搜索技术也应该拥抱相应的变化。

至少在语音、图像理解的搜索上,夸克背后的阿里已经拥抱变化。淘宝的图片搜索技术早已在移动端得到应用,天猫精灵也是国内智能音箱领域的头部玩家。

在夸克的产品中,也有这两类智能搜索技术的体现。

那么未来的多模态搜索又会怎样?

夸克的判断是,未来搜索很大程度上会是视频内容检索。注意不是对标题的搜索标题,而是对视频内容本身。

随着短视频这种娱乐、学习方式的兴起,传统的搜索方式变得无效,因为它不能对视频内容做出理解。

而这正是夸克在今天做的工作。

据夸克搜索技术负责人介绍,他们正在做视频理解——深入到视频每一画面、每一句语音里,去分析这个视频的主题和质量,然后在分析的结果上建设一个视频库。

将来用户只要一搜,就能把现在最好最热门的视频内容返回给用户,提升用户在视频搜索上的体验。

这项技术离我们不会太遥远。夸克产品负责人郑嗣寿透露,夸克将在不久后就会这样的视频搜索产品。

夸克为何要做搜索

通过搜索框和AI,我们初步了解了夸克产品。可是在信息孤岛化的今天,有人认为通用搜索已死,夸克为何还要做搜索?

因为在夸克团队看来,通用搜索不但不会死,未来的价值还会越来越重要。

而且,直到今天,搜索引擎一直是互联网的基础服务之一,每天国内就有数亿用户在用。

只要用户有需求,通用搜索就会一直存在。

吴嘉在接采访时说,过去我们的搜索内容在链接里、在H5里,但是今天想做好一个内容,已经没有现成的链接和H5可供抓取了。

只有把要把内容生态做起来,同时提高技术,搜索引擎才有出路。

生态方面,夸克不必担心,有阿里的电商和大文娱内容有阿里的生态内容作为支持。

而更重要的是有AI搜索还有对内容的理解,从海量化信息中把有价值的信息呈现给用户。在这方面,夸克有自然语言理解AI技术帮助提取有效信息。

夸克为何有底气做好搜索

无疑,阿里的中台架构帮助夸克在一年内快速实现智能搜索的愿景。

产品负责人嗣寿自豪地说:“阿里的基础设施建设是非常完善的,算力也有很大的优势,在这里可以实现更先进的算法。”

在技术方面,夸克搜索技术负责人向我们介绍,夸克在自然语言理解、知识图谱、多模内容理解方面都有大量投入:

  1. 在过去一年多的时间里,夸克构建了超大规模的基础的阅读理解的数据集,为网页搜索提供了段落级、句子级、单词级别不同粒度的阅读理解技术。

  2. 抽取网页文本的知识,将其与结构化的知识做融合,构建知识体系。目前已经在医疗类搜索中得到应用。

  3. 最后就是之前提到的对视频内容的理解。

除了搜索的基础技术外,夸克还在AR、VR围绕这些交互方式上有非常多的探索。

作为阿里前沿技术的大脑,达摩院也为夸克输送了大量的技术。

前不久达摩院提出的StructBERT,在通用语言理解评估基准GLUE上超过了谷歌、微软,排名第一。

这篇研究成果也被国际顶级AI学术会议ICLR 2020收录,夸克团队也很快将这项技术用到自己的搜索产品当中来。

去年谷歌将BERT用于文字搜索,大大提高搜索结果的准确性,夸克在方面紧跟国外前沿公司的潮流。

技术以人为本,以上的技术离不开夸克团队内部人才的吸引和培养机制。

现在的团队中也有很多搜索行业的老兵,他们分别来自各大互联网顶级公司。

据夸克搜索技术负责人介绍,现在的搜索技术团队,最初来自于阿里的多个业务领域的技术团队,之前研究过聊天机器人、智能问答等技术场景,后来还参加过智能音箱相关技术的研发。

技术团队不是天生为搜索,但是却与现在的智能搜索技术紧密关联。

面对瞬息万变的搜索市场,夸克也在及时获取新鲜血液,有很多入职不到两三年的新阿里人渐渐加入到当中来,不断壮大团队。

虽然夸克的完成度已经很高,但是未来还有很大的提升空间,尤其是视频搜索、交互模式等方面。这离不开更多新人的加入。

嗣寿希望,能够更多年轻人加入夸克,夸克的AI研发岗位会一直向顶尖技术人才敞开,为做出更好中文搜索引擎的愿景一起努力。

作者系网易新闻·网易号“各有态度”签约作者

「数据库」系列公开课开启,快来免费报名!

6月17号第一期直播,腾讯云数据库副总经理--王义成将全面剖析全球数据库的发展历程,分享如何将云计算、新基建、数据库的能力进行融合创新。此外还将结合实际金融案例,详细介绍腾讯云自研国产数据库TDSQL和TBase的产品核心架构和最佳实践。

之后的课程中,来自浪潮、蚂蚁集团的数据库业务负责人也将带来精彩分享,干货满满,全程免费参与,欢迎扫码报名~ 


量子位 QbitAI · 头条号签约作者


վ'ᴗ' ի 追踪AI技术和产品新动态


喜欢就点「在看」吧 !


登录查看更多
0

相关内容

专知会员服务
54+阅读 · 2020年7月4日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
新时期我国信息技术产业的发展
专知会员服务
70+阅读 · 2020年1月18日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
【阿里巴巴】 AI编译器,AI Compiler @ Alibaba,21页ppt
专知会员服务
44+阅读 · 2019年12月22日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
97+阅读 · 2019年12月14日
阿里搜索技术,在AI路上走了多远?
机器学习研究会
11+阅读 · 2017年12月29日
【AI 工程师】掌握这10个项目,秒杀90%面试者!
人工智能头条
13+阅读 · 2017年12月14日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Arxiv
6+阅读 · 2019年4月4日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
8+阅读 · 2018年5月1日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
11+阅读 · 2018年1月11日
VIP会员
相关VIP内容
专知会员服务
54+阅读 · 2020年7月4日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
新时期我国信息技术产业的发展
专知会员服务
70+阅读 · 2020年1月18日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
【阿里巴巴】 AI编译器,AI Compiler @ Alibaba,21页ppt
专知会员服务
44+阅读 · 2019年12月22日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
97+阅读 · 2019年12月14日
相关论文
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Arxiv
6+阅读 · 2019年4月4日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
8+阅读 · 2018年5月1日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
11+阅读 · 2018年1月11日
Top
微信扫码咨询专知VIP会员