最近中文搜索引擎市场又突然热了起来,一家巨头的入场让外界充满期待。
6月9日,阿里向外界确认成立智能搜索业务部,隶属阿里创新业务事业群,由UC事业部总经理、书旗事业部总经理吴嘉担任负责人。
阿里人事变动,莫非要进军搜索引擎市场?其实阿里的产品早已先行。
今年4月,一款名为“夸克”的智能搜索App首次在苹果应用商店排名超越百度,并首次跻身前20。
其实早在2018年,夸克就开始发力智能搜索,2019年1月,夸克发布3.0版,在自主订制的AI搜索引擎、搜索直达、指令控制等方面实现了重要升级。
搜索引擎诞生已有20余年,无论国内外,市场似乎早已尘埃落定,阿里为何如此“头铁”,夸克为何近两年来越来越进击智能搜索?
这恐怕与近年来AI成熟落地密不可分,也不得不从搜索行业的变化开始说起。
PC时代,我们以文字作为主要的搜索形式。移动互联网兴起后,手机端的搜索引擎App依然如此。
后来,智能手机开始普及,说一段话、拍一张图变得容易起来,各大搜索引擎公司又加入了语音、图片搜索。
如果我们仔细思考就会发现,现阶段大多数语音、图片搜索,其实本质上还是把多媒体信息转变成文字,然后再进行搜索。
这类搜索只是理解用户输入的信息,实际上对另一端抓取的信息是没有理解的。夸克要做的就是跳出这种机械文本检索的围墙,改变搜索引擎。
在吴嘉看来,这次的转变是一场搜索引擎的真正变革。
吴嘉认为,今天的内容生态有很大的变化,搜索技术也应该拥抱相应的变化。
至少在语音、图像理解的搜索上,夸克背后的阿里已经拥抱变化。淘宝的图片搜索技术早已在移动端得到应用,天猫精灵也是国内智能音箱领域的头部玩家。
在夸克的产品中,也有这两类智能搜索技术的体现。
那么未来的多模态搜索又会怎样?
夸克的判断是,未来搜索很大程度上会是视频内容检索。注意不是对标题的搜索标题,而是对视频内容本身。
随着短视频这种娱乐、学习方式的兴起,传统的搜索方式变得无效,因为它不能对视频内容做出理解。
而这正是夸克在今天做的工作。
据夸克搜索技术负责人介绍,他们正在做视频理解——深入到视频每一帧画面、每一句语音里,去分析这个视频的主题和质量,然后在分析的结果上建设一个视频库。
将来用户只要一搜,就能把现在最好最热门的视频内容返回给用户,提升用户在视频搜索上的体验。
这项技术离我们不会太遥远。夸克产品负责人郑嗣寿透露,夸克将在不久后就会这样的视频搜索产品。
通过搜索框和AI,我们初步了解了夸克产品。可是在信息孤岛化的今天,有人认为通用搜索已死,夸克为何还要做搜索?
因为在夸克团队看来,通用搜索不但不会死,未来的价值还会越来越重要。
而且,直到今天,搜索引擎一直是互联网的基础服务之一,每天国内就有数亿用户在用。
只要用户有需求,通用搜索就会一直存在。
吴嘉在接受采访时说,过去我们的搜索内容在链接里、在H5里,但是今天想做好一个内容,已经没有现成的链接和H5可供抓取了。
只有把要把内容生态做起来,同时提高技术,搜索引擎才有出路。
生态方面,夸克不必担心,有阿里的电商和大文娱内容有阿里的生态内容作为支持。
而更重要的是有AI搜索还有对内容的理解,从海量化信息中把有价值的信息呈现给用户。在这方面,夸克有自然语言理解AI技术帮助提取有效信息。
无疑,阿里的中台架构帮助夸克在一年内快速实现智能搜索的愿景。
产品负责人嗣寿自豪地说:“阿里的基础设施建设是非常完善的,算力也有很大的优势,在这里可以实现更先进的算法。”
在技术方面,夸克搜索技术负责人向我们介绍,夸克在自然语言理解、知识图谱、多模内容理解方面都有大量投入:
在过去一年多的时间里,夸克构建了超大规模的基础的阅读理解的数据集,为网页搜索提供了段落级、句子级、单词级别不同粒度的阅读理解技术。
抽取网页文本的知识,将其与结构化的知识做融合,构建知识体系。目前已经在医疗类搜索中得到应用。
最后就是之前提到的对视频内容的理解。
除了搜索的基础技术外,夸克还在AR、VR围绕这些交互方式上有非常多的探索。
作为阿里前沿技术的大脑,达摩院也为夸克输送了大量的技术。
前不久达摩院提出的StructBERT,在通用语言理解评估基准GLUE上超过了谷歌、微软,排名第一。
这篇研究成果也被国际顶级AI学术会议ICLR 2020收录,夸克团队也很快将这项技术用到自己的搜索产品当中来。
去年谷歌将BERT用于文字搜索,大大提高搜索结果的准确性,夸克在方面紧跟国外前沿公司的潮流。
技术以人为本,以上的技术离不开夸克团队内部人才的吸引和培养机制。
现在的团队中也有很多搜索行业的老兵,他们分别来自各大互联网顶级公司。
据夸克搜索技术负责人介绍,现在的搜索技术团队,最初来自于阿里的多个业务领域的技术团队,之前研究过聊天机器人、智能问答等技术场景,后来还参加过智能音箱相关技术的研发。
技术团队不是天生为搜索,但是却与现在的智能搜索技术紧密关联。
面对瞬息万变的搜索市场,夸克也在及时获取新鲜血液,有很多入职不到两三年的新阿里人渐渐加入到当中来,不断壮大团队。
虽然夸克的完成度已经很高,但是未来还有很大的提升空间,尤其是视频搜索、交互模式等方面。这离不开更多新人的加入。
嗣寿希望,能够更多年轻人加入夸克,夸克的AI研发岗位会一直向顶尖技术人才敞开,为做出更好中文搜索引擎的愿景一起努力。
作者系网易新闻·网易号“各有态度”签约作者
— 完 —
「数据库」系列公开课开启,快来免费报名!
6月17号第一期直播,腾讯云数据库副总经理--王义成将全面剖析全球数据库的发展历程,分享如何将云计算、新基建、数据库的能力进行融合创新。此外还将结合实际金融案例,详细介绍腾讯云自研国产数据库TDSQL和TBase的产品核心架构和最佳实践。
之后的课程中,来自浪潮、蚂蚁集团的数据库业务负责人也将带来精彩分享,干货满满,全程免费参与,欢迎扫码报名~
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !