(文末有福利)90后技术宅与他的另类搜索引擎「Magi」

2019 年 11 月 21 日 威锋网

文末有福利 记得看完哟

最近,一个名叫 Magi 的搜索引擎成了重点关注对象,据称这个搜索引擎和我们常见的搜索引擎很不一样,有一种程序员们钟爱的 X 冷淡风格。于是我们打开 Magi 看了看。

确实,这个页面看着就很让人舒爽。

对比一下我们熟悉的度娘 ⬇️
重要的是搜索结果也很不一般,属性中的每一个结果有对应的链接,并带有标签和主要学习来源部分,搜索结果以结构化知识的形式呈现。这种模式和国内外主流的搜索引擎完全不一样,让人感觉新鲜。
当然,也让人由此发出疑问:Magi 到底是什么,是谁开发的,好不好用?
按照开发者 PeakJi 季逸超的讲述和 Magi 网站上的说明,Magi 其实并不是单纯的网页搜索引擎,而是自主阅读文本并持续纠错的 AI。
Magi 是由 Peak Labs 从无到有自研的基于机器学习的信息抽取和检索系统,它能将任何领域的自然语言文本中的知识提取成结构化的数据,通过终身学习持续聚合和纠错,进而为人类用户和其他人工智能提供可解析、可检索、可溯源的知识体系。11 月,Peak Labs 发布了公众版 Magi.com。
与搜索引擎不同,Magi 不仅收录互联网上的海量文本,还会去尝试理解并学习这些文本中蕴含的知识和数据。此外,Magi 从零研发了一套互联网搜索引擎,所以 Magi.com 同时提供全网规模的普通搜索结果,学习过程是在无人干预的情况下 7 x 24 小时不间断运行。
互联网数据浩如烟海,质量参差不齐,如何将这些数据处理成机器能够理解的数据结构是个巨大的挑战。在「Magi 的使命」一项中,Peak Labs这样写道:作为公众版本的 magi.com 为人类用户提供了与互联网数据交互的新方式,而 Magi 系统背后的技术平台则承载着另一半重要的意义:让机器像人一样能理解并充分利用互联网中无穷无尽的知识。
对 Magi 的技术感兴趣的同学,可以访问 www.peak-labs.com 官网和季逸超的知乎,我们在这里就不多说了。
下面来关注一下 Magi 背后的团队——Peak Labs,以及创始人 PeakJi 。
创始人 PeakJi 真名季逸超,90 后男生,在北大附中读高中期间接触 iOS 并加入威锋网 WEIP 技术组,先后参与了 wefit 输入法的完善和各种 越狱 研究,高三设计并开发猛犸 1 网页浏览器,大一推出猛犸 4。据说,PeakJi 所有的产品都是由他独自完成设计、美工、算法、编码、测试和推广,可见啊这是一个非常有想法,动手能力也很强的「技术宅」了。
2012 年,在北大念书的季逸超创建 Peak Labs,并发明了 Rasgueado 输入法。据说 Peak Labs 的产品和技术还有很多,什么神经信息提取系统 Ireul,网页大规模搜索引擎 Ramiel,多语言分析 pipeline Arael 和分布式检索系统 Matarael 等等,利用这些技术构架,他们搭建了 Magi 服务,包括普惠版和企业版两种。
如果你要问 Magi 好不好用,我们暂时也无法给出明确回答,因为 Magi 目前完成度还有待提高。但是,比起当做搜索引擎来用,Magi 应该更适合做知识学习链库。
在使用的过程,我们会发现 Magi 也有很多不足之处,尤其是在搜索规模和答案准确度上。面对一些简单搜索,Magi 往往给不出让人满意的答案,而且速度也不够快。另外,它不是一款搜索引擎,像搜索网址这类任务也达不到很好的效果,也无法进行图片搜索。
对于 Magi 的缺点,团队和 PeakJi 都大方坦诚。
Peak Labs 指出,Magi 已经展示出的开放领域信息提取能力,可以应用到企业客户所在的细分领域内,变成一个更加强大的信息抽取系统,让每一个领域、每一家企业都可以轻松地打造属于自己的知识图谱,他们希望未来的 Magi 系统能够成为「知识领域的 ImageNet」。
Magi 现在还远算不上成熟,但其特性决定了它无穷的可能性和成长空间。
未来,也许 Magi 会成为打破现有搜索引擎原理的新范式,开启全新的结构化知识搜索引擎时代,改变我们对信息检索和知识获取方式的刻板印象,毕竟在信息大革命和人工智能大发展的时代,千帆竞速,百舸争流,谁都有机会。

    福利时间    

说到「机会」,现在你就有机会免费获得价值 388 元的 2019 虎嗅 F&M 创新节 双日通票,优秀的你,是不是要把握一下咧👇

F&M创新节,是虎嗅主办的——聚焦年度科技、商业与年轻议题、展现前沿技术、新奇产品的创新嘉年华。自 2013 年首次举办以来,F&M 创新节已成为中国科技界、创业圈 TOP 级的年度聚会。

今年的F&M创新节,时间定在 2019 年 11 月 23、24 日(周六-日),地点北京。

威锋网作为本次的合作媒体,给大家申请了些福利,我们将免费送出价值 388 元的虎嗅 F&M 创新节双日通票

本文所提及的 PeakJi 季逸超,将会作为 F&M 创新节 #能量馆 的嘉宾与大家来一场「创造力对话」。

领票方式如下:

1、为本文点个「在看」

2、在公众号后台回复「领票」即可获取领票教程。

还在等什么,北京的锋友马上去领票吧,门票数量有限,先到先得,领完即止!

如果锋友们因为居住地不在北京,或者时间原因无法成行,小编承诺以后会为大家带来更多有趣好玩的东西,锋友们要继续关注我们的推文哟!

(商务合作请联系:lin.chen@office.feng.com)



你有「在看」吗 ?

登录查看更多
1

相关内容

搜索引擎指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。
还在修改博士论文?这份《博士论文写作技巧》为你指南
Python地理数据处理,362页pdf,Geoprocessing with Python
专知会员服务
113+阅读 · 2020年5月24日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
算法与数据结构Python,369页pdf
专知会员服务
162+阅读 · 2020年3月4日
资源 | 李航老师《统计学习方法》(第2版)课件下载
专知会员服务
249+阅读 · 2019年11月10日
推荐系统(一):推荐系统基础
菜鸟的机器学习
25+阅读 · 2019年9月2日
Web渗透测试Fuzz字典分享
黑白之道
20+阅读 · 2019年5月22日
7 款实用到哭的App,只说一遍
高效率工具搜罗
84+阅读 · 2019年4月30日
关于【种子/磁力链】全攻略,这里都有
高效率工具搜罗
11+阅读 · 2019年4月26日
以为GAN只能“炮制假图”?它还有这7种另类用途
GAN生成式对抗网络
9+阅读 · 2018年10月23日
基于大数据搭建社交好友推荐系统
云栖社区
8+阅读 · 2018年2月2日
福利丨晚来天欲雪,一起囤大数据好书吗?
DBAplus社群
4+阅读 · 2017年12月13日
【NLP】周明:自然语言对话引擎
产业智能官
6+阅读 · 2017年10月19日
Arxiv
3+阅读 · 2018年10月18日
Arxiv
13+阅读 · 2018年4月6日
Arxiv
5+阅读 · 2017年7月23日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
还在修改博士论文?这份《博士论文写作技巧》为你指南
Python地理数据处理,362页pdf,Geoprocessing with Python
专知会员服务
113+阅读 · 2020年5月24日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
算法与数据结构Python,369页pdf
专知会员服务
162+阅读 · 2020年3月4日
资源 | 李航老师《统计学习方法》(第2版)课件下载
专知会员服务
249+阅读 · 2019年11月10日
相关资讯
推荐系统(一):推荐系统基础
菜鸟的机器学习
25+阅读 · 2019年9月2日
Web渗透测试Fuzz字典分享
黑白之道
20+阅读 · 2019年5月22日
7 款实用到哭的App,只说一遍
高效率工具搜罗
84+阅读 · 2019年4月30日
关于【种子/磁力链】全攻略,这里都有
高效率工具搜罗
11+阅读 · 2019年4月26日
以为GAN只能“炮制假图”?它还有这7种另类用途
GAN生成式对抗网络
9+阅读 · 2018年10月23日
基于大数据搭建社交好友推荐系统
云栖社区
8+阅读 · 2018年2月2日
福利丨晚来天欲雪,一起囤大数据好书吗?
DBAplus社群
4+阅读 · 2017年12月13日
【NLP】周明:自然语言对话引擎
产业智能官
6+阅读 · 2017年10月19日
Top
微信扫码咨询专知VIP会员