香侬科技李纪为:AI不会造就时代,而是时代催动AI发展

2018 年 3 月 1 日 红杉汇

毫无疑问,AI是当下最热的科技创新创业领域之一。李纪为是近期涌现出的著名青年AI学者之一,在博士期间研究方向是人工智能的一个重要分支——自然语言处理(NLP),他是第一位仅用三年时间就获得了斯坦福大学计算机科学博士学位的人。在三年的博士生涯中,他的多篇论文被各类顶级会议接收,他也是自然语言处理领域引用量最高的博士生之一。据统计,ICLR 2017 上李纪为有三篇论文被大会接收,其中两篇为第一作者;在 EMNLP 2017 上,他有两篇论文被大会接收,同样均为第一作者。


去年7月博士毕业后,经过半年的准备,他与两名大学同学共同创立了 AI 金融公司——香侬科技,专注于利用 NLP 技术提取、分析金融信息,为广大投资者提供有效、准确、全面的投资信息。刚刚获得红杉中国的天使轮融资。


最近,「机器之心」对李纪为进行了专访,了解其创立的香侬科技、AI 金融、NLP 等方面的问题。



Q:创业的感觉如何?


李纪为:创业是一种全新的体验。在创业时,你能遇见到不同的人和事儿,无时无刻不在刷新着你对周围世界的认识。不管是金融从业者(一级市场、二级市场、投行、券商等等),投资人,还是科研界学霸、工程大牛、产品经理等,他们所带有的与生俱来的职业嗅觉与理念,都值得我们学习很久很久。这是一个非常有意思的过程,每天都有新的东西需要学习、新的挑战。


这有一点像我刚开始读博士的感觉——每天早上都是带着对一天的憧憬起床。我非常愿意用“有意思”这个词来形容现在的生活。团队每天都在学习和成长过程中,这也是最令人鼓舞的。

Q:能否简单介绍一下新成立的公司?


李纪为:香侬科技-名称来自于信息论创始人克劳德·香侬(Claude Shannon)。


这来源于一种情怀,在 CMU 学习的时候仔细拜读过他在 50 年代那篇划时代的论文《Prediction and entropy of printed English》。当时我在 CMU 的老师 Eduard Hovy 一直想用这篇文章里面的概念来定义不同 NLP 问题的难度,所以就让我去读这篇文章。这是一篇具有时代意义的文章,香侬与他的太太 Betty Shannon 完成了重要的实验:给定英文一段话,告诉前面出现的字母,然后去猜下一个字母是什么。这是一个划时代的研究,它在语言上定义了信息熵的概念:语言的不确定性决定于熵的大小。现代很多的 NLP 的理论都是和它有关的。在 NLP 的问题中,你能猜得多准,基本定义了这个问题的难度。我也很崇拜他,这就是为什么我们将创业公司取名为 Shannon。


注册公司时我惊奇地发现,Shannon.AI 这个域名竟然还没有被注册,当时真的高兴手舞足蹈。


同时,这个名字听起来也给人一种温暖的感觉,它有点像吴语里的「想你」(此处大笑)。


公司成立于北京,目前位于中关村。从我的角度来讲,我也在加入大公司与创业之间犹豫了很久,直到去年九月份,随着几位合伙人陆续到位,我们就开始了各项事务的筹备。


Q:这是一家 AI 金融领域的创业公司,它将面向哪些类型的业务?为什么会选择金融这个方向?


李纪为我们希望人们能够快捷、简单、准确全面地获取自己想要的金融信息。让信息为大众所用是我们的愿景。


我们是这样思考的:互联网 1.0 时代让世界更公平了,它就像广播、电视一样,是一个里程碑。互联网让人们获取信息的机会变得平等了,曾经只有少数人可以接触到的信息现在可以为大众所有。但从另一个角度来看,互联网时代的来临也制造了巨量的信息。现在,在很多事情上使用简单的搜索方法已经很难找到你想要的信息了。这又把互联网 1.0(以门户网站、搜索为典型)为我们带来的这份平等给部分抵消了——信息太多,无从查找,只有某些特定的人群才知道去哪里找到有用的信息。


在金融领域中,让信息能更容易地为大众所获取是一个很有意义的方向。在国内,随着国民生活水平的提高,投资需求正在逐渐升温,越来越多的人们正在将眼光伸向股票、基金,甚至债券、期货等二级市场方向上的投资。


然而,目前无论对于机构投资者,还是我们这样的个人而言,传统方式的信息渠道能够解决的问题还是太少了。最简单的一件事:现在我想搜索一下“最近有哪些上市公司的董事长正被证监会调查?”这是一个很明确的问题,也是对于市场行情非常重要的事情。还有很多其他事,我们是无法找到现成信息的,如果必须要找的话,我们必须一个一个地从不同信息源之中的信息里进行提取出来,自己进行分析。


我们希望能够构建一个面对投资者的智能解决方案,来解决投资者对于信息的需求。能够通过用算法来解决这些问题。

Q:对你们来说,大陆的金融市场与海外(尤其是美国)有哪些不同?


李纪为:美国的二级市场中,机构资金占比 90%,个人投资者习惯于把钱给机构托管;而在国内的股市里,散户占据一大部分,由于信息的不对称,甚至由于无法找到有效的信息获取渠道,很多投资者会处于相对不公平的劣势位置。我们所做的就是解决这一问题,让所有人都能够获得信息。

Q:香侬科技的创始团队构成是什么样的?


李纪为:我们的核心创始团队为三人,我的博士专业是计算机科学(自然语言处理),另两人均为金融领域背景, 都是我大学同学。沈盛杰本科毕业于北京大学物理学院,硕士毕业于光华管理学院,曾在对冲基金 Magnetar Capital 和中信证券等公司工作,主要负责金融数据处理,衍生品定价和交易策略研究等工作。另一位创始人何豪杰是国内二级市场资深研究员,长期从事行业和上市公司研究,曾就职于招商基金和私募基金星石投资等公司。

香侬科技创始核心成员:沈盛杰、李纪为、何豪杰(从左至右)

Q:选择这个方向创业,是否意味着金融行业已经到了进入AI时代的节点?


李纪为我坚信AI会革命化地改变很多行业,金融便是其中的一个。但这并不意味这这次革命会在一夜之间发生,它可能需要一段很长的时间,可能3-5年,也可能是5-10年,甚至更长。深度学习从爆发到今天仅仅经历了五、六年的时间,而纵观人类科技的发展历史,具有重要意义的新科技都经历了更长的发展。技术和传统行业结合,慢慢地改变一个行业,会是一个漫长的过程。这个过程不仅仅是解决曾经的旧需求,而是在迭代中创造新的需求,新需求的创造恰恰是个慢慢发掘的过程。


我坚信人工智能逐渐会给很多行业带来变革。我认为,并不是AI造就了如今的时代,而是如今的时代催生了AI的发展:我们现在的工作正变得更加复杂,信息量变得更大。随着海量数据的产生,我们有了更多的需求去分析、理解,去提取我们想要的东西。我们每天都在用头条、滴滴、饿了么、美团这样的应用,大量的需求意味着我们需要一种高效的工具来分析、整合其中产生的数据,让人们能够简便地运用其中的知识。所以其实是社会需求推动了AI,AI反过来再推动了社会的变革。


站在金融的角度上,我们需要用新的方法来满足用户的需求,同时也可能会不断发现、甚至改变用户的需求,这是一个长期的过程。

Q:本轮融资过后,公司是否会开始进一步的团队建设,主要会招募哪些方向的人才?


李纪为:当然需要人工智能和深度学习方面的人才。不过,如何让实验室的深度学习技术落地,真正走进千家万户,这是一个全维度的任务。公司也希望招募更多前后端、数据库等方面有经验的工程师,以及产品经理、运维、UI 设计方面的大牛,大家把各自的特长相结合,互相促进,互相学习,得到一个真正可以造福行业的AI工具。

Q:NLP 与金融领域的契合点在哪些方面上?


李纪为NLP 与金融领域契合点主要是两点,一种是帮助你收集信息。一种是帮你做决策。


帮你做决策就是帮你做交易。第二步要比第一步更难。我们目前专注于收集信息方面,做投资决策还需要时间和技术的积淀,它将是未来可能发展的方向。

Q:机器学习作为量化交易方法的方向之一,在交易中有哪些应用?


李纪为举一个例子,美国最著名的对冲基金——“文艺复兴”的两位Co-CEO,Bob Mercer 与 Peter Brown。他们在自然语言处理(NLP)领域里也曾是风云人物。他们在上世纪90年代初把统计机器学习引入到了NLP,革命性地改变了这个领域。直到深度学习火热之前,他们提出的方法一直是 NLP 里的主流。他们在 1994 年提出的 IBM model 在机器翻译领域盛行了 20 年,直到最近两年才被神经网络的 seq2seq+attention 超越。有人笑谈,那个年代,他们把 NLP 玩儿坏了(此处大笑)。


后来他们都加盟了文艺复兴对冲基金,成为了用机器学习做量化投资的风云人物。


值得一提的是,Peter Brown 是深度学习先驱 Geoffrey Hinton 门下第一个毕业的博士,1987 年博士毕业于 CMU。


所以说机器学习在量化投资里的应用由来已久,很多量化投资都在应用机器学习、统计学习的算法。随着原微软研究院资深研究员邓力老师这样的学者加入金融领域,神经网络作为一种人工智能中流行的方法也被金融界人士拿来开始尝试于投资(量化模型)。但由于金融界是一个倾向于不公开新成果的行业,所以目前我们了解的不多。


本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载。

作者:李泽南


香 侬 科 技

领域:科技/传媒


香侬科技(Shannon.AI)是一家面向金融领域的人工智能公司,旨在用人工智能算法分析、提取、整合海量金融信息。在信息爆炸的大背景下,香侬科技倡导一个全新的以自然语言为基础的信息交互模式,让投资者更直观、及时、准确地获取想要的信息,把握金融市场的瞬息万变。


红杉资本中国基金始终关注 科技/传媒 领域的投资。成立至今已投资了今日头条、滴滴出行、京东、大众点评、美团、唯品会、掌趣科技、美丽说、新浪网、大疆创新等该领域知名企业。


除科技/传媒领域,红杉资本中国基金还关注医疗健康消费品/服务工业科技等领域的投资。


 推荐阅读

红杉FM | 创业必备清单Ⅱ:创业者和投资人的沟通清单

薪人薪事常兴龙:为什么“铁军”无法成就SaaS销售

12年数据分析、300家公司研究,告诉你企业转型成功的5个关键法则

红杉中国投资企业华米科技登陆纽交所 智能可穿戴市场的创新与发展提速

要爆发式增长?没有人比这八个企业玩得更6


登录查看更多
0

相关内容

【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
55+阅读 · 2020年3月4日
机器翻译深度学习最新综述
专知会员服务
98+阅读 · 2020年2月20日
人工智能学习笔记,247页pdf
专知会员服务
181+阅读 · 2019年12月14日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
奇点已过?聊聊BERT之后的NLP时代
AI研习社
4+阅读 · 2019年6月6日
【NLP】NLP将迎来黄金十年
产业智能官
5+阅读 · 2019年4月27日
预见未来 | NLP将迎来黄金十年
微软研究院AI头条
4+阅读 · 2018年11月26日
用深度学习Keras判断出一句文本是积极还是消极
北京思腾合力科技有限公司
6+阅读 · 2017年11月16日
微软洪小文:AI 还是个小学生,资本请慎重!
EGONetworks
4+阅读 · 2017年9月6日
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Graph Analysis and Graph Pooling in the Spatial Domain
Arxiv
4+阅读 · 2018年9月6日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
7+阅读 · 2018年3月21日
VIP会员
相关VIP内容
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
55+阅读 · 2020年3月4日
机器翻译深度学习最新综述
专知会员服务
98+阅读 · 2020年2月20日
人工智能学习笔记,247页pdf
专知会员服务
181+阅读 · 2019年12月14日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
相关资讯
奇点已过?聊聊BERT之后的NLP时代
AI研习社
4+阅读 · 2019年6月6日
【NLP】NLP将迎来黄金十年
产业智能官
5+阅读 · 2019年4月27日
预见未来 | NLP将迎来黄金十年
微软研究院AI头条
4+阅读 · 2018年11月26日
用深度学习Keras判断出一句文本是积极还是消极
北京思腾合力科技有限公司
6+阅读 · 2017年11月16日
微软洪小文:AI 还是个小学生,资本请慎重!
EGONetworks
4+阅读 · 2017年9月6日
相关论文
Top
微信扫码咨询专知VIP会员