专访港科大教授张晓泉：目前AI多做预测分类，还需经济学发现因果关系

2017 年 8 月 1 日 AI金融评论 伊莉

“人机回圈”（Human in the loop）是人工智能圈的高频词汇。简单地说，就是将个人（专家）或公众群体的判断，融入AI系统的优化中去。这个闭环回路在AlphaGo上展现得淋漓尽致，它之所以能横扫AI和人类对手，与背后包括欧洲围棋冠军樊麾在内的专业棋手团的磋磨分不开。

“在这个过程中，人类其实是在陪机器下棋，机器在逐渐获得人类的知识技能。人类相当于labor，很被动。”

在近期由中国计算机学会（CCF）主办，雷锋网和香港中文大学（深圳）承办的第二届CCF-GAIR全球人工智能与机器人峰会上，张晓泉教授分享了这番观点。

张晓泉现任香港科技大学资讯、商业统计及运营学系教授，此前求学于美国麻省理工学院、清华大学，分别获得管理学博士和管理学硕士学位。他的主要研究领域是商业人工智能、互联网金融、信息产品定价策略及大数据营销。学术论文曾发表在《美国经济评论》、《管理科学》等知名学术期刊。目前他还是学术期刊 Information Systems Research（信息系统研究）的高级主编。

人工智能是近年来的明星技术，各行业都纷纷对其敞开怀抱。其中，金融行业对于AI的研究和应用无疑走在前列。作为一位经济学家，张晓泉教授对于人工智能也颇有见地。立足于其研究视角，他指出，经济学有助于优化AI在金融领域的应用。他进一步解释说，

“目前人工智能更多是用于预测和分类，而经济学家的研究重心是找到因果关系，解释清楚事情的底层机制。这也是计算机学家与经济学家看待科技创新的一大差异。”

双方视角之差，犹如地心说与进化论的不同。地心说能够预测太阳明天会升起，但却无法解释背后的原理，因为理论根本是错误的。进化论却相反，它能解释人的由来和进化史，却无法预测人类未来会是什么样。张晓泉教授认为，行业如今的首要目标就是结合两种研究思维，这也是他当下的研究方向。

“除了‘Human in the loop’，我觉得应该也有‘Econ in the loop’。过去20年，经济学家建立了众多数据分析模型，包括整套的计量经济分析框架。若能将这些模型与人工智能相结合，会产生很多有趣的结果。”

Fintech前沿研究

股票情感分析

在股票投资领域，高卖低买一向是投资者的梦寐之求，但绝大多数情况只是黄粱美梦而已。虽然人们无法准确预测股价，但在不断向这个目标靠近。据了解，上世纪70年代，投资领域就开始广泛应用计算机。世界最大的两家资产管理公司黑石与领航都是完全采用量化投资方式。而近年来互联网、移动互联网、云计算、大数据、人工智能等技术的发展，为股票投资带来了更多新可能。

张晓泉教授就有不少围绕股票开展的研究课题。与人工智能相关的一个项目是利用深度学习进行股票情感分析。他的团队利用工具爬虫，全网抓取新闻媒体、散户论坛、微博等文本信息，收集后将其与该公司的金融信息做对比，建立一个模型。

据张晓泉教授介绍，该模型与其他模型的不同之处在于，其他模型从语义分析出发，仅是收集汇总文本含义。而他们的重点是，会进一步获取词汇与股票表现之间的关系，发现每个词在当时起到了什么作用。那么在未来，模型可以进行一些简单预测，发现众人的关注焦点，以及宏观层面的行业轮动。

模糊性研究

高风险、高收益是金融行业的永恒标签，股票投资也与风险息息相关。股票市场的传统风控就是研究股票波动率。业内存在一种观点是，可以用人工智能解决所有的风险管理问题。而张晓泉教授对雷锋网表示，该观点是错误的。

“ 风险有多种层次，而且一旦写出波动率，底层就一定假设了某种概率分布，但是很多时候，我们无法获知金融事件的概率分布。例如股票市场。”

图1 风险五级别

这里需要先介绍下张教授提出的不确定性的五个级别。

第一层是 Certainty，意味着 100% 会实现。
第二层是 Risk ，即有概率会发生。世界上的大部分问题都处在这个级别，但股票市场就不属于。
第三层是 Black Swan 黑天鹅，也就是小概率事件。
第四层是 Ambiguity 模糊性。“明天的股市不是涨就是跌，但是涨跌的比重没人知道。即便我们有过去世界所有股市的数据，但仍不知道明天是涨还是跌，因为有太多影响因素。”
第五层是 Radical Uncertainty，“ 人们不能描述出 Radica Uncertainty ，也完全无法解决这个级别问题。就好像人无法写一个模型来预测恐怖袭击会在何时、何地、如何发生一样”。

张晓泉教授表示，模糊性是一个比较前沿的研究，结合“Risk”有助于人们加深对风险的理解。举个例子，下图是美国股市从1968年到2016年的波动率，即股票市场的风险“Risk"。

图2 1968—2016年美国股市风险

如果用传统的方法——标准差去描述，看到几个现象：第一风险高点出现在1987年10月19日美国股灾。第二个高峰出现2002年，当时正值互联网泡沫破裂。再往后2007、2008年次贷危机攀上新高峰。

“最近我和同事在做模糊性预测模型，我们发现模糊性最高的是1987年股灾，而2002年科技泡沫时期的模糊性并没有那么高。我们得出的结论是，2002年的互联网泡沫不是一个真正的大泡沫，背后蕴含着技术对于未来的影响力。”

他总结说，经济学的愿景就是希望用模糊性去描述“Risk”没法解决的问题，他们为市场提供了模糊性新指标来衡量股票风险。

从研究到应用，两大跨界趋势

学术研究的目标在于找寻新风景，接下来的产业应用则会偏重于实地探测，挖掘金矿。除了学术经历，张晓泉教授此前也从事过投行分析师、科技公司国际市场部经理等职，还创办过一家互联网企业。他表示，从研究到应用过程中，存在两大跨界趋势。

学术界与产业界交融

第一，学术界和产业界融合愈加紧密。五到十年前，只有科研机构的实验室进行着超前研究，业界相去甚远。AI曾经是一个不被人重视的子领域，Geoffrey Hinton神经网络提出了30多年一直无人问津，但这一切在近五年发生了变化。现在业界的研究已经非常接近科研人员课题，双方互通有无，交流频繁。此外还出现了顶尖科学家投身产业界的趋势。比如，2013年，人工智能界两位泰斗多伦多大学计算机系教授Geoffrey Hinton、纽约大学终身教授YannLeCun分别加入了Google和Facebook；今年，斯坦福人工智能实验室负责人李飞飞教授兼任谷歌云首席科学家，伦敦大学学院计算机系汪军教授与阿里巴巴合作研发出了多智能双向协作网络等。

“我认为导致变化的主要原因是当时大数据尚未普及，计算能力不够。如今展现了一个非常好的趋势，科学家可能会在公司中任职，或者自己创业，这样能使得一些新的研究成果立刻付诸实践。另外，学术研究人员通常会拥有一种更长远、改变行业规则的心态，这能中和企业短期追求。”

张晓泉教授评价道。

“与此同时，也解决了学术圈长久以来存在的最大问题——资源有限，如数据资源有限，配备设施有限。此外，因为研究发现和实际应用有着一定的距离，落地流程比较繁琐，很多手握专利的教授可能不愿一步一步完成这个过程。而企业的出发点是商业化，只要有利于盈利，它们就会为研究提供资源。这样就形成了良性循环。”

当然，在双方合作落地的过程还存在一些问题，赵晓泉教授指出，其中一大基础矛盾就是学术界和产业界追求存在差异。科学家致力于最前沿的突破，研究如何将准确率95%提升到96%等问题。而企业追求解决问题，产生效用。提升1%，算法速度提升一秒等发现对于他们来说，意义可能并不是那么重大。当绝对值很小的时候，顶尖的研究对于行业的影响较微弱。这要求着学术界、产业界更进一步的沟通理解。

金融与科技的跨界合作

第二个趋势是，金融界与科技界的跨界合作正在接连上演。几乎任何一家金融机构都会设立金融科技部门，很多科技公司也开始涉足金融业务，“Fin”与“Tech”的合流之势不断明朗。

例如，今年六月，国内银行扎堆宣布与科技巨头联姻。当时，张晓泉教授就对雷锋网表达了他的看法，

“公司的存在就是为了提高效率，技术（包括商业大数据、AI）也是为了让工作更有效率，因此这样的合作更早的时候就可以开始了。未来的公司都不需要打标签，没有技术和金融之分，只是用技术来解决各行业的问题。”

与学术界与产业界需增进了解相同，fintech的发展也要求着“银行家”与“工程师”扩大交集。尤其是作为一门应用科学的股票投资。张晓泉教授举例道，一些AI专家写出的预测股票模型在实验室环境下准确率能达到80%，但是由于缺乏对金融市场的理解，真正下场的表现惨不忍睹。他的团队也有做相关预测模型，准确率在75%左右，实际表现也很稳定。

而随着近年来fintech行业的成熟，科技开始触碰到金融真正的核心。一些新技术及产品如雨后春笋涌现，其中以区块链、智能投顾最引人注目。

在张晓泉教授看来，目前智能投顾行业最大的问题是太拥挤了，门槛不高，从业者甚多。