袁峻峰 | AI 与理性投资——基于金融知识图谱的智能问答

2017 年 6 月 30 日 开放知识图谱 袁峻峰

本文转自公众号蚂蚁金服评论版权属于袁峻峰,仅代表个人观点。


作者介绍:袁峻峰,花名观妙,蚂蚁金服人工智能部。


                                       

国内的股票市场,一般认为是更加倾向于主题投资而不是基本面、价值投资的市场,原因之一是散户贡献了大部分成交量。与此同时,监管机构一再教育广大投资者要理性投资、价值投资,在2017年全国证券期货监管工作会议上,证监会主席刘士余也批判了题材炒作,鼓励理性投资、价值投资。


理性一直是人类探讨的一个永恒话题。本文并不打算就这一话题展开讨论,这里只描述下相关假设。本文所描述理性是按诺贝尔经济学奖,图灵奖获得者郝伯特·西蒙的不确定性环境下决策理论中的定义:理性应当是有限的理性,而不是完全理性;应当是过程合理性,而不是本质合理性。过程理性决策步骤可以参考文章[1][3]中描述。其实不论价值投资还是主题投资其实都可以理性投资。


在这个信息爆炸的时代,如《信号与噪声》[2]书中描述在大数据时代信息量呈指数增长。大多数数据都只是噪声,人们很难从干扰他们的噪声中分辨出有用的信号。数据展示给我们的通常都是我们想要的结果,而且我们通常也默认这种皆大欢喜的结果。作者纳特•西尔弗还引用莎士比亚剧作中的话“人们照着自己的意思解释一切事物的原因,实际上却和这些事物本身的目的完全相反”。在国内证券市场也是如此,更有甚者,有些专业的市场参与者还利用这点进行炒作。


如何为个人客户处理证券市场的纷繁信息,这是理性过程中的第一步的信息收集处理的要求。也是我们基于金融知识图谱的智能问答功能设计初衷。一方面,我们将金融市场相关数据构建知识库,在此基础上提供相关金融市场研究平台以及应用开发平台。另外一方面,大家知道支付宝的智能客服是蚂蚁金服人工智能部设计开发的,目前90%以上的的远程客户服务已经由智能机器人完成。在此过程中,团队积累了丰富的数据,自然语言处理(NLP)以及其他相关深度学习模型。将两者结合也就有基于金融知识图谱的智能问答功能,主要包括:


一、目前实现的一期的证券市场金融知识图谱以上市公司为核心,关联相关行业、概念等信息。客户可以询问股票、行业、基金的重仓概念板块、股权关系等问题。


 

二、国内证券市场受市场情绪比较重,在大数据时代,舆情因子是专业投资机构一直在研究的方向之一。我们也将蚂蚁金服强大的工程能力与自然语言处理模型能力相结合,为广大的普通投资者提供上市公司分析师评级与舆情信息。



三、结合专业的金融量化多因子基本面研究,将上市公司信息按以下公司基本面复合因子组合进行排名,客户可以查询行业、概念板块下指定财务估值、财务成长、舆情公司排名情况。而且之后,客户还可以根据自己的偏好自定义因子进行排名。

  • 财务因子:财务盈利、财务估值、财务运营、财务成长、资产负债

  • 公司因子:公司市值、股东集中度

  • 股价因子:换手率、相对总体市场的波动性(β系数)、波动率

  • 分析师投研因子:分析师评级

  • 舆情因子:


可以看出,目前还是以公司财务指标为主,财务的初衷是了解企业的财务状况、经营成果和现金流量等方面情况。但正如吴晓波老师说过的“你永远无法从财务报表中读懂一家互联网公司。”那些过滤了公司方方面面信息的财务信息,在这个日新月异的时代,早已不能合适的刻画公司经营情况,更何况互联网+还改变了很多行业、公司的原有商业模式。之后我们将继续完善这些企业可量化指标、包括结合大数据根据不同行业逻辑构建的因子等。


那这些公司信息因子排序能代表真实投资价值吗? 当然不行。哈耶克论述过:“在社会科学领域中什么是事实性信息。当我们说‘某一特定种类的事实(a certain kind of facts)’的时候…这些事实究竟是因为其属于某一特定种类的事实而对于我们来说是给定的,还是因为我们采取了一种特定的方法来看待它们而使它们成了这样一种给定的特定事实。”对于公司基本面信息,当然也并不是如同一些自然界中的事实一样是给定的,那些信息对个人来说之所以可以理解,是因为我们能理解那些数字背后的含义,因此,每个人据以构建企业价值的那些要素始终是我们自己心智所理解的范畴内的。以前往往只有专业的投资人会去分析这些数据。在人工智能的帮助下,将这些分析能力已问答的形式提供给广大普通投资者,从而帮助个人投资者更方便的构建自己的理性投资。

 

结论:

结合金融知识图谱和基于深度学习自然语言处理模型帮客户处理纷繁复杂的市场信息,为的是帮助个人客户更好的构建自己的理性投资。目前我们只走了一小步,希望这能为市场带来些微小而美好的改变。

 

参考文献:

[1] 郝伯特·西蒙. 现代决策理论的基石[M]. 北京经济学院出版社.1989.

[2] 纳特•西尔弗.信号与噪声:大数据时代预测的科学与艺术 [M].中信出版社.2013,9.

[3] 袁峻峰. 结合AlphaGo算法和大数据的量化基本面分析法探讨[OL].大数据文摘.2016-11-25.



OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

登录查看更多
4

相关内容

【经典书】人工智能及机器学习导论,457页pdf
专知会员服务
160+阅读 · 2020年7月5日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
163+阅读 · 2020年2月27日
报告 |事理图谱的构建及应用,附61页pdf
专知会员服务
189+阅读 · 2020年1月17日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
人工智能学习笔记,247页pdf
专知会员服务
182+阅读 · 2019年12月14日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
知识图谱的行业落地实现
竹间智能Emotibot
51+阅读 · 2019年9月16日
领域应用 | NLP 和知识图谱:金融科技领域的“双子星”
开放知识图谱
21+阅读 · 2018年8月12日
肖仰华 | 知识图谱与认知智能
开放知识图谱
15+阅读 · 2018年4月5日
刘志明 | 知识图谱及金融相关
开放知识图谱
13+阅读 · 2017年12月18日
甲子光年 | 为什么知识图谱终于火了?
开放知识图谱
5+阅读 · 2017年11月28日
你不得不看的六篇知识图谱落地好文
AI前线
29+阅读 · 2017年11月19日
漆桂林 | 知识图谱的应用
开放知识图谱
37+阅读 · 2017年9月26日
Arxiv
30+阅读 · 2019年3月13日
Embedding Logical Queries on Knowledge Graphs
Arxiv
3+阅读 · 2019年2月19日
Arxiv
9+阅读 · 2018年10月18日
Implicit Maximum Likelihood Estimation
Arxiv
7+阅读 · 2018年9月24日
Arxiv
5+阅读 · 2015年9月14日
Arxiv
3+阅读 · 2015年5月16日
VIP会员
相关VIP内容
【经典书】人工智能及机器学习导论,457页pdf
专知会员服务
160+阅读 · 2020年7月5日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
163+阅读 · 2020年2月27日
报告 |事理图谱的构建及应用,附61页pdf
专知会员服务
189+阅读 · 2020年1月17日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
人工智能学习笔记,247页pdf
专知会员服务
182+阅读 · 2019年12月14日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
相关资讯
知识图谱的行业落地实现
竹间智能Emotibot
51+阅读 · 2019年9月16日
领域应用 | NLP 和知识图谱:金融科技领域的“双子星”
开放知识图谱
21+阅读 · 2018年8月12日
肖仰华 | 知识图谱与认知智能
开放知识图谱
15+阅读 · 2018年4月5日
刘志明 | 知识图谱及金融相关
开放知识图谱
13+阅读 · 2017年12月18日
甲子光年 | 为什么知识图谱终于火了?
开放知识图谱
5+阅读 · 2017年11月28日
你不得不看的六篇知识图谱落地好文
AI前线
29+阅读 · 2017年11月19日
漆桂林 | 知识图谱的应用
开放知识图谱
37+阅读 · 2017年9月26日
相关论文
Arxiv
30+阅读 · 2019年3月13日
Embedding Logical Queries on Knowledge Graphs
Arxiv
3+阅读 · 2019年2月19日
Arxiv
9+阅读 · 2018年10月18日
Implicit Maximum Likelihood Estimation
Arxiv
7+阅读 · 2018年9月24日
Arxiv
5+阅读 · 2015年9月14日
Arxiv
3+阅读 · 2015年5月16日
Top
微信扫码咨询专知VIP会员