道公司、市场、货币和股票的金融新闻来源的激增为战略决策提供了机会,通过挖掘数据来提取金融实体及其相互关系的结构化表示。这些表示可以方便地存储为知识图谱中的(主题、谓词、对象)三元组,可以使用这些三元组通过使用高级声明性语言回答复杂查询来驱动新的见解。为了实现这个目标,我们开发了一个为金融领域量身定制的高精度知识提取框架。该平台将多种信息提取技术与我们构建的金融词典结合在一起,从28.8万多篇金融新闻文章中提取出超过342,000篇紧凑内容,对前100篇提取内容的精确度达到78%。这些提取被存储在一个知识图谱中,以便在下游应用程序中使用。在精确性、提取的总数量和金融谓词的覆盖率方面,我们的框架优于现有的工作。
https://open.library.ubc.ca/cIRcle/collections/ubctheses/24/items/1.0392614