在构建基于非结构化数据的知识图谱的过程中需要用到哪些技术?每个技术主要解决的问题是什么?

贪心学院AI学习挑战赛(奖学金活动)第18周第1个问题
关注者
43
被浏览
24,253
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

非结构数据-> 信息抽取(命名实体识别、关系抽取)-> 图谱构建(实体消歧、链接预测)-> 图分析算法

1.数据收集:构建数据库,得到数据。一般的可以运用网络爬虫去获取资源。非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML, HTML、各类报表、图像和音频/视频信息等等。爬虫可以获取非结构化的数据。

2.信息抽取:信息抽取是从异构数据源中自动抽取信息得到候选知识单元。对于结构化地数据只需要简单预处理,而非结构化数据需要借助自然语言处理等技术来提取出结构化信息。

3.图谱构建:根据实际需求构建自己的图谱

4.算法分析:根据实际场景进行图谱树算分析,促进项目落地