本文汇总了中文知识图谱计算会议CCKS报告合集,涵盖从2013年至2018年,共48篇,从中可以看出从Google 2012年推出知识图谱以来,中国学术界及工业界这6年来知识图谱的主流思想变迁。
作者 | 刘焕勇
来源 | CSDN博客
编辑 | apddd
项目介绍
懂语言者得天下,“自然语言处理是人工智能皇冠上颗明珠”这句话,大家都耳熟能详。确实不错,相比三大信息流(图像、语音、文本)前两个信息流都已经取得了较大突破,而由于自然语言的不确定性根本特征,虽然在某些任务上超越了人类(尤其是2018年11月份的BERT模型出世,吊打人类水准),但总体来说,都集中在判别和分类问题上,在推理、文本生成上还有很长一段路要走。
知识图谱,与以深度神经网络为首连接主义不同,作为符号主义,从一开始提出就注定了要从知识表示、知识描述、知识计算与推理上不断前行。知识图谱是年老的,从最初的逻辑语义网(semanticnet),到语义网络(semantic-web),到Linked-data,再到现在的知识图谱,知识图谱从一开始到现在,说长的话,已经经历了将近50年的时间。
知识图谱又是年轻的,知识图谱真正作为一个突出热点走进大家眼球的,还是在2012年收购FreeBase的Google,终于在受不了传统的文档搜索,而寻求一种更为简洁、人性化的搜索方式后以简洁答案、知识卡片的方式形成了大家现在一直提到的知识图谱(还记得蒙娜丽莎月达芬奇的经典图),从这个时间算起,也就7年的时间,所以知识图谱又是年轻的。
在这前前后后7年的时间里,知识图谱得到了全面的发展,从知识的组织,知识的构建(包括知识抽取、融合、链接、补全[缺失知识补充,既定知识辨识])等技术得到了快速的发展,虽然目前的性能还远没有达到可以完全实用的地步,但这种繁荣迹象承载着广大科研人员的辛勤劳动和整个知识时代的推动。
从CCKS的举办议题和懂特邀报告来看,我们可以看到知识图谱话题的演变,从2013年偏向概念与本体的知识图谱构建到2014年的知识链接,再到2015年的领域知识学习与深度学习引入,再到2016年的工业界知识图谱出现,再到2017年的中文开放知识图谱openkg的提出与知识图谱的体现化,再到2018年的工业界知识图谱全面开花,我门可以看到这个领域的进步。
学术界与工业界自打从娘胎里出来后,就注定了两者之间存在着一直为世人所诟病的gap,前者往往会在一个数据小,干净的环境下去从事基础科学研究,而以经济效益和实际价值的工业界所面临的压力却要强的多。我觉得CCKS做得很好的一点,就是有意识的缩小这种天然的gap,这是值得推崇的,有利于推进知识图谱既作为基础科学,又作为知识技术得到全面的发展。
总而言之,知识图谱,前路需考量,知识图谱就自身的架构和自身的技术而言还存在一些问题,一门科学技术的成败,与其自身的定义(或者叫体系)和自身的技术水平以及与现实问题的结合度息息相关,这就注定了知识图谱未来必须要针对其描述体系,对现实人类社会知识的描述框架进行审视和调整(比如引入事件、做事件图谱、事理图谱)。
在技术上,可能深度学习技术会越来越强,新的语言模型和编码器也会越来越好。第三就是与现实问题,如具体业务的紧密度,可解决程度(我们为什么当初要提出知识图谱这个概念,用它来做什么,现在是否跑偏?)。只有从这三个方面一同发力,才能前路可望。
作为自然语言处理界的一颗小螺丝钉,希望可以从点滴做起,做好一点知识图谱的事情。所以,与之前的代码项目不同,本项目贡献一下文档。
知识图谱会议报告合集
CCKS从2013年开始举办,每年举行一次,目前已经举办6届,作者通过网上收集,最终收集形成6年共48个CCKS 2018报告集合。这些报告都十分精彩,相信能够给大家带来帮助。
获取方式
由于文件较多且较大,笔者将以上文件上传至百度网盘,供大家下载。
下载链接(密码 ibxj):
https://pan.baidu.com/s/11FA2Qimm3_OuXOLxn2AFSw
总结
本项目通过个人对CCKS资料的收集,完成了从2013年至2018年共6年的知识图谱报告的简介与开源。
本项目中所涉及到的报告内容均来源于网上公开资源,对此免责声明。
本项目中所公开的资源只供学习使用,切不可用于商用(用于换取积分等)。
知识是用来共享的,希望大家一起行动起来,为自然语言处理敬一份力量。
如有自然语言处理、知识图谱、事理图谱、社会计算、语言资源建设等问题或合作,可通过以下方式联系我:
GitHub项目介绍:https://liuhuanyong.github.io
CSDN博客:https://blog.csdn.net/lhy2014
邮件地址:lhy_in_blcu@126.com
作者:刘焕勇,语言学硕士,目前就职于中国科学院软件研究所。主要从事信息抽取、知识图谱、情感分析、社会计算等自然语言处理研发工作,兴趣包括:语言资源构建、信息抽取与知识图谱、舆情监测与社会计算。
(本文为 AI科技大本营转载文章,转载请微信联系原作者。)
推荐阅读:
点击“阅读原文”,打开CSDN APP 阅读更贴心!