借助移动互联网技术、机器学习领域深度学习技术的发展,以及大数据语料的积累,自然语言处理技术发生了突飞猛进的变化。越来越多的科技巨头开始看到了这块潜在的“大蛋糕”中蕴藏的价值。自然语言处理的应用正变得越来越广泛,尤其是在一些公共服务以及企业级应用方业务上,比如说电商搜索或全网搜索、人机交互等等。具体说来,搜索领域在大数据场景越来越重要。在互联网发展的这么多年里,它提供的一个基础性能力就是信息检索。在搜索引起中输入想要找的内容,搜索引擎快速的给你最好的结果。促进搜索质量不断提升的一个核心就是采用了不断改进的自然语言理解技术。
另外知识图谱最早的落地也是在互联网搜索里。知识图谱其实是一个提出时间很久的概念,各大公司如微软、谷歌、百度都有比较好的应用。而其中最突出的应用,可能就是利用知识图谱来进行实体的识别。简单举例来说就是当搜索某个字符串的时候,搜索引擎知道这可能是在搜索某个人,因此它会尽量会按照人的特征去提供更多的相关信息,比如家庭信息、地址,或者是跟这个人有关系的人。当然,知识图谱的落地应用有更广阔的空间,也有像明略这样结合特定领域的应用。目前,明略正在构建各行业的知识图谱建设,通过明略知识工程完成人工智能的可复制行业应用。
而我们这次组织的系列公开课,将会由具有丰富实践经验的明略专家带领大家学习实现这些业务落地功能的关键技术!最重要的是,我们组织的这些干货满满的课程,将以我们一贯的操守免费开放给大家学习和参与!
企业级搜索简介
使用 Elasticsearch 构建企业级搜索方案
结合语义的搜索方案
搜索应用案例介绍
陈智发,技术经理,搜索技术专家。北京大学计算机硕士。目前陈智发在明略负责核心产品 SCOPA 中搜索和自然语言处理相关的架构设计及研发工作,带领团队成员实现了从文本中构建知识图谱的功能、搭建了效果优良的企业级搜索引擎。2015 年加入明略初期陈智发曾带领团队完成明略大数据商业智能产品 Discovery 的前后端架构设计和后端程序开发,对数据仓库和商业智能产品开发有丰富的经验, 是 Apache 开源项目 Calcite 的 contributor 。在加入明略之前,陈智发曾工作于虚拟化技术巨头 VMware 北京分公司,在桌面虚拟化技术部门担任开发工作,对服务器虚拟化技术、云计算技术有较深的理解。
2017 年 8 月 17 日(周四)晚八点半 大数据杂谈社群
文本处理第一个拦路虎 - 分词
不同领域的诉求是什么?
已有分词系统小结
问题的难点在哪里?
理论解决方案是啥?
如何工程解决?
结合深度学习?
牟小峰,明略研究院技术经理。专攻领域:自然语言处理。从业经历:北京语言大学博士毕业,在新媒传信飞信项目组从事自然语言处理研发;后创业,从事推荐系统开发;目前在明略研究院从事自然语言处理方面的技术研发和业务探索。
2017 年 8 月 24 日(周四)晚八点半 大数据杂谈社群
知识图谱和RDF的技术概念
RDF与属性图之间的关系
RDF的存储知识
RDF的查询技术
邵蓥侠,明略数据 SCOPA 技术顾问。北京大学博士后,主要研究方向包括大规模图计算优化、图挖掘应用以及复杂网络分析等,并在相关领域发表学术论文 10 余篇,包括 SIGMOD, VLDB, TKDE 等国际一流学术会议和期刊。曾获 2014 年 Google 博士奖学金、微软学者等称号。目前作为明略数据 SCOPA 技术顾问,主要参与图挖掘、图分析、知识工程等相关工作。
2017 年 8 月 31 日(周四)晚八点半 大数据杂谈社群
关注大数据杂谈,点击公众号菜单中的“加群学习”,按照提示操作。