教程题目:Wikipedia as a Resource for Text Analysis and Retrieval
教程简介:
维基百科中由众多网友们参与贡献形成的文章不仅反映了大众或者说网民们越来越广泛的兴趣,也很可能是目前为止最大的公开的、去中心化的非结构化或者半结构化知识库。本教程探讨为维基百科在文本分析和检索相关任务中的作用。利用维基百科的文本分析任务包括共指解析、字义及实体去模糊以及信息提取。
对于信息检索任务,对于查询指令的结构和意义有更好的理解,也可以帮助更好地匹配文档查询、聚合查询结果、为热门实体的查询提供知识检索。这个教学讲座将会对比维基百科与其他人工收集的知识库的特性以及优缺点,将会介绍把维基百科中的半结构化数据转换为结构化数据后的导出资源,以及介绍维基百科及其导出资源在文本分析以及增强信息检索中能起到的作用。
组织者:
Marius Pasca研究兴趣是信息检索和网络,机器智能,自然语言处理。