项目名称: 面向Web话题的多文档文摘研究
项目编号: No.60903139
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 轻工业、手工业
项目作者: 张瑾
作者单位: 中国科学院计算技术研究所
项目金额: 18万元
中文摘要: 作为一种能从海量信息中快速、准确地获取有用信息的手段,自动文摘技术越来越引起人们的重视,尤其是如何从海量的Web话题信息中提取文摘内容的多文档文摘技术作为一个新的研究点,引起了研究界和产业界的广泛关注。Web话题带有内容多元性、动态演化性等特点,由此给Web话题的多文档文摘方法的研究带来了众多的挑战。面对Web话题分析的挑战,本课题在Web话题的特点分析的基础,从面向话题的多文档文摘方法的研究入手,分别从文摘计算粒度、话题表示与模型优化两方面开展面向话题的多文档文摘的研究,同时针对面向Web话题动态演化性的文摘需求,开展了动态多文档文摘的研究。本课题内容立足于研究Web2.0环境下面面向话题的自动文摘技术,既有重要的研究价值,又有广阔的应用前景,将为网络舆情分析、信息内容安全等重要应用提供关键技术支持。
中文关键词: Web话题;自动文摘;话题分析;多元性;动态演化性
英文摘要:
英文关键词: web topic;automatic summarization;topic analysis;diversity;dynamic evolutionary