项目名称: 语气挖掘中的领域移植问题研究
项目编号: No.60803085
项目类型: 青年科学基金项目
立项/批准年度: 2009
项目学科: 矿业工程
项目作者: 谭松波
作者单位: 中国科学院计算技术研究所
项目金额: 20万元
中文摘要: 监督与非监督方法是解决语气分类问题的两种有效办法。监督方法通常具有很高的精度。但监督方法对每个领域都需要大量有标签的训练样本,这就大大制约了它的移植能力。另一方面,非监督方法(比如基于通用语气词典)则不需要训练集,所以说,非监督方法具备一定的移植能力。但是它的精度常常受到限制,难以满足实际需求。因此,研究一种具备移植能力的高精度语气分类方法具有重要的现实意义。为了达到这个目标,我们试图从三个方面来寻求解决方案:监督方法的领域移植模型、监督与非监督方法的融合移植模型、领域词典的自动构建模型。监督方法的领域移植模型的基本思想是通过寻找新旧领域之间的"共性词",来建立一条旧领域通向新领域的桥梁;监督与非监督方法的融合移植模型的基本思想是充分挖掘非监督方法的移植能力与监督方法的高准确性;领域词典的自动构建模型的基本思想是对每个新领域自动构建一个适合该领域的语气词典。
中文关键词: 语气分类;语气挖掘;信息检索
英文摘要:
英文关键词: