项目名称: 融合深层语义理解的网络水军发帖自动检测技术研究
项目编号: No.61203281
项目类型: 青年科学基金项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 徐博
作者单位: 中国科学院自动化研究所
项目金额: 25万元
中文摘要: 网络水军危害社会、影响正常的网络秩序,需要研究和治理。然而目前国内外对于网络水军的研究尚处于起步阶段,还没有提出有效的针对网络水军发帖的检测方法。本项目以网络水军发帖的自动检测方法研究为目标,通过结合自然语言理解及统计机器学习的研究成果,提出针对网络水军发帖的自动检测框架,为研究解决网络水军发帖自动检测提供解决方法和途径。研究内容包括:建立网络水军的多特征描述和生成方法,从而将网络水军发帖检测问题转化成一个模式分类的可计算问题;基于深层语义的句子相似度计算方法研究是机器能从语义层面理解发帖内容并检测网络水军发帖的一个重要基础;建立针对网络水军类内多模态分布的测度学习模型,以解决大样本多模态分布学习的难题。通过建立网络水军自动检测系统平台对本项目提出的特征描述、测度学习模型进行实践验证,并从根本上解决网络水军发帖的检测问题。
中文关键词: 深度学习;短文本表示;短文本分类;短文本摘要;
英文摘要: Internet water army is very harmful to the society and has negative effects to the normal order of the network, which need the research and management. However, the research on the water army is still in the very beginning stages both at home and abroad.
英文关键词: deep learning;short-text representation;short-text classification;short-text summarization;