项目名称: 复杂规则实时检测的模型和算法研究
项目编号: No.61202477
项目类型: 青年科学基金项目
立项/批准年度: 2013
项目学科: 计算机科学学科
项目作者: 刘燕兵
作者单位: 中国科学院信息工程研究所
项目金额: 23万元
中文摘要: 规则检测是网络内容分析和过滤中的核心关键技术。待检测的规则数量日益庞大、语法愈加复杂,现有的规则检测技术面临匹配效率低下、存储空间巨大的双重挑战,无法满足高速网络流检测的高实时性要求。本课题研究大规模复杂正则表达式规则的实时检测模型和算法,在此基础上设计并实现一个高效的正则表达式规则匹配引擎。该引擎既具有"粗过滤"的高效率,又具有"精细过滤"的准确性,将大幅度提高复杂规则检测的速度、显著降低复杂规则匹配算法的计算和存储开销,能够满足高速网络环境下复杂规则检测的高实时性要求。本课题的研究成果可以广泛应用于高速网络安全、信息内容安全等领域,可以大幅度地提升我国信息安全基础设施处理效率,具有重要的理论研究价值和实际应用价值。
中文关键词: 内容安全处理;多模式串匹配;正则表达式匹配;自动机构建加速;自动机压缩
英文摘要: Signature matching plays a fundamental rule in network traffic analysis and filtering. As the signature set grows larger and the signatures become more complex, existing signature matching methods are inefficient because of slow matching speed and huge memory usage. We research on efficient models and algorithms for complex regular expression signature matching, and design a high-performance regular expression signature matching engine. The engine combines DFA-based algorithms with coarse-grained filtering strategy, resulting in high-speed performance and low memory usage. Research results are capable to meet the demand of real-time processing of high-volume traffic and can greatly enhance the ability of national infrastructure for information security. The research is important and beneficial both in theory and practice.
英文关键词: Content Security Processing;Multiple String Matching;Regular Expression Matching;Accelerate Automata Building;Automata Compression