项目名称: 确定性表达式及其子类的理论问题与工具研究

项目编号: No.61472405

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 自动化技术、计算机技术

项目作者: 陈海明

作者单位: 中国科学院软件研究所

项目金额: 80万元

中文摘要: 确定性表达式在XML以及其它领域有着很多应用,然而相关的理论研究目前还远不能满足实际工作的需要。本项目将对其中迫切需要解决的问题进行深入、系统的研究。目前使用确定性表达式的最主要的困难在于这类表达式没有语法定义,这已成为制约确定性表达式应用以及在实际当中使用不符合规范的DTDs和XML Schemas的重要因素。另外在实际中,还经常使用确定性表达式的一些子类。因此,本项目研究确定性表达式及其子类的语法表示问题,和基于语法的确定性表达式生成工具。对于模式缺失的情况,则需要研究确定性表达式及子类的推断问题。对于确定性语言研究中极为重要的若干判定问题,我们将进行理论与算法研究,希望得到新的复杂度结论和算法。对于强确定性表达式,则希望得到线性判定算法,并通过建立确定性与强确定性表达式之间的联系,得到带数字出现的确定性表达式的自动机刻画。这些研究结果,将对确定性表达式的更好应用产生积极而深远的影响。

中文关键词: 确定性表达式;子类;XML;可判定性;算法

英文摘要: Deterministic regular expressions are widely used in XML and other fields. However the related theoretical studies for this kind of expressions currently cannot meet the need of practical work. This project will study several most important problems in the theoretical studies for deterministic expressions. Presently the most difficulty in using this kind of expressions is that they do not have a syntax definition. This has become an important reason for restricting the use of deterministic expressions, and also a reason for using DTDs and XML Schemas that do not conform specifications in practice. Meanwhile, most of DTDs and XML Schemas use subclasses of deterministic expressions, such as SOREs and CHAREs. Hence the main objectives of this project are to develop syntax definitions for deterministic expressions and their subclasses, and study tools for automatically generating deterministic expressions based on these definitions. For the situation where there is not any schema for the XML files, we will study how to infer deterministic expressions or their subclasses for these files. For some important decision problems in deterministic languages, we will try to investigate theoretical properties and develop new algorithms, and hope to get some computational complexity results. For strongly deterministic regular expressions, we want to establish the relations between strongly deterministic expressions and deterministic expressions. By using these relations, we intend to design a linear time algorithm for deciding strong determinism of regular expressions, and find automata whose determinism will indicates determinism of regular expressions with counting. All these theoretical results will greatly promote the use of deterministic regular expressions in practice.

英文关键词: Deterministic regular expressions;subclasses;XML;decidability;algorithms

成为VIP会员查看完整内容
1

相关内容

面向任务型的对话系统研究进展
专知会员服务
56+阅读 · 2021年11月17日
【开放书】《矩阵流形优化算法》,241页pdf
专知会员服务
93+阅读 · 2021年7月3日
专知会员服务
39+阅读 · 2021年6月2日
【干货书】从初等问题看数学的本质,400页pdf
专知会员服务
55+阅读 · 2021年5月28日
专知会员服务
42+阅读 · 2021年5月24日
【经典书】计算理论导论,482页pdf
专知会员服务
77+阅读 · 2021年4月10日
【经典书】数理统计学,142页pdf
专知会员服务
94+阅读 · 2021年3月25日
最新《非凸优化理论》进展书册,79页pdf
专知会员服务
104+阅读 · 2020年12月18日
【哈佛经典书】概率论与随机过程及其应用,382页pdf
专知会员服务
58+阅读 · 2020年11月14日
交替方向乘子法(ADMM)算法原理详解
PaperWeekly
3+阅读 · 2022年1月21日
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
【博士论文】基于冲量的加速优化算法
专知
7+阅读 · 2021年11月29日
Softmax 函数和它的误解
极市平台
0+阅读 · 2021年10月15日
神经网络常微分方程 (Neural ODEs) 解析
AI科技评论
40+阅读 · 2019年8月9日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
GAN的数学原理
算法与数学之美
14+阅读 · 2017年9月2日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月15日
小贴士
相关VIP内容
面向任务型的对话系统研究进展
专知会员服务
56+阅读 · 2021年11月17日
【开放书】《矩阵流形优化算法》,241页pdf
专知会员服务
93+阅读 · 2021年7月3日
专知会员服务
39+阅读 · 2021年6月2日
【干货书】从初等问题看数学的本质,400页pdf
专知会员服务
55+阅读 · 2021年5月28日
专知会员服务
42+阅读 · 2021年5月24日
【经典书】计算理论导论,482页pdf
专知会员服务
77+阅读 · 2021年4月10日
【经典书】数理统计学,142页pdf
专知会员服务
94+阅读 · 2021年3月25日
最新《非凸优化理论》进展书册,79页pdf
专知会员服务
104+阅读 · 2020年12月18日
【哈佛经典书】概率论与随机过程及其应用,382页pdf
专知会员服务
58+阅读 · 2020年11月14日
相关资讯
交替方向乘子法(ADMM)算法原理详解
PaperWeekly
3+阅读 · 2022年1月21日
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
【博士论文】基于冲量的加速优化算法
专知
7+阅读 · 2021年11月29日
Softmax 函数和它的误解
极市平台
0+阅读 · 2021年10月15日
神经网络常微分方程 (Neural ODEs) 解析
AI科技评论
40+阅读 · 2019年8月9日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
GAN的数学原理
算法与数学之美
14+阅读 · 2017年9月2日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员