An absent factor of a string $w$ is a string $u$ which does not occur as a contiguous substring (a.k.a. factor) inside $w$. We extend this well-studied notion and define absent subsequences: a string $u$ is an absent subsequence of a string $w$ if $u$ does not occur as subsequence (a.k.a. scattered factor) inside $w$. Of particular interest to us are minimal absent subsequences, i.e., absent subsequences whose every subsequence is not absent, and shortest absent subsequences, i.e., absent subsequences of minimal length. We show a series of combinatorial and algorithmic results regarding these two notions. For instance: we give combinatorial characterisations of the sets of minimal and, respectively, shortest absent subsequences in a word, as well as compact representations of these sets; we show how we can test efficiently if a string is a shortest or minimal absent subsequence in a word, and we give efficient algorithms computing the lexicographically smallest absent subsequence of each kind; also, we show how a data structure for answering shortest absent subsequence-queries for the factors of a given string can be efficiently computed.


翻译:字符串 $w$ 的缺省因素是 字符串 $u 元 的缺省因素 。 字符串 美元 的缺省因素 是 美元 美元 内 美元 内 字符串 美元 的 字符串 美元 的 美元, 美元 美元 内 的 字符串 美元 的 字符串 美元 美元 的 字符串 美元 美元 的 字符串 美元 美元 的 字符串 美元 的 字符串 美元, 美元 美元 美元 美元 美元 内 美元 的 字符串 的 美元 美元, 美元 美元 美元 内 美元 内 的 字符串, 美元 内 内 内 内 的 数 数 数 内 数 数 的 数 数 数 数 数 数 。 我们特别感兴趣的是 少 的 的 后 后, 后,, 即 少 少 后 后 后 数 数,, 少, 少 数 的 。 我们如何 测试 的 短 。

0
下载
关闭预览

相关内容

专知会员服务
50+阅读 · 2021年6月30日
【如何做研究】How to research ,22页ppt
专知会员服务
108+阅读 · 2021年4月17日
[CVPR 2020]BEDSR-Net:单张文档图像的阴影去除深度网络
专知会员服务
25+阅读 · 2020年9月29日
专知会员服务
139+阅读 · 2020年5月19日
word2Vec总结
AINLP
3+阅读 · 2019年11月2日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
干货|自然语言处理中的词向量 — word2vec!
全球人工智能
7+阅读 · 2018年1月25日
R文本分类之RTextTools
R语言中文社区
4+阅读 · 2018年1月17日
【推荐】树莓派/OpenCV/dlib人脸定位/瞌睡检测
机器学习研究会
9+阅读 · 2017年10月24日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Arxiv
0+阅读 · 2021年10月21日
Arxiv
0+阅读 · 2021年10月18日
Arxiv
0+阅读 · 2021年10月18日
Arxiv
11+阅读 · 2021年3月25日
Arxiv
3+阅读 · 2019年8月19日
Arxiv
3+阅读 · 2018年11月14日
VIP会员
相关资讯
word2Vec总结
AINLP
3+阅读 · 2019年11月2日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
干货|自然语言处理中的词向量 — word2vec!
全球人工智能
7+阅读 · 2018年1月25日
R文本分类之RTextTools
R语言中文社区
4+阅读 · 2018年1月17日
【推荐】树莓派/OpenCV/dlib人脸定位/瞌睡检测
机器学习研究会
9+阅读 · 2017年10月24日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
相关论文
Arxiv
0+阅读 · 2021年10月21日
Arxiv
0+阅读 · 2021年10月18日
Arxiv
0+阅读 · 2021年10月18日
Arxiv
11+阅读 · 2021年3月25日
Arxiv
3+阅读 · 2019年8月19日
Arxiv
3+阅读 · 2018年11月14日
Top
微信扫码咨询专知VIP会员