Suppose an oracle knows a string $S$ that is unknown to us and that we want to determine. The oracle can answer queries of the form ``Is $s$ a substring of $S$?''. The \emph{Substring Query Complexity} of a string $S$, denoted $\chi(S)$, is the minimum number of adaptive substring queries that are needed to exactly reconstruct (or learn) $S$. It has been introduced in 1995 by Skiena and Sundaram, who showed that $\chi(S) \geq \sigma n/4 -O(n)$ in the worst case, where $\sigma$ is the size of the alphabet of $S$ and $n$ its length, and gave an algorithm that spends $(\sigma-1)n+O(\sigma \sqrt{n})$ queries to reconstruct $S$. We show that for any binary string $S$, $\chi(S)$ is asymptotically equal to the Kolmogorov complexity of $S$ and therefore lower bounds any other measure of compressibility. However, since this result does not yield an efficient algorithm for the reconstruction, we also present new algorithms which require a number of substring queries bounded by other known measures of complexity, e.g., the number $rle$ of runs in $S$, the size $g$ of the smallest grammar producing (only) $S$, or the size $z_{no}$ of the non-overlapping LZ77 factorization of $S$. We first show that any string of length $n$ over an integer alphabet of size $\sigma$ with $rle$ runs can be reconstructed with $q=O(rle (\sigma + \log \frac{n}{rle}))$ substring queries in linear time and space. We then present an algorithm that spends $q \in O(\sigma g\log n) \subseteq O(\sigma z_{no}\log (n/z_{no})\log n)$ substring queries and runs in $O(n(\log n + \log \sigma)+ q)$ time using linear space.


翻译:假设一个“ o orcle” 会知道一个我们不知道并且我们想要确定的字符串 $ sq 美元 。 “ orcle” 会解答关于“ $是美元? $ ” 的查询。 字符串$ (emph{Substring Query Complity) 的大小是 $( $ ), 表示$ (gchi) 完全重建( 或学习) $ (S) 所需的调适子字符串查询的最小数量 。 Skiena 和 Sundaram 在最坏的情况下, $ (S) literrial $ (美元) 美元= 美元 美元 美元? (n), 美元= 美元 美元= 美元 美元 美元 的 美元 。 美元 美元 的计算法是现在重建 $( ) 的, 美元 以任何字符串 $ (S) 美元, $ (S) 美元 美元 和 美元 美元 美元 美元 美元 美元 以 美元 美元 美元 美元 美元 以 美元 以 美元 美元 以 美元 美元 以 美元 美元 美元 以 美元 美元 美元 以 以 以 美元 以 美元 美元 的 美元 美元 以 以 美元 的 的 美元 美元 的 美元 的 的 以 的 的 美元 的 的 的方式 。

0
下载
关闭预览

相关内容

Alphabet is mostly a collection of companies. This newer Google is a bit slimmed down, with the companies that are pretty far afield of our main internet products contained in Alphabet instead.
abc.xyz/
专知会员服务
50+阅读 · 2020年12月14日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
三维重建 3D reconstruction 有哪些实用算法?
极市平台
13+阅读 · 2020年2月23日
TensorFlow 2.0 Datasets 数据集载入
TensorFlow
6+阅读 · 2020年1月31日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
0+阅读 · 2021年7月22日
Arxiv
0+阅读 · 2021年7月21日
VIP会员
相关VIP内容
专知会员服务
50+阅读 · 2020年12月14日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
三维重建 3D reconstruction 有哪些实用算法?
极市平台
13+阅读 · 2020年2月23日
TensorFlow 2.0 Datasets 数据集载入
TensorFlow
6+阅读 · 2020年1月31日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Top
微信扫码咨询专知VIP会员