The complexity of a string can be measured by the richness of its substrings. For example in genetics a region of DNA is considered to be highly informative if many of the possible substrings of a certain length actually occur. Abstractly this kind of complexity is captured by the standard string complexity function. When dealing with binary strings, we have the additional feature that substrings can be viewed as subsets of an index set. This allows us to apply measures of subset complexity such as VC dimension. In this paper we define a notion of VC dimension for binary strings and investigate the structure of strings of finite VC dimension.


翻译:字符串的复杂性可以用其子字符串的丰富性来衡量。 例如,在遗传学中,如果实际出现许多可能具有一定长度的子字符串,DNA区域被认为是信息量很高的区域。 简单来说,这种复杂性被标准字符串复杂性函数所捕捉。 在处理二进制字符串时,我们还有另一个特性, 即子字符串可以被视为索引集子集的子字符串。 这使我们能够应用子集复杂性的量度, 如 VC 维度。 在本文中, 我们定义了二进制字符串的 VC 维度概念, 并调查有限 VC 维度的字符串结构 。

0
下载
关闭预览

相关内容

数字化健康白皮书,17页pdf
专知会员服务
110+阅读 · 2021年1月6日
专知会员服务
162+阅读 · 2020年1月16日
2019年机器学习框架回顾
专知会员服务
36+阅读 · 2019年10月11日
已删除
将门创投
7+阅读 · 2018年11月5日
笔记 | Sentiment Analysis
黑龙江大学自然语言处理实验室
10+阅读 · 2018年5月6日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
Arxiv
0+阅读 · 2021年3月15日
VIP会员
相关VIP内容
数字化健康白皮书,17页pdf
专知会员服务
110+阅读 · 2021年1月6日
专知会员服务
162+阅读 · 2020年1月16日
2019年机器学习框架回顾
专知会员服务
36+阅读 · 2019年10月11日
相关资讯
已删除
将门创投
7+阅读 · 2018年11月5日
笔记 | Sentiment Analysis
黑龙江大学自然语言处理实验室
10+阅读 · 2018年5月6日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
Top
微信扫码咨询专知VIP会员