We consider the problems of sampling and counting edges from a graph on $n$ vertices where our basic access is via uniformly sampled vertices. When we have a vertex, we can see its degree, and access its neighbors. Eden and Rosenbaum [SOSA 2018] have shown it is possible to sample an edge $\epsilon$-uniformly in $O(\sqrt{1/\epsilon}\frac{n}{\sqrt{m}})$ vertex accesses. Here, we get down to expected $O(\log(1/\epsilon)\frac{n}{\sqrt{m}})$ vertex accesses. Next, we consider the problem of sampling $s>1$ edges. For this we introduce a model that we call hash-based neighbor access. We show that, w.h.p, we can sample $s$ edges exactly uniformly at random, with or without replacement, in $\tilde{O}(\sqrt{s} \frac{n}{\sqrt{m}} + s)$ vertex accesses. We present a matching lower bound of $\Omega(\sqrt{s} \frac{n}{\sqrt{m}} + s)$ which holds for $\epsilon$-uniform edge multi-sampling with some constant $\epsilon>0$ even though our positive result has $\epsilon=0$. We then give an algorithm for edge counting. W.h.p., we count the number of edges to within error $\epsilon$ in time $\tilde{O}(\frac{n}{\epsilon\sqrt{m}} + \frac{1}{\epsilon^2})$. When $\epsilon$ is not too small (for $\epsilon \geq \frac{\sqrt m}{n}$), we present a near-matching lower-bound of $\Omega(\frac{n}{\epsilon \sqrt{m}})$. In the same range, the previous best upper and lower bounds were polynomially worse in $\epsilon$. Finally, we give an algorithm that instead of hash-based neighbor access uses the more standard pair queries (``are vertices $u$ and $v$ adjacent''). W.h.p. it returns $1+\epsilon$ approximation of the number of edges and runs in expected time $\tilde{O}(\frac{n}{\epsilon \sqrt{m}} + \frac{1}{\epsilon^4})$. This matches our lower bound when $\epsilon$ is not too small, specifically for $\epsilon \geq \frac{m^{1/6}}{n^{1/3}}$.


翻译:我们从一个以美元为基底的 {美元为底端的 { 美元为基底的 { 美元为基底的 { 美元为基底的 { 美元为基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 { 基底的 。 当我们有一个基底的 美元为基底的 美元 { 基底的 和 基底的 。

0
下载
关闭预览

相关内容

专知会员服务
76+阅读 · 2021年3月16日
专知会员服务
84+阅读 · 2020年12月5日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
【ICLR2020】五篇Open代码的GNN论文
专知会员服务
47+阅读 · 2019年10月2日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年9月9日
Arxiv
0+阅读 · 2021年9月8日
Arxiv
4+阅读 · 2021年7月1日
Arxiv
3+阅读 · 2018年10月18日
VIP会员
相关资讯
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员