We present an algorithm for approximating the edit distance between two strings of length $n$ in time $n^{1+\varepsilon}$ up to a constant factor, for any $\varepsilon>0$. Our result completes a research direction set forth in the recent breakthrough paper [Chakraborty-Das-Goldenberg-Kouck\`y-Saks, FOCS'18], which showed the first constant-factor approximation algorithm with a (strongly) sub-quadratic running time. The recent results of [Kouck\`y-Saks, STOC'20] and [Brakensiek-Rubinstein, STOC'20] have shown near-linear time algorithms that obtain an additive approximation, near-linear in $n$ (equivalently, constant-factor approximation when the edit distance value is close to $n$). In contrast, our algorithm obtains a constant-factor approximation in near-linear time for any input strings. In contrast to prior algorithms, which are mostly recursing over smaller substrings, our algorithm gradually smoothes out the local contribution to the edit distance over progressively larger substrings. To accomplish this, we iteratively construct a distance oracle data structure for the metric of edit distance on all substrings of input strings, of length $n^{i\varepsilon}$ for $i=0,1,\ldots,1/\varepsilon$. The distance oracle approximates the edit distance over these substrings in a certain average sense, just enough to estimate the overall edit distance.
翻译:我们提出一个算法, 以近距离计算两个字符串之间的编辑距离, 以美元计时, 以美元计时, 以美元计时。 我们的结果完成了最近的突破文件[ Chakraborty- Das- Das- Goldenberg- Kouuck ⁇ y- Saks, FOCS'18] 中列出的研究方向。 相比之下, 我们的算法在近距离运行时间里, 以( 强度) 次赤道运行时间表示第一个常数差近距离算法。 [ Kouuck ⁇ y- Saks, STOC'20] 和[ Braksenseek- Rubinstein, STOC'20] 的最新结果显示的近线性时间算法, 以美元计成添加近线性近线性时速( 当编辑距离值接近美元时, 恒定点差近于 $ ) 。 相反, 我们的算法在近线性时, 所有的输入时间都得到了一个恒定的近距离近距离近点近点近点近点的近点近点。 。 与以前的算相反, 和以前的算法比较, 主要是在更小的距离内, 的距离内递回回转, 远距离内, 在更小的距离的距离内, 的距离内, 我们的递算算法, 逐渐的递算, 递算, 递算, 递算, 我们的递算中, 递算, 递算, 递算, 递算中, 递算到这个距离平平到这个距离轴轴的距离轴的递算, 我们的递进的递算, 我们的递算, 递进到这个渐的递进的递进的递, 递进数 递算, 我们的递的递的递的递, 递, 递, 递, 递, 递, 平的递进的 递算, 递算, 递算, 递算, 我们的 递算, 平的 递 的 的 的 的 的 递 递 的 递算, 递算, 渐 递进数 平的 递 的 递 递 递的 的 的 的