In this paper, matching pairs of stocahstically generated graphs in the presence of generalized seed side-information is considered. The graph matching problem emerges naturally in various applications such as social network de-anonymization, image processing, DNA sequencing, and natural language processing. A pair of randomly generated labeled Erdos-Renyi graphs with pairwise correlated edges are considered. It is assumed that the matching strategy has access to the labeling of the vertices in the first graph, as well as a collection of shortlists -- called ambiguity sets -- of possible labels for the vertices of the second graph. The objective is to leverage the correlation among the edges of the graphs along with the side-information provided in the form of ambiguity sets to recover the labels of the vertices in the second graph. This scenario can be viewed as a generalization of the seeded graph matching problem, where the ambiguity sets take a specific form such that the exact labels for a subset of vertices in the second graph are known prior to matching. A matching strategy is proposed which operates by evaluating the joint typicality of the adjacency matrices of the graphs. Sufficient conditions on the edge statistics as well as ambiguity set statistics are derived under which the proposed matching strategy successfully recovers the labels of the vertices in the second graph. Additionally, Fano-type arguments are used to derive general necessary conditions for successful matching.
翻译:在本文中, 考虑了在普通种子侧信息面前匹配平面生成的图形的匹配配对。 图形配对问题自然出现在各种应用中, 如社交网络去匿名化、 图像处理、 DNA排序和自然语言处理。 随机生成的标签为Erdos- Renyi 的图和双向关联边缘。 假设匹配战略可以访问第一个图中脊椎的标签, 以及第二图中脊椎可能标签的短名单集 -- -- 称为模糊集 -- -- 短名单集。 目标是利用图表边缘与以模糊集形式提供的侧信息之间的关联, 以恢复第二个图中脊椎的标签。 这个假设可以被视为种子图匹配问题的概括化, 其模糊集以具体的形式表现在匹配之前知道第二个图中脊椎的一个子组的精确标签。 提议了一个匹配策略, 其匹配战略是, 将图表的边端和边端与以模糊化形式提供的边框 。, 其匹配策略是, 用来评估固定的直面的直面 。 其图的边端, 的底是用来分析 的直方图 的直方 。 。 的 的 。 。 将 将 的 将 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 将 的 的 的 的 的 将 的 的 的 的 的 的 的 的 的 的 的 。