Ranked data sets, where m judges/voters specify a preference ranking of n objects/candidates, are increasingly prevalent in contexts such as political elections, computer vision, recommender systems, and bioinformatics. The vote counts for each ranking can be viewed as an n! data vector lying on the permutahedron, which is a Cayley graph of the symmetric group with vertices labeled by permutations and an edge when two permutations differ by an adjacent transposition. Leveraging combinatorial representation theory and recent progress in signal processing on graphs, we investigate a novel, scalable transform method to interpret and exploit structure in ranked data. We represent data on the permutahedron using an overcomplete dictionary of atoms, each of which captures both smoothness information about the data (typically the focus of spectral graph decomposition methods in graph signal processing) and structural information about the data (typically the focus of symmetry decomposition methods from representation theory). These atoms have a more naturally interpretable structure than any known basis for signals on the permutahedron, and they form a Parseval frame, ensuring beneficial numerical properties such as energy preservation. We develop specialized algorithms and open software that take advantage of the symmetry and structure of the permutahedron to improve the scalability of the proposed method, making it more applicable to the high-dimensional ranked data found in applications.
翻译:由 m 法官/ 法官/ 选民 指定 n 对象/ 目标的优先等级 的 排名 数据集, m 法官/ 选民 指定 n 对象/ 候选人 的优先等级, 在政治选举、 计算机 视觉、 推荐系统 和 生物信息 等背景下越来越普遍。 每一等级的选票计数可视为 n! 位于 psutmahedron 上的数据矢量为 n! 位于 permutahedron 上的数据矢量, 这是对称组的Cayley 图表, 上面标注有垂直的斜面, 两组相相邻的交替位置不同。 混合组合代表制代表制理论和图表处理的最新进展, 我们调查了一种新颖的、可伸缩的变转换法方法, 我们用一个超完整的原子字典来代表对等等级数据的数据计数, 获取关于数据的光滑度信息( 典型的光谱图分解法处理方法的焦点 ) 和关于数据结构的结构信息( 典型的焦点来自 代表理论 ) ), 这些原子比任何已知的可解释性结构结构结构结构更自然比任何已知的可解释性结构 基础 基础,, 用于 建立 用于对等值的正数制的模型的精度结构的精度的精度,, 的精度的精度的精度的精度的精度,, 的精度的精度, 的精度的精度 的精度 的精度 的精度 的精度 的精度 的精度 的精度 的精度 的精度 的精度,, 的精度 的精度 度 度 度 的精度 的精度 的精度 的精度 的精度 的精度 度 度 的精度 度 的精度 度 度 的精度 的精度 度 度 度 度 度 度 度 的精度 的精度 度 度 度 度 度 度 度 度 度 的精度 的精度 的精度 的精度 的精度 度