最新资讯
DASFAA(Database Systems for Advanced Applications) 是CCF B类国际学术会议,会议涵盖了数据库、数据挖掘、推荐系统等众多领域。
在DASFAA-19会议上,实验室陈子泰和蔡桐钊合作的长文「SINE: Side Information Network Embedding」,以及李煜政的「A Semi-supervised Classification Approach for Multiple Time-varying Networks with Total Variation」,户维波的「Nonnegative Spectral Clustering for Large-Scale Semi-Supervised Learning」和黄杰的「Hyper2vec: Biased Random Walk for Hyper-Network Embedding」等三篇短文被录用。
SINE: Side Information Network Embedding
网络嵌入(Network Embedding)目的是为网络中的每个节点学习一个低维向量,使得这些低维向量能够保持网络结构的相似性,可直接作为后续任务的输入,比如节点分类和链路预测。但是在现实中,网络中的节点往往还包含着丰富的伴随信息,比如节点属性或者节点标签。如何有效利用这些信息来提升网络嵌入的质量是一个值得研究的问题。对此,本文提出了一种基于随机游走的网络嵌入方法,它能够在网络嵌入中同时考虑拓扑结构、节点属性、节点标签三者的相似性,为每个节点学习出更好的低维向量,实验证明这样得到的节点向量在后续的节点分类任务中能够取得更好的效果。
A Semi-supervised Classification Approach for Multiple Time-varying Networks with Total Variation
论文关注网络节点分类中的半监督分类方法,为降低噪声及信息缺失的影响,提出了结合多时序网络的半监督节点分类模型。在优化部分,论文将该模型分解为两个子问题,分别对节点标签变量、多时序图权重变量进行数值优化。在实验部分,论文对比了许多现有地图半监督分类方法,本文算法在分类准确度方面有较明显提升。
Nonnegative Spectral Clustering for Large-Scale Semi-Supervised Learning
谱聚类(Spectral Clustering)是近年来被广泛研究的一种基于谱图划分和矩阵特征值分解的聚类算法。许多传统的谱聚类算法忽视了指示矩阵的非负特性,导致求得的解出现严重偏差,另外,这些方法还受到后处理算法(如k-means)性能的限制。尽管少数方法保留了非负特性,但无法处理大规模问题。对此,本文提出了一种大规模的非负谱聚类算法,它自然地保留了指示矩阵的非负特性,使得聚类标签可以直接获得且更准确;同时,有限的标签信息被整合到模型中用于提高聚类性能;算法线性的时间复杂度使其可以处理大规模问题,实验证明这些改进将带来性能和速度上重大的提升。
Hyper2vec: Biased Random Walk for Hyper-Network Embedding
论文主要研究超网络的表示学习问题,网络表示学习旨在将网络中的节点表示成低维的向量形式。论文基于超网络的结构特征提出了一种带偏置的二阶随机游走模型,并取得了明显的效果提升。
更多精彩内容,请持续关注【inpluslab】