Billions of photos are uploaded to the web daily through various types of social networks. Some of these images receive millions of views and become popular, whereas others remain completely unnoticed. This raises the problem of predicting image popularity on social media. The popularity of an image can be affected by several factors, such as visual content, aesthetic quality, user, post metadata, and time. Thus, considering all these factors is essential for accurately predicting image popularity. In addition, the efficiency of the predictive model also plays a crucial role. In this study, motivated by multimodal learning, which uses information from various modalities, and the current success of convolutional neural networks (CNNs) in various fields, we propose a deep learning model, called visual-social convolutional neural network (VSCNN), which predicts the popularity of a posted image by incorporating various types of visual and social features into a unified network model. VSCNN first learns to extract high-level representations from the input visual and social features by utilizing two individual CNNs. The outputs of these two networks are then fused into a joint network to estimate the popularity score in the output layer. We assess the performance of the proposed method by conducting extensive experiments on a dataset of approximately 432K images posted on Flickr. The simulation results demonstrate that the proposed VSCNN model significantly outperforms state-of-the-art models, with a relative improvement of greater than 2.33%, 7.59%, and 14.16% in terms of Spearman's Rho, mean absolute error, and mean squared error, respectively.


翻译:每天通过各种类型的社交网络将数十亿张照片上传到网上。 其中一些图像通过各种类型的社交网络获得数百万个观点, 并变得广受欢迎, 而另一些则仍然完全无人注意。 这就提出了在社交媒体上预测图像受欢迎程度的问题。 图像受欢迎程度可能受到若干因素的影响, 例如视觉内容、 审美质量、 用户、 元元数据 和时间 。 因此, 考虑到所有这些因素对于准确预测图像受欢迎度至关重要。 此外, 预测模型的效率也发挥着关键作用。 在这项研究中, 由多种模式学习驱动的, 以及当前各种模式的绝对神经网络(CNNs)的成功, 我们提出了一个深层次的学习模式, 叫做视觉- 社会神经网络(VSCNNN), 通过将各种类型的视觉和社会特征纳入统一的网络模型来预测所张贴图像的受欢迎程度。 VSCNNN首先学会通过使用两个单独的CNS 来从投入33 的视觉和社会特征中提取高层次的演示。 这两家网络的输出结果随后被整合成一个联合网络, 来估计产出层59 中的平均模型的精度评分数, 。 我们分别用VSMISCFIS 的模型的模型的模型的模型的模型, 的模型的模型的模型的模型的演化结果。

0
下载
关闭预览

相关内容

Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
155+阅读 · 2019年10月12日
LibRec 精选:推荐系统的常用数据集
LibRec智能推荐
17+阅读 · 2019年2月15日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Arxiv
16+阅读 · 2021年1月27日
Arxiv
13+阅读 · 2020年8月3日
A survey on deep hashing for image retrieval
Arxiv
15+阅读 · 2020年6月10日
Image Captioning based on Deep Reinforcement Learning
Recurrent Fusion Network for Image Captioning
Arxiv
3+阅读 · 2018年7月31日
VIP会员
相关VIP内容
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
155+阅读 · 2019年10月12日
相关资讯
Top
微信扫码咨询专知VIP会员