文字描述生成视频的开源项目

2017 年 12 月 31 日 CreateAMind

文字condition 视频


Attentive Semantic Video Generation using Captions

Tensorflow implementation for the paper Attentive Semantic Video Generation using Captions by Tanya Marwah*, Gaurav Mittal* and Vineeth N. Balasubramanian accepted at International Conference on Computer Vision 2017 (ICCV 2017) (*Equal Contribution).



Proposed network architecture for attentive semantic video generation with captions.

Results

digit 6 is moving up and down digit 3 is moving left and right

person 4 is walking left to right

Example of Spatio Temporal Style Transfer

Caption 1: digit 4 is moving up and down Caption 2: digit 4 is moving left and right
Caption 1: digit 4 is moving up and down Caption 2: digit 9 is moving left and right Caption 1: digit 5 is moving left and right Caption 2: digit 9 is moving up and down

Caption 1: person 10 is walking left to right Caption 2: person 10 is walking right to left



人物行走请阅读原文访问github看原图片




招聘公众号回复招聘

登录查看更多
5

相关内容

ICCV 的全称是 IEEE International Conference on Computer Vision,即国际计算机视觉大会,由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议,被澳大利亚ICT学术会议排名和中国计算机学会等机构评为最高级别学术会议,在业内具有极高的评价。不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV,ICCV在世界范围内每两年召开一次。ICCV论文录用率非常低,是三大会议中公认级别最高的。ICCV会议时间通常在四到五天,相关领域的专家将会展示最新的研究成果。
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
专知会员服务
109+阅读 · 2020年3月12日
【干货】用BRET进行多标签文本分类(附代码)
专知会员服务
84+阅读 · 2019年12月27日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
18+阅读 · 2019年10月9日
博客 | Github开源人体姿态识别项目OpenPose中文文档
如何使用注意力模型生成图像描述?
AI研习社
9+阅读 · 2018年8月6日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
【推荐】自动特征工程开源框架
机器学习研究会
17+阅读 · 2017年11月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
SlowFast Networks for Video Recognition
Arxiv
19+阅读 · 2018年12月10日
Exploring Visual Relationship for Image Captioning
Arxiv
15+阅读 · 2018年9月19日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
专知会员服务
109+阅读 · 2020年3月12日
【干货】用BRET进行多标签文本分类(附代码)
专知会员服务
84+阅读 · 2019年12月27日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
18+阅读 · 2019年10月9日
相关论文
Top
微信扫码咨询专知VIP会员