做PPT需要复杂的多模态推理技能,以总结关键概念,并以逻辑和视觉上令人愉悦的方式呈现它们。机器能学会模仿这个费力的过程吗?我们提出了一种新的任务和方法来生成文档到幻灯片。解决这一问题涉及文档摘要、图像和文本检索、幻灯片结构和布局预测,以便以适合展示的形式安排关键元素。我们提出了一个层次序列到序列的方法,以端到端方式解决我们的任务。我们的方法利用文档和幻灯片的固有结构,并结合释义和布局预测模块来生成幻灯片。为了加速这一领域的研究,我们发布了一个关于6K配对文档和幻灯片组的数据集,用于我们的实验。我们证明了我们的方法优于强基线,并产生了具有丰富内容和对齐图像的幻灯片。

https://www.zhuanzhi.ai/paper/3078b811fd7aeb94fd538d646503840e

成为VIP会员查看完整内容
45

相关内容

专知会员服务
75+阅读 · 2021年7月23日
【NAACL2021】长序列自然语言处理, 250页ppt
专知会员服务
61+阅读 · 2021年6月7日
【CMU博士论文】可控文本生成,附107页pdf与Slides
专知会员服务
55+阅读 · 2021年4月21日
【AAAI2021】生成式Transformer的对比三元组提取
专知会员服务
48+阅读 · 2021年2月7日
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
36+阅读 · 2021年1月24日
专知会员服务
306+阅读 · 2020年11月24日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
92+阅读 · 2020年7月28日
【ICML2020-西电】用于语言生成的递归层次主题引导RNN
专知会员服务
21+阅读 · 2020年6月30日
使用GAN生成序列数据
专知
7+阅读 · 2020年7月4日
AAAI 2020论文解读:关注实体以更好地理解文本
AI科技评论
17+阅读 · 2019年11月20日
【教程】如何使用深度学习为照片自动生成文本描述?
GAN生成式对抗网络
20+阅读 · 2017年11月19日
Arxiv
48+阅读 · 2021年9月11日
Hierarchical Graph Capsule Network
Arxiv
20+阅读 · 2020年12月16日
Arxiv
14+阅读 · 2018年5月15日
Arxiv
3+阅读 · 2018年1月31日
Arxiv
5+阅读 · 2017年12月29日
Arxiv
3+阅读 · 2017年6月13日
VIP会员
相关主题
相关VIP内容
专知会员服务
75+阅读 · 2021年7月23日
【NAACL2021】长序列自然语言处理, 250页ppt
专知会员服务
61+阅读 · 2021年6月7日
【CMU博士论文】可控文本生成,附107页pdf与Slides
专知会员服务
55+阅读 · 2021年4月21日
【AAAI2021】生成式Transformer的对比三元组提取
专知会员服务
48+阅读 · 2021年2月7日
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
36+阅读 · 2021年1月24日
专知会员服务
306+阅读 · 2020年11月24日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
92+阅读 · 2020年7月28日
【ICML2020-西电】用于语言生成的递归层次主题引导RNN
专知会员服务
21+阅读 · 2020年6月30日
相关论文
Arxiv
48+阅读 · 2021年9月11日
Hierarchical Graph Capsule Network
Arxiv
20+阅读 · 2020年12月16日
Arxiv
14+阅读 · 2018年5月15日
Arxiv
3+阅读 · 2018年1月31日
Arxiv
5+阅读 · 2017年12月29日
Arxiv
3+阅读 · 2017年6月13日
微信扫码咨询专知VIP会员