懒人制作学术会议 Oral/Spotlight Video指南 - 专知

会员服务 ·

0

懒人制作学术会议 Oral/Spotlight Video指南

2020 年 6 月 6 日 AI科技评论

作者 | 山隹木又

编辑 | 丛末

1

引言

在疫情影响下，不少学术会议都变成了线上举行，于是乎制作在线上会议上使用的oral视频成了科研工作者们的新任务，最近做了BBN工作CVPR2020 oral材料，slides的制作比较简单，有很多帖子可以参考，写个文章记录下在mac OS下做视频的工具和思路。

学术会议的视频中，图像一般是slides，声音一般是对slides的讲解。（虽然和在现场分享别无二致，但是没有实体听众，多多少少会缺点人情味和紧张感～）一个很自然的思路是，自己线下配合slides，在小黑屋里边做presentation，边录屏、录音。

虽然这样看起来流程非常自然，但是实操过程中会经常失败，比如时不时slides动画的切换没有和嘴巴配合好，时不时嘴巴秃噜了念了个错误的词，抑或是对自己的pronunciation不是很自信。如此，想录一个完整的pre出来是时间成本较高的一件事。因为我是个比较懒的人，所以想了如下的懒人思路：

写好一份精炼的讲稿，由于正常情况下人一分钟能说130～150词，所以讲稿的长度完全由视频要求的时长决定，由于CVPR视频限时5分钟，我写的就是700词左右的讲稿；
结合讲稿做好静态的slides，在脑袋里模拟一下有哪些地方需要用动画配合讲解，再添加上动画，用latex做slides的大神除外；
把讲稿扔进text-to-speech软件里，生成一份由AI念的稿子，录下来存成mp3格式；
配合AI念的语音，完成对slides的录屏，存成mp4格式；
把语音和录屏剪辑在一起，完成啦！

为什么要这么做呢？原因有以下几点：

先写稿子，稿子决定了pre的质量，稿子可以反复修改，操作空间巨大；
写好稿子再做slides，速度会非常快，而且思路会更清晰；
AI生成的念稿语音可以解放我们的嘴巴，专心做好slides的页面切换和动画配合；
完成录屏后，可以直接用AI生成的语音合成视频，也可以自己跟读AI的语音，同时录音。跟读要容易很多很多，实操一把就知道；

剩下的文章分步骤详细讲讲怎么做。

2

讲稿

选择自己喜欢的写作方式，可以写俏皮一点也可以正规一点，感觉圈子还是很包容的！这里放一小段，可以用grammarly之类的app改一改。

3

Slides

知乎上有很多帖子教怎么做「学术ppt」，搜搜就有啦！主要风格还是简洁，不要摆太多字在slides上就好，TL;DR～

4

AI念稿（语音）

这里推荐谷歌家的text-to-speech ，谷歌牛逼我只能说，太逼真啦！试用功能就够用啦。下面图中的红框可以调节语速，这个功能可以让你把稿子的时长刚好控制在5分钟，也是非常节省时间的一步，不需要自己瞎琢磨语速。

由于mac的录屏没有声音，所以这一步会用到一个工具叫作Audio Hijack，这个软件长成下面的样子，可以捕捉app的声音，选择成捕捉浏览器的声音，就可以把谷歌AI念的语音导出成mp3文件咯。

5

slides录屏（图像）

这里试用mac OS自带的QuickTimePlayer就ok，简单易用，导出的视频是mp4格式的，完美；

6

剪辑（语音+图像->出货）

强烈推荐mac OS自带的iMovie，几乎没有学习成本，把录屏的mp4和录音的 mp3导入这个app，裁剪一下超时的视频和音频，对齐一下时间轴，随后就可以导出成成品视频啦！放一小段看看效果吧！

下面是一条硬广：

做了poster但是cvpr官方通知不需要了，觉得有点浪费！放在这里宣传一下我们的工作！code已开源！

论文链接：http://www.weixiushen.com/publication/cvpr20_BBN.pdf
开源代码：https://github.com/Megvii-Nanjing/BBN
论文文字版解读：《CVPR 2020 Oral | 双边分支网络BBN：攻坚长尾分布的现实世界任务》

招聘

AI 科技评论希望能够招聘科技编辑/记者一名

办公地点：北京/深圳

职务：以参与学术顶会报道、人物专访为主

工作内容：

1、参加各种人工智能学术会议，并做会议内容报道；

2、采访人工智能领域学者或研发人员；

3、关注学术领域热点事件，并及时跟踪报道。

要求：

1、热爱人工智能学术研究内容，擅长与学者或企业工程人员打交道；

2、有一定的理工科背景，对人工智能技术有所了解者更佳；

3、英语能力强（工作内容涉及大量英文资料）；

4、学习能力强，对人工智能前沿技术有一定的了解，并能够逐渐形成自己的观点。

感兴趣者，可将简历发送到邮箱：cenfeng@leiphone.com

点击"阅读原文"，直达“ACL 交流小组”了解更多会议信息。

登录查看更多

1

相关内容

Spotlight

神经常微分方程教程，50页ppt，A brief tutorial on Neural ODEs

神经常微分方程教程，50页ppt，A brief tutorial on Neural ODEs

专知会员服务

74+阅读 · 2020年8月2日

现代机器学习技术导论，596页pdf

专知会员服务

168+阅读 · 2020年7月27日

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

专知会员服务

108+阅读 · 2020年7月9日

ACL2020接受论文列表公布，571篇长文208篇短文

ACL2020接受论文列表公布，571篇长文208篇短文

专知会员服务

67+阅读 · 2020年5月19日

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

专知会员服务

94+阅读 · 2020年5月16日

自然语言处理顶会ACL2020放榜了，你的论文中了吗？因新冠将在线举办

自然语言处理顶会ACL2020放榜了，你的论文中了吗？因新冠将在线举办

专知会员服务

36+阅读 · 2020年4月5日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

Python数据分析:过去、现在和未来，52页ppt

Python数据分析:过去、现在和未来，52页ppt

专知会员服务

103+阅读 · 2020年3月9日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

神经网络与深度学习，复旦大学邱锡鹏老师

神经网络与深度学习，复旦大学邱锡鹏老师

专知会员服务

122+阅读 · 2019年9月24日

互联网顶尖技术大会视频+PPT合集！！！

互联网顶尖技术大会视频+PPT合集！！！

架构师之路

24+阅读 · 2019年6月14日

生成逼真3D人偶，居然不用3D形状建模，还能学会你的舞步 | 三星CVPR Oral

生成逼真3D人偶，居然不用3D形状建模，还能学会你的舞步 | 三星CVPR Oral

量子位

9+阅读 · 2019年6月10日

【学界】CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

【学界】CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

GAN生成式对抗网络

22+阅读 · 2019年4月27日

CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

极市平台

88+阅读 · 2019年4月26日

SFFAI分享 | 张士峰：经验分享之我的科研历程【附PPT与视频资料】

SFFAI分享 | 张士峰：经验分享之我的科研历程【附PPT与视频资料】

人工智能前沿讲习班

85+阅读 · 2019年3月23日

投稿近2000，NAACL 2019接收率仅为22.6%|附录取论文名单

投稿近2000，NAACL 2019接收率仅为22.6%|附录取论文名单

AI100

14+阅读 · 2019年3月2日

独家揭秘 | 波士顿动力SpotMini机器人自主导航技术

独家揭秘 | 波士顿动力SpotMini机器人自主导航技术

计算机视觉life

22+阅读 · 2018年5月15日

用Python制作3D动画

用Python制作3D动画

Python程序员

30+阅读 · 2018年1月17日

学习大纲：两周搭建Demo理解机器学习

学习大纲：两周搭建Demo理解机器学习

人人都是产品经理

5+阅读 · 2017年12月28日

视频教程【第13期】 | 5分钟了解TensorFlow的可视化工具包—Tensorboard

视频教程【第13期】 | 5分钟了解TensorFlow的可视化工具包—Tensorboard

AI100

3+阅读 · 2017年9月1日

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Arxiv

18+阅读 · 2019年9月25日

Neural Speech Synthesis with Transformer Network

Neural Speech Synthesis with Transformer Network

Arxiv

5+阅读 · 2019年1月30日

Close to Human Quality TTS with Transformer

Arxiv

3+阅读 · 2018年11月13日

Towards Scalable Spectral Clustering via Spectrum-Preserving Sparsification

Towards Scalable Spectral Clustering via Spectrum-Preserving Sparsification

Arxiv

4+阅读 · 2018年10月11日

Video-to-Video Synthesis

Video-to-Video Synthesis

Arxiv

9+阅读 · 2018年8月20日

I Have Seen Enough: A Teacher Student Network for Video Classification Using Fewer Frames

Arxiv

8+阅读 · 2018年5月12日

Long-term Visual Localization using Semantically Segmented Images

Arxiv

7+阅读 · 2018年1月16日

Detect-and-Track: Efficient Pose Estimation in Videos

Arxiv

7+阅读 · 2017年12月26日

Mitigating the Impact of Speech Recognition Errors on Chatbot using Sequence-to-Sequence Model

Arxiv

4+阅读 · 2017年12月2日

VIP会员

相关主题

相关VIP内容

神经常微分方程教程，50页ppt，A brief tutorial on Neural ODEs

神经常微分方程教程，50页ppt，A brief tutorial on Neural ODEs

专知会员服务

74+阅读 · 2020年8月2日

现代机器学习技术导论，596页pdf

专知会员服务

168+阅读 · 2020年7月27日

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

专知会员服务

108+阅读 · 2020年7月9日

ACL2020接受论文列表公布，571篇长文208篇短文

ACL2020接受论文列表公布，571篇长文208篇短文

专知会员服务

67+阅读 · 2020年5月19日

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

专知会员服务

94+阅读 · 2020年5月16日

自然语言处理顶会ACL2020放榜了，你的论文中了吗？因新冠将在线举办

自然语言处理顶会ACL2020放榜了，你的论文中了吗？因新冠将在线举办

专知会员服务

36+阅读 · 2020年4月5日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

Python数据分析:过去、现在和未来，52页ppt

Python数据分析:过去、现在和未来，52页ppt

专知会员服务

103+阅读 · 2020年3月9日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

神经网络与深度学习，复旦大学邱锡鹏老师

神经网络与深度学习，复旦大学邱锡鹏老师

专知会员服务

122+阅读 · 2019年9月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

互联网顶尖技术大会视频+PPT合集！！！

互联网顶尖技术大会视频+PPT合集！！！

架构师之路

24+阅读 · 2019年6月14日

生成逼真3D人偶，居然不用3D形状建模，还能学会你的舞步 | 三星CVPR Oral

生成逼真3D人偶，居然不用3D形状建模，还能学会你的舞步 | 三星CVPR Oral

量子位

9+阅读 · 2019年6月10日

【学界】CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

【学界】CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

GAN生成式对抗网络

22+阅读 · 2019年4月27日

CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

极市平台

88+阅读 · 2019年4月26日

SFFAI分享 | 张士峰：经验分享之我的科研历程【附PPT与视频资料】

SFFAI分享 | 张士峰：经验分享之我的科研历程【附PPT与视频资料】

人工智能前沿讲习班

85+阅读 · 2019年3月23日

投稿近2000，NAACL 2019接收率仅为22.6%|附录取论文名单

投稿近2000，NAACL 2019接收率仅为22.6%|附录取论文名单

AI100

14+阅读 · 2019年3月2日

独家揭秘 | 波士顿动力SpotMini机器人自主导航技术

独家揭秘 | 波士顿动力SpotMini机器人自主导航技术

计算机视觉life

22+阅读 · 2018年5月15日

用Python制作3D动画

用Python制作3D动画

Python程序员

30+阅读 · 2018年1月17日

学习大纲：两周搭建Demo理解机器学习

学习大纲：两周搭建Demo理解机器学习

人人都是产品经理

5+阅读 · 2017年12月28日

视频教程【第13期】 | 5分钟了解TensorFlow的可视化工具包—Tensorboard

视频教程【第13期】 | 5分钟了解TensorFlow的可视化工具包—Tensorboard

AI100

3+阅读 · 2017年9月1日

相关论文

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Arxiv

18+阅读 · 2019年9月25日

Neural Speech Synthesis with Transformer Network

Neural Speech Synthesis with Transformer Network

Arxiv

5+阅读 · 2019年1月30日

Close to Human Quality TTS with Transformer

Arxiv

3+阅读 · 2018年11月13日

Towards Scalable Spectral Clustering via Spectrum-Preserving Sparsification

Towards Scalable Spectral Clustering via Spectrum-Preserving Sparsification

Arxiv

4+阅读 · 2018年10月11日

Video-to-Video Synthesis

Video-to-Video Synthesis

Arxiv

9+阅读 · 2018年8月20日

I Have Seen Enough: A Teacher Student Network for Video Classification Using Fewer Frames

Arxiv

8+阅读 · 2018年5月12日

Long-term Visual Localization using Semantically Segmented Images

Arxiv

7+阅读 · 2018年1月16日

Detect-and-Track: Efficient Pose Estimation in Videos

Arxiv

7+阅读 · 2017年12月26日

Mitigating the Impact of Speech Recognition Errors on Chatbot using Sequence-to-Sequence Model

Arxiv

4+阅读 · 2017年12月2日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

精排模型-从MLP到行为序列：DIN、DIEN、MIMN、SIM、DSIN

微信扫码咨询专知VIP会员