Significant advancements made in the generation of deepfakes have caused security and privacy issues. Attackers can easily impersonate a person's identity in an image by replacing his face with the target person's face. Moreover, a new domain of cloning human voices using deep-learning technologies is also emerging. Now, an attacker can generate realistic cloned voices of humans using only a few seconds of audio of the target person. With the emerging threat of potential harm deepfakes can cause, researchers have proposed deepfake detection methods. However, they only focus on detecting a single modality, i.e., either video or audio. On the other hand, to develop a good deepfake detector that can cope with the recent advancements in deepfake generation, we need to have a detector that can detect deepfakes of multiple modalities, i.e., videos and audios. To build such a detector, we need a dataset that contains video and respective audio deepfakes. We were able to find a most recent deepfake dataset, Audio-Video Multimodal Deepfake Detection Dataset (FakeAVCeleb), that contains not only deepfake videos but synthesized fake audios as well. We used this multimodal deepfake dataset and performed detailed baseline experiments using state-of-the-art unimodal, ensemble-based, and multimodal detection methods to evaluate it. We conclude through detailed experimentation that unimodals, addressing only a single modality, video or audio, do not perform well compared to ensemble-based methods. Whereas purely multimodal-based baselines provide the worst performance.


翻译:深海假肢生成过程中的重大进步导致了安全和隐私问题。 攻击者可以很容易地将一个人的身份假冒在图像中, 以目标人的脸替换他的脸。 此外, 正在出现一个使用深层学习技术克隆人类声音的新领域。 现在, 攻击者可以使用目标人的几秒钟音频产生现实的克隆声音。 潜在损害深层假肢的新威胁可能引发, 研究人员已经提议了深层假肢探测方法。 但是, 攻击者只侧重于探测一个单一模式, 即视频或音频。 另一方面, 开发一个良好的深层假肢探测器, 能够应对深层假肢一代最近的进展。 我们需要一个能够探测多种模式( 即视频和音频) 的现实克隆声音。 建立这样的探测器, 我们需要一个包含视频和相应声音最坏的数据集。 但是, 他们只能找到一个最新的深层假死数据集, 音- 音频- 视频- 而非非视频- 深层深层智能探测器。 我们需要一个良好的深深层假死探测器, 使用这个模型, 我们只能使用这个模拟的模拟的模拟数据采集和模拟模拟模拟的模拟的模拟数据。

0
下载
关闭预览

相关内容

专知会员服务
15+阅读 · 2021年5月13日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
已删除
将门创投
4+阅读 · 2020年6月12日
Arxiv
20+阅读 · 2020年6月8日
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
Object detection on aerial imagery using CenterNet
Arxiv
6+阅读 · 2019年8月22日
VIP会员
相关VIP内容
相关资讯
已删除
将门创投
4+阅读 · 2020年6月12日
Top
微信扫码咨询专知VIP会员