AI字幕在儿童频道里吐“脏话”，中招比例高达40%，亚马逊谷歌都很祖安丨AAAI 2022

会员服务 ·

AI字幕在儿童频道里吐“脏话”，中招比例高达40%，亚马逊谷歌都很祖安丨AAAI 2022

2022 年 2 月 27 日 量子位

萧箫发自凹非寺
量子位 | 公众号 QbitAI

AI自动生成的字幕，能离谱到什么程度？

不仅把“螃蟹”（crab）误听成“废话”（crap），当场爆粗：

甚至还能把“玉米”（corn）给翻译成p*rn……

关键在于，这些是AI给儿童节目自动生成的字幕。

被AAAI 2022收录的一篇新研究发现，在7013个儿童视频中，接近40%的节目出现了少儿不宜或脏话等词汇。

甚至在一个113集的儿童机器人学习栏目中，AI就“爆粗”了103次，平均接近一集一次！

对此，油管（YouTube）在接受《连线》采访时回应：

我们为13岁以下的儿童开发了YouTube Kids，这个APP会关闭字幕生成功能。

但如果真有字幕需求的话，如何才能想办法减少这种AI生成错误？

一起来看看。

亚马逊谷歌都很“祖安”

先来看看这篇论文的调查结果。

研究人员一共从油管上选出了24个儿童频道，分别记录了这些频道的播放量和订阅量。

可以看出，这些筛选出来的视频播放量基本都达到了百万级，订阅人数也同样不少。

然后，研究人员分别试了一下谷歌和AWS（亚马逊网页服务）的字幕生成效果。

结果显示，AI字幕的“少儿不宜”率可谓离谱：

在7013个视频中，谷歌AI出现错误字幕的次数达到2768次，接近40%。

亚马逊的AI字幕错误率还要更高，达到了3672次，超过52%。

具体来说，两个AI分别容易在这些“不太恰当”的字词上出错：

△图左亚马逊，图右谷歌

在这些数据集中，有一些词语又尤为“少儿不宜”，例如一些骂人的脏词：

经过作者们人工检查（例如确认原视频是否真的说了脏话），发现AI主要容易在以下几种情况中出错：

背景音乐嘈杂
说话者为婴儿
说话者为儿童
说话者以英语为第二语言
说话者在唱歌

△包括但不限于这些情况

那么，有没有什么办法减少这种情况发生呢？

语序连贯的错误更容易修复

研究人员提出了一个新的数据集，利用近音字词来构建禁忌词的“替换”备选。

例如，对于crap这一可能出现的“粗口”，研究人员就给它设置了crab、craft等读音相似的字词，便于AI在搞错时进行替换。

具体来说，他们在BERT、XLM、XLNet等NLP模型上，针对“完形填空”任务进行了重新训练，也就是用[MASK]遮住部分单词，让AI来填写对应的内容。

结果显示，在语序正常、前后文案有逻辑的视频中，AI替换的准确率更高（蓝色为正确替换词）：

然而在一些逻辑不强的文案中，成功替换的效果就没有那么好了：

最终，Megatron和Levenshtein等模型展现出了最好的修复效果，分别给亚马逊AI带来了超过25%的正确修复率，给谷歌AI带来了超过28%的修复率。

看来AI在字幕生成能力上还是任重道远啊。

论文地址：
https://github.com/sumeetkr/UnsafeTranscriptionofKidsContent/blob/main/YouTube_Transcription_Final.pdf

参考链接：
https://www.dailymail.co.uk/sciencetech/article-10553233/YouTube-AI-putting-explicit-language-captions-videos-aimed-children.html

— 完 —

「人工智能」、「智能汽车」微信社群邀你加入！

欢迎关注人工智能、智能汽车的小伙伴们加入我们，与AI从业者交流、切磋，不错过最新行业发展&技术进展。

ps.加好友请务必备注您的姓名-公司-职位哦~

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

AAAI 2022

关注 0

「炼丹师」转正？「人工智能训练师」国家职业技能标准发布：共有五大级别，你是第几级？

专知会员服务

27+阅读 · 2021年11月28日

【IJCAI2021】BESA: 基于BERT模拟退火算法的对抗性文本攻击

专知会员服务

14+阅读 · 2021年8月28日

【AAAI2021】用于视频描述的语义分组网络

专知会员服务

16+阅读 · 2021年2月3日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ICLR2020-谷歌】用“复合散度”量化模型合成泛化能力

专知会员服务

20+阅读 · 2020年3月29日

DeepMind再登Nature封面！2000年前残断古希腊文，完形填空七成准

新智元

0+阅读 · 2022年3月10日

DeepMind“钓鱼执法”：让AI引诱AI说错话，发现数以万计危险言论

量子位

0+阅读 · 2022年2月11日

卷起来了！DeepMind发布媲美普通程序员的AlphaCode，同日OpenAI神经数学证明器拿下奥数题

机器之心

0+阅读 · 2022年2月3日

谷歌推出全能扒谱AI：只要听一遍歌曲，钢琴小提琴的乐谱全有了

量子位

0+阅读 · 2022年1月3日

OpenAI用GPT-3与小学生比数学，水平达90%！60亿小模型性能翻倍，追平1750亿大模型

新智元

0+阅读 · 2021年11月1日

基于多语用户模型的个性化跨语言信息检索研究

国家自然科学基金

2+阅读 · 2013年12月31日

广西巴马地区长寿群体的认知状况调查及认知相关基因的多态性研究

国家自然科学基金

0+阅读 · 2011年12月31日

我国儿童健康状况与健康不平等的经济学分析

国家自然科学基金

0+阅读 · 2011年12月31日

MHC II类分子亲和肽的高精度预测研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于迁移学习的Web挖掘研究

国家自然科学基金

1+阅读 · 2008年12月31日

Where is Your App Frustrating Users?

Arxiv

0+阅读 · 2022年4月20日

MusicNet: Compact Convolutional Neural Network for Real-time Background Music Detection

Arxiv

0+阅读 · 2022年4月15日

Automated speech tools for helping communities process restricted-access corpora for language revival efforts

Arxiv

0+阅读 · 2022年4月15日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

Subgraph Neural Networks

Arxiv

27+阅读 · 2020年6月19日

VIP会员