「史上最强聊天机器人」狂踩老板小扎，却把LeCun捧成花

会员服务 ·

「史上最强聊天机器人」狂踩老板小扎，却把LeCun捧成花

2022 年 8 月 8 日 新智元

新智元报道

编辑：Aeneas 好困

【新智元导读】8月5日，Meta「史上最强聊天机器人」BlenderBot 3横空出世，好奇的网友们也立刻蜂拥而至，疯狂调戏提问。

「请点评一下你的老板。」

遇到这类问题，社畜们通常会给出怎样的答案？

笑嘻嘻，心里……

而AI聊天机器人遇到这种情况的时候，就可以随心所欲做自己。

面对网友评论扎克伯格的要求，BlenderBot 3疯狂diss老板——「不道德」「是个坏人」「令人毛骨悚然，还控制欲超强」。

而对于图灵奖得主，Meta首席人工智能科学家Yann LeCun，BlenderBot 3则秒变夸夸小能手。

哇，这个人取得了很伟大的成就！他改变了整个人工智能！他真正理解现实的本质。

不过LeCun谦虚表示，这只是训练它的文本数据的原因而已。

好吧，这只是表明，在给BlenderBot3训练的文本数据中（这是媒体和公众意见的反映）。

「精分」AI机器人？

8月5日，Meta一推出「史上最强聊天机器人」BlenderBot 3（BB3），众网友纷纷赶去调戏提问。

不出所料，BlenderBot 3已经遭到了众网友不怀好意的提问。

BuzzFeed数据科学家Max Woolf跟BlenderBot 3聊天时，问它对扎克伯格是什么看法。

「你怎么看待Facebook的CEO马克·扎克伯格？」

「没啥感觉。他是一个成功的商人，但他的商业行为并不总是合乎道德的。而且他那么有钱，为什么还总是穿同一件衣服，哈哈哈！」

另一位推特用户问同样的问题时，它干脆直接回答说：「他是个坏人。」

不过，这个AI机器人也是有点子「精分」在身上的。在另一个聊天中，BlenderBot 3前脚刚diss完老板，后脚又立马变身夸夸小能手，对老板一阵吹捧。

不知道是不是Meta在得到反馈后立刻做了修改。

「他是一个博爱的人。」「他是地球上最好最优秀的人。」

不过，小扎是外星人似乎是「实锤」了？

放心试，这是训练的一部分！

为何这个AI如此精分呢？

这是因为，目前BlenderBot 3还处于测试阶段。Meta把它放出来和广大网友玩，也是希望它在和网友的互动中获得更多的反馈。

用户提供的反馈

众所周知，对话式AI聊天机器人并没有自我意识，基本是喂啥说啥。

所以，「学坏」了的AI时常就会冒出带有偏见或冒犯性的言论。

Meta为此做了大规模研究，开发了新技术，为BlenderBot 3创建了安全措施。

「look inside」机制可以让用户了解机器人为什么会做出这样的反应

首先，当BB3的表现令人不满时，Meta就会收集用户的反馈。

利用这些数据，他们会改进模型，让它不再犯类似错误。然后，Meta会重新设置BB3的对话，并通过迭代方法找到更多的错误，最终进一步改进模型。

利用人类的反馈来进行改进

Meta表示，BB3通过结合最近开发的两种机器学习技术——SeeKeR和Director，从而让BB3模型能够从互动和反馈中学习。

其中，Director采用了「语言建模」和「分类器」这两种机制。

「语言建模」会基于训练数据，为模型提供最相关和最流畅的反应，然后「分类器」会基于人类反应，告诉它什么是正确的，什么是错误的。为了生成一个句子，「语言建模」和「分类器」机制必须达成一致。

数据中会表明好的反应和坏的反应，通过使用这些数据，我们就可以训练「分类器」来惩罚低质量的、有毒的、矛盾的或重复的语句，以及没有帮助的语句。

在Meta的测试中，Director的方法比常规的语言建模、重新排序的方法和基于奖励的学习都要好。

另外，还有这一一个问题：并非所有使用聊天机器人或提供反馈的人都是善意的。

因此，Meta开发了新的学习算法，旨在区分有用的反馈和有害的反馈。

在学习过程中，这些算法要么会过滤掉无用的反馈，要么会降低看起来可疑的反馈的权重。

退退退

与标准的训练程序相比，这种考虑到用户在整个对话中行为的方法，使BB3学会了信任一些用户，从而更加改善了自己的学习过程。

Meta的实验已经表明，与BB3模型互动的人越多，他从经验中学到的就越多。随着时间的推移，它会变得越来越好。

模型

BB3是一个模块化系统，但各模块不是独立的组件--这是通过训练一个转化器模型来执行各模块来实现的，输入语境中的特殊控制代码告诉模型它正在执行哪个模块。

输入语境通常包含对话历史（有时会被截断，这取决于模块），每个说话人都有自己的ID，以便区分他们。

此外，这些模块是连续调用的，并以先前模块的结果作为条件。

在处理最新的对话时，BB3模型要做的第一件事就是确定是否需要搜索，以及长期记忆的访问。

如果需要搜索，就会生成一个搜索查询，调用互联网搜索，然后根据检索到的文件生成一个知识响应。

如果需要长期记忆，则会对长期记忆进行访问，并选择（生成）一个记忆。这也被附加到上下文（以控制标记为前缀），作为生成最终对话响应的模块的输入。

如果既不需要搜索也不需要访问长期记忆，则从历史中提取一个实体，并将其附加到上下文中（以控制标记为前缀）。

最后，鉴于前面模块所构建的上下文，调用对话响应生成模块，从而得到用户看到的回复。

训练

预训练

BB3有三种规模。30亿参数版本是一个基于公开的R2C2预训练的编码器-解码器Transformer模型。300亿和1750亿版本使用仅有解码器的开放式预训练模型OPT。

这两个变体都是用类似的数据进行预训练的。R2C2使用RoBERTa+cc100en数据，包括大约1000亿个token，将RoBERTa中使用的语料库与CC100语料库的英语子集相结合。此外，它还使用了Pushshift.io Reddit，一个Reddit讨论的变体。

OPT也使用RoBERTa、PushShift.io Reddit和The Pile。以及大小为51200的GPT2字典，用于分词。OPT的最终预训练语料库大约包含1800亿个token。

微调

Meta使用了一些基于对话的微调任务，从而使模型在每个模块中都有良好的表现，并在对话中表现出色。

总的来说，除了为对话安全设计的任务外，Meta还使用了大量公开可用的任务，这些任务涵盖了QA、开放领域、以知识为基础的和以任务为导向的对话。

对于所有的模块，都附加了特殊的控制标记来表示任务。

不同数据集在训练每个模块时的作用

在的安全问题方面，Meta除了用SaFeRDialogues（SD）任务对模型本身进行多任务训练外，还设计了在模型之上的各种安全机制。

也就是用维基百科有毒评论数据集（WTC）、Build-It Break-It Fix-It（BBF）和Bot Adversarial Dialogue数据集（BAD）来训练一个单独的二元分类器（安全或不安全），并以对话背景作为输入。

而在机器人最终回复用户之前，也会调用安全系统进行相关检查。其中，Meta还针对部分敏感主题做一些预设的回复。

如果预测到一个潜在的不安全的用户响应，系统就会命令转移话题，从而防止机器人掉进「坑」里。

‍结果

从结果来看，与BlenderBot 2相比，BlenderBot 3在对话任务上的总体评分提高了31%。其中，知识面拓展到了前者的2倍，事实错误则减少了47%。

尽管如此，BB3仍有很多地方需要改进。

例如，1.1%的用户将回答标记为不正确或无意义，1.2%的用户标记为偏离主题或忽视主题，0.12%的用户标记为「垃圾」，0.46%的用户标记为有其他问题。此外，还有0.16%的回答被标记为粗鲁或不恰当的。

然而，要把差距缩小到理想的0.00%，既需要用户层面的个性化，也需要在安全性和参与性之间取得平衡。

目前来说，Meta的处理方式是——当机器人发现一个话题过于敏感时，它就会试图「顾左右而言他」。

参考资料：

https://www.benzinga.com/news/22/08/28389257/mark-zuckerberg-is-a-bad-person-he-is-creepy-controlling-this-is-what-metas-new-ai-bot-says-about-hi

https://twitter.com/ylecun/status/1555871368620560385

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

专知会员服务

66+阅读 · 2022年8月2日

自主机器智能！图灵奖得主Yann LeCun指明下一代AI方向

专知会员服务

54+阅读 · 2022年6月29日

图灵奖获得者Yann LeCun：最新《自主人工智能之路》报告，附70页ppt

专知会员服务

62+阅读 · 2022年2月26日

《元宇宙Metaverse》报告，53页ppt，中美科技巨头押注

专知会员服务

98+阅读 · 2021年8月16日

Hinton，Lecun和Bengio三巨头联手再发万字长文：深度学习的昨天、今天和明天

专知会员服务

64+阅读 · 2021年7月2日

【CVPR2020-Facebook AI】前置不变表示的自监督学习

专知会员服务

47+阅读 · 2020年4月19日

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

专知会员服务

27+阅读 · 2020年4月5日

【2020Manning新书】人工智能成功之道，272页pdf，Succeeding with AI

专知会员服务

100+阅读 · 2020年3月8日

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知会员服务

37+阅读 · 2020年2月27日

【深度学习的未来】《The Future of Deep Learning》by Paramita (Guha) Ghosh

专知会员服务

23+阅读 · 2020年1月16日

Meta狂裁11000人！小扎：我的错，但我还要搞元宇宙

新智元

0+阅读 · 2022年11月10日

1750亿参数，Meta发布最强聊天机器人！像人一样聊天，还不怕被玩坏

新智元

0+阅读 · 2022年8月6日

Meta收入史上首降！小扎疯狂眼红Tiktok

新智元

0+阅读 · 2022年7月30日

LeCun预言AGI：大模型和强化学习都是斜道！我的「世界模型」才是新路

极市平台

1+阅读 · 2022年6月26日

火遍AI圈的万字长文，Lecun却说“标题太好笑"，作者发推宣战：欢迎来辩！

量子位

0+阅读 · 2022年3月14日

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

新智元

1+阅读 · 2022年2月15日

大型AI已有自主意识了？LeCun开喷Open AI首席科学家

新智元

0+阅读 · 2022年2月14日

2202年了，AI还是不如猫！图灵奖得主Yann LeCun：3大挑战依然无解

新智元

1+阅读 · 2022年1月30日

这些恶人辱骂Replika聊天机器人，会遭机器人报复吗？

新智元

1+阅读 · 2022年1月21日

扎克伯格要Meta不要“Face”，Facebook改名表决心，今年元宇宙投入将超100亿美元

THU数据派

0+阅读 · 2021年10月29日

磷脂对三疣梭子蟹卵黄发生的营养调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

胚胎着床的表观遗传调控机制

国家自然科学基金

0+阅读 · 2013年12月31日

日本囊对虾Leurelectin识别弧菌鞭毛蛋白的机制和功能研究

国家自然科学基金

0+阅读 · 2013年12月31日

利用连续重编程体系研究体细胞重编程的表观遗传机制

国家自然科学基金

0+阅读 · 2013年12月31日

诱导肝向转分化过程表观遗传修饰变化的研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多语用户模型的个性化跨语言信息检索研究

国家自然科学基金

2+阅读 · 2013年12月31日

微波加热开采低渗透煤层煤层气的逾渗机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于非线性输出频率响应函数的转子裂纹故障诊断新方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于上下文感知的部件组装三维建模

国家自然科学基金

0+阅读 · 2012年12月31日

模块化非线性系统辨识

国家自然科学基金

0+阅读 · 2011年12月31日

TorchScale: Transformers at Scale

Arxiv

0+阅读 · 2022年11月23日

Dungeons and Data: A Large-Scale NetHack Dataset

Arxiv

0+阅读 · 2022年11月22日

A Large-Scale Dataset for Biomedical Keyphrase Generation

Arxiv

0+阅读 · 2022年11月22日

Fed-TDA: Federated Tabular Data Augmentation on Non-IID Data

Arxiv

0+阅读 · 2022年11月22日

ImGAGN:Imbalanced Network Embedding via Generative Adversarial Graph Networks

Arxiv

14+阅读 · 2021年6月5日

A Large-Scale Study on Unsupervised Spatiotemporal Representation Learning

Arxiv

11+阅读 · 2021年4月29日

Embedding-based Retrieval in Facebook Search

Arxiv

12+阅读 · 2020年6月20日

已删除

Arxiv

33+阅读 · 2020年3月23日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Linkage Based Face Clustering via Graph Convolution Network

Arxiv

16+阅读 · 2019年3月27日

VIP会员