200字带你看完一本书，GPT-3已经会给长篇小说写摘要了

会员服务 ·

200字带你看完一本书，GPT-3已经会给长篇小说写摘要了

2021 年 9 月 28 日 夕小瑶的卖萌屋

文 | 博雯
源 | 量子位

现在，AI能帮你200字看完一段12万词的长篇小说了！比如这样一段121567词的《傲慢与偏见》原文：

AI分四个阶段来总结：先把原文总结成276个摘要（24796词），然后进一步压缩成25个摘要（3272词），再到4个摘要（475词）。最终得到一段175词的摘要，长度只有原片段的千分之一：

粗略翻译下看看，关键的几个情节都点到了：

这理解力，不禁让人望着某泡面压留下了泪水。这就是OpenAI最新推出的能给任意长度书籍写摘要的模型。

平均10万词以上的训练文本，最终能压缩到400字以内。而且这也是源自OpenAI精妙的刀法：没错，就是把GPT-3数据集里的书籍/小说部分抽出来进行训练所得到的模型。

话不多说，一起来看看这个微调版的GPT-3模型。

递归任务分解

首先，现将“总结一段文本”这一任务进行算法上的分解。如果该文本足够短，就直接进行总结；如果它比较长，就把文本分成小块，并递归地对每一块进行总结。这就形成了一棵总结任务树：

其中只有叶子任务会对书籍中的原始文本进行操作。并且，已生成的摘要应该放在同一深度，并按照顺序串联起来。

比如上图中的蓝色任务的先前总结输出就用虚线来表示，这样，每一个摘要都是自然地从上一层任务（前文）流出，以保证那些相距较远的段落能够真正地“联系上下文”。接下来开始训练：

根据上述的任务树将书籍和其子摘要递归为任务；
从树上抽出一个节点，对应一个带训练的总结任务；
获得训练数据，给该节点以输入；
使用训练数据对模型进行微调。

其中，所有训练数据都来自GPT-3中的书籍部分。研究人员会跳过非叙事性书籍，尽量选择小说类（平均包含超过10万个单词），因为这些上下文关联性更强的文本对总结任务来说更难。

这一训练过程可以使用新的模型、不同的节点采样策略、不同的训练数据类型（演示和比较）来迭代。对于演示用的数据，使用标准的交叉熵损失函数进行行为克隆（BC）。

对于比较数据，则通过强化学习（RL）来对抗一个专为人类偏好而训练的奖励模型。强化学习也有三种变体的抽样任务：

全树
第一棵子树
第一片叶子

训练完成后进行总结，任务的最终目的是追溯出叙述的时间线和整体主题。每个摘要子任务的目标是将文本压缩5到10倍，长度上限为128到384个符号。

优于现有同类模型

实验阶段，研究人员使用了Goodreads 2020榜单上的40本最受欢迎的书籍，其中囊括了幻想、恐怖、爱情、推理等近20个类型。然后让两名人类研究员和模型同时进行总结，要求双方的摘要质量的一致性接近于80%。

模型规模分为175B和6B两种，且训练模式也分为上述的强化学习的三种变体任务。最后结果中，可以看到第一棵子树RL和全树RL的总结任务最接近于人类的水平：

并且，也有超过5%的175B模型的摘要被打到了6分（满分7分），超过15%的摘要被打到5分：

研究团队也在最近提出的BookSum数据集上进行了测试，结果比现有的长文本总结模型更好：

除此之外，摘要是否能用来回答关于原文的问题也是评估方法之一。因此，团队将他们的总结模型应用于NarrativeQA问题回答数据集，可以看到，虽然没有经过明确的问题回答训练，但在所有的指标上都获得了最好的结果：

作者介绍

这篇研究出自OpenAI的 OpenAI Alignment team，他们表示，目前没有开源此模型的计划。论文一作Jeff Wu本硕都毕业于麻省理工大学，在加入OpenAI之前有过在谷歌工作的经历。

共同一作Long Ouyang本科毕业于哈佛大学，博士则毕业于斯坦福大学的认知心理学专业，主要研究领域为认知科学与概率规划研究。

论文：
https://arxiv.org/abs/2109.10862OpenAI

官网介绍：
https://openai.com/blog/summarizing-books/

参考链接：
https://venturebeat.com/2021/09/23/openai-unveils-model-that-can-summarize-books-of-any-length/

后台回复关键词【入群】

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会】

获取ACL、CIKM等各大顶会论文集！

登录查看更多

相关内容

GPT-3

关注 4

Max Welling作序，前高通AI研究员Jakub Tomczak2022新书《深度生成模型》出版,200+pdf

专知会员服务

140+阅读 · 2022年2月24日

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

北京大学《代数学方法卷二：线性代数》，318页pdf开放书

专知会员服务

67+阅读 · 2021年4月25日

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

专知会员服务

311+阅读 · 2021年3月21日

【2021新书】模式、预测与行动：机器学习的故事，308页pdf

专知会员服务

84+阅读 · 2021年2月15日

【经典书】线性代数，Linear Algebra，525页pdf

专知会员服务

78+阅读 · 2021年1月29日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

109+阅读 · 2020年12月19日

【2020 最新论文】对比学习中什么应该不是对比的？

专知会员服务

39+阅读 · 2020年8月16日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ACL2020】不要停止预训练:根据领域和任务自适应调整语言模型，Don't Stop Pretraining: Adapt Language Models to Domains and Tasks

专知会员服务

46+阅读 · 2020年4月25日

改代码超级快！GPT-3新增编辑与插入文本功能，AI能为你写诗了

新智元

0+阅读 · 2022年3月22日

作文写到8000字发现中间写错了？新版GPT-3：别怕，我可以改

大数据文摘

0+阅读 · 2022年3月17日

AAAI 2022上那些值得关注的NLP论文

PaperWeekly

1+阅读 · 2022年2月19日

OpenAI教GPT-3学会上网，「全知全能」的AI模型上线了

机器之心

1+阅读 · 2021年12月17日

3分钟看完一篇论文，这个AI文本生成模型把今年NeurIPS 2300+篇总结了个遍

量子位

0+阅读 · 2021年11月26日

有时抄个1000词，有时自己发挥，新研究揭示GPT到底是怎么写作文的

机器之心

0+阅读 · 2021年11月20日

OpenAI用GPT-3与小学生比数学，水平达90%！60亿小模型性能翻倍，追平1750亿大模型

新智元

0+阅读 · 2021年11月1日

AAAI'21 | 对比自监督的图分类

图与推荐

8+阅读 · 2021年10月28日

恕我直言，你的实验结论可能严重依赖随机数种子！

夕小瑶的卖萌屋

0+阅读 · 2021年8月19日

面试题：预训练方法 BERT和OpenAI GPT有什么区别？

七月在线实验室

15+阅读 · 2019年5月15日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

长时间、中低热流、高焓气动加热条件下材料的碳化分解机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

数学天元基金统计学研究生暑期学校2015

国家自然科学基金

2+阅读 · 2015年5月31日

面向企业的商品评论代表性意见提取策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

外部数据下中国商业银行操作风险度量模型验证研究

国家自然科学基金

0+阅读 · 2013年12月31日

无机氮对海草凋落叶分解率及其溶解有机碳释放率的影响

国家自然科学基金

0+阅读 · 2013年12月31日

基于生成模型的迁移学习算法研究及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

维、哈、柯跨语言内容过滤关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于复杂网络的中文文本语义相似度研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于数据挖掘的煤矿灾害预测研究

国家自然科学基金

0+阅读 · 2009年12月31日

A Corpus for Understanding and Generating Moral Stories

Arxiv

1+阅读 · 2022年4月20日

CodexDB: Generating Code for Processing SQL Queries using GPT-3 Codex

Arxiv

2+阅读 · 2022年4月19日

Adaptive Methods for Real-World Domain Generalization

Arxiv

13+阅读 · 2021年3月29日

Unsupervised Domain Clusters in Pretrained Language Models

Arxiv

11+阅读 · 2020年4月5日

Towards Building a Multilingual Sememe Knowledge Base: Predicting Sememes for BabelNet Synsets

Arxiv

15+阅读 · 2019年12月4日

Learning to Propagate for Graph Meta-Learning

Arxiv

14+阅读 · 2019年9月11日

Learning Discrete Structures for Graph Neural Networks

Arxiv

17+阅读 · 2019年3月28日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

Matching Networks for One Shot Learning

Arxiv

10+阅读 · 2017年12月29日

Attention Is All You Need

Arxiv

27+阅读 · 2017年12月6日

VIP会员