OpenAI 推出的 ChatGPT 对话模型掀起了新的 AI 热潮,它面对多种多样的问题对答如流,似乎已经打破了机器和人的边界。这一工作的背后是大型语言模型 (Large Language Model,LLM) 生成领域的新训练范式:来自普林斯顿博士生Ameet Deshpande讲述《大型语言模型》技术细节,值得关注! 在本次演讲中,我们将介绍从人工反馈中强化学习(RLHF)的基础知识,以及如何使用这种技术来实现最先进的ML工具,如ChatGPT。演讲的大部分内容将是相互关联的ML模型的概述,并涵盖自然语言处理和RL的基础知识,以便了解RLHF如何在大型语言模型上使用。最后将讨论RLHF的开放问题。

ChatGPT 背后的“功臣”——人类反馈强化学习RLHF 技术详解

成为VIP会员查看完整内容
186

相关内容

ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序 [1] ,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文任务。 [1] https://openai.com/blog/chatgpt/
【OpenAI-John Schulman】从人类反馈中强化学习:进展与挑战
专知会员服务
61+阅读 · 2023年4月22日
【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》
专知会员服务
162+阅读 · 2023年4月13日
ChatGPT如何work的?最新《大型语言模型》综述,51页slides
专知会员服务
160+阅读 · 2023年2月28日
ChatGPT 背后的“功臣”——RLHF 技术详解
专知会员服务
166+阅读 · 2023年2月21日
ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战
专知会员服务
74+阅读 · 2023年2月15日
【ChatGPT系列报告】AIGC专题二:ChatGPT更懂人类的叙事
专知会员服务
171+阅读 · 2023年2月15日
【哈工大SCIR】浅析ChatGPT的原理及应用
专知会员服务
187+阅读 · 2023年1月10日
ChatGPT 提⽰词⼿册
专知
11+阅读 · 2023年4月11日
阿里版ChatGPT就快来了
机器之心
4+阅读 · 2023年4月4日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
145+阅读 · 2023年4月20日
VIP会员
相关VIP内容
【OpenAI-John Schulman】从人类反馈中强化学习:进展与挑战
专知会员服务
61+阅读 · 2023年4月22日
【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》
专知会员服务
162+阅读 · 2023年4月13日
ChatGPT如何work的?最新《大型语言模型》综述,51页slides
专知会员服务
160+阅读 · 2023年2月28日
ChatGPT 背后的“功臣”——RLHF 技术详解
专知会员服务
166+阅读 · 2023年2月21日
ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战
专知会员服务
74+阅读 · 2023年2月15日
【ChatGPT系列报告】AIGC专题二:ChatGPT更懂人类的叙事
专知会员服务
171+阅读 · 2023年2月15日
【哈工大SCIR】浅析ChatGPT的原理及应用
专知会员服务
187+阅读 · 2023年1月10日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员