成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
40
大型语言模型
·
教程
·
6 月 30 日
大型语言模型(LLMs),附Slides与视频
专知会员服务
专知,提供专业可信的知识分发服务,让认知协作更快更好!
本教程全面介绍了大型语言模型(LLMs)的基本概念、构建过程和应用实例,涵盖了以下几个方面:
LLMs的基本概念
:
定义及区别:介绍了LLMs、语言模型(LM)和预训练语言模型(PLM)之间的区别,强调了LLMs的多用途和涌现能力。
语言模型的目标:包括困惑度(perplexity)等指标的定义和计算方法。
LLMs的构建过程
:
数据准备:强调了数据源的选择、数据清洗和分词的重要性。
预训练:讨论了大规模数据预训练的过程和成本。
微调与对齐:介绍了指令微调、强化学习人类反馈(RLHF)等技术,讨论了模型对齐与人类价值的关系。
流行的LLM实现概述
:
对多个著名的LLM模型(如GPT-4、Llama等)进行比较,分析它们的架构、参数规模和训练成本。
介绍了开源模型和封闭模型在研究和部署中的选择和考虑因素。
高级话题的快速采样
:
高效推理与服务:探讨了内存管理和推理效率的改进方法。
外部知识的使用:包括检索增强生成(RAG)和工具使用等技术。
多LLM代理:讨论了多个LLM协作解决复杂任务的未来方向。
负责任的AI:涵盖了可靠性、公平性、问责性、隐私和安全等广泛话题。 本教程通过详细的理论讲解和实践案例,帮助参与者理解LLMs的基本原理和前沿进展,并为未来的研究和应用提供了明确的指导和资源支持。
成为VIP会员查看完整内容
Large Language Models: the basics
点赞并收藏
40
暂时没有读者
68
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
大型语言模型
关注
88
《大型语言模型持续学习》综述
专知会员服务
76+阅读 · 4月26日
金融领域大型语言模型综述(FinLLMs)
专知会员服务
68+阅读 · 2月6日
【EMNLP2023教程】自然语言生成,249页ppt
专知会员服务
59+阅读 · 2023年12月9日
【EMNLP2023教程】自然语言处理可视化,200页ppt
专知会员服务
52+阅读 · 2023年12月6日
Text2SQL 针对表格数据的自然语言接口查询与可视化:一项综述
专知会员服务
54+阅读 · 2023年10月30日
KnowledGPT:基于知识库的检索和存储访问增强大型语言模型
专知会员服务
88+阅读 · 2023年8月31日
大语言模型简明指南
专知会员服务
139+阅读 · 2023年7月29日
UIUC-Gargi《增强型语言模型》,64页ppt与视频
专知会员服务
36+阅读 · 2023年5月12日
自然语言处理预训练模型的研究综述
专知会员服务
119+阅读 · 2020年12月9日
【2020新书】用C语言进行实际系统编程,286页pdf
专知会员服务
35+阅读 · 2020年10月29日
【2023新书】机器学习集成方法,354页pdf
专知
38+阅读 · 2023年4月11日
【2022新书】机器学习中的统计建模:概念和应用,398页pdf
专知
39+阅读 · 2022年11月5日
【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习,216页pdf
专知
16+阅读 · 2022年10月2日
【干货书】机器学习线性代数与优化,507页pdf
专知
19+阅读 · 2022年7月28日
【干货书】数据科学家统计学基础:R和Python实战,486页pdf
专知
26+阅读 · 2022年1月29日
初学者系列:Deep FM详解
专知
108+阅读 · 2019年8月26日
使用 Bert 预训练模型文本分类(内附源码)
数据库开发
102+阅读 · 2019年3月12日
【资源】机器学习算法工程师手册(PDF下载)
机器学习算法与Python学习
39+阅读 · 2018年10月14日
NLP自然语言处理(二)——基础文本分析
乐享数据DataScientists
12+阅读 · 2017年2月7日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
组合测试用例优先排序算法及选择策略研究
国家自然科学基金
6+阅读 · 2015年12月31日
基于重要性采样的并行离策略强化学习方法研究
国家自然科学基金
20+阅读 · 2015年12月31日
“自然语言-草图”耦合的地理场景查询方法研究
国家自然科学基金
3+阅读 · 2015年12月31日
汉英篇章衔接对齐资源构建与分析研究
国家自然科学基金
2+阅读 · 2015年12月31日
保持结构的交互式图像及视频编辑方法研究
国家自然科学基金
2+阅读 · 2015年12月31日
中文句子语义概念图自动构建方法及应用研究
国家自然科学基金
1+阅读 · 2014年12月31日
动态Gr?bner 基与GVW算法
国家自然科学基金
0+阅读 · 2014年12月31日
Biot模型基于有限元离散的多重网格算法研究
国家自然科学基金
1+阅读 · 2014年12月31日
复杂多元数据的半参数统计推断
国家自然科学基金
4+阅读 · 2014年12月31日
海量Web用户生成内容物化关键技术
国家自然科学基金
1+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Nature Language Reasoning, A Survey
Arxiv
66+阅读 · 2023年3月26日
A survey and taxonomy of loss functions in machine learning
Arxiv
22+阅读 · 2023年1月13日
MLRIP: Pre-training a military language representation model with informative factual knowledge and professional knowledge base
Arxiv
33+阅读 · 2022年7月28日
Few-shot Learning with Noisy Labels
Arxiv
12+阅读 · 2022年4月12日
ResMLP: Feedforward networks for image classification with data-efficient training
Arxiv
12+阅读 · 2021年5月7日
Hyper-SAGNN: a self-attention based graph neural network for hypergraphs
Arxiv
17+阅读 · 2019年11月6日
Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network
Arxiv
15+阅读 · 2019年5月28日
Interpretable machine learning: definitions, methods, and applications
Arxiv
19+阅读 · 2019年1月14日
Deep contextualized word representations
Arxiv
10+阅读 · 2018年3月22日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
大型语言模型
教程
相关VIP内容
《大型语言模型持续学习》综述
专知会员服务
76+阅读 · 4月26日
金融领域大型语言模型综述(FinLLMs)
专知会员服务
68+阅读 · 2月6日
【EMNLP2023教程】自然语言生成,249页ppt
专知会员服务
59+阅读 · 2023年12月9日
【EMNLP2023教程】自然语言处理可视化,200页ppt
专知会员服务
52+阅读 · 2023年12月6日
Text2SQL 针对表格数据的自然语言接口查询与可视化:一项综述
专知会员服务
54+阅读 · 2023年10月30日
KnowledGPT:基于知识库的检索和存储访问增强大型语言模型
专知会员服务
88+阅读 · 2023年8月31日
大语言模型简明指南
专知会员服务
139+阅读 · 2023年7月29日
UIUC-Gargi《增强型语言模型》,64页ppt与视频
专知会员服务
36+阅读 · 2023年5月12日
自然语言处理预训练模型的研究综述
专知会员服务
119+阅读 · 2020年12月9日
【2020新书】用C语言进行实际系统编程,286页pdf
专知会员服务
35+阅读 · 2020年10月29日
热门VIP内容
开通专知VIP会员 享更多权益服务
《利用自适应交互增强有人无人编队协同》217页
《美军联合任务环境测试能力(JMETC)》114页slides
俄乌冲突中的 Oreshnik 高超音速弹道导弹
《战术行动中人工智能驱动的人机协作:拟议框架、挑战和未来方向》
相关资讯
【2023新书】机器学习集成方法,354页pdf
专知
38+阅读 · 2023年4月11日
【2022新书】机器学习中的统计建模:概念和应用,398页pdf
专知
39+阅读 · 2022年11月5日
【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习,216页pdf
专知
16+阅读 · 2022年10月2日
【干货书】机器学习线性代数与优化,507页pdf
专知
19+阅读 · 2022年7月28日
【干货书】数据科学家统计学基础:R和Python实战,486页pdf
专知
26+阅读 · 2022年1月29日
初学者系列:Deep FM详解
专知
108+阅读 · 2019年8月26日
使用 Bert 预训练模型文本分类(内附源码)
数据库开发
102+阅读 · 2019年3月12日
【资源】机器学习算法工程师手册(PDF下载)
机器学习算法与Python学习
39+阅读 · 2018年10月14日
NLP自然语言处理(二)——基础文本分析
乐享数据DataScientists
12+阅读 · 2017年2月7日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
相关基金
组合测试用例优先排序算法及选择策略研究
国家自然科学基金
6+阅读 · 2015年12月31日
基于重要性采样的并行离策略强化学习方法研究
国家自然科学基金
20+阅读 · 2015年12月31日
“自然语言-草图”耦合的地理场景查询方法研究
国家自然科学基金
3+阅读 · 2015年12月31日
汉英篇章衔接对齐资源构建与分析研究
国家自然科学基金
2+阅读 · 2015年12月31日
保持结构的交互式图像及视频编辑方法研究
国家自然科学基金
2+阅读 · 2015年12月31日
中文句子语义概念图自动构建方法及应用研究
国家自然科学基金
1+阅读 · 2014年12月31日
动态Gr?bner 基与GVW算法
国家自然科学基金
0+阅读 · 2014年12月31日
Biot模型基于有限元离散的多重网格算法研究
国家自然科学基金
1+阅读 · 2014年12月31日
复杂多元数据的半参数统计推断
国家自然科学基金
4+阅读 · 2014年12月31日
海量Web用户生成内容物化关键技术
国家自然科学基金
1+阅读 · 2014年12月31日
相关论文
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Nature Language Reasoning, A Survey
Arxiv
66+阅读 · 2023年3月26日
A survey and taxonomy of loss functions in machine learning
Arxiv
22+阅读 · 2023年1月13日
MLRIP: Pre-training a military language representation model with informative factual knowledge and professional knowledge base
Arxiv
33+阅读 · 2022年7月28日
Few-shot Learning with Noisy Labels
Arxiv
12+阅读 · 2022年4月12日
ResMLP: Feedforward networks for image classification with data-efficient training
Arxiv
12+阅读 · 2021年5月7日
Hyper-SAGNN: a self-attention based graph neural network for hypergraphs
Arxiv
17+阅读 · 2019年11月6日
Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network
Arxiv
15+阅读 · 2019年5月28日
Interpretable machine learning: definitions, methods, and applications
Arxiv
19+阅读 · 2019年1月14日
Deep contextualized word representations
Arxiv
10+阅读 · 2018年3月22日
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top