导读 在本篇文章中,我们将深入探讨腾讯大语言模型在多个业务场景中的应用,特别是如何通过前沿技术提升模型的智能化与用户体验。首先介绍腾讯大模型的广泛应用场景,如内容生成、智能客服和角色扮演等,并详细解析 RAG(Retrieval-Augmented Generation)技术及其在实际业务中的创新应用,特别是在文档生成和问答系统中的优势。此外,文章还将探讨 GraphRAG 在角色扮演场景中的应用,如何结合知识图谱优化复杂的知识推理。最后,将深入分析 Agent 技术的原理与应用,展示其在目标驱动任务中的强大推理与执行能力。通过这些技术的结合与实践,腾讯正在推动大语言模型在各类复杂场景中的智能化演变,提供更加精准且高效的解决方案。
****主要内容包括以下几大部分:****1. 腾讯大语言模型应用场景2. RAG 技术原理及应用实践3. GraphRAG 在角色扮演场景中的应用4. Agent 技术原理和应用 5. 问答环节分享嘉宾|赵喜生 腾讯 高级工程师编辑整理|陈思永内容校对|李瑶 出品社区|DataFun
01
腾讯大语言模型应用场景****
1. 核心应用场景腾讯大模型技术的应用覆盖了多个业务场景,包括微信生态、社交内容、视频新闻、办公文档、游戏等。通过大模型,腾讯推动了业务场景的智能化与高效化应用。 核心业务场景包括:
2. 大模型应用技术****
腾讯在大模型应用中主要使用以下三种技术方式:(1)SFT(Supervised Fine-Tuning)
基于基座模型(如大语言模型)进行微调,结合业务专属数据,将特定领域的业务知识固化于模型中。
优势:可直接实现针对性的任务回答与处理。 (2)RAG(Retrieval-Advanced Generation)
结合外部知识库与检索技术,在生成内容时加入检索结果。
应用场景:智能客服、文档助手等。
优势:提供更高的可解释性,并显著减少幻觉现象(模型生成的虚假内容)。 (3)Agent(智能体)
通过调用外部工具,支持模型进行复杂任务的推理、规划和执行。
优势:适用于需要多步骤推理和执行的复杂任务场景。
3. 混元一站式大模型应用解决方案****
腾讯通过混元大模型平台提供一整套从基础模型管理到复杂应用开发的支持体系,具体包括:(1)基础模型管理与开发支持
RAG 技术原理及优化实践
在大模型技术快速发展的背景下,其直接应用于业务场景的过程中面临一些难以忽视的问题,如: * 幻觉问题:生成内容不准确或虚假,难以满足高可靠性场景需求。 * 知识更新滞后:业务知识快速迭代,但模型更新周期较长,无法及时反映最新动态。 * 可解释性与安全性:大模型的预测过程较为黑箱,难以提供足够的安全保障。 为应对上述挑战,RAG(Retrieval-Augmented Generation)技术通过结合检索与生成机制,为模型注入动态更新的外部知识,显著提高模型在复杂场景中的回答准确性与知识实时性。后文中将从技术原理、关键环节及实际应用出发,深入探讨 RAG 技术的优化方案和应用实践。RAG 技术主要包含两个核心部分:数据准备:
1. RAG技术原理****
整体链路与原则如下:
2. RAG 应用关键挑战
RAG 在实际应用中会面临诸多挑战。首先,原始文档格式多种多样,内容提取面临挑战;第二,如何对不同格式的文档进行切分,并保证语义完整性也是需要解决的一大问题;第三,需要考虑如何构建知识库;第四,需要保证文档召回率,召回的相关性,并在必要时融合多种召回技术;最后是如何让模型更好地生成内容。(1)文档解析****
技术手段:利用端到端模型对 PDF、Office 等文档进行视觉化编码和特征提取。
提供多种切分方式适配不同业务场景:
DocQAGenerator:直接基于原始文档生成可能的 QA 对
AugmentedQuestionGenerator:在用户提供了<Question, Context>对的情况下,基于当前问题和上下文,为上下文生成更多可能的用户问题
AtomicUnitsQAGenerator:Atomic Units QA 的方法首先对原始文本进行分块,然后将块分解为原子陈述,再针对这些原子(以块为上下文)生成一组合成问题 知识库扩充方案:
针对用户知识库数据有限的情况,提出知识库扩展方案:将文档内容切分为 Chunk;提取原子成分并生成对应问题;生成问答对,扩充知识库的覆盖范围。 成果:结合论文中提出的前沿方法,实现高效、精细化的知识库构建。(4)索引召回****
向量化技术:支持两种召回方式:
融合多种来源的召回结果,包括:Vector DB(向量数据库)、ES(Elasticsearch),以及外部搜索引擎与 API。通过 Reranking 模型对召回结果进行重排和过滤,确保结果准确性和多样性。(6)知识生成****
Prompt 工程: * 明确角色设定:为模型提供专家或工程师等明确身份背景。 * 定义清晰的输入输出格式,避免歧义。 * 提供示例数据(Few-shot),增强模型理解能力。 SFT(微调优化): * 从业务场景中收集样本数据。 * 结合监督学习方法进行模型微调,进一步提升生成效果。 03****
GraphRAG 在角色扮演场景中的应用
1. RAG 局限
在角色扮演场景中,RAG 存在如下一些局限性:
GraphRAG(Graph-based Retrieval-Augmented Generation)技术通过结合知识图谱构建与生成技术,为复杂知识场景中的问题解答提供了新的解决方案,特别是在长文本处理、关系推理和上下文理解等方面具有显著优势。GraphRAG 技术通过知识图谱的构建和使用,实现了从知识提取到推理生成的全链路优化。其核心流程包括三部分:(1)索引构建(Indexing)
知识抽取:从小说或剧本中切分出语义片段,抽取实体、关系和社区信息。
图谱构建:将这些内容组织为知识图谱,存储在图数据库中。 (2)检索(Retrieval)
局部检索(Local Query):针对具体实体或关系进行检索,获取细节信息。
全局检索(Global Query):检索整个图谱的社区结构与总结内容,提取高层次信息。 (3)生成(Generation)
基于检索结果生成回答,提供清晰的溯源和逻辑推理能力。
3. 基于混元LLM构建图检索增强框架
混元 LLM 构建 GraphRAG 主要包括离线和在线两部分。********
主要步骤:
语料切分对长文本如《西游记》或《长相思》进行内容切片(Chunking),以便模型处理。
知识抽取使用大模型的 Prompt 对 Chunk 内容进行解析,提取以下信息:实体(Entity):如金箍棒、太上老君、孙悟空等。关系(Relation):如“炼制”“使用”“借用”等。社区(Community):如金箍棒在故事中的完整链条。
图谱构建将抽取的实体、关系、社区等组织成图谱,存储在图数据库中。通过嵌入(Embedding)优化查询效率。
在线检索与生成****问题解析
用户问题触发 Local 和 Global 两种检索方式。
Local Query:针对单个实体的细节信息检索。
Global Query:获取高层次社区总结,描述全局关系。内容整合与生成
模型结合 Local 和 Global 检索内容,生成准确的回答。
在全局检索中,通过 Reduce 机制对 Community Report 进行排序和整合,进一步提升回答连贯性。回答特点
准确性:基于图谱的推理与生成,更接近真实。
透明性:提供回答溯源,减少幻觉现象。
4. 角色扮演场景介绍
在角色扮演中,GraphRAG 技术被用于以下场景:
Agent 技术原理和应用
**1. ****Agent **应用场景
2. Agent 技术原理
核心功能:Agent 技术结合了推理(Reasoning)和行动(Action),模型在执行任务前进行推理,并根据推理结果执行相应的行动。 **3. **Agent 在混元中的实现
角色定义:
用户(User):与系统交互的外部角色。
计划者(Planner):负责推理任务的角色,首先判断任务是否完整,若信息不全则会反问用户获取补充信息,并通过推理计划下一步操作。
工具(Tool):用于执行外部任务的工具,如天气查询或产品购买工具。 Agent流程
反复推理与执行:任务通过多轮推理和执行外部工具得以推进。例如,任务可能包括天气查询或旅游产品购买,系统会通过外部工具获取结果,并进行进一步推理,最终返回答案给用户。
动态规划:系统会根据执行过程的反馈动态调整计划,逐步优化解决方案。
4. Agent 应用案例
业务背景:腾讯云通过代理技术支持多个合作伙伴,帮助其提升用户体验和工作效率。通过与外部工具结合,平台能够在复杂任务中灵活调度和执行,自动化处理各类任务。技术优势:
**5. **总结
分享嘉宾
INTRODUCTION
赵喜生
腾讯
高级工程师
赵喜生,腾讯机器学习平台高级工程师,多年机器学习工程和大数据领域经验,主导过多个数据和机器学习相关产品的研发和设计工作,包括机器学习平台、推荐系统、用户画像,DMP 平台等。