计算基础设施的发展一直是近年来机器学习(Machine Learning, ML)重大突破的关键驱动力。如今,每年在 ML 软件与硬件基础设施上的投资高达数千亿美元,机器学习系统的效率比以往任何时候都更加重要。 目前,有两大趋势正在塑造 ML 系统的演进。

首先,现代 AI 系统正变得越来越复杂,往往集成了超出模型本身的多个组件——向量数据系统在其中发挥着关键作用。一个典型例子是检索增强生成(Retrieval-Augmented Generation, RAG),它不仅融合了多个模型组件,还结合了基于向量数据库的向量检索系统。系统组件(模型与向量数据系统)以及底层硬件(用于模型的 ML 加速器与用于检索的异构硬件)的异质性,使得这些工作负载与传统的模型推理与训练有显著不同。

其次,随着摩尔定律的终结,具备专用或异构硬件的计算机系统日益普及。多样化硬件组件的存在——其计算能力、内存层次结构及互连架构各不相同——带来了新的挑战:如果不充分考虑硬件格局的快速演变,实现高系统效率已不再可行。 基于上述两点观察,本论文围绕机器学习系统效率提出了三个关键研究问题: 1. 如何为新兴且复杂的 ML 工作负载(如 RAG 推理服务)设计高效的系统? 1. 如何开发更高效的向量数据系统与硬件? 1. 在后摩尔时代,如何在算法、系统与硬件之间实现协同优化?

为解答这些问题,本论文采用了跨栈(cross-stack)方法,并在提升 ML 系统效率方面做出了三大主要贡献,涵盖算法、系统与硬件三个层面。 首先,针对 RAG 推理服务在整个计算栈的效率问题,本论文提出了多项开创性工作:PipeRAG 聚焦算法层面的改进,RAGO 引入系统层优化,Chameleon 探索在 RAG 中使用异构加速器系统的方案。 其次,本论文研究了面向向量检索的算法-硬件协同设计,这不仅是 RAG 系统的核心环节,也在搜索引擎、推荐系统等领域具有重要意义。具体而言,FANNSFalcon 分别优化了基于量化和基于图的两类最流行检索算法范式。 第三,本论文关注推荐系统的推理效率——这也是向量中心型(vector-centric)ML 系统的另一典型案例。在推荐模型中,对嵌入向量表的内存密集型查找操作常常是主要性能瓶颈。MicroRecFleetRec 分别在硬件与系统层面提出解决方案,同时优化数据传输与计算,从而提升大规模推荐模型的效率。 本论文的研究工作并非一次性成果,而是迈向 ML 基础设施持续演进的奠基之作。它强调了两点重要性:(a) 优化现代 ML 流水线中的向量数据系统;(b) 在整个计算栈上追求性能优化。本文提出的思想将为下一代 ML 系统的设计与实现提供坚实基础。

成为VIP会员查看完整内容
1

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
基于脉冲神经网络的边缘智能
专知会员服务
17+阅读 · 7月23日
深度强化学习中的奖励模型:综述
专知会员服务
29+阅读 · 6月20日
面向医学的多模态大型语言模型:全面综述
专知会员服务
22+阅读 · 5月1日
当持续学习遇上多模态大型语言模型:综述
专知会员服务
29+阅读 · 3月5日
多模态持续学习的最新进展:综合综述
专知会员服务
46+阅读 · 2024年10月10日
用于疾病诊断的大型语言模型:范围综述
专知会员服务
26+阅读 · 2024年9月8日
边缘图智能:互相赋能边缘网络与图智能
专知会员服务
24+阅读 · 2024年7月28日
数据与多模态大型语言模型的协同作用综述
专知会员服务
55+阅读 · 2024年7月13日
可解释的机器学习模型和架构
专知会员服务
92+阅读 · 2023年9月17日
基于表格数据的深度学习方法
专知会员服务
39+阅读 · 2021年10月19日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
SemanticAdv:基于语义属性的对抗样本生成方法
机器之心
14+阅读 · 2019年7月12日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
神经网络结构在命名实体识别(NER)中的应用
全球人工智能
11+阅读 · 2018年4月5日
探幽深度生成模型的两种方法:VAE和GAN
AI前线
15+阅读 · 2018年3月10日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
基于信息理论的机器学习
专知
22+阅读 · 2017年11月23日
基于注意力机制的图卷积网络
科技创新与创业
73+阅读 · 2017年11月8日
深度学习时代的目标检测算法综述
AI前线
12+阅读 · 2017年9月22日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
44+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
475+阅读 · 2023年3月31日
Arxiv
172+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
基于脉冲神经网络的边缘智能
专知会员服务
17+阅读 · 7月23日
深度强化学习中的奖励模型:综述
专知会员服务
29+阅读 · 6月20日
面向医学的多模态大型语言模型:全面综述
专知会员服务
22+阅读 · 5月1日
当持续学习遇上多模态大型语言模型:综述
专知会员服务
29+阅读 · 3月5日
多模态持续学习的最新进展:综合综述
专知会员服务
46+阅读 · 2024年10月10日
用于疾病诊断的大型语言模型:范围综述
专知会员服务
26+阅读 · 2024年9月8日
边缘图智能:互相赋能边缘网络与图智能
专知会员服务
24+阅读 · 2024年7月28日
数据与多模态大型语言模型的协同作用综述
专知会员服务
55+阅读 · 2024年7月13日
可解释的机器学习模型和架构
专知会员服务
92+阅读 · 2023年9月17日
基于表格数据的深度学习方法
专知会员服务
39+阅读 · 2021年10月19日
相关资讯
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
SemanticAdv:基于语义属性的对抗样本生成方法
机器之心
14+阅读 · 2019年7月12日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
神经网络结构在命名实体识别(NER)中的应用
全球人工智能
11+阅读 · 2018年4月5日
探幽深度生成模型的两种方法:VAE和GAN
AI前线
15+阅读 · 2018年3月10日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
基于信息理论的机器学习
专知
22+阅读 · 2017年11月23日
基于注意力机制的图卷积网络
科技创新与创业
73+阅读 · 2017年11月8日
深度学习时代的目标检测算法综述
AI前线
12+阅读 · 2017年9月22日
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
44+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员