成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
论开启AI的第一步:除了GPU之外还有它!
2020 年 11 月 25 日
THU数据派
来源:脑集体
本文
约
4132
字
,建议阅读
8分钟
。
本文
介绍了5G+工业互联网,以及工业互联网融合发展的思路举措。
AI时代不一定是GPU为王,针对不同的业务,如推荐引擎、经典机器学习、循环神经网络,CPU有其不同的优势。
新基建东风一起,当今时代的企业可被分成两类:
正在采用AI加速发展的企业,和将会采用AI的企业。
人工智能的重要性不必赘言——新一轮产业变革的核心驱动力量,将推动数万亿数字经济产业转型升级。
IDC 预测,到 2021 年,有 75% 的企业应用将集成人工智能。即使有些企业目前不考虑使用人工智能,但总是需要处理越来越复杂的数据。
AI这趟顺风车当然要搭上,
然而飞得高不高固然重要,飞得累不累也不可忽视
:企业该选择怎样的计算基础设施?革新的同时如何保证成本在可接受范围?如何保持经济高效的运营和灵活性?
「因地制宜」:IT基础设施何须推翻重来?基于CPU运行人工智能吧
这些「灵魂拷问」都直接涉及企业未来的AI路线,其中关于IT基础设施的部署工作是重中之重。
事实上,企业通常已经在IT基础设施上做了投资,
改弦更张推倒重来的代价太大
。但AI应用的计算需求极高,为保证准确性对延迟和巨大吞吐量有着苛刻的要求。数据中心的负责者应该怎么样部署IT基础设施?
在增加新的AI工作负载时,必须先确保新功能可以优化现有资源,然后再考虑投资新计算资源。
在现有的计算基础设施上,即基于CPU的基础设施上运行人工智能工作负载可能是理想的选择。这样既能满足数据科学家的加速和性能需求,又能达成效率、可扩展性和灵活性目标。
或许不少数据科学家认为基于 GPU 的硬件平台能够为某些深度学习训练工作负载提供非常高的吞吐量,因此能够加快人工智能模型开发。
但深度学习氛围训练及推理两大阶段,如今推理比重越来越大,实际上开发速度很大程度上取决于涉及的人工智能工作负载、数据类型和要求。
针对不同的业务,如推荐引擎、经典机器学习、循环神经网络,CPU有其不同的优势,
大可以抱着开放的态度选择合适的平台对症下药。
灵活高效可扩展,阿里云基于第三代英特尔至强提升 BERT 模型性能
在确定工作负载本身的特征时,可以先向自己提问以下几个问题:
• 需要运行什么类型的模型?
• 这些模型的大小分别是多少(参数数量)?
• 用于建模的数据有多大?
• 每个模型的批大小通常是多少?
• 保持活跃的最大激活数量是多少?
• 每个模型的计算强度是多少?
• 有哪些延迟限制?
BERT是阿里云人工智能平台的主要模型之一。在与AI相关的各类服务中,它被广泛用于自然语言处理任务。阿里云希望通过降低延迟来提升用户体验。
而对于 BERT,模型参数庞大且固定在推理过程中。
集成在第三代英特尔至强可扩展处理器中的英特尔深度学习加速技术支持全新 Brain Floating Point (bfloat16,BF16) 指令。阿里云利用这一性能优势,优化主要人工智能模型的推理性能,进而提升服务体验并降低总体拥有成本。
内置BF16指令可以说是第三代至强可扩展平台的最大特性,进一步增强了现有的深度学习优化能力——对于新至强平台来说,
BF16相对于原有的FP32可以获得近2倍的性能。
这将提升大大提升AI人工智能、ML机器学习、DL深度学习等应用的性能、效率。
支持 BF16 的英特尔深度学习加速技术可在将准确率影响降至最低与大幅提高吞吐量之间达成平衡。
使用 BF16 MatMul 替代了 FP32 MatMul,并在第三代英特尔至强可扩展处理器上使用 oneAPI 深度神经网络库 (oneDNN) 1.3 版本进行测试。结果表明,BF16 解决方案实现了 1.83 倍的增益。此外,在处理用于分类任务的 MRPC 数据集时,BF16 解决方案的准确率与 FP32 解决方案相同(两者对于代理模型的准确率均为 83.59%)。
BERT 模型推理性能测试结果
灵活性、高效率、可扩展性是英特尔至强平台运行人工智能工作负载的三大优势。
英特尔至强平台原本就具有多种用途,因此能够支持广泛的工作负载。
借助大量针对机器学习和深度学习所做的软件优化和集成英特尔深度学习加速技术的推理加速功能,基于 CPU 运行人工智能的速度大幅提高。
在许多情况下,CPU 是深度学习训练的理想选择。
通过针对常见人工智能软件框架(例如 TensorFlow 和 PyTorch)、库和工具所做的优化,帮助保持较高的性能功耗比和性价比,使 PUE 比率尽可能接近 1。
软硬结合,在数据生命周期中融入人工智能
海量数据、算力和AI算法,被称为AI的三大支柱。而英特尔至强平台是一个理想的基础,可让企业和机构利用现有的数据、数据分析程序和基础设施资源,依靠这个平台开启人工智能之旅。
需要企业长期投入积累才能获取的数据是企业推进AI时最重要的先决条件。
即使有些企业目前不考虑使用人工智能,但总是需要处理越来越复杂的数据,进行数据分析。
企业和机构不仅必须要厘清哪些数据可用于提高竞争力和经营绩效,还必须攻克采集、分析和使用数据方面的挑战。
进入企业的数据在来源、体量、格式、结构和频率上多种多样。单单是收集和清洗数据,就耗费了数据科学家大约 40% 的时间。关键的第一步就是创建一个系统,在数据进入企业时,立即采集、存储和处理这些数据(从边缘到云)。
英特尔QuickAssist 技术等压缩技术有助于减小需要传输的数据大小。
同时,英特傲腾持久内存能够将更多数据保存在靠近 CPU 的位置,进而实现更多实时处理。数据准备妥当后,可以使用英特尔傲腾固态盘,实现经济高效的高容量数据存储。
软件算法对于人工智能同样至关重要。从头开始为每个应用重新构建所需的数学和算法是一项费时费力的复杂工作,
何不借助前辈的框架、库、工具和预先训练模型,从中直接受益?
为了满足这一需求,英特尔面向英特尔架构对被广泛采用的人工智能软件框架进行了各类优化,以期大幅提高应用性能,方便企业能够在现有环境中使用熟悉的英特尔至强平台开发高效的人工智能模型。
例如,对在 ResNet-50 上运行图像分类工作负载而言,利用集成面向ResNet-50 的英特尔深度学习加速技术的至强铂金 8280 处理器以及面向英特尔架构优化的 Caffe 版本框架,与最初发布的至强铂金 8180 处理器相比,
推理性能提升高达 14 倍
。
其他优化还包括面向 TensorFlow、MXNet 和 Python 的优化,可助力企业能够在已知的数据中心服务器上实现所需的性能。
英特尔针对主流框架进行了优化。
算力(IT基础设施)、算法、数据,无论是从推进人工智能发展的三大支柱,亦或数据自身生命周期(发现、数据、开发、部署),企业拥抱人工智能,加速AI落地都需要进行思量,做出选择。
在做出选择时,企业的业务需求是推动力,其自身已有的IT环境则是做出决策的大前提,持续开发广泛AI计算产品组合的英特尔可以提供高性价比方法。
仰望星空与脚踏实地可共存。
——
EN
D
——
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
Intel Xeon
关注
1
Intel Xeon
小米在预训练模型的探索与优化
专知会员服务
19+阅读 · 2020年12月31日
神经网络不work?看下这份《训练神经网络实用技巧》,3页pdf
专知会员服务
56+阅读 · 2020年12月29日
百度德勤管理咨询联合发布《知识中台白皮书》
专知会员服务
76+阅读 · 2020年12月19日
《中国新一代人工智能科技产业发展•2020》报告,附pdf与ppt
专知会员服务
188+阅读 · 2020年11月12日
《2020人工智能医疗产业发展蓝皮书》发布
专知会员服务
115+阅读 · 2020年9月11日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
126+阅读 · 2020年5月22日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
120+阅读 · 2020年5月6日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
197+阅读 · 2020年3月8日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
深度学习视频中多目标跟踪:论文综述
专知会员服务
94+阅读 · 2019年10月13日
知乎热议:未来3到5年内,哪个方向机器学习人才最稀缺?
新智元
5+阅读 · 2020年6月3日
【AI芯片】计算芯片——大数据和人工智能的基石
产业智能官
9+阅读 · 2020年3月8日
几分钟构建自己的深度学习开发环境,我是怎么做到的?
AI前线
5+阅读 · 2019年4月22日
领域应用 | 到底什么时候使用图数据库?
开放知识图谱
16+阅读 · 2019年4月19日
阿里云发布机器学习平台PAI v3.0
雷锋网
13+阅读 · 2019年3月22日
2019年深度学习的十大预测
人工智能学家
6+阅读 · 2019年1月31日
2019年机器学习:追踪人工智能发展之路
人工智能学家
4+阅读 · 2018年10月14日
资源 | 小米开源移动端深度学习框架MACE:可转换TensorFlow模型
机器之心
3+阅读 · 2018年6月29日
AI+安防:国内最大AI市场的「新老之战」,BAT几乎在旁观丨雷锋网年度特辑
雷锋网
3+阅读 · 2018年1月17日
“我今年36岁了,除了收费啥也不会!”
创业邦杂志
4+阅读 · 2018年1月14日
Equivariant message passing for the prediction of tensorial properties and molecular spectra
Arxiv
0+阅读 · 2021年2月5日
Risk-Constrained Interactive Safety under Behavior Uncertainty for Autonomous Driving
Arxiv
0+阅读 · 2021年2月5日
Calibration of Google Trends Time Series
Arxiv
0+阅读 · 2021年2月4日
Go Wide, Then Narrow: Efficient Training of Deep Thin Networks
Arxiv
15+阅读 · 2020年7月1日
Language Modeling with Deep Transformers
Arxiv
6+阅读 · 2019年7月11日
DC-SPP-YOLO: Dense Connection and Spatial Pyramid Pooling Based YOLO for Object Detection
Arxiv
3+阅读 · 2019年3月20日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Differentiable Dynamic Programming for Structured Prediction and Attention
Arxiv
56+阅读 · 2018年2月20日
PointCNN
Arxiv
8+阅读 · 2018年1月25日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
Intel Xeon
GPU
推荐引擎
中央处理器 (CPU)
循环神经网络
英特尔 (Intel)
相关VIP内容
小米在预训练模型的探索与优化
专知会员服务
19+阅读 · 2020年12月31日
神经网络不work?看下这份《训练神经网络实用技巧》,3页pdf
专知会员服务
56+阅读 · 2020年12月29日
百度德勤管理咨询联合发布《知识中台白皮书》
专知会员服务
76+阅读 · 2020年12月19日
《中国新一代人工智能科技产业发展•2020》报告,附pdf与ppt
专知会员服务
188+阅读 · 2020年11月12日
《2020人工智能医疗产业发展蓝皮书》发布
专知会员服务
115+阅读 · 2020年9月11日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
126+阅读 · 2020年5月22日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
120+阅读 · 2020年5月6日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
197+阅读 · 2020年3月8日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
深度学习视频中多目标跟踪:论文综述
专知会员服务
94+阅读 · 2019年10月13日
热门VIP内容
开通专知VIP会员 享更多权益服务
面向无人机视角的多源信息融合目标检测
【ICLR2025】DynaPrompt:动态测试时提示调优
面向无人机视角的多源信息融合目标检测
行业报告丨中国信通院发布《专精特新中小企业数字化转型研究报告(2024年)》
相关资讯
知乎热议:未来3到5年内,哪个方向机器学习人才最稀缺?
新智元
5+阅读 · 2020年6月3日
【AI芯片】计算芯片——大数据和人工智能的基石
产业智能官
9+阅读 · 2020年3月8日
几分钟构建自己的深度学习开发环境,我是怎么做到的?
AI前线
5+阅读 · 2019年4月22日
领域应用 | 到底什么时候使用图数据库?
开放知识图谱
16+阅读 · 2019年4月19日
阿里云发布机器学习平台PAI v3.0
雷锋网
13+阅读 · 2019年3月22日
2019年深度学习的十大预测
人工智能学家
6+阅读 · 2019年1月31日
2019年机器学习:追踪人工智能发展之路
人工智能学家
4+阅读 · 2018年10月14日
资源 | 小米开源移动端深度学习框架MACE:可转换TensorFlow模型
机器之心
3+阅读 · 2018年6月29日
AI+安防:国内最大AI市场的「新老之战」,BAT几乎在旁观丨雷锋网年度特辑
雷锋网
3+阅读 · 2018年1月17日
“我今年36岁了,除了收费啥也不会!”
创业邦杂志
4+阅读 · 2018年1月14日
相关论文
Equivariant message passing for the prediction of tensorial properties and molecular spectra
Arxiv
0+阅读 · 2021年2月5日
Risk-Constrained Interactive Safety under Behavior Uncertainty for Autonomous Driving
Arxiv
0+阅读 · 2021年2月5日
Calibration of Google Trends Time Series
Arxiv
0+阅读 · 2021年2月4日
Go Wide, Then Narrow: Efficient Training of Deep Thin Networks
Arxiv
15+阅读 · 2020年7月1日
Language Modeling with Deep Transformers
Arxiv
6+阅读 · 2019年7月11日
DC-SPP-YOLO: Dense Connection and Spatial Pyramid Pooling Based YOLO for Object Detection
Arxiv
3+阅读 · 2019年3月20日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Differentiable Dynamic Programming for Structured Prediction and Attention
Arxiv
56+阅读 · 2018年2月20日
PointCNN
Arxiv
8+阅读 · 2018年1月25日
大家都在搜
锂电池
自主可控
大型语言模型
基础模型
研究报告
量化交易
产品推广
项目经理
机器学习平台
“跨越险阻2018”挑战赛中
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top