成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
WAIC 开发者日Workshop预告:旷视天元 MegEngine 推动低比特量化技术的落地
2022 年 8 月 24 日
机器之心
人工智能创新技术持续涌现,推动新一代技术浪潮向前发展,解决一个个技术难题,其中如何在资源有限的终端场景实现 AI 模型的有效部署,是加速 AI 落地的重要问题。
AI 工程师们研发了各种试图缩小模型大小并保持性能的办法,例如量化和蒸馏。
目前相对成熟的模型量化方案是 INT8 量化。而为了推动低比特量化技术的发展,旷视天元 MegEngine 团队对 int4 进行了深入研究。在本届 2022 世界人工智能大会(WAIC)上,旷视天元 MegEngine 异构计算组负责人王彪,将出席 9 月 2 日的技术 Workshop,为大家分享开源深度学习框架实现支持 CUDA int4 的设计思路和踩坑经验。
(旷视科技 MegEngine 异构计算组负责人,王彪)
分享主题:
深度学习框架 MegEngine CUDA int4 推理详解
分享嘉宾:
王彪,旷视科技 MegEngine 异构计算组负责人。
毕业于中科院计算所,研究方向为高性能计算,对 X86、Arm、OpenCL、CUDA 等多种平台具备丰富的优化经验。2018 年加入旷视,任职期间完成了 MegEngine 基于 MLIR 的即时编译技术等多项技术突破,并落地 MegEngine CUDA 推理解决方案以及多个端上优化项目。
分享时间:
北京时间 9 月 2 日 18:00-19:00
【关于旷视天元 MegEngine】
旷视天元开源深度学习框架 MegEngine 是旷视自主研发的国产工业级深度学习框架,是旷视新一代 AI 生产力平台 Brain++ 的最核心组件,在 2020 年 3 月正式向全球开发者开源,能够帮助企业与开发者大幅节省产品从实验室原型到工业部署的流程,真正实现小时级的转化能力。MegEngine 是一个快速、可拓展、易于使用的深度学习框架,拥有以下三大关键特点:
训练推理一体:训练推理同一内核,模型结构、量化、前后处理、动态 shape 甚至求导均可 放入模型 进行推理,训练推理轻松对齐精度
超低硬件门槛:依靠算法优化各类关键资源占用,DTR 让训练显存占用量一键下降 3 倍,pushdown 内存分配算法让推理内存占用下降至极低水平
全平台高效推理:在 x86/Arm/CUDA/RoCM 各平台上均可体验到高性能且精度对齐的推理体验,更有 丰富的高阶用法可以优化性能、节省内存
MegEngine 官网:https://www.megengine.org.cn/
项目源码:https://github.com/MegEngine
如何预约观看本场 Workshop?
第一步:扫描下方二维码,进入 WAIC 2022 云平台 3.0,填写报名信息,注册成为云观众
第二步:扫描下方「AI 开发者日 - AI 开发与工程实践 Workshop」专属活动二维码,点击右上角“预约线上参会”
9 月 2 日 18:00,通过 WAIC 2022 云平台 3.0 个人主页 “我的预约” 或扫描专属活动二维码进入直播间,收看精彩分享!
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
比特
关注
1
人工智能技术应用实践白皮书:数字经济时代,AI加持下的技术与业务创新(附报告)
专知会员服务
48+阅读 · 2022年11月7日
深度学习如何用在边缘设备上?苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》,182页pdf
专知会员服务
89+阅读 · 2022年10月22日
《用于边缘智能的高能效卷积神经网络加速器》博士论文,苏黎世大学和苏黎世联邦理工学院
专知会员服务
23+阅读 · 2022年5月5日
【MIT Sam Hopkins】如何读论文?How to Read a Paper
专知会员服务
105+阅读 · 2022年3月20日
【CVPR2021】用于目标检测的通用实例蒸馏
专知会员服务
23+阅读 · 2021年3月22日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
25+阅读 · 2020年5月7日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【课程推荐】理科学校的深度学习(Deep Learning for Science School)
专知会员服务
15+阅读 · 2019年11月10日
【Amazon AWS】深度学习编译器(Deep Learning Compiler),附35页ppt
专知会员服务
42+阅读 · 2019年11月5日
人工智能赋能下的银行形态变革,招商银行 人工智能实验室负责人李金龙,第八届全国社会媒体处理大会SMP2019
专知会员服务
38+阅读 · 2019年10月24日
超轻量!AI模型编译器MegCC开源,让推理引擎体积变小小小小小……
PaperWeekly
1+阅读 · 2022年11月10日
提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现
PaperWeekly
0+阅读 · 2022年9月26日
直播预告 | 低比特量化、海量智能体、大模型创新实践,你感兴趣的开发工具与工程实践都在这
机器之心
0+阅读 · 2022年9月1日
WAIC开发者日Workshop预告:华为昇思MindSpore基础模型创新实践
机器之心
1+阅读 · 2022年9月1日
WAIC开发者日Workshop预告:超参数科技如何探索海量AI决策课题
机器之心
0+阅读 · 2022年8月30日
无缝支持Hugging Face社区,Colossal-AI低成本轻松加速大模型
机器之心
2+阅读 · 2022年7月13日
推理加速GPT-3超越英伟达方案50%!最新大模型推理系统Energon-AI开源,来自Colossal-AI团队
量子位
0+阅读 · 2022年5月31日
百度开源深度学习平台飞桨的核心技术及应用
专知
2+阅读 · 2022年4月16日
火山引擎项亮揭秘字节跳动基于 HPC 的大规模机器学习技术|直播分享报名
量子位
1+阅读 · 2022年4月12日
极市直播|AI开发应用部署及算法打榜冠军方案分享
极市平台
2+阅读 · 2021年12月16日
面向GNSS星间通信的网络编码基础理论研究
国家自然科学基金
0+阅读 · 2014年12月31日
云计算数据中心应用感知的动态资源配置技术研究
国家自然科学基金
1+阅读 · 2014年12月31日
面向人脸检测的大规模异构并行Adaboost机器学习算法研究
国家自然科学基金
3+阅读 · 2013年12月31日
基于稳定性约束的高效多相流连续-离散耦合模拟
国家自然科学基金
0+阅读 · 2013年12月31日
虚拟化环境中高效节能的内存资源动态管理技术研究
国家自然科学基金
0+阅读 · 2013年12月31日
通用异构并行密度泛函计算方法研究
国家自然科学基金
1+阅读 · 2013年12月31日
云计算环境下面向多租户应用的个性化数据隐私保护机制研究
国家自然科学基金
0+阅读 · 2012年12月31日
高温稠密等离子体中电流输运过程的理论及数值模拟研究
国家自然科学基金
0+阅读 · 2011年12月31日
基于多层网络的内生型产业集群核心企业动态竞争优势形成机理与演进路径研究
国家自然科学基金
1+阅读 · 2008年12月31日
WGOS层次化语义系统模型研究
国家自然科学基金
1+阅读 · 2008年12月31日
Workload Similarity Analysis using Machine Learning Techniques
Arxiv
0+阅读 · 2022年11月23日
Multimodal Dual Emotion with Fusion of Visual Sentiment for Rumor Detection
Arxiv
0+阅读 · 2022年11月23日
TLP: A Deep Learning-based Cost Model for Tensor Program Tuning
Arxiv
0+阅读 · 2022年11月22日
Explaining YOLO: Leveraging Grad-CAM to Explain Object Detections
Arxiv
0+阅读 · 2022年11月22日
Trustworthy AI: From Principles to Practices
Arxiv
46+阅读 · 2021年10月4日
Multi-Agent Simulation for AI Behaviour Discovery in Operations Research
Arxiv
37+阅读 · 2021年8月30日
AI in Finance: Challenges, Techniques and Opportunities
Arxiv
45+阅读 · 2021年7月20日
Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine
Arxiv
16+阅读 · 2020年8月10日
Single-Shot Object Detection with Enriched Semantics
Arxiv
11+阅读 · 2018年4月8日
Attention Is All You Need
Arxiv
27+阅读 · 2017年12月6日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
比特
异构计算
异构
CUDA
深度学习框架
北京旷视科技有限公司
相关VIP内容
人工智能技术应用实践白皮书:数字经济时代,AI加持下的技术与业务创新(附报告)
专知会员服务
48+阅读 · 2022年11月7日
深度学习如何用在边缘设备上?苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》,182页pdf
专知会员服务
89+阅读 · 2022年10月22日
《用于边缘智能的高能效卷积神经网络加速器》博士论文,苏黎世大学和苏黎世联邦理工学院
专知会员服务
23+阅读 · 2022年5月5日
【MIT Sam Hopkins】如何读论文?How to Read a Paper
专知会员服务
105+阅读 · 2022年3月20日
【CVPR2021】用于目标检测的通用实例蒸馏
专知会员服务
23+阅读 · 2021年3月22日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
25+阅读 · 2020年5月7日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【课程推荐】理科学校的深度学习(Deep Learning for Science School)
专知会员服务
15+阅读 · 2019年11月10日
【Amazon AWS】深度学习编译器(Deep Learning Compiler),附35页ppt
专知会员服务
42+阅读 · 2019年11月5日
人工智能赋能下的银行形态变革,招商银行 人工智能实验室负责人李金龙,第八届全国社会媒体处理大会SMP2019
专知会员服务
38+阅读 · 2019年10月24日
热门VIP内容
开通专知VIP会员 享更多权益服务
《支持 ML/AI 的下一代智能自主网络系统:性能提升与管理》177页
《飞行训练指导:夜间熟悉》152页
数据:联合作战的新弹药
《混合现实飞行模拟器中的夜视镜仿真:无缝集成真实世界》最新54页
相关资讯
超轻量!AI模型编译器MegCC开源,让推理引擎体积变小小小小小……
PaperWeekly
1+阅读 · 2022年11月10日
提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现
PaperWeekly
0+阅读 · 2022年9月26日
直播预告 | 低比特量化、海量智能体、大模型创新实践,你感兴趣的开发工具与工程实践都在这
机器之心
0+阅读 · 2022年9月1日
WAIC开发者日Workshop预告:华为昇思MindSpore基础模型创新实践
机器之心
1+阅读 · 2022年9月1日
WAIC开发者日Workshop预告:超参数科技如何探索海量AI决策课题
机器之心
0+阅读 · 2022年8月30日
无缝支持Hugging Face社区,Colossal-AI低成本轻松加速大模型
机器之心
2+阅读 · 2022年7月13日
推理加速GPT-3超越英伟达方案50%!最新大模型推理系统Energon-AI开源,来自Colossal-AI团队
量子位
0+阅读 · 2022年5月31日
百度开源深度学习平台飞桨的核心技术及应用
专知
2+阅读 · 2022年4月16日
火山引擎项亮揭秘字节跳动基于 HPC 的大规模机器学习技术|直播分享报名
量子位
1+阅读 · 2022年4月12日
极市直播|AI开发应用部署及算法打榜冠军方案分享
极市平台
2+阅读 · 2021年12月16日
相关基金
面向GNSS星间通信的网络编码基础理论研究
国家自然科学基金
0+阅读 · 2014年12月31日
云计算数据中心应用感知的动态资源配置技术研究
国家自然科学基金
1+阅读 · 2014年12月31日
面向人脸检测的大规模异构并行Adaboost机器学习算法研究
国家自然科学基金
3+阅读 · 2013年12月31日
基于稳定性约束的高效多相流连续-离散耦合模拟
国家自然科学基金
0+阅读 · 2013年12月31日
虚拟化环境中高效节能的内存资源动态管理技术研究
国家自然科学基金
0+阅读 · 2013年12月31日
通用异构并行密度泛函计算方法研究
国家自然科学基金
1+阅读 · 2013年12月31日
云计算环境下面向多租户应用的个性化数据隐私保护机制研究
国家自然科学基金
0+阅读 · 2012年12月31日
高温稠密等离子体中电流输运过程的理论及数值模拟研究
国家自然科学基金
0+阅读 · 2011年12月31日
基于多层网络的内生型产业集群核心企业动态竞争优势形成机理与演进路径研究
国家自然科学基金
1+阅读 · 2008年12月31日
WGOS层次化语义系统模型研究
国家自然科学基金
1+阅读 · 2008年12月31日
相关论文
Workload Similarity Analysis using Machine Learning Techniques
Arxiv
0+阅读 · 2022年11月23日
Multimodal Dual Emotion with Fusion of Visual Sentiment for Rumor Detection
Arxiv
0+阅读 · 2022年11月23日
TLP: A Deep Learning-based Cost Model for Tensor Program Tuning
Arxiv
0+阅读 · 2022年11月22日
Explaining YOLO: Leveraging Grad-CAM to Explain Object Detections
Arxiv
0+阅读 · 2022年11月22日
Trustworthy AI: From Principles to Practices
Arxiv
46+阅读 · 2021年10月4日
Multi-Agent Simulation for AI Behaviour Discovery in Operations Research
Arxiv
37+阅读 · 2021年8月30日
AI in Finance: Challenges, Techniques and Opportunities
Arxiv
45+阅读 · 2021年7月20日
Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine
Arxiv
16+阅读 · 2020年8月10日
Single-Shot Object Detection with Enriched Semantics
Arxiv
11+阅读 · 2018年4月8日
Attention Is All You Need
Arxiv
27+阅读 · 2017年12月6日
大家都在搜
洛克菲勒
PRML
大型语言模型
ETHZ博士论文
时间序列
大模型
MoE
palantir
笛卡尔
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top