WAIC 开发者日Workshop预告：旷视天元 MegEngine 推动低比特量化技术的落地 - 专知

会员服务 ·

0

WAIC 开发者日Workshop预告：旷视天元 MegEngine 推动低比特量化技术的落地

2022 年 8 月 24 日 机器之心

人工智能创新技术持续涌现，推动新一代技术浪潮向前发展，解决一个个技术难题，其中如何在资源有限的终端场景实现 AI 模型的有效部署，是加速 AI 落地的重要问题。 AI 工程师们研发了各种试图缩小模型大小并保持性能的办法，例如量化和蒸馏。

目前相对成熟的模型量化方案是 INT8 量化。而为了推动低比特量化技术的发展，旷视天元 MegEngine 团队对 int4 进行了深入研究。在本届 2022 世界人工智能大会（WAIC）上，旷视天元 MegEngine 异构计算组负责人王彪，将出席 9 月 2 日的技术 Workshop，为大家分享开源深度学习框架实现支持 CUDA int4 的设计思路和踩坑经验。

（旷视科技 MegEngine 异构计算组负责人，王彪）

分享主题： 深度学习框架 MegEngine CUDA int4 推理详解

分享嘉宾： 王彪，旷视科技 MegEngine 异构计算组负责人。毕业于中科院计算所，研究方向为高性能计算，对 X86、Arm、OpenCL、CUDA 等多种平台具备丰富的优化经验。2018 年加入旷视，任职期间完成了 MegEngine 基于 MLIR 的即时编译技术等多项技术突破，并落地 MegEngine CUDA 推理解决方案以及多个端上优化项目。

分享时间： 北京时间 9 月 2 日 18:00-19:00

【关于旷视天元 MegEngine】

旷视天元开源深度学习框架 MegEngine 是旷视自主研发的国产工业级深度学习框架，是旷视新一代 AI 生产力平台 Brain++ 的最核心组件，在 2020 年 3 月正式向全球开发者开源，能够帮助企业与开发者大幅节省产品从实验室原型到工业部署的流程，真正实现小时级的转化能力。MegEngine 是一个快速、可拓展、易于使用的深度学习框架，拥有以下三大关键特点：

训练推理一体：训练推理同一内核，模型结构、量化、前后处理、动态 shape 甚至求导均可放入模型进行推理，训练推理轻松对齐精度
超低硬件门槛：依靠算法优化各类关键资源占用，DTR 让训练显存占用量一键下降 3 倍，pushdown 内存分配算法让推理内存占用下降至极低水平
全平台高效推理：在 x86/Arm/CUDA/RoCM 各平台上均可体验到高性能且精度对齐的推理体验，更有丰富的高阶用法可以优化性能、节省内存

MegEngine 官网：https://www.megengine.org.cn/
项目源码：https://github.com/MegEngine

如何预约观看本场 Workshop？

第一步：扫描下方二维码，进入 WAIC 2022 云平台 3.0，填写报名信息，注册成为云观众

第二步：扫描下方「AI 开发者日 - AI 开发与工程实践 Workshop」专属活动二维码，点击右上角“预约线上参会”

9 月 2 日 18：00，通过 WAIC 2022 云平台 3.0 个人主页 “我的预约” 或扫描专属活动二维码进入直播间，收看精彩分享！

登录查看更多

0

相关内容

《用于边缘智能的高能效卷积神经网络加速器》博士论文，苏黎世大学和苏黎世联邦理工学院

《用于边缘智能的高能效卷积神经网络加速器》博士论文，苏黎世大学和苏黎世联邦理工学院

专知会员服务

24+阅读 · 2022年5月5日

【MIT Sam Hopkins】如何读论文？How to Read a Paper

【MIT Sam Hopkins】如何读论文？How to Read a Paper

专知会员服务

108+阅读 · 2022年3月20日

【CVPR2021】用于目标检测的通用实例蒸馏

【CVPR2021】用于目标检测的通用实例蒸馏

专知会员服务

24+阅读 · 2021年3月22日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

【课程推荐】理科学校的深度学习（Deep Learning for Science School）

【课程推荐】理科学校的深度学习（Deep Learning for Science School）

专知会员服务

16+阅读 · 2019年11月10日

超轻量！AI模型编译器MegCC开源，让推理引擎体积变小小小小小……

超轻量！AI模型编译器MegCC开源，让推理引擎体积变小小小小小……

PaperWeekly

1+阅读 · 2022年11月10日

提速还能不掉点！深度解析 MegEngine 4 bits 量化开源实现

提速还能不掉点！深度解析 MegEngine 4 bits 量化开源实现

PaperWeekly

0+阅读 · 2022年9月26日

直播预告 | 低比特量化、海量智能体、大模型创新实践，你感兴趣的开发工具与工程实践都在这

直播预告 | 低比特量化、海量智能体、大模型创新实践，你感兴趣的开发工具与工程实践都在这

机器之心

0+阅读 · 2022年9月1日

WAIC开发者日Workshop预告：华为昇思MindSpore基础模型创新实践

WAIC开发者日Workshop预告：华为昇思MindSpore基础模型创新实践

机器之心

1+阅读 · 2022年9月1日

WAIC开发者日Workshop预告：超参数科技如何探索海量AI决策课题

WAIC开发者日Workshop预告：超参数科技如何探索海量AI决策课题

机器之心

0+阅读 · 2022年8月30日

基于稳定性约束的高效多相流连续-离散耦合模拟

国家自然科学基金

0+阅读 · 2013年12月31日

虚拟化环境中高效节能的内存资源动态管理技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

云计算环境下面向多租户应用的个性化数据隐私保护机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

高温稠密等离子体中电流输运过程的理论及数值模拟研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于多层网络的内生型产业集群核心企业动态竞争优势形成机理与演进路径研究

国家自然科学基金

1+阅读 · 2008年12月31日

Workload Similarity Analysis using Machine Learning Techniques

Arxiv

0+阅读 · 2022年11月23日

Explaining YOLO: Leveraging Grad-CAM to Explain Object Detections

Arxiv

0+阅读 · 2022年11月22日

AI in Finance: Challenges, Techniques and Opportunities

Arxiv

46+阅读 · 2021年7月20日

Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine

Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine

Arxiv

16+阅读 · 2020年8月10日

Single-Shot Object Detection with Enriched Semantics

Arxiv

11+阅读 · 2018年4月8日

VIP会员

相关主题

深度学习框架

北京旷视科技有限公司

相关VIP内容

《用于边缘智能的高能效卷积神经网络加速器》博士论文，苏黎世大学和苏黎世联邦理工学院

《用于边缘智能的高能效卷积神经网络加速器》博士论文，苏黎世大学和苏黎世联邦理工学院

专知会员服务

24+阅读 · 2022年5月5日

【MIT Sam Hopkins】如何读论文？How to Read a Paper

【MIT Sam Hopkins】如何读论文？How to Read a Paper

专知会员服务

108+阅读 · 2022年3月20日

【CVPR2021】用于目标检测的通用实例蒸馏

【CVPR2021】用于目标检测的通用实例蒸馏

专知会员服务

24+阅读 · 2021年3月22日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

【课程推荐】理科学校的深度学习（Deep Learning for Science School）

【课程推荐】理科学校的深度学习（Deep Learning for Science School）

专知会员服务

16+阅读 · 2019年11月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《北约认知战概念报告》

《预测促成大规模货运无人机的技术趋势与影响》报告

美海军放弃星座级转而采用国家安全巡逻舰设计

《北约作战弹性概念》报告

相关资讯

超轻量！AI模型编译器MegCC开源，让推理引擎体积变小小小小小……

超轻量！AI模型编译器MegCC开源，让推理引擎体积变小小小小小……

PaperWeekly

1+阅读 · 2022年11月10日

提速还能不掉点！深度解析 MegEngine 4 bits 量化开源实现

提速还能不掉点！深度解析 MegEngine 4 bits 量化开源实现

PaperWeekly

0+阅读 · 2022年9月26日

直播预告 | 低比特量化、海量智能体、大模型创新实践，你感兴趣的开发工具与工程实践都在这

直播预告 | 低比特量化、海量智能体、大模型创新实践，你感兴趣的开发工具与工程实践都在这

机器之心

0+阅读 · 2022年9月1日

WAIC开发者日Workshop预告：华为昇思MindSpore基础模型创新实践

WAIC开发者日Workshop预告：华为昇思MindSpore基础模型创新实践

机器之心

1+阅读 · 2022年9月1日

WAIC开发者日Workshop预告：超参数科技如何探索海量AI决策课题

WAIC开发者日Workshop预告：超参数科技如何探索海量AI决策课题

机器之心

0+阅读 · 2022年8月30日

相关基金

基于稳定性约束的高效多相流连续-离散耦合模拟

国家自然科学基金

0+阅读 · 2013年12月31日

虚拟化环境中高效节能的内存资源动态管理技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

云计算环境下面向多租户应用的个性化数据隐私保护机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

高温稠密等离子体中电流输运过程的理论及数值模拟研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于多层网络的内生型产业集群核心企业动态竞争优势形成机理与演进路径研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Workload Similarity Analysis using Machine Learning Techniques

Arxiv

0+阅读 · 2022年11月23日

Explaining YOLO: Leveraging Grad-CAM to Explain Object Detections

Arxiv

0+阅读 · 2022年11月22日

AI in Finance: Challenges, Techniques and Opportunities

Arxiv

46+阅读 · 2021年7月20日

Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine

Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine

Arxiv

16+阅读 · 2020年8月10日

Single-Shot Object Detection with Enriched Semantics

Arxiv

11+阅读 · 2018年4月8日

大家都在搜

朱克爱德华兹家族

大型语言模型

蓝牙安全攻防

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员