小米AI要搞大动作了！正式开源移动端深度学习框架MACE

会员服务 ·

小米AI要搞大动作了！正式开源移动端深度学习框架MACE

2018 年 7 月 4 日 大数据技术

开源最前线（ID：OpenSourceTop）猿妹整编

综合自：GitHub、量子位等

这可能是小米目前为止最重要的AI大动作。

6 月 28 日，在第十三届开源中国开源世界高峰论坛上，小米首席架构师、人工智能与云平台副总裁崔宝秋在《小米 AI 时代的开源》的主题演讲中，代表小米正式发布了小米移动端深度学习框架 —— MACE。

Mobile AI Compute Engine (MACE) 是一个专为移动端异构计算平台优化的神经网络计算框架。总体架构如下：

此外，MACE主要还从以下的角度做了专门的优化：

● 性能

代码经过NEON指令，OpenCL以及Hexagon HVX专门优化，并且采用 Winograd算法来进行卷积操作的加速。此外，还对启动速度进行了专门的优化。

● 功耗

支持芯片的功耗管理，例如ARM的big.LITTLE调度，以及高通Adreno GPU功耗选项。

● 系统响应

支持自动拆解长时间的OpenCL计算任务，来保证UI渲染任务能够做到较好的抢占调度，从而保证系统UI的相应和用户体验。

● 内存占用

通过运用内存依赖分析技术，以及内存复用，减少内存的占用。另外，保持尽量少的外部依赖，保证代码尺寸精简。

● 模型加密与保护

模型保护是重要设计目标之一。支持将模型转换成C++代码，以及关键常量字符混淆，增加逆向的难度。

● 硬件支持范围

支持高通，联发科，以及松果等系列芯片的CPU，GPU与DSP(目前仅支持Hexagon)计算加速。同时支持在具有POSIX接口的系统的CPU上运行。

模型转换

目前，我们为TensorFlow和Caffe提供模型转换器。未来还会支持更多的框架。

模型加载

MACE模型格式包含两部分：模型图定义和模型参数张量。图表部分利用Protocol Buffers进行序列化。所有的模型参数张量都连接成一个连续的字节数组，我们在下面的段落中调用这个数组张量数据。在模型图中，记录张量数据偏移和长度。

模型可以用3种方式加载：

模型图和张量数据都是从外部动态加载的（默认情况下，来自文件系统，但用户可以自由选择自己的实现，例如压缩或加密）。这种方法提供了最大的灵活性，但是最薄弱的模型保护。

模型图和张量数据都转换成C ++代码并通过执行编译后的代码加载。这种方法提供了最强大的模型保护和最简单的部署。

模型图转换为C ++代码并构建为第二种方法，张量数据作为第一种方法从外部加载。

小米开源战略

此外，在本次论坛上，还重新提到了小米开源战略的五个方面

第一个就是快，快速选型、快速融入社区、快速反馈，快是小米模式的重要组成部分；

第二个不重造轮子；

第三个不用则已，要用则精，很多公司只用不精，不能真正驾驭；

第四点就是公司的态度——永远拥抱开放和共享的态度，第四点也是与其他公司不同的。

在重大的软件项目上、开源软件项目上，要赢得话语权、为社区做贡献，就得降低自己封闭的维护成本，这个和第三条也是息息相关的，不用则已，要用则精。

关于该项目的Android的示例程序，可以下载编译好的APK文件进行安装(下载地址：https://cnbj1.fds.api.xiaomi.com/mace/demo/mace_android_demo.apk)。

MACE项目地址: https://github.com/XiaoMi/mace

MACE Model Zoo项目地址: https://github.com/XiaoMi/mace-models

●编号622，输入编号直达本文

●输入m获取文章目录

登录查看更多

相关内容

深度学习框架

关注 100

【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构，GPU-Dedicated Architecture

专知会员服务

33+阅读 · 2020年4月1日

【百度】-大规模深度学习广告系统的分布式分层GPU参数服务器，Distributed Hierarchical GPU PS

专知会员服务

24+阅读 · 2020年3月15日

【Google大脑】AutoML-Zero: 从无到有演化机器学习算法，Evolving Machine Learning

专知会员服务

26+阅读 · 2020年3月11日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

【Google】利用AUTOML实现加速感知神经网络设计

专知会员服务

30+阅读 · 2020年3月5日

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

【O'Reilly TensorFlow Conference 2019】基于TensorFlow的实时流数据机器学习（Machine learning over real-time streaming data with TensorFlow）

专知会员服务

28+阅读 · 2019年11月14日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

【上海交通大学】分布式移动端机器学习综述论文，28页pdf

专知会员服务

45+阅读 · 2019年10月12日

阿里云发布机器学习平台PAI v3.0

雷锋网

13+阅读 · 2019年3月22日

1500+ FPS！目前最快的CNN人脸检测算法开源

极市平台

25+阅读 · 2019年3月15日

爱奇艺基于AI的移动端自动化测试框架的设计

前端之巅

18+阅读 · 2019年2月27日

解读微软开源MMLSpark：统一的大规模机器学习生态系统

AI前线

8+阅读 · 2018年11月4日

资源 | TensorFlow推出模型优化工具包，可将模型压缩75%

机器之心

9+阅读 · 2018年9月24日

机器学习者必知的 5 种深度学习框架

深度学习世界

7+阅读 · 2018年5月3日

上海交大团队：如何用TVM优化ARM架构GPU，在移动端实现快速深度学习

论智

5+阅读 · 2018年1月17日

开源神经网络框架Caffe2全介绍

北京思腾合力科技有限公司

3+阅读 · 2017年12月12日

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

开源中国

3+阅读 · 2017年11月16日

论文导读 | OpenCL版Caffe：高速跨平台机器学习框架

AI前线

4+阅读 · 2017年10月15日

Accelerated Methods for Deep Reinforcement Learning

Arxiv

6+阅读 · 2019年1月10日

Knowledge Based Machine Reading Comprehension

Arxiv

4+阅读 · 2018年9月12日

MnasNet: Platform-Aware Neural Architecture Search for Mobile

Arxiv

4+阅读 · 2018年7月31日

Ask No More: Deciding when to guess in referential visual dialogue

Arxiv

4+阅读 · 2018年6月12日

Sockeye: A Toolkit for Neural Machine Translation

Arxiv

7+阅读 · 2018年6月1日

Emergent Translation in Multi-Agent Communication

Arxiv

3+阅读 · 2018年4月11日

Joint Training for Neural Machine Translation Models with Monolingual Data

Arxiv

4+阅读 · 2018年3月1日

XNMT: The eXtensible Neural Machine Translation Toolkit

Arxiv

3+阅读 · 2018年3月1日

MXNET-MPI: Embedding MPI parallelism in Parameter Server Task Model for scaling Deep Learning

Arxiv

4+阅读 · 2018年1月11日

Caffeinated FPGAs: FPGA Framework For Convolutional Neural Networks

Arxiv

10+阅读 · 2016年9月30日

VIP会员