题目:
Accelerator-aware neural network desing using autoML
简介:
尽管神经网络硬件加速器提供了大量的原始计算量,但必须针对底层硬件体系结构共同设计部署在其上的模型,以获得最佳的系统性能。 我们提供了一类计算机视觉模型,该模型使用硬件感知的神经体系结构搜索设计并定制运行在Edge TPU上,Edge TPU是用于低功耗,边缘设备的Google神经网络硬件加速器。 对于Coral设备中的Edge TPU,这些模型可实现实时分析图像分类性能,同时获得通常只有在数据中心运行的大型,计算繁重的模型才能看到的准确性。 在Pixel 4的Edge TPU上,这些模型与现有的SoTA移动模型相比,改善了精确度-延迟等问题。