TensorFlow Lite是可帮助开发人员在移动端(mobile)、嵌入式(embeded)和物联网(IoT)设备上运行TensorFlow机器学习模型的一组工具。它使设备机器学习具有低延迟和更小的二进制体积。本文是TensorFlow Lite入门指导。
TensorFlow Lite由两个主要组件组成:
下图显示了 TensorFlow Lite 的架构设计:
在设备端使用模型的过程:
converter使用TF模型生成FlatBuffer文件(.tflite),然后将FlatBuffer文件部署到客户端设备(例如移动设备,嵌入式设备)并使用TensorFlow Lite解释器在本地运行。下图显示了此转换过程:
converter代码实现如下:
为什么要使用FlatBuffer? 主要原因有:
使用converter转换模型的主要原因:
注:推理(Inference) 是通过模型(model)运行数据(data)以获得预测(predictions)的过程。这个过程需要模型(model)、解释器(interpreter)和输入数据(input data)。
为了实现这些目标,主要组成部分是所谓的量化(Quantization)如下图: