分享主题:高性能边缘 AI 计算:最新深度模型压缩算法分享与领域回顾 苏江,英国帝国理工学院电子电气工程系博士,后加入剑桥大学担任计算机学院计算机架构研究组助理研究员,从事 AI 芯片架构设计与高性能 AI 模型研究。苏江博士曾就职于英特尔,赛灵思等公司。目前就职于暗物智能科技,从事 AI 芯片架构设计与智能硬件产品研发。 内容简介: 高性能 AI 算法能否在端侧设备高效执行,是一个从算法优化到端侧硬件芯片定制的全栈问题。本讲座首先分享高性能端侧 AI 全栈优化的思路,尤其是 AI 算法模型优化和芯片架构优化两部分背景介绍。然后重点介绍 ECCV 高分论文鹰眼算法 EagleEye: Fast Sub-net Evaluation for Efficient Neural Network Pruning。 该方法采用了一种自适应批归一化的简单却有效的评估组件技术,以揭示不同剪枝子网络与其微调收敛精度之间的强相关性。这种强相关性使我们不需要对子网络进行实际微调就能在候选子网络中快速找到具有最高潜在准确率的网络。从模型压缩精度和效率上,EagleEye 在 MobileNet、ResNet 等标准网络均达到领域最优效果。最后提出有关下一个边缘 AI 有效算力提升 10 倍以上性能的大胆预测。