作者:Chip Huyen
机器之心编译
参与:泽南、小舟、杜伟
在 LinkedIn 上,很多你申请的机器学习职位都有超过 200 名竞争者。在 AI 工具上人们也有这么多选择吗?
这一列表是在 2019 年 11 月列出的,最近开源社区可能会有新工具出现。
有些科技巨头的工具列表庞大,无法一一列举,比如 AWS 就已经提供了超过 165 种机器学习工具。
有些创业公司已经消失,其提出的工具不为人们所知。
项目设置
数据 pipeline
建模和训练
服务
监测:怎么知道你的数据分布已经改变以及需要重新训练模型?
数据标注:如何快速地标注新数据,或者为新模型重新标注现有数据?
CI/CD 测试:由于你不能花几天的时间等着模型训练和收敛,所以如何运行测试以确保每次改变后模型像期望地那样运行?
部署:如何封装和部署新模型或者替换现有模型?
模型压缩:如何压缩 ML 模型使其拟合消费类设备?
推理优化:如果加速模型的推理时间?是否可以将所有操作融合在一起?是否可以采用更低精度?缩小模型或许可以加速推理过程。
边缘设备:硬件运行 ML 算法速度快且成本低。
隐私:如何在保护隐私的同时利用用户数据来训练模型?如何使流程符合《通用数据保护条例》(GDPR)?