万里挑一!热门机器学习开源资源最强盘点

2019 年 2 月 8 日 AI前线
策划编辑 | Natalie
作者 | Mybridge
译者 | Sambodhi
编辑 | Vincent
AI 前线导读:读者们,在猪年春节小长假,你们过得可好?在和家人团聚迎新春同时,别忘了继续学习哦!今天我们带来了由 Mybridge 整理的 2018 年度热门机器学习开源资源大盘点,值得一提的是,在这份列表中,出现了来自中国腾讯的贡献的两个资源。

更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)

在过去的一年里,我们比较了近 22000 个机器学习开源工具和项目,选出了前 49 个(约占 0.22%)。

这些工具和项目分为 6 个类别,如下:  

  • 计算机视觉(1~5)

  • 强化学习(6~13)

  • 自然语言处理(14~20)

  • 生成对抗网络(21~26)

  • 神经网络(27~35)

  • 工具包(36~49)

这是一份极具竞争力的列表,它精心挑选了 2018 年 1 月到 12 月发布的最佳开源机器学习资源。Mybridge AI 通过考虑受欢迎程度、参与度和回头率来评估质量。为了让你对质量有直观的了解,Github 上⭐平均颗数是 3566。  

  • 带有目录的文本版本请访问 Github:https://github.com/Mybridge/amazing-machine-learning-opensource-2019

  • 2018 年度热门机器学习年度文章请访问:https://medium.mybridge.co/learn-machine-learning-from-top-50-articles-for-the-past-year-v-2019-15842d0b82f6

  • 2017 年度热门机器学习开源资源(该博文在 Medium 上有 21000 个赞)请访问:https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7

对程序员来说,开源项目非常有用。给你足够的时间让你去尝试过去一年里可能错过的机器学习开源项目。

学习建议

A)初学者:Python 下的机器学习、数据科学和深度学习。TensorFlow 和神经网络(http://bit.ly/2FbgIcv)【84632 个推荐,4.5/5 ⭐】

B)高阶:Python 深度强化学习(http://bit.ly/2DQxHjq)【20396 个推荐,4.6/5 ⭐】

计算机视觉
【No 1】Detectron

用于对象检研究的 FAIR 研究平台,实现了 Mask R-CNN、RetinaNet 等流行算法。【在 Github 有 18913 颗⭐】

地址:https://github.com/facebookresearch/Detectron?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 2】Openpose

用于身体、面部和手部的姿态估计的实时多人关键点检测库。【在 Github 有 11052 颗⭐】

地址:https://github.com/CMU-Perceptual-Computing-Lab/openpose?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 3】DensePose

一种将 2D RGB 图像中所有人类像素映射到基于 3D 表面的人体模型的实施方法。【在 Github 上有 4156 颗⭐】

地址:https://github.com/facebookresearch/Densepose?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 4】Maskrcnn-benchmark

Pytorch 中语义分割和对象检测算法的快速模块化参考实现。【在 Github 上有 3888 颗⭐】

地址:https://github.com/facebookresearch/maskrcnn-benchmark?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 5】SNIPER

一种高效的多尺度对象检测算法。【在 Github 上有 1963 颗⭐】

地址:https://github.com/mahyarnajibi/SNIPER?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

强化学习
【No 6】Psychlab

使用 Psychlab 平台(基于智能体人工智能的 3D 平台)实现的实验范例。【在 Github 上有 5595 颗⭐】

地址:https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/psychlab?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 7】ELF

一个广泛的、轻量级的、灵活的游戏研究平台。我们用它创建了围棋游戏机器人 ——ELF OpenGo,以 14:0 的比分击败了全球前 30 名棋手中的四名。【在 Github 上有 2406 颗⭐】

地址:https://github.com/pytorch/elf?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 8】TRFL

一个有用的构件块库,用于编写 TensorFlow 中的增强学习智能体。【在 Github 上有 2312 颗⭐】

地址:https://github.com/deepmind/trfl?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 9】Horizon

第一个面向大规模产品和服务的开源强化学习平台。【在 Github 上有 1703 颗⭐】

地址:https://github.com/facebookresearch/Horizon?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 10】Chess-alpha-zero

通过 Alpha Zero 方法进行国际象棋强化学习。【在 Github 上有 1307 颗⭐】

地址:https://github.com/Zeta36/chess-alpha-zero?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 11】Dm_control

DeepMind 控制套件和控制包。【在 Github 上有 1231 颗⭐】

地址:https://github.com/deepmind/dm_control?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 12】MAMEToolkit

街机游戏强化学习 Python 库。【在 Github 上有 437 颗⭐】

地址:https://github.com/M-J-Murray/MAMEToolkit?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 13】Reaver

模块化深度强化学习框架。专注于星际争霸 II。支持 Gym、Atari 和 MuJoCo。匹配参考结果。【在 Github 上有 355 颗⭐】

地址:https://github.com/inoryy/reaver?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

自然语言处理
【No 14】Bert:

为 BERT 提供 TensorFlow 代码和预训练模型。【在 Github 上有 11703 颗⭐】

地址:https://github.com/google-research/bert?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 15】Pytext

基于 PyTorch 的自然语言建模框架。【在 Github 上有 4466 颗⭐】

地址:https://github.com/facebookresearch/pytext?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 16】Bert-as-service

由 Google 开发的用于预训练语言表示的 NLP 模型。它利用了网上公开提供发的大量纯文本数据,并以无人监督的方式进行训练。【在 Github 上有 2055 颗⭐】

地址:https://github.com/hanxiao/bert-as-service?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 17】UnsupervisedMT

基于短语和神经无监督机器翻译 ——来自 Facebook 研究。【在 Github 上有 1068 颗⭐】

地址:https://github.com/facebookresearch/UnsupervisedMT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 18】DecaNLP

自然语言十项全能:面向销售队伍的 NLP 多任务挑战。【在 Github 上有 1648 颗⭐】

地址:https://github.com/salesforce/decaNLP?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 19】Nlp-architect

Intel 人工智能实验室的 NLP 架构师:用于探索最先进的深度学习拓扑和技术的 Python 库。【在 Github 上有 1751 颗⭐】

地址:https://github.com/NervanaSystems/nlp-architect?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 20】Gluon-NLP

使 NLP 变得容易使用。【在 Github 上有 1263 颗⭐】

地址:https://github.com/dmlc/gluon-nlp?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

生成对抗网络
【No 21】DeOldify

基于深度学习的项目,用于着色和恢复老照片。【在 Github 上有 5060 颗⭐】

地址:https://github.com/jantic/DeOldify?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 22】Progressive_growing_of_gans

渐进式增长的生成对抗网络,可以提高质量、稳定性和变异性。【在 Github 上有 4046 颗⭐】

地址:https://github.com/tkarras/progressive_growing_of_gans?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 23】MUNIT

多模态无监督图像到图像转换。【在 Github 上有 1339 颗⭐】

地址:https://github.com/NVlabs/MUNIT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 24】Transparent_latent_gan

使用有监督学习来阐明 GAN 的潜在空间,以进行受控生成和编辑。【在 Github 上有 1337 颗⭐】

地址:https://github.com/SummitKwan/transparent_latent_gan?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 25】Gandissect

基于 pytorch 的工具,用于可视化和理解 GAN 的神经元。【在 Github 上有 1065 颗⭐】

地址:https://github.com/CSAILVision/gandissect?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 26】GANimation

从一张图像中感知具有解剖学意义的面部动画。【在 Github 上有 869 颗⭐】

地址:https://github.com/albertpumarola/GANimation?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

神经网络
【No 27】Fastai

它使用现代最佳实践简化了快速准确的神经网络训练。【在 Github 上有 11597 颗⭐】

地址:https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 28】DeepCreamPy

用深度神经网络去除成人漫画的马赛克。【在 Github 上有 7046 颗⭐】

地址:https://github.com/deeppomf/DeepCreamPy?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 29】Augmentor v0.2

用于机器学习的 Python 图像增强库。【在 Github 上有 2805 颗⭐】

地址:https://github.com/mdbloice/Augmentor?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 30】Graph_nets

在 TensorFlow 中构建图网。【在 Github 上有 2723 颗⭐】

地址:https://github.com/deepmind/graph_nets?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 31】Textgenrnn

Python 模块,可使用预训练的基于字符的递归神经网络轻松地生成文本。【在 Github 上有 1900 颗⭐】

地址:https://github.com/minimaxir/textgenrnn?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 32】Person-blocker

使用预训练的神经网络自动 “屏蔽” 图像中的人(如英国独立单元剧《黑镜》(Black Mirror))。【在 Github 上有 1806 颗⭐】

地址:https://github.com/minimaxir/person-blocker?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 33】Deepvariant

Deepvariant 是一个分析管道,使用深度神经网络调用来自下一代 DNA 测序数据的遗传变异。【在 Github 上有 1502 颗⭐】

地址:https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 34】Video-nonlocal-net

用于视频分类的非本地神经网络。【在 Github 上有 1049 颗⭐】

地址:https://github.com/facebookresearch/video-nonlocal-net?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 35】Ann-visualizer

用于可视化人工神经网络(Artificial Neural Networks ,ANN)的 Python 库。【在 Github 上有 922 颗⭐】

地址:https://github.com/Prodicode/ann-visualizer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

工具包
【No 36】Tfjs

一个 WebGL 加速的、基于浏览器的 JavaScript 库,用于训练和部署机器学习模型。【在 Github 上有 10268 颗⭐】

地址:https://github.com/tensorflow/tfjs?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 37】Dopamine

Google 出的强化学习算法快速原型化的研究框架。【在 Github 上有 7142 颗⭐】

地址:https://github.com/google/dopamine?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 38】Lime

解释任何机器学习分类器的预测。【在 Github 上有 5173 颗⭐】

地址:https://github.com/marcotcr/lime?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 39】Autokeras

一种用于自动机器学习(AutoML)的开源软件库。【在 Github 上有 4520 颗⭐】

地址:https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 40】Shap

使用期望值和 Shapley 值解释任何机器学习模型的输出。【在 Github 上有 3496 颗⭐】

地址:https://github.com/slundberg/shap?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 41】MMdnn

一套用于帮助用户在不同深度学习框架之间进行互操作的工具。例如模型转换和可视化。在 Caffe、Keras、MXNet、TensorFlow 之间进行转换模型。【在 Github 上有 3021 颗⭐】

地址:https://github.com/Microsoft/MMdnn?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 42】Mlflow

用于机器学习生命周期的开源平台。【在 Github 上有 3013 颗⭐】

地址:https://github.com/mlflow/mlflow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 43】Mace

用于移动异构计算平台优化的深度学习推理框架。【在 Github 上有 2979 颗⭐】

地址:https://github.com/XiaoMi/mace?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 44】PySyft

用于安全、私密的深度学习的 Python 库。PySyft 使用 PyTorch 的多方计算(Multi-Party Computation,MPC)将私有数据从模型训练中分离出来。【在 Github 上有 2595 颗⭐】

地址:https://github.com/OpenMined/PySyft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 45】Adanet

具有学习保证(learning guarantees)的快速灵活的 AutoML。【在 Github 上有 2293 颗⭐】

地址:https://github.com/tensorflow/adanet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 46】Tencent-ml-images

最大的多标签图像数据库;ResNet-101 模型;ImageNet 上的 80.73% 的 top-1 acc。【在 Github 上有 2094 颗⭐】

地址:https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 47】Donkeycar

开源软硬件平台,打造小型自动驾驶汽车。【在 Github 上有 1207 颗⭐】

地址:https://github.com/autorope/donkeycar?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 48】PocketFlow

自动模型压缩框架(Automatic Model Compression,AutoMC),用于开发更小、更快的人工智能应用。【在 Github 上有 1677 颗⭐】

地址:https://github.com/Tencent/PocketFlow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

【No 49】DALI

包含高度优化的构件块和用于深度学习应用中的数据预处理的执行引擎的库。【在 Github 上有 1013 颗⭐】

地址:https://github.com/NVIDIA/dali?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

以上就是 2018 年度的机器学习教程的全部内容。如果你喜欢这份报道,请阅读更多由 Mybridge 排名的博文:https://medium.mybridge.co/

原文链接:

https://medium.mybridge.co/amazing-machine-learning-open-source-tools-projects-of-the-year-v-2019-95d772e4e985

今日荐文

点击下方图片即可阅读

Spark背后公司获2.5亿融资!估值达27.5亿美元


精品推荐

在 AI 高速发展的第七个年头,以深度学习为基础的新一代 AI 技术正趋向切实业务尝试。2019 年 5 月 6-8 日,QCon 特邀行业内场景落地专家与你相约北京国际会议中心,深度聚焦人工智能技术、机器学习应用与实践等专题。点击 「 阅读原文 」或识别二维码了解 QCon 十周年精心策划,现在购票即享 8 折限时折扣,立减 1760 元,团购还有更多优惠!有任何问题欢迎联系票务小姐姐 Ring:电话 010-53935761,微信 qcon-0410


点一下「好看」,为新年积攒福气 👇

登录查看更多
1

相关内容

【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
专知会员服务
109+阅读 · 2020年3月12日
专知会员服务
116+阅读 · 2019年12月24日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
94+阅读 · 2019年12月23日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
2019年度机器学习49个顶级工程汇总
专知
5+阅读 · 2019年2月6日
2018机器学习开源资源盘点
专知
6+阅读 · 2019年2月2日
2018-Github最热门机器学习开源项目Top10分享
深度学习与NLP
8+阅读 · 2019年1月22日
机器学习开源项目Top10
AI100
4+阅读 · 2019年1月20日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
6月份最热门的机器学习开源项目Top10
AI前线
8+阅读 · 2018年7月3日
推荐 | 机器学习开源项目 Top 10
AI100
3+阅读 · 2018年3月21日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
资源 | GitHub上的五大开源机器学习项目
机器之心
9+阅读 · 2017年11月9日
VIP会员
相关VIP内容
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
专知会员服务
109+阅读 · 2020年3月12日
专知会员服务
116+阅读 · 2019年12月24日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
94+阅读 · 2019年12月23日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
2019年度机器学习49个顶级工程汇总
专知
5+阅读 · 2019年2月6日
2018机器学习开源资源盘点
专知
6+阅读 · 2019年2月2日
2018-Github最热门机器学习开源项目Top10分享
深度学习与NLP
8+阅读 · 2019年1月22日
机器学习开源项目Top10
AI100
4+阅读 · 2019年1月20日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
6月份最热门的机器学习开源项目Top10
AI前线
8+阅读 · 2018年7月3日
推荐 | 机器学习开源项目 Top 10
AI100
3+阅读 · 2018年3月21日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
资源 | GitHub上的五大开源机器学习项目
机器之心
9+阅读 · 2017年11月9日
Top
微信扫码咨询专知VIP会员