2018年度最牛逼的30个机器学习项目!

2018 年 12 月 14 日 大数据技术
来自:开源最前线(ID:OpenSourceTop)

原文:https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7


在过去的一年中,我们比较了8,800多个开源机器学习项目,从中挑选出前30名,这个极具竞争力的排行榜,精选了2018年1月到12月期间发布的最佳开源机器学习库、数据集和应用程序等。Mybridge AI根据它们的受欢迎程度,参与度和新鲜度来评估。这30个开源项目的Github平均Star数为:3,558


开源项目对数据科学家用处很大,你可以通过阅读代码来学习,并在现有项目之上构建一些东西。话不多说,一起来看看上榜的项目有哪些:



1
FastText


https://github.com/facebookresearch/fastText Star 16675



fasttext是facebook开源的一个词向量与文本分类工具,在2016年开源,典型应用场景是“带监督的文本分类问题”。



2
Deep-photo-styletransfer


https://github.com/luanfujun/deep-photo-styletransfer Star 9747 



深度摄影风格转换,此代码基于Torch。它已经在Ubuntu 14.04 LTS上进行了测试。上图就是该算法的图片风格转换对比。



3
face_recognition


https://github.com/ageitgey/face_recognition Star 8672



Face Recognition 是一个基于 Python 的人脸识别库,它还提供了一个命令行工具,让你通过命令行对任意文件夹中的图像进行人脸识别操作。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。



4
Magenta


https://github.com/tensorflow/magenta Star 11752



Project Magenta由Google Brain团队发布,其主要目标是利用机器学习创作艺术和谱写曲子。Project Magenta使用了 TensorFlow系统。



5
Sonnet


https://github.com/deepmind/sonnet  Star 5731



Sonnet 库使用面向对象的方法,允许创建定义一些前向传导计算的模块。模块用一些输入 Tensor 调用,添加操作到图里并返回输出 Tensor。其中一种设计选择是通过在随后调用相同的模块时自动重用变量来确保变量分享被透明化处理。



6
deeplearn.js


https://github.com/PAIR-code/deeplearnjs Star 5462



DeepLearn.js 是 Google 推出的一个可用于机器智能并加速 WebGL 的开源 JavaScript 库,完全在浏览器中运行,不需要安装,不需要后端处理



7
fast-style-transfer


https://github.com/lengstrom/fast-style-transfer Star 4843



快速风格迁移的TensorFlow实现,任意风格图和内容图0.1秒出结果。



8
Pysc2


https://github.com/deepmind/pysc2 Star 3683



PySC2 是 DeepMind 开源的 “星际争霸II学习环境”(SC2LE)的 Python 组件,允许研究者较容易地使用暴雪的 feature-layer API 和自己的智能体。



9
AirSim


https://github.com/Microsoft/AirSim Star 3681



AirSim 是微软开源的一个跨平台的建立在虚幻引擎( Unreal Engine)上的无人机以及其它自主移动设备的模拟器。 它支持硬件在循环与流行的飞行控制器的物理和视觉逼真模拟。



10
Facets


https://github.com/PAIR-code/facets Star 5054



Facets 是 Google 开源的一款可视化工具,帮助理解、分析和调试 ML 数据集。Facets 包含两个部分 —— Facets Overview 和 Facets Dive ,允许用户以不同的粒度查看其数据的整体图像。



11
Style2Paints


https://github.com/lllyasviel/style2paints Star 8150



STYLE2PAINTS 是新一代的线稿上色 AI ,可根据用户上传的自定义色彩给线稿进行上色。



12
Tensor2Tensor


https://github.com/tensorflow/tensor2tensor Star 3087



Tensor2Tensor 是一个模块化和可扩展的库和二进制文件,用于在 TensorFlow 中训练深度学习模型,并专注于序列任务,由谷歌开发维护。



13
pytorch-CycleGAN-and-pix2pix


https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix Star 6197



基于PyTorch的图像到图像翻译的项目,比如马到斑马,老鹰到猫等。当前的软件适用于PyTorch 0.4+



14
Faiss


https://github.com/facebookresearch/faiss Star 5181



FAISS 是 Facebook AI 研究团队开源的针对聚类和相似性搜索库,用C++编写,它包含一种在任意大小的向量集合中搜索直到可能不适合在 RAM 中的新算法,还包含用于评估和参数调整的支持代码。 



15
Fashion-mnist


https://github.com/zalandoresearch/fashion-mnist Star 4623



FashionMNIST 是一个替代 MNIST 手写数字集的图像数据集,其涵盖了来自 10 种类别的共 7 万个不同商品的正面图片,FashionMNIST 的大小、格式和训练集 / 测试集划分与原始的 MNIST 完全一致。



16
ParlAI


https://github.com/facebookresearch/ParlAI Star 3933



ParlAI是 Facebook 开源的,用于在 Python 中实现的对话 AI 研究框架。



17
Fairseq


https://github.com/facebookresearch/fairseq Star 3254



Fairseq 使用一种全新的卷积神经网络(CNN)进行语言翻译,结果以 9 倍于以往循环神经网络(CNN)的速度实现了目前最高准确率。



18
Pyro


https://github.com/uber/pyro Star 4772



Pyro 是 Uber AI 实验室开源的一款深度概率编程语言(PPL),基于 Python 与 PyTorch 之上,专注于变分推理,同时支持可组合推理算法。



19
iGAN


https://github.com/junyanz/iGAN Star 3121



iGAN,又名 interactive GAN ,自然图像流形上的可视化操作的生成。该系统基于类似 GAN and DCGAN 这些深度生成模型(Deep Generative Models)



20
Deep-image-prior


https://github.com/DmitryUlyanov/deep-image-prior  Star 3666



它让一个深度卷积网络去学习复制被破坏的图像(如,加入噪点的图像),发现这个网络会自动先学会如何重建图像。



21
Face_classification


https://github.com/oarriaga/face_classification Star 3559



利用fer2013/imdb 数据库、Keras CNN 模型和OpenCV进行实时脸部识别和情绪/性别分类。



22
Speech-to-Text-WaveNet


https://github.com/buriburisuri/speech-to-text-wavenet Star 2785



用WaveNet和TensorFlow进行端到端的英语演讲语句识别。



23
StarGAN


https://github.com/yunjey/StarGAN Star 3347



StarGAN,顾名思义,就是星形网络结构,在StarGAN中,生成网络G被实现成星形。



24
Ml-agents


https://github.com/Unity-Technologies/ml-agents Star 4608



Unity机器学习代理(ML-Agents)是一款开源的Unity插件,让你可以在游戏环境和模拟环境中训练智能代理。



25
DeepVideoAnalytics


https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/ Star 2337



Deep Video Analytics提供了一个从视频和图像索引和提取信息的平台。使用深度学习检测和识别算法来用检测到的对象索引各个帧/图像。



26
OpenNMT


https://github.com/OpenNMT/OpenNMT Star 2039



OpenNMT 是一个由 Harvard NLP (哈佛大学自然语言处理研究组) 开源的 Torch 神经网络机器翻译系统。



27
Pix2pixHD


https://github.com/NVIDIA/pix2pixHD Star 2696



pix2pixHD 是英伟达开源的用条件 GANs (生成式对抗网络)进行 2048x1024 分辨率的图像合成和处理的项目,它可以用于将语义标签贴图转换为逼真的图像,或者从人脸标签贴图合成肖像。



28
Horovod


https://github.com/uber/horovod Star 4595



Horovod 是 Uber 开源的针对 TensorFlow 的分布式深度学习框架,能够轻松采用单个 GPU TensorFlow 程序,同时也能更快地在多个 GPU 上成功地对其进行训练。



29
AI-Blocks


https://github.com/MrNothing/AI-Blocks Star 1518



一款强大的WYSIWYG界面,能让任何人创建机器学习模型。



30
deep-voice-conversion


https://github.com/andabi/deep-voice-conversion Star 2007



该项目可在TensorFlow上用深度神经网络实现语音转换。



●编号734,输入编号直达本文

●输入m获取文章目录

登录查看更多
3

相关内容

Magenta is a Google Brain project to ask and answer the questions, “Can we use machine learning to create compelling art and music? If so, how? If not, why not?”
专知会员服务
80+阅读 · 2020年6月20日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
213+阅读 · 2020年2月21日
专知会员服务
116+阅读 · 2019年12月24日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
CMU博士论文:可微优化机器学习建模
专知会员服务
59+阅读 · 2019年10月26日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
2019年度机器学习49个顶级工程汇总
专知
5+阅读 · 2019年2月6日
年度大盘点:机器学习开源项目及框架
云栖社区
3+阅读 · 2018年12月17日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
2017年度盘点:Github上十大有趣的机器学习项目(文末有惊喜......)
机器学习算法与Python学习
9+阅读 · 2018年1月6日
GitHub最著名的20个Python机器学习项目!
THU数据派
6+阅读 · 2017年12月14日
GitHub最著名的20个Python机器学习项目
全球人工智能
9+阅读 · 2017年12月7日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Arxiv
8+阅读 · 2018年11月21日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
6+阅读 · 2018年4月4日
VIP会员
相关VIP内容
专知会员服务
80+阅读 · 2020年6月20日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
213+阅读 · 2020年2月21日
专知会员服务
116+阅读 · 2019年12月24日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
CMU博士论文:可微优化机器学习建模
专知会员服务
59+阅读 · 2019年10月26日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
相关资讯
2019年度机器学习49个顶级工程汇总
专知
5+阅读 · 2019年2月6日
年度大盘点:机器学习开源项目及框架
云栖社区
3+阅读 · 2018年12月17日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
2017年度盘点:Github上十大有趣的机器学习项目(文末有惊喜......)
机器学习算法与Python学习
9+阅读 · 2018年1月6日
GitHub最著名的20个Python机器学习项目!
THU数据派
6+阅读 · 2017年12月14日
GitHub最著名的20个Python机器学习项目
全球人工智能
9+阅读 · 2017年12月7日
相关论文
Top
微信扫码咨询专知VIP会员