6月份最热门的机器学习开源项目Top10

2018 年 7 月 3 日 AI前线
编译 | Debra
编辑 | Natalie
AI 前线导读: 燥热的 6 月天已经结束了,本月机器学习领域又有哪些开源项目值得一看呢?Mybridge AI 从将近 250 个机器学习开源项目中评选出排名 Top10 的项目。这是他们对在此期间新发布或进行重大发布的项目进行比较之后得出的结果,考量了各种因素对项目的专业性进行排序。哪些项目上榜了呢?

更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)


  • Github 收藏平均数量:764⭐️

  • 机器学习 Github Top10 开放源代码,https://github.com/Mybridge/machine-learning-open-source。

  • 主题:NLP 架构、视频分类、Mlflow、经典游戏、Dragonfire、Opencv、计算机视觉、Star GAN、Glow、生成压缩

这些开源项目对程序员很有用,希望你能找到一个能引起你兴趣的有趣项目。

Top1 Nlp-architect

英特尔人工智能实验室的 NLP 架构:探索最先进的 NLP 深度学习拓扑和技术的 Python 库[Github 1194 颗星]

当前版本的 NLP Architect 包含了从研究角度和实际应用都非常有趣的特性:

  • NLP 核心模型可以为 NLP 工作流程提供强大的语言特征提取功能:例如分析器(BIST)和 NP chunker

  • 提供一流性能的 NLU 模块:例如意图提取(IE),名称实体识别(NER)

  • 解决语义理解的模块:例如,内涵提取,最常见词义,NP 嵌入表示(如 NP2V)

  • 会话式 AI 组件:例如 ChatBot 应用程序,包括对话系统,序列分块和 IE

  • 使用新拓扑的端到端 DL 应用程序:例如 Q&A,机器阅读理解

感谢 Intel Nervana[英特尔人工智能实验室对 NLP 架构的介绍:

https://ai.intel.com/introducing-nlp-architect-by-intel-ai-lab/

github 链接:

https://github.com/NervanaSystems/nlp-architect

Top2 视频非局域网

Video-nonlocal-net:用于视频分类的非局部神经网络,用 Caffe2 开发[Github 592 颗星]

Facebook Research 介绍:https://medium.com/@FBResearch

论文地址:https://arxiv.org/pdf/1711.07971.pdf

GitHub 链接:

https://github.com/facebookresearch/video-nonlocal-net

Top3 Mlflow

整个机器学习生命周期的开源平台 [Github 1282 颗星]

目前的 MLflow 是 alpha 版本,意味着 API 和数据格式有可能发生变化,且不支持 Windows 运行。

GitHub 链接:

https://github.com/databricks/mlflow

Top4 Gym Retro

经典游戏强化学习平台 [Github 905 颗星]

OpenAI 使用 Gym Retro 来研究强化学习(RL)算法并研究泛化。 RL 之前的研究主要集中在优化代理解决单个任务上。 通过 Gym Retro,我们可以研究在概念相似但外观不同的游戏之间进行概括的能力。此外,OpenAI 还微信游戏田姐了新的整合工具。

视频地址:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-heavy/output2.mp4

此版本包括世嘉创世纪和世嘉主系统的游戏,以及任天堂的 NES,SNES 和 Game Boy 游戏机。它还包括对世嘉 Game Gear,任天堂 Game Boy Color,任天堂 Game Boy Advance 和 NEC TurboGrafx 的初步支持。 一些已发布的游戏集成(包括 Gym Retro 的数据 / 实验文件夹中的那些游戏)处于测试状态。由于涉及的变化规模很大,代码暂时只能在一部分游戏上使用。

OpenAI 介绍:https://blog.openai.com/gym-retro/

GitHub 链接:

https://github.com/openai/retro/tree/develop

Top5 Dragonfire v1.0

基于 Ubuntu 的 Linux 发行版的开源 AI 助手 [Github 688 颗星]

支持环境:

Dragonfire 执行命令步骤:

  • 搜索内置命令并评估代数表达式

  • 尝试学习使用高级 NLP 和数据库管理技术

  • 询问无所不知的 Q&A 引擎(感谢所有为维基百科做贡献的人)

  • 使用 Deep Conversation 系统进行响应,这是一个使用 Cornell Movie-Dialogs Corpus 训练的 seq2seq 神经网络

Dragonfire 使用 Mozilla DeepSpeech 来理解你的语音命令,并使用 Festival Speech Synthesis System 来处理文本到语音的任务。

你可以到 Gitter 聊天室(https://gitter.im/DragonComputer/Lobby),或者 Twitter 帐户与 Dragonfire 体验亲自与她交谈的乐趣。

DRAGON.COMPUTER 介绍:

https://github.com/DragonComputer/Dragonfire

GitHub 链接:

https://github.com/DragonComputer/Dragonfire

Top6 FaceAI

人脸、视频、文字检测和识别项目(使用自动翻译器:中文 - >英文) [Github 1482 颗星]。

功能

  1. 人脸检测、识别(图片、视频)

  2. 轮廓标识

  3. 头像合成(给人戴帽子)

  4. 数字化妆(画口红、眉毛、眼睛等)

  5. 性别识别

  6. 表情识别(生气、厌恶、恐惧、开心、难过、惊喜、平静等七种情绪)

  7. 视频对象提取

  8. 图片修复(可用于水印去除)

  9. 图片自动上色

  10. 眼动追踪(待完善)

  11. 换脸(待完善)

开发环境

  • Windows 10(x64)

  • Python 3.6.4

  • OpenCV 3.4.1

  • Dlib 19.8.1

  • face_recognition 1.2.2

  • keras 2.1.6

  • tensorflow 1.8.0

  • Tesseract OCR 4.0.0-beta.1

GitHub 链接:

https://github.com/vipstone/faceai

Top7 Sod

嵌入式计算机视觉和机器学习库(CPU 优化和 IoT 功能)[Github 557 颗星]

SOD 是嵌入式的现代跨平台计算机视觉和机器学习软件库,公开了一套用于深入学习的高级媒体分析和处理 API,包括实时、多类别对象检测和嵌入式系统上的模型训练计算资源和物联网设备,旨在为计算机视觉应用提供通用基础设施,并加速在开源和商业产品中使用机器感知。

SOD 目前的计算机视觉算法支持但不限于移动机器人、AR/VR、基因学、人机交互、机器自动化等。

值得注意的 SOD 功能:

  • 专为真实世界和实时应用程序而打造。

  • 最先进的 CPU 优化深度神经网络,包括全新的独家 RealNets 架构。

  • 无需专利,先进的计算机视觉算法。

  • 支持主要的图像格式。

  • 简单,干净且易于使用的 API。

  • 深入了解有限的计算资源,嵌入式系统和物联网设备。

  • 易于使用 OpenCV 或任何其他专有 API 进行插补。

  • 预训练模型可用于大多数体系结构。

  • 支持 CPU 的 RealNets 模型训练。

  • 已完备、跨平台、高质量的源代码。

  • SOD 是免费的,用 C 语言编写,几乎可以在所有平台和体系结构上编译和运行。合并 - 将所有 SOD 源文件合并为一个 C 文件(sod.c)以便于部署。

  • 开源,积极开发和维护产品。

  • 开发者友好的支持渠道(https://sod.pixlab.io/support.html)

SOD 编程指南:https://sod.pixlab.io/intro.html

Symisc Systems 主页介绍:https://sod.pixlab.io/

GitHub 链接:https://github.com/symisc/sod

Top8 StarGAN-Tensorflow

StarGAN 的简单 Tensorflow 实现(CVPR 2018 Oral)[Github 382 颗星],感谢 Junho Kim。

StarGAN 是一个使用单个数据集解决多域图像到图像转换问题的框架,可以合并包含不同标签集的多个数据集,并灵活地使用这些标签进行图像翻译。

论文链接:https://arxiv.org/pdf/1711.09020.pdf

GitHub 链接:

https://github.com/taki0112/StarGAN-Tensorflow

Top9 Glow

神经网络硬件加速器编译器 [Github 603 颗星],致谢 PyTorch。

Glow 是针对各种硬件目标而设计的机器学习编译器和执行引擎,被用作高级机器学习框架的后端。该编译器可以进行最先进的编译器优化和神经网络图的代码生成。这个库还在实验和发展阶段。

工作原理

Glow 将传统的神经网络数据流图降低到两阶段强类型中间表示(IR)。高级 IR 允许优化器执行特定域的优化。较低级别的仅基于指令的 IR 允许编译器执行与内存相关的优化,例如指令调度,静态内存分配和复制消除。在最底层,优化器执行特定机器代码生成,以利用其硬件特性。Glow 的降低阶段特点在于使编译器无需在所有目标上实现所有运算符,从而支持大量的输入运算符以及大量的硬件目标。降低阶段的设计旨在减少输入空间,让新的硬件后端专注于少数线性代数基元。其设计理念在 arXiv 论文中有所描述。

论文链接:https://arxiv.org/abs/1805.00907

GitHub 链接:

https://github.com/pytorch/glow

Top10 生成压缩

Generative-compression:GAN 极端学习图像压缩的 TensorFlow 实现。[Github 225 颗星],致谢 Justin-Tan。

Generative-compression 的方法由 Agustsson 等人在 Generative Adversarial Networks for Extreme Learned Image Compression 一文中提出。

论文链接:https://arxiv.org/pdf/1804.02958.pdf

GitHub 地址:

https://github.com/Justin-Tan/generative-compression

原文链接:

https://medium.mybridge.co/machine-learning-open-source-projects-of-the-month-v-june-2018-d87e2ca3e13f  

AI前线
紧跟前沿的AI技术社群

如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!

登录查看更多
8

相关内容

Databricks开源的机器学习平台
专知会员服务
54+阅读 · 2020年7月4日
专知会员服务
171+阅读 · 2020年6月4日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
288+阅读 · 2020年6月3日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
干货书《数据科学数学系基础》2020最新版,266页pdf
专知会员服务
319+阅读 · 2020年3月23日
专知会员服务
109+阅读 · 2020年3月12日
【精通OpenCV 4】Mastering OpenCV 4 - Third Edition 随书代码
专知会员服务
39+阅读 · 2019年11月13日
2018-Github最热门机器学习开源项目Top10分享
深度学习与NLP
8+阅读 · 2019年1月22日
机器学习开源项目Top10
AI100
4+阅读 · 2019年1月20日
2018年最实用机器学习项目Top 6(附开源链接)
新智元
20+阅读 · 2019年1月4日
年度大盘点:机器学习开源项目及框架
云栖社区
3+阅读 · 2018年12月17日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
推荐 | 机器学习开源项目 Top 10
深度学习世界
4+阅读 · 2018年3月22日
GitHub上12月份最热门开源项目
程序猿
4+阅读 · 2018年1月9日
Arxiv
3+阅读 · 2019年9月5日
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
Arxiv
8+阅读 · 2018年5月21日
Arxiv
5+阅读 · 2017年7月23日
VIP会员
相关VIP内容
专知会员服务
54+阅读 · 2020年7月4日
专知会员服务
171+阅读 · 2020年6月4日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
288+阅读 · 2020年6月3日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
干货书《数据科学数学系基础》2020最新版,266页pdf
专知会员服务
319+阅读 · 2020年3月23日
专知会员服务
109+阅读 · 2020年3月12日
【精通OpenCV 4】Mastering OpenCV 4 - Third Edition 随书代码
专知会员服务
39+阅读 · 2019年11月13日
相关资讯
2018-Github最热门机器学习开源项目Top10分享
深度学习与NLP
8+阅读 · 2019年1月22日
机器学习开源项目Top10
AI100
4+阅读 · 2019年1月20日
2018年最实用机器学习项目Top 6(附开源链接)
新智元
20+阅读 · 2019年1月4日
年度大盘点:机器学习开源项目及框架
云栖社区
3+阅读 · 2018年12月17日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
推荐 | 机器学习开源项目 Top 10
深度学习世界
4+阅读 · 2018年3月22日
GitHub上12月份最热门开源项目
程序猿
4+阅读 · 2018年1月9日
Top
微信扫码咨询专知VIP会员