7月份最热门的机器学习开源项目TOP5

2018 年 8 月 7 日 AI前线
作者 | PRANAV DAR
编译 | 无明
编辑 | Vincent
AI 前线导读:你是否想过,即使不知道如何画画,甚至不知道如何握好一支画笔,也能成为一名艺术家?借助计算机视觉技术就可以做到。更妙的是,ML 社区已经将这些库的代码开源了!下面列出了一些非常酷的开源库——基于深度学习和 GAN 并与自然语言处理相关的文本匹配,以及用于对现有图像进行重新绘制的计算机视觉技术。我们还从 Reddit 上选择了一些有关深度学习和人工智能的讨论,它们将帮助你评估和了解某些行业技术的现状,以及在不久的将来可能会走向何方。

更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)
Image Outpainting

这是我在本系列中介绍的最酷的开源库之一。“去水印”(Inpainting)一直是最近的一个趋势概念,但由斯坦福大学的几位研究人员设计的“Outpainting”技术却恰恰相反。“Outpainting”对 GAN 在去水印方面的用途进行了扩展,用于估计和想象超出现有图像范围的部分可能是什么样子的,然后通过算法将图像扩展到现有边界之外。正如上图所示,效果非常好。

这个开源库是基于 Keras 实现的。你可以从头开始构建模型,也可以使用开源库作者提供的模型。无论选择哪种方式,都去试一试吧!

地址:https://github.com/bendangnuksung/Image-OutPainting

基于 TensorFlow 的文本分类模型

这个开源库是各种文本分类模型的 TensorFlow 实现,它为提到的每个模型提供了链接。已经实现的模型包括:

  • Word-level CNN

  • Character-level CNN

  • Very Deep CNN

  • Word-level Bidirectional RNN

  • Attention-Based Bidirectional RNN

  • R-CNN

地址:https://github.com/dongjun-Lee/text-classification-models-tf

MatchZoo

虽然这个开源库严格来说并不是上个月创建的,但最近这个开源库推出了一个重大更新。MatchZoo 基本上是一个用于文本匹配的工具包。它的目的是为了设计、比较和分享各种深层文本匹配模型。MatchZoo 可用于文档检索、会话响应排名、问题回答和释义识别等。

其他一些深度匹配方法有 DRMM、MatchPyramid、MV-LSTM、aNMM、DUET 等。查看这个开源库,以获取有关如何安装和使用这个库的详细信息。

地址:https://github.com/faneshion/MatchZoo

GANimation

上面的这些面孔会让你对这个开源库感到兴奋吗?绿色边框内的图像是原始图像,剩下的是使用 GANimation 改变了主体面部表情后的图像。这种方法稍显复杂,但如果你对深度学习感兴趣,一定会深入探索的。

作者为入门提供了所需的一切:初学者指南、先决条件、数据准备资源,当然还有 Python 代码。还在等什么,快到碗里来!

地址:https://github.com/albertpumarola/GANimation

GAN Stability

这个优秀的开源库包含了这篇论文(https://avg.is.tuebingen.mpg.de/publications/meschedericml2018)中提到的各种实验的 Python 代码。这篇论文是在七月份的 2018 年国际机器学习会议上提出的。对于任何对深度学习尤其是 GAN 感兴趣的人来说,这是一个非常吸引人的案例。

这个开源库可以帮助你更好地了解顶级 ML 会议论文中的研究和思考水平。这是 ICML 2018 最佳论文的链接(https://www.analyticsvidhya.com/blog/2018/06/best-research-papers-icml-2018)。

地址:https://github.com/LMescheder/GAN_stability

Reddit 上的讨论
我应该学习哪些深度学习论文?

地址:https://old.reddit.com/r/MachineLearning/comments/8vmuet/d_what_deep_learning_papers_should_i_implement_to/

如果你是深度学习新手,那么就一定要读一读这个主题。很多深度学习专家在最近发表的论文中提出了他们的观点(还提供了大量的链接),你应该阅读这些论文。这样可以加强你所学到的知识,并可以让你与最新的技术保持同步。

如果你有深度学习经验,这将刷新你的概念,或告诉你在这个多元化的领域发生了哪些事情。学无止境,因此我建议你查看一下所有的资源。你还应该阅读其他数据科学家提供的意见,你可以将这些意见增加到你自己的观点中。

科学在 Google Brain/FAIR/DeepMind 等组织中的应用情况

地址:https://old.reddit.com/r/MachineLearning/comments/8yvlzy/d_debate_about_science_at_organizations_like/

这个标题足以引起数据科学家的注意。这个讨论起源于 Twitter 上的关于大型技术组织如何使用科学技术的辩论。虽然辩论是以悲观的观点作为开始,但却从那些在这些公司工作过的人那里获得了更多积极正面的观点。

你不仅可以了解到 Google Brain 如何定义和使用科学,还可以了解到数据科学从业人员对当前科学应用状况的看法。

一些理论方面的好书

地址:https://old.reddit.com/r/MachineLearning/comments/8wcjcm/d_what_are_some_good_books_to_get_more/

如果你想从事机器学习研究,需要了解很多理论知识,包括核心数学、概率论等。这个主题列出了一些关于各种机器学习概念的书籍。

这个主题还提供了大量的建议(差不多 100 条评论!)和链接,从高级机器学习到强化学习的介绍,这个主题简直就是顶级资源的金矿。

讨论人工智能将如何影响当前和未来的工作

地址:https://www.reddit.com/r/artificial/comments/8zx2mx/artificial_intelligence_will_create_as_many_jobs/

这是几十年来一直在讨论的话题,并且随着最近对 ML 和 AI 兴趣的增加而变得更加突出。尽管专家在尽力减轻恐惧,但这种担忧仍然存在。这个主题包含了来自 AI 爱好者和专家的意见,可以了解他们如何看待 AI 对不同国家的工作的影响。

主题中还提供了大量的统计数据和链接,可以帮助你了解人工智能的发展方向。你也可以参与讨论,参与越多,对数据科学的信心就越大。

人们在数据可视化中犯的常见错误

地址:https://www.reddit.com/r/datascience/comments/8wj1nr/play_your_charts_right_an_illustrated_collection/

数据可视化是机器学习项目的关键部分,不过它也有独立的应用程序,如仪表盘、报告等。商业智能是一个正在蓬勃发展的领域,随着越来越多的人进入,他们需要注意人们经常会犯的一些错误。主题中给出的图表很好地说明了这一点。

这是你在数据科学之旅中遇到的一个非常重要的主题。你不一定要虔诚地跟进每一个观点,但了解该领域的领导者们在想什么还是很有好处的。

英文原文:

https://www.analyticsvidhya.com/blog/2018/08/best-machine-learning-github-repositories-reddit-threads-july-2018/

如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!


登录查看更多
2

相关内容

GAN:生成性对抗网,深度学习模型的一种,在神经网络模型中引入竞争机制,非常流行。
专知会员服务
110+阅读 · 2020年3月12日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
358+阅读 · 2020年2月15日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
2019年机器学习框架回顾
专知会员服务
36+阅读 · 2019年10月11日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
143+阅读 · 2019年10月10日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
2018年8月份GitHub上最热门的开源项目
算法与数据结构
3+阅读 · 2018年9月4日
2018年7月份GitHub开源项目排行榜
算法与数据结构
15+阅读 · 2018年8月3日
6月份最热门的机器学习开源项目Top10
AI前线
8+阅读 · 2018年7月3日
2018 年 2 月份 GitHub 上最热门的开源项目
算法与数据结构
5+阅读 · 2018年3月10日
Python 开源项目 Top30 | 值得收藏
人工智能头条
8+阅读 · 2018年1月19日
GitHub上12月份最热门开源项目
程序猿
4+阅读 · 2018年1月9日
Arxiv
9+阅读 · 2019年4月19日
Knowledge Based Machine Reading Comprehension
Arxiv
4+阅读 · 2018年9月12日
VIP会员
相关VIP内容
专知会员服务
110+阅读 · 2020年3月12日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
358+阅读 · 2020年2月15日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
2019年机器学习框架回顾
专知会员服务
36+阅读 · 2019年10月11日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
143+阅读 · 2019年10月10日
相关资讯
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
2018年8月份GitHub上最热门的开源项目
算法与数据结构
3+阅读 · 2018年9月4日
2018年7月份GitHub开源项目排行榜
算法与数据结构
15+阅读 · 2018年8月3日
6月份最热门的机器学习开源项目Top10
AI前线
8+阅读 · 2018年7月3日
2018 年 2 月份 GitHub 上最热门的开源项目
算法与数据结构
5+阅读 · 2018年3月10日
Python 开源项目 Top30 | 值得收藏
人工智能头条
8+阅读 · 2018年1月19日
GitHub上12月份最热门开源项目
程序猿
4+阅读 · 2018年1月9日
Top
微信扫码咨询专知VIP会员