2018年2月份Github上最热门的数据科学和机器学习项目

2018 年 3 月 23 日 AI前线 GitHub
作者 | Pranav Dar
译者 | 马卓奇
编辑 | Emily
AI 前线导读:GitHub 项目仓库让数据科学领域的从业者可以方便快捷地跟进该领域的最新进展。它也是一个很好的协作工具,可以与其他数据科学家共同合作完成项目。本文将简单介绍 2 月份 Github 上最火的 5 个数据科学和机器学习项目。

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)


FastPhotoStyle(快速照片风格转换)

FastPhotoStyle 是 NVIDIA 开发的 python 库。该模型将一张内容照片和一张风格图作为输入,然后将内容照片转换为风格图的风格。

开发人员给出了两个算法示例。第一个是十分简单的迭代算法——下载一张内容图和风格图,调整图像尺寸,然后运行照片真实感图像风格化代码。第二个样例中,需要利用语义分割标签图来生成带有语义的风格化图像。

Twitter Scraper(Twitter 爬虫)

如果你曾经在 Twitter 上爬过推送,你肯定用过 Twitter 自己给出的 API,Twitter 自己的 API 有流速限制。这个 python 库就是考虑到这一点——它没有 API 限流(不需要任何验证),没有限制,并且超级快。你可以用这个库爬取任何用户的任意一条推特。

开发者提出它可以用于设计马尔科夫链,但目前只能用于 python 3.6 及以上版本。

Handwriting Synthesis(手写体合成)

这个项目来自 Alex Graves 的论文《Generating Sequences with Recurrent Neural Networks(用 RNN 生成序列)》,是其中手写体合成实验的实现。它可以生成不同风格的手写字迹。模型包括初始化和偏置两个部分。初始化控制样例的风格,偏置控制样例的整洁度。

作者在这个项目的 GitHub 主页上展示了各种各样的样例风格。作者还在寻找这个项目的贡献者,如果你有兴趣,请与作者联系。

ENAS PyTorch(高效神经网络结构搜索)

这个项目是对论文《Efficient Neural Architecture Search (ENAS) via Parameters Sharing(参数共享的高效神经网络结构搜索)》的实现。ENAS 减少了计算需求,将 NAS 的 GPU 计算时间减少了足足 1000 倍。他们通过共享大型计算图中的子图模型间的参数实现了这一点。

使用方法在 GitHub 上有详细介绍,下面是这个库所需的依赖项:

  • Python 3.6+

  • PyTorch

  • tqdm, imageio, graphviz, tqdm, tensorboardX

Sign Language(手势语言识别)

这是一个相对简单又十分有趣的机器学习项目。开发人员在 python 中使用卷积神经网络构造模型,可以识别出手势,并将其转换成文字。

作者用 Tensorflow 和 Keras 共同搭建了 CNN 模型。作者特别详细地说明了他是怎么创建这个项目的,以及每一步是怎么进行的。所以这绝对是一个值得一试的项目。

查看英文原文:

https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/

如果您觉得内容优质,记得给我们「留言」和「点赞」,给编辑鼓励一下!

登录查看更多
5

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
专知会员服务
171+阅读 · 2020年6月4日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
【新书】Python中的经典计算机科学问题,224页pdf
专知会员服务
144+阅读 · 2019年12月28日
【电子书推荐】Data Science with Python and Dask
专知会员服务
43+阅读 · 2019年6月1日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
6月份最热门的机器学习开源项目Top10
AI前线
8+阅读 · 2018年7月3日
3月份Github上最热门的数据科学和机器学习项目
大数据技术
7+阅读 · 2018年4月23日
3月份GitHub上最热门的开源项目
大数据技术
3+阅读 · 2018年4月10日
推荐 | 机器学习开源项目 Top 10
AI100
3+阅读 · 2018年3月21日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
GitHub最著名的20个Python机器学习项目!
THU数据派
6+阅读 · 2017年12月14日
GitHub最著名的20个Python机器学习项目
全球人工智能
9+阅读 · 2017年12月7日
资源 | GitHub上的五大开源机器学习项目
机器之心
9+阅读 · 2017年11月9日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Adversarial Metric Attack for Person Re-identification
Adversarial Reprogramming of Neural Networks
Arxiv
3+阅读 · 2018年6月28日
Arxiv
14+阅读 · 2018年5月15日
Arxiv
4+阅读 · 2018年4月30日
VIP会员
相关资讯
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
6月份最热门的机器学习开源项目Top10
AI前线
8+阅读 · 2018年7月3日
3月份Github上最热门的数据科学和机器学习项目
大数据技术
7+阅读 · 2018年4月23日
3月份GitHub上最热门的开源项目
大数据技术
3+阅读 · 2018年4月10日
推荐 | 机器学习开源项目 Top 10
AI100
3+阅读 · 2018年3月21日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
GitHub最著名的20个Python机器学习项目!
THU数据派
6+阅读 · 2017年12月14日
GitHub最著名的20个Python机器学习项目
全球人工智能
9+阅读 · 2017年12月7日
资源 | GitHub上的五大开源机器学习项目
机器之心
9+阅读 · 2017年11月9日
相关论文
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Adversarial Metric Attack for Person Re-identification
Adversarial Reprogramming of Neural Networks
Arxiv
3+阅读 · 2018年6月28日
Arxiv
14+阅读 · 2018年5月15日
Arxiv
4+阅读 · 2018年4月30日
Top
微信扫码咨询专知VIP会员