动漫美少女生成神器、猫的门禁...2019 年十七大最佳机器学习项目 | 年度盘点

2019 年 12 月 28 日 CSDN

者 |  Derrick Mwiti

译者 | Raku

出品 | AI科技大本营(ID:rgznai100)

为了筛选2019年一些令人惊叹的机器学习项目。根据reddit上机器学习类目中的内容,作者盘点了过去一年中最受欢迎的17个机器学习项目、研究论文、demo。希望你能在这个列表中获得一些鼓舞人心的、有教育意义的启发。

1、小样本非监督图像转换模型

从人类的能力中获得灵感,从少量的例子中提取新事物的本质,并从中进行归纳,作者寻求的是一种小样本、无监督的图像到图像的转换算法,该算法适用于在测试时仅通过一些示例图像指定的、以前未见过的目标类。

论文链接:

https://arxiv.org/abs/1905.01723

“我们的模型通过将对抗训练方案与新颖的网络设计相结合实现了这一能力。通过对基准数据集上几种基线方法的大量实验验证和比较,我们验证了该框架的有效性。

相关链接:

https://youtu.be/kgPAqsC8PLM

GitHub链接:

https://github.com/NVlabs/FUNIT

2、分解潜空间(latent space)生成自定义动漫少女

作者提出了一种能够绘制动画的人工神经网络。

相关链接:https://waifulabs.com/

The Waifu实验室的自动贩卖机(Vending Machine)允许你选择喜欢的角色,基于此,你可以生成你可能喜欢的动画。

3、机器学习最大数据集列表

在这里,作者整理了一个机器学习数据集的列表,可以用于机器学习实验。

相关链接:https://www.datasetlist.com/

这种资源肯定可以减少在线查找数据集所需的工作时间。数据集按各种任务/领域进行细分,包括计算机视觉、自然语言处理、自动驾驶、问答系统、音频和医疗。你还可以按license type排序。

4、数据集:480000个NLP烂番茄(Rotten Tomatoes)评价,标记为好/不好

(ps:烂番茄是一个以提供电影、电子游戏及电视节目的相关评论、资讯和新闻为主的网站。

作者从网上搜罗了烂番茄的评论,这些评论在自然语言处理任务中非常有用。

GitHub链接:

https://github.com/nicolas-gervais/6-607-Algorithms-for-Big-Data-Analysis/blob/master/scraping%20all%20critic%20reviews%20from%20rotten%20tomatoes

该数据集可在Google云端硬盘上找到。

相关链接:

https://drive.google.com/file/d/1N8WCMci_jpDHwCVgSED-B9yts-q9_Bb5/view

5、猫的门禁:使用ML创建猫门,当猫嘴里有猎物时会自动锁定

这篇文章是关于一个使用机器学习创建的猫门。

相关链接:

https://youtu.be/1A-Nf3QIJjM

作者制作了一扇猫门,如果猫嘴里有东西,门就会自动锁上15分钟,这使得猫无法把死动物带到房子里。他将摄像机连接到猫门上,然后用机器学习检查猫嘴里是否有东西。

6、Neural Point-Based Graphics

作者提出了一种新的基于点的复杂场景建模方法,使用原始点云作为场景的几何表示。

在本文中,研究者提出了一种新的基于点的复杂场景建模方法。该方法使用原始点云作为场景的几何表征,并且利用能够编码局部几何结构和外观的可学习神经描述符来增大每个点。

相关链接:

https://youtu.be/7s3BYGok7wU

深度渲染网络与描述符同时进行学习,这样从新视点将点云的光栅部分穿过这个网络,从而获得场景的新视图。研究表明,这种新方法可用于建模复杂场景、得到这些场景的逼真视图,同时能够避免显式表面估计和网格化。具体来讲,使用手持商用 RGB-D 传感器和标准 RGB 摄像头可以在场景扫描任务中获得令人信服的结果。

论文链接:

https://arxiv.org/abs/1906.08240

7、AdaBound

AdaBound是一个优化器,旨在看不见的数据上有更快的训练速度和性能。它的训练速度和Adam一样快,和SGD一样好(ICLR 2019),有一个现成的PyTorch实现。其提出者是来自中国高校的大四学生。

GitHub链接:

https://github.com/Luolc/AdaBound

在模型训练开始时,AdaBound的行为类似于Adam,并在结束时转换为SGD。

相关链接:https://www.luolc.com/publications/adabound/

8、Pluribus:首个在6人扑克中击败职业玩家的AI

来自Facebook Research上的帖子:“ Pluribus是第一款能够以六人无限注德州扑克打败人类专家的AI机器人,德州扑克是世界上使用最广泛的扑克形式。而且,这是AI机器人第一次在超过两个或两个团队的复杂游戏中击败顶级人类玩家。

“ Pluribus之所以成功,是因为它可以非常有效地处理具有隐藏信息的两名以上玩家的游戏挑战,它使用自我玩法来教自己如何取胜,没有任何示例或策略指导。

相关链接:https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker/

9、各种ML模型的NumPy实现

numpy-ml是越来越多的专门用NumPy和Python标准库编写的机器学习模型、算法和工具的集合。”

GitHub链接:

https://github.com/ddbourgin/numpy-ml

下面给出模型的可用代码链接:

https://github.com/ddbourgin/numpy-ml/blob/master/numpy_ml/README.md

10、17种Deep RL算法的PyTorch实现

作者策划了17种深度强化学习算法的PyTorch实现。

GitHub链接:https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch

其中的一些实现包括DQN,DQN-HER,Double DQN,REINFORCE,DDPG,DDPG-HER,PPO,SAC,离散SAC,A3C,A2C。

11、100万可供下载的AI生成假脸

作者使用NVIDIA的StyleGAN生成了100万张面孔。

相关链接:

https://archive.org/details/1mFakeFaces

如你所见,这些图像看起来与真实人物完全一样。

链接:

https://youtu.be/_kk4Zv1ysgU

12、教神经网络驾驶赛车

教神经网络驾驶赛车。这是一个简单的网络,具有固定数量的隐藏节点(没有NEAT),并且没有偏差。然而,经过短短几代人的努力,它成功地使汽车快速、安全地行驶。

相关链接:

https://youtu.be/wL7tSgUpy8w 

“人口为650,该网络通过随机突变发展,拟合评估目前是手动完成的。

13、m2cgen:一个简单的库,将ML模型转换为本地代码(Python / C / Java)

m2cgen(模型2代码生成器)—是一个轻量级的库,它提供了一种简便的方法来将经过训练的统计模型转换为本地代码(Python,C,Java,Go,JavaScript,Visual Basic,C#)。

GitHub链接:

https://github.com/BayesWitnesses/m2cgen/

当前支持的模型如下:

14、探索神经网络的损失情况

摘自作者的帖子:“该帖子是关于在神经网络的损失面中找到不同的模式。通常,围绕最小值的场景看起来像是一个坑,周围是随机的丘陵和山脉,但是存在着更有意义的坑,如下图所示。

GitHub链接:

https://github.com/universome/loss-patterns

“我们发现你几乎可以找到自己喜欢的任何landscape的最小值。有趣的是,找到的横向模式即使对于测试集也仍然有效,即,它具有一种很可能对于整个数据分布仍然有效的属性。

论文链接:

https://arxiv.org/abs/1910.03867

15、基于GPT-2的Reddit Bot

作者构建了一个由OpenAI的GPT-2驱动的Reddit机器人。

GitHub链接:

https://github.com/openai/gpt-2

可以通过回复任何带有“ gpt-2完成此操作”的评论来使用该机器人。

GitHub链接:

https://github.com/shevisjohnson/gpt-2_bot 

16、Super SloMo:一个可以将任何视频转换为慢动作视频的CNN

作者在PyTorch中实现了论文:

https://people.cs.umass.edu/~hzjiang/projects/superslomo/

GitHub链接:

https://github.com/avinashpaliwal/Super-SloMo

17、NLP的预训练模型库:Bert,GPT,GPT-2,Transformer-XL,XLNet,XLM

这是用于NLP的预训练transformer模型的开源库。它具有六种架构:

  • Google’s BERT

  • OpenAI’s GPT & GPT-2

  • Google/CMU’s Transformer-XL & XLNet

  • Facebook’s XLM

GitHub链接:

https://github.com/huggingface/transformers 

该库为这些架构提供了27种预训练的模型权重。

原文链接: 

https://heartbeat.fritz.ai/best-of-machine-learning-in-2019-reddit-edition-5fbb676a808 

【End】
北邮教授为你揭秘5G的发展历程、内在规律,并重点阐述新技术在数字经济时代的作用以及对我们每个人的影响,5G时代你绝不能错过的干货课程,立即免费报名!

热 文 推 荐 

☞华为回应关于“获政府巨额补贴”报道;最高法:微信微博聊天记录可作为证据;GoLand 2020.1 路线图公布 | 极客头条

☞大厂押注“极速版”

互联网,请别再说谎!

OPPO  物联网开放之路

人工智能尴尬的2019:需要钱却没钱可烧了

不要让 Chrome 成为下一个 IE!

量子通信,到底是什么工作原理?

这三名男子靠开加密矿池获得7.22 亿美元,却不兑现收益拿去奢侈挥霍……

点击阅读原文,即刻参加!

你点的每个“在看”,我都认真当成了喜欢


登录查看更多
0

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
80+阅读 · 2020年5月5日
【资源】100+本免费数据科学书
专知会员服务
105+阅读 · 2020年3月17日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
干货 | Github项目推荐 : GANSynth: 用GANs创作音乐
AI科技评论
9+阅读 · 2019年3月2日
项目 | 基于GAN的人脸照片涂鸦编辑
机器学习算法与Python学习
5+阅读 · 2019年3月1日
2019年度机器学习49个顶级工程汇总
专知
5+阅读 · 2019年2月6日
拆台BigGan:“失败”图像生成集锦
论智
5+阅读 · 2018年11月19日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
Generating Fact Checking Explanations
Arxiv
9+阅读 · 2020年4月13日
Arxiv
8+阅读 · 2019年3月28日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
4+阅读 · 2018年4月17日
Arxiv
10+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年1月31日
VIP会员
相关资讯
干货 | Github项目推荐 : GANSynth: 用GANs创作音乐
AI科技评论
9+阅读 · 2019年3月2日
项目 | 基于GAN的人脸照片涂鸦编辑
机器学习算法与Python学习
5+阅读 · 2019年3月1日
2019年度机器学习49个顶级工程汇总
专知
5+阅读 · 2019年2月6日
拆台BigGan:“失败”图像生成集锦
论智
5+阅读 · 2018年11月19日
10月机器学习开源项目Top10
机器学习算法与Python学习
3+阅读 · 2018年10月30日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
相关论文
Generating Fact Checking Explanations
Arxiv
9+阅读 · 2020年4月13日
Arxiv
8+阅读 · 2019年3月28日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
4+阅读 · 2018年4月17日
Arxiv
10+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年1月31日
Top
微信扫码咨询专知VIP会员