新智元报道
过去一年,是人工智能和机器学习蓬勃发展的一年。许多高影响力的机器学习应用被开发出来,特别是在医疗保健、金融、语音识别、增强现实以及更复杂的3D和视频应用中。
我们已经看到了更多的应用驱动研究,而不是理论研究。虽然这些研究有着一些不足,但当前的确产生了巨大的积极影响,也促成了很多可以迅速商业化的新研发。这一趋势也在机器学习的大部分开源项目中得到了强烈反映。
让我们来看看过去一年中前6大最实用的机器学习项目。这些项目发布了代码和数据集,允许个别开发人员和小型团队学习并能实现立即创造价值。它们可能不是理论上最具开创性的作品,但却非常适用且实用。
Github链接:
https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
项目链接:https://docs.fast.ai/
Fast.ai库的编写是为了简化训练快速准确的神经网络。它去掉了在实践中实施深度神经网络可能带来的所有细节工作。
Fast.ai非常易于使用,并且设计成符合开发者的应用程序来构建思维模式。最初这个开源项目是为Fast.ai课程的学生创建的,该库以简洁易懂的方式编写在易于使用的Pytorch库上。
github链接:
https://github.com/facebookresearch/Detectron?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Detectron是Facebook AI用于物体检测和实例分割研究所创建的研究平台,用Caffe2进行编写。它包含各种目标检测算法的实现,包括:
Mask R-CNN::使用更快的R-CNN结构的目标检测和实例分割;
RetinaNet:一个基于特征金字塔的网络,具有独特的Focal Loss来处理难题;
更快的R-CNN:目标检测网络最常见的结构
所有网络都可以使用以下几种可选的分类主干之一:
ResNeXt {50101152}(https://arxiv.org/abs/1611.05431)
RESNET {50101152}(https://arxiv.org/abs/1512.03385)
特征金字塔网络(使用ResNet / ResNeXt)(https://arxiv.org/abs/1612.03144)
VGG16(https://arxiv.org/abs/1409.1556)
更重要的是,以上都带有COCO数据集上的预训练模型,因此开发者可以立即使用它们。
github链接:https://github.com/facebookresearch/fastText
这是来自Facebook的另一个研究,fastText库专为文本表述和分类而设计。它配备了预先训练的150多种语言的词向量模型。这些词向量可用于多种任务,包括文本分类、摘要和翻译。
GitHub链接:
https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Auto-Keras是一个用于自动机器学习(AutoML)的开源软件库。它由德克萨斯州农工(Texas A&M)大学的DATA实验室和社区贡献者开发。
AutoML的最终目标是为只有有限数据科学或机器学习背景的领域专家提供易于访问的深度学习工具。Auto-Keras提供自动搜索深度学习模型的最佳架构和超参数的功能。
GitHub链接:
https://github.com/google/dopamine?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Dopamine由谷歌创建,是快速原型的强化学习算法的研究框架。它旨在灵活且易于使用,实现标准的RL算法、指标和基准。
根据Dopamine的文档,他们的设计原则是:
简单的实验:帮助新用户运行基准实验;
灵活的开发:为新用户提供新的创新想法;
紧凑且可靠:为一些较旧且更流行的算法提供实现的可能性;
可重复性:确保结果的可重复性。
GitHub链接:
https://github.com/NVIDIA/vid2vid?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
vid2vid项目是英伟达(Nvidia)最先进的视频到视频的合成算法。Pytorch实现了高分辨率(例如2048x1024)逼真的视频到视频转换方法。这一项目的目标是学习从输入源视频到精确描绘源视频内容的输出拟真视频的变换功能。
这个库的好处在于其选择多样性:它提供了几种不同的vid2vid应用程序,包括自动驾驶/城市场景,人脸和人体姿势。它还附带了丰富的指令和功能,包括数据集加载、任务评估、训练功能和多块GPU。
参考链接:
https://towardsdatascience.com/the-10-most-useful-machine-learning-projects-of-the-past-year-2018-5378bbd4919f
【加入社群】
新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号:aiera2015_2 入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。