机器学习工具简介

机器学习工具简介

机器学习工具简介

目前有许多实现机器(深度)学习算法的平台,国外有Tensorflow, pytorch等,国内有百度的飞桨PaddlePaddle。很多专注于机器学习的项目(Shogun,Keras,scikit-learn,Pattern,Theano等), 不同的机器学习平台各有优劣。然而对于非人工智能专业或很少学编程但又需要使用机器学习算法做一些研究的同学来说直接使用这些平台可能具有较大的学习成本。当然,很多软件中如spss也集成了部分机器学习算法。这里主要汇总了几种对编程要求较低,但又能使用机器学习做一些数据挖掘小问题的机器学习平台。

(1)Weka

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。Weka的主要特点是将目前许多现有的机器学习算法进行包装,可以通过界面操作。可参考书籍《数据挖掘与机器学习——WEKA应用技术与实践》(不是打广告哦)。另外,Weka还可以做深度学习,deeplearning4j。具体教程后期会在博客中编写或转载一些现有的教程。

下载地址:cs.waikato.ac.nz/ml/wek

(2)Matlab 机器学习工具箱

Matlab应用在方方面面。许多机器学习算法均可通过Matlab编程实现,同时,matlab的App里面也集成了机器学习和深度学习方面的工具箱,包括分类,回归,聚类,神经网络,搭建深度神经网络。Matlab里面的机器学习算法种类是比不上Weka鸟的,当然还是首先推荐Weka。

(3)R 的Rattle可视化包

Rattle包是集成在R中的一种通过界面(GUI)操作的机器学习工具,R语言是数据统计分析和图像可视化的优秀语言。rattle包里还提供了非常多的统计量,可以说包括了数据的整理和后续的模型评价。另外,rattle也可以创建一些非常基础的面积图,折线图啊,箱线图啊,直方图等等。当然Rattle的一个不足是集成的机器学习算法比较少。除Rattle外,在R语言中通过简单的代码也可以实现轻松实现机器学习小算法的调用。

(4)SPSS

这个是作为学生可能都会了解的一个统计工具,里面集成有Logistic,ANN等经典的机器学习算法。

(5)Python:scikit-learn

这里可能需要一点点编程的知识,没有接触过编程也不要害怕,学一些基本的python语法相信肯定是没问题的,说不定你还会喜欢上python哦。毕竟软件能实现的功能,代码都可以实现,并且更为灵活。python中的scikit-learn就是常用的机器学习工具包之一,scikit-learn对许多机器学习算法进行了包装,可通过几行代码直接调用。

(6)其他

除了上面介绍的几种,还有许多数据挖掘的可视化工具,包括Rapid Miner,Oracle Data Mining,Teradata,Framed Data,KNIME,Orange,SAS Data Mining,Apache Mahout,PSPP, Tanagra,NLTK等。

(7)一些好的机器学习开源项目

在GitHub上有个“大索引”awesome(小星星10万+)汇集了许许多多的资源,当然也包括机器学习汇总。

https://github.com/josephmisiti/awesome-machine-learning

在GitHub上有太多优秀的学习资源,宝藏等待大家挖掘。推荐大家学习。

参考:

  1. zhihu.com/question/2047
  2. cnblogs.com/aibabel/p/9
  3. blog.csdn.net/toky_min/
  4. zhuanlan.zhihu.com/p/32
  5. zhuanlan.zhihu.com/p/60
发布于 2020-03-29 09:05