大数据分析研究组开源了Easy Machine Learning系统,其通过交互式图形化界面让机器学习应用开发变得简单快捷,系统集成了数据处理、模型训练、性能评估、结果复用、任务克隆、ETL等多种功能,此外系统中还提供了丰富的应用案例以及基于Docker的分布式运行环境,欢迎大家下载试用。
Github: https://github.com/ICT-BDA/EasyML
在线服务: http://159.226.40.104:18080/dev/
系统将机器学习应用任务抽象为有向无环数据流图,通过图节点处理数据,边引导数据的进一步流向,从而实现机器学习复杂流程的建模和操作。系统的主要功能包括:
资源管理。用户可通过网页界面对数据、程序和示例任务进行管理,支持用户上传/下载第三方的程序和数据。
图1:系统主界面和资源管理功能。
任务创建。用户可通过拖拽式交互界面构建数据流图、设置程序参数等,用户也可基于现有任务模板克隆任务并编辑,实现任务流程的快速构建。
图2:选择程序与设置参数。
任务监控。用户可实时查看已提交任务的执行状态、中间结果以及错误信息等。
图3:实时查看任务的运行状态。
图4:查看程序执行过程中的输出内容。
结果复用。用户可对已有的任务和结果进行重用,系统可自动识别已成功运行的节点并直接复用其历史结果,避免了不必要的计算开销提升运行效率。
图5:复用已有任务的执行结果。