Apache软件基金会近日宣布Apache PredictionIO由Apache孵化器项目升级成为一个顶级项目。这则新闻标志着这个项目的发展迎来了一个重要的阶段。
Apache PredictionIO是一种开源机器学习平台,旨在帮助开发人员和数据科学家们创建预测引擎和服务,以执行机器学习任务。
Apache PredictionIO副总裁唐纳德•塞托(Donald Szeto)说:“PredictionIO成立之初旨在普及机器学习,为此通过模板来提供高度定制,并使用一整套Apache其他开源项目提供的成熟技术。很高兴看到这个项目经历了孵化阶段,日益壮大的用户和开发者社区提供了宝贵的反馈和贡献。我们为自己升级成为顶级项目而感兴奋,并期盼在社区的帮助下,继续实现该项目的目标。”
PredictionIO一开始就有自己的公司,其使命是简化开发机器学习技术的工作。2016年2月该公司被Salesforce收购,开源版本在去年夏天捐赠给了Apache软件基金会。
该项目的特点是,能够构建预测引擎,并将它作为Web服务来部署,实时响应动态查询,系统地评估和调整多个引擎变种,统一来自多个平台的数据,以及加快机器学习建模。
Salesforce的Einstein产品管理高级总监西蒙•陈(SimonChan)在一篇博文中写道:“Apache PredictionIO为开发人员提供了轻松创建端到端智能应用程序、大规模部署它们的整套架构,无需拼凑底层技术。”Einstein是Salesforce的另一种人工智能技术,致力于普及机器学习。
PredictionIO帮助开发人员更容易构建基于机器学习的应用软件,这归功于“模板库”(template gallery):模板库提供了诸多工具,比如分类、聚类、自然语言、推荐和回归等引擎。开发人员只要下载这些引擎就可以随意使用它们,因而节省大量时间。陈表示,有了PredictionIO,通常需要几个月来构建的推荐引擎在短短“几周”内就能构建完成。
据Apache软件基金会声称,PredictionIO已经用于ActionML、BizReach、LiftIQ和Pluralsight。
Apache软件基金会成员、Apache PredictionIO孵化导师苏尼尔•马蒂(Suneel Marthi)说:“确实很荣幸被邀请指导PredictionIO从孵化器项目成功地升级成为顶级项目。Apache PredictionIO这个平台填补了学术研究和机器学习即服务之间实现产品化之间的空白。本人长期以来就是涉及大规模分析的机器学习的从业人员,也是多年来Apache Mahout项目的提交者(committer),很高兴与PredictionIO团队合作,看到自己回到这个社区,帮助解决工作中使用PredictionIO时遇到的问题。”
PredictionIO捆绑有诸多工具,包括Apache Spark大数据处理框架、MLLib、Hbase和Elasticsearch及其他技术。它可以从GitHub(https://github.com/apache/incubator-predictionio)来下载。