对很多人来说,“机器学习”这个词既让人倍感兴奋,又觉得高深莫测。毕竟,几乎所有巨头——从国外的Google、Facebook、Apple、Amazon到国内的BAT、华为、美团、今日头条等,都在争相进军这一领域。机器学习技术也渗入到生活的方方面面,从新闻资讯应用里推送的文章,逛淘宝时的物品推荐到无人驾驶汽车等,无一不用到机器学习技术。
对机器学习感兴趣的人也日益增加,很多工程师正在考虑一个机器学习工程师的职业生涯问题。想要成为机器学习工程师,那你需要具备以下技能:计算机基础和编程、概率统计、数据建模和评估、应用机器算法和库、软件工程和系统设计等知识,其中数据分析、建模和评估方面的技能至关重要,毕竟大数据和机器学习有着不可切割的关系。
/
大数据和机器学习
/
在大数据领域中,机器学习几乎无处不在,即便我们没有特意引用它们,它们也经常出现在大数据应用中,例如:搜索、推荐、预测和数据挖掘等。随着互联网的高速发展,数据量不断爆发式增长,数据维度越来越丰富,这也为机器学习的发展和应用提供了良好的土壤,机器学习的良好成果也反向让数据产生更大的价值,成为真正的“大数据”,两者相辅相成,相互促进,让数据越来越智能。
随着大数据技术的发展以及数据产品的应用和推广,尤其是在工业和互联网领域,企业使用机器学习来提升收入或是降低成本的方式愈加有效。这其中,预防欺诈、定位电子广告的目标客户、内容推荐、建造更好的汽车、瞄准更好的潜在市场、优化媒体改善医疗保障服务等都证明大数据机器学习的多功能性和广泛的适用性。
大家都知道,机器学习技术不仅包含高深的理论算法模型以及对数据的合理利用,同时也离不开全面的工程技术支持。 我们邀请的国内一线互联网技术专家们,也将通过各自在不同领域的实践分享,向大家展示如何利用【机器学习实践】和【大数据实时计算】技术的融合来引领业务发展的,并引领大家走上成为机器学习工程师之路。
/
深 度 培 训
/
>> 机器学习实践
本课程尝试从工程的角度阐述如何在实际的工业问题中利用数据、收集数据、训练模型进而改善实际 的业务问题。听众不仅能学习到如何使用机器学习的方法去建立预测模型,也能了解到对于不同的业务问题如何选取具体的算法,还可以学习到如何从无到有构建产品环境的机器学习应用。
本课程的另一大特色是通过一个信用卡申请的业务问题开始,配合丰富的实验且结合实 际场景中的数据收集、特征处理、模型构建以及模型部署的整个过程。通过具体案例和实验 练习教会用户在实际业务中如何使用机器学习的构建方法。围绕各个环节,介绍和讲授如何构建机器学习系统、管道和整个机器学习的平台。
讲师介绍:
张彭善,具有非常深厚的机器学习、数学、统计学功底,长期在互联网公司从事机器学习、大数据的相关研发工作,具备丰富的应用机器学习到工业场景的经验。最近五年讲师一直在第三方支付公司的风控部门从事反欺诈的工作,不仅实际工作中应用各种机器学习模型到反 欺诈的场景,提高和保障公司的支付产品正常的运转;并且基于实际经验构建基于大数据的 机器学习的管道,结合线上系统的要求构建高可用可扩展的机器学习线上系统。对于实际应用中如何使用机器学习,如何使用各种机器学习的方法和数据处理的方式,如何部署实际的 机器学习模型以及如何优化机器学习的问题有着非常深入的理解和经验。
课程收益:
1. 了解机器学习和数据科学
2. 如何对业务问题进行数学建模
3. 如何收集数据、设计特征进行机器学习
4. 学习各种机器学习的算法解决实际问题并了解其应用场景
5. 如何部署模型上线,如何开发具备产品强度的数据模型服务
6. 如何评估机器学习模型的作用以及如何补足机器学习模型的缺点
>> 大数据实时计算
提高计算的时效性,更快的从数据中挖掘出信息和知识就意味着能够获取更大的价值。在实时计算领域,Apache Storm、Samza、Spark Streaming、Kafka Stream、Flink 等开源流式计算引擎层出不穷,呈现百家争鸣之势。本次培训中,我们将以典型的实时处理框架为例,分享相关背景、架构设计与应用。
讲师介绍:
翟佳 毕业于中科院计算所,目前就职于一家下一代实时处理初创公司 Streamlio,是 streamlio 的核心创始成员之一。在此之前任职于 EMC,是北京 EMC 实时处理平台的技术负责人。主要从事实时计算和分布式存储系统的相关开发,此外也在开源项目 Apache BookKeeper, Distributedlog,DC/OS 等项目中持续贡献代码。
郭斯杰 下一代实时处理初创公司Streamlio的联合创始人。之前就职于Twitter,任职Staff Software Engineer,是Twitter message group的技术负责人。同时也是Apache BookKeeper的PMC Chair, Apache DistributedLog的Co-Creator。加入Twitter之前,就职于Yahoo
课程收益:
1、了解流计算及其架构的历史,发展和典型应用,理解不同流计算平台的特性和优缺点
2、理解Messaging处理机制并能使用Pulsar进行messaging处理
3、理解Heron的基本架构并能使用Heron进行实时处理
4、理解Apache BookKeeper/DistributedLog特性并能使用它们进行实时数据的存取
5、能够便捷地搭建一套高性能切实可用的实时处理系统
6、了解分布式系统和实时处理系统设计中常见问题、难点和处理策略
/
预约学习席位
/