随着人工智能的发展,越来越多的企业开始重视 建设大数据、在大数据基础之上构建数据应用、深度挖掘数据价值,进而解决实际业务问题,支撑和驱动公司发展。因此具备相关技能的优秀工程师也变得炙手可热。
该课程伴随着数据应用层次的逐步加深:从简单的数据查询、到OLAP数据分析以及更有深度挖掘、机器学习应用,由浅入深的介绍了在这个过程中必备的专业技术能力,包括技术的简单使用、原理剖析和较佳实践,同时兼具深度和广度,让大家对企业大数据价值运营有一个全方位、立体化的系统性学习。
课程大纲:
第一课:某企业级大数据应用服务架构演进
1)大数据在企业中的主要应用
2)业务快速迭代背景下对技术的挑战
3)企业级大数据应用服务整体介绍
第二课:大数据服务高可用设计原则
1)多维度切入高可用架构设计理念
2)可用性评价维度介绍
3)资源隔离保护核心服务
4)流量控制打造柔性可用系统
5)分钟级定位故障以及纠错方案
6)兜底以及回滚、降级减少故障恢复时间
7)常态化的故障演练机制以及容灾方案
第三课:基于MySQL集群构建可伸缩性存储层
1)数据量以及请求量对查询服务的冲击
2)可伸缩的应对上下游压力的实践
3)读写分离下MySQL的高可用设计
第四课:基于HBase的支撑百亿级别数据查询(1)
1)hbase入门
2)hbase简单操作
3)hbase架构详解(what and why)
第五课:基于hbase的支撑百亿级别数据查询(2)
1)hbase核心源码深度剖析
2)hbase优劣势以及技术选型
3)hbase企业级典型应用场景以及较佳实践
第六课:企业级大数据OLAP介绍
1)OLAP是什么以及常见操作
2)OLAP引擎技术方案选型
第七课:Kylin离线大数据OLAP引擎解决方案
1)Kylin介绍
2)海量数据较精确去重的实现
3)Kylin的优势以及局限
4)Apache Kylin的应用场景和较佳实践
第八课:Druid实时大数据分析引擎
1)Druid介绍
2)Druid原理深度剖析
3)Druid应用场景和较佳实践
第九课:大数据查询服务 统一SQL引擎层
1)为什么需要SQL接口层
2)SQL接口层的技术方案选型
3)基于apache calcite实现标准SQL查询
第十课:深度挖掘企业大数据价值
1)企业大数据指标体系以及管理策略
2)我们需要收集哪些数据
3)企业大数据应用的痛点
4)讨论一下机器学习的问题域
5)算法工程师们都在做些什么
第十一课:机器学习算法入门
1)机器学习入门 — 什么是机器学习
2)线性回归算法由浅入深— 麻雀虽小、五脏俱全
3)手把手完成线性拟合数据集实战
第十二课:用户画像应用介绍
1)比你更了解你,浅谈用户画像
2)用户画像与个性化推荐系统领域
3)用户画像效果实时在线评估策略
第十三课:竞价广告系统点击率预测算法与实战
1)线性模型logistic回归算法介绍
2)基于线性模型logistic回归的点击率预测实战
3)非线性模型GBDT算法介绍
4)非线性模型GBDT与推荐排序
5)基于AUC值、ROC曲线的模型评价方法
第十四课:课程整体回顾及总结
授课时间:
课程预计2018年03月24日开课,预计课程持续时间为16周
授课对象:
对大数据感兴趣的同学以及从业者,掌握基本的统计学知识,有一些cs基础即可、。
收获预期:
让学员对企业大数据价值转化由浅(数据查询、数据分析)入深(深度挖掘数据价值)的技术以及原理有一个全方位、立体化的系统性学习。
讲师介绍:
刘老师
某大型互联网公司技术专家,长期在BAT、TMD等互联网公司担任研发工作,积累了宝贵的经验。
点击下方二维码或阅读原文报名课程: