《企业大数据应用体系从0到1》全方位系统性学习数据化运营,掌握一线实践技能

2018 年 1 月 10 日 炼数成金订阅号

随着人工智能的发展,越来越多的企业开始重视 建设大数据、在大数据基础之上构建数据应用、深度挖掘数据价值,进而解决实际业务问题,支撑和驱动公司发展。因此具备相关技能的优秀工程师也变得炙手可热。


该课程伴随着数据应用层次的逐步加深:从简单的数据查询、到OLAP数据分析以及更有深度挖掘、机器学习应用,由浅入深的介绍了在这个过程中必备的专业技术能力,包括技术的简单使用、原理剖析和较佳实践,同时兼具深度和广度,让大家对企业大数据价值运营有一个全方位、立体化的系统性学习。


课程大纲:

第一课:某企业级大数据应用服务架构演进

1)大数据在企业中的主要应用

2)业务快速迭代背景下对技术的挑战

3)企业级大数据应用服务整体介绍


第二课:大数据服务高可用设计原则

1)多维度切入高可用架构设计理念

2)可用性评价维度介绍

3)资源隔离保护核心服务

4)流量控制打造柔性可用系统

5)分钟级定位故障以及纠错方案

6)兜底以及回滚、降级减少故障恢复时间

7)常态化的故障演练机制以及容灾方案


第三课:基于MySQL集群构建可伸缩性存储层

1)数据量以及请求量对查询服务的冲击

2)可伸缩的应对上下游压力的实践

3)读写分离下MySQL的高可用设计


第四课:基于HBase的支撑百亿级别数据查询(1)

1)hbase入门

2)hbase简单操作

3)hbase架构详解(what and why)


第五课:基于hbase的支撑百亿级别数据查询(2)

1)hbase核心源码深度剖析

2)hbase优劣势以及技术选型

3)hbase企业级典型应用场景以及较佳实践


第六课:企业级大数据OLAP介绍

1)OLAP是什么以及常见操作

2)OLAP引擎技术方案选型


第七课:Kylin离线大数据OLAP引擎解决方案

1)Kylin介绍

2)海量数据较精确去重的实现

3)Kylin的优势以及局限

4)Apache Kylin的应用场景和较佳实践


第八课:Druid实时大数据分析引擎

1)Druid介绍

2)Druid原理深度剖析

3)Druid应用场景和较佳实践


第九课:大数据查询服务 统一SQL引擎层

1)为什么需要SQL接口层

2)SQL接口层的技术方案选型

3)基于apache calcite实现标准SQL查询


第十课:深度挖掘企业大数据价值

1)企业大数据指标体系以及管理策略

2)我们需要收集哪些数据

3)企业大数据应用的痛点

4)讨论一下机器学习的问题域

5)算法工程师们都在做些什么 


第十一课:机器学习算法入门

1)机器学习入门 — 什么是机器学习

2)线性回归算法由浅入深— 麻雀虽小、五脏俱全

3)手把手完成线性拟合数据集实战


第十二课:用户画像应用介绍

1)比你更了解你,浅谈用户画像

2)用户画像与个性化推荐系统领域

3)用户画像效果实时在线评估策略


第十三课:竞价广告系统点击率预测算法与实战

1)线性模型logistic回归算法介绍

2)基于线性模型logistic回归的点击率预测实战

3)非线性模型GBDT算法介绍

4)非线性模型GBDT与推荐排序

5)基于AUC值、ROC曲线的模型评价方法


第十四课:课程整体回顾及总结


授课时间:

课程预计2018年03月24日开课,预计课程持续时间为16周


授课对象:

对大数据感兴趣的同学以及从业者,掌握基本的统计学知识,有一些cs基础即可、。


收获预期: 

让学员对企业大数据价值转化由浅(数据查询、数据分析)入深(深度挖掘数据价值)的技术以及原理有一个全方位、立体化的系统性学习。


讲师介绍:

刘老师

某大型互联网公司技术专家,长期在BAT、TMD等互联网公司担任研发工作,积累了宝贵的经验。 


点击下方二维码或阅读原文报名课程:


登录查看更多
0

相关内容

HBase 全称是 Hadoop Database,是开源的高可靠性、高性能、可伸缩的分布式数据库系统,利用 HBase 技术建立大规模结构化存储集群。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
36+阅读 · 2020年4月26日
专知会员服务
123+阅读 · 2020年3月26日
【2020新书】Kafka实战:Kafka in Action,209页pdf
专知会员服务
67+阅读 · 2020年3月9日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
【数字化】制造业数字化转型的实战路线图
产业智能官
39+阅读 · 2019年9月10日
40张PPT,帮你轻松入门Spark大数据!BAT架构师制作!
七月在线实验室
19+阅读 · 2019年5月27日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
每个架构师都应该培养业务思维
InfoQ
3+阅读 · 2019年4月21日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Arxiv
101+阅读 · 2020年3月4日
Geometric Graph Convolutional Neural Networks
Arxiv
10+阅读 · 2019年9月11日
Revealing the Dark Secrets of BERT
Arxiv
4+阅读 · 2019年9月11日
Self-Attention Graph Pooling
Arxiv
5+阅读 · 2019年4月17日
Arxiv
12+阅读 · 2019年1月24日
VIP会员
相关资讯
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
【数字化】制造业数字化转型的实战路线图
产业智能官
39+阅读 · 2019年9月10日
40张PPT,帮你轻松入门Spark大数据!BAT架构师制作!
七月在线实验室
19+阅读 · 2019年5月27日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
每个架构师都应该培养业务思维
InfoQ
3+阅读 · 2019年4月21日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
相关论文
Arxiv
101+阅读 · 2020年3月4日
Geometric Graph Convolutional Neural Networks
Arxiv
10+阅读 · 2019年9月11日
Revealing the Dark Secrets of BERT
Arxiv
4+阅读 · 2019年9月11日
Self-Attention Graph Pooling
Arxiv
5+阅读 · 2019年4月17日
Arxiv
12+阅读 · 2019年1月24日
Top
微信扫码咨询专知VIP会员