从一开始就创建良好的数据,而不是在收集数据之后修复它。通过遵循这本书中的指导方针,你将能够进行更有效的分析,并产生研究数据的及时演示。

数据分析师通常与数据集提出了勘探和研究设计不良,导致解释的困难和延误产生有意义的结果。数据分析培训的重点是如何在开始认真分析之前清理和转换数据集。通过使用良好的数据集设计和理解数据类型如何决定可以执行的分析类型,可以避免不恰当或令人困惑的表示、度量单位选择、编码错误、缺失值、离群值等。

这本书讨论了数据集创建的原则和最佳实践,并涵盖了基本数据类型及其相关的适当统计和可视化。这本书的一个重点是为什么选择某些数据类型来表示概念和度量,而不是典型的讨论如何分析选定的特定数据类型。

你会: 注意创建和收集数据的原则 了解基本数据类型和表示 选择数据类型,预测分析目标 理解数据集的结构和用于分析和共享的实践 由例子引导和用例(好的和坏的) 使用清洁工具和方法创建良好的数据

成为VIP会员查看完整内容
81

相关内容

学习编程,数据结构是基础中的基础。
【干货书】管理统计和数据科学原理,678页pdf
专知会员服务
176+阅读 · 2020年7月29日
【2020新书】实战R语言4,323页pdf
专知会员服务
98+阅读 · 2020年7月1日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
85+阅读 · 2020年6月28日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
255+阅读 · 2020年6月10日
专知会员服务
165+阅读 · 2020年6月4日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
【经典书】数据结构与算法C++,第二版,738页pdf
专知会员服务
165+阅读 · 2020年3月27日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
189+阅读 · 2020年3月12日
PySpark和大数据处理初探
Python程序员
7+阅读 · 2019年10月10日
图数据表示学习综述论文
专知
52+阅读 · 2019年6月10日
421页《机器学习数学基础》最新2019版PDF下载
【入门】数据分析六部曲
36大数据
17+阅读 · 2017年12月6日
Arxiv
6+阅读 · 2019年7月11日
Arxiv
4+阅读 · 2019年4月17日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
72+阅读 · 2018年12月22日
Arxiv
21+阅读 · 2018年8月30日
VIP会员
相关VIP内容
【干货书】管理统计和数据科学原理,678页pdf
专知会员服务
176+阅读 · 2020年7月29日
【2020新书】实战R语言4,323页pdf
专知会员服务
98+阅读 · 2020年7月1日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
85+阅读 · 2020年6月28日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
255+阅读 · 2020年6月10日
专知会员服务
165+阅读 · 2020年6月4日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
【经典书】数据结构与算法C++,第二版,738页pdf
专知会员服务
165+阅读 · 2020年3月27日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
189+阅读 · 2020年3月12日
微信扫码咨询专知VIP会员