获得干净的数据来获取见解是至关重要的,因为不进行适当的数据清理就直接进行数据分析可能会导致错误的结果。本书向您展示了使用Python清理和处理数据的工具和技术。首先,您将通过使用大多数数据源来熟悉数据的状况。然后,这本书教你如何使用数据,使其变成有用的形式。您还将学习如何过滤和总结数据,以获得深刻的见解,更好地理解什么是有意义的,什么是没有意义的,同时还将发现如何对数据进行操作,以解决您发现的问题。

接下来,您将学习关键任务,如处理缺失值、验证错误、删除重复数据、监控大量数据以及处理异常值和无效日期。接下来,您将介绍如何使用监督学习和朴素贝叶斯分析来识别意外值和分类错误,并为探索性数据分析(EDA)生成可视化来可视化意外值。最后,您将构建在有新数据时无需修改即可重用的函数和类。

读完这本Python书,您将掌握清理数据和诊断其中问题所需的所有关键技能。

这本书涵盖了以下激动人心的特点: 了解如何从各种来源读取和分析数据 生成数据帧、列和行属性的摘要 过滤数据并选择满足给定条件的感兴趣的列 处理杂乱的数据问题,包括处理日期和缺失的值 通过使用方法链接来提高Python pandas 的工作效率 使用可视化来获得额外的见解并识别潜在的数据问题 增强您了解数据中正在发生什么的能力 构建用户定义的函数和类来自动化数据清理

成为VIP会员查看完整内容
69

相关内容

【2020新书】数据结构与数据表示指南,112页pdf
专知会员服务
81+阅读 · 2020年10月6日
【2020新书】实战R语言4,323页pdf
专知会员服务
98+阅读 · 2020年7月1日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
专知会员服务
165+阅读 · 2020年6月4日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
115+阅读 · 2020年5月10日
算法与数据结构Python,369页pdf
专知会员服务
160+阅读 · 2020年3月4日
流畅的Python, 751页pdf
专知
4+阅读 · 2020年8月3日
Python数据分析案例实战
炼数成金订阅号
5+阅读 · 2019年5月9日
【入门】数据分析六部曲
36大数据
17+阅读 · 2017年12月6日
python数据分析师面试题选
数据挖掘入门与实战
6+阅读 · 2017年11月21日
Arxiv
0+阅读 · 2021年10月13日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
5+阅读 · 2018年3月28日
Arxiv
5+阅读 · 2017年7月23日
VIP会员
相关VIP内容
【2020新书】数据结构与数据表示指南,112页pdf
专知会员服务
81+阅读 · 2020年10月6日
【2020新书】实战R语言4,323页pdf
专知会员服务
98+阅读 · 2020年7月1日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
专知会员服务
165+阅读 · 2020年6月4日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
115+阅读 · 2020年5月10日
算法与数据结构Python,369页pdf
专知会员服务
160+阅读 · 2020年3月4日
微信扫码咨询专知VIP会员