1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源

2020 年 7 月 5 日 量子位
萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI

你是否也在朋友圈看过这样的小广告:

「你要悄悄学Python,然后惊艳所有人。」

现在,GitHub上一位博主告诉你:不用学,用sweetviz就行。

这是一个基于Python编写的数据分析软件,只要掌握3种函数用法,一行Python代码就能实现数据集可视化、分析与比较

我们以Titanic数据集为例,输入一行代码:

一个1080p的清晰网页界面就出现在了眼前。

不仅根据性别、年龄等不同栏目纵向分析数据,每个栏目下还有众数、最大值、最小值等横向对比。

所有输入的数值、文本信息都会被自动检测,并进行数据分析、可视化和对比,最后帮你进行数据总结。

在这样的数据分析下,结果一目了然。

Titanic数据集部分功能细节展示

这样的效果,是基于3个主函数实现的。

3种函数用法

analyze()丨数据分析

数据分析函数中,有4个参数source,target_feat,feat_cfg和pairwise_analysis需要被设置。

source:以pandas中的DataFrame数据结构、或是DataFrame中的某一类字符串作为分析对象。

target_feat:需要被标记为目标对象的字符串。

feat_cfg:需要被跳过、或是需要被强制转换为某种数据类型的特征。

pairwise_analysis:相关性和其他类型的数据关联可能需要花费较长时间。如果超过了某个阈值,就需要设置这个参数为on或者off,以判断是否需要分析数据相关性。

数据相关性分析效果,可能需要花费一定时间

compare()丨两个数据集比较

如果想要对两个数据集进行对比分析,就使用这个比较函数。

例子中的my_dataframe和test_df是两个数据集,分别被命名为训练数据和测试数据。

除了这个被插入的数据集,剩余的参数与analyze中的一致。

compare_intra()丨数据集栏目比较

想要对数据集中某个栏目下的参数进行分析,就采用这个函数进行。

例如,如果需要比较“性别”栏目下的“男性”和“女性”,就可以采用这个函数。

理解这几种函数的变量后,一行代码就能实现Python数据分析。

使用指南

sweetviz支持Python 3.6+和Pandas0.25.3+环境,配置好环境后,使用万能的pip下载安装包:

但有一个条件需要注意:sweetviz需要用到基础「os」模块。所以,如果你在使用类似于Google Colab的自定义环境,可能会无法使用sweetviz,目前开发者也在探索解决方案。

下载好后,使用import快速导入sweetviz,就可以开始使用了~

sweetviz使用的原理是,使用一行代码,生成一个数据报告的对象(其中,my_dataframe是pandas中的DataFrame,一种表格型数据结构)

在这里,analyze函数可以被替换为compare或compare_intra函数,使用方法在上面已经给出,全看你需要什么类型的数据报告了。

最后,用show一键输出。(结果会以SWEETVIZ_REPORT.html网页形式展示)

由于在这个过程中,实际上真正需要编写的只有第二行的生成对象代码,可以说是名副其实的1行代码生成数据分析。

展示界面也非常简洁,只要鼠标停留在感兴趣的栏目上,右侧就会自动显示出数据分析的图表和报告。

感兴趣的小伙伴,快戳下方的传送门用起来吧~

传送门:

https://github.com/fbdesignpro/sweetviz

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

了解AI发展现状,抓住行业发展机遇

每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。

同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:

AI社群 | 与优秀的人交流


量子位 QbitAI · 头条号签约作者


վ'ᴗ' ի 追踪AI技术和产品新动态


喜欢就点「在看」吧 !


登录查看更多
0

相关内容

流畅的Python 中英文版 PDF 高清电子书
专知会员服务
80+阅读 · 2020年8月2日
【2020新书】Python金融大数据分析宝典,426页pdf与代码
专知会员服务
149+阅读 · 2020年7月11日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
专知会员服务
137+阅读 · 2020年5月19日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
【图神经网络(GNN)结构化数据分析】
专知会员服务
114+阅读 · 2020年3月22日
【资源】100+本免费数据科学书
专知会员服务
105+阅读 · 2020年3月17日
一文看懂怎么用 Python 做数据分析
大数据技术
23+阅读 · 2019年5月5日
用Python实现流行机器学习算法
Python程序员
20+阅读 · 2018年12月31日
教你在Python中实现潜在语义分析(附代码)
数据派THU
8+阅读 · 2018年12月6日
实战 | 用Python做图像处理(二)
七月在线实验室
17+阅读 · 2018年5月25日
【入门】数据分析六部曲
36大数据
17+阅读 · 2017年12月6日
python数据分析师面试题选
数据挖掘入门与实战
6+阅读 · 2017年11月21日
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
python pandas 数据处理
Python技术博文
3+阅读 · 2017年8月30日
Arxiv
15+阅读 · 2020年2月5日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
8+阅读 · 2019年3月28日
Arxiv
4+阅读 · 2017年10月30日
VIP会员
相关VIP内容
流畅的Python 中英文版 PDF 高清电子书
专知会员服务
80+阅读 · 2020年8月2日
【2020新书】Python金融大数据分析宝典,426页pdf与代码
专知会员服务
149+阅读 · 2020年7月11日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
专知会员服务
137+阅读 · 2020年5月19日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
【图神经网络(GNN)结构化数据分析】
专知会员服务
114+阅读 · 2020年3月22日
【资源】100+本免费数据科学书
专知会员服务
105+阅读 · 2020年3月17日
相关资讯
一文看懂怎么用 Python 做数据分析
大数据技术
23+阅读 · 2019年5月5日
用Python实现流行机器学习算法
Python程序员
20+阅读 · 2018年12月31日
教你在Python中实现潜在语义分析(附代码)
数据派THU
8+阅读 · 2018年12月6日
实战 | 用Python做图像处理(二)
七月在线实验室
17+阅读 · 2018年5月25日
【入门】数据分析六部曲
36大数据
17+阅读 · 2017年12月6日
python数据分析师面试题选
数据挖掘入门与实战
6+阅读 · 2017年11月21日
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
python pandas 数据处理
Python技术博文
3+阅读 · 2017年8月30日
相关论文
Top
微信扫码咨询专知VIP会员