我是个只会用Excel的数据分析工作者。有一天,我和同事大鹏约好晚上一起喝酒,离下班还有5分钟,老板突然Q我:
912个CSV表格,每个表格共370列,约360行不等
这么多!我试了一下Power Query, 电脑不客气地歇菜了,这要是纯手动复制非得睡公司不可。我瘫在工位上:“鹏哥,我今天怕是得和912张表共度良宵,你自个儿去喝酒吧。”
大鹏听完来龙去脉却哈哈一笑:“小事一桩,今晚这酒还真得喝定了,看我的!”
我半信半疑看着大鹏打开一个黑色的窗口,刷刷刷敲了几行代码,一份合并好的表格就很快完成了!
顺利下班!之前我总觉得Excel能做好多事情,自己学习动力也不是特别强,很多时候都得过且过,并且看到代码有点望而生畏,看起来好像很难的亚子,但没想到这么方便。
我坐不住了:鹏哥,你会的这个代码,怎么这么厉害,比Excel还好用啊?
大鹏神秘一笑:Python可强大了,远不止你看到的这些。
刚才处理表格的效率你看到了,更厉害的是如果有类似的工作任务,我们只需要更改一下工作路径,这份代码便可以直接使用,可谓一劳永逸。
除了合并表格这类需求,批量出图是不是也曾经困扰你?想想你用Excel怎么做数据分析的:
从数据的清洗整理到出图的每一步都要鼠标点击,非常繁琐且容易出错,而使用Python只需几行代码即可轻松出图:
当你面对高重复性的工作时,也只需要略微改动,或者引入循环,再也不用点鼠标点到手抽筋了。
我有点心动:好像是比Excel方便多了,会用Python肯定能大大提高工作效率。
就在我在心里为大鹏的表演喊“666”的同时,大鹏又滔滔不绝地讲了起来:小刘,你别看我前面只提到了使用Python整整表格出出图,人家可是著名的“胶水语言”。
大鹏解释道:Python可以利用MySQLdb库连接数据库,可以利用pandas和matplotlib进行清洗和分析,可以利用pyecharts进行交互可视化,可以利用numpy和sklearn进行建模,甚至可以利用pyinstaller打包工作流交给同事,共同提效……
而且这些库的丰富程度,可以说是超出你的想象,以python可视化必知基本库matplotlib为例,光是他的官方gallery就有26个大类527个样式,数量上就碾压了市面上大部分同功能软件。
matplotlib官网:https://matplotlib.org/tutorials/index.html
Python可视化类工具会有针对图表样式进行调整的代码,也可以交互,几行代码,省时省力,分分钟关机下班。
比较一下Seaborn的图表库和Excel的图表库,感受差距:
这就有点惊讶到我了:这效率和酷炫程度和Excel根本不是一个层级的。这么游刃有余的本事,不可谓不吸引人啊!会用Python肯定能做更多的事情,让老板刮目相看。
我随手找了一点资料:
Python官方在今年2月做了一份报告,从官方的角度说明了python的使用状况和受欢迎程度。
该调查由 Python 软件基金会与 JetBrains 一起发起,有来自 150 多个国家的超过两万名开发人员参与。
从官方喜出望外的报告中,我发现python受到大部分人的欢迎,是用户手中的香饽饽:
在python的用途上,大家使用python最常用的场景是
数据分析
,并且相比2017年,2018年的涨幅也是相比最高的,相关的机器学习场景涨幅也有7%。
再结合大鹏哥的介绍,python语言的这种火热程度也是不难理解了。看来,使用Python进行数据分析是时代的趋势。
我有点坐不住了:鹏哥,我从来没写过代码,但我真想学会你这一手Python数据分析本事啊!
“没问题,”大鹏自信地说,“小刘你这么勤学好问,又对数据有兴趣,只要找对了正确的方法,肯定学得快。正好最近我有一个直播,你要不要来听听?”
这个直播课程是由网易云课堂和专业数据机构城市数据团联合打造,每周一至周四固定开课,现在限时0元领取。不仅如此,还有Python入门资料包免费送哦~
扫码领取
限时0元Python数据分析课程
课程详情
1. 工作流程梳理及逻辑构建
2. Python函数基础
3. 实际工作中如何设计函数模块
4. 完成1个简单的数据分析算法搭建
1. 什么是文本数据
2. 字符串的常用方法
3. 数据分析中的文本数据常见问题
4. 案例练习:星座运势文本数据分析
1.读懂网页结构
2.页面解析及标签提取
3.手把手教你实现第一个数据爬虫
4.如何进阶到python数据分析师
1.数据分析师为什么要学习正则
2.常用正则函数及方法
3.正则表达式模式学习
8.19-8.22限时0元课程8.19-8.22限时0元
扫码领取
限时0元Python数据分析课程
咨询人数较多,请耐心等待~