1198元学习python爬虫合适吗?

关注者
2,377
被浏览
743,707
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

一、学习误区

先不说课程合不合适,首先要明确你的目的。

我觉得很多人在这里有个误区,不知道自己是需要使用爬虫还是自己想通过爬虫学习Python。

举个例子,我在知乎搜索爬虫

知乎搜索“爬虫”关键字

爬取所有搜索结果,将结果根据点赞数进行排序,可以看到前27个问题中,有12个问题提到了Python,(ps:其中一个就是题主的问题)。在统计181个问题中,有46个问题中提到了Python,别的问题虽然没有提到Python,但回答里面大部分都有提到Python。

知乎搜索“爬虫”的结果统计

假设我是一个小白,某天我想获取一下相亲论坛里的用户数据,提高我相亲的效率,于是我想到了使用爬虫获取数据,于是我上知乎一搜爬虫,一大半问题和回答都提到使用Python来写爬虫爬取数据,那么我就很容易陷入一个误区:爬取数据->学写爬虫->学Python。渐渐的就导致自己头秃,忘了自己本来只是想提高相亲效率,导致相亲更难了。

二、不需要写代码爬取数据方法推荐

如果你是想爬取某些数据,用在其他方面(例如做调研、数据分析、产品需求分析等),而且你对编程并不了解,只是网上搜爬虫很多都提到Python,那么其实通过学习Python来解决你的需求未必是你最优的选择。

爬取数据没有想象的那么难,但是你想先学Python在爬取数据那就给自己挖了个大坑了,你得学一堆Python的语法(文本处理、正则表达式、Http请求)、网页知识、反爬虫知识等等,如果你没有编程基础那就更久了,相亲对象都跑啦。

那么作为一个小白不会写代码有什么方法爬取数据呢?(PS:上面知乎举例就是没有通过写代码获取的)

推荐几个方法:

  • Chrome插件——web Scraper:爬虫神器,操作也很简单,例子中知乎爬取就是使用这个插件。设置好模板后,爬取一个网站数据只需要鼠标点几下就ok,使用方法和模板获取可以去这个网站看:webscraper中文网|关于webscraper,看这个网站就够了。也可以看这个站长开的课,有比较详细的课程(课程侧重点是如何利用信息收集获取信息差赚钱),提供了300个常见网站的模板使用(例如知乎、淘宝、京东等等),为了尊重作者权利,模板就不直接发给大家了,有需要的可以扫码了解,需要的人多我可以联系作者帮忙要个优惠券(网站上也有模板的,只是课件里比较系统的整理和教学如何使用,大家根据需要自行选择)

weike.fm/gD5lL3322a (二维码自动识别)

三、如何通过爬虫学习Python

如果你想明白了,其实爬不爬虫无所谓,并不一定要用,只是想通过学习爬虫这种方式来学习Python,那么你的重点就应该更多的放在Python中,掌握Python才是目的,通过写爬虫来检验自己对Python的掌握程度。

如何学习呢?

一个爬虫说起来就是三步:

  1. 发送请求
  2. 从返回的结果获取自己想要的信息并保存
  3. 自动不断地重复前两步

通过学习以下这些内容,你就可以实现一个最基础的爬虫了,此时你对Python有了基本的了解

后面会发现,这种爬虫限制太多,很多网站无法爬取成功,因为别人不想把过多资源浪费在你的爬虫上,影响其他用户的使用,就会采取一些反爬措施。针对这些反爬措施,你又要继续学习一些反反爬措施提高效率......从而一步步了解到Python的更多高级用法,这里就不细说了。

四、如何学习Python

上面说了通过学习爬虫来学习Python,是一个很好的结果驱动学习的方式。除此之外,还可以通过很多种方式,挑一个自己感兴趣的,例如做一个微信机器人、做一个网站、写一些实用脚本等,先给自己找一个感兴趣的目标,从而给自己学习下去的动力,可以参考我这个回答,通过写一个手语翻译的机器人来学习。

对于一些学习资源,推荐几个我觉得不错的:

  • 慕课网(慕课网-程序员的梦工厂):有许多优质的免费课程,也有一些付费的实战项目课,对于入门而言十分不错。
  • 官方文档:这个就不用多说了,文档必须得会看,可以省很多麻烦。
  • 菜鸟教程(菜鸟教程 - 学的不仅是技术,更是梦想!):对于一个技术的快速入门还是很方便的,例如写爬虫需要了解一些网页知识又不需要很深入,可以在上面迅速入门。

此外还可以通过一些培训课,例如下面这种,优势在于有同学、助教一起帮助学习,相比于自学遇到困难更易解决,不会一个人盲目的学习,适合自学能力稍弱的人,通过这些课程入门。

知乎上相关的回答也很多,大家可以尝试用那个不写代码的方法,爬取知乎上python相关的问题,找到点赞数最多的一些去找到学习Python的方法~如下,需要这个表格的话可以私信我