自己动手打造工具系列之自动刷新简历

2018 年 9 月 3 日 FreeBuf

0x00 背景

话说搞安全的大佬们都非常忙,自己在一步一步成长中无暇顾及其他琐碎的事情,比如让猎头注意到各位大佬。如何让猎头和大厂注意到自己呢?第一、提高自己在整个行业的曝光度;第二、定时刷新自己的简历;还有第三,第四等等,各位发挥脑洞。针对第一点,很多大佬各有自己的办法,但是针对第二点其实我们有全自动化的解决方案,可以为自己相对地节约点时间。小弟今天就带来自己动手打造工具系列之自动刷新简历。本文主要是针对喜欢写工具的童鞋提供一些思路,并一步一步地分析思路和方法,起一个抛砖引玉的作用吧。(本文代码部分可阅读原文CV)

0x01 方法及步骤

原理

本工具主要是使用selenium来操作浏览器,实现元素定位、按钮点击和url请求,然后通过点击成功后页面信息的变化判断和截图判断的方式来确定是否成功刷新简历。另外本文只操作了猎聘网和智联招聘网站,因为自己用到这两个网站比较多,很多好机会都是从这两个网站获得的。其他招聘网站还请各位自行研究。比如如何识别验证码等。

开发环境

开发语言:Python 3.6.5 (也存在Java版的)

所用模块:

selenium 3.11.0 (自动化测试模块)

argparse

sys

time.sleep

系统环境:MacOS Sierra

IDE: Pycharm

0x02 步骤解析

开始之前,需要下载相关的组件。主要包括各类浏览器的驱动(Webdriver),这样我们才可以操作浏览器来完成自动刷新简历的工作。以下是主流浏览器的驱动下载地址:

Firefox: https://github.com/mozilla/geckodriver/releases/ (本文主要以操作Firefox为主来讲解)

其他WebDriver下载地址:https://www.seleniumhq.org/download/

如果使用macOS, 直接使用brew install geckodriver 即可。

步骤一、创建Python虚拟环境

如果使用的是Pycharm的话,在选择建立项目的时候可以选择创建虚拟环境。同时,也可以自己建立虚拟环境。选择其一即可。建立虚拟环境的方法请参考官方文档。虚拟环境搭建好以后使用如下命令安装模块:

pip install selenium

等待安装完成后,即可开始工具编写之旅。

步骤二、导入模块

本文主要使用以下模块的方法:

Options主要是来已无GUI方式启动浏览器,避免突然跳个浏览器出来吓自己一跳。

步骤三、代码编写

首先定义一个类,所谓面向对象编程嘛。现在很火,耳熟能详 ~ ~其次初始化参数和一些变量。代码如下:

代码初始化了用户名和密码,而且定义了需要进行自动刷新简历的网站。后面的方法中会用到这些参数和变量。有盆友会问,为什么是m.liepin.com而不是www.leipin.com呢?后面会一一解释。

然后我们需要操作两个网站的简历自动刷新,那我们来定义两个方法吧,我真的想称之为函数。C/C++中毒太深!两个方法我取了个拼音,好low有没有!zhaopin() and liepin()。这个两个方法的内容大同小异,因为每个网站的结构不一样,所以造成了需要设定两个方法。以zhaopin()这个方法来讲解。

因为我们需要无GUI模式启动浏览器,所以Options必不可少,在其中加入‘headless’ 参数后便可以悄无声音地刷新简历,这样老板就不会看到我们在看其他机会啦。哈哈。在注释里已经说得相对明白了。其实主要在于如何去定位元素,然后操作元素。Selenium提供了8种定位元素的方法,大家有兴趣可以去官网看看。我们用得最多的还是.find_element_by_name、.find_element_by_tag_name 和 .find_element_by_class_selector。当然其他定位元素的方法只要能实现的都没问题,看自己喜好。

我们使用浏览器打开zhaopin.com, 按下F12打开开发者工具, 随后点击最左边的“选取一个元素按钮”,然后移动到用户名和密码输入框处便可以获取name,Class等信息。如图所示:

最后使用.find_element_by_name 和 .find_element_by_tag来定位操作元素,因为该页面只有一个button标签,所以就使用tag name即可定位:

其中sleep(3),主要是点击后页面可能还未加载。所以等待页面加载完后再进行其他操作。然后我们进入登陆后的页面去查找我们想要得到的自动刷新简历的功能。找到元素,右键“复制”->”CSS选择器”即可复制位置。

而我们定义的t主要是来获取文字变化后状态,因为该网站简历刷新后文字会变成“刷新成功”。以此我们可以来判断是否刷新成功。最后关闭driver,一定得关闭,不然Firefox可能还在后台运行。

最后,liepin.com的操作方式大同小异,主要是在于www.liepin.com有反爬策略。对新手来说太友好。所以我选择了m.liepin.com来操作。不知道发了这篇文章后会不会加强m.liepin.com的反爬策略。哈哈!所以跟做安全一样,此路不通的时候,可以另辟蹊径。思路决定出路!代码如下:

0x04 总结

对于Selenium这个包来说,有很多用途,比如扫描工具可以使用它来进行模糊测试。此文主要是稍微浅显的说明下此模块的基本用法。还是那句话思路决定出路,idea是最宝贵的东西。大家多想多写,一定能成为安全界的大佬。

另外需要JAVA版的童鞋请私信我,谢谢!预告一下,下一次还有如何打造本地安全漏洞和安全工具的知识库的文章哦!欢迎关注自己动手打造工具系列文章! 欢迎关注Github: https://github.com/Hell0W0rld0。谢谢各位!最后附上完整代码:

*本文作者:ztencmcp,转载请注明来自FreeBuf.COM

登录查看更多
0

相关内容

提供网络招聘服务及其他人力资源服务的专业网站。
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
【初学者系列】tensorboard学习笔记
专知
7+阅读 · 2019年10月4日
搭建自己的searx搜索引擎
黑白之道
13+阅读 · 2019年5月31日
渗透某德棋牌游戏
黑白之道
12+阅读 · 2019年5月17日
Pupy – 全平台远程控制工具
黑白之道
43+阅读 · 2019年4月26日
教你打造一个属于自己的「搜索引擎」
少数派
9+阅读 · 2018年10月23日
占坑!利用 JenKins 持续集成 iOS 项目时遇到的问题
教程 | 如何通过PyTorch上手Tensor Comprehensions?
机器之心
5+阅读 · 2018年3月12日
6个实验教你用Torch玩转深度学习
七月在线实验室
7+阅读 · 2017年11月21日
码农日常工具推荐
架构文摘
4+阅读 · 2017年9月26日
Arxiv
11+阅读 · 2019年6月19日
Arxiv
21+阅读 · 2019年3月25日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
7+阅读 · 2018年5月23日
Arxiv
15+阅读 · 2018年2月4日
Arxiv
5+阅读 · 2018年1月29日
Arxiv
5+阅读 · 2017年7月23日
VIP会员
相关VIP内容
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
相关资讯
【初学者系列】tensorboard学习笔记
专知
7+阅读 · 2019年10月4日
搭建自己的searx搜索引擎
黑白之道
13+阅读 · 2019年5月31日
渗透某德棋牌游戏
黑白之道
12+阅读 · 2019年5月17日
Pupy – 全平台远程控制工具
黑白之道
43+阅读 · 2019年4月26日
教你打造一个属于自己的「搜索引擎」
少数派
9+阅读 · 2018年10月23日
占坑!利用 JenKins 持续集成 iOS 项目时遇到的问题
教程 | 如何通过PyTorch上手Tensor Comprehensions?
机器之心
5+阅读 · 2018年3月12日
6个实验教你用Torch玩转深度学习
七月在线实验室
7+阅读 · 2017年11月21日
码农日常工具推荐
架构文摘
4+阅读 · 2017年9月26日
相关论文
Arxiv
11+阅读 · 2019年6月19日
Arxiv
21+阅读 · 2019年3月25日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
7+阅读 · 2018年5月23日
Arxiv
15+阅读 · 2018年2月4日
Arxiv
5+阅读 · 2018年1月29日
Arxiv
5+阅读 · 2017年7月23日
Top
微信扫码咨询专知VIP会员