Tensorflow实战:端到端简单粗暴识别验证码(反爬利器)

2018 年 12 月 6 日 七月在线实验室

点击上方蓝字关注


今天分享一下如何简单粗暴的解决验证码的办法


背景:

  • 对于一个爬虫开发者来说,反爬虫无疑是一个又爱又恨的对手,两者之间通过键盘的斗争更是一个没有硝烟的战场。

  • 反爬虫有很多措施,在这里说说验证码这一块

  • 论爬虫修养:大家都是混口饭吃,上有老下有小,码农何苦为难码农?爬数据的时候尽可能减少服务器压力,能爬列表页,就不爬详情页


正文:

  • 数据集:百度上找的一个验证码数据集(因为懒得生成),也可以自己生成。


  • 在训练前可以先对图片进行降噪,去掉干扰点,可以用opencv里面的函数滤波器等。这样识别会快点


  • 在这里我就没有去做啦,不然怎么叫粗暴呢(真正:懒, 没时间)


  • 准确率训练到90+我就保存模型停止了,大家可以根据需求设置。看下图


  • 这里是训练中的loss以及accuracy


  • 这里是测试


  • 这个是识别有错误的,毕竟我的GTX950也辛苦算了这么久,再说这个7这么像1呀。莫得了。



话不多说来个网络结构图再说


觉得有点乱的,看看下面的图


划重点:show you code


3个卷积层, 2个全连接层


损失函数,以及优化器


最后就是训练了

来源:

https://blog.csdn.net/weixin_43741442/article/details/84718013


End


今日学习推荐

机器学习集训营第七期

火热报名中

前一百人特惠价:13999元

2019年1月14日开课

三个月挑战年薪四十万,甚至拿更高薪~


往期学员面经先来一波

看看他们的面试经验和学习心得

(点击下方直接查看)

 邱同学“人称offer收割机”,45万offer

→ 汪同学,本科应届双非院校,20万offer

→ 赵同学,高薪offer,薪资翻倍涨


有意的亲们抓紧时间喽,报名即送两门课程👉《机器学习工程师 第九期》、《深度学习 第四期》,助力您更好的学习机器学习。且两人及两人以上组团还能各减500元


咨询/报名/组团可添加微信客服

julyedukefu_02

👇

长按识别二维码


 更多资讯

 请戳一戳

往期推荐

资源 | 30个经典机器学习项目,GitHub星星加起来超过16万

程序员夏天穿格子衫,那么冬天穿什么?答案扎心了哈哈哈哈!

贝叶斯分类算法实例 --根据姓名推测男女

刚写完排序算法,就被开除了…

这是一份超全机器学习&深度学习网站资源清单,请收藏!

拼团,咨询,查看课程,点击 “ 阅读原文 

↓↓↓ 
登录查看更多
1

相关内容

全自动区分计算机和人类的图灵测试(英语: Completely Automated Public Turing test to tell Computers and Humans Apart,简称 CAPTCHA),俗称 验证码,是一种区分用户是计算机和人的公共全自动程序。
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
107+阅读 · 2020年6月27日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
331+阅读 · 2020年3月17日
【模型泛化教程】标签平滑与Keras, TensorFlow,和深度学习
专知会员服务
20+阅读 · 2019年12月31日
【机器学习课程】Google机器学习速成课程
专知会员服务
162+阅读 · 2019年12月2日
基于Web页面验证码机制漏洞的检测
FreeBuf
7+阅读 · 2019年3月15日
推荐系统召回四模型之:全能的FM模型
AINLP
16+阅读 · 2019年3月4日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
简单粗暴TensorFlow学习教程(PDF)
专知
8+阅读 · 2018年11月18日
一图概览整个深度学习的核心知识体系(建议收藏)
七月在线实验室
6+阅读 · 2018年10月9日
简单粗暴 TensorFlow Eager 教程
专知
5+阅读 · 2018年9月13日
深度学习面试100题(第71-75题)
七月在线实验室
5+阅读 · 2018年8月2日
实战 | 40行代码实现人脸识别
七月在线实验室
3+阅读 · 2018年3月7日
手把手带你玩转机器学习和深度学习
大数据技术
8+阅读 · 2018年1月3日
带你训练一个简单的音频识别网络(附代码)
数据派THU
4+阅读 · 2017年10月9日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
7+阅读 · 2019年5月31日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关资讯
基于Web页面验证码机制漏洞的检测
FreeBuf
7+阅读 · 2019年3月15日
推荐系统召回四模型之:全能的FM模型
AINLP
16+阅读 · 2019年3月4日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
简单粗暴TensorFlow学习教程(PDF)
专知
8+阅读 · 2018年11月18日
一图概览整个深度学习的核心知识体系(建议收藏)
七月在线实验室
6+阅读 · 2018年10月9日
简单粗暴 TensorFlow Eager 教程
专知
5+阅读 · 2018年9月13日
深度学习面试100题(第71-75题)
七月在线实验室
5+阅读 · 2018年8月2日
实战 | 40行代码实现人脸识别
七月在线实验室
3+阅读 · 2018年3月7日
手把手带你玩转机器学习和深度学习
大数据技术
8+阅读 · 2018年1月3日
带你训练一个简单的音频识别网络(附代码)
数据派THU
4+阅读 · 2017年10月9日
Top
微信扫码咨询专知VIP会员