Python网络爬虫与信息抽取笔记06 爬虫实战2

2018 年 5 月 7 日 专知 Yukun

【导读】我们在上一节的内容中已经为大家对爬虫实践进行讨论,这一节将继续实践剩下的例子。本文内容讨论了实战爬虫的两个例子:网络图片的爬取和存储以及IP地址归属地的自动查询。话不多说,让我们一起学习这些内容吧。


春节充电系列:李宏毅2017机器学习课程学习全部笔记


Python网络爬虫与信息抽取笔记01 课程框架和Python IDE工具

Python网络爬虫与信息抽取笔记02 requests库入门

Python网络爬虫与信息抽取笔记03 HTTP协议介绍

Python网络爬虫与信息抽取笔记04 Robots协议

Python网络爬虫与信息抽取笔记05 爬虫实战1


视频网址:

https://www.bilibili.com/video/av9784617?from=search&seid=240663710546169136

http://www.icourse163.org/course/BIT-1001870001?tid=1001962001


Python网络爬虫与信息抽取06 爬虫实战2

 

1.网络图片的爬取和存储




先讨论网络图片的爬取与存储


我们要先明白网络图片链接的格式是什么样子的


比如我们将爬取这个网址

http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg


先用指令爬取网址


因为图片是二进制网址,所以使用r.content


图片就会保存在D://abc.jpg中

图片爬取的全代码如下


2.IP地址归属地的自动查询




接下来试一试IP地址归属地的自动查询


我们可以在www.ip138.com这个网址进行查询


如果想用爬虫的形式爬取的话,就是如下网址


将网址填入爬虫指令


发现返回码为200,说明爬取成功


然后看服务器响应字符串的倒数500个字符


IP地址查询的全代码如下


目前我们已经会爬取网址进行简单的任务了,从下节开始我们介绍Beautiful Soup库


参考链接:

http://www.icourse163.org/course/BIT-1001870001?tid=1001962001

 更多教程资料请访问:人工智能知识资料全集

-END-

专 · 知

人工智能领域主题知识资料查看与加入专知人工智能服务群

【专知AI服务计划】专知AI知识技术服务会员群加入人工智能领域26个主题知识资料全集获取

[点击上面图片加入会员]

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

登录查看更多
1

相关内容

知识抽取,即从不同来源、不同结构的数据中进行知识提取,形成知识(结构化数据)存入到知识图谱。
一份简明有趣的Python学习教程,42页pdf
专知会员服务
76+阅读 · 2020年6月22日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
【新书】Python数据科学食谱(Python Data Science Cookbook)
专知会员服务
114+阅读 · 2020年1月1日
史上最大规模1.4亿中文知识图谱开源下载
专知
39+阅读 · 2019年10月14日
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
手把手教你用R语言制作网络爬虫机器人(一)
R语言中文社区
4+阅读 · 2019年1月26日
Python用法速查网站
Python程序员
17+阅读 · 2018年12月16日
181页机器学习Python介绍书籍pdf下载
专知
17+阅读 · 2018年8月11日
我是一个爬虫
码农翻身
12+阅读 · 2018年6月4日
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
【宁波站】网络爬虫与文本挖掘
数萃大数据
5+阅读 · 2017年7月19日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
4+阅读 · 2018年5月14日
Arxiv
6+阅读 · 2018年4月21日
VIP会员
相关VIP内容
一份简明有趣的Python学习教程,42页pdf
专知会员服务
76+阅读 · 2020年6月22日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
【新书】Python数据科学食谱(Python Data Science Cookbook)
专知会员服务
114+阅读 · 2020年1月1日
相关资讯
史上最大规模1.4亿中文知识图谱开源下载
专知
39+阅读 · 2019年10月14日
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
手把手教你用R语言制作网络爬虫机器人(一)
R语言中文社区
4+阅读 · 2019年1月26日
Python用法速查网站
Python程序员
17+阅读 · 2018年12月16日
181页机器学习Python介绍书籍pdf下载
专知
17+阅读 · 2018年8月11日
我是一个爬虫
码农翻身
12+阅读 · 2018年6月4日
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
【宁波站】网络爬虫与文本挖掘
数萃大数据
5+阅读 · 2017年7月19日
相关论文
Top
微信扫码咨询专知VIP会员