Python网络爬虫与信息抽取笔记06 爬虫实战2

会员服务 ·

Python网络爬虫与信息抽取笔记06 爬虫实战2

2018 年 5 月 7 日 专知 Yukun

【导读】我们在上一节的内容中已经为大家对爬虫实践进行讨论，这一节将继续实践剩下的例子。本文内容讨论了实战爬虫的两个例子：网络图片的爬取和存储以及IP地址归属地的自动查询。话不多说，让我们一起学习这些内容吧。

春节充电系列：李宏毅2017机器学习课程学习全部笔记

Python网络爬虫与信息抽取笔记01 课程框架和Python IDE工具

Python网络爬虫与信息抽取笔记02 requests库入门

Python网络爬虫与信息抽取笔记03 HTTP协议介绍

Python网络爬虫与信息抽取笔记04 Robots协议

Python网络爬虫与信息抽取笔记05 爬虫实战1

视频网址：

https://www.bilibili.com/video/av9784617?from=search&seid=240663710546169136

http://www.icourse163.org/course/BIT-1001870001?tid=1001962001

Python网络爬虫与信息抽取06 爬虫实战2

1.网络图片的爬取和存储

先讨论网络图片的爬取与存储

我们要先明白网络图片链接的格式是什么样子的

比如我们将爬取这个网址

http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg

先用指令爬取网址

因为图片是二进制网址，所以使用r.content

图片就会保存在D://abc.jpg中

图片爬取的全代码如下

2.IP地址归属地的自动查询

接下来试一试IP地址归属地的自动查询

我们可以在www.ip138.com这个网址进行查询

如果想用爬虫的形式爬取的话，就是如下网址

将网址填入爬虫指令

发现返回码为200，说明爬取成功

然后看服务器响应字符串的倒数500个字符

IP地址查询的全代码如下

目前我们已经会爬取网址进行简单的任务了，从下节开始我们介绍Beautiful Soup库

参考链接：

http://www.icourse163.org/course/BIT-1001870001?tid=1001962001

更多教程资料请访问：人工智能知识资料全集

-END-

专 · 知

人工智能领域主题知识资料查看与加入专知人工智能服务群：

【专知AI服务计划】专知AI知识技术服务会员群加入与人工智能领域26个主题知识资料全集获取

[点击上面图片加入会员]

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

请加专知小助手微信（扫一扫如下二维码添加），加入专知主题群（请备注主题类型：AI、NLP、CV、 KG等）交流~

请关注专知公众号，获取人工智能的专业知识！

点击“阅读原文”，使用专知

登录查看更多

相关内容

知识抽取

关注 21

知识抽取，即从不同来源、不同结构的数据中进行知识提取，形成知识(结构化数据)存入到知识图谱。

一份简明有趣的Python学习教程，42页pdf

专知会员服务

77+阅读 · 2020年6月22日

干净的数据：数据清洗入门与实践，204页pdf

专知会员服务

164+阅读 · 2020年5月14日

【实用书】Python爬虫Web抓取数据，第二版，306页pdf

专知会员服务

122+阅读 · 2020年5月10日

算法与数据结构Python，369页pdf

专知会员服务

166+阅读 · 2020年3月4日

【干货】机器学习经典书PRML 最新 Python 3 代码实现，附最全 PRML 笔记视频学习资料

专知会员服务

179+阅读 · 2020年3月3日

手把手教你用R语言制作网络爬虫机器人（一）

R语言中文社区

4+阅读 · 2019年1月26日

Python用法速查网站

Python程序员

17+阅读 · 2018年12月16日

Python网络爬虫与信息抽取笔记08 标签树的遍历

专知

3+阅读 · 2018年5月10日

Python3爬虫之入门和正则表达式

全球人工智能

7+阅读 · 2017年10月9日

【宁波站】网络爬虫与文本挖掘

数萃大数据

5+阅读 · 2017年7月19日

Did the Model Understand the Question?

Arxiv

4+阅读 · 2018年5月14日

Generative Stock Question Answering

Arxiv

6+阅读 · 2018年4月21日

DVQA: Understanding Data Visualizations via Question Answering

Arxiv

4+阅读 · 2018年3月29日

The Web as a Knowledge-base for Answering Complex Questions

Arxiv

5+阅读 · 2018年3月18日

MilkQA: a Dataset of Consumer Questions for the Task of Answer Selection

Arxiv

4+阅读 · 2018年1月10日

VIP会员