Python网络爬虫与信息抽取笔记01 课程框架和Python IDE工具

【导读】自从上次春节充电系列:李宏毅机器学习笔记以来我们又见面了,因为在机器学习中数据集是很关键的东西,好的数据集可以给实验带来很好的结果,然而有时候数据集需要我们自己构造,这时候就需要爬虫来帮你建造数据集了。Python网络爬虫与信息提取笔记系列主要针对用Python在网上进行信息爬取,需要初步的Python基础,当然如果你不会python也没关系,可以在实战中学习。今天主要是课程准备工作的介绍,涉及课程框架、Python IDE工具和科学计算工具三部分内容。话不多说,让我们一起学习这些内容吧。


春节充电系列:李宏毅2017机器学习课程学习全部笔记


视频网址:

https://www.bilibili.com/video/av9784617?from=search&seid=240663710546169136


http://www.icourse163.org/course/BIT-1001870001?tid=1001962001


Python网络爬虫与信息抽取笔记01 课程框架和Python IDE工具

 

1.课程框架




本课总体框架如下图所示,大致分为5个主要部分,Requests库的介绍、robots.txt的协议内容、Beautiful Soup的实用方法、Projects的实战、Re正则表达式的规则以及Scrapy框架的应用。

本课程有12个单元,分为8个内容单元和4个实例单元

大概四周左右时间讲完


2.Python IDE工具




如果你是初学者,就要选择一个python IDE工具写python代码,分为文本工具类IDE,集成工具类IDE

常用的是如下四个Python IDE工具

IDLE是纯 Python 下自带的简洁的集成开发环境

Sublime Text是专门为程序员开发的第三方专业编程工具,几乎所有的程序员都使用类似sublime text这种的开发工具而不是集成开发工具

Wing收费,适合多人共同开发

Visual Studio & PTVS是微软公司提供的,调试功能丰富 

Eclipse为开源IDE开发工具,熟悉java的人肯定对这个很熟悉

Pycharm则是我推荐的,因为我在用


3.科学计算工具




如果你要做科学计算和数据分析,肯定要先安装Canopy或者Anaconda这两个软件

Canopy是收费项目,适合科学计算领域应用开发

Anaconda开源免费,很友好。说个题外话,Anaconda和Canopy作者是同一个人,关于他的人生经历就自行google吧

这么多IDE,适合自己才是最好的。

 

参考链接:

http://www.icourse163.org/course/BIT-1001870001?tid=1001962001

-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

投稿&广告&商务合作:fangquanyi@gmail.com


点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员