如果编程是一种魔法,那么web抓取无疑是一种魔术。通过编写一个简单的自动化程序,您可以查询web服务器、请求数据并解析它以提取所需的信息。这本实用书籍的扩展版不仅介绍了web抓取,而且还提供了从现代web中抓取几乎所有类型数据的全面指南。
第1部分侧重于web抓取机制:使用Python从web服务器请求信息,执行服务器响应的基本处理,并以自动方式与站点交互。第2部分探索了各种更具体的工具和应用程序,以适应您可能遇到的任何web抓取场景。