热门排行
简介
Python是数据分析的首选语言,而网络中的数据和信息很多,如何从中获取需要的数据和信息呢?最简单、直接的方法就是用爬虫技术来解决。《从零开始学Python网络爬虫》是一本教初学者学习如何爬取网络数据和信息的入门读物。书中不仅有Python的相关内容,而且还有数据处理和数据挖掘等方面的内容。本书内容非常实用,讲解时穿插了22个爬虫实战案例,可以大大提高读者的实际动手能力。
本书共分12章,核心主题包括Python零基础语法入门、爬虫原理和网页构造、我的第一个爬虫程序、正则表达式、Lxml库与Xpath语法、使用API、数据库存储、多进程爬虫、异步加载、表单交互与模拟登录、Selenium模拟浏览器、Scrapy爬虫框架。此外,书中通过一些典型爬虫案例,讲解了有经纬信息的地图图表和词云的制作方法,让读者体验数据背后的乐趣。
本书适合爬虫技术初学者、爱好者及高等院校的相关学生,也适合数据爬虫工程师作为参考读物,同时也适合各大Python数据分析的培训机构作为教材使用
从零开始学Python网络爬虫目录
第1章 Python零基础语法入门 1
第2章 爬虫原理和网页构造 17
第3章 我的第一个爬虫程序 26
第4章 正则表达式 45
第5章 Lxml库与Xpath语法 63
第6章 使用API 88
第7章 数据库存储 109
第8章 多进程爬虫 139
第9章 异步加载 159
第10章 表单交互与模拟登录 182
第11章 Selenium模拟浏览器 209
第12章 Scrapy爬虫框架 229