Python的Scrapy框架基本使用详解

2023-12-06 10:08:00 作者：凌冰_

这篇文章主要介绍了Python的Scrapy框架基本使用详解,Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据,Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试,需要的朋友可以参考下

一、Scrapy框架使用

（不能有汉字，不能数字开头）

scrapy startproject Baidu

cd Baidu
scrapy  genspider wenda www.baidu.com

注意： parse()是执行了start_url之后要执行的方法，方法中的response就是返回的对象。相当于response = requests.get或requests.post

scrapy crawl wenda

在parse（）函数打印一句话，运行后发现没有打印结果，原因是被一个叫robots.txt的文件给阻止了。

解决：大平台的君子协议，只需在settings里将ROBOTSTXT_OBEY = True注释掉即可。

再次运行

scrapy官网：https://scrapy.org/

scrapy文档：https://doc.scrapy.org/en/latest/intro/tutorial.html

scrapy日志：https://docs.scrapy.org/en/latest/news.html

到此这篇关于Python的Scrapy框架基本使用详解的文章就介绍到这了,更多相关Python的Scrapy框架内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！