python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python Xpath Helper

Python中Xpath Helper(xpath辅助插件)的具体使用

作者:MinggeQingchun

XPath Helper是一款免费的Chrome插件,专用于网页解析和爬虫辅助,它允许用户轻松获取网页数据的XPath,以便进行批量爬取,下面就来介绍一下Python中Xpath Helper的具体使用,感兴趣的可以了解一下

XPath Helper是一款免费的Chrome插件,专用于网页解析和爬虫辅助。它允许用户轻松获取网页数据的XPath,以便进行批量爬取。下载插件后,通过拖拽安装到Chrome浏览器,然后在网页上右键检查,复制XPath并输入到XPath Helper查询框,即可高亮显示对应元素。此外,插件还支持批量获取数据、链接和文本等功能,对于前端开发者和爬虫工程师来说非常实用。

如下图所示,在QUERY输入框中写XPath代码,右侧文本框会显示查找到的xpath结果,在网页中也会高亮度显示xpath所在的位置。

一、下载XPath Helper

XPath Helper下载:XPath Helper_2.0.2_Chrome插件下载_极简插件

1、进入并点击 ‘推荐下载’ 即可下载出压缩包,打开文件下载位置为一个zip文

2、将压缩包解压, 有两个文件

二、加载XPath Helper插件至谷歌浏览器

1、使用谷歌浏览器,打开设置(Settings)

2、点击扩展程序(Extensions)

3、打开 开发者模式(Developer mode)

4、将名为 ’hgimnogjllphhhkhlmebbmlgjoejdpjl_2.0.2_chrome.zzzmh.cn.crx‘ 的文件拖拽复制到chrome浏览器

5、点击弹窗中 ‘Add extension’ (添加扩展) 按钮;到此已将 Xpath Helper 插件已添加至谷歌浏览器

6、将 Xpath Helper 钉( pin ) 在主页上, 便于后期插件的使用

三、Xpath Helper使用

这里以 www.baidu.com 页面热搜为例

1、右键热搜链接,点击检查(inspect)

2、在弹出的 开发者工具栏 复制 Xpath (Copy Xpath) , 并点击上方 xpath helper 插件 

3、点击插件后, 将刚复制的 xpath 粘贴至查询框

​ xpath正确,则结果框中显示网页中相应元素,且网页中相应数据高亮显示

//*[@id="hotsearch-content-wrapper"]/li[2]/a/span[2]

//*[@id="hotsearch-content-wrapper"]/li[2]/a/span[2]/text()

4、批量获取数据

//*[@id="hotsearch-content-wrapper"]/li/a/span[2]

5、获取链接

//*[@id="hotsearch-content-wrapper"]/li/a/@href

6、获取文本

//*[@id="hotsearch-content-wrapper"]/li/a/span[2]/text()

到此这篇关于Python中Xpath Helper(xpath辅助插件)的具体使用的文章就介绍到这了,更多相关Python Xpath Helper内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! 

您可能感兴趣的文章:
阅读全文