主页

XPath的使用

2025-09-10 10:09AM

方法1:在浏览器开发者工具中直接测试

1. 使用Chrome 或 Firefox浏览器打开一个网页

2. 点击 F12 打开开发者工具

3. 切换到 Elements(查看器/元素)面板

4. 点击 ctrl + f 在底部搜索框中输入你的 XPath 表达式

5. 如果表达式正确,它就会高亮显示匹配到的元素,并告诉你找到了几个。

例如:

打开这个链接:https://www.runoob.com/try/xml/books.xml

在搜索框中输入 /bookstore/book/title 选取所有 title 节点

4个分别是:

Everyday Italian
Harry Potter
XQuery Kick Start
Learning XML

方法2:在编程中使用

XPath本身不是编程语言,它需要被其他语言调用,最常用于:

Python(使用 lxml 或 parsel 库):

from lxml import html

source = """
<html><body><div><a href=‘https://www.example.com’>链接</a></div></body></html>
"""
selector = html.fromstring(source)
# 使用XPath提取链接地址
link_url = selector.xpath(‘//a/@href’)[0]
print(link_url) # 输出: https://www.example.com

总结:

理解结构:学习XPath前,最好先对HTML的树状DOM结构有个基本了解。

多用浏览器练习:F12 -> Ctrl+F 是最佳练习场。看到页面上的任何元素,都试着用XPath去定位它。

从简单到复杂:先掌握 ///@[] 这几个最核心的符号,然后再去学习函数如 contains()text()starts-with() 等。

避免过于脆弱的XPath:尽量避免使用绝对路径(如/html/body/div[2]/div[5]/div[1]/div/span),因为页面结构稍一变化,路径就失效了。尽量使用属性和相对路径来构造更健壮的XPath(如 //div[@class=“title”]/span)。

返回>>

登录

请登录后再发表评论。

评论列表:

目前还没有人发表评论