页面元素定位 - XPath
阅读原文时间:2023年07月10日阅读:1

1. XPath 简介

2. 选取节点

2.1 选取节点表达式

2.2 XPath 运算符

2.3 XPath 常用函数

2.4 亲属关系匹配

2.5 *综合示例

1. XPath 简介

XPath 是一门在 XML 文档中查找信息的语言。

XPath 使用路径表达式来选取 XML 文档中的节点或者节点集,这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。

XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 QName 处理、序列处理、逻辑值等等。

在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。

XML 文档是被作为节点树来对待的。

树的根被称为文档节点或者根节点。

2. 选取节点

**示例:http://www.w3school.com.cn/example/xmle/books.xml**

模糊选取:

函数

返回值

last()

返回当前上下文中的最后一个节点的位置号数。

position()

返回当前节点的位置的数字,位于第几个。

  • parent::*  表示当前节点的父节点元素

  • ancestor::*  表示当前节点的祖先节点元素

  • child::*  表示当前节点的子元素

  • descendant::* 表示当前节点的所有后代元素

  • self::*  表示当前节点的自身元素

  • ancestor-or-self::*  表示当前节点的及它的祖先节点元素

  • descendant-or-self::*  表示当前节点的及它们的后代元素

  • following-sibling::*  表示当前节点的后序所有兄弟节点元素

  • preceding-sibling::*  表示当前节点的前面所有兄弟节点元素

  • following::*  表示当前节点的后序所有元素

  • preceding::*  表示当前节点的所有元素

    1 # 使用唯一属性值
    2 //book[@cover='paperback']
    3
    4 # 使用多个属性组合,构成唯一的属性组合
    5 //book[@category='web' and @cover='paperback']
    6
    7 # 使用绝对路径
    8 //bookstore/book[2]/title
    9
    10 # 使用标签的文字来精确定位
    11 //*[.='Everyday Italian']
    12 //*[text()='Everyday Italian']
    13
    14 # 使用部分文字
    15 //title[contains(.,'Everyday')]
    16 //title[contains(text(),'Everyday')]
    17 //title[contains(text(),'Everyday')]/..
    18
    19 # 使用部分属性值
    20 //book[contains(@category,'chi')]
    21
    22 # 使用通过文本值的大小比较来进行定位
    23 //book[price<30]/title 24 25 # 使用函数 26 //book[position()>=3] # 定位第三、第四个节点
    27 //book[last()] # 定位最后一个book节点
    28 //book[last()-1] # 定位倒数第二个book节点
    29
    30 # 使用axis轴
    31 # 1. 定位子节点
    32 //book[2]/child::title # 定位到下一级的title节点
    33 //book[2]/child::* # 定位到下一级的所有子节点
    34 # 2. 定位父节点
    35 //book[2]/title/..
    36 //book[2]/title/parent::book