JS之DOM(一)
阅读原文时间:2023年07月08日阅读:3

一、DOM简介

什么是DOM?简单地说,DOM是是针对HTML和XML文档的一个API,一套对文档的内容进行抽象和概念化的方法。

学习过ORM的同学可能知道ORM是将数据库中的表映射到类,建立一个表和类的映射模型,类属性为表字段,类实例为表记录,通过操作类和类的实例来对数据库进行增删改查。

DOM就是另一种模型,不同的是DOM是将一个HTML或XML文档映射到一个家谱树,文档中的内容划分为许多类型的节点,这些节点按照原本的层次组成一颗家谱树,通过对家谱树节点的操作来达到对整个文档的增删改查。

也就是说,DOM描绘了一个层次化的节点树,可以使用JS来操作这个节点树,进而改变底层文档的外观和结构。

另外DOM也分为几种不同的等级,这主要是根据每一级推出的时间及主要功能来分的。最开始的DOM(DOM0)在每个浏览器的实现都有很大的区别,大大增加了开发的难度,为此,W3C结合各家优点,推出了一个标准化的DOM(DOM1),主要定义了HTML和XML文档的底层结构。之后推出的DOM2和DOM3则在这个结构的基础上引入了更多的交互能力,其目的在于扩展DOM API,以满足操作XML的需求,同时提供更好的错误处理及特性检测,这些功能的关键是对命名空间的支持,我们在之后会详细讲解。

二、DOM节点树

说到DOM,就必须明白DOM将文档构建节点树的规则,HTML大家都熟悉,那就先来看下DOM节点树的组成。

DOM节点树由节点构成,而节点也是对象,有以下几种类型:

  (1)最基本的节点是Node,用于抽象的表示文档中一个独立的部分;所有其他类型都继承自Node。

  (2)Document类型表示整个文档,是一组分层节点的根节点。在JS中,document对象使Document的一个实例。

  (3)Element节点表示文档中的所有HTML或XML元素,可以用来操作这些元素的内容和特性。

  (4)另外还有一些节点类型,分别表示属性、文本内容、注释、文档类型、CDATA区域和文档片段。

其中我们最应该关心的的是前三类节点,此外,文本节点与属性节点对我们操控文档也有着很大帮助。

刚刚提到节点也是对象,这就说明了几个问题:

  (1)每种节点都有其各自的属性和方法。

  (2)节点之间除了家族关系(层次关系)外,还可能有继承关系(这主要说的是抽象节点Node与其他类型的关系),所以会有继承下来的共有属性与方法。

(一)Node类型

Node节点作为所有节点类型的超类,定义了各类节点共享着的的相同属性和方法:

1. 每个节点都有的属性:

  (1)NodeType属性:表明节点类型。节点类型由在Node类型中定义的下列12个数值常量来表示,任何节点类型必居其一。

类型

nodeType常数值

描述

Node.ELEMENT_NODE

1

元素节点

Node.ATTRIBUTE_NODE

2

属性节点

Node.TEXT_NODE

3

文本节点

Node.CDATA_SECTION_NODE

4

字符数据节点(文本不会被解析器解析)

Node.ENTITY_REFERENCE_NODE

5

实体引用节点

Node.ENTITY_NODE

6

实体节点

Node.PROCESSING_INSTRUCTION_NODE

7

处理指令节点

Node.COMMENT_NODE

8

注释节点

Node.DOCUMENT_NODE

9

文档节点(DOM树的根节点)

Node.DOCUMENT_TYPE_NODE

10

向为文档定义的实体提供接口

Node.DOCUMENT_FRAGMENT_NODE

11

表示邻接节点和它们的子树。

Node.NOTATION_NODE

12

代表一个符号在DTD中的声明

  (2)childNodes属性:指向一个NodeList对象(包含一组同胞节点)。NodeList是一种类数组对象,用于保存一组有序的节点,可以通过位置来访问这些节点。NodeList的独特之处在于,他实际上是基于DOM结构动态执行查询的结果,这种特性的好处是DOM结构的变化能够自动反映在NodeList对象中,但也会产生一些问题,之后我们会讲到,主要是内存占用方面。另外还有一种HTMLCollection对象,和NodeList很类似,主要区别在于NodeList保存所有类型的节点,HTMLCollection只保存Element类型的节点,以及多一个namedItem方法(传入name属性返回节点)。

  (3)parentNode、previousSibling、nextSibling属性:分别指向父节点、前一个同胞节点、后一个同胞节点。

2. 每个节点都有的方法:

  (1)appendChild():用于向childNodes列表的末尾添加一个节点,返回新增的节点。

  (2)insertBefore():定位插入子节点,返回新增的节点。

  (3)replaceChild():替换节点,返回被替换的节点。技术上将,这个是将旧节点的所有关系指针复制到新节点上,同时删除自身关系,这样旧节点就成了一个孤儿节点,在文档中没有了自己的位置。

  (4)removeChild():移除节点。也是通过删除关系指针的方式。

(二)Document类型

JS通过Document类型表示文档。在浏览器中,doucument对象是HTMLDocument(继承自Document类型)的一个实例,表示整个HTML页面。而且,document对象是window对象的一个属性,因此可以将其作为全局对象来访问。Document节点具有下列特征:nodeType为9,nodeName为“#document”,nodeValue为null,parentNode为null,其子节点可能是一个Document、Element、ProcessingInstruction或Comment。

1. document子节点的快捷方式

(1)document.documentElement:指向元素,等价于document.childNodes[0]和document.firstChild

(2)document.body:指向元素

(3)document.doctype:指向的引用。由于各浏览器差别较大,因此这个属性用处很有限。

2. 文档信息

document对象的实例属性提供了网页的一些信息,包括title、URL、domain、referrer。

3. 查找元素

getElement系列:(1)ById,按Id查找,如果多个元素Id相同,则取第一次出现的元素。

(2)ByTagName,按标签名查找,返回一个NodeList,在HTML中返回HTMLCollection,可通过下标的方式取得单个元素。(下标值为数值-->调用item;下标值为字符串-->调用namedItem)

(3)ByName,HTML特有,返回一个HTMLCollection

(4)ByClass,HTML5新增,返回一个HTMLCollection

4. 特殊集合

常用的HTMLCollection对象:(1)document.anchors,包含所有带name特性的元素。

(2)document.forms,包含所有

元素。

(3)document.images,包含所有元素

(4)document.links,包含所有带href特性的元素。

5. DOM一致性检测

由于DOM分为多个级别,也包含多个部分,因此检测浏览器实现了DOM的哪些部分就十分必要了。document.implementation属性就是为此提供信息和功能的对象,与浏览器对DOM的实现直接对应。DOM1级只为document.implementation规定了一个方法,即hasFeature()。这个方法接受两个参数:要检测的DOM功能的名称及版本号。如果浏览器支持给定名称和版本的功能,则该方法返回true。与之类似的还有一个isSupported()方法(在DOM2中规定),但这两个方法都有一个问题,不同实现对什么特性返回true或false并不一致,所以最好还是使用能力检测(在编写代码前先检测浏览器的能力)。

6. 文档写入

(1)write()、writeln():动态写入内容,注意参数要先转义。

(2)open()、close():打开和关闭网页的输出流。

(三)Element类型

Element类型用于表现文档元素,提供了对元素标签名、子节点及特性的访问。Element节点具有以下特征:nodeType为1,nodeName为元素标签名(tagName属性),nodeValue为null,parentNode可能是Document或Element,其子节点可能是Element、Text、Comment等

1. HTML元素

所有HTML元素都有HTMLElement类型表示(继承自Element),有如下属性:id、title、lang、dir、className

2. 操作特性

getAttribute()、setAttribute()、removeAttribute()

3. attributes属性

指向一个NamedNodeMap对象,对象保存了元素的每一个Attr节点。NamedNodeMap对象拥有下列方法:getNamed()、removeNamedItem()、setNamedItem()、item(pos)返回指定位置的节点。

4. 创建元素

第一步:document.createElement():创建新元素,同时设置新元素的ownerDocument属性。参数可以是标签名,也可以是完整的元素标签。

第二步:用之前提到过的append、insert或replace方法把新元素添加到文档树。

5. 元素的子节点

childNodes属性,包含了元素间所有的节点。如果只想获得元素子节点,可以调用getElementTagName方法。

(四)Text类型

文本节点由Text类型表示,包含的是可以照字面解释的纯文本内容。纯文本可以包含转义后的HTML字符,但不能不含HTML代码。Text节点具有以下特征:nodeType为3,nodeName为"#text",nodeValue为节点所包含的文本(data属性),parentNode是一个Element,没有子节点。

1. 属性:节点.length = nodeValue.length = data.length

2. 操作文本节点的方法有:appendData()、deleteData()、insertData()、replaceData()、splitText()、substringData()

3. 创建文本节点:参考element节点

4. 规范文本节点:normalize()合并相邻文本节点,splitText()分割文本节点。

(五)Comment类型

注释在DOM中是通过Comment类型来表示的。Comment节点具有以下特征:nodeType为8,nodeName为"#comment",nodeValue为注释的内容,parentNode可能是Document或Element,没有子节点。

除没有splitText()方法外和Text类型基本一致。

(六)Attr类型:存在于元素的attributes属性中的节点。

---

还有其他几种类型,但在开发中使用概率不是很高,可以用到时再深入学习。

理解了DOM节点,就已经能够对文档进行基本操作,剩下的就是学习DOM的拓展与升级了,这些我们会在下一篇进行讨论。