¿Cuál es el atributo de dom?
DOM es una propiedad del modelo de objetos de documento.
Document Object Model (DOM) es una interfaz de programación estándar recomendada por la organización W3C para procesar lenguajes de marcado extensibles. Es una interfaz de programación de aplicaciones (API) independiente de la plataforma y el lenguaje que puede acceder dinámicamente a programas y scripts para actualizar su contenido, estructura y estilo de documentos www (los documentos HTML y XML se definen a través de secciones de descripción). El documento se puede procesar más y los resultados del procesamiento se pueden agregar a la página actual.
DOM es un documento API basado en árbol que requiere que todo el documento esté representado en la memoria durante el procesamiento. Otra API simple es SAX basada en eventos, que se puede utilizar para procesar documentos XML muy grandes. Debido a su gran tamaño, no son adecuados para procesarlos todos en la memoria.
Extensión del árbol DOM
Según la definición del W3C, los atributos de los nodos del árbol DOM incluyen el nombre de la etiqueta, el tipo de nodo, el contenido del nodo, la colección de objetos del nodo principal y los objetos del nodo secundario. Colecciones, colecciones de objetos de nodos hermanos, etc. Estos atributos de los nodos del árbol DOM brindan el contenido básico y la información estructural de la página, pero no pueden reflejar la relevancia de las etiquetas, los atributos y el contenido para el tema y, por lo tanto, carecen de la semántica necesaria para la extracción del tema.
La idea general de expandir el árbol DOM es: considerar las categorías de etiquetas de página HTML y el impacto de los valores de los atributos de etiqueta en la información del tema de la página, e incorporar este impacto en el cálculo de los elementos de contenido de la página y el árbol DOM El nodo se expande semánticamente y se introduce el factor de influencia del nodo para describir la importancia del nodo en el árbol.
Para ver el contenido anterior, consulte el modelo de objetos de documento de la Enciclopedia Baidu