Red de conocimiento informático - Problemas con los teléfonos móviles - Cómo abrir un archivo xml de Python

Cómo abrir un archivo xml de Python

Hay muchos artículos sobre la lectura de xml con Python, pero la mayoría publica un archivo xml primero y luego usa código para procesar el archivo. Esto no es fácil de aprender para los principiantes. Espero que este artículo pueda enseñarle cómo usar Python para leer archivos xml de una manera más comprensible.

¿Qué es xml?

xml es un lenguaje de marcado extensible (lenguaje de marcado extensible), que se puede utilizar para marcar datos y definir tipos de datos. Es un lenguaje fuente que permite a los usuarios definir su propio lenguaje de marcado.

abc.xml

4

prueba

</login>

< ID del artículo ="2">

Zope

¿Ok? estructuralmente mira, es muy similar a nuestro lenguaje de marcado de hipertexto HTML de uso común. Pero están diseñados para diferentes propósitos; el lenguaje de marcado de hipertexto está diseñado para mostrar datos, con énfasis en la apariencia de los datos. El lenguaje de marcado de hipertexto está diseñado para transmitir y almacenar datos, y se centra en el contenido de los datos.

Por lo tanto, tiene las siguientes características:

En primer lugar, consta de pares de etiquetas,

Las etiquetas pueden tener atributos :

Los pares de etiquetas pueden incrustar datos: abc

Los pares de etiquetas pueden incrustar subetiquetas (con relaciones jerárquicas) :

Obtener atributos de etiqueta

Por lo tanto, aquí se explica cómo leer este tipo de archivo usando Python.

#coding=utf-8import ?xml.dom.minidom#abrir documento xml dom = xml.dom.minidom.parse('abc.xml')#obtener raíz del objeto del elemento del documento = dom.documentElementprint root .nodeNameprint root.nodeValueprint root.nodeTypeprint root.ELEMENT_NODE

El módulo mxl.dom.minidom se utilizará para procesar archivos xml, así que preséntelo primero.

xml.dom.minidom.parse()? se utiliza para abrir un archivo xml y obtener la variable dom del objeto del archivo.

documentElement se utiliza para obtener el elemento de documento del objeto dom y entregar el objeto obtenido a la raíz.

Cada nodo tiene sus atributos nodeName, nodeValue y nodeType.

nodeName es el nombre del nodo.

nodeValue es el valor del nodo y solo es válido para nodos de texto.

nodeType es el tipo de nodo. El tipo de directorio es ELEMENT_NODE

Ahora tiene el siguiente contenido:

'ATTRIBUTE_NODE'

'CDATA_SECTION_NODE'

'COMMENT_NODE'

'DOCUMENT_FRAGMENT_NODE'

'DOCUMENT_NODE'

'DOCUMENT_TYPE_NODE'

'ELEMENT_NODE'

'ENTITY_NODE'

'ENTITY_REFERENCE_NODE'

'NOTATION_NODE'

'PROCESSING_INSTRUCTION_NODE'

'TEXT_NODE'

¿Tipo de nodo? -?Constantes con nombre