Un ejemplo de programación XML DOM sale mal
1. DOM y XML
DOM es la abreviatura de Document Object Model, que proporciona un modelo de programación estándar para interactuar con XML: (1) Proporciona métodos estándar para crear y recorrer. programas O actualizar el contenido del documento XML. (2) Proporciona un conjunto básico de interfaces de programación de aplicaciones (API) independientes del proveedor y del lenguaje que pueden satisfacer la mayoría de las necesidades de interacción con XML. Por tanto, las API DOM se convierten en un puente entre las aplicaciones y los documentos XML.
La especificación DOM Nivel 1 del W3C (World Wide Web Consortium) define dos conjuntos de interfaces de programación DOM: 6U6Linux Alliance
(1) Interfaz básica: La interfaz básica del W3C define dos grupos de Interfaces de programación DOM utilizadas en aplicaciones Interfaz para manipular documentos XML en el programa; 6U6Linux Alliance
(2) Interfaz extendida: la interfaz extendida W3C define algunas interfaces que son convenientes para los desarrolladores.
Todos los controladores XML deben admitir ambas formas de codificación de caracteres Unicode: UTF-8 y UTF-16. XML Parser puede leer documentos codificados con ISO-8859-1, Big-5 o Shift-JIS y convertirlos automáticamente a Unicode al cargar el documento.
Si la codificación de caracteres utilizada por el documento XML no es UTF-8 (el texto ASCII de 8 bits también es aceptable UTF-8) o UTF-16, entonces se debe proporcionar una declaración de codificación de caracteres en el XML. declaración, de lo contrario XML Parser puede estar equivocado. Por supuesto, incluso si se declara la codificación de caracteres, es posible que Parser no pueda manejarla (la codificación no es compatible), pero puede brindar la información solicitada correctamente. (Debido a que la declaración XML está escrita usando texto ASCII básico, Parser puede leer su contenido correctamente).
2. Introducción a MSXML 4.0
MSXML (Microsoft XML Core Services) es una biblioteca COM proporcionada por Microsoft para procesar documentos XML. MSXML DOM no solo implementa la interfaz básica y la interfaz extendida definidas por la especificación W3C DOM Nivel 1, sino que también proporciona métodos adicionales para admitir la transformación XSL (XSLT), XPath, espacios de nombres y tipos de datos. Además de admitir la codificación de caracteres requerida por la especificación, MSXML también admite más formatos de codificación de caracteres y utiliza internamente la codificación de caracteres Unicode UCS-2 para procesar todo el texto en documentos XML.
Este artículo utiliza Visual C++ 6.0 como entorno de desarrollo para introducir el uso de DOM en MSXML4.0 SDK. Además, también se utiliza habitualmente SAX en MSXML.
2.1. MSXML DOM
MSXML DOM es el tema central de este artículo. Proporciona una interfaz rica para facilitar la manipulación de documentos XML en programas. El DOM proporciona una representación completa de un documento XML en la memoria, permitiendo el acceso aleatorio a todo el contenido del documento. DOM permite que las aplicaciones dependan de la estructura lógica proporcionada por MSXML Parser para procesar información basada en XML. El flujo de trabajo y el principio se muestran en la siguiente figura (derivada del SDK de MSXML 4.0):
Cuando MSXML Parser carga un documento XML.