29.¿Qué es XML?
XML es la abreviatura de Extensible Markup Language. XML es un conjunto de reglas para definir el marcado semántico, que divide un documento en partes e identifica estas partes. También es un lenguaje de metamarcado, es decir, define un lenguaje sintáctico que se utiliza para definir otros lenguajes de marcado estructurados semánticamente específicos de un dominio.
XML es un lenguaje de metamarcado
Lo primero que hay que entender sobre XML es que no es lo mismo que el lenguaje de marcado de hipertexto (HTML) o un formateador. Estos lenguajes definen un conjunto fijo de etiquetas para describir una cierta cantidad de elementos. Si el lenguaje de marcado no tiene el marcado requerido, el usuario no tiene otra opción. Sólo pueden esperar a que la próxima versión del lenguaje de marcado incluya marcado, pero eso depende de la elección del desarrollador de software.
Pero XML es un lenguaje de metamarcado. Los usuarios pueden definir las etiquetas que necesitan. Estas etiquetas deben crearse de acuerdo con ciertos principios generales, pero existe una flexibilidad considerable en el significado de las etiquetas. Por ejemplo, si el usuario se ocupa de cuestiones relacionadas con el árbol genealógico y necesita describir el nacimiento, la muerte, el lugar de entierro, la familia, el matrimonio, el divorcio, etc. de una persona, se debe crear una etiqueta para cada elemento. El marcado recién creado se puede describir mediante una definición de tipo de documento (a menudo denominada DTD en los siguientes capítulos). Aprenderá más sobre las DTD en la segunda parte de este libro. Por ahora, piense en una DTD como un glosario y sintaxis para un determinado tipo de documento. Por ejemplo, el archivo MOL.DTD en Chemical Markup Language de Peter Murray-Rust (abreviado como CML) describe el vocabulario y la sintaxis de las ciencias moleculares: incluida la química, la cristalografía, la física del estado sólido y más. DTD también se utiliza para describir la sintaxis de la ciencia molecular. Incluye etiquetas para átomos, moléculas, enlaces, espectros, etc. Este DTD*** puede ser utilizado por muchas personas diferentes en el campo de la ciencia molecular.
XML define un conjunto de metasintaxis que deben seguir los lenguajes de marcado específicos del dominio, como MusicML, MathML y CML. Si una aplicación puede entender este metalenguaje, entonces puede entender automáticamente todos los lenguajes creados a partir de este metalenguaje. El navegador no tiene que conocer de antemano cada marcado utilizado por muchos lenguajes de marcado diferentes. De hecho, el navegador sólo aprende sobre el marcado utilizado en un documento específico o su DTD cuando lee ese documento. Se proporcionan instrucciones detalladas sobre cómo mostrar el contenido de estas etiquetas en una hoja de estilo separada adjunta al documento. Por ejemplo, mire la ecuación de Schrödinger:
Los artículos científicos están llenos de este tipo de ecuaciones, pero los científicos tuvieron que esperar años antes de que los desarrolladores de navegadores admitieran el marcado necesario para escribir las fórmulas matemáticas más básicas. Los músicos tienen la misma limitación, ya que ni Netscape Navigator ni Internet Explorer soportan todavía la notación musical.
Tener XML significa que no tienes que esperar a que los desarrolladores del navegador satisfagan las necesidades del usuario. Los usuarios pueden crear el marcado que necesitan y simplemente decirle al navegador cómo mostrarlo cuando lo necesiten.
XML describe la estructura y la semántica, no el formato
Lo segundo que hay que entender sobre XML es que las etiquetas XML describen la estructura y el significado del documento. No describe el formato de los elementos de la página. Las hojas de estilo se pueden utilizar para agregar información de formato a un documento. El documento en sí describe sólo el marcado contenido en el documento, no su apariencia.
lt;COMPOSERgt;Jacques Moralilt;/COMPOSERgt;
lt;COMPOSERgt;Henri Belololt;/COMPOSERgt;
lt;COMPOSERgt.Victor Willislt;/COMPOSERgt ;
lt;PRODUCERgt;Jacques Moralilt;/PRODUCERgt;
lt;PUBLISHERgt;PolyGram Recordslt;/PUBLISHERgt;
lt;LENGTHgt;6:20lt; /LENGTHgt;
lt;YEARgt; 978lt;/YEARgt;
lt;ARTISTgt;Gente del pueblolt;/ARTISTgt;
lt;/SONGgt; p>
p>
En lugar de utilizar etiquetas genéricas como Las etiquetas XML también permiten que robots automatizados no humanos encuentren fácilmente todas las canciones de un documento. En HTML, los bots sólo pueden decirnos que el elemento es dt. El robot no podía decir si dt representaba el título o la definición de la canción, o simplemente el formato de texto con sangría favorito de algún diseñador. De hecho, es probable que un documento contenga múltiples elementos dt con los tres significados anteriores. Se pueden elegir nombres de elementos XML para que tengan un significado adicional en otros contextos. Por ejemplo, el nombre del elemento podría ser el nombre de dominio de la base de datos. XML es más flexible que HTML y adecuado para una variedad de aplicaciones porque no es necesario utilizar un marcado limitado para muchos propósitos diferentes.