Unidad 1.8. XML: un estándar para la descripción, intercambio de la información
En esta unidad el alumno estudiará el lenguaje de marcado extensible XML desde un punto de vista práctico, en el que a través de algunos ejemplos que le ayudarán a comprender los principales conceptos y componentes básicos, analizará la estructura de los documentos, sus etiquetas y la declaración, con el objetivo de ser capaz de crear su propio lenguaje XML al finalizar la unidad.
XML es una especificación creada por el W3C, para combinar en un mismo lenguaje el potencial de SGML con la sencillez de HTML, y conseguir los siguientes objetivos:
- Ser apto para internet.
- Ser compatible con SGML.
- Que sus documentos sean de creación sencilla y legibles en lenguaje humano.
- Que pueda ser soportado por una amplia variedad de aplicaciones.
De esta manera, los documentos generados con XML permitirán:
- Realizar búsquedas más precisas.
- Personalizar la información.
- Elaborar filtros.
- Crear y compartir información.
- La comunicación entre aplicaciones distintas.
A lo largo de esta unidad didáctica veremos la anatomía de un documento XML y aprenderemos las distintas fases y elementos que se necesitan para crear un documento con este lenguaje.
Anatomía de un documento XML
Un documento XML consta de dos partes:
1. Prólogo:
a) La declaración XML
b) La declaración del tipo de documento.
2. Ejemplar
a) Elementos
b) Atributos
c) Entidades y notaciones
d) Comentarios
- La declaración XML es la primera línea que aparece en un documento XML (ejemplo: <?xml version=“1.0” encoding=”ISO88591”standalone=”yes” ?>). Se utiliza para declarar el documento como un texto XML, además de señalar la versión de la norma W3C utilizada, el tipo de codificación y la declaración de documento autónomo.
- La declaración del tipo de documento indica el tipo de estructura que sigue un documento XML.
- El ejemplar: es la parte del documento donde se encuentra el contenido o la información propiamente dicha, a la que se le añade el marcado. En el ejemplar podemos encontrar: los elementos, los atributos, las entidades y notaciones, y los comentarios.
- Elementos: las piezas de información en las que podemos dividir un documento. Normalmente, constan de tres partes: etiqueta de inicio, contenido y etiqueta de finalización:
<ETIQUETA>contenido</ETIQUETA>
Podemos encontrar distintos tipos de elementos, dependiendo de la relación que mantienen entre sí dentro de la jerarquía de un documento:
- Elemento raíz o elemento documento: contiene todo el contenido del documento. Sólo puede haber uno.
- Elementos padre: un elemento es padre de otros que forman parte de su contenido.
- Elementos hermanos: aquellos que comparten un mismo padre.
- Elementos hijo: aquellos que se incluyen entre las etiquetas de un elemento padre.
- Elementos vacíos: se utilizan cuando no es necesario una etiqueta que contenga un contenido, pero sí una serie de atributos que faciliten información sobre la misma.
En la unidad veremos cómo hay que construir los nombres de los elementos, ya que para que puedan ser aceptados por los procesadores XML, no pueden tener unos caracteres determinados. Lo mismo ocurre con el contenido de un elemento.
- Atributos: son piezas de información que se añaden a un elemento para completar su información. Aparecen en la etiqueta de inicio del elemento, separados de su nombre por uno o más espacios. El nombre de los atributos cumple las mismas restricciones que el nombre de los elementos. Van seguidos del signo igual, y a continuación entre comillas su valor. Un mismo atributo no puede aparecer más de una vez en un elemento.
- Entidades y Notaciones: una entidad es un tipo de marcado que identifica el nombre del archivo que queremos añadir a nuestro documento XML, mientras que una notación es un tipo de marcado que establece la aplicación que procesa ese archivo.
- Comentarios: son anotaciones que pueden realizarse en un documento XML para hacer cualquier comentario que queramos. Se hacen entre las cadenas de caracteres <!y>. No son procesados por el procesador XML, y normalmente no se muestran en pantalla.
Creación de documentos XML
Consta de tres etapas:
- El diseño del documento,
- La definición (o declaración) de su estructura
- El marcado de los documentos.
En este apartado el alumno analizará los diferentes pasos que hacen falta para diseñar un documento XML y conocerá en qué consiste la declaración del documento XML, la cual consta de dos partes:
1. La declaración del tipo de documento propiamente dicha.
2. La Definición del Tipo de Documento (DTD):
- Declaraciones de tipos de elementos
- Declaraciones de listas de atributos
- Declaraciones de entidades
- Declaraciones de notaciones
Para más información consulta:
Bibliografía:
- Livingston, Dan. Guía esencial XML. Prentice Hall, 2002.
- Gutiérrez, Abraham, y Martínez Raúl. XML a través de ejemplo. RaMa,2001.
- Elliotte Rusty Harold. XML 1.1 Bible. 3ª ed. Wiley, 2004.
- World Wide Web Consortium (W3C). Extensible Markup Language (XML): (https://www.w3.org/XML/).
- World Wide Web Consortium (W3C). Extensible Markup Language (XML) 1.1. (Second Edition) W3C Recommendation 16 August 2006, edited in place 29 September 2006 (https://www.w3.org/TR/xml11/)
- xml.com (https://www.xml.com/)
- xmlfiles.com (https://www.xmlfiles.com/).