XML-Lenguaje de marcas

Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones

Escrito el en español con un tamaño de 22,92 KB

DOC XML PARTES

  • Prólogo:


    Informa al Intérprete encargado de procesar el documento de todos aquellos datos que Necesita para realizar su trabajo. Consta de dos partes:
    • Definición de XML


    • Declaración Del tipo de documento

  • Ejemplar:


    Contiene los Datos del documento que se quiere procesar.

    Es el elemento raíz del Documento y ha de ser único

Declaración de tipo de documento



Ya Habíamos visto que permite al autor definir restricciones y carácterísticas En el documento, aunque no habíamos profundizado en las partes que la Forman:

  • La declaración del tipo de Documento propiamente dicha


    Comienza con el texto que indica el Nombre del tipo, precedido por la cadena " " separado del Nombre del tipo por, al menos, un espacio. El nombre del tipo ha de ser Idéntico al del ejemplar del documento XML en el que se está trabajando.

  • La definición del tipo de Documento

    Permite asociar al documento una definición de tipo DTD , la cual Se encarga de definir las cualidades del tipo.
    • Subconjunto Interno:


      Contiene las declaraciones que pertenecen exclusivamente a un Documento y no es posible compartirlas. Se localizan dentro de unos Corchetes que siguen a la declaración de tipo del documento.

    • Subconjunto Externo:

      Están localizadas en un documento con extensión dtd que puede Situarse en el mismo directorio que el documento XML.
      • <!DOCTYPE Nombre_ejemplar SYSTEM "URI"

En Este caso, se especifica un URI donde pueden localizarse las declaraciones.

      • <!DOCTYPE Nombre_ejemplar PUBLIC "id_publico" "URI"

En Este caso también se especifica un identificador, que puede ser utilizado por El procesador XML para intentar generar un URI alternativo, posiblemente basado En alguna tabla. Como se puede observar también es necesario incluir algún URI.

·Ahora Los corchetes pierden sentido, para localizar las declaraciones del tipo de Documento externo mediante una declaración explícita de subconjunto externo se Utiliza:

Definición de la sintaxis de documentos XML.


  • El dato será un elemento si Cumple alguna de las siguientes condiciones:
    • Contiene Subestructuras.
    • Es de un Tamaño considerable.
    • Su valor Cambia frecuentemente.
    • Su valor va a Ser mostrado a un usuario o aplicación.
  • Los casos en los que el dato Será un atributo son:
    • El dato es de Pequeño tamaño y su valor raramente cambia, aunque hay situaciones en las Que este caso puede ser un elemento.
    • El dato solo Puede tener unos cuantos valores fijos.
    • El dato guía El procesamiento XML pero no se va a mostrar.

Los Espacios de nombres, o namespaces, ¿qué nos permiten?

  • Diferenciar entre los elementos Y atributos de distintos vocabularios con diferentes significados que Comparten nombre.
  • Agrupar todos los elementos y Atributos relacionados de una aplicación XML para que el software pueda Reconocerlos con facilidad.

¿Cómo se Declaran?

xmnls:"URI_namespace"

¿Y si se Usa un prefijo que nos informe sobre cuál es el vocabulario al que está Asociada esa definición?

xmnls:prefijo="URI_namespace"

En ambos Casos URI_namespace es la localización del conjunto del vocabulario del espacio De nombres al que se hace referencia.



Definiciones de tipo de documento, DTD.


Están Formadas por una relación precisa de qué elementos pueden aparecer en un Documento y dónde, así como el contenido y los atributos del mismo. Garantizan Que los datos del documento XML cumplen las restricciones que se les haya Impuesto en el DTD, ya que estas últimas permiten:

  • Especificar la estructura del Documento.
  • Reflejar una restricción de Integridad referencial mínima utilizando (ID e IDREF).
  • Utilizar unos pequeños Mecanismos de abstracción comparables a las macros, que son las entidades.
  • Incluir documentos externos.

¿Cuáles Son los inconvenientes de los DTD?
Los principales son:

  • Su sintaxis no es XML.
  • No soportan espacios de Nombres.
  • No definen tipos para los Datos. Solo hay un tipo de elementos terminales, que son los datos Textuales.
  • No permite las secuencias no Ordenadas.
  • No es posible formar claves a Partir de varios atributos o elementos.
  • Una vez que se define un DTD no Es posible añadir nuevos vocabularios.

Declaraciones De tipos de elementos terminales.

Los tipos Terminales son aquellos elementos que se corresponden con hojas de la Estructura de árbol formada por los datos del documento XML asociado al DTD. La Declaración de tipos de elementos está formada por la cadena "<!ELEMENT" Separada por, al menos un espacio del nombre del elemento XML que se declara, y Seguido de la declaración del contenido que puede tener dicho elemento.

En el caso De elementos terminales, es decir, aquellos que no contienen más elementos, Esta declaración de contenido es dada por uno de los siguientes valores:

  • EMPTY:


    Indica que el Elemento no es contenedor. Por ejemplo, la siguiente definición muestra un Elemento A que no contiene nada:
  • ANY:


    Permite que El contenido del elemento sea cualquier cosa. Un ejemplo de definición de Un elemento de este tipo es:
  • (#PCDATA):


    Indica que Los datos son analizados en busca de etiquetas, resultando que el elemento No puede contener elementos, es decir solo puede contener datos de tipo Carácter exceptuando los siguientes: <, &, ]], >. Si es de este Tipo, el elemento A tendrá una definición como:

Declaraciones De tipos de elementos no terminales.

Una vez Que sabemos el modo de definir las hojas de un árbol de datos veamos cómo Definir sus ramas, es decir los elementos que están formados por otros Elementos.
Para definirlos utilizamos referencias a los grupos que los componen tal y como Muestra el ejemplo:


En este Caso se ha definido un elemento A que está formado por un elemento B seguido de Un elemento C.

¿Y qué Sucede cuando un elemento puede aparecer en el documento varias veces, hay que Indicarlo de algún modo? Pues sí, también hay que indicar cuando un elemento Puede no aparecer. Para ello usamos los siguientes operadores, que nos permiten Definir la cardinalidad de un elemento:

  • Operador opción, ?


    Indica que el Elemento no es obligatorio. En el siguiente ejemplo el subelemento trabajo Es opcional.
  • Operador uno-o-más, +


    Define un Componente presente al menos una vez. En el ejemplo definimos un elemento Formado por el nombre de una provincia y otro grupo, que puede aparecer Una o varias veces.
  • Operador cero-o-mas, *


    Define un Componente presente cero, una o varias veces. En el ejemplo el grupo (cp, Ciudad) puede no aparecer o hacerlo varias veces.
  • Operador de elección, |


    Cuando se Utiliza sustituyendo las comas en la declaración de grupos indica que para Formar el documento XML hay que elegir entre los elementos separados por Este operador.

Declaraciones de listas de atributos para Los tipos de elementos



Ya sabemos Cómo declarar elementos, ahora veamos el modo de declarar los atributos Asociados a un elemento.
Para ello utilizamos la cadena <!ATTLIST Seguida del nombre del elemento asociado al atributo que se declara.

Al igual Que los elementos no todos los atributos son del mismo tipo, los más destacados Son:

  • Enumeración, es decir, el Atributo solo puede tomar uno de los valores determinados dentro de un Paréntesis y separados por el operador |.
  • CDATA, se utiliza Cuando el atributo es una cadena de texto.

  • ID, permite Declarar un atributo identificador en un elemento. Hay que recordar que Este valor ha de ser único en el documento.

  • IDREF, permite Hacer referencias a identificadores.

  • NMTOKEN, permite Determinar que el valor de un atributo ha de ser una sola palabra Compuesta por los caracteres permitidos por XML.

¿También Hemos de declarar si el valor de un atributo es obligatorio o no? Si, para ello Se usan los siguientes modificadores:

  • #IMPLIED, determina Que el atributo sobre el que se aplica es opcional.

  • #REQUIRED, determina Que el atributo tiene carácter obligatorio.

  • #FIXED, permite Definir un valor fijo para un atributo independientemente de que ese Atributo se defina explícitamente en una instancia del elemento en el Documento XML.
  • Literal, asigna a un atributo El valor dado por una cadena entre comillas.

Declaraciones de entidades



¿Qué Sucede si queremos declarar valores constantes dentro de los documentos?
¿podemos?
Las entidades nos permiten definir constantes en un documento XML. Cuando se Usan dentro del documento XML se limitan por "&" y ";", Por ejemplo &entidad;
¿Cómo trabaja el intérprete con ellos? Al procesar el documento XML, el Intérprete sustituye la entidad por el valor que se le ha asociado en el DTD.
No admiten recursividad, es decir, una entidad no puede hacer referencia A ella misma.
Para definir una entidad en un DTD se usa el elemento <!ENTITY>

Las entidades Pueden ser de tres tipos:

  • Internas:


    Existen cinco Entidades predefinidas en el lenguaje, son:
    • <:


      Se Corresponde con el signo menor que, <.
    • &gt;:
      Hace Referencia al signo mayor que, >.

    • ":

      Son las Comillas rectas dobles, ''.

    • &após;:

      Es el apóstrofe O comilla simple, '.

    • &:

      Es el et o Ampersand, &.
      Utilizando la siguiente sintaxis:

Por Ejemplo, <!ENTITY dtd "Definiciones de Tipo de Documento">

Externas:


Permiten establecer una Relación entre el documento XML y otro documento a través de la URL de éste último. Un ejemplo de declaración de una entidad externa es:


En este Caso el contenido de los ficheros es analizado, por lo que deben seguir la Sintaxis XML.

De parámetro:


Permite dar nombres a Partes de un DTD y hacer referencia a ellas a lo largo del mismo. Son Especialmente útiles cuando varios elementos del DTD comparten listas de Atributos o especificaciones de contenidos. Se denotan por %entidad;

< !ENTITY %dirección "calle, numero?, ciudad, cp">
< !ENTITY alumno (dni, %dirección;)>
< !ENTITY ies (nombre, %dirección;)>

De parámetro externas:


Permite incluir En un DTD elementos externos, lo que se aplica en dividir la definición DTD en Varios documentos.


Declaraciones de notación



Cuando se Incluyen ficheros binarios en un fichero, ¿cómo le decimos qué aplicación ha de Hacerse cargo de ellos? La respuesta es utilizando notaciones. La sintaxis para Declarar notaciones es:

< !NOTATION nombre SYSTEM aplicación>

Por Ejemplo, una notación llamada gif donde se indica que se hace referencia A un editor de formatos gif para visualizar imágenes será:

< !NOTATION gif SYSTEM "gifEditor.Exe">

Para Asociar una entidad externa no analizada, a esta notación basta declarar dicha Entidad del siguiente modo:

< !ENTITY dibujo SYSTEM "imagen.Gif" NDATA gif>

Secciones condicionales



Permiten Incluir o ignorar partes de la declaración de un DTD. Para ello se usan dos Tokens:

  • INCLUDE, permite que Se vea esa parte de la declaración del DTD. Su sintaxis es:

Por Ejemplo:

<![INCLUDE [ <!ELEMENT nombre (#PCDATA)>] ] >

  • IGNORE, permite Ocultar esa sección de declaraciones dentro del DTD. La forma de uso es:

Por Ejemplo:

<![IGNORE [<!ELEMENT clave (#PCDATA)>] ] >

XML Schema



Los DTD Permiten diseñar un vocabulario para ficheros XML, pero, ¿qué sucede Cuando los valores de los elementos y atributos de esos ficheros han de Corresponder a datos de un tipo determinado, o cumplir determinadas Restricciones que no pueden reflejarse en los DTD? Para ello se definen XML Schemas.

¿También se Definen en ficheros planos?
Si, ya que son documentos XML, pero en este Caso la extensión de los archivos es xsd, motivo por el cual también se les Denomina documentos XSD.

Los Elementos XML que se utilizan para generar un esquema han de pertenecer al Espacio de nombre XML Schema, que es: http://www.W3.Org/2001/XMLSchema.

El Ejemplar de estos ficheros es <xs:schema>, contiene declaraciones Para todos los elementos y atributos que puedan aparecer en un documento XML Asociado válido. Los elementos hijos inmediatos de este ejemplar son <xs:element> Que nos permiten crear globalmente un elemento. Esto significa que el elemento Creado puede ser el ejemplar del documento XML asociado.

Tipos de datos



Son los Distintos valores que puede tomar el atributo type cuando se declara un elemento O un atributo y representan el tipo de dato que tendrá el elemento o atributo Asociado a ese type en el documento XML.

Algunos de Estos valores predefinidos son:

  • string, se Corresponde con una cadena de caracteres UNICODE.

  • boolean, representa Valores lógicos, es decir que solo pueden tomar dos valores, true o false.

  • time, hora en el Formato hh:mm:ss.

  • date, fecha en formato CCYY-MM-DD.

  • gYearMonth, representa Un mes de un año determinado mediante el formato CCYY-MM.

  • gYear, indica un Año gregoriano, el formato usado es CCYY.

  • gMothDay, representa Un día de un mes mediante el formato –MM-DD.

  • gDay, indica el Ordinal del día del mes mediante el formato –DD, es decir el 4º día del Mes será –04.

  • gMonth, representa El mes mediante el formato –MM. Por ejemplo, Febrero es –02.

  • language, representa Los identificadores de lenguaje, sus valores están definidos en RFC 1766.

  • ID, IDREF, ENTITY, NOTATION, MTOKEN

    . Representan Lo mismo que en los DTD's (ver apartado 2.3).

Facetas de los tipos de datos



¿Cuáles Son las restricciones que podemos aplicar sobre los valores de los datos de un Elemento o atributo?
Están definidos por las facetas, que solo pueden aplicarse sobre tipos Simples utilizando el elemento xs:restriction.
Se expresan como un Elemento dentro de una restricción y se pueden combinar para lograr restringir Más el valor del elemento. Son, entre otros:

  • Length, Minlength, maxlentgh:


    Longitud del tipo de datos.

  • Enumeration:

    Restringe a Un determinado conjunto de valores.
  • Whitespace:


    Define el Tratamiento de espacios (preserve/replace, collapse).
  • (max/min)(In/Ex)clusive:


    Límites Superiores/inferiores del tipo de datos. Cuando son Inclusive el valor que Se determine es parte del conjunto de valores válidos para el dato, Mientras que cuando se utiliza Exclusive, el valor dado no pertenece al Conjunto de valores válidos.

  • TotalDigits, fractionDigits:

    número de Dígitos totales y decimales de un número decimal.
  • Pattern:


    Permite Construir máscaras que han de cumplir los datos de un elemento. La Siguiente tabla muestra algunos de los caracteres que tienen un significado especial para la generación de las máscaras.

Elementos para Hacer patrones.

Patrón

Significado

[A-Z A-z]

Letra.

[A-Z]

Letra Mayúscula.

[a-z]

Letra Minúscula.

[0-9]

Dígitos Decimales.

\D

Cualquier Carácter excepto un dígito decimal.

(A)

Cadena Que coincide con A.

A | B

Cadena Que es igual a la cadena A o a la B.

Elementos para Hacer patrones.

Patrón

Significado

AB

Cadena Que es la concatenación de las cadenas A y B.

A?

Cero O una vez la cadena A.

A+

Una O más veces la cadena A.

A*

Cero O más veces la cadena A.

[abcd]

Alguno De los caracteres que están entre corchetes.

[^abcd]

Cualquier Carácter que no esté entre corchetes.

\t

Tabulación.

Elementos del lenguaje



Algunos de Los más usados son:

  • Esquema, xs:schema, Contiene la definición del esquema.
  • Tipos complejos, xs:complexType, Define tipos complejos.
  • Tipos simples, xs:simpleType, Permite definir un tipo simple restringiendo sus valores.
  • Restricciones, xs:restriction, Permite establecer una restricción sobre un elemento de tipo base.
  • Agrupaciones, xs:group, Permite nombrar agrupaciones de elementos y de atributos para hacer Referencia a ellas.
  • Secuencias, xs:secuence, Permite construir elementos complejos mediante la enumeración de los que Les forman.
  • Alternativa, xs:choice, Representa alternativas, hay que tener en cuenta que es una o-exclusiva.
  • Contenido mixto, definido dando Valor true al atributo mixed del elemento xs:complexType, permite Mezclar texto con elementos.
  • Secuencias no ordenadas, xs:all, Representa a todos los elementos en cualquier orden.

Definición de tipos de datos XML Schema



En los DTD Se diferencia entre los elementos terminales y los no terminales ¿en este caso También?
Si, este lenguaje permite trabajar tanto con datos simples como con Estructuras de datos complejos, es decir, compuestos por el anidamiento de Otros datos simples o compuestos.

  • Tipos de datos Simples



    Estos datos se suelen definir para hacer una restricción sobre un tipo de Datos XDS ya definido y establece el rango de valores que puede tomar.

También Se pueden crear tipos de datos simples basados en listas de valores utilizando El atributo derivedBy de simpleType.

  • Tipos de datos Compuestos


    El elemento xsd:complexType permite definir estructuras complejas de Datos. Su contenido son las declaraciones de elementos y atributos, o Referencias a elementos y atributos declarados de forma global. Para Determinar el orden en que estos elementos aparecen en el documento XML se Utiliza el elemento .

Asociación con documentos XML



Una vez Que tenemos creado el fichero XSD ¿cómo lo asociamos a un fichero XML?

El modo de Asociar un esquema a un documento XML es un espacio de nombres al ejemplar del Documento, donde se indica la ruta de localización de los ficheros esquema Mediante su URI, precedida del prefijo " xsi:
".

Documentación del esquema



Una vez Que hemos visto como crear un esquema vamos a ver el modo de incorporar cierta Documentación (quién es el autor, limitaciones de derechos de autor, utilidad Del esquema, etc.) al mismo.

Podemos Pensar que un método para añadir esta información es utilizar comentarios. El Problema es que los analizadores no garantizan que los comentarios no se Modifiquen al procesar los documentos y por tanto, que los datos añadidos no se Pierdan en algún proceso de transformación del documento.

En lugar De usar los comentarios, XML Schema tiene definido un elemento xs:annotation Que permite guardar información adicional.
Este elemento a su vez puede Contener una combinación de otros dos que son:

  • xs:documentation, además de Contener elementos de esquema puede contener elementos XML bien Estructurados.
    También permite determinar el idioma del documento mediante el atributo xml:
    Lang.

  • xs:appinfo, se Diferencia muy poco del elemento anterior, aunque lo que se pretendíó Inicialmente era que xs:documentation fuese legible para los usuarios y Que xs:appinfo guardase información para los programas de software.
    También es usado para generar una ayuda contextual para cada elemento Declarado en el esquema.

Herramientas de creación y validación



  • Editix XML Editor (Gratuito).
  • Microsoft Core XML Services (MSXML) (Gratuito).
  • XMLFox Advance.

Entradas relacionadas: