El lenguaje de marcas extensibles
Enviado por MayMV • 21 de Febrero de 2012 • Práctica o problema • 3.274 Palabras (14 Páginas) • 580 Visitas
Introducción.
El lenguaje de marcas extensibles (Extensible Markup Language, XML) no se considera como una tecnología para base de datos.
XML tiene sus raíces en la gestión de documentos y esta derivado de un lenguaje para estructurar documentos grandes conocidos como lenguajes estándar generalizado de marcas (SGML). XML puede representar datos de base de datos, así como muchas clases de datos estructurados usadas en aplicaciones de negocios.
Es útil porque sirve para cuando las aplicaciones se deben comunicar con otra aplicación o integrar información de varias aplicaciones.
Conceptos básicos.
Es importante antes de comenzar el tema dar a conocer los siguientes conceptos:
Marca: se refiere a cualquier elemento en un documento del que no se tiene intención que se parte de la salida impresa.
Lenguaje de marcas: es una descripción formal de qué parte del documento es contenido, qué parte es marca y y lo que significa la marca.
Elemento: un par de etiquetas de inicio y finalización coincidentes y todo el texto que aparece entre ellas.
7.1 Antecedentes
Los lenguajes de marcas evolucionaron desde la especialización de instrucciones que indican como imprimir partes del documento para la función del documento.
Las marcas funcionales ayudan a la extracción automática de partes claves de los documentos.
Para la familia de los lenguajes de marcado, las marcas adoptan la forma de etiqueta encerrado entre corchetes angulares (< >).
Las etiquetas se usan en pares, estas delimitan el comienzo y el final de la porción del documento a la cual se refiere la etiqueta. Por ejemplo:
<Titulo> Fundamentos de bases de datos </Titulo>
XML no prescribe las etiquetas permitidas, y se pueden establecer etiquetas según cada necesidad. Esta es la clave de la función principal de XML en la representación e intercambio de datos.
Comparado con el almacenamiento de los datos de una base de datos, la representación XML puede parecer poco eficiente. Sin embargo, XML presenta ventajas significativas cuando se usa para el intercambio de datos.
Al igual que SQL es el lenguaje dominante para consultar los datos relacionales XML se está convirtiendo en el formato dominante para el intercambio de datos.
7.2 ESTRUCTURA DE DATOS XML.
Los documentos XML deben tener un único elemento raíz que abarca el resto de elementos en el documento. Además los documentos XML se deben anidar adecuadamente
<materia>…<profesor>…</profesor>…</materia>
Esta anidado adecuadamente, mientras que,
<materia>…<profesor>…</materia>…</profesor>
No esta adecuadamente anidado.
Se dice que el texto aparece en el contexto de un elemento si aparece entre la etiqueta de inicio y la etiqueta de finalización de dicho elemento. Las etiquetas están anidadas adecuadamente si toda etiqueta de inicio tiene una única etiqueta de finalización coincide que esta en el contexto del mismo elemento padre.
El texto puede estar mezclado con los subelementos de otro elemento, esta libertad tiene mas sentido en un contexto de procesamiento de documento que en contexto de procesamiento de datos y no es particularmente útil para representar en XML datos mas estructurados como son el contenido de la base de datos.
Las representaciones anidadas se usan ampliamente en las aplicaciones de intercambio de datos XML para evitar las reuniones.
Un elemento que no contiene subelementos o texto <elemento> </elemento>, se puede abreviar como </elemento>.
En XML se debe de introducir un mecanismo de espacios de nombres para permitir a las organizaciones nombres únicos globalmente para que se usen como marcas de elementos en los documentos.
Algunas veces se necesitan almacenar valores que contengan etiquetas sin que sean interpretadas como etiquetas XML. XML permite esta construcción para ello.
<![CDATA [<cuenta>…</cuenta>]]>
Esta expresión se trata como datos de texto normal, no como una etiqueta
7.3 ESQUEMA DE LOS DOCUMENTOS XML.
Los documentos XML se pueden crear de forma predeterminada sin un esquema asociado. Un elemento puede tener entonces cualquier subelemento o atributo aunque dicha libertad puede ser aceptable algunas veces, dada la naturaleza autodescriptiva del formato de datos, no es útil generalmente cuando los documentos XML se deben procesar automáticamente como parte de una aplicación o incluso cuando se van a dar formato en XML a grandes cantidades de datos relacionados.
7.3.1 Definicion de tipo de documentos.
La definición de tipos de documentos (document type definition, DTD) es una parte opcional de un documento XML. El principal de DTD es similar al de un esquema restringir el tipo de información presente en el documento. Sin embargo, DTD no restringe en realidad los tipos básicos como entero o cadena. En su lugar solamente restringe el aspecto de subelementos y atributos de un elemento.
DTD es principalmente una lista de reglas que indican el patrón de subelementos que aparecen en un elemento. Las definiciones de tipos de documentos están fuertemente conectadas con la herencia del formato del documento XML. Debido a esto no son adecuadas por varios motivos para servir como estructura de tipos de XML para aplicaciones de procesamiento de datos.
Algunas limitaciones de la DTD como mecanismo de esquema:
• No se pueden declarar el tipo de elementos y atributos de testo individuales.
• Es dificil usar el mecanismo DTD para especificar conjuntos desordenados de subelementos.
7.4 CONSULTA Y TRANSFORMACIONES.
Dado el creciente número de aplicaciones que usan XML para intercambiar las herramientas para una gestión efectiva de datos XML están siendo cada vez más importantes. las herramientas para consultar y transformar los datos XML son esenciales para extraer información de grandes cuerpos de datos XML y para convertir los datos entre distintas representaciones en XML.
Varios lenguajes proporcionan grados crecientes de capacidades de consulta y transformación:
• XPath es un lenguaje para expresiones de rutas de accesos.
• XSLT fue diseñado para ser un lenguaje de transformación como parte del sistema de hojas de estilo XSL, que se usa para controlar el formato de los datos XML en HTML u otro lenguaje de impresión o visualización. Aunque diseñado para el formato, XSLT puede generar XML como salida y puede expresar muchas consultas interesantes. Además, es
...