Introdução ao XML

Fevereiro 2017


Apresentação do XML


XML (entenda eXtensible Markup Language e traduza linguagem de marcação estendida, ou linguagem de marcação extensível) é um tipo de linguagem HTML melhorada para definir novas tags. Na verdade, trata-se de uma linguagem para formatar documentos usando tags (markup).

Ao contrário do HTML, que é considerado como uma linguagem definida e fixa (com um número limitado de tags), o XML pode ser considerado como uma metalinguagem para definir outras linguagens, isto é, definir novas tags para descrever a apresentação de um texto (Quem nunca quis uma tag que não existe?).

A força do XML reside na sua capacidade de poder descrever qualquer campo de dados, graças à sua extensibilidade. Com ele é possível estuturar, usar o vocabulário e a sintaxe dos dados nele contidos.

Na verdade, as tags XML descrevem o conteúdo ao invés da apresentação (ao contrário do HTML). Assim, o XML separa o conteúdo da apresentação, o que permite, por exemplo, mostrar o mesmo documento em aplicações ou periféricos diferentes sem precisar criar tantas versões de documento quantas representações necessárias!

O XML foi desenvolvido pelo XML Working Group sob a proteção do Wide Web Consortium (W3C) desde 1996. Desde 10 de fevereiro de 1998, as especificações XML 1.0 têm sido reconhecidas como recomendações pelo W3C, tornando-a uma linguagem famosa. (Todos os documentos relacionados ao padrão XML podem ser consultados e baixados no site do W3C http://www.w3.org/XML/).

O XML é um subconjunto do SGML (Standard Generalized Markup Language), definido pelo padrão ISO8879 em 1986, usado no campo da Gestão Eletrônica de Documentos (GED). O XML inclui a maioria das características do SGML, sendo assim uma simplificação do SGML para torná-lo utilizável na web!

Formatação do XML


O XML é um formato de descrição de dados e não de sua representação, como é o caso do HTML. A formatação dos dados é fornecida por uma linguagem de formatação de terceiros. No final do ano 2000, existeiam três soluções para formatar um documento XML:

  • CSS ((Cascading StyleSheet), a solução mais utilizada atualmente, pois é a norma que já provou a sua eficácia com o HTML
  • [xmlxsl.php3 XSL] (eXtensible StyleSheet Language), uma linguagem de folhas de estilo extensível desenvolvida especialmente para o XML. No entanto, esta nova linguagem ainda não é reconhecida como um padrão oficial
  • [xmlxslt.php3 XSLT] (eXtensible StyleSheet Language Transformation). Trata-se de uma recomendação W3C de 16 de Novembro de 1999, para transformar um documento XML em HTML com folhas de estilo

Estrutura dos documentos XML


O XML fornece uma maneira de verificar a sintaxe de um documento graças ao DTD ( Document Type Definition). Trata-se de um arquivo que descreve a estrutura dos documentos se referindos à elas com uma linguagem adequada. Assim, um documento XML deve seguir, escrupulosamente, as convenções de notação XML e, eventualmente, se referir a um DTD descrevendo o aninhamento dos possíveis elementos. Um documento seguindo as regras do XML é chamado documento bem formado. Um documento XML com um DTD e, estando coerente com ele é chamado de documento válido.

Decodificação de um documento XML


Assim, o XML possibilita a definição de um formato de troca de acordo com as necessidades do usuário e fornece mecanismos para verificar a validade do documento produzido. Portanto, é essencial para o destinatário de um documento XML poder extrair os dados do documento. Isso é possível utilizando uma ferramenta chamada analisador (em inglês parser).

O analisador extrai os dados de um documento XML (estamos falando da análise do documento ou de parsing) e verifica a validade do documento.

As vantagens do XML


Veja os principais trunfos do XML :

  • Legibilidade: teoricamente, nenhum conhecimento é necessário para entender o conteúdo de um documento XML
  • Auto-descritivo e extensível
  • Uma estrutura de árvore: para modelar a maioria dos problemas informáticos
  • Universalidade e portabilidade: os diferentes conjuntos de caracteres são levados em conta
  • Vasto: ele pode ser distribuído facilmente por qualquer protocolo, podendo até transportar textos, como o HTTP
  • Integrabilidade: um documento XML pode ser utilizado por qualquer aplicação equipada de um analisador (isto é, um software para analisar um código XML)
  • Extensibilidade: documento XML deve ser utilizado em todas as áreas de aplicação


Assim sendo, o XML é particularmente adequado para a troca de dados e documentos.

O interesse de ter um formato comum para troca de informações depende do contexto profissional em que os usuários interveem. Portanto, muitos formatos de dados saídos do XML aparecem (há mais de uma centena):

  • OFX : Open Financial eXchange para o intercâmbio de informações no mundo financeiro
  • MathML : Mathematical Markup Language para representar fórmulas matemáticas
  • CML : Chemical Markup Language para descrever compostos químicos
  • SMIL : Synchronized Multimedia Integration Language para criar apresentações de multimídia sincronizando várias fontes: de áudio, de vídeo, de texto,...



Tradução feita por Lucia Maurity y Nouira


Veja também

Publicado por pintuda. Última modificação: 9 de fevereiro de 2012 às 15:39 por pintuda.
Este documento, intitulado 'Introdução ao XML', está disponível sob a licença Creative Commons. Você pode copiar e/ou modificar o conteúdo desta página com base nas condições estipuladas pela licença. Não se esqueça de creditar o CCM (br.ccm.net) ao utilizar este artigo.