A estrutura básica de um documento HTML

O que é um documento HTML

Uma página HTML é um arquivo simples que contém texto formatado com tags HTML. Tradicionalmente, o arquivo recebe uma extensão HTM ou HTML mas, potencialmente, uma página web pode ter qualquer extensão. Uma página web pode ser criada por editores de texto mais básicos (como a aplicação bloco de notas, por exemplo), mas existem editores muito mais sofisticados.

Os editores WYSIWYG (What You See Is What You Get) são editores de interface gráfica para trabalhar em uma página web, que permitem visualizar melhor o que verão os visitantes do site. Com este tipo de editor, é possível adicionar tags com um simples clique do mouse e seus atributos podem ser alterados digitando as suas propriedades em um formulário. Em todo caso, para utilizar o melhor possível este tipo de editor é bom ter um conhecimento prévio do HTML.

Também existem editores HTML que mostram as tags, os atributos e seus valores com cores diferentes para facilitar a leitura. Às vezes, eles incluem ferramentas para verificar a validade do código HTML.

Além das extensões HTM e HTML, uma página web pode ter as seguintes extensões:

ASP para página gerada dinamicamente em ASP (Active Server Pages);
CGI para página gerada dinamicamente com CGI (Common Gateway Interface);
PHP, PHP3 ou PHP4 para página gerada dinamicamente em PHP;
PL para página gerada dinamicamente em Perl (Practical Extraction and Report Language), etc.

A estrutura do documento HTML

Um documento HTML começa com a tag HTML e termina com a marca /HTML. Ele também contém um cabeçalho que descreve o título da página e um corpo no qual se encontra o conteúdo da página. O cabeçalho é delimitado pelas tags HEAD e /HEAD. Já o corpo é delimitado pelas tags BODY e /BODY.

Veja o exemplo de uma página HTML simples:

<HTML> 
<HEAD>
<TITLE>Título da página</TITLE>
</HEAD>
<BODY>
Conteúdo da página
</BODY>
</HTML>

Declaração do tipo de documento

A página HTML deve incluir a declaração do tipo de documento (DTD), referência ao padrão HTML que se usa para especificar o padrão de código empregado pela página. Esta declaração faz-se agregando uma linha como esta:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN"> 
<HTML>
<HEAD>...</HEAD>
<BODY>Conteúdo da página</BODY>
</HTML>

Isso indica a DTD utilizada, ou seja, a referência das características da linguagem usada. O quadro abaixo recapitula as declarações para as principais versões da linguagem HTML:

Versão Declaração
HTML 2.0 <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
HTML 3.2 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
HTML 4.01 Strict: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN" "http://www.w3.org/TR/html4/strict.dtd">
Transitional: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
Frameset: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">
XHTML 1.0 Strict: <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
Transitional: <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-loose.dtd">
Frameset: <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">
XHTML 1.1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
Nosso conteúdo é produzido em colaboração com especialistas em tecnologia da informação sob o comando de Jean-François Pillou, fundador do CCM.net. CCM é um site sobre tecnologia líder em nível internacional e está disponível em 11 idiomas.
Veja também
Este documento, intitulado 'A estrutura básica de um documento HTML', está disponível sob a licença Creative Commons. Você pode copiar e/ou modificar o conteúdo desta página com base nas condições estipuladas pela licença. Não se esqueça de creditar o CCM (br.ccm.net) ao utilizar este artigo.

Assine nossa newsletter!

Assine nossa newsletter!