Uma página HTML é um arquivo simples que contém texto formatado com tags HTML. Tradicionalmente, o arquivo recebe uma extensão HTM ou HTML mas, potencialmente, uma página web pode ter qualquer extensão. Uma página web pode ser criada por editores de texto mais básicos (como a aplicação bloco de notas, por exemplo), mas existem editores muito mais sofisticados.
Os editores WYSIWYG (What You See Is What You Get) são editores de interface gráfica para trabalhar em uma página web, que permitem visualizar melhor o que verão os visitantes do site. Com este tipo de editor, é possível adicionar tags com um simples clique do mouse e seus atributos podem ser alterados digitando as suas propriedades em um formulário. Em todo caso, para utilizar o melhor possível este tipo de editor é bom ter um conhecimento prévio do HTML.
Também existem editores HTML que mostram as tags, os atributos e seus valores com cores diferentes para facilitar a leitura. Às vezes, eles incluem ferramentas para verificar a validade do código HTML.
Além das extensões HTM e HTML, uma página web pode ter as seguintes extensões:
ASP para página gerada dinamicamente em ASP (Active Server Pages);
CGI para página gerada dinamicamente com CGI (Common Gateway Interface);
PHP, PHP3 ou PHP4 para página gerada dinamicamente em PHP;
PL para página gerada dinamicamente em Perl (Practical Extraction and Report Language), etc.
Um documento HTML começa com a tag HTML e termina com a marca /HTML. Ele também contém um cabeçalho que descreve o título da página e um corpo no qual se encontra o conteúdo da página. O cabeçalho é delimitado pelas tags HEAD e /HEAD. Já o corpo é delimitado pelas tags BODY e /BODY.
Veja o exemplo de uma página HTML simples:
<HTML>
<HEAD>
<TITLE>Título da página</TITLE>
</HEAD>
<BODY>
Conteúdo da página
</BODY>
</HTML>
A página HTML deve incluir a declaração do tipo de documento (DTD), referência ao padrão HTML que se usa para especificar o padrão de código empregado pela página. Esta declaração faz-se agregando uma linha como esta:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN">
<HTML>
<HEAD>...</HEAD>
<BODY>Conteúdo da página</BODY>
</HTML>
Isso indica a DTD utilizada, ou seja, a referência das características da linguagem usada. O quadro abaixo recapitula as declarações para as principais versões da linguagem HTML:
Versão | Declaração |
---|---|
HTML 2.0 | <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> |
HTML 3.2 | <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> |
HTML 4.01 | Strict: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN" "http://www.w3.org/TR/html4/strict.dtd"> Transitional: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> Frameset: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd"> |
XHTML 1.0 | Strict: <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> Transitional: <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-loose.dtd"> Frameset: <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd"> |
XHTML 1.1 | <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> |