O que é um URL
O
URL (Uniform Resource Locator - Localizador Padrão de Recursos) é o formato de atribuição universal para designar um recurso na Internet. É uma cadeia de caracteres
ASCII imprimíveis com cinco partes:
O nome do protocolo ou seja, a linguagem utilizada para se comunicar na rede. O protocolo mais usado é o
protocolo HTTP (HyperText Transfer Protocol), que permite passar as páginas Web para o formato
HTML. Contudo, muitos outros são possíveis (FTP, News, Mailto, Gopher, etc.).
Identificador e senha, que permite especificar os parâmetros de acesso a um servidor protegido. Esta opção é desaconselhada porque a senha é visível no URL.
Nome do servidor, que se refere ao
nome de domínio do computador que aloja o recurso pedido. Saiba que é possível utilizar o
endereço IP do servidor, o que torna o
URL XSR menos legível.
Quantidade de portas: trata-se de um número associado a um serviço permitindo ao servidor saber qual o tipo de recurso solicitado. A porta associada por padrão ao protocolo é a porta número 80. Sendo assim, quando o serviço Web do servidor for associado ao número da porta 80, sua inscrição se torna facultativa.
Caminho para acessar o recurso: esta última parte permite ao servidor conhecer o lugar onde o recurso está situado, ou seja, o diretório e o nome do arquivo solicitado.
Como é estruturado um URL
| Protocolo | Senha (facultativa) | Nome do servidor | Porta (facultativa se 80) | Caminho |
| [http://] | user:password@ | br.ccm.net | :80 | /glossair/glossair.php3 |
Os seguintes protocolos podem, por exemplo, ser utilizados através do URL:
HTTP, para a consulta de páginas web,
FTP, para a consulta de sites FTP,
Telnet, para a conexão a um terminal remoto,
Mailto, para o envio de um e-mail, Wais e Gopher.
O nome do arquivo no URL pode ser seguido por um ponto de interrogação e dados no formato ASCII. Trata-se de dados suplementares enviados através do parâmetro de um aplicativo no servidor (um certificado CGI, por exemplo). O URL será similar a uma cadeia de caracteres como esta:
http://br.ccm.net/forum/index.php3?cat=1&page=2
Como é codificado um URL
Já que o URL é um meio para enviar informações pela Internet (para enviar dados para um certificado CGI, por exemplo), é preciso poder enviar caracteres especiais. Porém, os URLs não podem conter caracteres especiais. Além disso, certos caracteres são reservados porque têm um significado particular (a barra oblíqua permite especificar um subdiretório, os caracteres & e ? servem para o envio de dados por meio de formulários). Para concluir, os URLs podem ser incluídos num documento HTML, o que torna difícil a inserção de caracteres como
ou no URL.
É por isso que uma codificação é necessária! Ela consiste em substituir os caracteres especiais pelo caractere
% (ele mesmo um caractere especial) acompanhado do código ASCII do caractere a ser codificado em
notação hexadecimal.
Veja a lista dos caracteres que necessitam de uma codificação específica:
| Caractere | Codificação URL |
|---|
| Tabulação | %09 |
| Espaço | %20 |
| " | %22 |
| # | %23 |
| % | %25 |
| & | %26 |
| ( | %28 |
| ) | %29 |
| + | %2B |
| , | %2C |
| . | %2E |
| / | %2F |
| : | %3A |
| ; | %3B |
| < | %3C |
| = | %3D |
| > | %3E |
| ? | %3F |
| @ | %40 |
| [ | %5B |
| %5C |
| ] | %5D |
| ^ | %5E |
| ' | %60 |
| { | %7B |
| %7C |
| } | %7D |
| ~ | %7E |
Saiba que o formato dos URLs é definido pelo
RFC 1738.
Este documento, intitulado 'O que é um URL', está disponível sob a licença
Creative Commons. Você pode copiar e/ou modificar o conteúdo desta página com base nas condições estipuladas pela licença. Não se esqueça de creditar o
CCM (
br.ccm.net) ao utilizar este artigo.