O URL (Uniform Resource Locator - Localizador Padrão de Recursos) é o formato de atribuição universal para designar um endereço na Internet. É uma cadeia de caracteres ASCII imprimíveis com cinco partes. Aprenda o que você precisa sobre o URL no artigo abaixo.
O que é um URL
Como dito acima, todo URL é composto por
cinco partes:
- Nome do protocolo: a linguagem utilizada para se comunicar na rede. O protocolo mais usado é o protocolo HTTP, que permite passar as páginas Web para o formato HTML. Contudo, existem muitos outros (FTP, News, Mailto, Gopher etc.).
- Login e senha: permite especificar os parâmetros de acesso a um servidor protegido. Esta opção é desaconselhada porque a senha é visível no URL.
- Nome do servidor: refere-se ao nome de domínio do computador que aloja o recurso pedido. Saiba que é possível utilizar o endereço IP do servidor, o que torna o URL XSR menos legível.
- Quantidade de portas: número associado a um serviço permitindo ao servidor saber qual o tipo de recurso solicitado. A porta associada por padrão ao protocolo é a porta número 80. Assim, quando o serviço Web do servidor for associado ao número da porta 80, sua inscrição se torna facultativa.
- Caminho para acessar o recurso: permite ao servidor conhecer o lugar onde o recurso está situado, ou seja, o diretório e o nome do arquivo solicitado.
Como é estruturado um URL
Protocolo | Senha (facultativa) | Nome do servidor | Porta (facultativa se 80) | Caminho |
[http://] | user:password@ | br.ccm.net | :80 | /glossair/glossair.php3 |
Os seguintes protocolos podem ser utilizados através do URL:
HTTP, para consulta de páginas web,
FTP, para consulta de sites FTP,
Telnet, para conexão a um terminal remoto,
Mailto, para o envio de um e-mail.
O nome do arquivo no URL pode ser seguido por um ponto de interrogação e dados no formato ASCII. São dados suplementares enviados através de um aplicativo no servidor (um certificado CGI, por exemplo). O URL será similar a uma cadeia de caracteres como esta:
http://br.ccm.net/forum/index.php3?cat=1&page=2
Como é codificado um URL
Como o URL é um meio para
enviar informações pela Internet, é preciso poder enviar caracteres especiais. Porém, os URL não podem conter caracteres especiais. Além disso, certos caracteres são reservados porque têm um significado particular (a barra oblíqua permite especificar um subdiretório, os caracteres & e ? servem para o envio de dados por meio de formulários).
Para concluir, os URL podem ser incluídos em um documento HTML, o que torna difícil a inserção de caracteres especiais. Por isso, é necessária uma codificação específica. Ela consiste em substituir caracteres especiais pelo caractere
% acompanhado do código ASCII do caractere a ser codificado em
notação hexadecimal.
Veja a lista dos caracteres que necessitam de uma codificação específica:
Caractere | Codificação URL |
---|
Tabulação | %09 |
Espaço | %20 |
" | %22 |
# | %23 |
% | %25 |
& | %26 |
( | %28 |
) | %29 |
+ | %2B |
, | %2C |
. | %2E |
/ | %2F |
: | %3A |
; | %3B |
< | %3C |
= | %3D |
> | %3E |
? | %3F |
@ | %40 |
[ | %5B |
| %5C |
] | %5D |
^ | %5E |
' | %60 |
{ | %7B |
| %7C |
} | %7D |
~ | %7E |
Saiba que o formato dos URLs é definido pelo
RFC 1738.
Foto: © iStock.