Для обеспечения адресации Web-документов и других информационных объектов в свое время была предложена концепция унифицированных указателей ресурса (Uniform Resource Locator, URL). URL представляет собой набор информации, необходимый для того, чтобы определить:
-
узел сети, на котором расположен информационный объект;
-
расположение информационного объекта на узле;
-
метод получения доступа к объекту.
|
Унифицированный указатель ресурса (URL) представляет собой частный случай унифицированного определителя ресурса (Uniform Resource Identifier, URI). URI - является абстрактным понятием, описывающим принципы универсальной адресации ресурсов сети, позволяющие идентифицировать любой информационный объект в сети, независимо от его внутренней структуры (форматов представления данных, кодировок и т.п.), расположения и сетевых сервисов, обеспечивающих доступ к нему. В настоящее время определены различные подходы к реализации такой универсальной адресации. Одним из таких подходов является URL, для которого ключевой информацией для идентификации объекта является его местоположение (location) в сети. Другой способ универсальной идентификации определен концепцией унифицированных имен ресурсов (Uniform Resource Name, URN), в которой ключевой информацией является уникальное мнемоническое имя ресурса, возможно никак не связанное с его физическим местоположением. Например, для однозначной идентификации человека в России можно использовать комбинацию "Фамилия-Имя-Отчество-Адрес Прописки" (аналог URL), или комбинацию "Номер и Серия паспорта" (аналог URN).
Поскольку для получения доступа к объекту все-таки необходимо знать его расположение (чтобы правильно адресовать запрос), то использование схем, не основанных на информации о расположении объекта, практически не очень удобно и требует дополнительных преобразований. Поэтому URL является наиболее популярной схемой адресации объектов в сети |
Общая структура URL выглядит следующим образом:
СХЕМА:ЧАСТЬ-ЗАВИСЯЩАЯ-ОТ-СХЕМЫ
Рис 1
Часть СХЕМА определяет способ получения доступа к ресурсу и то, каким образом представляется местоположение ресурса в части "ЧАСТЬ-ЗАВИСЯЩАЯ-ОТ-СХЕМЫ".
Ниже приведены примеры URL:
http://www.site.ru
Рис 2
mailto:name@youraddress.ru
Рис 3
Как видно из примера, схема доступа может определять как конкретный протокол, так и целый сервис. В настоящее время существует целый ряд схем, которые могут использоваться в URL. Ниже перечислены наиболее часто использующиеся схемы:
Схема |
Определяемый механизм доступа |
mailto |
Электронная почта |
news |
Телеконференции |
ftp |
Протокол FTP |
telnet |
Протокол Telnet |
http |
Протокол HTTP |
https |
Протокол HTTPS |
file |
Файл, расположенный на локальном компьютере |
Независимо, от того, какая схема используется, "ЧАСТЬ-ЗАВИСЯЩАЯ-ОТ-СХЕМЫ" должна соответствовать следующим правилам:
-
набор символов ограничен латинскими буквами, цифрами, символами "-" и "_";
-
символы "%", "/", ":", ";", ".", "?", "@", "&", "#", "=", "+" используются как служебные (например, в качестве разделителей имен, входящих в состав адреса);
-
не существует различия между прописными и строчными буквами.