Главная
    Русские интернет-кафе
    Смерть в Интернете
    Находки
    Мои книги
    Статьи, Обзоры, Стихи
    Реальная жизнь



    Что такое URL



    Опубликовано в журнале Chip в январе 2003
    Андрей Травин

Маленький мальчик пpиходит к отцу:
- Папа, как пишется "адpес", с одной "с" или двумя?
- Напиши "URL" и иди ложись спать...

Из телеконференций Usenet


О чем говорит текст, увиденный вами в поле "Адрес"/"location"? Как известно, это URL (Uniform Resource Locator) - универсальный указатель ресурса Сети (можно более вольно, но по сути более точно перевести, как "единый указатель на ресурс"). Каждая страница имеет свой уникальный URL, служащий ее адресом. URL - это текст, используемый для идентификации и адресации некого объекта в компьютерной сети. Короче, URL сообщает информацию о местоположении в любой точке Всемирной Сети, то есть URL - он и в Африке URL, хотя там еще не слишком развит World Wide Web.

Как правило, опытный "сетевой" человек может получить некоторые сведения, разбирая символы, находящиеся между косыми черточками и точками в URL. Это может быть обозначение организации, к примеру, .org, код той или иной страны, к примеру .nd - Нидерланды и т. д. Нужно лишь привыкнуть к конструкции этого адреса, весьма непривычного для пользователей DOS и Windows.

Каждый сервер в Интернет имеет уникальное имя-адрес, которое определяет название организации, обслуживающей данную машину. Однако, не следует удивляться, если несколько различных имен в URL, соответствуют одному и тому же серверу. Люди для удобства окружающих имеют одно имя, сервер может иметь несколько имен - и по той же самой причине. Так, зарубежному пользователю удобнее обратиться по адресу http://www.rocit.org, а российскому - по адресу http://www.rocit.ru/, но попасть в одно и тоже место Сети.

Все виды URL

Здесь мы укажем все варианты написания URL в программах просмотра веб всех версий:

http://www.rol.ru/~crosser/ksp/
https://www.microsoft.com/
gopher://culine.colorado.edu/
telnet://debra.doc.ca/
ftp://sumex-aim.stanford.edu
wais://archive.orst.edu/aeronautics
news:relcom.www.users
news:*
news://msnews.microsoft.com/frontpage.client
snews://news.zippo.com/
nntp://msnews.microsoft.com/microsoft.public.internet.mail
mailto:wolf@bst.ru

Для полноты описания, отметим, что кроме конструкции URL вида:
протокол://полное.имя.машины/путь/

разрешена его конструкция вида:
адрес:порт/путь

Параметр "порт" можно не указывать и тогда подразумевается порт, стандартный для данного протокола. Для ftp используются порты 20 и 21, для http - 80, для telnet - 23, для gopher - 70, news - 19 и т.д. Если же их указывать явно, то URL будет выглядеть, к примеру, так:

http://anxiety-closet.mit.edu:8001/activities/russian-club/catalog.html
telnet://whitehouse.gov:23

В качестве адреса машины допустимо использование и IP-адреса:
http://128.100.80.13/vladimir/scherbakov/

При указании адреса ресурса возможна ссылка на место внутри файла HTML. Для этого вслед за именем документа может быть указана метка внутри документа, при этом в URL их разделяет символ "#": http://www.cs.umd.edu/~cema/russia.html#bards

Когда web-технология используется в режиме off-line (то есть в отсутствии удаленного доступа), то URL имеет следующий вид:
file:///C|/text/html/music.htm
В данном примере приведено обращение к документу на жестком диске пользователя в системе MS Windows.

Только в Netscape Navigator используется специальный URL mailbox:/, предназначенный для сообщения почтовой системе о том, какой файл будет использоваться в качестве почтового ящика:
mailbox:/C57C/Programm%20Files/Netscape/Navigator/Mail/Inbox?id-199705051113PAA02958@skraldespand.demos.su

Кроме того, возможен URL tn3270:// для Telnet-сеансов в режиме 3270. Для него я даже не могу привести примера, ибо ни разу не контактировал с сервером на основе IBM 3270.

Что скрыто от пользователей при поиске URL?

"Где круга этого начало, где конец,
Откуда мы пришли, куда уйдем отселе?"

Омар Хайям


Само собой разумеется, то, что скрыто от пользователя, ему знать и необязательно, поэтому эта статья предназначена для читателей, которым интересно, а что же происходит "внутри" Интернета, начиная от того момента, как вы сделали запрос по какому либо URL до того момента, когда в строке статуса появится надпись Connect: Contacting host: <address>.
Здесь мы введем лишь два новых понятия и одну новую команду, поэтому если вы готовы - приступим, если нет - переходите к следующему разделу.

В первую очередь речь здесь пойдет о DNS-серверах системы доменных имен и о том, как они работают в Сети. Данная система сегодня повсеместно внедрена на DNS-серверах всего Интернета (а также на других компьютерах, которые используют их информацию). В задачи системы доменных имен входит отображение уникальных буквенно-цифровых имен, которые, как правило, используются для запросов человеком, в уникальные адреса Интернета и наоборот. Более кратко этот процесс называется переводом имени в адрес и адреса в сетевое имя. DNS - это, по существу, распределенная база данных, применяемая для того, чтобы с помощью имен определить местонахождение узлов сети. Для нас важно, что имеется связь этой базы данных со стандартными адресами электронной почты в Интернете и с адресами World Wide Web.

Как известно, компьютеры в Интернете взаимодействуют один с другим посредством протоколов семейства IP, которые позволяют системам одного типа работать в совершенно разных сетях. А каждому элементу Сети присвоен уникальный 32-разрядный адрес, называемый IP-адресом.

Поскольку человеку удобно всему давать названия, узловые компьютеры обычно имеют имена узлов, и при этом существует определенная взаимосвязь между именем и числовым IP-адресом (тот, кто подключен к сетям Fidonet или CompuServe представляет неудобства из-за того, что имеющиеся там адреса, состоят только из цифр). Благодаря DNS пользователь может работать с именами узлов, а не с их адресами.

На самом высоком уровне это соответствие отслеживается специальной службой Интернета, называемой InterNIC - сетевой информационный центр. Все соответствия хранятся в специальном файле и время от времени - по мере добавления новых узлов - передаются остальным компьютерам Сети.
Каждый домен (часть адреса) представляет собой узел в дереве имен. При этом уникальность имен узлов требуется лишь в пределах их собственных доменов.

Иерархическая структура имен и распределенный характер информации, обеспечивают удобство и гибкость в работе с DNS.
Транслятор имен должен начать поиск с корня дерева, к примеру, в адресе www.iomega.com такому транслятору нужно найти сначала домен "com", а в нем отыскать домен "iomega", использовать информацию, связанную с этим доменом (например, IP-номер узла). Существует масса разных способов ускорения и упрощения этого процесса. Они позволяют обрабатывать разные части дерева имен по отдельности.

Весьма важным в этой связи является понятие зон. Каждый определенный сервер имен отвечает за какую-то зону пространства DNS-имен (т.е. за ту часть, о которой он имеет полную информацию). Чтобы получить сведения о другой части пространства имен, этот сервер должен обратиться с запросом к другому серверу (называемому главным информационным сервером). И наоборот, если сервер является ответственным за какую-то часть пространства имен, то другие серверы обращаются к нему за информацией об этих именах.

Если бы при каждом запросе на преобразование имени поиск начинался с обращения к одному из "корневых" серверов, которых в Интернете имеется всего семь, то они быстро оказались бы перегруженными. Для решения подобной проблемы в трансляторах имен применяется кэширование информации, получаемой от серверов имен. Поэтому при запросе на преобразование имени транслятор уже может не обращаться с запросом к главному серверу, а выдаст ответ непосредственно из своего кэша (естественно, поскольку адреса сервера периодически изменяются, в ответе на каждый запрос к серверу предусмотрено специальное поле, название которого Time-to-live по смыслу можно перевести как "срок годности информации").

Для тех, кто дочитал до этого места, дается первый полезный вывод, хотя и вряд ли ставший для кого-либо открытием. Буквенный адрес web-сервера на самом деле является числовым. По нему происходит непосредственное обращение в Сети, его можно записывать и запоминать в закладках и обращаться "напрямую", минуя DNS-сервер, если тот по каким-либо причинам неисправен, недоступен или неизвестен.

Вывод второй. Если вы установили связь с удаленной машиной, но не можете попасть даже на сервер Microsoft, поскольку он дескать не найден в DNS, то (попробовав повторное обращение, поскольку серверы иногда "падают"), закрывайте сеанс связи и проверяйте правильность введения вами при настройках числового адреса DNS (вы уже догадались, почему он вводится всегда как числовой?).

Вывод третий. Система имен в Интернете является замечательным и очень надежным изобретением. Стало быть, если вы набрали URL, а сервер по нему не нашелся, то практически всегда виноваты вы, а не машина (правда иногда бывает виновато просто плохое качество линий).

После того, как по имени запрошенного объекта найден его IP-адрес, происходит собственно передача запроса. Пакеты маршрутизируются так, как это обычно и происходит в Интернете. Пользователям Netscape for Windows повезло меньше, чем пользователям Netscape for Unix. Для последнего из них предусмотрено выведение на экран полного пути прохождения пакета с указанием промежуточных узлов - traceroute (в середине девяностых было интересно наблюдать как, к примеру, запрос, направленный из Москвы в Зеленоград совершает зарубежный вояж через Амстердам).

Помочь в этом аспекте несчастным пользователям Windows 3.1, если они еще существуют, может trace bp из пакетов PC/TCP и Netmanage Chameleon (http://www.netmanage.com/). А вот в системах Windows 95 и выше удается хоть как-то компенсировать следствия названной проблемы. В этом случае необходимости выяснения пути (трафика) IP-пакета перейдите в Norton Commander, оставаясь в сеансе Windows 95, и далее введите следующую команду:

tracert <адрес сервера >, например, tracert www.playboy.com

Конечно, у вас возник вопрос, зачем переходить в окно DOS для вызова tracert. Это конечно необязательно, но при вызове её из Windows окно программы закроется после завершения её работы, и результаты будут потеряны (очень странная такая консоль).

Конкретизировать, времена каких именно задержек вы будете получать на экране, наверное, здесь необязательно, хотя сразу скажу, что чем они меньше, тем лучше.

Полный синтаксис этой диагностической утилиты следующий:
tracert [-h] [-d] [-j] [-w] имя приёмника

Данная утилита определяет маршрут к приемнику (по протоколу ICMP), передавая последнему эхо-пакеты (некоторые маршрутизаторы молча пропускают такие пакеты и невидимы утилите tracert). Параметром [-h] вы можете задать максимальное число переходов при поиске приемника (номера переходов проставляются в первой колонке при выдачи результата). Вообще это число можно сделать равным от 15 до 30, поскольку при 30 переходах вы, как правило, получаете звездочки, означающие, что попытка не удалась.

Кроме того, я использую при вызове данной команды из NC перенаправление результата в файл обычными средствами DOS:
tracert www.playboy.com > trace.txt
Это работает благодаря свойству ОС Windows 95 вызова Windows-приложений из DOS и последующего возвращения управления Norton Commander.

Что же касается появления на вашем компьютере команды Tracert, то она автоматически помещается в системную директорию Windows 95, когда вы устанавливаете у себя поддержку TCP/IP. Tracert является Windows-программой, однако при ее запуске из Norton Commander не исчезает окно с результатами работы, что удобно.

В заключение этой сложной главы - забавный курьёз. В ранних версиях Netscape, если в URL встречалось словосочетание jwz (инициалы разработчика Netscape для Unix), то вместо характерной буквы N в правом верхнем углу Netscape рисовался симпатичный компас.



 



Runetka-интервью:
"Порталу "Смерть в Интернете" исполнилось четыре года"


У меня достаточно оригинальное мировоззрение, которое я ни разу не высказывал ни на более чем 430 страницах "Смерти в Интернете", ни где-либо еще. >>>



Мак-до - Путь Воина

О самом знаменитом из евангелистов Apple Computer Гае Кавасаки писали многие, но создавалось впечатление, словно люди старательно обходили главную метафору, которая являлась как первородным смыслом учения, так и внешней позой жизни этого неординарного человека >>>










 
 Copyright © 1997–2006 - Andrey Travin                                                                                                     Design 2003 - Leeloo