Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Информационно-поисковые системы в сетях Internet




Глобальная сеть Internet

История развития

Особая роль среди глобальных сетей принадлежит мировому сообществу сетей Internet. Internet – это гигантская информационно-справочная система. В буквальном переводе Internet означает межсеть. Первые шаги в истории сети следует отнести к середине 50-х годов, в это время американские военные службы начали заниматься лабораторными исследованиями и экспериментами в области создания удаленной компьютерной связи. Решение о создании первой национальной компьютерной сети было принято в США в 1958 г. сразу после запуска Советским Союзом первого искусственного спутника Земли. К середине 60-х годов к этой сети начали подключаться метеорологические, авиационные и другие национальные службы. Слабым местом централизованной сети была ее недостаточная надежность, связанная с тем, что при выходе из строя какого-либо из узлов полностью выходил из строя и весь сектор, находившийся за ним. Основной задачей являлось создание гибкого и надежного протокола передачи информации в сети, поиск новых принципов сетевой архитектуры. К концу 60-х годов американское правительство осознает, что развитие такого проекта, как создание глобальной национальной сети, невозможно без привлечения широких научных и образовательных кругов. С 70-х годов начинается активное финансирование университетов и научных групп с целью создания вычислительных центров и объединения их линиями компьютерной связи, т. е. полигона по апробации глобальной сети. Работы курировались военным ведомством DARРA, а первая сеть имела название ARPANet (1967 г.). Основной объявленной задачей было создание технологии разработки совместных технических проектов территориально удаленными научными группами. В это время активно развивались службы электронной почты и обмена файлами. Необъявленной задачей является разработка новых сетевых протоколов, способных обеспечить живучесть глобальной сети даже при ядерном конфликте.

Следующим крупным шагом в развитии сети Internet (в дальнейшем просто Сети) являлось создание протоколов TCP/IP и в связи с этим выход военного ведомства из проекта. В 1983 г. управление Сетью было передано Американскому Национальному Научному Фонду (NSF), сеть стала называться NSFNet. Годы руководства сетью NSF ознаменованы борьбой с коммерциализацией сети. Сеть по прежнему финансировалась на правительственные средства. В это время к ней начинают подсоединяться академические и научные сети других стран. Она стремительно развивалась после перехода на протоколы TCP/IP, к этому времени стала доступна широким массам дешевая персональная компьютерная техника. Развитие сети становится неуправляемым процессом. С созданием системы доменных имен (DNS) во второй половине 80-х годов сеть выходит из под контроля NSF и начинает жить самостоятельной жизнью. Появляются провайдеры Internet-услуг и сеть переходит от финансирования через центр к финансированию от конечных пользователей к владельцам опорных сетей.

Современное название сети "Internet" было предложено в 1974 г. Винтом Серфом и другим замечательным ученым ¾ Бобом Каном в статье, посвященной протоколу TCP (V. G. Cerf, R. E. Kahn, "A protocol for packet network interconnection", IEEE Trans. Comm. Tech., vol. COM-22, V 5, pp. 627-641, May 1974).

Единого центра управления сетями Internet не существует. В основе лежат опорные сети в США, Европе, Азии и на территории бывшего СССР. Управлением и продвижением технологий занимаются следующие организации:

· крупные провайдеры, владельцы или организаторы опорных сетей;

· местные (региональные) провайдеры;

· поставщики информации и организаторы сетевых услуг.

Провайдером(поставщиком) называют организацию, которая определяет направления развития Internet в регионе, подключение пользователей к сети, сервисные функции, ценовую политику и другие сетевые вопросы. В различных странах и регионах эти организации имеют разные названия.

Службы Internet

Логическая структура Internet представляет собой некое виртуальное объединение, имеющее свое собственное информационное пространство. Internet обеспечивает обмен информации между всеми компьютерами, которые входят в сети, подключенные к ней. Основные ячейки Internet ¾ локальные вычислительные сети. Если некоторая локальная сеть подключена к Internet, то каждая рабочая станция этой сети также может подключаться к ней. Существуют также компьютеры, самостоятельно подключенные к Internet. Они называются хост-компьютерами. Каждый подключенный к сети компьютер имеет свой адрес. Важной особенностью Internet является то, что она, объединяя различные сети, не создает при этом никакой иерархии – все компьютеры, подключенные к сети, равноправны.

Основополагающим протоколом передачи данных в Internet является семейство протоколов ТСР/IР.

К адресам станций предъявляются специальные требования. Адрес должен иметь формат, позволяющий вести его обработку автоматически, и нести некоторую информацию о его владельце. С этой целью для каждого компьютера устанавливаются два адреса: цифровой IР-адрес и доменный адрес. Оба адреса могут применяться равноценно. Цифровой адрес удобен для обработки на компьютере, а  доменный – для восприятия пользователем.

Цифровой адрес – это 4-байтовая последовательность. Принято каждый байт записывать в виде десятичного числа. Два первых байта определяют адрес сети, а два других – адрес компьютера внутри этой сети. IР-адрес включает в себя три компонента: адрес сети, адрес подсети, адрес компьютеров в подсети. Например, адрес почтового сервера – 175.45. 7.200, где 175.45 – адрес сети, 7 – адрес подсети, 200 – адрес компьютера.

Доменный адрес – определяет область, представляющую ряд хост-компьютеров. В отличие от цифрового он читается в обратном порядке. В начале идет имя компьютера, затем – имя сети, в которой он находится. В систему доменных имен заложен принцип иерархии. Коренным доменом является последнее буквенное сочетание, обозначающее обычно страну мира, где расположен хост. Однако последний домен почти не применяется, так как в США в качестве корневого домена принято использовать обозначение вида деятельности организации, которой принадлежит хост. Компьютерное имя включает, как минимум, два уровня доменов, отделенных друг от друга точкой.

Домен второго уровня в России обычно отражает информацию о городе, где находится хост, например, ic.vrn.ru. Для пользователей адресами могут быть просто регистрационные имена на компьютере, подключенном к сети. За именем следует знак @. Все это слева присоединяется к имени компьютера.

Основными услугами, которые предоставляет Internet пользователям сети, являются:

· использование электронной почты;

· участие в телеконференциях;

· получение информации с серверов мирового информационного пространства;

· пересылка и копирование файлов.

Электронная почта E-mail(Electronic mail) ¾ электронный аналог обычной почты, второй по популярности Internet сервис. С ее помощью можно посылать, получать сообщения в свой электронный почтовый ящик; отвечать на письма корреспондентов автоматически, используя их адреса, из писем; рассылать копии Вашего письма сразу нескольким получателям; переправлять полученное письмо по другому адресу; использовать вместо адресов логические имена; создавать несколько подразделов почтового ящика для разного рода корреспонденции; включать в письма текстовые, графические, звуковые файлы и т. д. Сообщение электронной почты(письмо) – логическая совокупность данных, имеющая структуру, определенную используемым протоколом. Сообщение электронной почты – это не файл, а запись в базе данных на сервере и клиентском компьютере. Данная служба функционирует на основе технологии клиент-сервер.

Для работы с электронной почтой создано большое количество программ. Эти программы выполняют следующие функции: подготовку текста, чтение, сохранение или удаление корреспонденции; ввод адреса, импорт других файлов; пересылку корреспонденции. Почтовый сервер– программа, обеспечивающая работу электронной почты со стороны Internet. Почтовый клиент – программа, установленная на компьютере пользователя, обеспечивающая совместную работу с почтовым сервером, используемая для отправки и просмотра сообщений электронной почты.

Программы почтовых серверов – sendmail (под UNIX), Internet Information Services (под Windows NT, Windows 2000) и др. Самые популярные программы, выступающие в качестве клиентов электронной почты: Microsoft Outlook Express, Netscape Messenger, The Bat!

При отправлении сообщений по электронной почте необходимо указывать в адресе не только имя хост-компьютера, но и имя абонента, которому сообщение предназначено.

Адрес электронной почты– запись, однозначно определяющая путь доступа к электронному почтовому ящику адреса.Адресэлектронной почты в Internet выглядит так: mailto:ivanov@mail.ru. и состоит из:

· имени пользователя (ivanov),

· имени хоста или сетевой машины (mail.ru).

Достоинства почты:

· передача тестовых сообщений большой длины;

· возможность передачи информации в отсутствие абонента;

· отсутствие необходимости наличия абонента на другом конце линии;

· сохранение электронной копии сообщения на ЭВМ абонента и его дальнейшей автоматической обработки;

· передача сообщения сразу нескольким абонентам;

· высокая надежность передачи сообщения.

Телеконференции USENET. Телеконференции (другие термины: конференции, форумы, круглые столы) предназначены для получения последних новостей, знакомства с людьми по интересам, обмена идеями и мнениями, получения необходимых консультаций. В системе Internet многие сети предоставляют пользователям конференции, но главную роль играют конференции USENET.Usenet распределенная система телеконференций. Она не является эквивалентом электронной почты.

Группа новостей– это подборка сообщений, помещенных различными пользователями на компьютеры со специальным программным обеспечением –сервером новостей(телеконференций). Каждый Internet-провайдер обычно имеет свой сервер новостей. В группу новостей можно направить свои сообщения (или так называемые статьи) на определенную тему. Здесь же можно прочитать сообщения на аналогичную тему, присланные другими пользователями. Дискуссии осуществляются посредством электронной почты.

Группы новостей бывают двух типов: координируемые (моделируемые) и некоординируемые.

Для участия в конференции пользователь должен "подписаться" на соответствующую конференцию, т. е. послать сообщение на сервер этой конференции. От режима подписки зависит характер получения информации от конференции:

• получение всех статей данной конференции;

• получение статей по выбору пользователя.

Пользователь направляет корреспонденцию на сервер конференции, как правило, работающий в круглосуточном режиме. Перед работой с конференцией знакомятся с правилами:

news. answers ¾ правила конференций на английском языке;

relcom. answers ¾ правила конференций на русском языке;

relcom. newusers ¾ информация о конференциях на русском языке.

Кроме того, необходимо придерживаться тематики конференции, не использовать конференцию для личной переписки и не оскорблять участников конференции.

Файловые системы FTP и Gopher.Сети, входящие в Internet, поддерживаются протоколами ТСР/IР (Transmission Control Protocol / Internet Protocol), которые представляют собой совокупность надежных сетевых протоколов.

Эта служба сетей Internet предоставляет пользователям возможности:

· просматривать каталоги программ других ЭВМ;

· копировать на свою ПЭВМ файлы с текстовыми и
графическими документами, различными программами и объектами с других ЭВМ;

· передавать свои файлы на другие ЭВМ.

Для того чтобы обеспечить перемещение данных между различными операционными системами, которые могут встретиться в Internet используется протокол FTP (File Transfer Protocol), который входит в систему протоколов TCP/IP. Большие возможности по поиску программных файлов предоставляет сервер http: www. shareware.com.

Возможность работы с FTP имеют практически все браузеры, нужно только в адресе ресурса поставить аббревиатуру ftp://.

Другим средством поиска файлов является программа Gopher (gopher://), которая работает по поиску файлов быстрее FTP.

Служба World Wide Web (WWW).Безусловно, это самая популярная служба современной сети. Ее нередко отождествляют с Internet, хотя на самом деле это лишь одна из его многочисленных служб. World Wide Web — это единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов. Как правило, документы WWW хранятся на постоянно подключенных к Internet компьютерах ¾ Web-cepвepax. Отдельные документы, составляющие пространство Web, называютWeb-страницами.Обычно это комбинированные документы, которые могут содержать текст, графическую иллюстрацию, мультимедийные и другие вставные объекты. Для создания Web-страниц используется язык HTML. Группы тематически объединенных Web-страниц называются Web-узлами (жаргонный термин ¾ Web-сайт или просто сайт). Один физический Web-сервер может содержать достаточно много Web-узлов, каждому из которых, как правило, отводится отдельный каталог на жестком диске сервера.

От обычных текстовых документов Web-страницы отличаются тем, что они оформлены без привязки к конкретному носителю. Поэтому Web-документы не могут иметь «жесткого» форматирования. Оформление выполняется непосредственно во время их воспроизведения на компьютере клиента, и происходит оно в соответствии с настройками программы, выполняющей просмотр.

Возможность внедрения в текст графических и других объектовявляется одной из самых эффектных с точки зрения оформления Web-страниц, но не самой важной с точки зрения самой идеи World Wide Web. Наиболее важной особенностью среды WWW является наличие средств перехода от одного документа к другому, тематически с ним связанному, без явного указания адреса, при помощи гипертекстовых ссылок (гиперссылок).Гиперссылка это выделенный фрагмент документа, с которым ассоциирован адрес другого Web-документа. При использовании гиперссылки, указав на нее мышью, происходит открытие Web-страницы, на которую указывает ссылка.

Гипертекстовая связь между сотнями миллионов документов, хранящихся на физических серверах Internet, является основой существования логического пространства World Wide Web. Однако такая связь не могла бы существовать, если бы каждый документ в этом пространстве не обладал своим уникальным адресом. Адрес любого файла во всемирном масштабе определяется унифицированным указателем ресурса — URL. Он содержит указания на прикладной протокол передачи, адрес компьютера и путь поиска документа на этом компьютере. Однако навигация (целенаправленное перемещение между документами) в Internet чаще выполняется не путем ввода адреса URL, а посредством использования гиперссылок.

Средства просмотра Web.Со стороны Internet работу службы WWWобеспечивают серверные программные средства – WWW-серверы, а со стороны пользователя – клиентские программы ¾ Web-браузеры. Форматирование и отображение документа на конкретном компьютере производится специальной программой — браузером(от английского слова browser). Основные его функции следующие:

· установление связи с Web-сервером, на котором хранится документ, и загрузка всех компонентов комбинированного документа;

· интерпретация тегов (команд) языка HTML;форматирование и отображение Web-страницы в соответствии с возможностями компьютера, на котором браузер работает; предоставление средств для отображения мультимедийных и других объектов, входящих в состав Web-страниц, а также механизма расширения, позволяющего настраивать программу на работу с новыми типами объектов;

· обеспечение автоматизации поиска Web-страниц и упрощение доступа к Web-страницам, посещавшимся ранее;

· предоставление доступа к встроенным или автономным средствам для работы с другими службами Internet.

Примером наиболее известного браузера может служить Internet Explorer 5.0. Программа предоставляет единый метод доступа к локальным документам компьютера, ресурсам корпоративной сети Internet и к информации, доступной в Internet. Она обеспечивает paботy c World Wide Web, предоставляет идентичные средства работы с локальными папками компьютера и файловыми архивами FTP, дает доступ к средствам связи через Internet. Схема использования Internet через Internet Explorer представлена на рис. 7.1.

 


Рис. 7.1. Организация доступа к ресурсам Internet

 

Программы Qutlook Express и Microsoft NetMeeting автономны, но рассматриваются как часть пакета Internet Explorer 5.0.

Для запуска браузера Internet Explorer можно использовать его значок на Рабочем столе или на Панели быстрого запуска, а также Главное меню (Пуск> Программы > Internet Explorer). Кроме того, программа запускается автоматически при попытке открыть документ Internet или локальный документ в формате HTML.Для этой цели можно использовать ярлыки Web-страниц, папку Избранное (Пуск > Избранное или пункт меню Избранное в строке меню окна папки или программы Проводник), панель инструментов Рабочего стола Адрес или поле ввода в диалоговом окне Запуск программы (Пуск > Выполнить).

Если соединение с Internet отсутствует, то после запуска программы на экране появится диалоговое окно для управления установкой соединения. При невозможности установить соединение сохраняется возможность просмотра в автономном режимеранее загруженных Web-документов. При наличии соединения после запуска программы на экране появится так называемая "домашняя", или основная, страница, выбранная при настройке программы.

 



Информационно-поисковые системы в сетях Internet

Сети Internet располагают огромным количеством разнообразнейшей информации, которая постоянно обновляется и увеличивается в объеме. Найти пользователю необходимые данные помогают многочисленные информационно-поисковые системы (ИПС). Поисковая система занимается сбором информации о ресурсах Internet и ее систематизацией для того, чтобы упростить пользователю доступ к интересующей его информации. Все ИПС делятся на два типа: системы с поиском по индексам (ссылкам) и системы с поиском по каталогам (классификаторам). Однозначно назвать лучший тип ИПС нельзя, однако можно дать некоторые рекомендации.

Индексные ИПС более эффективны для получения детальной исчерпывающей информации при сложных запросах на получение данных или для локализации неясной информации. В различных индексных ИПС пользователям предоставляются процедуры поиска данных по ключевому слову, нескольким словам, URL ¾ адресу (это адреса ресурсов Е ¾ mail, USENET, FTP, TELENET и др. при обращении к ним со страниц WWW).

Каталожные ИПС базируются на каталогах, которые составляют люди-редакторы Web-серверов. Каталоги Web-серверов напоминают структуру библиотечных каталогов. Они удобны в случаях, когда нужно провести быстрый поиск каких-либо общих тем.

Разделяют ИПС:

1. По особенностям функционирования (табл. 7.1):

· каталоги;

· поисковые машины.

2. По охвату информационных ресурсов:

· глобальные;

· локальные.

3. По типу и тематике информационных ресурсов:

· универсальные;

· специализированные.

 

Таблица 7.1.

Классификация ИПС

Каталоги

Поисковые машины










Последнее изменение этой страницы: 2018-04-12; просмотров: 212.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...