Рубрики верхнего уровня иерархии.
п/п | Имя рубрики | Содержание рубрики |
1 | alt | Альтернативные группы новостей |
2 | bit | Список рассылки Bitnet LISTSERV |
3 | biz | Реклама для бизнеса |
4 | clarinet | Служба новостей (только по подписке) |
5 | comp | Все темы, связанные с компьютерами, с делением на группы - от новичков до профессионалов |
6 | k12 | Образование (дошкольное и школьное) |
7 | misc | Темы, не относящиеся ни к одной другой группе |
8 | news | Информация и новости, связанные с Usenet |
9 | rec | Досуг и хобби |
10 | sd | Различные темы из области научных исследований |
11 | soc | Социальная тематика, культура |
12 | talk | Обсуждение спорных вопросов (множество дискуссий по различной тематике) |
Этот процесс называется подпиской (Subscribe) на группу. IP - адрес Вашего сервера новостей задается ISP при подключении к Internet.
Internet позволяет не только получать разнообразную информацию и обмениваться сообщениями, но и общаться в реальном масштабе времени с любым пользователем сети, где бы он не находился. Данная услуга называется IRC (Internet Relay Chat - Беседа через Интернет). Общение ведется с помощью клавиатуры. Непосредственным такое общение (или разговором в реальном масштабе времени) данный сервис называется из-за того, что между посылкой сообщения и ответом на него проходит очень мало времени.
Часто этот вид сервиса называют "чатом" или "чаттингом". В WWW он реализован на многих серверах под названием "диван" или "кроватка" (имеется в виду, что "удобно расположившись на диване, ведется неторопливая беседа").
Для реализации сервиса IRC необходимы специальные программы, например, chat.exe , или alphachat.exe , или mirc.exe , и др. В зависимости от используемой программы интерфейс реализован по-разному. Но в любом случае для участия в разговоре необходимо сначала представиться (зарегистрироваться), сообщив свой псевдоним (имя, которое будет сопровождать Ваши сообщения). В нижней части экрана есть по меньшей мере одна строка, в которой с помощью клавиатуры набирается Ваше сообщение.
Центральная часть экрана отводится для фиксации сообщений всех участников разговора.
Кроме досуга IRC позволяет реализовать и более серъезные мероприятия: организовать сервисное обслуживание проданных товаров или оказанных услуг (вреальном времени! В любое время суток); провести обсуждение потребительских свойств товара или качества обслуживания; организовать аукцион; провести совещание с удаленными сотрудниками фирмы; при использовании IRC в учебных целях можно проводить семинары с удаленными слушателями, и т.д.
Некоторые программы IRC позволяют протоколировать ход беседы и сохранять протокол в виде файла.
Фирма Microsoft выпустила freeware - программу для общения в реальном времени - NetMeeting. Эта программа позволяет двум или более лицам обмениваться информацией через Internetв реальном масштабе времени с использованием набираемых на клавиатуре письменных сообщений, передачей звуковых файлов, рисунков, выполняемых на специальной "доске".
Кроме того, эта программа позволяет совместно использовать файлы (что позволяет одновременно работать нескольким лицам с одним и тем же файлом Word или Excel).
NetMeeting совместим с более чем 20 программными продуктами различных фирм для проведения конференций.
Свое начало этот вид сервиса ведет с марта 1989г., когда Тим Бернерс-Ли из CERN предложил руководству этого международного европейского научного центра концепцию новой распределенной информационной системы, которую назвал World Wide Web (WWW или W3). С начала 1995г. практически все компьютерные издания обратили внимание на этот вид сервиса: наконец-то появился удобный интерфейс для работы в Internet.
Программное обеспечение WWW предусматривало наличие двух основных составляющих: WWW-сервера и WWW-клиента. Последний назывался браузером.
К 1995 году были разработаны программы - браузеры Netscape, Arena, Chimera. В последствии к ним добавилась Microsoft Internet Explorer.
Бернерс-Ли считал, что информационная система, построенная на принципах гипертекста, должна объединить все множество информационных ресурсов CERN, которое состояло из базы данных отчетов, компьютерной документации, списков почтовых адресов, информационной реферативной системы, наборов данных, полученных в экспериментах, и т.п. Гипертекстовая технология должна была позволить легко перепрыгивать из одного документа в другой.
В начале 1992г. Марк Андрессен из Национального Центра Суперкомпьютерных Приложений (NCSA) построил на принципах W3 программу MOSAIC - мультипротокольный переносимый интерфейс, который обеспечил бурный рост популярности этого вида сервиса.
При создании новых браузеров ставилась цель - многопротокольная работа: не только в WWW, но и в FTP, telnet, Gopher, WAIS, и др. Благодаря этому в настоящее время, работая в WWW, можно использовать практически все сервисы Internet.
В WWW клиент - это интерпретатор HTML. В зависимости от команд HTML он выполняет различные функции: размещение текста на экране; обмен информацией с сервером по мере анализа полученного HTML-текста или графических образов; запуск внешних программ для работы с документами в форматах, отличных от HTML (GIF, JPEG, MPEG, Postscript, и др.).
Наибольшее распространение получили Web -броузеры Netscape Navigator (Netscape Communicator), Microsoft Internet Explorer.
Сервер протокола HTTP обеспечивает работу WWW, управляет имеющимися базами данных документов в формате HTML и программным обеспечением, разработанным в стандарте CGI. Получили известность такие серверы HTTP, как Netsite (Netscape), Apache (Apache Group), Open Market Secure Web Server (Open Market), NCSA HTTP (NCSA), Netscape Enterprise Server (Netscape), O'Reilly Website (O'Reilly), Internet Information Server (Microsoft), Personal Web Server (Microsoft).
Поиск необходимых сведений в большом объеме достаточно разнообразной информации - задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов были разработаны достаточно совершенные поисковые средства и приемы, позволяющие найти необходимый документ.
В качестве основного инструмента для поиска информации в библиотеках используются каталоги (алфавитные, систематические и предметные). Однако каждый инструмент имеет свои недостатки. При больших объемах информации (которые характерны для Internet) поиск информации становится очень сложной процедурой. Для того, чтобы найти нужные сведения в Inernet необходимо иметь специальные знания и навыки.
Специалист, обладающий такими знаниями и навыками и осуществляющий поиск информации по поступившим заказам называется информационным брокером. Он знает, как устроены классификаторы, как их интерпретируют систематизаторы, какие существуют инструменты для поиска информации в Inernet, технологические приемы и методики поиска, особенности различных поисковых машин и т.д.
В беседе с заказчиком он изучает его информационную потребность и превращает ее в поисковое предписание. В нашей стране специалисты такого профиля - пока редкость, хотя потребность в них уже ощущается.
В Internet доступны информационно-поисковые системы (ИПС) трех типов: классификационные, словарные и предметные.
Классификационные ИПС используют иерархическую организацию информации, которая описывается с помощью классификатора. Разделы классификатора называются рубриками.
В библиотечном деле для этой цели используется, например, систематический каталог.
Классификатор разрабатывается и совершенствуется коллективом авторов. Затем его использует другой коллектив специалистов, называемых систематизаторами, которые, зная классификатор, читают документы и приписывают им классификационные индексы, указывающие, каким разделам классификатора эти документы соответствуют.
В качестве примера классификационной ИПС в Internet можно назвать Yahoo! (), в которой одновременно работает более 100 систематизаторов, Excite, Look Smart, Yellow Web, "Созвездие Интернет", "Ау".
Классификационные ИПС обладают рядом специфических недостатков. Разработка классификатора связана с оценкой относительной важности различных областей человеческой деятельности. Любая оценка является социальным действием - она связана с обществом, культурой, социальной группой, к которой принадлежит производящий оценку человек.
Поэтому классификаторы, созданные разными коллективами в разных странах сильно различаются. Кроме того, у систематизаторов возникают сложности с интерпретацией материалов, написанных на иностранных языках (не только исходных документов, но и классификаторов).
Поскольку абсолютно строгой классификации не удается сделать никому, всегда существуют документы, которые можно отнести к нескольким разделам классификатора.
Систематизаторы в сложных случаях (когда неясно, к какому из разделов должен быть отнесен документ) применяют два приема: отсылка и ссылка. Отсылка (в Yahoo! она обозначается знаком @) помещается в тех разделах классификатора, в которые не попал данный документ - в ней указывается, к какой рубрике он отнесен систематизатором.
Ссылка используется в тех случаях, когда аналогичная информация может находиться в других разделах классификатора.
Словарные ИПС используют базу данных, построенную из слов, встречающихся в документах Internet'а. В такой базе при каждом слове хранится список документов, из которых оно взято.
Поскольку все морфологические единицы в словаре упорядочены, поиск нужного слова может выполняться достаточно быстро, без последовательного просмотра.
По одному слову найти требуемую информацию довольно сложно. Поэтому, каждая словарная ИПС имеет свой язык запросов, позволяющий комбинировать слова, наиболее полно характеризующие искомую информацию.
К словарным ИПС Internet'а относятся такие, как Alta Vista, Rambler, .Hndex, Апорт.
Словарные ИПС способны выдавать списки документов, содержащие миллионы ссылок. Даже простой просмотр таких списков затруднителен. Поэтому многие словарные ИПС предоставляют возможность ранжирования результатов поиска - наиболее важные документы помещаются в начало списка. В языке запросов таких ИПС предусмотрены специальные средства, например, в режиме сложного поиска в Alta Vista можно указать перечень терминов, которые повышают ранг найденного документа (что для этой ИПС особенно актуально, так как она показывает только первые 200 найденных документов).
Rambler и .Hndex позволяют указать вес каждого из терминов, что позволяет довольно точно настраивать порядок следования найденных документов.
В предметных ИПС с поисковым образом связаны списки ресурсов Сети, содержащих нужную информацию и ссылки на близкие по тематике сайты. В таких ИПС создаются кольцевые ссылочные структуры. Так, сервер содержит несколько десятков тысяч тематических колец (средний размер кольца - около 12 серверов, но есть и кольца-гиганты, в состав которых входят тысячи серверов). Пока кольца были небольшими, поиск информации трудностей не представлял.
Для облегчения поиска на указанном сервере используются свои классификационная и словарная ИПС, помогающие найти необходимую информацию.
С помощью информационно-поисковых систем можно искать вполне определенные информационные объекты, список которых приведен на рис. 2.
Описание поисковых систем. Поисковая система Alta Vista.
У каждой поисковой системы существует свой язык запросов, который определяет правила, в соответствии с которыми формулируются запросы на поиск информации.
В классификационных и словарных ИПС запрос составляется на основе ключевых слов, которые являются наиболее яркой характеристикой искомой информации (по сути, без этих слов данная информация обойтись не может). Лучше, если эти ключевые слова имеют специфический смысл, присущий только искомому информационному материалу, отличающему данный материал от всех остальных.
Поисковая система AltaVista относится к разряду словарных ИПС и является одной из самых информационно насыщенных. Обратиться к ней можно по адресам:
(этот адрес позволяет обратиться к поисковой системе, работающей на русском языке);
(по этому адресу содержится доступ к нескольким поисковым машинам, в том числе - работающим на русском языке).
Рассмотрим правила составления поисковых запросов,
использования операторов и команд в языке запросов системы AltaVista:
1) Запрос на поиск информации (поисковое предписание) представляет собой поисковый образ.
2) Поисковый образ может состоять из одного или нескольких ключевых слов.
3) В зависимости от способа соединения ключевых слов в поисковом запросе различают простые и сложные запросы.
4) Сложный запрос отличается от простого тем, что в нем можно
указать дату создания искомого документа (чтобы выделить материалы, имеющие последнее обновление после указанной даты), специальную логику поиска (определяемую использованием операторов AND, OR, NOT, NEAR), выбрать один из трех вариантов упорядочивания результатов поиска при их выводе: "только в качестве итога",
"компактная форма", и "стандартная форма" (последняя используется по умолчанию), и использовать круглые скобки для выделения логически самостоятельных частей запроса.
5) Ключевые слова могут набираться на разных регистрах клавиатуры - в зависимости от этого поисковая машина будет по-разному проводить поиск.
Наличие в ключевом слове заглавной буквы заставит поисковую машину при простом поиске искать слова именно с таким написанием, как в запросе. Если же заглавные буквы не использовались, то поисковая машина учитывает любые варианты написания этих слов. Например, если поисковое предписание состоит из одного слова Computer, будут найдены информационные материалы, содержащие это слово именно в таком начертании. Если же это слово не будет содержать заглавных букв, то при поиске будут учитываться слова в таких начертаниях, как computer, COMPUTER, COMPuter, и др.
Необходимо учитывать, что при использовании поискового образа, состоящего только из одного слова computer, AltaVista предоставляет около 2000 ссылок. Просмотреть такое количество ссылок практически невозможно, а значит, информационный поиск нельзя считать эффективным (при правильно составленном запросе необходимая информация находится в числе первых двух десятков ссылок).
6) В том случае, если неизвестно правильное написание слова, или интерес представляет множество однокоренных слов, используется оператор неопределенности - "*" (звездочка). Поставив этот символ после любой последовательности букв (не менее трех), влияние которых необходимо учесть при поиске, можно произвести широкий поиск, при котором ключевое слово будет модифицироваться: поиск будет весьтись как для жестко указанной до звездочки совокупности букв, так и для слов, содержащих любые буквы (числом до 5) вместо звездочки.
Например, если указать ключевое слово comp* , то при поиске будут учитываться , как ключевые - computer, computers, compute, и др.
7) Для соединения нескольких ключевых слов могут использоваться операторы "пробел", "кавычки", логические операторы "+", "-", AND, OR, NOT, NEAR.
8) Оператор "пробел" соединяет слова в поисковом предписании таким образом, что для поиска каждое из этих слов используется отдельно. При этом, порядок слов в запросе не имеет значения.
В процессе поиска учитывается только расстояние каждого слова от начала документа и частота его использования в документе.
9) Оператор "кавычки" соединяет слова так, что они образуют фразу, в которой все указанные в предписании слова в документе стоят рядом друг с другом и в той же последовательности, как это указано в предписании. Поэтому, если задать поисковое предписание в виде слов "personal computer" и в виде "computer personal", то результаты поиска будут разными.
10) Оператор "+", соединяющий слова, сообщает поисковой машине, что в документе необходимо искать основное слово (первое), но документ надо показывать в результате поиска только если далее в тексте встречаются остальные слова из поискового предписания. Оператор ставится непосредственно перед каждым второстепенным словом. Например, по поисковому образу:
computer +personal +digital будет вестись поиск основного слова computer, но текст будет считаться актуальным только если в нем встречаются так же слова personal и digital.
11) Оператор стоящий перед словом, обозначает, что основное слово должно использоваться в тексте без второстепенного. Например, поисковое предписание computer -personal сообщает поисковой машине, что надо искать основное слово computer, но в тексте не должно встречаться слово personal (т.е. интересуют материалы о компьютерах, но не персональных).
12) Операторы AND, OR, NOT, NEAR используются в сложных запросах.
13) Оператор AND (вместо него можно использовать символ ) определяет, что соединяемые им слова должны встречаться вместе (т.е. в простых запросах он эквивалентен знаку "+").
14) Оператор OR (вместо него можно использовать знак "|") определяет, что соединяемые им слова независимы друг от друга (в простых запросах он эквивалентен пробелу).
15) Оператор NOT обозначает отрицание (в простых запросах он эквивалентен знаку "-").
16) Оператор NEAR (вместо него можно использовать символ "~") определяет, что в искомом тексте указанное им ключевое слово отстоит от основного не далее, чем на 10 слов (например, в поисковом предписании:
провайдер* NEAR "очень дешево"
предусматривается, что в искомом тексте слово "провайдер" и словосочетание "очень дешево" находятся не в разных концах текста, а рядом друг с другом - между ними может находиться не более 10 слов).
17) Для ограничения поиска используются специальные команды (тэги): anchor, applet, title, url, host, link, image,from, subject.
18) Команда anchor позволяет найти в Сети слово, содержащееся в "теле" ссылки. Для этого после команды anchor через двоеточие указывается искомое слово. Например, поисковый образ содержит:
anchor:home
По этому запросу будет найдено все множество страниц, содержащих внутри ссылок слово home, в том числе - и в такой ссылке: "If you would like go home, press here".
19) Команда applet позволяет найти заданный названием модуль Java. Например, если модуль Java называется word, то найти его можно, записав поисковый образ: applet:word .
20) Команда title используется в том случае, если искомое слово находится в заголовке текста. Например, по запросу вида: title:links
будут найдены документы, содержащие слово links в заглавии, в том числе текст с заглавием "Cool Links".
21) Команда url предписывает искать url-адрес, содержащий заданное слово. Например, если неизвестно, в каком корневом домене находится host-компьютер МЭСИ, можно задать поисковое предписание: url:mesi . Среди множества адресов с таким словом будет и адрес .
22) Команда host позволяет узнать, какие Web-сайты есть на заданном host-компьютере. Например, для того, чтобы узнать, какие сайты есть на хосте необходимо набрать запрос: host:intel.ru . Если же в запросе указать только часть имени, то в результате поиска будут найдены сайты, имеющие другие адреса, но содержащие заданную часть имени.
Используя эту команду, можно вести поиск в заданной стране. Например, по запросу host:*.ru +kreml будет найдена информация о Московском, Рязанском и других Кремлях.
При этом нужно помнить, что поиск ведется только для сайтов, зарегистрированных в поисковой системе AltaVista, другие сайты ей недоступны.
23) Команда link позволяет найти адреса страниц (сайтов), содержащих ссылку на конкретную (заданную в поисковом образе) Web-страницу. Например, для того, чтобы узнать, кто ссылается на сайт необходимо задать предписание: link: . Результатом будет список страниц, на которых содержатся ссылки на сайт mesi.ru .
24) Команда image позволяет найти иллюстрацию в Internet. Для этого надо знать название файла, в котором она хранится.
Формат команды тот же.
25) Команда from позволяет искать в телеконференциях Usenet почтовое сообщение, отправленное конкретным человеком, имя которого указывается после двоеточия в команде. Например: from:Иван +Федоров (или Ivan +Fedorov).
26) Команда subject позволяет искать сообщения в телеконференциях Usenet на конкретную, заданную в поисковом предписании тему.
Поисковая система AltaVista может работать (и вести поиск) на разных языках, в том числе и на русском.
Описанные принципы управления поисковой системой во многом аналогичны используемым и в других поисковых системах.
Поисковая система Yandex.
В 1997г. по адресу: открылась новая российская поисковая машина Yandex (или .Hndex). По набору своих поисковых возможностей она не уступает самым сложным поисковым машинам Запада, специально рассчитана на русскоязычные запросы и учитывает особенности русской лексики, предлагает несколько больше возможностей для интеллектуального поиска.
Аналогично AltaVista, Yandex различает заглавные и прописные буквы. Если ключевое слово написано прописными буквами, то поисковая машина не различает прописные и заглавные буквы, т. е при задании ключевого слова computer в поиске будут учитываться и Computer, и COMPUTER, и др.
Тогда, как если в поисковом образе будет содержаться хотя бы одна заглавная буква, при поиске будут приниматься во внимание только слова, имеющие данное начертание.