Онлайн библиотека PLAM.RU


  • Поисковые серверы. Некоторые правила поиска
  • Принципы работы поисковых серверов
  • Правила построения поисковых запросов
  • Поисковые запросы: подробно
  • Поисковый сервер «Яндекс»
  • Поисковый сервер Google
  • Альтернативные средства поиска
  • Метапоиск
  • Веб-каталоги
  • Поиск ответов на вопросы
  • Поиск рисунков в Интернете
  • GoGraph.com
  • Picsearch
  • Поиск музыки и видео
  • Поиск по FTP-серверам
  • Глава 3

    Поиск в Интернете

    Поисковые серверы. Некоторые правила поиска

    Поисковые запросы: подробно

    Альтернативные средства поиска

    Поиск рисунков в Интернете

    Поиск музыки и видео

    Поиск по FTP-серверам


    Проблема поиска во Всемирной паутине не в том, что информации мало, а в том, что ее много. Поэтому отыскать то, что нужно, порой достаточно трудно. Вообще, поиск информации в Интернете – краеугольный камень эффективной работы в Сети. Владение навыками поиска делает Интернет для пользователя полезным инструментом для работы и отдыха. В этой главе поговорим о том, как правильно искать в Сети необходимую информацию. Кроме того, разберемся с поиском файлов (который имеет некоторые особенности по сравнению с поиском текстовой информации), картинок и других ресурсов.

    Поисковые серверы. Некоторые правила поиска

    Для организации поиска в Интернете существуют специализированные службы, называемые поисковыми серверами. На практике – это веб-сайты, где можно набрать в соответствующей строке ключевые слова, касающиеся интересующей темы, и получить множество ссылок на ресурсы с нужной информацией. Например, на запрос домашние животные поисковый сервер «Яндекс» (подробнее о нем см. ниже) выдает более 14 000 000 ссылок на страницы, содержащие нужные, на его взгляд, сведения. Однако далеко не все так гладко: при посещении некоторых найденных страниц выясняется, что искомой информации на них недостаточно, а то и вовсе нет.

    Чтобы искать с максимальной результативностью, не лишне будет знать, как работают поисковые серверы.

    Принципы работы поисковых серверов

    Поисковый сервер – это довольно сложная программа, точнее комплекс программ, в которых используются специальные алгоритмы анализа содержимого веб-сайтов в масштабах всего Интернета.

    Интересный момент: на обработку того же запроса домашние животные у «Яндекса» ушло менее секунды. Невольно возникает вопрос: «А можно ли проанализировать весь Интернет за столь короткое время?» Однозначный ответ на это: «За столь короткое время проанализировать весь Интернет нельзя». Тем не менее факт остается фактом: на обработку запроса затрачено меньше секунды. Ответом на возникшее недоразумение будет описание принципов работы поисковых серверов.

    Работа над запросом конкретного пользователя (а заодно и над всеми другими возможными запросами) началась задолго до его введения. Специальная программа, называемая «пауком», просматривает содержимое веб-сайтов.

    Ее задачи чем-то схожи с задачами обычного веб-браузера, только вместо того, чтобы показывать страницы на экране, «паук» передает их содержимое другой программе – «путешествующему пауку». Задача «путешествующего паука» – вычленение из загруженной страницы ссылок на другие сайты, по которым снова направляется «паук». Цикл этот повторяется многократно, точнее непрерывно.

    На этом работа не заканчивается. За дело принимается программа-индексатор, которая, используя определенные правила, анализирует полученные «пауками» страницы и формирует сложную базу данных поискового сервера. Вот эта самая база данных потом и выдает результаты поиска, которые появляются после обработки введенного запроса. На принципах работы индексатора остановимся поподробнее, так как именно от него зависит то, что войдет в результаты поиска.

    В основе работы большинства современных поисковиков лежит индекс цитирования, который вычисляется индексатором в результате анализа ссылок на текущую страницу с других страниц Интернета. Чем их больше, тем выше индекс цитирования анализируемой страницы и тем выше эта страница будет отображена в результатах поиска. Кроме того, учитывается индекс цитирования страниц, которые ссылаются на страницу, изучаемую индексатором.

    Кроме индекса цитирования учитываются также следующие параметры:

    • наличие искомых слов в заголовке страницы или названии сайта;

    • частота повторений искомых слов на странице;

    • размер шрифта, которым на странице написаны слова из поискового запроса, а также выделение этих слов шрифтами и стилями;

    • тематика ссылающихся сайтов и некоторые другие.

    После ввода запроса пользователем за дело берется последнее звено поискового сервера – система выдачи результатов. В итоге анализа и сопоставления упомянутых выше показателей эта система определяет степень соответствия содержимого страницы условиям запроса. Чем эта степень больше, тем выше страница будет представлена в списке найденных ресурсов.

    Возвращаясь к вопросу о скорости обработки запроса, отмечу, что такая высокая скорость обеспечивается за счет того, что страницы Интернета проиндексированы заранее, а результаты поиска составляются на основе информации из базы данных поискового сервера.

    Такой способ, как несложно догадаться, имеет очевидный недостаток, заключающийся в том, что содержимое веб-страниц может со временем изменяться, а «паук» не будет успевать найти их и обработать, следовательно, результаты поиска будут неточными. Еще раз, упомянув о времени, необходимом поисковому серверу для просмотра и индексации всего Интернета, скажу, что на это у разных поисковиков уходит от нескольких суток до нескольких недель в зависимости от алгоритма обработки информации. Так что сайты, появившиеся в Сети недавно, в результатах поиска представлены не будут.

    Разработчики поисковых серверов борются с этим разными способами и с переменным успехом. Например, большинство современных поисковиков предоставляет такой сервис, как поиск по новостным лентам, обновляющимся каждые несколько минут, и поэтому они чаще индексируются поисковиками. Как бы там ни было, лучшего способа, чем предварительная индексация страниц, сегодня не существует.

    Правила построения поисковых запросов

    Как уже отмечалось, в Интернете существует множество поисковых серверов, отечественных и зарубежных.

    Российские поисковые серверы:

    • «Яндекс» – www.yandex.ru;

    • «Рамблер» – www.rambler.ru;

    • «Апорт» – www.aport.ru;

    • Gogo – www.gogo.ru.

    Зарубежные поисковые серверы:

    • Google – www.google.com;

    • Altavista – www.altavista.com;

    • Yahoo! – www.yahoo.com.

    Для поиска на русском языке лучше подходят российские серверы, на иностранном – зарубежные, хотя, например, Google неплохо справляется с поиском на многих языках. Подробнее о наиболее популярных поисковых системах поговорим позже, рассматривая расширенные возможности поиска, так как у каждой из этих систем есть свои особенности. Сейчас остановимся на некоторых базовых правилах построения поисковых запросов, общих для всех поисковиков.

    Несмотря на заявления многих владельцев поисковых серверов, что запросы могут быть написаны практически на языке, который люди используют для общения между собой, это далеко не так. По всей видимости еще не скоро наступит время, когда компьютер и человек смогут общаться на естественном (для человека) языке. Впрочем, нужно отдать должное поисковым серверам: в последнее время они стали гораздо лучше понимать пользователя, и результаты поиска теперь больше соответствуют ожиданиям, чем это было несколько лет назад. Произошло это во многом благодаря внедрению новых языковых технологий.

    Из вышесказанного следует, что на практике рядовому пользователю находить нужную информацию стало проще. Поисковики теперь ищут не только запрашиваемое слово, но и его словоформы, что позволяет делать результаты поиска более точными. Например, если в поисковом запросе присутствует слово умный, то его результаты будут содержать не только это слово, но и его производные: умного, умная, а также ум и даже разум. Конечно, страницы со словоформами будут не в числе первых результатов поиска, но элементы искусственного интеллекта налицо. Этот факт полезно учитывать при построении поисковых запросов. Теперь расскажу еще о нескольких таких фактах.

    Поисковые серверы при обработке запроса не учитывают регистр символов. Поэтому запросы Отдых в Турции и отдых в турции с точки зрения поисковика идентичны.

    Также следует помнить, что применять знаки препинания в поисковых запросах вовсе не обязательно, точнее, даже не нужно, так как они также игнорируются поисковыми серверами. Зато многие традиционные знаки препинания могут быть использованы при построении сложных расширенных запросов, результаты поиска по которым обычно гораздо ближе к ожидаемым.

    Большинство поисковых серверов (кроме, пожалуй, Google) также игнорирует короткие слова, не несущие смысловой нагрузки. В русском языке это предлоги, союзы и т. д., в иностранных, например, артикли.

    Многие поисковые серверы позволяют бороться с опечатками и неправильной раскладкой клавиатуры. Наверняка многим читателям часто случалось набрать при включенной английской раскладке клавиатуры русское слово, и получалось, например, gfhjdjp вместо паровоз. Тот же «Яндекс» сразу определит, что здесь что-то не так и вверху страницы с результатами поиска выдаст ссылку: Быть может, вы искали: паровоз, перейдя по которой можно получить страницу с правильными результатами. Аналогично можно бороться с опечатками. Если поисковому серверу покажется, что в слове допущена ошибка или опечатка, то он предупредит об этом той же фразой: Быть может, вы искали.

    Поговорим о том, какие слова лучше взять для запроса поисковому серверу. Во-первых, из интересующей пользователя темы нужно взять самые важные по смыслу слова, отражающие только суть вопроса. Например, если необходим материал по теме «Ловля пингвинов в Антарктиде в условиях полярной ночи», то вовсе не обязательно писать фразу целиком, результаты поиска в этом случае, скорее всего, не устроят запрашивающего, так как будет много лишнего. Есть выражение «Машина должна работать, человек – думать», и сказано оно как раз о такой ситуации. Задача пользователя при составлении поискового запроса – выделить ключевые слова, задача поискового сервера – наилучшим образом обработать введенный запрос. В рассматриваемом примере ключевыми можно считать слова ловля пингвинов. Ведь известно, что кроме Антарктиды они нигде больше не водятся, ну а «полярную ночь» стоит отбросить хотя бы потому, что в реальности в таких условиях работать достаточно сложно.

    Этот ироничный пример иллюстрирует, что пользователь, основываясь на своих знаниях и логике, должен выделить только необходимые ключевые слова, не перегружая запрос лишними терминами.

    Рассмотрим пример, иллюстрирующий типичные ошибки начинающих пользователей при поиске в Интернете. На запрос загадки о музыкальных инструментах поисковик не выдал полезных результатов. Тогда пользователь решает исправить запрос, дополнив его и написав: загадки для детей о музыкальных инструментах – результаты поиска оказались еще хуже предыдущего. В такой ситуации говорят, что условия запроса стали более жесткими в отличие от более мягких, установленных в предыдущем случае. Для данного примера неплохим решением, как показала практика, явился поиск по ключевому слову загадки. В Интернете много таких сайтов, а зайдя на сам сайт и немного поискав по его разделам, вполне можно найти интересующую информацию.

    Рассуждая о том, какие слова нужно использовать в поисковом запросе, можно сформулировать несколько правил:

    • выбирайте только самые важные ключевые слова, касающиеся рассматриваемой темы;

    • слов не должно быть слишком много или слишком мало; некоторые считают оптимальным запрос, состоящий из трех-четырех слов, однако в разных случаях это количество может различаться;

    • при неудовлетворительных результатах поиска попробуйте применить более мягкие условия для запроса, но ни в коем случае не более жесткие;

    • если вы не удовлетворены результатами поиска на одном поисковом сервере, то попробуйте поискать на другом; механизмы работы у серверов неодинаковые, так что результаты могут различаться коренным образом.

    Надеюсь, что вышеизложенная информация поможет читателям находить в Сети необходимые сведения. Если найти что-то все равно никак не удается, то на помощь придут расширенные методы поиска.

    Поисковые запросы: подробно

    Для обеспечения более эффективного поиска в Интернете поисковые серверы предоставляют возможность расширенного поиска, а также поиска с использованием языка запросов. Чтобы разграничить эти понятия, дам их определения.

    Расширенный поиск – возможность поиска с указанием множества различных параметров. Для этого в поисковиках предусмотрены отдельные страницы, на которых можно задать такие параметры. Принципы работы расширенного поиска схожи у большинства поисковиков.

    Язык запросов – система команд, позволяющая изменять параметры запроса из основной строки поиска с помощью специальных команд. Ориентирован на опытных пользователей.

    Рассмотрим дополнительные возможности поиска на примерах поисковиков «Яндекс» и Google. Почему именно на них? Потому что «Яндекс» – самый популярный поисковый сервер в русскоязычном Интернете, а Google – самый популярный поисковик в мире. Впрочем, с успехом можно пользоваться и другими поисковыми системами, но мы пока остановимся на двух упомянутых.

    Поисковый сервер «Яндекс»

    Этот поисковик – один из старейших в русскоязычном сегменте Сети. «Яндекс» начал свою деятельность еще в 1997 году, когда Интернет только начал развиваться на постсоветском пространстве. Постепенно набирая обороты, «Яндекс» сегодня стал самым популярным поисковым сервером в русскоязычном Интернете, его ежедневная аудитория составляет более 4 000 000 человек. Около половины всех русскоязычных пользователей Интернета пользуются его услугами. При поиске в Интернете «Яндекс» одним из первых стал учитывать морфологию русского языка, то есть использовать различные формы слова, о чем говорилось выше.

    Зайдя на сайт www.yandex.ru, пользователь может ввести запрос и тут же получить результаты поиска. Можно также воспользоваться присутствующей там же ссылкой Расширенный поиск и перейти на соответствующую страницу (рис. 3.1), на которой тонко настроить параметры поиска.

    Рис. 3.1. Страница расширенного поиска «Яндекса»


    Рассмотрим дополнительные возможности, которые можно использовать на странице расширенного поиска.

    В поле Я ищу набираем запрос. Под данным полем расположена надпись (используйте минус перед словом для его исключения), следует взять это на заметку. Такая возможность бывает полезна, когда искомый термин имеет несколько значений. Например, если необходима информация о машине времени (устройстве), то в поле следует указать машина времени -группа, чтобы исключить из результатов поиска сайты, содержащие информацию об одноименном популярном музыкальном коллективе.

    В разделе Искомые слова необходимо выбрать расположение слов в тексте сайта. Здесь можно настроить расположение слов относительно друг друга, расположение их на странице, а также форму употребления в тексте. Здесь все ясно из названий, однако поясню, что переключатель употреблены в тексте можно установить в одно из двух положений: в любой форме или точно так, как в запросе. Выбором последнего варианта поисковику указывается, что морфологию слова изменять не нужно, а искать только ту форму слова, которая задана.

    В разделе Страницы можно указать параметры искомого документа, настроив значения следующих элементов.

    • язык – в данном раскрывающемся списке доступны варианты: любой, русский, английский, французский, немецкий, украинский, белорусский. Повторю, что сайты на иностранных языках искать все же лучше с помощью иностранных поисковых серверов.

    • дата – в данном поле указывается дата последнего обновления сайта (вариант выбирается из предложенных диапазонов дат или задается пользователем).

    • формат – среди доступных форматов интересующего документа – HTML, PDF, RTF, DOC, XLS, PPT и SWF.

    Совет

    Если нажать и удерживать клавишу Ctrl на клавиатуре, то можно выбрать несколько форматов. То же касается выбора языков.

    • находятся на сайте – в данном поле можно указать сайт, на котором необходимо искать информацию (если интересует не весь Интернет, а только конкретный его ресурс). Эту функцию удобно применять, если пользователь знает качественный сайт, на котором много информации на интересующую его тему. Логично, что гораздо эффективнее поискать ответ на вопрос именно на нем, чем по всей базе сайтов. Поиск по сайту также выручает, когда на каком-либо сайте нет функции поиска (правда, следует помнить, что «Яндекс» мог проиндексировать не все страницы сайта).

    • похожи на страницу – в поле указывается страница, на которую должен быть похож найденный ресурс. Анализируя документ, заданный пользователем в качестве образца, «Яндекс» подбирает страницы, отвечающие запросу столь же хорошо.

    • регион – в поле устанавливается географический регион поиска.

    • В результатах поиска показывать ссылок на странице – с помощью значений раскрывающегося списка указывается количество ссылок, выводимое на каждой странице.

    Выполнив все настройки, остается нажать кнопку Найти и изучать результаты поиска.

    Кроме расширенного поиска «Яндекс» позволяет использовать язык запросов, ориентированный на опытных пользователей, и дает возможность еще более тонкой настройки параметров запроса. Поскольку язык запросов достаточно сложен и объемен, приведу здесь лишь основные его конструкции, которые могут быть наиболее востребованы пользователем. Полностью со структурой языка запросов «Яндекса» можно познакомиться на странице http://help.yandex.ru/search/?id=481939. Основные команды языка запросов «Яндекса» представлены в табл. 3.1.

    Таблица 3.1. Основные команды языка запросов поискового сервера «Яндекс»

    Это основные (но не все) возможности языка запросов «Яндекса». Применяя их, можно значительно облегчить себе задачу поиска нужного документа.

    Поисковый сервер Google

    Поисковик Google был основан двумя аспирантами Стэндфордского университета Лари Пейджем и Сергеем Брином, выходцем из бывшего СССР. В 1996 году они начали сотрудничать с поисковым сервером BackRub, который работал по принципу back links – «обратные ссылки». Эта формула определяла количество ссылок, ведущих на заданный сайт. Создатели справедливо решили, что на популярный и интересный сайт ссылаться будут гораздо чаще, чем на скучный и полумертвый ресурс. Этот принцип и лег в основу поискового сервера Google. Поисковик снабжен очень дружелюбным интерфейсом. Пользователь, впервые попавший на сайт поисковой системы Google, удивится чистому окну, не содержащему практически ничего, кроме строки поиска.

    Сейчас поисковая система Google обрабатывает ежедневно около 50 000 000 поисковых запросов и индексирует более 8 000 000 000 веб-страниц. Google может давать информацию более чем на 100 языках.

    Как и в «Яндексе», в Google присутствует возможность расширенного поиска и использования языка запросов.

    Страница расширенного поиска Google (рис. 3.2), попасть на которую можно, нажав на ссылку Расширенный поиск на главной странице поисковика, очень похожа на свой аналог из «Яндекса».

    Рис. 3.2. Страница расширенного поиска Google


    Различия страниц настройки поисковиков разве что в количестве языков, на которых можно вводить запрос (их гораздо больше), и в возможности отсеивать результаты с определенными правами использования (коммерческие, некоммерческие и т. п.). Остальные возможности настройки параметров практически идентичны. Язык поисковых запросов в Google отличается от «Яндекса», хотя есть и некоторые общие моменты. Рассмотрите основные команды этого языка, изучив табл. 3.2.

    Таблица 3.2. Основные команды языка запросов Google

    Поисковый сервер Google предоставляет еще одну возможность, которая напрямую не имеет отношения к поиску, но тем не менее может показаться кому-то интересной. Это возможность совершения простых арифметических действий: сложения, вычитания, умножения, деления, возведения в степень (команда ^, например, 6^3), возврат процентов (команда % of, например,45% of 39). Получается эдакий своеобразный калькулятор. При этом можно использовать и скобки для написания более сложных математических выражений.

    Приведенного перечня команд рядовому пользователю вполне достаточно для задания необходимых условий поиска. Познакомиться со всеми командами языка запросов Google можно по адресу www.google.com/help/operators.html.

    Следует упомянуть об еще одной интересной функции поискового сервера Google, вызываемой кнопкой Мне повезет. Ее нажатие приводит к тому, что результатом поиска будет не страница со списком ссылок, а переход на первый найденный сайт. Данную кнопку удобно использовать при поиске, например, сайтов крупных организаций. Если набрать в строке поиска МГУ и нажать кнопку Мне повезет, то сразу откроется сайт Московского государственного университета.

    Альтернативные средства поиска

    Несмотря на то что в сегодняшнем Интернете поисковые серверы являются главным способом поиска информации, существуют и другие методы ее поиска. Такие альтернативные способы порой помогают найти то, что не удалось отыскать с помощью поискового сервера.

    Метапоиск

    Несмотря на универсальность поисковых серверов, результаты поиска у каждого из них практически всегда разные. Искать отдельно на каждом поисковике интересующую информацию достаточно трудно и утомительно. Проще найти необходимые сведения с помощью метапоиска, который позволяет искать введенные пользователем ключевые слова сразу по нескольким поисковым серверам в автоматическом режиме. Затем полученные результаты группируются по следующему принципу: чем больше поисковиков нашло конкретный сайт и чем выше его позиция в результатах поиска, тем выше он будет и в метапоиске. Работа с сервером метапоиска, с точки зрения пользователя, практически ничем не отличается от поиска на обычном поисковом сервере: тот же ввод ключевых слов, то же нажатие кнопки Найти.

    Наиболее мощные серверы метапоиска в русскоязычном Интернете – Nigma.ru (www.nigma.ru) и MetaBot.ru (www.metabot.ru).

    Поисковик Nigma.ru поддерживает поиск по следующим поисковым серверам: Google, Yahoo!, Msn, «Яндекс», «Рамблер», Altavista, Aport. Можно искать на русском или английском языке. Предусмотрен простой язык поисковых запросов, а также расширенный поиск. Nigma.ru (рис. 3.3) ищет документы с учетом русской орфографии, а также корректирует возможные ошибки. Кроме традиционного поиска веб-страниц возможен поиск по разделам: Картинки, Библиотеки, Музыка и даже Подарки.

    Рис. 3.3. Метапоисковик Nigma.ru


    Метапоисковик MetaBot.ru (рис. 3.4) поддерживает поиск по большому количеству поисковиков, среди которых есть малоизвестные, можно сказать даже экзотические: Alltheweb, Google, Inktomi, «Яндекс», Northernlight, Altavista, Lycos, Webtop, Aport, Euroseek, «Рамблер», Links2go, Excite.

    Рис. 3.4. Главное окно сервера метапоиска MetaBot.ru


    Однако, по заявлению администрации MetaBot.ru, количество и состав опрашиваемых поисковых систем может меняться. При поиске с помощью данного сервера можно выбрать один из его видов:

    • РУССКИЙ ПОИСК – поиск в русскоязычном Интернете;

    • ВЕСЬ МИР – поиск по всему Интернету;

    • ПОИСК ФАЙЛОВ – поиск собственно информации;

    • MP3/VIDEO – поиск музыки и видео.

    Как и Nigma.ru, MetaBot.ru имеет несложный язык поисковых запросов, а вот возможности расширенного поиска у него, к сожалению, нет.

    Веб-каталоги

    Еще один альтернативный способ поиска – веб-каталоги. Это по сути интернет-сайт, на котором собраны ссылки на различные ресурсы Сети. Эти ссылки сгруппированы по разделам, которые могут иметь подразделы, те, в свою очередь, также разбиваются на подразделы и т. д. Зайдя, например, в раздел «Бизнес и финансы», можно увидеть подразделы «Менеджмент», «Валюта», «Юристы», «Безопасность», «Банки», «Налоги» и др. Обычно в веб-каталоге существует внутренний поиск по ресурсам каталога. Ссылки на конкретные веб-сайты, как правило, сопровождаются небольшим описанием ресурса, что делает поиск более удобным.

    На заре Интернета, когда количество сайтов в Сети было сравнительно невелико, поиск по веб-каталогам являлся основным средством поиска информации во Всемирной паутине. Со временем Интернет разрастался, и администраторам таких каталогов становилось все труднее обеспечивать их работоспособность и поддерживать актуальность представленной информации на должном уровне. Веб-мастерам, которые создавали свои сайты, предоставлялась возможность самим добавлять ссылки на свой ресурс в веб-каталог. Однако отслеживать корректность добавляемых ссылок и описаний администраторам веб-каталогов становилось все труднее. Поэтому постепенно веб-каталоги уступали место поисковым серверам, которые могли автоматически индексировать содержимое интернет-сайтов, и участие человека там было минимальным, а получаемые результаты зачастую больше соответствовали требованиям.

    Тем не менее веб-каталоги живы и поныне. Многие крупные интернет-порталы имеют в своем составе веб-каталоги. Многие владельцы поисковых серверов считают хорошим тоном иметь свой веб-каталог. Вот некоторые из действующих веб-каталогов:

    • WWW.RU – www.ru/rus (при попытке зайти на данный веб-ресурс он отсылает пользователя по адресу http://www.ru/eng/index.html; русскоязычный вариант этого ресурса – http://www.ru/rus/index.html;

    • Каталог Российских Веб-Серверов – www.weblist.ru/russian;

    • Каталог@MAIL.RU – www.list.mail.ru;

    • Яндекс.Каталог – www.yaca.yandex.ru.

    Часто с помощью веб-каталогов можно найти интересные и информативные ресурсы, которые не удавалось отыскать с помощью поисковых серверов.

    Поиск ответов на вопросы

    Строго говоря, то, о чем сейчас пойдет речь, не является поиском в чистом виде. Однако, рассматривая способы поиска в Интернете, нельзя не упомянуть экспертные узлы. Как уже говорилось, люди пока не научили компьютеры понимать живой человеческий язык. Иногда возникает ситуация, когда найти ответ на интересующий вопрос невозможно, формулируя этот самый вопрос одними лишь ключевыми словами: требуется изложить суть проблемы на живом языке. Например, вы купили на рынке неизвестный фрукт и не у кого спросить, что это такое (спрашивается, зачем тогда покупали, но это уже неважно). Важно, что, как бы вы ни старались, традиционные да и многие альтернативные способы поиска в Интернете тут помочь не смогут. Вот в этом-то случае и придет на помощь экспертный узел – специализированный веб-сайт, своего рода информационный центр, поддерживаемый знаниями и суждениями живых людей.

    Работа экспертного узла во многом напоминает работу форума (о форумах подробнее см. в гл. 9 разд. «Знакомства, общение, поиск друзей») и строится следующим образом: один человек задает вопрос на обычном «человеческом» языке, а другие посетители ресурса дают ответ опять же на обычном языке. В рассматриваемом примере с фруктом вопрос можно сопоставить примерно так: «Кто знает, как называется фрукт такого-то цвета, такого-то запаха, такого-то размера, внешне похожий на то-то?»

    Поскольку количество посетителей экспертных узлов велико, то, как правило, ответ находится в течение нескольких минут. Чаще всего результатом вопроса бывает весьма квалифицированный и индивидуальный ответ или совет, какой не способна дать ни одна поисковая система. Все вопросы разделены по категориям, почти как в веб-каталогах, что облегчает участникам общение между собой.

    Для русскоязычного Интернета такое явление, как экспертные узлы, пока не очень распространено. Из более-менее крупных можно назвать разве что проект Ответы@Mail.Ru (otvet.mail.ru). Проект насчитывает более 7,5 000 000 участников, и их количество постоянно растет (рис. 3.5).

    Рис. 3.5. Проект Ответы@Mail.Ru, позволяющий найти ответ на любой вопрос


    Пользователи, готовые задать вопрос на английском языке и на нем же получить ответ, могут прибегнуть к услугам зарубежных экспертных узлов, таких, как AskMe (askme.com) или LookSmart Live.

    Разобравшись в целом с поиском веб-страниц и документов, следует обратить внимание на поиск файлов всех форматов, так как он имеет некоторые особенности по сравнению с поиском текстов. Под файлами подразумеваются именно файлы в чистом виде: картинки, аудио– и видеофайлы, программы, архивы и т. д. (по сути, веб-страница – это тоже множество файлов). Рассмотрим некоторые тонкости поиска картинок, музыкальных и иных файлов.

    Поиск рисунков в Интернете

    Миллиарды картинок, хранящихся в Сети, могут быть использованы с самыми разными целями: в качестве рисунка Рабочего стола, как иллюстрация к научной или другой работе, для создания собственных открыток или презентаций и т. д. Искать рисунки сложнее, чем текст, поскольку индексация картинок для поисковика проблематичнее, чем индексация текста, ведь компьютеры пока не научились распознавать образы.

    Какими бы умными ни казались компьютеры, как бы ни поражала их вычислительная мощь, но современные вычислительные машины пока не в состоянии справиться с задачей, которую под силу выполнить пятилетнему ребенку, например отличить изображение кошки от изображения собаки. Причем несмотря на то, что конечный пользователь при поиске рисунка описывает его именно словами, а не образами. Определение списка ключевых слов для конкретного изображения в Сети является главной проблемой, стоящей перед поисковыми серверами.

    Для ее решения анализируются следующие параметры: слова, встречающиеся на странице рядом с картинкой; название ссылки, ведущей на рисунок; имя файла изображения; название сайта и др. Как бы там ни было, но находить рисунки в Интернете можно.

    Однако при поиске картинок необходимо учитывать наличие описанных выше проблем по их поиску. Далеко не всегда на найденном рисунке будет изображено то, что ожидалось. Об этом нужно помнить и при построении поискового запроса. Одно дело, когда требуется найти изображение велосипеда (то есть конкретного предмета), и совсем другое, когда необходима картинка на абстрактную тему, например «бег трусцой». В последнем случае придется поэкспериментировать и попробовать, например, следующие варианты ключевых слов: «пробежка», «бегун», «спортсмен» и т. п. Таким образом, в отличие от поиска текста при поиске рисунков, если их не удается найти сразу, нужно использовать смежные, а порой и отдаленные понятия.

    Рассмотрим средства, применяемые для поиска картинок в Сети. Как упоминалось выше, используя серверы метапоиска, можно искать картинки, просто введя ключевые слова в поисковую строку и выбрав функцию поиска по картинкам. Кстати, обычные поисковые серверы тоже предоставляют возможность поиска рисунков. На главной странице практически любого поисковика есть ссылка Картинки или Рисунки, перейдя по которой можно искать рисунки. Например, сервис поиска картинок «Яндекса» находится по адресу www.images.yandex.ru, соответствующей услугой, предоставляемой Google, можно воспользоваться на странице www.images.google.com. Результатом запроса будет страница с уменьшенными копиями найденных рисунков (рис. 3.6).

    Рис. 3.6. Результаты поиска картинок по запросу поросенок в Google


    Щелкнув на любом из таких миниатюрных изображений, можно увидеть его полноразмерный вариант и, конечно, сохранить рисунок на винчестере компьютера.

    Кроме обычных поисковых серверов для поиска картинок можно использовать специализированные службы, задача которых заключается исключительно в поиске изображений. Среди них – GoGraph.com (www.gograph.com) и Picsearch (www.picsearch.com). Общий недостаток этих сервисов – их англоязычный интерфейс. Вкратце охарактеризую оба эти поисковика.

    GoGraph.com

    Данный сервер, скорее, не поисковик, а веб-каталог рисунков с функцией поиска. Как и в обычном веб-каталоге, на GoGraph.com (рис. 3.7) все рисунки структурированы по категориям, что позволяет искать изображения вручную, не прибегая к функциям поиска.

    Рис. 3.7. Каталог-поисковик GoGraph.com


    Искать можно по всем типам файлов или выбрав один или несколько из предложенных: Animated GIFs (GIF-анимация), Photos (фотографии), Icons (значки), Clip Art (клипарт). Некоторые изображения, в частности картинки с большим разрешением, будут доступны только за деньги.

    Picsearch

    Picsearch – удобный в использовании сервис с простым интерфейсом, возможностью расширенного поиска по различным параметрам и даже собственным мини-языком поисковых запросов (поддерживаются команды + (обязательно включать слово) и – (исключить слово)). Как заявлено на главной странице сервиса, искать можно по более чем 2 000 000 000 картинок. Picsearch (рис. 3.8) довольно быстро работает и, несмотря на свой англоязычный интерфейс, неплохо справляется с обработкой русскоязычных запросов.

    Рис. 3.8. Главная страница сервера поиска картинок Picsearch


    Если ввести на странице запрос велосипед, то после обработки и выдачи результата сервер предложит попробовать и другие часто используемые запросы: детский велосипед, водный велосипед, горный велосипед. Такой подход подтверждает, что понимание русского языка у Picsearch организовано на высоком уровне.

    Пожалуй, это вся основная информация, касающаяся поиска рисунков в Сети. Рассмотрим не менее полезные и интересные возможности интернет-поиска – поиск файлов мультимедиа.

    Поиск музыки и видео

    Как и поиск картинок, поиск мультимедийных файлов имеет особенности. С точки зрения поисковиков, мультимедийные файлы индексируются проще, чем изображения. Во-первых, большинство современных аудио– и видеоформатов поддерживают возможность хранить внутри самого файла текстовую информацию, которая и считывается поисковым сервером, а затем используется при поиске таких файлов. Во-вторых, в отличие от картинок мультимедиафайлы обычно размещаются в Сети специально для того, чтобы их скачивали. Поэтому такие файлы обычно имеют название, соответствующее содержанию (файл называется так же, как и представленная им музыкальная композиция или фильм), а также ссылку, которая указывает на адрес такого файла и содержит в себе название произведения.

    В связи с этим для поиска мультимедиафайлов часто используются обычные поисковые серверы, которые приносят неплохие результаты. Причем искать можно без использования специальных средств поисковика, то есть мультимедийный файл ищется так же, как и обычная веб-страница.

    Вопрос о присутствии аудио– и видеопроизведений в Интернете очень волнует правообладателей таких продуктов, ведь часто мультимедиафайлы распространяются нелегально, что наносит ущерб законным владельцам авторских прав. В последние годы оборот в Интернете аудио– и видеопродукции приобретает все более цивилизованный облик. Некоторые крупные порталы, предлагавшие раньше загрузить MP3-музыку (причем, как правило, бесплатно), сейчас прекратили свое существование или переквалифицировались и перевели свою деятельность в законное русло.

    Примером тому может служить крупный музыкальный портал MP3Search.ru (www.mp3search.ru), который изначально задумывался создателями как система для поиска бесплатных музыкальных файлов в Сети. Однако со временем проект вынужден был сменить тактику работы, и сегодня это один из крупнейших ресурсов в русскоязычном Интернете, занимающихся законным распространением музыкальных композиций (естественно, за соответствующую плату). На портале MP3Search.ru представлено большое количество музыки разных стилей и направлений, искать можно вручную по принципу веб-каталога или с использованием строки поиска.

    При поиске видео также наблюдается схожая ситуация. Нелегальные сайты постепенно прекращают свое существование, уступая место легальным. Стоит упомянуть о поисковом сервере GoGo.ru (www.gogo.ru), который одним из первых в русскоязычном Интернете предоставил сервис поиска видео. Искать требуемое видео на данном сервисе просто: нужно всего лишь набрать ключевые слова в строке поиска и выбрать категорию Видео. В результатах поиска будут исключительно ресурсы, распространяющие видео на законных основаниях.

    Поиск по FTP-серверам

    На действующих сегодня FTP-серверах можно найти самые разные типы файлов, в том числе музыку и видео. Значительная часть FTP-ресурсов имеет платный или ограниченный доступ, тем не менее многие из них являются общедоступными. Набравшись немного опыта и определив для себя наиболее предпочтительные ресурсы, пользователь может искать на них файлы, просто переходя из папки в папку. Однако гораздо удобнее воспользоваться услугами FTP-поисковиков, которые ищут файлы на различных FTP-серверах.

    Особенность поиска файлов в том, что они, кроме имени и типа, не имеют каких-либо признаков, которые могли бы их идентифицировать. Это даже не картинки, содержимое которых можно определить, используя специальные алгоритмы. Содержимое файла никак нельзя классифицировать. Правда, мультимедийные файлы часто содержат в себе некоторую информацию, скажем, о названии композиции или исполнителе. Однако архивы, программы и многие другие типы файлов не поддаются классификации. Вследствие этого основным признаком, по которому можно найти файл, остается его имя.

    С учетом этой специфики и работают FTP-поисковики. Возможность поиска по FTP-серверам в качестве дополнительной функции предоставляют некоторые обычные поисковые серверы. Например, «Рамблер» (http://ftpsearch.rambler.ru/db/ftpsearch/) или уже упоминавшийся в контексте поиска веб-страниц метапоисковый сервер MetaBot.ru (www.metabot.ru). Кроме того, существуют специализированные поисковые системы, ориентированные исключительно на поиск по FTP-серверам. Самая известная из российских – FileSearch.ru (www.filesearch.ru). Один из наиболее мощных зарубежных FTP-поисковиков – FreewareWeb (www.freewareweb.com).

    Рассмотрим возможности таких поисковых серверов на примере FileSearch.ru (работа остальных FTP-поисковиков, в том числе англоязычных, строится схожим образом).

    Главная страница FileSearch.ru, как и большинства поисковиков, выглядит достаточно просто, правда, изобилует рекламой. Кроме собственно строки поиска присутствует раскрывающийся список, в котором можно выбрать тип файлов для поиска из следующих вариантов:

    • файл/каталог – поиск по всем файлам и папкам;

    • музыка (mp3) – поиск MP3-музыки;

    • изображения – поиск картинок;

    • видео – поиск видеофайлов;

    • сервер – поиск FTP-сервера.

    Еще в одном раскрывающемся списке можно выбрать географические границы поиска: в России или по всем (то есть по всему миру). Задав необходимые параметры, следует набрать имя нужного файла или его часть и нажать кнопку Найти – результаты поиска появляются практически мгновенно.

    Совет

    Имя файла можно задавать, используя спецсимволы * и ?, которые означают соответственно любую группу символов и любой одиночный символ.

    На главной странице поискового сервера есть также ссылка Драйверы, перейдя по которой можно попасть на страницу поиска драйверов для различных устройств компьютера. Выбрав тип устройства и его производителя, нужно будет указать конкретную модель, в результате чего появятся ссылки на найденные драйверы, хранящиеся на FTP-серверах.

    Как и большинство уважающих себя поисковиков, FileSearch.ru обеспечивает возможность расширенного поиска. Перейдя на главной странице поиска по ссылке Расширенный поиск, можно попасть на страницу (рис. 3.9), где можно изменять некоторые параметры поиска файлов.

    Рис. 3.9. Страница расширенного поиска сервера FileSearch.ru


    Данная страница практически не содержит настроек, требующих пояснения. Среди возможностей следует отметить отключение показа в результатах поиска файлов, предназначенных для использования на системах семейства Unix. Целесообразно пользоваться этой возможностью, когда нужно найти файлы для Windows, чтобы не перегружать результаты поиска лишними данными. Полезной иногда бывает возможность ограничения размера файла, если, например, известно, что искомый файл не может быть менее определенного размера или чтобы отбросить слишком большие файлы, загрузка которых на компьютер может потребовать больших временных затрат.

    Есть на FileSearch.ru и свой язык поисковых запросов, который в общих чертах похож на языки традиционных поисковиков, поэтому подробно на нем останавливаться не будем. Ознакомиться с перечнем команд языка можно по адресу www.filesearch.ru/help/regexp.html.

    Напомню, что для загрузки файлов с FTP-сервера понадобится одна из программ FTP-клиентов (см. гл. 2, разд. «Загрузка и выгрузка файлов посредством FTP»).

    Подводя итог рассказу о возможностях поиска в Интернете, стоит упомянуть еще об одном новом явлении в Сети – визуальном поиске, суть которого в наглядном и красочном представлении результатов поиска.

    Отмечу также, что для успешного поиска от пользователя требуется приобретение некоторых навыков. Кроме того, помните: «Кто ищет, тот всегда найдет!»









    Главная | Контакты | Нашёл ошибку | Прислать материал | Добавить в избранное

    Все материалы представлены для ознакомления и принадлежат их авторам.