Поиск

Лучшая карта:



Уже скачали: 127202 

Обновлённые карты и обзоры:

  • Карты Ивановской области
    [ подборка] просмотров 16594
  • Карты Сирии
    [ 20 карт] просмотров 16890
  • Контурная карта Европы (ч/б для печати)
    [2.14 Mb вектор] просмотров 6633
  • Карты Северной Осетии (Алании)
    [ 8 карт] просмотров 16606
  • Карты Кировской области
    [ 9 карт] просмотров 16604
  • Карты Республики Марий Эл
    [ подборка] просмотров 16619
  • Карты Калмыкии
    [ 7 карт] просмотров 16606
  • Карты Самарской области
    [ 7 карт] просмотров 16636
  • Карты Республики Алтай
    [ 11 карт] просмотров 16648
  • Карты Адыгеи
    [ подборка] просмотров 16610
  • Карты Амурской области
    [ 12 карт] просмотров 16633
  • Карты Карелии
    [ подборка] просмотров 16716
  • Карты Удмуртии
    [ 7 карт] просмотров 16622
  • Контурная физическая карта Казахстана
    [1.97 Mb вектор] просмотров 7669
  • Карты Ханты-Мансийского автономного округа (ХМАО)
    [ подборка] просмотров 16642
  • Карты Ямало-Ненецкого автономного округа (ЯНАО)
    [ подборка] просмотров 16663
  • Карты Магаданской области
    [ подборка] просмотров 16633
  • Карты Пензенской области
    [ 6 карт] просмотров 16640
  • Карты Калининградской области
    [ подборка] просмотров 16757
  • Карты Италии
    [ подборка] просмотров 16649

  • Регионы России
    прочитали 61319 раз
  • Население мира на октябрь 2024 года
    прочитали 18093 раз
  • Династия Романовых (подробное генеалогическое древо)
    прочитали 203781 раз
  • География Псковской области
    прочитали 19222 раз
  • География Италии
    прочитали 13003 раз
  • География Пскова
    прочитали 19306 раз
  • ВРП субъектов России
    прочитали 4081 раз
  • Список портов Китая
    прочитали 1428 раз
  • Посадница. Никольский источник.
    прочитали 19982 раз
  • Мардарий. Путь к источнику Святого Мардария.
    прочитали 16265 раз
  • Другие версии сайта

    Перейти на мобильную версию сайта
    Перейти на телеграм-версию сайта

    Форма входа

    Картографический авторский проект fedoroff.net 2024 год | Вы Гость×|
    Статьи | Файлы | Альбомы | Новости | Лучшие | Блог | Карта сайта | Контакты |

    FEDOROFF.NET » ГЛАВНАЯ » СТАТЬИ » Лучшее

    Релевантность поиска и поисковые запросы

    Последнее обновление:
    05.Февраля.2010, 12:31


    Как уже творилось выше, релевантный - значит относящийся к делу. Релевантность результатов поиска поисковой машины означает, что эти результаты содержат страницы, относящиеся к делу, т.е. к смыслу поискового запроса.
     
    В отношении поисковых машин очень часто можно слышать качественные о «Я пользуюсь "Яндексом", потому что он лучше ищет!», «"Гугл" круче всех» вольно распространенные высказывания. Что такое качество поисковика? Синонимом качества поиска считается его релевантность.
     
    В отношении поисковых машин слово "релевантный" — чуть ли не главный термин релевантная выдача, релевантные результаты, у поисковика X релевант выше, чем у поисковика Y, - такие выражения можно слышать постоянно, что они означают?
     
    Это определение релевантности выглядит очень просто. Казалось бы, из него следует, что если мы введем поисковый запрос и если среди первых результатов поиска окажутся только релевантные сайты, то выдача поисковой машины будет релевантна. Однако это не совсем так. Давайте разберемся с этим вопросом по дробнее.
     
    Не существует релевантности вообще, в вакууме. Ведь кто-то должен определить, действительно ли сайты соответствуют тому, что предполагалось в запросе. Кто? Очевидно, лучше всего это может сделать сам автор запроса, который ввел его и поисковую машину.
     
     
    И вот здесь возникает несколько проблем. Ведь не очень интересно обсуждать за просы выдуманные, введенные для эксперимента. В «Яндексе», «Рамблере», Google есть десятки миллионов популярных, реальных запросов, которые ежедневно вводят реальные пользователи. А с ними далеко не все так ясно.
     
    Во-первых, большинство запросов — однословные или двухсловные, то есть очень лаконичные. Ясно, что далеко не всегда они полностью задают смысл искомой страницы. Значит, какие-то условия поиска всегда остаются недосказанными, в уме пользователя.
     
     
    Во-вторых, ни поисковик, ни мы с вами не можем знать, что происходит в уме  пользователя, вводящего конкретный запрос. Что он на самом деле имел ввиду?
     
    В-третьих, у популярных запросов очень много «соавторов» — их вводят совер шенно разные люди. Всегда ли они имеют в виду одно и то же — неизвестно. Ско рее всего, нет.
     
    Например, что такое запрос «дизайн»? Что имел в виду автор – «веб-дизайн», «дизайн квартир», «ландшафтный дизайн» или «промышленный»? А что делать, если разные авторы этого запроса имели в виду разное? Поэтому, релевантность играет важнейшую роль в поисковом продвижении сайта и поисковой оптимизации сайта и, особенно коммерческого магазина, в варианте http://www.weblancer.net/projects/?category_id=61.
     
    Итак, можно сформулировать следующее утверждение: сам по себе поисковый запрос принципиально неполон. Почти для каждого запроса существует не высказанное пользователем явно, но важное для него условие релевантности запроса.
     
    Это субъективное понятие, поскольку результаты поиска, уместные для одного пользователя, могут быть неуместными для другого. Основным методом для оценки релевантности является TF-IDF-метод, который используется в большинстве поисковых систем (как в интернет-поисковиках, так и в справочных системах (MSDN). Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones).
    Пертинентность (англ. pertinence) — соотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).
    Пертинентность (англ. pertinence) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя.
    Допустим, что мы решили обзавестись четырёхколёсным другом и, чтобы купить легковушку, пытаемся вначале узнать что-нибудь об автомобилях. Вводим в поисковой системе слово "машина" (это ведь так называется?) и получаем: "боевая машина пехоты", "машина баз данных", "машинка для точной подстройки скрипичных струн", "адская машина", "бездушная судебная машина" и т. п. Всё найденное релевантно запросу, однако совершенно не пертинентно информационной потребности. Стоит, однако, ввести запрос "легковой автомобиль", и всё, релевантное ему, окажется пертинентным информационной потребности.

    + дополнительный материал: Источник материала Свободная публикация материалов сайта при условии наличия ссылки на сайт. Здесь общение с автором проекта по вопросам рекламы,  развития и поддержки проекта, обмена информацией, авторских прав - в контакты. Почта администратора сайта - evgeniy@fedoroff.net. Статья 29.4 Каждый имеет право свободно искать, получать, передавать, производить и распространять информацию любым законным способом. Перечень сведений, составляющих государственную тайну, определяется федеральным законом. © fedoroff.net  



    + основной материал: Релевантность поиска и поисковые запросы

    Категория: Лучшее | Добавил: Добавлено: (05.Февраля.2010) | Авторские права: Фёдоров Евгений Евгеньевич
    Просмотров: 5059 | Комментарии: 1 | Теги: Статьи, поисковая машина, поиск, релевантность |
    Всего комментариев: 1
    1 Добавлено:   (05.Февраля.2010 12:32) [Материал]
    4.5. Вычисление релевантности поиска по запросу

    Каждому элементу характеристического множества назначается вес. Релевантность равна взвешенной сумме элементов характеристического множества запроса. Если веса элементов характеристического множества одинаковы, то в этом частном случае средняя релевантность равна среднему арифметическому от элементов характеристического множества запроса.

    Пример. Задан следующий набор весов элементов характеристического множества запроса: (5, 4, 3, 2, 1). Запрос имеет характеристическое множество (0.8, 0.5, 0.46, 0.43, 0.4).

    Тогда средняя релевантность равна:

    0.8*5/15 + 0.5*4/15 + 0.46*3/15 + 0.43*2/15 + 0.4*1/15 = 0.267 + 0.133 + 0.092 + 0.057 + 0.027 = 0.576.

    4.6. Вычисление средней релевантности поиска по всем запросам

    Средняя релевантность по всем запросам является единой характеристикой технической эффективности поисковой машина, определяется как среднее арифметическое от значений релевантности поиска по отдельным запросам. Чем больше средняя релевантность, тем выше техническая эффективность поисковой машины.

    5. Рекомендуемые размеры и веса элементов

    Мы рекомендуем взять пять элементов – значения точности поиска для первых 10, 30, 50, 70, 100 документов, найденных по запросу, и назначить следующие веса элементов: (5,4,3, 2, 1), как в приведённых выше примерах.

    6. Множество тестовых запросов
    В данном множестве приведено 100 запросов, наиболее часто поступавших на поисковую машину Рамблер по состоянию на май 2000 г. Отбор запросов проводился в соответствии с подходом, изложенным в п. 4.1 настоящего документа. При этом запросы с ненормативной лексикой не учитывались.
    Ниже приводятся тестовые запросы, сгруппированные по количеству содержащихся в них слов.

    6.1. Запросы из одного слова

    1) рефераты
    2) гороскоп
    3) халява
    4) mp3
    5) чат
    6) открытки
    7) игры
    8) работа
    9) icq
    10) сонник
    11) Чечня
    12) анекдоты
    13) поздравления
    14) фото
    15) футбол
    16) кавказ-центр
    17) музыка
    18) хакер
    19) Земфира
    20) crack
    21) мода
    22) библиотека
    23) мебель
    24) картинки
    25) Москва
    26) психология
    27) сочинения
    28) фоменко
    29) оружие
    30) ваз
    31) mtv
    32) стульчик
    33) тосты
    34) новости
    35) словари
    36) программы
    37) приколы
    38) драйвер
    39) delphi
    40) радио
    41) журнал
    42) аккорды
    43) алсу
    44) games
    45) Путин
    46) досуг
    47) экология
    48) dvd
    49) бодибилдинг
    50) кино
    6.2. Запросы из двух слов

    51) карта москвы
    52) мумий тролль
    53) телефонный справочник
    54) русское радио
    55) скрытые камеры
    56) кавказ центр
    57) руки вверх
    58) виртуальные открытки
    59) britney spears
    60) доска объявлений
    61) телефонная база
    62) секретные материалы
    63) желтые страницы
    64) горные лыжи
    65) прогноз погоды
    66) русское лото
    67) российская газета
    68) курс доллара
    69) машина времени
    70) курсы валют
    71) тексты песен
    72) библиотека мошкова
    73) backstreet boys
    74) расписание поездов
    75) сектор газа
    76) visual basic
    77) tomb raider
    78) психологические тесты
    79) живые камеры
    80) доски объявлений
    6.3. Запросы из трех слов

    81) день святого валентина
    82) гости из будущего
    83) московская коллекция рефератов
    84) правила дорожного движения
    85) телефонный справочник москвы
    86) работа за рубежом
    87) соло на клавиатуре
    88) англо-русский словарь
    89) китайский новый год
    90) работа для вас
    91) горе от ума
    92) аргументы и факты
    93) центральный дом подарков
    94) московская регистрационная палата
    95) великая отечественная война
    96) российская государственная библиотека
    97) комитет солдатских матерей
    6.4.Запросы из четырех слов

    98) из рук в руки
    99) теория государства и права
    100) red hot chili peppers


    -->Добавлять комментарии могут только зарегистрированные пользователи.
    [ Регистрация | Вход ]