Поиск

Форма входа

Течение времени

Пасха:
1 мая 2016 года

Понедельник 20.2.2017

Мобильная версия сайта

Перейти на мобильную версию сайта

Лучшая карта:


( Комментариев: 12

Уже скачали: 22040 

Обновлённые карты и обзоры:

  • Карты стран мира
    скачали 3904 раз
  • Подробная карта Херсонской области
    скачали 0 раз
  • Подробная карта Тернопольской области
    скачали 0 раз
  • Подробная карта Ровненской области
    скачали 1 раз
  • Спутниковая карта мира [файл]
    скачали 1400 раз
  • Политическая карта Европы
    скачали 755 раз
  • Подробная карта Хорватии
    скачали 286 раз
  • Генеральный план города Пскова
    скачали 12 раз
  • Подробная карта Нигера
    скачали 71 раз
  • Мировые карты экономических свобод
    скачали 71 раз

  • География России
    прочитали 2665 раз
  • Сравнение кэшбэк-сервисов для Aliexpress 02.2017
    прочитали 1209 раз
  • Варвары на границах Империи
    прочитали 3109 раз
  • Бланк и образец справки о зарплате с места работы. Россия 2017 год
    прочитали 474380 раз
  • Пропаганда первой половины XX века
    прочитали 333 раз
  • Регионы Украины
    прочитали 1139 раз
  • Что посмотреть в Баку
    прочитали 143 раз
  • Внутреннее деление Псковской области
    прочитали 2492 раз
  • Самое высокое здание в мире
    прочитали 216 раз
  • Хронология президентов США
    прочитали 776 раз
  • Статистика

    Рейтинг@Mail.ru
    Сейчас с нами: 10
    Гостей: 10
    Пользователей: 0

    Поддержать проект

      Webmoney R005078747309

      Яндекс.деньги 410012885572345

      VISA 4817760009155312

    Географический авторский проект fedoroff.net 2017 год | Вы Гость×|
    Статьи | Файлы | Альбомы | Новости | Лучшие | Тезисы | Карта сайта | Контакты | О сайте

    FEDOROFF.NET » ГЛАВНАЯ » » »

    Релевантность поиска и поисковые запросы

    Последнее обновление:
    05.Февраль.2010, 12:31


    Как уже творилось выше, релевантный - значит относящийся к делу. Релевантность результатов поиска поисковой машины означает, что эти результаты содержат страницы, относящиеся к делу, т.е. к смыслу поискового запроса.
     
    В отношении поисковых машин очень часто можно слышать качественные о «Я пользуюсь "Яндексом", потому что он лучше ищет!», «"Гугл" круче всех» вольно распространенные высказывания. Что такое качество поисковика? Синонимом качества поиска считается его релевантность.
     
    В отношении поисковых машин слово "релевантный" — чуть ли не главный термин релевантная выдача, релевантные результаты, у поисковика X релевант выше, чем у поисковика Y, - такие выражения можно слышать постоянно, что они означают?
     
    Это определение релевантности выглядит очень просто. Казалось бы, из него следует, что если мы введем поисковый запрос и если среди первых результатов поиска окажутся только релевантные сайты, то выдача поисковой машины будет релевантна. Однако это не совсем так. Давайте разберемся с этим вопросом по дробнее.
     
    Не существует релевантности вообще, в вакууме. Ведь кто-то должен определить, действительно ли сайты соответствуют тому, что предполагалось в запросе. Кто? Очевидно, лучше всего это может сделать сам автор запроса, который ввел его и поисковую машину.
     
     
    И вот здесь возникает несколько проблем. Ведь не очень интересно обсуждать за просы выдуманные, введенные для эксперимента. В «Яндексе», «Рамблере», Google есть десятки миллионов популярных, реальных запросов, которые ежедневно вводят реальные пользователи. А с ними далеко не все так ясно.
     
    Во-первых, большинство запросов — однословные или двухсловные, то есть очень лаконичные. Ясно, что далеко не всегда они полностью задают смысл искомой страницы. Значит, какие-то условия поиска всегда остаются недосказанными, в уме пользователя.
     
     
    Во-вторых, ни поисковик, ни мы с вами не можем знать, что происходит в уме  пользователя, вводящего конкретный запрос. Что он на самом деле имел ввиду?
     
    В-третьих, у популярных запросов очень много «соавторов» — их вводят совер шенно разные люди. Всегда ли они имеют в виду одно и то же — неизвестно. Ско рее всего, нет.
     
    Например, что такое запрос «дизайн»? Что имел в виду автор – «веб-дизайн», «дизайн квартир», «ландшафтный дизайн» или «промышленный»? А что делать, если разные авторы этого запроса имели в виду разное? Поэтому, релевантность играет важнейшую роль в поисковом продвижении сайта и поисковой оптимизации сайта и, особенно коммерческого магазина, в варианте http://www.weblancer.net/projects/?category_id=61.
     
    Итак, можно сформулировать следующее утверждение: сам по себе поисковый запрос принципиально неполон. Почти для каждого запроса существует не высказанное пользователем явно, но важное для него условие релевантности запроса.
     
    Это субъективное понятие, поскольку результаты поиска, уместные для одного пользователя, могут быть неуместными для другого. Основным методом для оценки релевантности является TF-IDF-метод, который используется в большинстве поисковых систем (как в интернет-поисковиках, так и в справочных системах (MSDN). Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones).
    Пертинентность (англ. pertinence) — соотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).
    Пертинентность (англ. pertinence) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя.
    Допустим, что мы решили обзавестись четырёхколёсным другом и, чтобы купить легковушку, пытаемся вначале узнать что-нибудь об автомобилях. Вводим в поисковой системе слово "машина" (это ведь так называется?) и получаем: "боевая машина пехоты", "машина баз данных", "машинка для точной подстройки скрипичных струн", "адская машина", "бездушная судебная машина" и т. п. Всё найденное релевантно запросу, однако совершенно не пертинентно информационной потребности. Стоит, однако, ввести запрос "легковой автомобиль", и всё, релевантное ему, окажется пертинентным информационной потребности.

    + дополнительный материал: Источник материала [?] Здесь общение с автором проекта по вопросам рекламы,  развития и поддержки проекта, обмена информацией, авторских прав - в контакты. Почта администратора сайта - evgeniy@fedoroff.net. Статья 29.4 Каждый имеет право свободно искать, получать, передавать, производить и распространять информацию любым законным способом. Перечень сведений, составляющих государственную тайну, определяется федеральным законом. © fedoroff.net 2016 
     


    + основной материал: Релевантность поиска и поисковые запросы

    Категория: Лучшее | Добавил: Добавлено: (05.Февраль.2010) | Авторские права: Фёдоров Евгений Евгеньевич
    Просмотров: 2180 | Комментарии: 1 | Теги: Статьи, поисковая машина, поиск, релевантность |
    Всего комментариев: 1
    1 Добавлено:   (05.Февраль.2010 12:32)
    4.5. Вычисление релевантности поиска по запросу

    Каждому элементу характеристического множества назначается вес. Релевантность равна взвешенной сумме элементов характеристического множества запроса. Если веса элементов характеристического множества одинаковы, то в этом частном случае средняя релевантность равна среднему арифметическому от элементов характеристического множества запроса.

    Пример. Задан следующий набор весов элементов характеристического множества запроса: (5, 4, 3, 2, 1). Запрос имеет характеристическое множество (0.8, 0.5, 0.46, 0.43, 0.4).

    Тогда средняя релевантность равна:

    0.8*5/15 + 0.5*4/15 + 0.46*3/15 + 0.43*2/15 + 0.4*1/15 = 0.267 + 0.133 + 0.092 + 0.057 + 0.027 = 0.576.

    4.6. Вычисление средней релевантности поиска по всем запросам

    Средняя релевантность по всем запросам является единой характеристикой технической эффективности поисковой машина, определяется как среднее арифметическое от значений релевантности поиска по отдельным запросам. Чем больше средняя релевантность, тем выше техническая эффективность поисковой машины.

    5. Рекомендуемые размеры и веса элементов

    Мы рекомендуем взять пять элементов – значения точности поиска для первых 10, 30, 50, 70, 100 документов, найденных по запросу, и назначить следующие веса элементов: (5,4,3, 2, 1), как в приведённых выше примерах.

    6. Множество тестовых запросов
    В данном множестве приведено 100 запросов, наиболее часто поступавших на поисковую машину Рамблер по состоянию на май 2000 г. Отбор запросов проводился в соответствии с подходом, изложенным в п. 4.1 настоящего документа. При этом запросы с ненормативной лексикой не учитывались.
    Ниже приводятся тестовые запросы, сгруппированные по количеству содержащихся в них слов.

    6.1. Запросы из одного слова

    1) рефераты
    2) гороскоп
    3) халява
    4) mp3
    5) чат
    6) открытки
    7) игры
    8) работа
    9) icq
    10) сонник
    11) Чечня
    12) анекдоты
    13) поздравления
    14) фото
    15) футбол
    16) кавказ-центр
    17) музыка
    18) хакер
    19) Земфира
    20) crack
    21) мода
    22) библиотека
    23) мебель
    24) картинки
    25) Москва
    26) психология
    27) сочинения
    28) фоменко
    29) оружие
    30) ваз
    31) mtv
    32) стульчик
    33) тосты
    34) новости
    35) словари
    36) программы
    37) приколы
    38) драйвер
    39) delphi
    40) радио
    41) журнал
    42) аккорды
    43) алсу
    44) games
    45) Путин
    46) досуг
    47) экология
    48) dvd
    49) бодибилдинг
    50) кино
    6.2. Запросы из двух слов

    51) карта москвы
    52) мумий тролль
    53) телефонный справочник
    54) русское радио
    55) скрытые камеры
    56) кавказ центр
    57) руки вверх
    58) виртуальные открытки
    59) britney spears
    60) доска объявлений
    61) телефонная база
    62) секретные материалы
    63) желтые страницы
    64) горные лыжи
    65) прогноз погоды
    66) русское лото
    67) российская газета
    68) курс доллара
    69) машина времени
    70) курсы валют
    71) тексты песен
    72) библиотека мошкова
    73) backstreet boys
    74) расписание поездов
    75) сектор газа
    76) visual basic
    77) tomb raider
    78) психологические тесты
    79) живые камеры
    80) доски объявлений
    6.3. Запросы из трех слов

    81) день святого валентина
    82) гости из будущего
    83) московская коллекция рефератов
    84) правила дорожного движения
    85) телефонный справочник москвы
    86) работа за рубежом
    87) соло на клавиатуре
    88) англо-русский словарь
    89) китайский новый год
    90) работа для вас
    91) горе от ума
    92) аргументы и факты
    93) центральный дом подарков
    94) московская регистрационная палата
    95) великая отечественная война
    96) российская государственная библиотека
    97) комитет солдатских матерей
    6.4.Запросы из четырех слов

    98) из рук в руки
    99) теория государства и права
    100) red hot chili peppers


    Добавлять комментарии могут только зарегистрированные пользователи.
    [ Регистрация | Вход ]