Поиск

Форма входа

Течение времени

Пасха:
1 мая 2016 года

Воскресенье 11.12.2016

Мобильная версия сайта

Перейти на мобильную версию сайта

Лучшая карта:


( Комментариев: 12

Уже скачали: 21403 

Обновлённые карты и обзоры:

  • Карты стран мира
    скачали 3880 раз
  • Карты по Ливонским войнам
    скачали 381 раз
  • Контурные карты по истории Древнего мира
    скачали 5 раз
  • Подборка карт по Наполеоновским войнам
    скачали 9 раз
  • Подробные карты Кубы
    скачали 313 раз
  • Карты города Пскова 17-19 века
    скачали 346 раз
  • Карты гражданских войн в Китае (1924-1950)
    скачали 1 раз
  • Подробная карта Тайланда
    скачали 299 раз
  • Карта Санкт-Петербургской губернии 1900 г. [8.5 Mpx]
    скачали 1818 раз
  • Подробная карта Японии
    скачали 109 раз

  • География России
    прочитали 2019 раз
  • Внутреннее деление Псковской области
    прочитали 2252 раз
  • Самое высокое здание в мире
    прочитали 53 раз
  • Хронология президентов США
    прочитали 534 раз
  • Курорты и туристические города Мексики
    прочитали 821 раз
  • География Мексики
    прочитали 1803 раз
  • Участники и потери Второй Мировой Войны
    прочитали 93 раз
  • Регионы России
    прочитали 1498 раз
  • География Болгарии
    прочитали 102 раз
  • География Грузии
    прочитали 88 раз
  • Статистика

    Рейтинг@Mail.ru
    Сейчас с нами: 13
    Гостей: 13
    Пользователей: 0

    Поддержать проект

      Webmoney R005078747309

      Яндекс.деньги 410012885572345

      VISA 4817760009155312

    Географический авторский проект fedoroff.net 2016 год | Вы Гость×|
    Статьи | Файлы | Альбомы | Новости | Лучшие | Тезисы | Карта сайта | Контакты | О сайте

    FEDOROFF.NET » ГЛАВНАЯ » » »

    Релевантность поиска и поисковые запросы

    Последнее обновление:
    05.Февраль.2010, 12:31


    Как уже творилось выше, релевантный - значит относящийся к делу. Релевантность результатов поиска поисковой машины означает, что эти результаты содержат страницы, относящиеся к делу, т.е. к смыслу поискового запроса.
     
    В отношении поисковых машин очень часто можно слышать качественные о «Я пользуюсь "Яндексом", потому что он лучше ищет!», «"Гугл" круче всех» вольно распространенные высказывания. Что такое качество поисковика? Синонимом качества поиска считается его релевантность.
     
    В отношении поисковых машин слово "релевантный" — чуть ли не главный термин релевантная выдача, релевантные результаты, у поисковика X релевант выше, чем у поисковика Y, - такие выражения можно слышать постоянно, что они означают?
     
    Это определение релевантности выглядит очень просто. Казалось бы, из него следует, что если мы введем поисковый запрос и если среди первых результатов поиска окажутся только релевантные сайты, то выдача поисковой машины будет релевантна. Однако это не совсем так. Давайте разберемся с этим вопросом по дробнее.
     
    Не существует релевантности вообще, в вакууме. Ведь кто-то должен определить, действительно ли сайты соответствуют тому, что предполагалось в запросе. Кто? Очевидно, лучше всего это может сделать сам автор запроса, который ввел его и поисковую машину.
     
     
    И вот здесь возникает несколько проблем. Ведь не очень интересно обсуждать за просы выдуманные, введенные для эксперимента. В «Яндексе», «Рамблере», Google есть десятки миллионов популярных, реальных запросов, которые ежедневно вводят реальные пользователи. А с ними далеко не все так ясно.
     
    Во-первых, большинство запросов — однословные или двухсловные, то есть очень лаконичные. Ясно, что далеко не всегда они полностью задают смысл искомой страницы. Значит, какие-то условия поиска всегда остаются недосказанными, в уме пользователя.
     
     
    Во-вторых, ни поисковик, ни мы с вами не можем знать, что происходит в уме  пользователя, вводящего конкретный запрос. Что он на самом деле имел ввиду?
     
    В-третьих, у популярных запросов очень много «соавторов» — их вводят совер шенно разные люди. Всегда ли они имеют в виду одно и то же — неизвестно. Ско рее всего, нет.
     
    Например, что такое запрос «дизайн»? Что имел в виду автор – «веб-дизайн», «дизайн квартир», «ландшафтный дизайн» или «промышленный»? А что делать, если разные авторы этого запроса имели в виду разное? Поэтому, релевантность играет важнейшую роль в поисковом продвижении сайта и поисковой оптимизации сайта и, особенно коммерческого магазина, в варианте http://www.weblancer.net/projects/?category_id=61.
     
    Итак, можно сформулировать следующее утверждение: сам по себе поисковый запрос принципиально неполон. Почти для каждого запроса существует не высказанное пользователем явно, но важное для него условие релевантности запроса.
     
    Это субъективное понятие, поскольку результаты поиска, уместные для одного пользователя, могут быть неуместными для другого. Основным методом для оценки релевантности является TF-IDF-метод, который используется в большинстве поисковых систем (как в интернет-поисковиках, так и в справочных системах (MSDN). Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones).
    Пертинентность (англ. pertinence) — соотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).
    Пертинентность (англ. pertinence) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя.
    Допустим, что мы решили обзавестись четырёхколёсным другом и, чтобы купить легковушку, пытаемся вначале узнать что-нибудь об автомобилях. Вводим в поисковой системе слово "машина" (это ведь так называется?) и получаем: "боевая машина пехоты", "машина баз данных", "машинка для точной подстройки скрипичных струн", "адская машина", "бездушная судебная машина" и т. п. Всё найденное релевантно запросу, однако совершенно не пертинентно информационной потребности. Стоит, однако, ввести запрос "легковой автомобиль", и всё, релевантное ему, окажется пертинентным информационной потребности.

    + дополнительный материал: Источник материала [?] Здесь общение с автором проекта по вопросам рекламы,  развития и поддержки проекта, обмена информацией, авторских прав - в контакты. Почта администратора сайта - evgeniy@fedoroff.net. Статья 29.4 Каждый имеет право свободно искать, получать, передавать, производить и распространять информацию любым законным способом. Перечень сведений, составляющих государственную тайну, определяется федеральным законом. © fedoroff.net 2016 
     


    + основной материал: Релевантность поиска и поисковые запросы

    Категория: Лучшее | Добавил: Добавлено: (05.Февраль.2010) | Авторские права: Фёдоров Евгений Евгеньевич
    Просмотров: 2066 | Комментарии: 1 | Теги: Статьи, поисковая машина, поиск, релевантность |
    Всего комментариев: 1
    1 Добавлено:   (05.Февраль.2010 12:32)
    4.5. Вычисление релевантности поиска по запросу

    Каждому элементу характеристического множества назначается вес. Релевантность равна взвешенной сумме элементов характеристического множества запроса. Если веса элементов характеристического множества одинаковы, то в этом частном случае средняя релевантность равна среднему арифметическому от элементов характеристического множества запроса.

    Пример. Задан следующий набор весов элементов характеристического множества запроса: (5, 4, 3, 2, 1). Запрос имеет характеристическое множество (0.8, 0.5, 0.46, 0.43, 0.4).

    Тогда средняя релевантность равна:

    0.8*5/15 + 0.5*4/15 + 0.46*3/15 + 0.43*2/15 + 0.4*1/15 = 0.267 + 0.133 + 0.092 + 0.057 + 0.027 = 0.576.

    4.6. Вычисление средней релевантности поиска по всем запросам

    Средняя релевантность по всем запросам является единой характеристикой технической эффективности поисковой машина, определяется как среднее арифметическое от значений релевантности поиска по отдельным запросам. Чем больше средняя релевантность, тем выше техническая эффективность поисковой машины.

    5. Рекомендуемые размеры и веса элементов

    Мы рекомендуем взять пять элементов – значения точности поиска для первых 10, 30, 50, 70, 100 документов, найденных по запросу, и назначить следующие веса элементов: (5,4,3, 2, 1), как в приведённых выше примерах.

    6. Множество тестовых запросов
    В данном множестве приведено 100 запросов, наиболее часто поступавших на поисковую машину Рамблер по состоянию на май 2000 г. Отбор запросов проводился в соответствии с подходом, изложенным в п. 4.1 настоящего документа. При этом запросы с ненормативной лексикой не учитывались.
    Ниже приводятся тестовые запросы, сгруппированные по количеству содержащихся в них слов.

    6.1. Запросы из одного слова

    1) рефераты
    2) гороскоп
    3) халява
    4) mp3
    5) чат
    6) открытки
    7) игры
    8) работа
    9) icq
    10) сонник
    11) Чечня
    12) анекдоты
    13) поздравления
    14) фото
    15) футбол
    16) кавказ-центр
    17) музыка
    18) хакер
    19) Земфира
    20) crack
    21) мода
    22) библиотека
    23) мебель
    24) картинки
    25) Москва
    26) психология
    27) сочинения
    28) фоменко
    29) оружие
    30) ваз
    31) mtv
    32) стульчик
    33) тосты
    34) новости
    35) словари
    36) программы
    37) приколы
    38) драйвер
    39) delphi
    40) радио
    41) журнал
    42) аккорды
    43) алсу
    44) games
    45) Путин
    46) досуг
    47) экология
    48) dvd
    49) бодибилдинг
    50) кино
    6.2. Запросы из двух слов

    51) карта москвы
    52) мумий тролль
    53) телефонный справочник
    54) русское радио
    55) скрытые камеры
    56) кавказ центр
    57) руки вверх
    58) виртуальные открытки
    59) britney spears
    60) доска объявлений
    61) телефонная база
    62) секретные материалы
    63) желтые страницы
    64) горные лыжи
    65) прогноз погоды
    66) русское лото
    67) российская газета
    68) курс доллара
    69) машина времени
    70) курсы валют
    71) тексты песен
    72) библиотека мошкова
    73) backstreet boys
    74) расписание поездов
    75) сектор газа
    76) visual basic
    77) tomb raider
    78) психологические тесты
    79) живые камеры
    80) доски объявлений
    6.3. Запросы из трех слов

    81) день святого валентина
    82) гости из будущего
    83) московская коллекция рефератов
    84) правила дорожного движения
    85) телефонный справочник москвы
    86) работа за рубежом
    87) соло на клавиатуре
    88) англо-русский словарь
    89) китайский новый год
    90) работа для вас
    91) горе от ума
    92) аргументы и факты
    93) центральный дом подарков
    94) московская регистрационная палата
    95) великая отечественная война
    96) российская государственная библиотека
    97) комитет солдатских матерей
    6.4.Запросы из четырех слов

    98) из рук в руки
    99) теория государства и права
    100) red hot chili peppers


    Добавлять комментарии могут только зарегистрированные пользователи.
    [ Регистрация | Вход ]