Поиск

Форма входа

Лучшая карта:



Уже скачали: 104237 

Обновлённые карты и обзоры:

  • Карты полушарий
    [ ] скачали 23 раз
  • Политическая карта полушарий
    [1.75 Mb ] скачали 48 раз
  • Карты Таджикистана
    [ 5 карт] скачали 6266 раз
  • Подробные карты Сочи
    [4.39 Mb 2 карты] скачали 11943 раз
  • Контурные карты Московской области
    [224.2 Kb ] скачали 7681 раз
  • Карта Таджикистана 1924-1929 года
    [286.6 Kb ] скачали 22 раз
  • Карта Таджикской АССР 1928 года
    [1.44 Mb 8.55 Mb] скачали 12 раз
  • Карта Узбекской ССР 1928 года
    [ 8.55 Mb] скачали 17 раз
  • Карта Польши 1938 года
    [2.57 Mb ] скачали 22 раз
  • Карта СССР 1940 года
    [1.67 Mb ] скачали 72 раз

  • Династия Рюриковичей (генеалогическое древо)
    прочитали 25190 раз
  • Страстная неделя
    прочитали 21445 раз
  • Генеалогические корни рода Романовых
    прочитали 210 раз
  • География России
    прочитали 14118 раз
  • Династия Романовых (генеалогическое древо)
    прочитали 126748 раз
  • Население мира на 2021 год
    прочитали 10430 раз
  • Схема государственного устройства Российской Федерации
    прочитали 48185 раз
  • Рыцарский Кодекс Чести [Invictus Maneo]
    прочитали 72395 раз
  • Площади стран мира
    прочитали 15507 раз
  • Средняя плотность населения стран мира
    прочитали 1381 раз
  • Мобильная версия сайта

    Перейти на мобильную версию сайта
    Географический авторский проект fedoroff.net 2021 год | Вы Гость×|
    Статьи | Файлы | Альбомы | Новости | Лучшие | Тез | Карта сайта | Контакты | О сайте

    FEDOROFF.NET » ГЛАВНАЯ » СТАТЬИ » Лучшее

    Релевантность поиска и поисковые запросы

    Последнее обновление:
    05.Февраля.2010, 12:31


    Как уже творилось выше, релевантный - значит относящийся к делу. Релевантность результатов поиска поисковой машины означает, что эти результаты содержат страницы, относящиеся к делу, т.е. к смыслу поискового запроса.
     
    В отношении поисковых машин очень часто можно слышать качественные о «Я пользуюсь "Яндексом", потому что он лучше ищет!», «"Гугл" круче всех» вольно распространенные высказывания. Что такое качество поисковика? Синонимом качества поиска считается его релевантность.
     
    В отношении поисковых машин слово "релевантный" — чуть ли не главный термин релевантная выдача, релевантные результаты, у поисковика X релевант выше, чем у поисковика Y, - такие выражения можно слышать постоянно, что они означают?
     
    Это определение релевантности выглядит очень просто. Казалось бы, из него следует, что если мы введем поисковый запрос и если среди первых результатов поиска окажутся только релевантные сайты, то выдача поисковой машины будет релевантна. Однако это не совсем так. Давайте разберемся с этим вопросом по дробнее.
     
    Не существует релевантности вообще, в вакууме. Ведь кто-то должен определить, действительно ли сайты соответствуют тому, что предполагалось в запросе. Кто? Очевидно, лучше всего это может сделать сам автор запроса, который ввел его и поисковую машину.
     
     
    И вот здесь возникает несколько проблем. Ведь не очень интересно обсуждать за просы выдуманные, введенные для эксперимента. В «Яндексе», «Рамблере», Google есть десятки миллионов популярных, реальных запросов, которые ежедневно вводят реальные пользователи. А с ними далеко не все так ясно.
     
    Во-первых, большинство запросов — однословные или двухсловные, то есть очень лаконичные. Ясно, что далеко не всегда они полностью задают смысл искомой страницы. Значит, какие-то условия поиска всегда остаются недосказанными, в уме пользователя.
     
     
    Во-вторых, ни поисковик, ни мы с вами не можем знать, что происходит в уме  пользователя, вводящего конкретный запрос. Что он на самом деле имел ввиду?
     
    В-третьих, у популярных запросов очень много «соавторов» — их вводят совер шенно разные люди. Всегда ли они имеют в виду одно и то же — неизвестно. Ско рее всего, нет.
     
    Например, что такое запрос «дизайн»? Что имел в виду автор – «веб-дизайн», «дизайн квартир», «ландшафтный дизайн» или «промышленный»? А что делать, если разные авторы этого запроса имели в виду разное? Поэтому, релевантность играет важнейшую роль в поисковом продвижении сайта и поисковой оптимизации сайта и, особенно коммерческого магазина, в варианте http://www.weblancer.net/projects/?category_id=61.
     
    Итак, можно сформулировать следующее утверждение: сам по себе поисковый запрос принципиально неполон. Почти для каждого запроса существует не высказанное пользователем явно, но важное для него условие релевантности запроса.
     
    Это субъективное понятие, поскольку результаты поиска, уместные для одного пользователя, могут быть неуместными для другого. Основным методом для оценки релевантности является TF-IDF-метод, который используется в большинстве поисковых систем (как в интернет-поисковиках, так и в справочных системах (MSDN). Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones).
    Пертинентность (англ. pertinence) — соотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).
    Пертинентность (англ. pertinence) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя.
    Допустим, что мы решили обзавестись четырёхколёсным другом и, чтобы купить легковушку, пытаемся вначале узнать что-нибудь об автомобилях. Вводим в поисковой системе слово "машина" (это ведь так называется?) и получаем: "боевая машина пехоты", "машина баз данных", "машинка для точной подстройки скрипичных струн", "адская машина", "бездушная судебная машина" и т. п. Всё найденное релевантно запросу, однако совершенно не пертинентно информационной потребности. Стоит, однако, ввести запрос "легковой автомобиль", и всё, релевантное ему, окажется пертинентным информационной потребности.

    + дополнительный материал: Источник материала [?] Здесь общение с автором проекта по вопросам рекламы,  развития и поддержки проекта, обмена информацией, авторских прав - в контакты. Почта администратора сайта - evgeniy@fedoroff.net. Статья 29.4 Каждый имеет право свободно искать, получать, передавать, производить и распространять информацию любым законным способом. Перечень сведений, составляющих государственную тайну, определяется федеральным законом. © fedoroff.net 2016 


    + основной материал: Релевантность поиска и поисковые запросы

    Категория: Лучшее | Добавил: Добавлено: (05.Февраля.2010) | Авторские права: Фёдоров Евгений Евгеньевич
    Просмотров: 4225 | Комментарии: 1 | Теги: Статьи, поисковая машина, поиск, релевантность |
    Всего комментариев: 1
    1 Добавлено:   (05.Февраля.2010 12:32) [Материал]
    4.5. Вычисление релевантности поиска по запросу

    Каждому элементу характеристического множества назначается вес. Релевантность равна взвешенной сумме элементов характеристического множества запроса. Если веса элементов характеристического множества одинаковы, то в этом частном случае средняя релевантность равна среднему арифметическому от элементов характеристического множества запроса.

    Пример. Задан следующий набор весов элементов характеристического множества запроса: (5, 4, 3, 2, 1). Запрос имеет характеристическое множество (0.8, 0.5, 0.46, 0.43, 0.4).

    Тогда средняя релевантность равна:

    0.8*5/15 + 0.5*4/15 + 0.46*3/15 + 0.43*2/15 + 0.4*1/15 = 0.267 + 0.133 + 0.092 + 0.057 + 0.027 = 0.576.

    4.6. Вычисление средней релевантности поиска по всем запросам

    Средняя релевантность по всем запросам является единой характеристикой технической эффективности поисковой машина, определяется как среднее арифметическое от значений релевантности поиска по отдельным запросам. Чем больше средняя релевантность, тем выше техническая эффективность поисковой машины.

    5. Рекомендуемые размеры и веса элементов

    Мы рекомендуем взять пять элементов – значения точности поиска для первых 10, 30, 50, 70, 100 документов, найденных по запросу, и назначить следующие веса элементов: (5,4,3, 2, 1), как в приведённых выше примерах.

    6. Множество тестовых запросов
    В данном множестве приведено 100 запросов, наиболее часто поступавших на поисковую машину Рамблер по состоянию на май 2000 г. Отбор запросов проводился в соответствии с подходом, изложенным в п. 4.1 настоящего документа. При этом запросы с ненормативной лексикой не учитывались.
    Ниже приводятся тестовые запросы, сгруппированные по количеству содержащихся в них слов.

    6.1. Запросы из одного слова

    1) рефераты
    2) гороскоп
    3) халява
    4) mp3
    5) чат
    6) открытки
    7) игры
    8) работа
    9) icq
    10) сонник
    11) Чечня
    12) анекдоты
    13) поздравления
    14) фото
    15) футбол
    16) кавказ-центр
    17) музыка
    18) хакер
    19) Земфира
    20) crack
    21) мода
    22) библиотека
    23) мебель
    24) картинки
    25) Москва
    26) психология
    27) сочинения
    28) фоменко
    29) оружие
    30) ваз
    31) mtv
    32) стульчик
    33) тосты
    34) новости
    35) словари
    36) программы
    37) приколы
    38) драйвер
    39) delphi
    40) радио
    41) журнал
    42) аккорды
    43) алсу
    44) games
    45) Путин
    46) досуг
    47) экология
    48) dvd
    49) бодибилдинг
    50) кино
    6.2. Запросы из двух слов

    51) карта москвы
    52) мумий тролль
    53) телефонный справочник
    54) русское радио
    55) скрытые камеры
    56) кавказ центр
    57) руки вверх
    58) виртуальные открытки
    59) britney spears
    60) доска объявлений
    61) телефонная база
    62) секретные материалы
    63) желтые страницы
    64) горные лыжи
    65) прогноз погоды
    66) русское лото
    67) российская газета
    68) курс доллара
    69) машина времени
    70) курсы валют
    71) тексты песен
    72) библиотека мошкова
    73) backstreet boys
    74) расписание поездов
    75) сектор газа
    76) visual basic
    77) tomb raider
    78) психологические тесты
    79) живые камеры
    80) доски объявлений
    6.3. Запросы из трех слов

    81) день святого валентина
    82) гости из будущего
    83) московская коллекция рефератов
    84) правила дорожного движения
    85) телефонный справочник москвы
    86) работа за рубежом
    87) соло на клавиатуре
    88) англо-русский словарь
    89) китайский новый год
    90) работа для вас
    91) горе от ума
    92) аргументы и факты
    93) центральный дом подарков
    94) московская регистрационная палата
    95) великая отечественная война
    96) российская государственная библиотека
    97) комитет солдатских матерей
    6.4.Запросы из четырех слов

    98) из рук в руки
    99) теория государства и права
    100) red hot chili peppers


    -->Добавлять комментарии могут только зарегистрированные пользователи.
    [ Регистрация | Вход ]