Что такое релевантность и релевантность запросу? Ранжирование, ссылочное ранжирование сайта в поисковых системах

Релевантность, релевантность запросу. Ранжирование, ссылочное ранжированиеВ современном мире информация играет особую роль. Получить ту или иную информацию можно в библиотеках, просматривая телепередачи или прослушивая радиовещание. Но, пожалуй, самым быстрым способом является поиск в сети Интернет.

Интернет – глобальная сеть, объединяющая большое количество компьютеров заключенных в сети. Сети могут быть домашними, корпоративными, научными при этом архитектура их создания также очень разнообразна. Объединение таких разных сетей в единую – Интернет – стало возможным благодаря использованию протокола IP и принципу маршрутизации пакетов даннях. По своей сути Интернет – это глобальное информационное пространство, в котором можно найти огромное количество разнообразной информации.

Поиск нужной информации – это процесс выделения среди большого количества разнообразных документов тех, которые наиболее полно соответствуют необходимой теме.

Для поиска информации по теме используют поисковые запросы – набор слов, фразы, которые коротко и емко характеризуют тему или могут часто встречаться при ее описании. Такой поиск называется «поиск на естественном языке», а слова — ключевыми. Но возможен поиск и с использованием специального синтаксиса или языка поисковых запросов.





Для оценки эффективности запроса используют понятие релевантность – соответствие чему-либо. Релевантность запросу – это точность соответствия выдаваемой поисковыми машинами информации конкретному поисковому запросу. Данное понятие весьма субъективно, так как степень соответствия найденных документов поисковому запросу оценивает конкретный человек в каждом конкретном случае. Более того найденный документ может содержать слова поискового запроса, приблизительно соответствовать теме, но не раскрывать ее или быть некорректным.

Существует три основных вида релевантности:

  1. Содержательная – соответствие информационному запросу, чаще всего обычное определение частоты использования слов запроса в документе и сравнение с другими документами.
  2. Формальная – сравнение образа документа и запроса по определенному алгоритму.
  3. Пертинентность – сопоставление объёма полезной информации ко всему объёму полученной информации. Не зависит от полноты и точности информации поискового запроса. Используется для определения эффективности работы поисковых систем интернета.

В зависимости от релевантности документа проводится его ранжирование. Само понятие ранжирование обозначает – сортировка, для документов с учетом информационной значимости. Как правило, документы в сети не размещены «сами по себе», а имеют определенное местоположение – сайт. При выводе документов, максимально соответствующих поисковому запросу, на странице поиска обязательно указывается ссылка на ресурс, на котором расположен документ. Порядковый номер в списке выводимой по запросу информации, определяется согласно информационной ценности, релевантности документа. Автоматически сайт, на котором расположены релевантные (наиболее отвечающие запросам ) документы попадает при ранжировании в число первых. И можно уже говорить не только о релевантности документа, а и о релевантности сайта, соответствующего той или иной тематике.

Также существует понятие ссылочного ранжирования – поиск и сортировка по лексике ссылок, содержащихся в материалах сайта. Иногда поисковая машина выдает на запрос ссылку на страницу, в которой нет ни одного слова из текста самого запроса. Происходит данная ситуация потому, что при поиске были найдены нужные слова в тексте ссылки на документ с абсолютно другого документа, что сильно повышает его релевантность согласно информационного запроса. Этот фактор целенаправленно введен в алгоритм поисковых систем. Предполагалось, что если существует ссылка на страницу с текстом, то текст должен быть на этой странице, причем должна существовать прямая зависимость – чем больше ссылок, тем больше вероятность наличия информации. Но данное предположение оправдывается далеко не всегда. Ссылочное ранжирование способно достаточно сильно влиять на общую релевантность сайта.

Термины, встречающиеся в статье:

  1. Интернет – глобальная сеть, объединяющая большое количество компьютеров заключенных в локальные сети – информационное пространство.
  2. Поиск нужной информации – это процесс выделения среди большого количества информации действительно нужной и значимой.
  3. Поисковый запрос – слова, фразы, которые характеризуют искомую тему или часто встречаются при ее описании.
  4. Ключевые слова – наиболее употребляемые для формулировки запросов.
  5. Релевантность — соответствие чему – либо (буквально).
  6. Релевантность запросу – это точность соответствия найденной информации конкретному поисковому запросу.
  7. Ранжирование – сортировка (буквально).
  8. Ссылочное ранжирование – поиск, анализ и сортировка по лексике ссылок, содержащихся в материалах сайта.