Приветствую читателей блога! Итак, вопрос, который меня давно интересует: «Как найти все внешние (исходящие) ссылки блога?«. Сервисов, которые проверяют сайты на внешние и внутренние ссылки, много, но большинство из них может проверять только отдельные страницы, а что если нужно проверить весь сайт? В этой статье я попытаюсь решить этот вопрос.

Как найти все внешние (исходящие) ссылки с блога?

Меня заинтересовала данная тема прежде всего потому, что стало интересно проверить какие внешние ссылки на блоге закрыты от индексации, а какие нет. Бывает так, что забываешь добавить ссылке атрибут nofollow или же когда-то обменивался ссылками, а сейчас хочешь проверить «живучесть» сайта, на который размещал и «живучесть» твоей ссылки на нём. Кроме того это очень важный вопрос в продвижении сайта, т.к. от этого зависят показатели сайта (ТИЦ и PR), его ранжирование в поисковых системах, трастовость и т.д.

Недавно заменил, что сайт, на который вела ссылка с моего блога поменял содержание, когда-то это был блог, а сейчас торрент-трекер, т.е. понятно что домен был перепродан и блог или переехал, или удалён. В данном случае мне нет смысла держать эту ссылку и её необходимо удалить. Одно дело, когда случайно попадаются такие ссылки, а другое найти все исходящие ссылки одним махом.

Сразу скажу, что идеального сервиса по поиску всех исходящих ссылок нет, поэтому будем выбирать из того что есть. Итак, сначала пройдёмся по сервисам, которые проверяют страницы/сайты на внешние и внутренние ссылки, а потом уже выберем лучший или комплексно решим вопрос.

Проверка отдельных страниц/URL на исходящие ссылки

pr-cy — выводит и анализирует внешние и внутренние ссылки страницы. Показывает какие ссылки скрыты в noindex и nofollow. Также показывает PR страниц.

web-it — проверяет отдельные страницы, также имеет небольшой набор инструментов для проверки индексации, скорости загрузки страницы и т.д. Показывает внутренние и внешние ссылки, а также их индексацию.

xseo — показывает ссылки (проиндексированные поисковиком) исходящие с сайта.

my-seotools — выводит внутренние и внешние ссылки. Показывает какие ссылки скрыты в noindex и nofollow. Для зарегистрированных пользователей больше возможностей по проверке ТИЦ и PR.

SEO LinkTracker — показывает исходящие ссылки, их количество, вес, а также выводит некоторые SEO параметры. Есть плагин для FireFox.

be1 — анализ показателей страницы, также анализ по внешним и внутренним ссылкам, показывает noindex и nofollow ссылки.

observer — проверка отдельных страниц на наличие исходящих ссылок. Показывает ссылки в noindex и nofollow.

Проверка всего сайта на исходящие ссылки

RDS Bar — сервис, который делает комплексный анализ сайта, имеет в наличии плагины для разных браузеров. Использует для проверки внешних и внутренних ссылок сервис Solomono. Также сам может выполнять проверку на внутренние и внешние ссылки (nofollow) отдельные страницы, но для этого нужно зарегистрироваться.

Нужно отметить, что плагин для Firefox лучше остальных, т.к. более насыщен всякими возможностями. Для получения доступа ко всем инструментам нужно зарегистрироваться.

Для того, чтобы проверить ссылки необходимо установить плагин, после установки перейти на сайт, который анализируется и нажать на иконку RDS bar. В пункте ссылки на сайт можно найти такую строчку: Solomono: кол-во доноров/кол-во получателей. Где доноры — это те сайты, которые ссылаются на анализируемый домен/сайт, а получатели — те сайты, на которые ведёт анализируемый домен/сайт.

Кроме этого можно сразу через сервис Solomono ввести в поиске from имя домена (например, from compass-blogger.com.ua), и получить нужную информацию.

В итоге можно экспортировать данные о донорах и получателях в Exel файлы. Кроме этого можно проанализировать не только общее кол-во доноров и получателей, но и отдельные ссылки, что является главной целью. Платная версия отчёта (11.04 руб. ($ 0.36)) не ограничивается кол-вом строк (5000 для бесплатной версии отчёта) и только этим отличается от бесплатной версии.

К минусам можно отметить то, что сервис не показывает атрибуты ссылок, т.е. узнать индексируются ссылки или нет нельзя. Также сервис периодически обновляет свой индекс и по сути не всегда можно узнать кол-во ссылок на данный момент.

graffity.biz — показывает внешние ссылки с сайта, также показывает битые ссылки с сайта. Проверяет только 100 страниц. Не показывает ссылки в noindex и nofollow.

Bing — вводим в поисковой системе linkfromdomain: имя домена (например, linkfromdomain:compass-blogger.com.ua). Можно посмотреть ссылки, на которые ведёт сайт. В RDS bar также есть данная опция.

Мой способ проверки ссылок на nofollow

В итоге идеального сервиса я не нашёл и поэтому прийдётся проверять исходящие ссылки ручным методом, но чтобы это сделать как можно быстрее попробуем применить некоторые хитрости. Данный метод можно назвать «методом тыка», т.к. все ссылки одним махом проверить не получится. Проверить сможем только те, которые вызывают подозрение.

1. Будем пользоваться сервисом Solomono, который может показать все внешние ссылки с сайта. Если их больше 5000, то можно купить отчёт за 11 рублей. Таким образом первую часть вопроса мы решили и нашли все внешние (исходящие) ссылки с сайта. Теперь нужно найти среди ссылок те, которые индексируются и те которые не индексируются, т.е. с атрибутом rel=»nofollow».

2. Качаем файл базы данных сайта с хостинга, открываем его в редакторе Notepad++.

3. Открываем отчёт Solomono и прокручиваем список исходящих ссылок, если какая-то ссылка вызывает подозрение, то копируем её и в форме поиска редактора БД (Ctrl+F) вводим href=»http://адрес ссылки/ (например, href=»http://compass-blogger.com.ua/) и нажимаем «Искать всё«. В итоге получилось 50 ссылок. После этого вводим в форму поиска rel=»nofollow» href=»http://адрес ссылки/ (например, rel=»nofollow» href=»http://compass-blogger.com.ua/) и получили 43 результата. Это значит, что 7 ссылок индексируются. В таком случае опять делаем первый поиск и уже нажимаем «Найти все в текущем документе«. После этого откроется нижняя вкладка, где высветятся все эти ссылки и можно будет найти те, которые индексируются.

4. В том случае, если исходящая ссылка одна, то можно из отчёта скопировать адрес страницы, на которой она находится, перейти в браузере на данную страницу и уже визуально определить индексируется ссылка или нет. Определить можно с помощью расширения для браузера. В Firefox это тот же RDS bar, в Chrome я использую NoFollow. Расширение подсвечивает ссылки с атрибутом rel=»nofollow».

5. Для пункта 4 также можно проверить с помощью сервисов, которые я предоставил выше. Например, с помощью PR-CY или RDS bar, которые показывает ссылки в rel=»nofollow» с отдельных страниц.

6. Для пункта 4 также можно проверить с помощью исходного кода, т.е. в браузере нажать «Посмотреть исходный код» и в поиске (Ctrl+F) найти нужную ссылку.

В заключение замечу, что вопрос проверки всего блога на исходящие ссылки + индексацию этих ссылок решён не полностью и всё сводится к ручному методу. Возможно данная статья вам поможет максимально уменьшить затраты времени на поиск и проверку.