В новой версии Яндекс.Вебмастера появился удобный инструмент быстрого исследования того, как сайт индексируется поисковой системой.
Этот инструмент называется «Статистика» и находится он в разделе «Индексирование».
Я хочу рассказать вам, как мы, в агентстве Реаспект, проводим быстрый аудит индексирования сайта при помощи данного инструмента.
1. Составление структуры сайта
2. Проверка соответствия реальной структуры сайта и добавление новых разделов
3. Выгрузка данных
4. Исследование данных
5. Распространенные ошибки
6. Выводы.
Если у вас небольшой сайт (до 5000 страниц), пункты 1-2 можно пропустить и сразу перейти к пункту 3 — Выгрузка данных.
Составление структуры сайта – то, что необходимо делать с самого начала работы над новыми проектами. Именно на этом этапе специалист знакомится с проектом, получает первые представление о проблемных зонах и точках роста.
Тема составления и расширения структуры сайта довольно большая. Если читателям будет интересно, я напишу отдельную статью о том, как правильно составить структуру сайта, какие можно использовать для этого инструменты и какие полезные решения можно найти для роста сайт.
На выходе мы должны получить структуру сайта c url масками
Пример структуры:
Раздел |
URl |
Главная |
site.ru |
Каталог продукции 1 (категория продуктов) |
site.ru/catalog-1/ |
Подкаталог продукции 1.1 (бренд/подкатегория) |
site.ru/catalog-1/category-1/ |
… |
Заходим в
Структура сайта показывает распределение страниц сайта, загруженных роботом, по директориям и скриптам. Она отображает только разделы, которые содержат более 10 страниц и составляют более 1% от общего числа страниц, загруженных в базу Поиска.
Подробнее:
Смотрим, какие разделы и подразделы выделила поисковая система, и в случае необходимости добавляем новые разделы кнопкой «Добавить раздел».
К сожалению, в настоящий момент есть возможность добавить до 5 пользовательских разделов.
На вопрос, будет ли увеличено количество пользовательских разделов, поддержка Яндекс Вебмастера отвечает: «Пока от пользователей сервиса не было массового запроса на увеличение данной возможности. При возникновении такого общественного запроса он будет рассмотрен менеджерами сервиса».
Но мы можем добавлять свои разделы и удалять их по мере необходимости.
Стоит учесть, если вы добавили свой раздел в структуру, и Яндекс знает о страницах, которые есть в данном разделе, но в столбцах «Загружено», «В поиске» и «Доля загруженных, %» появляется надпись: «Данные о разделе скоро появятся», вы все равно можете посмотреть всю нужную информацию, зайдя в соответствующий отчет. Данные о разделах в таблице обновятся позже.
Для выгрузки данных о страницах идем в раздел «Индексирование» — «Статистика».
В выпадающем меню разделов сайта выбираем:
Далее можно начать ковыряться в сводке, выбирая разные типы ошибок и смотреть что там и как, это будет красиво, но долго. А нам надо быстро и удобно.
Для этого нажимаем кнопку «Скачать архив загруженных страниц».
В полученном архиве будет файл с расширением .tsv. Файлы с таким расширением открываются офисными таблицами, например, excel.
Задаем в документе фильтрацию («Данные» — «Фильтрация») и приступаем к анализу данных.
Первым делом изучаем, с какими кодами ответа сервера, кроме 200 столкнулся Яндекс на исследуемом сайте.
Для этого, в колонке «http_code» поочередно просматриваем все значения, отличные от «200».
Самые распространенные коды ответов:
Подробнее с кодами ответа вы можете ознакомиться на данной странице
Хочу обратить внимание на то, что коды ответов в таблице – это коды, полученные поисковой системой на момент посещения страницы, и на момент выгрузки данных, код может отличаться. Поэтому, обязательно смотрите данные из колонки «last_access».
Не забывайте, что Яндекс выгружает данные в формате
Приступаем к изучению страниц, которые отдавали код ответа 200 (существуют) Яндексу, но не участвуют в поиске.
Для этого выставляем в колонке «http_code» значение «200», а в колонке «searchable» значение «0».
Поочередно просматриваем, какие страницы исключены из индекса поисковой системы. Зайдите на сами страницы и попытайтесь понять, почему Яндекс считает данные страницы бесполезными для поиска.
Также рекомендую после описанных выше шагов изучить, какие страницы присутствуют в выдаче поисковых систем в настоящий момент.
Цель такого изучения – поиск страниц, которые в индексе присутствовать не должны, как пример:
Если такие страницы найдены, то лучшим решением будет удалить их из поиска, закрыв от индексации, или удалить с сайта, если это мусор.
Можно выделить следующие ошибки, которые я чаще всего встречаю при анализе сайта и пути их решения:
Таким, довольно несложным для освоения способом, можно быстро поставить предварительный диагноз многим сайтам. Найти, какие страницы могли бы приносить трафик, но не приносят, а какие наоборот воруют трафик.
Не получилось проверить структуру сайта самостоятельно или добавить новые разделы? Оставляйте комментарии, будем разбираться вместе.