Вопрос 1. Как поисковые системы (ПС) узнают о существовании сайта и его страниц?
Простой вопрос, на который многие из вас уже знают ответ. Например, индекс Яндекса узнает о вашем сайте двумя способами: - Увидев ссылку на ваш сайт в просторах Интернета (т.е. автоматически). - Узнав о вашем сайте по вашей инициативе. Для этого вам нужно “Добавить сайт” и подтвердить свои права на сайт в сервисе Яндекс.Вебмастер: У Google все немного иначе: он также автоматически может обнаружить ваш сайт в ссылках на страницах из своего индекса. Но чтобы настроить это вручную, вам придется воспользоваться сервисом Google Search Console. Там перейти во вкладку “Сканирование” и выбрать “Посмотреть как Googlebot”, далее вводите URL-адрес страницы и нажимаете “Запросить индексирование”: Следующий этап - непосредственно индексирование сайта.Вопрос 2. Что такое индексация?
Нет, ну мало ли. Вопрос тоже простой, поэтому и ответим просто. Вот что говорит Википедия: Индексирование в поисковых системах (веб-индексирование) — процесс добавления сведений (о сайте) роботом поисковой машины в базу данных, впоследствии использующуюся для (полнотекстового) поиска информации на проиндексированных сайтах. Т.е. по сути индексация представляет собой сканирование вашего сайта и внесение информации о нем в базу данных поисковой системы. Именно проиндексированные сайты отображаются в поисковой органической выдаче.Вопрос 3. Что такое файлы индексации и какими они должны быть?
В первую очередь, речь пойдет о файле robots.txt. Это специальный текстовый файл, содержащий параметры индексирования для поисковых систем. При обходе сайтов поисковик загружает этот файл и ориентируется на данные, прописанные в нем. Таким образом, с помощью robots.txt вы можете влиять на индексацию. А точнее, сообщить системе, какие страницы вы хотите закрыть от индексации. Такой файл должен быть размещен в корневой папке сайта. Прежде чем загрузить файл, нужно знать, как правильно его создать. Каким должен быть robots.txt, чтобы поисковая система считала его:- вес файла не должен быть больше 32 КБ;
- файл должен быть текстовым;
- все параметры (директивы) должны быть оформлены правильно (не на кириллице* и без использования регистра в названии самих директив).
- Если сайт достаточно большой с большим количеством страниц. Роботы могут просто пропустить новые страницы или страницы с недавними изменениями.
- Если на сайте много страниц, не связанных друг с другом. Их можно просто перечислить в файле (но не более 50 000 в одном).
- У вашего сайта мало внешних ссылок. Роботы при автоматическом сканировании ориентируются на ссылки на ваш ресурс.
- Если на сайте есть мультимедийный контент. Как мы уже писали ранее, из файла Sitemap система может узнать различную информацию для отображения в поиске.
Вопрос 4. Как узнать скорость обхода роботами страниц сайта?
Прежде всего, нужно понимать, зачем вообще это знать. Дело в том, что скорость обхода страниц сайта роботами напрямую влияет на скорость индексации. Чем чаще система индексирует ваш сайт, тем лучше это повлияет на выдачу. Иначе говоря, обход всех страниц сайта по несколько раз в день - это хороший плюс в карму вашего сайта у поисковой системы. Теперь конкретнее. Узнать скорость обхода можно двумя способами: 1) С помощью статистики в Яндекс.Вебмастере (только в Яндексе). 2) С помощью сторонних сервисов (тоже только в Яндексе). Яндекс.Вебмастер дает возможность отследить, какие страницы были проиндексированы, а какие нет вследствие ошибок либо из-за недоступности сервера. Увидеть статистику можно на странице Индексирование → Статистика обхода. Здесь же есть вкладка “Последние изменения”, где вы можете увидеть дату последнего посещения страницы роботом и, соответственно, понять, насколько часто Яндекс сканирует сайт. Что касается сторонних ресурсов: мы рекомендуем tools.promosite.ru. Достаточно просто зарегистрироваться и ввести нужный домен, сервис рассчитает среднюю скорость индексации. С Google, как всегда, все сложно. Сторонних сервисов, позволяющих выявить скорость сканирования мы не знаем. Можно, конечно, использовать GSC для отслеживания общей динамики, но это недостаточно показательная информация. Тем не менее, здесь вы можете обнаружить общую статистику проиндексированных страниц и проконтролировать, чтобы в такой динамике не было слишком резких скачков и падений. На сегодня - информации хватит. В следующей части вы узнаете ответы на не менее важные вопросы:- Сколько страниц уже в индексе поисковой системы?
- Как ускорить процесс индексации?
- Какими должны быть ссылки и размер страниц?
- Краулинговый спрос и бюджет: что об этом нужно знать?
с SEO-аудита вашего сайта
Получить предложение! Подпишись и следи за выходом новых статей в нашем монстрограмме Остались вопросы? Не нашли ответ на интересующий Вас вопрос? Или не нашли интересующую Вас статью? Задавайте вопросы и темы статей которые Вас интересуют в комментариях.
Комментарии