Вам перезвонить?

Технические требования к сайтам поисковых машин

Поводом для написания этой статьи стал практический опыт специалистов “Internet Marketing Service”. К нам часто обращаются владельцы сайтов за консультациями или с запросом о ведении рекламы уже имеющихся у них веб - ресурсов.

Не очень ясно, почему обращение к специалистам следует, как правило, в тот момент, когда сайт уже создан и работа изготовителя полностью оплачена и закрыта. Раз за разом при анализе уже сданных заказчику сайтов приходится сталкиваться с тем, что сайт был принят с целым рядом нарушений элементарных технических требований.

Сами требования вполне полноценно описаны в соответствующих разделах справочных материалов как “Яндекс”, так и “Google”. Если проанализировать то, что пишется в Яндекс в разделе "Помощь вебмастеру" и в соответствующем разделе рекомендаций “Google”, то всё описанное можно свести к следующему набору требований:

1. Указание главного зеркала сайта.

Многие вебмастера спорят по поводу того, как именно поисковые машины определяют главное зеркало сайта при наличии ошибок в его склейке, но на данный момент бесспорно одно: два разных URL головной страницы - это дубли, снижающие ранжирование сайта в целом. Да, поисковые машины при отсутствии соответствующих записей в технических файлах выберут какую-то одну страницу в качестве главного зеркала, но её ранжирование, тем не менее, будет ниже, как и всего сайта в целом, в конечном итоге.

Типичной ошибкой является, помимо этого, отсутствие склейки защищённой и незащищённой версий сайта. Одна и та же страница не может существовать на адресах http://site/page/ и https://site/page/. Это дубли, снижающие ранжирование страницы. Кроме того, часто CMS сайта могут показывать головную страницу на двух адресах в вариантах https://site.com и https://site.com/index.php (https://site.com/index.html, тут возможны варианты). Это, по сути, также нежелательные дубли.

Идёт много споров среди вебмастеров, как правильно выбрать вариант написания адреса главного зеркала: с www или без www. Специалисты “Internet Marketing Service” считают, что домен с www - это домен более низкого уровня, и правильная склейка должна быть на вариант без www.

В итоге, при правильной склейке, получаем:

  • http://site.com - 301 редирект на https://site.com, для любых страниц.
  • https://www.site.com - 301 редирект на https://site.com, для любых страниц.
  • https://site.com/index.php - 301 редирект на https://site.com. В некоторых случаях такой редирект организовать невозможно, тогда в файле robots.txt пишем строчку:
    Disallow: /index.php*

2. Отсутствие дублей страниц.

Кратко: определённый контент может располагаться только на одном URL, и не должно быть клоакинга (подмены содержимого) страниц, когда на одном и том же URL появляется разное содержимое.

В CMS должна быть предоставлена возможность простановки метатега “canonical”. Указание канонического адреса страницы - это одна из мер по борьбе с дублями страниц на сайте, особенно - когда просто склеить страницы между собой способом редирект - 301 не представляется возможным.

3. Обработка ошибки 404.

Существуют определённые требования поисковых машин к содержанию страницы ошибки “404”. В общем и целом, при наборе в адресной строке браузера несуществующего URL в домене, сервер должен ответ “404” - ошибка. При этом неплохо, если сервер осуществляет редирект на страницу “404”. Проверить код ответа сервера можно, воспользовавшись соответствующим инструментом в “Яндекс - Вебмастер” или онлайн - сервисом, например - вот этим: Сheckmy.

4. Структура страниц ("title", "meta", "<h1...h6>", content).

Перед созданием структуры сайта специалисты “Internet Marketing Service” подробнейшим образом прорабатывают семантическое ядро будущего сайта. Без этого невозможно собрать его будущую структуру и правильно распределить страницы. Основой создания любого сайта должна являться именно семантика как отображение существующего спроса на товар или услугу (и “хотелки” заказчика при этом в идеале должны отойти на второй план) и связанный с ним контент, правильно разложенный постранично и по разделам. После создания “скелета” сайта, создаваемая структура его страниц должна отвечать неким минимальным требованиям. Среди них:

  • наличие ключевого слова, связанного с данной страницей. Оно должно быть прописано в тегах страницы и в метаописании (meta name="description" content=”...”)
  • заголовок текста страницы должен быть выделен тегом "h1", который должен быть релевантен ключу, но не совпадать полностью с тегом "title" страницы. Тег "h1" может быть применён на странице только один раз. Подзаголовки можно выделить тегами от "h2" до "h6", они могут применяться в нескольких местах текста страницы.
  • контент страницы должен быть уникален, проверен с помощью специальных сервисов на уникальность и оптимизирован под те ключевые слова, по которым предполагается продвигать страницу.

В общем и целом:

  • в URL страниц не должны использоваться параметры запросов или динамического формирования страниц, в идеале - т.н. “ЧПУ”. Такие URL формируют практически все современные CMS. В качестве символов разделителей используется только дефис, а не нижнее подчёркивание. (Правильно: https://site.com/bred/kak-sdelat-sajt.html. Неправильно: https://site.com/bred/kak_sdelat_sajt.html).
  • url внутренней страницы должен точно соответствовать положению страницы внутри структуры сайта. Не надо пытаться вытаскивать страницу с хорошим контентом “наверх” структуры. Кроме того, очень желательно при создании сайта с большим количеством уровней вложенности страниц использовать “хлебные крошки”. Они облегчают навигацию по сайту для пользователей и, кроме того, при их сканировании поисковыми машинами дают поисковой системе более полное представление о структуре сайта.
  • CMS сайта не должна делать ошибок при формировании карты сайта в виде файла /sitemap.xml. В файле robots.txt должен быть прописан реальный адрес файла sitemap. при этом обратите внимание на вариант написания имени карты сайта - в некоторых случаях CMS формируют имя файла с написанием с заглавной буквы: Sitemap.xml.
  • в файле robots.txt должен быть закрыто индексирование с помощью директивы “Disallow” всех некачественных страниц.
  • в идеале, все ссылки на другие страницы сайта должны быть приписаны с полными URL:
    Правильно: href=”https://site.com/stranitscha-1.html”.
    Неправильно: href=”/stranitscha-1.html"
  • нежелательны ссылки на страницах на саму себя.

Конечно, в этой статье описаны только основные технические моменты, касающиеся сайтостроения. Если Вам нужна более подробная консультация - Вы можете связаться с нами, заполнив соответствующую форму на странице “контакты”.

Заказ обратного звонка