Создание, продвижение, автоматизация Web-сайтов и приложений, а так же парсинг, сбор и обработка больших объёмов данных
У страниц сайта должна быть только одна основная версия, то есть в поисковой выдаче не должно быть копий (зеркал) сайта. Поисковые системы считают каждый URL отдельной страницей, одна и та же страница доступная по разным адресам — воспринимается дублями. Наличие страниц с дублирующим контентом ухудшает ранжирование сайта поисковыми системами.
Примечание: п. 2 и 3 необходимо выполнять параллельно (одновременно).
Оптимизация:
Необходимо настроить 301 редиректы со всех страниц копий сайта на соответствующие страницы основной версии.
Пример настройки для выбранного варианта без www символов и с наличием символа слеш / в конце URL адреса.
Копия страницы | Редирект | Конечная страница |
http:// santehpro.com.ua/page1/ | 301 | https://santehpro.com.ua/page1/ |
https://www.santehpro.com.ua/page1/ | 301 | |
https://santehpro.com.ua/page1 | 301 | |
https://santehpro.com.ua/index.php | 301 | https://santehpro.com.ua/ |
https://santehpro.com.ua/index.html | 301 | https://santehpro.com.ua/ |
https://santehpro.com.ua/Page1/ | 301 | https://santehpro.com.ua/page1/ |
https://site.com///page1 | 301 | https://santehpro.com.ua/page1/ |
Необходимо обеспечить техническую возможность формирования url-адресов страниц категорий, подкатегорий товаров, страниц товаров и сервисных страниц с учетом наличия ключевых слов и добавления уникального идентификатора. При этом идентификатор должен располагаться в конце url-адреса.
ЧПУ – человеко-понятный URL. Основное назначение — это добавление ключевого слова семантического ядра в URL адрес страницы, помогающий продвижению страницы в поисковой выдаче и релевантно определяющий направление страницы (но не ограничивающий семантику страницы).
Реализация
Соблюдая общие принципы формирования URL (пункт 4.1) и исходя из того, что будущая структура сайта предполагает реализацию категорий (Cанфаянс, Ванны, Душевое оборудование, Мебель для ванной комнаты, Смесители и т.д.) и соответствующие им страницы подкатегорий, необходимо с помощью механизма транслитерации и путем добавления идентификатора и кода объекта в конец адреса обеспечить формирование URL-адресов:
https://santehpro.com.ua/[translit]-<идентификатор><код>/
Список идентификаторов:
cat — категория/подкатегория товара
brand — бренд
prod — карточка товара
art — Блог/статья блога
Для страниц категорий:
https://santehpro.com.ua/[название категории]-<идентификатор><код>/ (Cанфаянс, Ванны, Душевое оборудование, Мебель для ванной комнаты, Смесители и т.д.)
Пример – для страницы Санфаянс:
https://santehpro.com.ua/sanfayans-cat1/
Для страниц Брендов
https://santehpro.com.ua/[название Бренда]-<идентификатор><код>/
Пример – для страницы Производители → Roca:
https://santehpro.com.ua/roca-brand25/
Для страниц подкатегорий:
https://santehpro.com.ua/[название подкатегории]-<идентификатор><код>/
Пример – для страницы Санфаянс → Пьедесталы:
https://santehpro.com.ua/piedestaly-cat15/
Для страниц карточек товаров:
https://santehpro.com.ua/[наименование товара в базе данных]<идентификатор><код>/
Пример – для страницы карточки товара Санфаянс → Пьедесталы → Пьедестал Freja (L77000000) Kolo:
https://santehpro.com.ua/piedestal-freja-l77000-kolo-prod13/
Для страниц информационного раздела:
https://santehpro.com.ua/[Блог]-<идентификатор><код>/
Пример – для страницы Статьи:
https://santehpro.com.ua/blog-art1/
Для страниц статей информационного раздела:
https://santehpro.com.ua/[Блог]/[Название статьи]-<идентификатор><код>/
Пример – для страницы Статьи → Инсталляции Geberit:
https://santehpro.com.ua/statji/installjacii-geberit-art12/
Должна быть обеспечена техническая возможность формирования мета-данных на страницах сайта [title, description, заголовки (H1)].
Для корректной реализации пагинационных страниц, на страницах всех разделов необходимо соблюдать следующие требования:
URL-адреса всех пагинационных страниц необходимо формировать исходя из следующего шаблона — https://santehpro.com.ua/[категория/подкатегория]-идентификатор/page-[№ страницы]/;
http://geektimes.ru/post/128746/
1-ая страница пагинации <link rel=»next» href=»[url 2-ой пагинационной страницы]» />
2-ая страница пагинации — <link rel=»prev» href=»[url 1-ой категории/подкатегории] » />
<link rel=»next» href=»[url 3-ей пагинационной страницы]» />
и для последующих пагинационных страниц по аналогии.
…
последняя страница пагинации –
<link rel=»prev» href=»[url предыдущей пагинационной страницы] » />
<meta name=»robots» content=»noindex, follow»>
Рекомендуется автодобавление реализовать таким образом, чтобы номер страницы был указан в начале содержания title, description.
Пример:
https://santehpro.com.ua/categoria-cat№/
title: Название категории. Santehpro.com.ua
description: Описание категории Santehpro.com.ua
https://santehpro.com.ua/categoria-cat№/page-2/
title: Страница 2. Название категории. Santehpro.com.ua
description: Страница 2. Описание категории Santehpro.com.ua
Механизм навигационной цепочки должен формироваться в соответствии со структурой сайта (то есть, хлебные крошки должны отражать путь к странице) и с соблюдением нижеприведенных требований:
Тег H1 – должен использоваться только для оформления заголовка на страницах сайта. На одной странице сайта должен быть только один тег H1. Заголовок визуально выделяется отдельными настройками шрифта. Лучше использовать тот же шрифт.
Тег H2 – должен использоваться для оформления подзаголовков на странице. Используется менее крупный шрифт, чем в заголовке первого уровня, но крупнее, чем в основном тексте.
Тег H3 (H4-H6) – используется для оформления подразделов статьи. Тег не обязательный в использовании.
Не допускается следующее использование тегов H1-H6:
Необходимо все тексты, оформленные с помощью тегов Н1-H3, оформить с помощью стилей CSS.
Страницы, требующие корректного оформления тегов H1-H3 – Главная и все страницы категорий (Санфаянс, Ванны, Душевое оборудование и т.д) и подкатегорий (Акриловые ванны, стальные ванны, чугунные ванны и пр.).
Необходимо предусмотреть возможность добавлять/менять alt и title для картинок отдельно и задать правило (к примеру, для страниц товаров – описания изображений должны формироваться исходя из хранившихся в базе данных наименований товаров), по которым они будут заполняться автоматически.
ALT и TITLE обязательно нужно использовать на сайте, так как благодаря этим атрибутам, поисковые системы проводят ранжирование в своих сервисах по поиску картинок.
Примечание: по возможности, рекомендуется реализовать отдельный функционал, который будет оптимизировать изображения — сжатие изображений с целью уменьшения их объема без значительной потери в качестве.
Изображения должны быть оптимизироваными и легкими (сервис оптимизации изображений: http://optimizilla.com/).
Alt — это альтернативный текст, который отображает браузер, если по тем или иным причинам он не может загрузить картинку.
Title — это дополнительная информация о картинке или ссылке. Его основное предназначение помочь посетителю получить более подробное описание элемента. Значение этого атрибута показывается при наведении мышки на объект. Не путайте атрибут TITLE с одноименным тегом заголовка страницы.
Необходимо в раздел <head> указанных страниц добавить тег:
<meta name=»robots» content=»noindex, nofollow»>
При нажатии на эти ссылки посетитель должен попадать на соответствующую страницу, но в коде этих элементов необходимо прописать для поисковых роботов атрибут, запрещающий роботам переход по ссылкам.
Пример решения:
HTML-код элемента:
<a href=”//site.com” rel=”nofollow”>[наименование]</a>
В случае реализации нижеприведенного функционала с наличием живой ссылки вида <a href=»»></a> в код данных элементов также необходимо добавить атрибут rel=»nofollow»:
Цель:
— оптимизировать перераспределение внутреннего ссылочного веса — страницы таких товаров получают ссылочный вес, но являются бесполезными для поиска (по ним нет поискового трафика, они не продают);
— уменьшить затраты краулингового бюджета поисковой системы для сайта, который имеет ограниченное количество.
Реализация процесса:
Пример:
https://aquacity.com.ua/catalog/baths/acrilic_baths/filter/brand-is-cersanit/type-is-pryamougolnaya/apply/ —> 301 редирект → https://aquacity.com.ua/catalog/baths/acrilic_baths/filter/brand-is-cersanit/apply/
12.1. Каждая страница на сайте должна быть доступна только по одному уникальному URL-адресу.
12.2. В структуре сайта не должно быть страниц с одинаковым контентом (к примеру, в категории “Мебель для ванной комнаты — Шкафы для ванной комнаты” контент страниц товаров одного производителя может отличаться только цветом), так как:
Реализация — устранение дублированного контента следующим методом:
На странице категории в листинге все товары одной модели, которые являются «многоцветовыми», должны ссылаться на один из товаров той же модели, выбранный в качестве основного, с помощью атрибута rel=”canonical”.
Пример
Страница данного основного товара по своей сути будет являться «бесцветовой» (метаданные будут заполнены без указания цвета товара). Страницу основного товара необходимо указать в качестве канонической — на всех страницах товара других цветов в <head> необходимо разместить:
<link rel=”canonical” href=”[url основного товара]” />.
Необходимо сформировать файл Sitemap.xml, соблюдая нижеперечисленные требования, отдельно для страниц сайта sitemap.xml и изображений sitemap-image.xml:
В файле индекса обязательно используются следующие теги XML:
sitemapindex – родительский тег в начале и конце файла;
sitemap – родительский тег для каждого файла Sitemap, указанного в файле (дочерний тег тега sitemapindex);
loc – расположение файла Sitemap (дочерний тег тега sitemap);
lastmod – дата последнего изменения файла Sitemap. Эта дата должна быть в формате W3C Datetime. Значение обновляется в случае любого изменения в текущем файле Sitemap.
Пример:
<?xml version=«1.0» encoding=«UTF-8»?>
<sitemapindex xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9»>
<sitemap>
<loc> https://santehpro.com.ua/sitemap-1.xml.gz</loc>
<lastmod>2016-12-15</lastmod>
</sitemap>
<sitemap>
<loc> https://santehpro.com.ua/sitemap-2.xml.gz</loc>
<lastmod>2016-12-16</lastmod>
</sitemap>
</sitemapindex>
urlset – родительский тег в начале и конце файла.
url – родительский тег для каждого URL адреса, указанного в файле (дочерний тег тега urlset).
loc – расположение страницы, URL адрес (дочерний тег тега url).
lastmod – дата последнего изменения страницы. Эта дата должна быть в формате W3C Datetime. Значение обновляется в случае любого изменения связанного с текущей страницей.
changefreq – вероятная частота изменения текущей страницы.
priority – приоритетность URL относительно других URL на сайте.
Пример:
<?xml version=«1.0» encoding=«UTF-8»?>
<urlset xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9»>
<url>
<loc> https:/santehpro.com.ua</loc>
<lastmod>2016-12-16</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>
Значения сhangefreq и priority в соответствии типом страницы:
Главная страница – 1, daily
категории/ подкатегории – 0.7, daily
бренды – 0.7, daily
страницы продуктов – 1, daily
страницы новостей, статей – 0.6, weekly
сервисные страницы – 0.4, weekly
Символ | Маскирование | |
Амперсанд | & | & |
Одинарные кавычки | ‘ | ' |
Двойные кавычки | « | " |
Больше чем | > | > |
Меньше чем | < | < |
https://support.google.com/webmasters/answer/178636?hl=ru
Требования к содержанию файла sitemap-image.xml
В файлах Sitemap используются следующие теги XML:
Пространство имен XML:
xmlns=»http://www.google.com/schemas/sitemap-image/1.1″
urlset – родительский тег в начале и конце файла.
url – родительский тег для каждого URL адреса, указанного в файле (дочерний тег тега urlset).
loc – расположение страницы, URL адрес (дочерний тег тега url).
<image:image> — Содержит всю информацию об одном изображении. Каждый URL (тег <loc>) может включать до 1000 тегов <image:image> (обязательный тег);
<image:loc> — URL изображения (обязательный тег);
<image:caption> — Подпись к изображению (необязательный тег);
<image:geo_location> — Место съемки (не обязательный тег);
<image:title> — Название изображения (необязательный тег);
<image:license> — URL лицензии изображения (необязательный тег).
Пример:
<?xml version=«1.0» encoding=«UTF-8»?>
<urlset xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9»
xmlns:image=«http://www.google.com/schemas/sitemap-image/1.1»>
<url>
<loc> santehpro.com.ua</loc>
<image:image>
<image:loc> https://santehpro.com.ua/kartinka.jpg</image:loc>
</image:image>
<image:image>
<image:loc> https://santehpro.com.ua/photo.jpg</image:loc>
</image:image>
</url>
</urlset>
При реализации сайта, необходимо осуществлять проверку на наличие ошибок верстки для прохождения валидации validator.w3.org.
Выполнение данного пункта в первую очередь рекомендовано для основных элементов сайта (footer, header) и основных шаблонов сайта: страницы категории, подкатегории, карточки товара, Главной страницы.
Для страниц фильтрации каноническими должны быть указаны только сами страницы фильтрации.
Рекомендуется внедрить рекомендации Google PageSpeed Insights с целью оптимизации скорости работы сайта. Учитывать предложенные на данном сервисе рекомендации для достижения быстрой загрузки сайта (оптимально, если показатели скорости загрузки сайта на разных устройствах – в оранжевой зоне).
Примеры
Быстро работающий сайт: www.work.ua | Сайт, у которого проблемы со скоростью загрузки |
Favicon – картинка специального формата, которая отображается рядом с адресом вашего сайта в поисковой системе и в адресной строке.
Разработанную картинку favicon необходимо загрузить в корень сайта в формате ico.
При запросе страницы, которая не существует, сервер должен возвращать ошибку 404, то есть «страница не найдена». Данный код ответа говорит серверам и браузерам, что такая страница не существует.
Необходимо настроить сайт так, чтобы при запросе несуществующих страниц появлялся код ответа 404, то есть страница не найдена.
Пример реализации: