Если Вы всерьез задумываетесь о расширении аудитории вашего сайта, то для многих логичным решением будет выход на международный рынок или получение аудитории, живущей в вашей стране, но говорящей на других языках. Перед принятием такого решения стоит хорошенько подумать сможете ли Вы конкурировать с иностранными компаниями "на их территории" и суметь продавать иностранным клиентам на их языке.
В случае же, когда ваша аудитория говорит на одном языке, создание дополнительных языковых версий сайта, так сказать "для галочки", скорее всего будет не целесообразным, так как, часто, реальные затраты на создание и содержание каждой дополнительной языковой версии сопоставимы с содержанием еще одного аналогичного сайта.
Если же Вы всё-таки решились создать сайт с несколькими языковыми версиями, то не плохо было бы узнать об особенностях их продвижения в поисковых системах, о чем и пойдет речь в данной статье.
Многоязычный веб-сайт отображает содержание на нескольких языках. Например, сайты украинских компаний часто имеют две или три версии – на украинском, русском и на английском.
Мультирегиональный веб-сайт явным образом ориентирован на пользователей из разных стран. Некоторые сайты являются как мультирегиональными, так и многоязычными (например, содержание на сайте может быть представлено для США и Канады с двумя версиями канадского содержания – для английского и французского языков).
Оптимизация веб-сайта для пользователей из разных регионов, говорящих на разных языках, может оказаться достаточно сложной задачей. Наличие нескольких версий сайта означает, что одни и те же проблемы придется решать в каждой из них. Это требует тщательной проверки оригинального сайта и наличия инфраструктуры для работы с несколькими его версиями. Ниже приведены некоторые советы и рекомендации по созданию многоязычных и/или мультирегиональных сайтов.
Если Вы хотите чтобы локализованное содержание отображалось в результатах поиска на соответствующем языке, вам следует придерживаться следующих правил.
Для определения языка страницы Google использует только видимое ее содержание, а не код, например атрибуты lang
. Вы можете помочь Google правильно определить язык, используя на всех страницах один и тот же язык для содержания и навигации а также избегая параллельных переводов. Допустим, на сайте переведен только стандартный текст, а основной контент остается на исходном языке (это может быть в том случае, если его создают пользователи). В результате одни и те же материалы могут появляться в результатах поиска многократно, но будут отнесены к разным языкам. Это не понравится пользователям.
В файле robots.txt заблокируйте поисковым системам доступ к страницам сайта, которые переводятся автоматически. Автоматический перевод далеко не всегда имеет смысл и может расцениваться как спам. Немаловажно также и то, что плохой или машинный перевод может негативно сказаться на впечатлении от вашего ресурса.
Выдавайте содержание для каждого из языков по отдельным URL. Не используйте файлы cookie для отображения переведенных версий страницы. Постарайтесь на каждой странице размещать перекрестные ссылки для других языков. Тогда, к примеру, француз, попавший на версию страницы для немецкого языка, сможет одним нажатием выбрать понятный ему язык.
Избегайте автоматического перенаправления по языку пользователя. Это может привести к тому, что посетители сайта и поисковые системы не смогут просмотреть его целиком.
Google использует для определения языка страницы ее содержание, но и сам по себе URL может включать информацию о контенте. Например, в следующих URL для канадских пользователей (домен .ca
) в качестве субдомена или подкаталога используется fr
, что достаточно ясно указывает на французский язык: http://example.ca/fr/vélo-de-montagne.html
и http://fr.example.ca/vélo-de-montagne.html
.
Указание языка в URL может также помочь при выявлении проблем с многоязычным содержанием сайта.
Кроме того, попробуйте переводить слова в URL или настроить интернациональные доменные имена (IDN). Убедитесь, что URL передается в кодировке UTF-8 (рекомендуется использовать UTF-8 везде, где это возможно), и обеспечьте правильное экранирование в ссылках по этому URL.
Если указать Google страну, на которую осуществляется таргетинг, мы сможем использовать эту информацию для повышения эффективности поиска для различных стран. Как правило, Google использует для определения страны таргетинга сайта следующие элементы:
Примечание. Поскольку такие региональные домены верхнего уровня, как .eu или .asia, не привязаны к какой-либо конкретной стране, Google расценивает их как общие домены верхнего уровня.
Google не использует для геотаргетинга ни метатеги расположения (например, geo.position
или distribution
), ни атрибуты HTML.
Постарайтесь создать структуру URL, которая позволит выделить фрагменты, связанные с геотаргетингом. Подходящие варианты перечислены в таблице ниже.
Структура URL-адресов | Пример | Плюсы | Минусы |
Привязан к конкретной стране | example.ie |
|
|
Субдомены с gTLD | de.example.com |
|
|
Подкаталоги с gTLD | example.com/de/ |
|
|
Параметры URL | site.com?loc=de |
|
|
Геотаргетинг невозможно задать с абсолютной точностью. Очень важно решить, что делать с пользователями, для которых страница выбрана неверно. Попробуйте разместить на всех страницах ссылки, по которым пользователь сможет выбрать нужный язык и регион.
На веб-сайтах с контентом для различных регионов и на разных языках иногда возникают ситуации, когда одинаковый (или очень похожий) контент публикуется по нескольким URL. В общем случае это не является проблемой, пока это содержание предназначено для пользователей в различных странах. Для каждой группы пользователей мы рекомендуем предлагать индивидуальный контент (понятно, что на практике это не всегда возможно). Как правило, не требуется скрывать одинаковое содержание с помощью файла robots.txt или метатега noindex. Однако если по разным URL одним и тем же пользователям выдается одинаковый контент (например, и example.de/
, и example.com/de/
содержат текст на немецком и предлагаются пользователям из Германии), имеет смысл выбрать предпочтительную версию и произвести переадресацию (или указать в ссылке элемент rel="canonical"). Также нужно изучить рекомендации по использованию rel-alternate-hreflang, чтобы проверить, отображается ли в результатах поиска нужный язык и URL.
Обратите также внимание, что указание канонической страницы для ряда страниц-дублей с помощью rel="canonical" имеет другой эффект, нежели закрытие таких страниц от индексации.
robots.txt — это текстовый файл, который в первую очередь анализируют поисковые роботы заходящие на сайт. В нем описаны инструкции для роботов: какие страницы нужно индексировать, а какие нет, где находится карта сайта для роботов (sitemap.xml) и какой основной адрес сайта.
С 16 июля 2022 года украинские сайты обязаны иметь украинскую версию.