Всё для технического документирования
+7 (495) 001-40-42
Разработка технической документации
Курсы для технических писателей
Программное обеспечение

Единый источник и дублированный контент (поисковая оптимизация) (Часть 1)

26.11.2014

26.11.14Если вы сумели решить проблему с написанием качественного контента, перед вами тут же встаёт новая и не менее важная: контент, к которому не могут получить доступ пользователи, ­– это впустую потраченные деньги и время. Сегодня с помощью Тома Джонсона мы попробуем понять некоторые поисковые механизмы Google и обернуть их в свою пользу.


Одна из проблем, с которой технические писатели сталкиваются при поисковой оптимизации своей документации, – выбор между единым источником и дублированным контентом. Google пытается выдавать ряд уникальных результатов, а не версию одного и того же. Если у вас в Интернете размещены несколько версий одного и того же контента, Google, скорее всего, просто выберет версию, которую посчитает лучшей, и скроет остальные.

Под единым источником здесь я подразумеваю несколько интернет-версий контента, не обязательно версии для различных сред. Предположим, у вас есть 9 онлайн руководств для «ACME Software»: версия 1.0, версия 2.0, версия 3.0. И для каждой версии у вас есть руководство для начинающих, руководство администратора и гайд по должностным обязанностям (для руководства). Кроме того, у вас есть печатные версии каждого из 9 руководств. Это означает, что в общей сложности их у вас 18.

В каждой версии руководства у вас есть тема под названием «Настройка параметров». Что происходит, когда пользователь ищет по ключевым словам «Настройка параметров для справки ACME» в Google? Появятся ли все версии темы «Настройка параметров», учитывая высокую степень дублирования контента?

Нет, вероятно, появятся только 2 версии – одна веб-версия и версия для печати. Вот объяснение от Google:

Google старается индексировать и показывать страницы с чёткой информацией. Такая фильтрация означает, например, что если на вашем сайт есть «обычная» и «печатная» версии каждой статьи, и ни одна из них не блокируется неиндексируемыми мета-тегами, мы выберем при поиске одну из них. В тех редких случаях, когда Google понимает, что дублированный контент может показываться с целью манипулирования нашими рейтингами и обмана наших пользователей, мы вносим соответствующие изменения в индексации и ранжировании сайтов.

Другими словами, Google сделает всё, чтобы показывать только результаты поиска, которые являются уникальными для пользователя. Если две веб-страницы содержат почти одинаковый контент, покажется только одна. Google распознаёт разницу между печатным материалом и онлайн-материалами, поэтому вполне вероятно, что появятся и оригинальная страница, и PDF-версия руководства.

В общем, если пользователю нужна версия 2.0 руководства администратора, он или она имеет мало шансов (около 12%) найти этот результат в поиске Google.

Почему дублированный контент теряется: спам-сайты

Несмотря на то, что сценарий единого источника, который я описал, не рассматривается особо широко в обсуждениях дублированного контента между экспертами по SEO, тема дублированного контента активно обсуждается. Это происходит потому, что очень многие сайты копируют контент из других мест. Например, я иногда получаю пингбеки от спам-сайтов, которые копируют контент с моего RSS-канала и размещают его на своем сайте, чтобы получить определенные ключевые слова при поиске.

Google не хочет наказывать жертв спам-сайта, снижая поисковый рейтинг обеих версий. Google снижает в поиске спам-сайт, продвигая при этом оригинальный сайт. Его алгоритмов, как правило, достаточно, чтобы различить сайты, но, если он случайно продвинет спам-сайт, вы можете сообщить об этом через эту форму.

Канонические теги для спасения

Дублированный контент также является проблемой для обычных веб-платформ, таких как WordPress. Версия этого поста есть не только в окне страницы, есть также версия на главной странице, архивах данных, архивах категорий, архивах тегов и, возможно, архивах серии.

Для того чтобы Google знал приоритетную страницу в результатах поиска, вы можете добавить ссылку в заголовке всех одинаковых страниц:

<link rel=»canonical» href=»http://www.example.com/the-real-page»/>

Где the-real-page – каноническая страница.

Тэги канонической ссылки дают понять Google, что эта версия страницы является канонической – другие версии, которые дублируют эту страницу, будут проигнорированы.

Если вы публикуете несколько версий справочного материала в Интернете, рассмотрите вопрос о включении тэга канонической ссылки на версию, которую вы хотите поднять в результатах поиска. Добавление тэга канонической ссылки даёт гарантию, что одна страница получает приоритет над другими страницами.

Давайте применим канонический тег в предыдущем сценарии: какой теме «Настройка параметров» мы должны отдавать приоритет как канонической?

Одним из решений может быть добавление канонических ссылок только на последние версии, и выбор руководства администратора. В руководстве администратора мы могли бы добавить боковую панель со ссылками, которые позволяют пользователям получить доступ к предыдущим версиям или другим руководствам.

Проблема этого метода состоит в том, что он ограничивает Google одним типом результатов поиска. Если вы руководитель, использующий версию 2.0 вместо 3.0, как вы найдёте эту версию контента на Google? Никак. Вы ограничены результатами поиска, предоставляемыми в рамках HTML-справки по продукту.

Ссылки вместо дублирования

В попытке избежать дублирования контента давайте рассмотрим другую стратегию. Вместо того чтобы дублировать контент, попробуйте выложить одну версию контента в Интернете и дать ссылки, куда вам необходимо.

Например, вы можете иметь разные оглавления, которые показывают различные способы организации материала (оглавления руководства для начинающего, руководства администратора и руководства по должностным обязанностям), но все оглавления, которые содержат тему «Настройка параметров» будет указывать на одну и ту же тему.

С этой стратегией вы быстро поймете, что вы не можете поставить оглавление для начинающих слева от Настройки параметров, оглавление руководства администратора слева от Настройки параметров, а также оглавление руководства по должностным обязанностям слева от Настройки параметров.

И это проблема с оглавлениями: они запирают вас в основной навигации на основе заранее определенной идеи порядка и содержания контента. Кроме того, они делают почти невозможной работу с дублированным контентом.

(продолжение следует)

Источник: Single sourcing and duplicate content (search engine optimization)

Тэги: , , ,

< Вернуться к списку публикаций

Облако тегов