Duplicate content. Co to właściwie jest i czym to grozi?

Powszechnie uważa się, że każde powtórne wykorzystanie tej samej treści jest złe z założenia i mianowane „duplicate content”. Po raz kolejny jednak okazuje się, że ten uklepany termin wzbudzający strach wśród webmasterów nie jest taki groźny! Aby to wyjaśnić, podzielimy zagadnienie na dwie części.

Duplicate content na wielu domenach.

Z założenia Google znajdując identyczną treść na wielu domenach traktuje ją jako duplicate content i traktuje jako nieczyste zagranie manipulujące wynikami. Tekst może wydawać się jeszcze bardziej podejrzany jeśli zawiera we własnej treści linki do innych serwisów. Wtedy właściwie Google przyjmuje, że taki powielony tekst coś pozycjonuje pod kątem anchor tekstu, czyli na słowa kluczowe zawarte wewnątrz tagu odnośnika a to jest już praktyka naruszająca Webmaster Guideline.
W jednym ze swoich videocastów Matt Cutts został zapytany o to w jaki sposób Google determinuje, która strona ma prawo do oryginalnego teksty, a która strona go podkradła i powinna zostać ukarana. Odpowiedź była jednoznaczna, domena, która zamieściła tekst jako pierwsza a pozostałe zostaną ukarane. Pozostaje jednak pytanie czy ta strona została zindeksowana jako pierwsza? Jeśli nie, czy straci ona „punkty” za swój własny tekstu z powodu opóźnionej indeksacji?[ad#post] Niestety nie wiemy do końca jak to działa. Porada od Matta dla osób korzystających z programów partnerskich typu „feed” lub właścicieli sklepów zamieszczających identyczne opisy produktów od producenta to inwencja twórcza czyli znalezienie własnego unikalnego sposobu na prezentacje danych.
Z drugiej strony Googlebot nie jest aż taki dobry w ocenianiu, które strony posiadają identyczne treści. Sprawdziłem to na serwisach jednego klienta, który uruchamiał klony oryginalnego, własnego serwisu. Problem zaczął sie dopiero po roku gdy uruchomiony został 4-ty serwis z identyczna treścią (różna struktura HTML) i załapał się na jakiś filtr. Po otrzymaniu PR2 i indeksacji ponad 30 tysięcy podstron, wypadł z wyników wyszukiwania poza 50-tkę. Co ciekawe, wszystkie zindeksowane podstrony pozostały w wynikach na odległych miejscach i generują duży ruch z efektu „long tail”. Czyżby jednak duplicate content popłacał?

Duplicate content wewnątrz jednej domeny.

To chyba największy mit powtarzany bezmyślnie przez „pozycjonerów”. Poniżej cytat z Google Guidlines:

Myth number 1: Duplicate content causes drops in traffic!
Webmasters often wonder if the duplicates on their site can have a negative effect on their site’s traffic. As mentioned in our guidelines, unless this duplication is intended to manipulate Google and/or users, the duplication is not a violation of our Webmaster Guidelines. The second part of my presentation illustrates in greater detail how to deal with duplicate content using canonicalization.

Powtórzmy zatem głośno i wyraźnie: duplicate content wewnątrz własnej domeny nie łamie zasad przewodnika Google.

Czy takie podwojenie treści jest dobre na stronie? Moim zdaniem nie. Jest drażniące, nie pomaga użytkownikowi i zwiększa poziom frustracji. Oczywiście Google posiada mechanizmy do identyfikacji podejrzanych praktyk i wielokrotne stosowanie np. artykułów jako dopalacza linkowego do głębszych podstron może skończyć się nieciekawie ale to akurat ociera się o specyficzne praktyki spamerskie i jest łatwo rozpoznawalne. Oficjalna odpowiedź Matta to nie przejmować się, że w naturalny sposób na niektórych podstronach znajdują się identyczne treści.

Jeśli chcesz sprawdzić tą teorię skorzystaj z Narzędzi Webmastera i śledź strony z powtarzającym się TITLE lub DESCRIPTION.

źródło:

Powiązane wpisy:

Powiązane słowa kluczowe:

  • duplicate content

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>