Duplicate content – czym jest duplikacja treści i jaki ma wpływ na SEO?

Aleksandra Podżorska
Aleksandra Podżorska
Archiwum 12.2024
 
Duplicate content – czym jest duplikacja treści i jaki ma wpływ na SEO?

Czym jest duplikacja treści
i jaki ma wpływ na SEO?

Treści odgrywają ogromną rolę dla pozycjonowania stron. W związku z tym praca nad ich jakością w obrębie serwisu powinna stanowić wysoki priorytet podczas optymalizowania witryny. Jednym z problemów dotyczących treści na stronie może być duplicate content. Na czym on polega, jaki ma wpływ na SEO i w jaki sposób go eliminować?

 

Czym jest duplikacja treści?

Duplikacja treści (czyli tzw. duplicate content) występuje wtedy, gdy identyczna treść pojawia się w sieci na więcej niż jednej stronie internetowej. Innymi słowy, jeśli ten sam tekst pojawia się pod wieloma adresami URL, mamy do czynienia z powielaniem treści. Co ważne, taka treść może być skopiowana w ramach jednej domeny. Mówimy wtedy wówczas o duplikacji wewnętrznej. Gdy jednak te same teksty znajdują się na różnych domenach, mamy do czynienia z duplikacją zewnętrzną.

Pierwszym skojarzeniem, które może przyjść do głowy po usłyszeniu frazy „zduplikowana treść”, jest po prostu kradzież tekstu z jednej witryny i umieszczenie go na innej. Jest to jedna z metod stosowanych w marketingu typu Black Hat SEO. Co więcej, niektóre szacunki sprzed kilku lat mówią, że statystycznie, na co czwartej stronie znajdującej się w sieci można znaleźć zduplikowaną treść. Niemniej jednak faktem jest, że w większości przypadków duplicate content na stronie powstaje w zasadzie przypadkowo, bez jakichkolwiek złych intencji. Najlepiej omówić tę kwestię na konkretnych przykładach.

Wewnętrzna duplikacja treści

Wyobraźmy sobie następującą sytuację: jesteśmy właścicielami strony https://przykladowadomena.pl. Okazuje się jednak, że na naszą stronę można również wejść z adresów:

  • http://przykladowadomena.pl
  • https://www.przykladowadomena.pl
  • http://www.przykladowadomena.pl
  • https://przykladowadomena.pl/index

Jeżeli nie wykonamy odpowiednich przekierowań 301 w pliku .htaccess lub nie zdefiniujemy strony kanonicznej (o tym wspomnimy w dalszej części tekstu), to każdy z wyżej wymienionych adresów będzie traktowany przez algorytm Google’a jako osobna strona. Co w praktyce oznacza, że to robot samodzielnie wybierze wersję kanoniczną i to ją będzie indeksował najczęściej, pozostałe strony traktując jak duplikat.

Bardzo częstym zjawiskiem jest także zwykłe kopiowanie tekstów w obrębie jednej witryny. Mamy z nim do czynienia, chociażby w sklepach internetowych, gdzie identyczne opisy kategorii produktów lub samych produktów znajdują się na różnych podstronach i pod różnymi URL-ami. Przykładowo, opis kategorii może zostać powielony na wszystkich stronach paginacji. W takiej sytuacji tak naprawdę duplikacja treści następuje automatycznie.

Poza tym, jeżeli udostępnimy wersję strony do druku, wówczas także możemy stworzyć duplicate content. Aby temu zapobiec, wystarczy w wersji do druku użyć meta tagu „noindex”. Wtedy nie zostanie ona zaindeksowana, a tym samym nie znajdzie się w wynikach wyszukiwania.

Duplicate content może przybierać wiele form. Duplikacja znaczników meta, a także duplikacja nagłówków również nie jest pożądanym zjawiskiem.

Zewnętrzna duplikacja treści

W tym przypadku zasada jest prosta: ta sama treść znajduje się na różnych witrynach. Najczęstsze powody takiego stanu rzeczy to:

  • Treść została nielegalnie skopiowana.
  • Dany tekst, na przykład opis produktu, oryginalnie pochodzi od jego twórcy, wydawcy, producenta lub dystrybutora. A my nie tworzymy nowego opisu, tylko korzystamy z gotowego. Tak samo, jak nasza konkurencja.
  • Powielono treść opisu produktu w sklepie online oraz na aukcji na portalu Allegro lub innym marketplace.
  • Ta sama treść trafiła na naszą stronę i na wpis w serwisie społecznościowym.
  • Treść została skopiowana jako cytat, ale nie oznaczono tego w żaden sposób w kodzie strony. Dotyczy to również wszelkiego rodzaju notatek prasowych czy artykułów sponsorowanych.

Duplikacja treści a kanibalizacja fraz

Warto znać różnicę pomiędzy pojęciem duplicate content i kanibalizacją treści, gdyż bardzo często te dwa zjawiska są ze sobą mylone. Duplikaty to powielenia treści, które mogą występować zarówno wewnątrz domeny, jak i na domenach zewnętrznych. Natomiast kanibalizacja fraz kluczowych odnosi się do optymalizacji dwóch lub więcej podstron jednej domeny wobec tych samych słów kluczowych. Duplikacja może być jednak jedną z przyczyn kanibalizacji. Więcej na temat kanibalizacji słów kluczowych przeczytasz tutaj.

Jak duplicate content wpływa na pozycjonowanie?

Jeżeli przyjrzymy się bliżej wytycznym Google’a, to zauważymy, że zewnętrzna duplikacja treści nie jest zbyt dobrym rozwiązaniem. Owszem, bezpośrednia kara za zgłoszoną kradzież treści z innych stron jest oczywistością. Okazuje się jednak, że Google może również nałożyć karę na witrynę w sytuacji, gdy uzna, że obecność powielonej treści na różnych stronach ma za cel manipulację wynikami wyszukiwarki. I chociaż taka sytuacja nie zdarza się zbyt często, to być może któraś z przyszłych zmian w algorytmach Google’a znacznie zwiększy częstotliwość nakładania filtrów na strony zawierające zduplikowane teksty.

Natomiast duplikacja wewnętrzna nie powinna mieć miejsca z kilku powodów. Po pierwsze, zwiększa to możliwość kanibalizacji treści, co negatywnie wpływa na wyniki pozycjonowania i widoczność strony www. Po drugie, powielanie stron z taką samą treścią, np. wpisów blogowych, powoduje zużywanie crawl budgetu na różne adresy z tą samą zawartością. W związku z tym może się okazać, że roboty Googla nie dotrą i nie zaindeksują stron, które wnoszą realną wartość dla użytkownika. Po trzecie, duplikacja treści negatywnie wpływa na zachowania użytkowników. Mogą oni odczuć irytację, jeśli kilkukrotnie przeczytają tę samą treść na różnych podstronach. Konsekwencją może być wzrost współczynnika odrzuceń i skrócenie czasu spędzanego na Twojej stronie. Czynniki te również mają wpływ na pozycjonowanie.

Sekcja blog CTA Sekcja blog CTA

Audyt SEO

Sprawdź, czy duplicate content szkodzi Twojej stronie

Jak uniknąć powielania treści?

Jeżeli posiadamy sklep internetowy, to po prostu warto tworzyć unikalne opisy produktów lub usług, a przynajmniej synonimizować te „oficjalne”, np. ze stron producentów. Oczywiście synonimizacja czy przeredagowanie tekstu powinno odbyć się z zachowaniem zasad poprawnej polszczyzny.

Jeżeli umieszczamy na naszej stronie teksty skopiowane z innych witryn – komunikaty prasowe, nowinki branżowe itp. – oznaczmy to w kodzie strony. Służy do tego znacznik <blockquote>. Jeśli natomiast chcemy w podobny sposób oznaczyć źródło danej informacji, na przykład link do źródła cytowanego tekstu, użyjmy atrybutu <cite>. Pamiętajmy przy tym, że roboty Google’a nie odróżniają, który tekst jest wersją oryginalną, a gdzie została opublikowana jego kopia. Teoretycznie może się więc zdarzyć, że nasz oryginalny tekst ostatecznie zostanie uznany za kopię, a ktoś, kto skopiował naszą pracę, osiągnie wyższą pozycję w wyszukiwarce Google.

Aby temu zapobiec, warto co jakiś czas uruchomić narzędzie antyplagiatowe, które samodzielnie wykrywa i analizuje zewnętrzne duplikacje treści.  Można również poszukać ewentualnego plagiatu na własną rękę. Wystarczy w tym celu wkleić w polu wyszukiwarki fragment naszego tekstu – 20 do 30 słów – w cudzysłowie; cudzysłów jest tutaj kluczowy. Następnie wciskamy „enter” i już wiemy, czy ktoś powiela nasze opisy produktów lub jakąkolwiek inną treść, która do nas należy.

Jeżeli uda nam się wykryć tego rodzaju kradzież treści, wówczas kontaktujemy się z właścicielami strony i prosimy o usunięcie spornego tekstu. Jak to nie przyniesie rezultatu, wówczas informujemy Google o powielaniu treści w Internecie bez naszej zgody.

Jak wykryć wewnętrzną duplikację treści?

Do najprostszych sposobów można zaliczyć wykorzystanie dedykowanych narzędzi. Łatwo można wykryć skopiowane treści przy pomocy takich programów jak:

  • Siteliner,
  • Copyscape,
  • Screaming Frog SEO Spider.

W zależności od potrzeb narzędzia występują w darmowych wersjach podstawowych i rozszerzonych wersjach płatnych.

Co zrobić, gdy na stronie występuje duplikacja treści?

Jeśli dana strona ma problem z duplikacją treści w obrębie jednej domeny, należy podjąć konkretne działania. Może to bowiem skutkować wyświetlaniem w wynikach wyszukiwania innej wersji strony niż ta, na której zależy nam najbardziej.

Co w takim wypadku należy zrobić? Powinno się użyć tagu kanonicznego.

Wróćmy do wyżej zaprezentowanego przykładu „https://przykladowadomena.pl„. Jeżeli chcemy, aby to właśnie strona znajdująca się pod tym adresem była indeksowana i uznawana przez algorytmy za najważniejszą, w sekcji <head> pozostałych wersji stron wklejamy kod:

<link rel=”canonical” href=”https://przykladowadomena.pl” />.

Warto jednak pamiętać, że należy bardzo uważać ze stosowaniem tagu „canonical”. Ta zaledwie jedna linijka kodu może dość mocno nadwyrężyć pracę, jaką włożyliśmy w pozycjonowanie swojej witryny. Dlatego, jeżeli nie jesteśmy pewni, czy postępujemy słusznie i nie do końca wiemy, co robimy, warto poprosić specjalistów o pomoc (nasz audyt SEO zawiera dokładne informacje o wdrożeniu tagów kanonicznych na stronie). W przeciwnym wypadku może się okazać, że część naszej witryny w zasadzie zniknie z wyników wyszukiwania.

Duplikacja treści – podsumowanie

Kopiowanie treści na swojej stronie, z punktu widzenia SEO, to praktyka przynosząca negatywne rezultaty. Wiedząc już, czym jest duplicate content, możesz świadomie zarządzać treścią w swoim serwisie. Warto pamiętać również o cyklicznej weryfikacji contentu. Dzięki temu, w razie potrzeby, można szybko zapobiec szkodom, które mogłaby wywołać duplikacja.

Tekst zaktualizowany, w pierwotnej wersji znalazł się na blogu w 2020 roku.

Aleksandra Podżorska
SEO Specialist. W DevaGroup odpowiada za prowadzenie kampanii SEO, przeprowadzanie audytów i optymalizację stron internetowych klientów. Szczególnym zainteresowaniem darzy strategie SXO i rozwój AI w branży SEO. Prywatnie miłośniczka podróży małych i dużych, kultury i języka włoskiego oraz aktywnego stylu życia.

Podobał Ci się artykuł? Wystaw 5!
słabyprzeciętnydobrybardzo dobrywspaniały (11 głosów, średnia: 5,00 / 5)
Loading...
Przewiń do góry