Milena Majchrzak pracę w branży SEO rozpoczęła 13 lat temu. Od 20 lat tworzy strony i platformy internetowe, najpierw hobbystycznie, a następnie zawodowo. Miała okazję i przyjemność występować na wielu scenach związanych z marketingiem internetowym. Szkoliła marketerów zarówno z obsługi narzędzia, jak i podstaw optymalizacji stron czy tworzenia treści. Niezachwianie wierzy w data-driven i content marketing. Wspiera zespół SEMSTORM w różnych przedsięwzięciach, od rozwoju produktu, przez działania operacyjne, aż do tworzenia treści na firmowy blog. Jej wystąpienie podczas semKRK#18 zajęło trzecie miejsce w ankietach po konferencji. Sprawdźcie krótki wywiad z prelegentką w którym odpowiada na pytania zadane przez uczestników semKRK#18!
Cześć Milena! Czy badania były powtarzane w jakiś miejscach ?
Jeśli chodzi o moje badanie, to zakończyłam zbieranie danych 31 lipca 2021, a formułowanie wniosków przed 18 edycją wydarzenia semKRK. Nie starczyło mi czasu na powtórzenie równie rozległej analizy na innych danych.
Jednak w 2020 roku sprawdzałam podobną zależność. Wówczas przyglądałam się pozycji i długości tekstu wyrażonej w znakach ze spacjami. Wyniki wyszły bardzo zbliżone. Korelacja między liczbą znaków a pozycją wyniosła -0,02, a więc także wskazywała na brak związku między tymi dwiema zmiennymi.
Również w 2020 roku przeanalizowałam inne badania, wykonywane przez firmy trzecie. Badanie z 2020 roku, przeprowadzone przez Backlink.io[1] nie podawało w ogóle wskaźnika korelacji. Badanie z 2017 roku od Ahrefs[2] miało współczynnik korelacji na poziomie 0,08.
Przypominam, że wskaźnik korelacji (liniowy, wykorzystany we wszystkich tych badaniach, poza Backlink.io 2020) mieści się w przedziale od -1 do 1. Gdy jest większy od 0,3 bądź mniejszy od -0,3 – uznajemy, że zależność istnieje. Niektórzy badacze skłaniają się nawet do ustawienia tych wartości na poziomie 0,5 i -0,5 lub wyżej. Wszystkie przytoczone badania wskazują więc na brak zależności między długością tekstu, a jego pozycją.

Chcesz zobaczyć wystąpienia z semKRK#18?
Czy w liczbie słów brałas pod uwagę nagłówek i stopkę? Czy wyłącznie sekcje contentową?
Brałam pod uwagę nagłówek i stopkę, bo te elementy wpływają (choć w nieco mniejszym stopniu niż główna treść) na SEO i osiągane pozycje. Takie podejście dało mi też możliwość porównania wyników z poprzednim badaniem, które prowadziłam w pierwszej połowie 2020 roku (choć na mniejszej próbce danych). Wtedy także wyszło mi jednoznacznie, że zależność między długością tekstu a pozycją nie istnieje.
Czy oszacowałaś dominantę liczby wyrazów na danej pozycji lub w Top 5?
Przygotowując się do wystąpienia, nie liczyłam dominanty. Przyznam szczerze, że wybrałam wartości średnie, aby stworzyć iluzję potwierdzenia teorii „im dłuższy tekst, tym wyższa pozycja”. Postawiłam na średnią, bo mam wrażenie, że łatwiej nam ją intuicyjnie zrozumieć i zinterpretować.
Dominanta zdecydowanie nie była moją „miarą pierwszego wyboru”. Obawiałam się, że najczęściej będzie się powtarzać nie faktycznie najliczniej występująca długość treści, a strona, która jest widoczna na najwięcej słów kluczowych. Obawa była nieuzasadniona, bo odnotowałam względnie niewiele zduplikowanych stron.
Przygotowałam zestawienie wszystkich wartości miar centralnych w tabeli poniżej.
Pozycja | Średnia | Dominanta (ile razy) | Mediana |
1 | 1 876 | 1 743 (28) | 1 500 |
2 | 1 863 | 143 (26) | 1 461 |
3 | 1 862 | 143 (21) | 1 458 |
4 | 1 808 | 317 (21) | 1 455 |
5 | 1 803 | 317 (28) | 1 435 |
Dla TOP5, traktowanego jako jednorodny zbiór, dominanta wynosi 317 słów i naliczyłam 71 stron mających właśnie tyle wyrazów. Dodam jeszcze, że tylko 5 adresów się zduplikowało.
Ogólnie w takim badaniu trzeba jednak pamiętać o jego specyfice i ograniczeniach. Np. dane zbierane były przez 9 miesięcy, od listopada 2020 do lipca 2021. W takim czasie musiała nastąpić rotacja na pozycjach. Weryfikując dane, trafiałam na przypadki, gdy analiza przeprowadzona w grudniu dawała inne pozycje niż analiza na to samo słowo przeprowadzona w kwietniu. W badanym przedziale czasu zmieniała się też treść na stronach, na niektórych bardzo dynamicznie. Żeby nie usuwać tych różnic z pola widzenia nie deduplikowałam danych w badaniu (ograniczyłam się tylko do ich oczyszczenia i weryfikacji).
ps. Mediana, podobnie jak średnia, także wykazuje tendencję malejącą 😉
Czy w Twoim badaniu była granica słów po przekroczeniu której pozycje były niższe?
Nie zauważyłam jej podczas badania, natomiast muszę dodać dwa komentarze:
a) Możliwe, że przyczyną jest analizowanie przeze mnie TOP20 wyników. Być może, gdybym sięgnęła głębiej, np. po TOP50 czy nawet TOP100 wnioski byłyby zupełnie inne. Najdłuższy badany przeze mnie tekst miał 79 549 wyrazów, ale może gdzieś w odmętach internetu, poza TOP100, istnieją strony-behemoty liczące kilkaset tysięcy słów.
b) Moje doświadczenie jednak mi podpowiada, że nie ma tej zależności dla „zwykłych”, „typowych” tekstów.
Sięgnęłam jeszcze raz po dane, żeby sprawdzić 1000 najdłuższych treści.
– pozycja 1: 65 stron
– pozycja 2: 53 strony
– pozycja 3: 77 stron
– pozycja 4: 61 stron
– pozycja 5: 67 stron
– pozycja 6: 75 stron
– pozycja 7: 57 stron
– pozycja 8: 40 stron
– pozycja 9: 50 stron
– pozycja 10: 48 stron
– pozycja 11: 52 strony
– pozycja 12: 50 stron
– pozycja 13: 40 stron
– pozycja 14: 37 stron
– pozycja 15: 44 strony
– pozycja 16: 31 stron
– pozycja 17: 38 stron
– pozycja 18: 55 stron
– pozycja 19: 43 strony
– pozycja 20: 17 stron
Na wykresie wygląda to następująco:
Widać nawet pewną tendencję malejącą. Więcej długich stron zajmuje wyższe, a nie niższe pozycje. Jednak musimy wejść głębiej. Np. dla pozycji 1-3 mało która ze stron nie ma nagłówków pierwszego rzędu (H1), podczas gdy dla pozycji 15+ jest to częste. Także trudno formułować wnioski bazując wyłącznie na długości.
Ile znaków ma 1000 wyrazów w tym badaniu?
Wyliczając na podstawie przeciętnej długości wyrazu, to 6 965 znaków bez spacji + 999 spacji, co daje wynik w pobliżu 8 000 znaków ze spacjami.

Prezentacja Mileny z semKRK#18 już dostępna!
[1] https://backlinko.com/search-engine-ranking, https://backlinko.com/app/uploads/2020/03/search-engine-ranking-study-methods.pdf [dostęp 2021.09.20]
[2] https://www.seoblog.com/long-form-content/ [dostęp 2021.09.20]