Wayback Machine – udaj się w internetową podróż do przeszłości

Wayback Machine – udaj się w internetową podróż do przeszłości

Wayback Machine -
udaj się w internetową podróż do przeszłości

W internecie nic nie ginie, tym bardziej, jeśli już raz zostało umieszczone w Internecie. Jak jednak wykorzystać dostępne dzięki organizacji Internet Archive cyfrowe archiwum stron www i w czym może nam pomóc ta ogromna wyszukiwarka? Przyjrzyjmy się temu wspólnie.

Czym jest Wayback Machine?

To podróż w czasie, zupełnie darmowa i niezwykle fascynująca. Jak ją odbyć? Wystarczy wejść na stronę https://web.archive.org/ i wyszukać interesujące nas witryny internetowe. Dostęp do nich to swego rodzaju prezent od powstałej w 1996 roku organizacji non-profit o nazwie Internet Archive, która za cel obrała sobie gromadzenie zasobów multimedialnych. Pełne zbiory fundacji to ponad 835 miliardów stron internetowych, 44 miliony książek i publikacji, 15 milionów nagrań audio, prawie 11 miliardów materiałów video, 5 milionów grafik oraz milion wersji wszelkiej maści oprogramowania. W ramach edukacji i szerzenia wiedzy o historii Internetu organizacja udostępnia spory wycinek swych zbiorów każdemu z nas.

Jak działa the Wayback Machine?

Działanie archiwum zmian zachodzących na stronach jest możliwe dzięki pracy robotów indeksujących Google. Narzędzie Wayback Machine gromadzi kopie (snapshots) adresów przeskanowanych przez oprogramowanie Google z różnych dni i godzin. Zasoby są skanowane i indeksowane, a wyniki zapisywane w postaci obszernej biblioteki danych. W efekcie, gdy wpiszemy w Wayback Machine interesującą nas witrynę, ta wyświetli nam oś czasu, zawierającą podział na konkretne lata, miesiące, dni oraz godziny (jeżeli tylko roboty odwiedzały daną stronę kilka razy dziennie). Liczba takich skanów może być różna w zależności od witryny, a całkowita analiza w Wayback Machine trwać do kilkunastu dni. Dla przykładu, gdy wpiszemy w Wayback Machine adres devagroup.pl, uzyskamy następujące dane.

 

W kalendarium u góry znajdziemy wszystkie kopie strony (snapshoty) „ściągnięte” przez roboty Google od momentu jej powstania, zaś poniżej konkretne wyniki (tutaj dla 2016 roku). Niebieskim kolorem zaznaczone zostały wykonane skany, zaś zielonym wszelkie przekierowania (301) do naszej witryny. Niekiedy pojawiają się też dni „czerwone”. To dla nas informacja, że mieliśmy do czynienia z błędami po stronie serwera. Oznaczenia pomarańczowe wskazują natomiast na próby archiwizacji podstron nieistniejących. Co ważne, dane z kalendarza nie odnoszą się do tego, ile razy witryny sieci web ulegały aktualizacji danego dnia, czy miesiąca. Wskazują jedynie na liczbę odwiedzin przez roboty Google w danym przedziale czasu.

Internet Archive – archiwum bez granic?

Przeszukując Wayback Machine, można stracić rachubę czasu. W pewnym momencie tej podróży ku źródłom Internetu musi się jednak pojawić pytanie o jej kres. Jakie więc są możliwości i ograniczenia web Archive org i czy rzeczywiście każdy nasz ślad zamieszczony w sieci można zarchiwizować? Nie do końca. Choć bowiem sami twórcy Internet Archive dumnie podkreślają znaczenie narzędzia dla naszego dziedzictwa kulturowego, a zgromadzone przez nich zbiory często przyrównuje się do Biblioteki Aleksandryjskiej, to wyszukiwarka Wayback też ma pewne blokady nie do przeskoczenia i nie znajdziemy w niej wszystkiego. W Wayback Archive próżno zatem szukać adresów URL niedostępnych publicznie, które wymagają od nas zalogowania oraz wszelkich treści, zablokowanych przez blokady załączone w pliku robots.txt

Internet Archive, czyli internetowy wehikuł czasu

Podsumowując to, co już wiemy, Wayback Machine dla przeciętnego użytkownika sieci, to wspaniała, sentymentalna podróż do przeszłości. Biblioteka Wayback stanowi źródło wszelkich możliwych treści, które od 1996 roku udało się sukcesywnie archiwizować i w efekcie zapisać dla potomnych. To archiwum darmowe i dostępne online. Czy jednak możemy je wykorzystać do czegoś więcej niż spojrzenia w przeszłość? Marketerzy przeglądają the Internet Archive, by lepiej poznać swoich klientów. Zasoby biblioteki Wayback dają im dostęp do wiedzy o tym, jak dana firma się rozwijała i które usługi z biegiem czasu zyskały dla niej największe znaczenie. Dla ekspertów SEO z kolei jest to źródło wiedzy na temat linkowań i przekierowań, ale też praktyczne narzędzie do wykorzystania podczas pozycjonowania.

Biblioteka online dla specjalistów SEO

Web Archiwe Org zawiera grubo ponad 10 miliardów wyników website. Nic więc dziwnego, że jest niezwykle cenne dla pozycjonerów. SEO-wcy mogą wykorzystać narzędzie Web Archive co najmniej na kilka sposobów.

Analiza historii domeny

Budowanie struktury linkowania dla nowego serwisu internetowego to zajęcie żmudne i czasochłonne. Klienci często nie zdają sobie sprawy, jak wielkim ułatwieniem dla pozycjonera może być wgląd w linkowania stosowane w przeszłości. Profil linkowy możemy co prawda podejrzeć np. w Majestic lub Ahrefs. Narzędzia te nie dają nam jednak wglądu we wcześniejsze rozwiązania stosowania na platformie, portalu czy sklepie. Tej cennej wiedzy dostarcza Wayback Machine.

Wgląd w linkowanie

Dzięki Wayback Machine sprawdzimy stare linkowania. To znakomite ułatwienie w budowaniu mapy przekierowań nowych. Niedziałające linki, pojawiające się błędy w serwisie, to wszystko mogło mieć wpływ na stan naszej platformy. Możemy wykluczyć te błędy na przyszłość w myśl zasady lepiej zapobiegać, niż leczyć.

Sekcja blog CTA Sekcja blog CTA

Zleć nam audyt SEO

Wyłap kosztowne błędy na swojej stronie

Łatwa identyfikacja błędów

Wayback pozwala SEO-wcom wychwycić błędy, które doprowadzają do spadków ruchu na naszej stronie. Jeśli takie spadki pojawiają się np. w Google Analytics, możemy prześledzić historię snapshotów stworzonych przez roboty Google tuż przed nimi. W efekcie drogą indukcji wyłapiemy zmiany w serwisie, niedziałające elementy, a nawet zawirusowane podstrony.

Niepoprawne indeksowanie

Wgląd w historię danego serwisu daje nam dostęp do wygodnej do prześledzenia mapy indeksowania. Tutaj nic nie jest „of the record”, zapisują się również zmiany w plikach robots.txt. Dzięki niemu sprawdzimy, kiedy zaczęły się trudności z indeksowaniem i co mogło do nich doprowadzić.

Właściwe wdrożenie kodu Google Analytics

Wayback Machine indeksuje również kod źródłowy stron www, stąd mamy łatwy dostęp do struktury serwisu. Wejście w kod pozwala sprawdzić, czy wdrożenie GA przebiegło poprawnie. Z tego miejsca przeanalizujemy, czy Analytics jest sparowany z każdą z naszych podstron i czy nic nie utrudnia mu zbierania interesujących nas danych. Taka wiedza przydaje się, zwłaszcza kiedy natrafiamy na nieścisłości w statystykach GA.

Content w koronie

Nie od dziś wiemy, że content is a king. Jakościowe treści są nie tylko gwarancją merytoryki, wpływają również na wysokie pozycje organiczne platform. Niekiedy jednak np. przy przenoszeniu czy przebudowie serwisu zdarzają się sytuacje, w których możemy je przypadkowo usunąć. Ratunkiem są właśnie kopie z Wayback. Możemy je tam wyszukiwać i ponownie umieścić w serwisie.

Słowem podsumowania

To oczywiście nie wszystkie możliwości, które daje nam kolos taki, jak Archiwe.org, za to najważniejsze i najwartościowsze z nich. Zachęcamy was z tego miejsca do samodzielnego prześledzenia cyfrowej biblioteki historii internetu i odbycia podróży w czasie, którą oferują. Jeżeli dodatkowo prowadzicie własny biznes, będzie to dla Was okazja do uporządkowania zmian, które wdrożyliście w waszych sklepach, czy serwisach.

Tekst aktualizowany. Pierwsza wersja ukazała się na naszym blogu w listopadzie 2021.

 

Justyna Przygoda
Były pracownik na stanowisku Social Media & Content Specialist. Od 5 lat z pasją i zapałem zajmuję się słowem pisanym, a od 2 mediami społecznościowymi. Doświadczenie w dziennikarstwie pozwoliło mi uwierzyć w moc słów. Działanie w social mediach sprawiło, że stawiam człowieka na początku każdej historii. Prywatnie nieuleczalna miłośniczka planszówek, stand-upów i gór.

Patrycja Kozioł
Marketing Specialist. Przeszła drogę od amatorskiego marketingu eventów do profesjonalnego prowadzenia social mediów. Jej czujne oko wyłapuje wszystkie błędy i niespójności w tekstach i na stronach internetowych. Wolny czas spędza na czytaniu kryminałów, poprawianiu przecinków i zgłębianiu kultur dalekowschodnich.

Podobał Ci się artykuł? Wystaw 5!
słabyprzeciętnydobrybardzo dobrywspaniały (19 głosów, średnia: 5,00 / 5)
Loading...
Przewiń do góry