Poniższy tekst jest tłumaczeniem (za zgodą 😉 ) wpisu na blogu Johna Chow autora, który chciał pozostać anonimowy. Na końcu mój komentarz.
____
Wszyscy chyba słyszeliśmy mity i przypowieści związane z faktem, że googiel potrafi rozpoznawać layout strony, wyłapywać zwielokrotnioną treść (duplicate content), dokładnie ustalać jakość linków, itp. Nie oznacza to, że googiela nie można oszukać.
Mark Moore, właściciel MetalBuildingDepot.com zamierzał wypozycjonować swój serwis na frazę “metal buildings” w googielu oraz być wysoko na różne inne frazy związane z daną branżą, jak “steel buildings”, “metal garages”, itd. Co więc Mark Moore zrobił aby to osiągnąć? Postawił on (lub wynajął kogoś) szacunkowo około 6000 stron na różnych domenach z identycznym wyglądem i niemalże dokładnie taką samą treścią!
W jaki sposób doszliśmy do tych 6000 domen? Wykonując proste zapytanie w Yahoo i sprawdzając ile z pierwszego 1000 wyników jest tego typu stronami. W pierwszym 1000 było ich 642. Strona ma około 9600 linków, więc można spokojnie przyjąć założenie, że 6000 z nich jest tego typu stronami.
Dlaczego wychwalany doskonały algorytm googiela nie wyłapał aż tak wielkiego spamowania swoich zbiorów? Nie mam pojęcia. Chociaż mimo, że googiel nie zareagował wcześniej, jestem pewien, że wkrótce tak się stanie.
Spamowana strona https://www.metalbuildingdepot.com aktualnie okupuje pozycję numer jeden na frazę “metal buildings” i posiada przyzwoite pozycje na wiele innych słów lub fraz. Kilka przykładów “spamerskich” stron:
www.metalbuildingdepot.net
www.steelbuildingdepot.net
www.garagedoorkits.com
www.steelbuildingdepot.org
www.indianasteelbuilding.com
www.south-carolina-steel-buildings.com
www.south-carolina-metal-buildings.com
www.metal-building-solution.com
Reszta listy w oryginalnym wpisie na blogu Johna Chow.
____
Mój komentarz.
Przede wszystkim powyższy artykuł jest w tonie potępiającym taką praktykę… Nie będę tego komentował.
Dalej, w Polsce tego typu konstrukcje rzadko kiedy przekraczają 100 stron, tu mamy do czynienia ze skalą prawdziwie masową! Ciekawe, kiedy również dojdziemy do tak hurtowych ilości…
Praktycznie całe to “imperium” (lub prawie całe, sprawdzałem tylko pobieżnie) stoi na zaledwie trzech IP; konkretnie główne domeny stroją na 68.178.146.155 i 68.178.146.156, natomiast podstrony głównego serwisu na 12.193.186.132. Tym niemniej podany przykład znacząco podważa teorie, iż linkowanie z tego samego IP (czy też ogólniej różnych IP z tej samej klasy C) jest praktycznie niewiele znaczące.
Ostatnia sprawa to kary za duplicate content – również tu nasuwają się spore wątpliwości co do ich istnienia… Wprawdzie poszczególne domeny rzeczywiście nieco się różnią jedną częścią tekstu (to znaczy prawdopodobnie zostały wygenerowane automatycznie z pomocą przyzwoitego słownika z synonimami), ale np. layout jest ten sam, każda domena “bliźniacza” ma tylko stronę główną.
Wątpliwości się mnożą, nam pozostaje tylko obserwować, czy i jak szybko zareaguje googiel. Obserwować i wyciągać wnioski…