Przeglądając ostatnio statystyki odwiedzin swojej strony natknąłem się na coś, co mnie zaciekawiło. Moją uwagę zwróciło to, że przy niektórych odsłonach stron system statystyk nie rozpoznał wersji Firefoksa.
Okazało się, że odwiedziło mnie coś, co przedstawia się tak: Mozilla/5.0 Gecko Firefox (dla porównania – najnowsza wersja Firefoksa przedstawia się np. tak: Mozilla/5.0 (X11; U; Linux i686; pl; rv:1.8.1.2) Gecko/20070220 Firefox/2.0.0.2). Zerknięcie na informację, skąd to przyszło, rozwiało wątpliwości: spider5.szukaj.onet.pl. To robot-pająk odwiedzajacy strony internetowe, by można było je wyszukać w wyszukiwarce Onetu.
Na pierwszy rzut oka to nic dziwnego – na podobnej zasadzie niektóre roboty udają Internet Explorera. Zaskakujące jest jednak kilka rzeczy. Po pierwsze – takie udawanie jakiejś przeglądarki jest raczej spotykane w przypadku robotów mniej znanych serwisów. Po drugie – w mojej pamięci wciąż zachowany jest obraz Onetu, jako portalu, który ignoruje użytkowników przeglądarek innych niż produkt Microsoftu. Był to zresztą powód usunięcia wyszukiwarki tego portalu z listy domyślnie instalowanych (wyszukiwarek) w Firefoksie. A tu nagle ich robot mówi przy wejściu na każdą stronę: Jestem Firefox.
Najzabawniejsze jest to, że taki robot nie zindeksuje (chyba, że dodano pewne wyjątki) jednego z serwisów tego portalu: Onet Plejer. Powód? Użytkownikom przeglądarek innych niż MSIE wyświetli się komunikat (pomnińmy, to, że trzeba mieć Windows):
W tej przeglądarce nie można poprawnie korzystać z serwisu Onet Plejer.
Uruchom Internet Explorer w wersji 6.0 lub wyższej i ponownie wejdź na ten serwis.
I własnie robot Onetu dostał kosza 😉
2 odpowiedzi na “Robot Onetu udaje Firefoksa”
No wiesz, to nie problem ustawić tak, aby wejścia z określonej puli adresów były identyfikowane w inny sposób… 🙂 A co za tym idzie – przedstawić inną treść.
MySz: To właśnie miałem na myśli pisząc o „dodaniu pewnych wyjątków”. Pytanie, czy o tym pamiętali 🙂