Vorhin hatte ich in einem auf phpBB3 basierenden Forum eine höchst interessante Besucherkonstellation. Die Liste der gerade online befindlichen Besucher sieht (für Administratoren) bei dieser Boardsoftware so aus:
[Blockierte Grafik: http://downloads.pigsgrame.de/bilder/bot-forum-statistik.png]
phpBB3 kennt standardmäßig die User-Agents und IP-Adressen der Crawler einiger großer Suchportale und kennzeichnet als Bots erkannte "Gäste" entsprechend. Auf den ersten Blick scheint es nun so, dass 4 menschliche Benutzer online sind, davon ein registrierter (ich), von denen 2 den Firefox und 2 den IE 7 benutzen. Eine realistische Situation, die die tatsächlichen Marktanteile annähernd widerspiegelt.
Spätestens auf den zweiten Blick fällt dann aber auf, dass die beiden IE-Gäste eine dem MSN-Bot ziemlich ähnliche IP-Adresse haben - und tatsächlich, eine whois-Abfrage in der RIPE-Datenbank zeigt: Beide IPs gehören zum Netzwerk der "Microsoft Corp.". Der MSN-Bot spidert das Forum also von drei Servern gleichzeitig, aber nur einer identifiziert sich eindeutig als MSN-Bot; die beiden anderen geben zunächst einmal vor, "ganz normale" menschliche Nutzer zu sein.
Zugegeben: Es ist für jeden Crawler vorteilhaft, wenn er nicht gleich als solcher erkannt wird. Eine Bekannte, für den Surfer aber wertlose Methode des "Search Engine Optimizing" ist schließlich, Suchmaschinen eine andere Seite zu präsentieren als regulären Browsern. Man könnte also zunächst einmal annehmen, dass Microsoft so vorgeht, um zu vergleichen, ob menschlichen Surfern die gleichen Inhalte ausgeliefert werden.
Interessant ist nur, dass diese Scheinmenschen nicht etwa verschiedene Bowser und Betriebssysteme benutzen, sondern beide "zufällig" ausgerechnet den IE7, den trotz neuerlicher WGA-Befreiung keiner so recht haben will, und Windows Vista, ein Betriebssystem, das bisher ähnlich kolossal gescheitert ist wie zuletzt Windows ME.
Ich will daraus jetzt keine Verschwörungstheorie konstruieren, aber doch einmal auf diesen interessanten Fakt hinweisen: Microsoft manipuliert, ich vermute: bewusst, Besucherstatistiken und erzeugt damit Marktanteilquoten, die schlichtweg nicht der Realität entsprechen. Natürlich kann man die IPs des MSN-Bots komplett von einer Statistik ausnehmen, aber welche Statistiksoftware tut dies schon? Und welcher Statistiksoftwarenutzer hat Lust, die vorgefertigte Konfiguration anzupassen?
Es ist eindeutig: Die Marktanteile von IE7 und Windows Vista werden infolge solcher Tricks von vielen Seiten deutlich höher beziffert, als sie sind - und der MSN-Bot besucht einmal indizierte Seiten häufig neu. Die oben gezeigte Datenbasis ist zugegebenermaßen eher klein, aber doch erwähne ich: Der eine eingeloggte Benutzer bin wie gesagt ich und die IP des ersten Gastes löst auf einen Homeuser-Provider auf. Mit ziemlicher Sicherheit verwenden im Moment dieses Schnappschusses also 100% der menschlichen Besucher den Firefox - auch wenn es zunächst einen anderen Anschein hat.