Google-Bug

Hihi… ich habe doch tatsächlich einen Bug in der allseits beliebten Suchmaschine Google gefunden. :-)

Normalerweise indiziert Google die besuchten Webseiten nicht nur, sondern erstellt (zumindest von der reinen HTML-Seite) auch eine Kopie in dessen Cache. Auf den Ergebnisseiten erkennt man das an dem “Im Cache”-Link, mit dem man nicht die tatsächliche, sondern die von Google gecachte Seite öffnen kann:

Googlebug
Nun gibt es Webmaster die zwar eine Indizierung, aber kein Caching ihrer Seiten wünschen. Besonders trickreich ist das bei Sites, welche den Webcrawlern zwar alle Inhalte präsentieren (und somit indizieren lassen), von “normalen” Benutzern allerdings eine (oft gebührenpflichtige) Anmeldung erfordern. Damit Google von den erfassten Inhalten dann keine gecachte Version anbietet, wird das Meta-Tag “Robots” auf “nocache” gesetzt.

Ein spontanes Beispiel ist das Forum “Webmaster World”. Gibt man z.B. den Suchbegriff “site:webmasterworld.com noodp” ein, erhält man u.a. folgenden Treffer:

Googlebug
Der Vorschau-Text enthält Fragmente der “richtigen” Webseite, ein Klick auf den Link führt allerdings zur Anmelde-Aufforderung.

Aber: klickt man einfach auf “Diese Seite übersetzen”, erhält man eine relativ gute Übersetzung der Original-Website. Bingo. :-)

Streng genommen handelt es sich hierbei aber nicht wirklich um einen Fehler in Google, da die Übersetzung aller Wahrscheinlichkeit nach nicht auf einer gecachten Kopie, sondern der Original-Seite basiert. Viel mehr wird Google quasi als Proxy verwendet, um auf die ansonsten nicht-öffentlichen Inhalte zugreifen zu können. Vielleicht würde es bei manchen Sites sogar schon reichen, diese mit Opera anzusurfen und die Browser-Kennung auf die eines typischen Google-Bots zu setzen…

Eine Bemerkung zu “Google-Bug”

  1. Alphager

    Sorry für ein viel zu spätes Kommentar, aber für die Google-Übersetzung gibt es noch ein Schmankerl:
    Du kannst in der URL die Sprachen (Von und Nach) einstellen. Bei beiden die Originalsprache eingeben, und schon bekommst du die originalseite.

Einen Kommentar schreiben