Google Dance
Unter "Google Dance" versteht man das Verhalten der Suchmaschine Google wärend des Ablaufes eines Index-Updates.
Früher wurde dieses Update einmal pro Monat getätigt. Dabei wurde der vollständige Cache indexierter Seiten zum Stand des letzten Spiderns gespiegelt und auch neu eingegangene Links angezeigt.
Seit Mitte 2003 führte Google aber nunmehr fortlaufende Update-Prozesse ein. Gelegentlich bekommt der Google Index noch immer s. g. Updates, allerdings wirken sich diese nicht mehr so stark auf die Suchergebnisse aus.
Der Google Dance und seine Technik
Der Suchdienst Google zeigt Suchergebnisse von ca. 10.000 Servern , bei denen es sich um einfache Linux-PCs handelt, welche Google in erster Linie aus wirtschaftlichen Gründen einsetzt.
Das Index-Update kann deshalb natürlich nicht auf allen Servern gleichzeitig erfolgen. Der neue Index wird deshalb jeweils in die einzelnen Server eingepflegt.
Google legt bei dieser Technik die Nutzung des Domain Name Systems (DNS) zugrunde.
DNS
Der Google Index ist somit auf viele tausend Server verteilt wobei sich diese Server in derzeit 13 Rechenzentren befinden.
Diese Zentralensind hauptsächtlich in den USA (z.B in Santa Clara, Kalifornien und Herndon, Virginia) sowie in Dublin, Irland ansässig.
Theoretisch wäre es denkbar, dass alle Suchanfragen zentral erfasst und anschließend an die einzelnen Rechenzentralen verteilt werden.
Diese Regelung wäre aber weniger praktikabel. Die einzelnen Zentralen besitzen vielmehr eigene IP-Adressen (numerische Adressen innerhalb des Internets) und den Ablauf, wie auf diese IP´s zugegriffen wird, regelt das Domain Name System (DNS).
Funktion des DNS
Datenübertragungen finden im Internet ausschließlich zwischen IP-Adressen statt. Informationen, welche Domain zu welcher IP-Adresse zugeordnet wird, beinhalten die Name Server (DNS). Gibt ein User eine Domain in seinen Browser ein, ermittelt der lokale Name Server die dazugehörige IP-Adresse, indem er eine Verbindung mit dem jeweilig für die Domain zuständigen Name Server aufnimmt. Diese IP-Adresse wird dann im lokalen Name Server in dessen Cache zwischengespeichert, damit nicht bei jeder Verbindung erneut eine Anfrage über das DNS erfolgen muss.
Für jede Domain wird dabei geregelt, wie lange sie im Cache des betreffenden Name Servers gehalten wird. Dieser Wert ist als Time To Live (TTL) einer Domain bezeichnet. Sobald die TTL abgelaufen ist, muss ein Name Server die IP-Adresse erneut über das DNS beim zuständigen Name Server anfordern. Meistens wird die TTL auf einen oder mehrere Tage festgelegt. Bei der Domain www.google.com ist die Time To Live jedoch mit 5 Minuten deutlich kürzer. Damit können Name Server die IP-Adresse der Domain www.google.com nur fünf Minuten cachen und müssen sie anschließend erneut beim zuständigen Name Server Google's anfordern.
|