| Prev | Up | Next |
de.comm.infosystems.suchmaschinen-FAQ —> Authoring —> Indizierung
Log-Dateien sind das Zugriffsprotokoll deines Webservers. Sie bestehen gewöhnlich aus ganz vielen Zeilen, von denen jede genau einen Zugriff wiedergibt. Eine solche Zeile könnte beispielsweise so aussehen:
128.210.177.132 - - [08/Jul/2004:22:20:53 -0700] "GET /main/test.html HTTP/1.1" 200 3215 "http://www.google.de/search?hl=de&ie=UTF-8&q=suchmaschinen+faq&btnG=Google-Suche&meta=" "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.7) Gecko/20040626 Firefox/0.9.1"
Das erste Feld (hier: 128.210.177.132) gibt die IP-Adresse an. Du kannst herausfinden, wem diese Adresse gehört, indem du unter Unix "whois IP-Adresse" eingibst, oder indem du übers Web eine Whois-Abfrage bei RIPE startest.
Das zweite Feld und das dritte Feld (hier jeweils nur ein "-") geben Auskunft über den Benutzernamen. Dieser Besucher hat, da es sich um eine öffentlich zugängliche Seite handelt, ohne sich zu authentifizieren auf die Seite zugegriffen.
Das vierte Feld (in eckigen Klammern) gibt den Zeitpunkt an, zu dem der Zugriff erfolgte.
Das fünfte Feld (in Anführungszeichen) gibt den HTTP-Request-String an. Hier wurde die Seite /main/test.html abgeholt. Lautet der Hostname also www.example.org, so ist die heruntergeladene Seite unter dem URL http://www.example.org/main/test.html verfügbar.
Das sechste Feld gibt den HTTP-Status-Code an, hier 200 OK.
Im siebten Feld steht die Anzahl der übertragenen Bytes, hier also 3215.
Das achte Feld, der sog. Referrer, verrät dir, welche Seite der Benutzer zuletzt besucht hat. In diesem Fall ist das eine Google-Ergebnisseite, nämlich http://www.google.de/search?hl=de&ie=UTF-8&q=suchmaschinen+faq&btnG=Google-Suche&meta=, aus deren URL hervorgeht, dass der Besucher nach »suchmaschinen faq« gesucht hat. Durch Auswertung der Referrer-Felder kannst du herausfinden, unter welchen Suchbegriffen du am häufigsten gefunden wirst, und von welchen Webseiten oder Suchmaschinen die meisten Benutzer kommen.
Das neunte Feld ist der User-Agent-String, der Auskunft über den verwendeten Browser gibt. Robots kann man neben der IP-Adresse auch am User-Agent-String erkennen. Googles User-Agent heißt zum Beispiel "Googlebot/2.1 (+http://www.google.com/bot.html)". Wenn du herausfinden möchtest, ob der Robot einer Suchmaschine bereits eine deiner Seiten heruntergeladen hat, musst du also nur deine Log-Datei(en) nach dem Namen des zugehörigen Crawlers durchsuchen (normalerweise ähnlich dem Suchmaschinennamen), für Google also "Googlebot".
Es gibt viele Programme zur Auswertung von Log-Dateien. Die populärsten sind Webalizer, Analog und AWStats. Weitere Programme findet man auch in der dmoz-Kategorie Log Analysis.
Falls dein Provider dir keine Log-Dateien zur Verfügung stellt, wechsel den Provider. (Oder wechsel den Tarif, falls dein Provider unter einem anderen Tarif Log-Dateien anbietet.) Log-Dateien sind ein essentiell wichtiges Werkzeug bei der Ursachenfindung von Suchmaschinenproblemen und bei der Optimierung der Webseiten.
| Prev | Up | Next |
Maintainer: Felix Wiemann <Felix.Wiemann@ososo.de>