Wenn es um Sichtbarkeit von Webseiten, Blogs, etc. geht, ist man schnell bei Google und beim Googlebot. Häufigste Frage: auf welcher Seite im Google Ranking tauchst Du auf.
Um Dir mal einen Einblick zu geben, welche Faktoren hier eine Rolle spielen und was sich genau dahinter verbirgt, haben wir das mal zusammengeschrieben. Wie bei Google üblich, sind nicht alle Details bekannt bzw. werden nicht bekannt gegeben. Jedoch für die Allermeisten bietet der Beitrag sicherlich viel Neues.
Heute beschäftigen wir uns mit dem sogenannten Googlebot und welche bekannten Punkte zu beachten sind. Wir Verfassen aber immer wieder Artikel die sich mit einzelnen Themen rund um SEO befassen. Themen sind z.B. Linkkennzeichnung, Praxistipps und weitereführende Artikel zu Google.
Zum Anfang zwei Begriffsdefinitionen:
Googlebot = ein Webcrawler den Google verwendet um Webseiten zu finden und Informationen über die Seite zu sammeln um den Google Index zu aktualisieren.
Webcrawler = Webcrawler werden manchmal auch als Bots oder Robots bezeichnet und sind lediglich einige Zeilen Sofwarecode, entwickelt mit dem Ziel Informationen zu sammeln und diese an eine zu definierende Zieladresse zu schicken. Dazu ist der Googlebot ständig unterwegs und besucht Milliarden von Webinhalten im gesamten Web und sammelt, aktualisiert Information.
Was genau tut der Googlebot aber nun?
Er besucht Webseiten im Internet und erfasst die Inhalte (Worte, Hashtags, Keywords, etc.), die den Inhalt der Webseite beschreiben. Eine Bewertung der Inhalte nimmt der Googlebot dabei nicht vor.
Außerdem prüft er, ob die Seite über Verlinkungen zu anderen Seiten verfügt und erfasst auch diese Informationen.
Wenn der Bot die Informationen zu einer Seite vollständig erfasst hat, schickt der Bot alle erfassten Informationen an Google und dort wird der Index vervollständigt oder upgedated.
Der Google Index ist das Verzeichnis in dem Webseiten von Google verglichen und geranked werden. Soll eine Webseite bei Google in den Suchergebnissen vorkommen, muss diese für den Googlebot sichtbar sein. Das bedeutet, die entsprechenden Angaben müssen in der Datei robot.txt im Quelltext angegeben sein.
Um ein möglichst optimales Ergebnis im Google Ranking zu erreichen und gegebenenfalls auf der ersten Seite der Suche zu landen, sollten alle Webseiten und Quellen für den Googlebot einsichtig bzw. zugänglich sein.