• Praxistipp: rel=amphtml und rel=canonical?

    Immer wieder kommen werden Fragen nach Link Bezeichnungen aufgeworfen. Die geläufigste Link Bezeichnung ist sicherlich rel=nofollow über die wir bereits früher in einem kurzen Praxistipp geschrieben haben.

    Die Link Kennzeichnung als rel=nofollow ist also in allen unseren vergebenen Aufträgen zwingend gefordert. Es gibt aber weitere Bezeichnungen von denen wir Euch heute 2 interessante vorstellen möchten.

    Was bedeutet die Link Bezeichnung rel=amphtml und wofür wird es verwendet?

    Am einfachsten ist es wie immer an einem praktischen Beispiel zu erklären:  <link rel=“amphtml“ href=“https://www.t5content.de/amp-page.html”>

    diese Linkbezeichnung sagt folgendes aus. Es gibt eine AMP Version der hinterlegten Web Seite (im Beispiel „https://www.t5content.de/). Unter dem angegebenen Link ist die AMP Seite für Google auffindbar.

    AMP?

    AMP ist die Abkürzung für „accelerated mobile pages“ und zeigt Suchmaschinen wie Google an, dass eine Web Seite in einer für Mobilgeräte optimierten Spezifikation vorliegt. Die Beschreibung geht dabei auf ein Open Source Projekt zurück. Das Kernziel ist mobile Web Seiten, die in der Performance und Darstellung optimiert sind, auf mobilen Geräten anzuzeigen anstatt die nicht optimierten komplett zu laden. Die speziellen AMP Seiten werden auch vom Googlebot indiziert und schließlich im Google Index abgelegt.

    Was geschieht nun? Ruft man von einem mobilen Endgerät eine Web Seite auf die mit rel=amphtml versehen ist, wird das aufrufende mobile Endgerät auf die AMP Seite geleitet.

    rel=canonical: wieder zurück

    Da nun ja 2 Web Seiten des gleichen Inhaltes vorliegen müssen auch die AMP Seiten mit entsprechenden „Wegweisern“ versehen werden, falls ein Nutzer nicht mit einem mobilen Endgerät zugreift. Die rel=canonical dient unter anderem genau dazu: AMP Seiten bzw. deren mobil optimierten Code können mit dem Verweis auf die ursprüngliche Web Seite verweisen, d.h. Anfragen werden zur entsprechenden Web Seite geleitet.In unserem Beispiel würden wir in den Code der Seite https://www.t5content.de/amp-page.html über die im Header eingebaute Linkkennzeichnung <link rel=canonical href=https://www.t5content.de> auf die „nicht AMP“ Version verweisen.

    … und einiges mehr

    Darüber hinaus lässt rel=canonical auch in anderen Szenarien einsetzen, z.B. um trotz unterschiedlicher URL Variationen auf eine richtige Seite zu verweisen. Auch hierzu ein kurzes Beispiel. Unsere Homepage/ Anwendung unter https://www.t5content.de ist theoretisch auch unter verschiedenen anderen Schreibweisen zu erreichen. Anmerkung: wir haben nicht alle tatsächlich belegt. Ob über http://www.t5ontent.de, https://www.t5content.de/index.html, https://t5content.de und viele mehr wäre unsere Seite zu erreichen. Was bedeutet das? Verlinken andere Nutzer zu unserer Seite, können Sie theoretisch jeder einen anderen Link verwenden. Dann hätten wir auf jeder Seite aber jeweils nur einen Link und würden uns in der Relevanz selbst unwichtiger darstellen als notwendig. Durch den Einsatz von rel=canonical im Header der „Unterseiten“ kann ich genau diesen Effekt umgehen, ebenso einsetzbar bei dynamischen URLs in denen z.B. am Ende sich eine Farbwahl einfügt um die passende Seite anzuzeigen.

    und dynamische Links?

    Setze ich bei dynamischen URLs rel=canonical ein, ist trotz der Erweiterung der URL der Inhalt der Seite aus Sicht der Search Engines immer gleich, d.h. die Relevanz der Hauptseite steigt.   Zusammenfassend kann man fest stellen: Die korrekte Kennzeichnung von Links kann für die Sichtweise von Suchmaschinen einen großen Unterschied machen hinsichtlich der Bewertung z.B. zur Relevanz auf Grund der Beurteilung der Verlinkung.

  • Praxistipp: Kennzeichnung von Sponsored Posts – Was bedeutet eigentlich die von t5 content geforderte Linkkennzeichnung „rel=nofollow“?

    Jeder unserer Aufträge verlangt die Kennzeichnung der Beiträge, völlig egal ob es sich dabei um einen Blogpost oder ein Video handelt. Die Hintergründe sind dabei vielfältig und wir wissen auch, dass immer wieder Fragen aufkommen warum das so ist. Heute möchten wir, in Ergänzung zu unseren bisherigen Posts, zu diesem Thema noch einmal etwas tiefer in die Bedeutung von der immer für Links in Beiträgen geforderten Kennzeichnung „rel=nofollow“ und die Bedeutung eingehen.

    Was bedeutet eigentlich rel=nofollow?
    • Einen Link auf rel=nofollow zu setzen, bedeutet das eine Suchmaschine dem Link nicht folgen soll
    • Es zeigt auf, dass der Link keine zu verfolgende Beziehung mit der Zielseite hat, z.B. im Sinn das der Content von 3. stammt oder Werbung beinhaltet
    • Die Bezeichnung wird auch bei kommerziellen, sponsored posts verwendet – hierzu besteht in Deutschland sogar eine gesetzliche Kennzeichnungspflicht
    • rel (von Relationship) bezeichnet dabei die Beziehung zur Zielseite

    Einfach beispielhafte Verwendung im html code:

    <a href=“Beispiel.de“ rel=“nofollow“>link text</a>

    Das Beispiel bedeutet folgendes:

    • Hier ist ein Link zur Webseite Beispiel.de
    • Wenn du eine Suchmaschine bist, bewerte den Link nicht hinsichtlich meiner Linkpopularität, da ich nicht der Urheber der Zielseite bin.
    Wo wird der Code eingesetzt?

    Da rel=nofollow eine linkspezifische Anweisung ist, steht die Anweisung im HTML Code des jeweiligen Link.

    Vor der Einführung des Attributs rel=nofollow, konnten nur generisch alle Links einer Webseite als follow oder nofollow gekennzeichnet werden. Mit rel=nofollow kann jeder einzelne Link einer Webseite gekennzeichnet werden.

    Ziel der Verwendung

    Der Hauptgrund für die Verwendung der Kennzeichnung von Links als rel=nofollow ist der Versuch das SPAM Aufkommen zu kontrollieren und bezahlte Links zu kennzeichnen.

    • 2004: Suchmaschienen führen das Attribut zur SPAM Kennzeichnung ein
    • 2005: Empfehlung von Google bezahlte Links entsprechend zu kennzeichnen
    • 2016: Fester Bestandteil der Google Webmaster Guidelines

    In den meisten Fällen wir die Kennzeichnung aber eingesetzt, um möglichen Abwertungen durch die Suchmaschinen zu entgehen.

    Kennzeichnung Sponsored Posts

    Wann sollte rel=nofollow auf alle Fälle zur Link Kennzeichnung genutzt werden?

    Es gibt 4 Hauptszenarien in denen es sich absolut empfiehlt die Links als rel=nofollow zu setzen.

    1. Wenn der Link auf nicht vertrauenswürdigen Content verweist
    2. Bei bezahlten Links
    3. Zur Festlegung wie Suchmaschinen Bots die die Seite durchsuchen
    4. Um sich vor Abwertungen durch Google, etc. zu schützen
    1.Nicht vertrauenswürdiger Content

    Es gibt viele Situationen, bei denen man nicht die volle Kontrolle über die Veröffentlichungen auf der eigenen Seite hat, wie zum Beispiel bei:

    • Blog Kommentaren
    • Diskussionen im Forum
    • Social Media Widgets

    In den aufgeführten Szenarien ist es mehr als empfehlenswert sicherzustellen, dass die Links alle mit rel=nofollow gekennzeichnet sind. Wer die Links nicht entsprechend kennzeichnet, spricht im Prinzip eine Einladung an Spamer aus und riskiert damit das mühsam erarbeitete Suchmaschinen-Ranking.

    2. Bezahlte Links

    Google ist mittlerweile dazu übergegangen Seiten abzustufen, die auf Bezahllinks verweisen und diese nicht als rel=nofollow kennzeichnen.

    Wenn du die folgenden Arten an Links auf deiner Seite hast, solltest du diese auf alle Fälle als rel=nofollow kennzeichnen.

    • Bezahlte Links
    • Affiliate Links
    • Anzeigen im Allgemeinen
    • Links die auf Pressemitteilungen auf anderen Seiten verweisen oder auf Texte die in ihrer Aufmachung diesen ähnlich sind

    Hierzu gibt es in den Google Webmaster Guidelines ausführlichere Infos.

    3. Vorgaben / Priorisierung wie Suchmaschinen die Webseiten durchsuchen

    Jeder Suchmaschinen Bot (auch der Googlebot) interagiert mit deiner Webseite – durch die Verwendung von rel=nofollow Links kann man diese Arbeit priorisieren.

    Es gibt Szenarien in denen es Beschränkungen gibt, wie viele Webseiten ein Crawler (Bot) aktiv durchsucht oder welche in denen es Sinn macht den Crawler direkt auf die „wichtigen“ Seiten zu lenken.

    Ein sehr stark vereinfachtes Beispiel zur Erklärung:

    Deine Webseite hat 100 Seiten, aber 90 davon sind für das Google Ranking uninteressant, da es sich um (für Google Inhaltsleere) Seiten wie Log In, Suchergebnisseiten, etc. handelt. In diesem Fall möchtest du auf alle Fälle, dass der Bot die übrigen 10 Seiten crawled und die „wichtigen“ Informationen erfasst.

    Wenn du nun die Links zu den 90 uninteressanten Seiten als rel=nofollow kennzeichnest, dann wird der Bot diese nicht durchsuchen und sich auf die verblieben 10 konzentrieren. Das priorisiert für die Bots diese 10 Seiten und damit den „wichtigen“ Content darauf!

    Das Szenario ist in der Tat ein bisschen weit hergeholt und spielt häufig keine große Rolle, es kann aber Umstände geben, gerade mit Bots die nicht so gut bekannt sind wie der von Google, in dem das durchaus eine Rolle spielen kann.

    4. Schutz vor Abwertung in den Suchmaschinenergebnissen

    Wahrscheinlich ist für viele der Hauptgrund rel=nofollow zu nutzen, um sich vor möglichen Abwertungen in den Suchergebnissen zu schützen. Dabei gibt es eine Reihe von Fällen wo diese Abhängigkeit direkt besteht, z.B. um einige (nicht alle) zu nennen in folgenden Fällen:

    • Bezahlte Links werde nicht mit rel=nofollow gekennzeichnet? – Das Ranking deiner Seite wird durch Google heruntergesetzt.
    • Nicht Kennzeichnung von fragwürdigen Links mit rel=nofollow? – Das Ranking deiner Seite könnte durch Google heruntergesetzt werden.
    • Verlinkung zu Pressemitteilungen werden nicht mit rel=nofollow gekennzeichnet? – Das Ranking deiner Seite könnte durch Google heruntergesetzt werden.

    Zusammenfassend kann man sagen, dass rel=nofollow ein Spamschutz ist – funktional. In der menschlichen Wahrnehmung ist es aber auch ein Schutz vor Herabstufung in Suchmaschinenergebnissen. Das führt dazu, dass es im Zweifel – und in Deutschland in allen sponsored posts, etc. – immer das richtige ist, den Link als rel=nofollow zu setzen. Lieber einen Link zu viel auf nofollow setzen, als ein unnötiges Risiko einzugehen.

  • Das Mysterium Googlebot – zu klärende Fragen!

    Der Googlebot ist der Weg wie Google seinen Index pflegt. Es ist daher wichtig, dass ich mir als Webmaster einer Seite folgende Fragen stelle und beantworte:

    Kann der Googlebot:

    1. alle meine Webseiten erfassen?
    2. auf meinen kompletten Content und die Links zugreifen?
    3. auch alle meine Seiteninhalte erkennen?

    Es lohnt sich das ein bisschen genauer unter die Lupe zu nehmen:

    1. Kann der Googlebot alle meine Webseiten erfassen?

    Um eine Vorstellung zu bekommen was Google von deiner Webseite sieht und erfasst genügt eine einfache Google Suche:

    Googlebot

    Durch das voranstellen von „site:“ vor deiner Domain, stößt du die Suche nach den Inhalten an, welche Google von deiner Domain indiziert hat. Optimaler Weise enthält die Anfrage kein Leerzeichen zwischen „site:“ und deiner Domain.

    Das angezeigte Ergebnis ist das was Google von deiner Seite erfasst. Ist es weniger als erwartet solltest du überprüfen, ob du z.B. den Googlebot in robot.txt (dazu kommen wir im 2. Teil im Detail) blockst und ob Google tatsächlich Zugriff auf deine Ressourcen hat.

    2. Kann ER auf allen meinen kompletten Content und die Links zugreifen?

    Der nächste Schritt ist es sicherzustellen, dass Google deine Inhalte und Links korrekt erfassen kann. Unterliegt bitte nicht dem fehlglauben, dass nur weil der Googlebot deine Seite erfassen kann, Google tatsächlich das optimale Bild von deiner Seite hat.

    Die Vorgehensweise des Googlebots ist dabei die, dass nicht die ganze Webseite im Ganzen erfasst wird, sondern nur die einzelnen Inhalte der Seite, wie z.B den HTML und CSS Code. Wenn nun einzelne Inhalte nicht zugänglich sind, werden diese nicht erfasst. D.h. da er Webseiten nicht wie ein Mensch sieht, kann er z.B. keine Bilder erkennen sondern nur den Code, der das Bild beschreibt. Wenn z.B. der Code des Bildes für den Googlebot nicht zugänglich ist, erhält Google kein vollständiges Bild von deiner Webseite. Die Informationen werden also auch nicht im Index von Google erscheinen.

    Nun gibt es viele verschiedene Gründe, warum der Googlebot bestimmte Webseiten Inhalte nicht indexieren kann. Hier einige Beispiele von häufigen Gründen:

    • Robots.txt verweigert Zugang zu bestimmten Inhalten
    • Seitenlinks sind nicht erreichbar oder fehlerhaft
    • Wenn z.B. zu viele Flash-Komponenten (oder andere Technologien) eingesetzt werden, mit denen der Googlebot Probleme hat
    • Schlechte Qualität des HTML Code oder Fehler im Code

    Am einfachsten lassen sich die Punkte im Google Webmaster Tool überprüfen, es gibt aber auch andere Tools die das prüfen können.

    3. Kann ER auch alle meine Seiteninhalte erkennen?

    Solltest Du CSS oder JavaScript auf deiner Seite verwenden die durch deine robot.txt File blockiert werden, kann das bei Google „Verwirrungen“ hinsichtlich des Inhalts deiner Seite hervorrufen. Die „Verwirrungen“ können dabei sehr viel größer sein als z.B. nur ein Bild nicht mit zu indizieren. Im schlimmsten Fall kann es dazu führen, dass deine Webseite mit falschen Angaben indiziert wird oder das bestimmte Möglichkeiten, wie z.B. dass eine für Mobile Device optimierte Seite, nicht von Google wahrgenommen werden kann.

    Nutzt Du z.B. CSS oder JavaScript zur Festlegung, von welchem Device aus die Seite betrachtet wird und der CSS oder JavaScript Code ist für den er nicht zugänglich, kann es sein, dass der Googlebot die Inhalte deiner Seite erfassen, aber nicht feststellen kann, dass die Seite auch für mobile Device optimiert dargestellt werden kann. Auch das lässt sich mit einem einfach Tool wie z.B. dem kostenlosen Google Guideline Tool überprüfen.