htaccess. zum Verhindern von Duplicate Content

Den meisten Neueinsteigern im Suchmaschinenoptimierungs-Geschäft ist es schon passiert. Deshalb schreib ich hier nochmal eine der wichtigsten Handlungen zu Beginn eines Webseitenaufbaus. Sie müssen als aller erstes dafür sorgen, dass Ihre Internet Seite nicht durch 2 Domains aufgerufen werden kann.

Wie kommt es zu 2 Domains?

Wie jedermann weiß, können Webseiten mit www. oder ohne www. gleichermaßen aufgerufen werden. Natürlich kommt bei beiden Varianten für den Besucher am Ende das selbe raus und es wird die exakt gleiche Webseite geöffnet. Nicht so leicht reagiert die Suchmaschine Google mit Ihren Spidern darauf. Für diese sind beide Varianten auf verschiedene Homepages zurückzuführen. Google denkt, dass sich hinter dem www und ohne dem www 2 Seiten mit exakt gleichem Inhalt verbergen und alarmiert Dupliace Content, zu deutsch “duplizierter Inhalt”.

Was sind Folgen von Duplicate Content?

Dies lässt sich nicht genau definieren. Während manche Seite einfach nur für geraume Zeit in die Sandbox wandern und später wieder aus dem Filter entlassen werden, fliegen andere Homepages direkt aus dem Index. Bei anderen wiederum wird nur die einzelne Seite aus dem Index gekickt. Ich denke, dass es darauf ankommt, wo der Duplicate Content auftritt. Steht er zum Beispiel auf der Startseite könnte die Seite aus dem Index gebannt werden. Steht er auf einer Unterseite, wird nur diese Seite entfernt. Bevor jedoch die Startseite aus dem SERPS von Google gelöscht wird, folgt als erstes die Sandbox. Diese sorgt dafür, dass die Seite nur noch sehr schwer über Google gefunden werden kann. Der Weg aus der Sandbox ist sehr schwer, folgt aber an dieser Stelle wohl auch nur, wenn der Duplicate Conten von der Seite enfernt wird.

Wie kann ich von vorne herein Duplicate Content verhindern?

Sie sollten versuchen, die Spider nur auf eine der beiden Varianten Ihrer Domain umzuleiten. Ich rede hier von einer 301-Weiterleitung. Diese wird gewöhnlich in der .htaccess definiert und kommt dadurch zur Anwendung. Sie bewirkt, dass der Spider entweder immer auf die www.-Seite stößt, auch wenn er die Homepage ohne diese aufruft und anders herum.

Damit Sie Ihre Seite schnell und einfach gegen Duplicate Conten schützen können, gebe ich Ihnen hier die beiden Varianten:

Die Seite soll nur mit www. aufgerufen werden können:

RewriteEngine on
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteRule ^(.*) http://www.%{HTTP_HOST}/$1 [R=301]

Die Seite soll nur ohne www. aufgerufen werden können:

RewriteEngine on
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteRule ^(.*) http://%{HTTP_HOST}/$1 [R=301]

Ist mit oder ohne www für meine Homepage besser?

Hier rotieren verschiedene Gerüchte, dass Google Seite ohne www. in den SERPS bevorzugt. Ich an dieser Stelle denke, dass dies keinerlei Rolle spielt. Persönlich greife ich auch immer zu der www.-Variante, da man neben den vielen SEO-Maßnahmen auch an die User denken sollte, für die eine vollständige Domain besser aussieht.

Wie erstelle ich eine .htaccess?

Sie benötigen als erstes ein FTP-Programm mit dem Sie Datein direkt in das rootverzeichnisses Ihres Servers laden können. Jetzt schreiben Sie eine Text-Datei (nicht mit office word) mit einen der oben genannten Zeilen und speichern diese ab. Dann geben Sie der Datei den namen “.htaccess” und laden diese auf den Server hoch. Sollte dort noch die Dateiendung “.txt” im Namen stehen, löschen Sie diese jetzt einfach raus.

Gibt es Möglichkeiten, Duplicate Conten ohne .htacces zu verhindern?

Klar gibt es Alternativen dazu. Loggen Sie sich einfach bei den Google Webmastertools ein. Hier können Sie bequem zwischen den beiden Varianten auswählen und zeigen Google so, welche Seite durch den Spider ausgelesen werden und auf welche Variante bei der Indexierung verzichtet werden soll.

Ähnliche Beiträge

2 Kommentare bisher »

  1. Benjamin sagt

    am 23. November 2008 @ 19:52

    Hehe, gut erklärt, auch wenn mir der Artikel irgendwie ein wenig bekannt vorkommt. ;)

  2. She-Sign.de » SuMa-freundliches Wordpress sagt

    am 25. November 2008 @ 20:11

    [...] Damit werden alle eure Beiträge und Seiten von Wordpress auf die http://www.-Variante ge-re-writed und somit Duplicate Content ausgeschlossen. Vorraussetzung hierfür ist natürlich, dass Wordpress ordnungsgemäß auf dem Server installiert wurde und die Domain direkt mit der Seite verknüpft ist. Was noch alles mit dem Rewrite gelöst wird und wie du die Variante ohne www. nutzen kannst, erfährst du in einem anderem Post. [...]

Hinterlasse einen Kommentar

Name: (erforderlich)

eMail: (erforderlich)

Website:

Kommentar: