Google von der BB ausschliessen?
Auf unserer Blogbibliothek bilden wir ja Texte aus Blogs ein zweites mal mit dem Einverständnis des Autors und allenfalls anderer Rechteinhaber ab; ganz konsequent und hartnäckig. Dadurch sind die Inhalte logischerweise auch zwei mal im Internet verfügbar; nämlich an der Quelle und hier in der BB. Dass das nicht nur Gutes bringen kann, schilderten mittlerweile schon einige Leute, darunter auch Soeren vom Gemeinschaftsblog Endlosrekursion. Denn die Suchmaschinen – allen voran Google – entdecken dadurch doppelten Inhalt, was in der Regel dazu führt, dass eine der beiden Seiten durch Google “abgestraft” wird. Das bedeutet nichts anderes, als dass Google einer der beiden Seiten weniger Wert beimisst und sie bei einer relevanten Suche entsprechend später in den Resultaten listet. Soeren vermutet, dass die BB aufgrund ihrer Struktur eher den höheren oder besseren Wert bei Google bekommen würde. Deswegen schlägt er eine Diskussion vor, in der den Ausschluss von Google und andern Suchmaschinen besprochen und allenfalls beschlossen und umgesetzt wird.
Aus meiner Sicht ist die Feststellung von Soeren richtig und sie verdient, entsprechend beachtet zu werden. Denn schliesslich wollen wir hier Blogger supporten und nicht via Google und Konsorten bestrafen. Wir haben das heute zu Dritt besprochen und sind der Meinung, dass wir die Herausforderung hier besprechen sollten. Wir wollen aber nicht eine Grundsatzdiskussion, die gibt es nämlich schon zu Hauf da draussen im Netz, sondern möchten mit drei konkreten Alternativen die Diskussion beginnen:
- 1. Möglichkeit Wir lassen alles, wie es zur Zeit ist. Die Suchmaschinen dürfen alle Seiten der BB indexieren und entsprechend in den Suchresultaten listen. Alle Links auf die Blogs bleiben erhalten, die ja schliesslich auch zur “Wertbildung” bei Google beitragen.
- 2. Möglichkeit Keine Suchmaschine bekommt die Erlaubnis, unsere Seiten zu indexieren. Dadurch verhindern wir, dass die Suchmaschinen Inhalte doppelt finden und sie allenfalls unterschiedlich be- und verwerten, dafür gehen aber alle Links verloren und ausserdem sind auch die Meta-Informationen zu den Blogs und Autoren bei Google und Konsorten nicht mehr auffindbar. Weiter würden Suchende auch die BB als solche nicht mehr über Suchmaschinen finden.
- 3. Möglichkeit Sämtliche Suchmaschinen dürfen alle Seiten der BB indexieren und verwerten, mit der Ausnahme des Verzeichnisses
/single/. Ausschliesslich dort werden die Volltext-Beiträge angezeigt. Dies würde bedeuten, dass sämtliche Informationen über die gelisteten Blogs und Autoren hier in der BB durch die Suchmaschinen gefunden und angezeigt werden, die Volltexte jedoch nicht. Also bloss noch die Anleser, wie sie beispielsweise auf der Startseite zu finden sind.
Kurt, Caro und ich favorisieren ganz klar die 3. Möglichkeit, weil sie wohl am ehesten allen Beteiligten einen Dienst erweisen würde. Dadurch blieben auch alle Links zu den Blogs erhalten, ausser denjenigen, die am Ende einer Volltextseite angezeigt werden. Wichtig scheint mir, dass wir diese Variante konsequent für alle Suchmaschinen (die sich an die Standards halten) einführen würden. Dazu käme die Lösung einer robots.txt in Frage.
Wir sind uns bewusst, dass wir Menschen hier als Leser haben möchte und keine Roboter, Spider und automatische Suchmechanismen. Doch ist es eine Tatsache, dass Google und Konsorten Leser hierher führen. Deswegen wollen wir diese Suchtools nicht überbewerten – wir sind ja keine SEOs – aber einen gewissen Stellenwert nehmen sie bestimmt ein. Und den sollen sie hier auf der BB bekommen. Nun sind wir aber gespannt auf Eure Ansichten und Eindrücke!


18. Januar 2009 um 16:49 Uhr
Ganz klar die 3!
18. Januar 2009 um 21:56 Uhr
Hmm, schwieriges Dilemma. Einerseits genügt ja ein Suchmaschinenfund, egal, ob im Original-Blog oder in der Bibliothek, da ja die Bib zum Original verweist. Lösung 3 klingt auf jeden Fall plausibel.
Dass man die Blogbibliothek-Duplikate im Titel besonders kennzeichnet, nützt wohl nichts (will fragen: scannt die Suchmaschine den gesamten Text und stuft ihn, wenn er nur beinahe identisch ist als identisch ein?)
18. Januar 2009 um 23:33 Uhr
@irgendlink: da kenne ich mich zu wenig aus, dazu möchte allenfalls soeren etwas dazu sagen. Ich weiss bloss, dass der Titel (der Titel-Tag und der Titel an sich) bei Google eine Rolle spielen.
19. Januar 2009 um 01:44 Uhr
Gar nicht so einfach zu beantworten. Ich könnte nur eine aus dem Bauch heraus Antwort geben und keine mit Sicherheit. Allerdings würde dann das passieren, was genauso unerwünscht wäre: Die Blogbibliothek wäre die von Google benachteiligte.
Es ist nunmal so, dass Google einen Text nicht zwei Mal im Index haben möchte. Die Gründe liegen auf der Hand. Du willst, wenn du nach irgendetwas suchst, auch nicht zwei Mal während deiner Suche auf ein und den selben text auf zwei Seiten stoßen. Suchmaschienen leben nicht nur von den “besten” Rankings, sondern eben, solange sie noch kein grundlegendes semantisches Level erreicht haben, von Vielfalt, sodass du beim Suchen selbt das für dich beste Ergebnis auswählst.
Auch wenn es anders nach außen getragen wird, im Grunde tut Google nur eines um seine Suchergebnisse “gut” für den Suchenden zu füllen: mögliche Spamquellen ausschließen bzw. so weit anch hinten wie möglich schieben, bis eben noch schlechtere Sieten dies verhindern.
Für mich stellt es sich ejdenfalls so dar, alle Gründe dafür kann ich hier nicht ausbreiten, haben auch weniger mit SEO, sondern mit dem “Verstehen” von etwas Bedeutungsvollen zu tun. Warum braucht es solche tollen Projekte wie die Blogbibliothek, wenn doch Google immer schon das Beste heraussucht? Weil Google nichts versteht und Texte nicht nach ihrer Qualität beurteilt.
Darin, spammige Seiten zu finden, ist Google aber schon ganz gut. Es ist eben schon immer leichter gewesen zu sagen, was schlecht ist, selbst ohne die Antwort auf die Frage zu kennen, was gut ist.
Ich plädiere also ganz klar für Version 3, auch wenn ich das ausschließen durch “noindex” mit dem verweis “follow” noch eleganter finde, da so alle verlinkten Sieten profitieren, auch die in der Single verlinkten Seiten der Blogbibliothek, aber dennoch keiner der Beteiligten zu befürchten hätte, dass Google irgendeine hier partizipierende Seite für “schlecht” zu halten.
Yoda, ich würde euch gerne bei der Implementierung helfen, weiß allerdings nicht, welches CMS ihr für die Bibliothek nutzt. Für Wordpress könnte ich euch den Code zukommen lassen. Im Grunde müsst ihr nur im Header ein “if is single then metanagabe (kann ich hier nicht schreiben, frisst nämlich Wordpress, schicke ich euch aber gerne zu)” einbauen.
Ist die selbe Anweisung für Suchmschinen wie in eienr robots.txt, allerdings verfolgen Google, Yahoo und Live eben durch das “follow” auch noch alle Links (bei den kleineren weiß ich es nicht). Wenn sich also eine Suchmaschine an die robots hällt, wird sie sich auch an diese Anweisung halten. Alle, die sich nicht dran halten, sind aber eh egal.
Wenn ihr Hilfe braucht, dann meldet euch einfach.
19. Januar 2009 um 08:30 Uhr
Da ich Nutzerin und in dem was ich mir aus dem Netz raussuche Nutz-Geniesserin bin, kann ich zu technischem gar nichts sagen und mich nur aus dem Bauch raus mitteilen.
Ich möchte vor allem Lesen und dies (wie im realen Leben auch) bei den Bibliothekaren oder auch Antiquariaten meines Vertrauens. Ich geh da draussen in den Städten in mir ausgewählte Bibliotheken und Buchläden, obwohl es noch ganz viele Andere gäbe, doch in diese geh ich aus irgendwelchen Gründen nicht.
Nun bin ich zur BlogBibliothek gekommen, durch die persönliche Einladung dazu, durch die Bibliothekare meines Vertrauens im Netz und diese BB ist mir heut bereits schon selbst zur Schmuckperle geworden, wird somit immer mein Favorit bleiben.
Aber nun zum eigentlichen. Ich plädiere für Punkt 1)
Mit dem Vorschlag einer kleinen Ergänzung (vielöleicht gibt es die ja auch schon und ich hab diese lediglich überlesen)
Die Texte die in der BB aufgenommen und dort zu lesen sind, mit dem Link zum Ursprungsort, könnten doch dort, am Ursprungsort ab Freigabe in der BB auch einen Link zur BB führen. Dann sollte es doch (sofern ich da richtig unterwegs bin) egal sein, ob der Text aus der BB oder dem Ursprungsblog der Stärkere ist und in einer Suchmaschine aufgeführt wird.
So kann ich als Nutzerin dann selbst meinem Gusto nachfolgen und mich leiten lassen ob ich nach Lesen des Textes im Netz weiterschauen möchte.
So wie es mir hier in der BB geht. Ich geh nach lesen eines Textes mal auf die Ursprungsseite stöbern, aber nicht immer.
Abschliessend noch dieser Gedanken. Ich merke bei mir, dass ein absolutes eingrenzen bzw gar vermeiden von Grundsatzdiskusionen, wie Yoda es zuvor in diesem Post anspricht, mir ganz wichtig scheint. Gerade hier. Denn für mich ist eine Bibliothek eine Bibliothek und sollte es trotz begleitendem Blog vor allem auch bleiben.
19. Januar 2009 um 08:36 Uhr
Vielen Dank soeren für die ausführliche Antwort und das Angebot! Das nehme ich sehr gerne an. Wir haben das CMS für die BB “selbst gestrickt” und können so den Header sehr leicht anpassen. Wenn Du uns den richtigen Code zustellen könntest, wäre ich Dir sehr dankbar. Die Adresse hast Du ja, oder? Steht im Impressum hier. Danke!
19. Januar 2009 um 08:39 Uhr
Danke Christina! Ich denke, mit dem Vorschlag von soeren bewegen wir uns auch auf Deiner Philosophie, die ich im Übrigen sehr gut nachvollziehen kann und die auch uns als Grundlage dient. Dadurch erfüllen wir fast alle Bedürfnisse, meine ich.
20. Januar 2009 um 23:15 Uhr
Inzwischen habe ich den HTML-Code von Soeren erhalten. Auch über diesen Kanal ein Danke an ihn!
Wir werden also demnach die Seiten mit den Volltext-Beiträgen nicht mehr durch die Suchmaschinen indexieren lassen, hingegen folgen die Spider weiterhin den Links. Offenbar ist das noch ein wichtiger Bestandteil, den wir nun auch nutzen konnten. Alle übrigen Seiten sind von dieser Massnahme nicht betroffen. Den Code habe ich bereits eingebaut und online gestellt.
25. Januar 2009 um 18:11 Uhr
Gut, dass du nochmal drauf hingewiesen hast, weil es da zu Missverständnissen gekommen ist. Alle Links auf den vom index ausgeschlossenen Artikel zählen natürlich in der ganz normalen Art und Weise. Google crawlt den Artikel und gibt Linkpower weiter, als gäbe es das noindex gar nicht. Nur im index erscheintd er Artikel eben nicht.