OnPage.org

Mehr erfahren
AdWords, KMU, wir machen den Unterschied!
Mehr erfahren

Wie Google Spam erkennt

Google  |   |  , 17:29 Uhr  |  25 Kommentare

SpamIn dem Artikel `Google ready for action against content farms´ auf cnet.com geht Matt Cutts, Mitglied des Search Quality Teams von Google, noch einmal auf seine später auch auf dem offiziellen Google Blog gemachte Ankündigung ein, der Suchmaschinenbetreiber würde forciert daran arbeiten, seinen Index von Webspam zu befreien…

Während Google offensichtlichen Webspam (Hacking usw.) immer besser in den Griff bekommt, stellen Content Farmen, d.h. minderwertiger, oft eigens nur für Suchmaschinen generierter Content ein größeres Problem für Google dar.

Als Content Farm wird ein Geschäftsmodell bezeichnet, bei dem der Anbieter einer Internetplattform durch freie Mitarbeiter Inhalte aus Text, Videos, Fotos und Grafiken produzieren lässt, die durch Suchmaschinenoptimierung möglichst viele Seitenaufrufe anziehen sollen. Einnahmen entstehen zumeist durch Onlinewerbung.

Neben der Hoffnung, dass sich immer mehr User an der Bekämpfung von Spam beteiligen und ihrer Meinung nach minderwertige Webseiten bei Google melden, arbeitet der Suchmaschinenbetreiber offensichtlich gezielt auch an einer automatischen Erkennung von minderwertigen Inhalten. Matt Cutts schreibt hierzu:

First off, it plans to change its famous search recipe to ding sites that are clear content scrapers, or those that copy content wholesale from other sites and repost it under their own domain, credit or not […] To respond to that challenge, we recently launched a redesigned document-level classifier that makes it harder for spammy on-page content to rank highly. The new classifier is better at detecting spam on individual web pages, e.g., repeated spammy words – the sort of phrases you tend to see in junky, automated, self-promoting blog comments.

Wo wir vor einiger Zeit noch im Scherz darüber berichtet haben, Google würde die Links aus Blogkommentaren nur ab einer bestimmten Textlänge werten, scheint Google nun tatsächlich eine Möglichkeit gefunden zu haben, minderwertige Texte als solche zu erkennen und entsprechende Webseiten in den Suchergebnissen herabzusetzen bzw. beinhaltende Links nicht werten zu können. In Bezug auf SEO stellt sich nun die Frage, woran Google diese Texte möglicherweise erkennen könnte.

Erkennungsmerkmale minderwertiger Texte

Länge eines Textes: Theoretisch ist es möglich, einem Text zu einem bestimmten Thema (Title/Überschrift) durch einen Vergleich mit anderen Texten eine gewisse Mindestlänge zuzuweisen. Liegt die Textlänge weit unterm Durchschnitt, scheint er von minderer Qualität zu sein.

Strukturierung eines Textes: Texte aus Content Farmen weisen nicht selten kaum eine inhaltliche Strukturierung (Überschriften, Unterpunkte usw.) auf. Ein durchgängiger, nicht selten auch dem Thema entsprechend viel zu kurzer Fließtext lässt auf eine mindere Qualität schließen.

Thema eines Textes: Minderwertige Texte bzw. deren zugehörige Webseiten setzen beim Themeneinstieg vergleichsweise weit im Longtail-Bereich an. Eine hautsächlich auf längere Keywordphrasen optimierte Webseite deutet auf Webspam hin.

Alternative Medien: Minderwertige Texte dürften eine vergleichsweise geringe Einbindung alternativer Medien (Bilder, Videos usw.) aufweisen und können theoretisch auch so identifiziert werden.

Verwendung von Keywords: Die offensichtliche Wiederholung bestimmter, womöglich auch im Title bzw. in der Überschrift vorkommender Begriffe deutet auf Suchmaschinenmanipulation hin.

Nichtverwendung von Keywords: Die Nichtverwendung bestimmter, im Zusammenhang mit dem Thema oft verwendeter Begriffe, deutet auf eine oberflächliche Behandlung des Themas und damit ebenfalls auf eine mindere Qualität hin.

Besucher-/Leserinteraktion: Eine in Bezug auf das Ranking einer Webseite bzw. eines Weblogs vergleichsweise geringe Beteiligung des Users (Kommentare, Bewertungen usw.) könnte ein Indiz für fehlende Relevanz darstellen.

Verwendende Werbemittel: Die Art der verwendeten Werbemittel bzw. deren Form der Einbindung ist möglicherweise ebenfalls ein Anzeichen für die Qualität eines Webinhalts.

Es gibt eine ganze Reihe Möglichkeiten, wie Google minderwertige Texte bzw. Webinhalte erkennen könnte. Allen Möglichkeiten gemein ist das vorherige Definieren gewisser, einen qualitativ hochwertigen Text üblicherweise auszeichnende Kriterien und deren Vergleich mit anderen, möglicherweise als Spam einzustufenden Inhalten.

Durch Caffeine hat Google die Infrastruktur geschaffen, beschriebene Qualitätsberechnungen tatsächlich auch durchführen zu können. Das Schwierigste an der Findung geeigneter Algorithmen zur Bekämpfung von Webspam dürfte nicht die Findung der Kriterien zur Identifizierung, sondern die Vermeidung möglicher Kolalateralschäden sein. Sollte Google jemals jedoch einen solchen Algorithmus finden, dürfte eine Bereinigung der Suchergebnisse stattfinden, dessen Ausmaß das der Auswirkungen des Mayday-Updates bei weitem noch übertreffen würde…

Gretus

Sie befinden sind hier: Wie Google Spam erkennt

Kommentare zu Wie Google Spam erkennt:

  1. […] Erkennungsmerkmale minderwertiger Texte […]

1 3 4 5

Jetzt zu "Wie Google Spam erkennt" kommentieren:

Loading Disqus Comments ...

Ihre Agentur noch nicht dabei?

Ihr Job noch nicht dabei?

Ihr Beitrag noch nicht dabei?