Ein mentales Modell für den Panda-Algorithmus

23. August 2011

Panda Forschung

Panda Forschung

Bei der Erforschung des Google-Rankings können SEOs nur Black-Box-Methoden anwenden. Bei einem Update wie Panda ist es aber schwierig, vorher ein passendes Labor-Szenario aufzubauen, um den Änderungen im Algorithmus auf die Spur zu kommen. Umso wichtiger sind daher die ganz besonderen Fälle die dazu dienen, Zusammenhänge des Algorithmus besser zu verstehen. Einen solchen, nahezu unglaublichen Fall möchte ich Euch heute vorstellen und ein mentales Modell für das Panda-Update ableiten.

Bereits vor dem Eintreffen des Panda in Deutschland habe ich diesem Blog analysiert, das fehlender Brand-Traffic eine Ursache für einen Panda-Abrutsch sein könnte. Mittels dieser simplen Analyse lag ich daher auch in der Panda-Prognose für die Preisvergleicher wie z.B. Idealo (Gewinner) oder Yopi (Verlierer) ziemlich richtig. Ob der Brand-Traffic dabei die Ursache ist oder nur zu den Ursachen korreliert, kann ich nicht beantworten. Nach dem Eintreffen des Panda in Deutschland ist aber eines sicher: Der Brand zählt.

Doch welche Indizien könnte es dafür noch geben? Immerhin gibt es zahlreicher weitere Verdächtige Signale für einen Panda-Verlust wie Absprungrate, ausufernder Werbung, schlechte Texte etc… Ist ein schlechter Brand nicht eher die Folge solcher negativen Signale? Um diese Frage zu beantworten bräuchte man ein Experiment unter Laborbedingungen (schwierig) oder vielleicht einen ganz besonderen “Fall”. Ein Fall, in dem ähnlich einem kontrolliertem Experiment spezifische Parameter exakt gleich und andere wiederum unterschiedlich sind.

Wie wäre es, wenn der Panda dieselbe Website sowohl bestraft als auch belohnt hätte? Und wenn ja – wie unterscheiden sich die beiden Teile der Website? Schließlich dürften viele Dinge gleich sein (und damit ihre Bedeutung für den Panda geringer sein) während die, die sich signifikant unterscheiden wohl hauptursächlich für eine Rankingänderung durch das Panda-Update sein müssten! Ok, voilà:

Schottenland vs. Hardwareschotte

Schottenland vs. Hardwareschotte

Beide Seiten sehen nicht nur gleich aus, im Grunde genommen unterscheiden Sie sich auch inhaltlich nicht wesentlich. Um ganz genau zu sein, ist hardwareschotte.de nur die Elektronik-Kategorie des Allgemeinen Preisvergleichers schottenland.de. Als ich darauf aufmerksam geworden bin, habe ich mich lange mit Steffen von Schottenland darüber unterhalten. Er war sehr offen und so konnte ich Einblick in Statistiken der betroffen Domains bekommen. Folgende Signale sind auf beiden Domains nahezu identisch.

Identische Panda Signale:

  • HTML-Templates
  • Anteil Text/Bild in den Detailseiten
  • Textqualität
  • Anzahl der Werbeslots
  • Bouncerate (und vermutlich auch SERP-Returnrate)
  • Verweildauer
  • Trafficmix
  • Website-Geschwindigkeit
  • Social Signals (Likes, Tweets, Shares, +1)

Das ist interessant. Wenn diese Signale auf beiden Domains gleich sind, dann können sie nicht ausschlaggebend für die Frage dafür sein, ob der Panda beißt oder nicht! Das heißt nicht, dass diese Dinge belanglos sind aber sie sind offenbar weniger wichtig als die Signale, die beide Domains unterscheiden. Welche sind das?

Unterschiedliche Panda Signale:

  • Die Domain (!)
  • Thematische Breite
  • Brand & Brandsignale

Es lohnt sich also einen näheren Blick auf diese 3 Signale zu werfen. Offensichtlich war mindestens eines dieser Signale ausschlaggebend für die unterschiedliche Bewertung der beiden Domains.

Die Domain

Für die Bewertung des Domainfaktors ist ein kurzer Rückblick in die Geschichte der Website interessant. Im Jahre 2000 wurde hardwareschotte.de als reiner Elektronik-Preisvergleicher gegründet. Im Laufe der Zeit wurden andere Produkte zunehmend wichtiger und es zeigte sich, das der Name für einen breit aufgestellten Preisvergleich einfach zu kurz gegriffen war. Ein mühevoller Umzug auf die generische Domain schottenland.de begann im Jahre 2003. Jedoch überlebte die Domain hardwareschotte.de bis heute als Elektronik-Kategorie von schottenland.de.

Beide Domains sind also recht alt. Der Panda-Gewinner hardwareschotte.de ist dabei noch etwas älter als der Panda-Verlierer schottenland.de. Ist das ein Grund? Ganz ehrlich, ich glaube es nicht. Dann bräuchten Spammer ihre Projekte nur auf alten Domains einrichten (und das machen sie ja auch) und schon wären sie vor dem Panda sicher. Hier gibt es aber einfach zu viele Gegenbeispiele, als das der Faktor Domain als Kriterium taugt.

Die Thematische Breite

Die Thematische Breite der beiden Domains unterscheidet sich deutlich. Während schottenland.de den Preisvergleich für sehr viele unterschiedliche Kategorien leisten muss, hat hardwareschotte.de einen eindeutigen Elektronik-Fokus. Wir haben es also mit einem thematisch abgegrenzten Portal vs. einem breit aufgestelltem Portal zu tun, und das breit aufgestellte Portal hat verloren.

Das könnte ich mir als mögliches Leitsignal schon viel eher vorstellen. Aber auch hier gibt es in der aktuellen Panda-Welle einfach zu viele Gegenbeispiele. Zu viele Domains hat es getroffen, die auch einen thematisch engen Fokus hatten. Ich halte also nicht soviel davon.

Brand & Brandsignale

Kommen wir zum letzen und streng dem dramaturgischem Aufbau folgenden, spannensten Signal: dem Brand. Wie kam es denn eigentlich zu dieser merkwürdigen Konstellation, dass eine ältere Domain noch als Kategorie für ein breit aufgestelltes Portal einer anderen Domain fungiert? Das ist durchaus spannend, hardwareschotte.de hatte nämlich vor allem durch die gute Anbindung der lokalen Händler hier in Berlin einen guten Ruf gewonnen, ein Brand! Es war auch irgendwie leichter zu merken und der Umzug zu schottenland.de verlief sehr schleppend. Die Nutzer wollten einfach immer ihr altes hardwareschotte.de aufrufen und sich partout nicht an dieses neumodische schottenland.de gewöhnen :)

Schon bei meiner Brandtraffic-Analyse der Preisvergleicher vor dem Panda konnte ich zeigen, dass hardwareschotte.de fast die dreifache Menge an Brandtraffic als schottenland.de bekommt. Berücksichtigt man ferner, das hardwareschotte.de nur einen Bruchteil des Traffics von schottenland.de bekommt, lässt das auf einen fulminant unterschiedlichen Anteil an Brand-Traffic im Vergleich zum Search-Traffic schließen. Und hier schließt sich der Kreis einer Diskussion, die ich damals mit meinem Artikel losgetrat, als ich fehlenden Brand-Traffic als Leitsignal für einen Panda-Absturz identifiziert habe.

Fazit

Brand-Traffic bzw. der Anteil von Brand-Traffic am Traffic-Mix ist ein plausibles, schwer zu manipulierendes und für Google einfach zu berechnendes Leitsignal. Es korrelliert im allgmeinen mit der Behandlung durch den Panda, auch wenn diese Korrelation nicht zwangsläufig kausal ist.

Soweit die Fakten. Es sei mir erlaubt, darüber hinaus zu spekulieren, was denn genau Panda eigentlich ist. Einige  Eigenschaften des Panda-Updates sind dabei wesentlich:

  • Der Panda-Faktor ist nie positiv: durch Panda wurden offensichtlich keine Seiten direkt aufwertet sondern die Gewinner des Panda-Updates haben Rankings nur Aufgrund des Wegfalles von Mitbewerbern gewonnen,
  • Der Panda Faktor ist nicht binär: die Abwertungen durch Panda sind für eine Domain nicht vollständig, sondern reichen von wenigen Prozent bis weit über 80% Prozent Rankingverluste im Sichtbarkeitindex
  • Der Panda-Faktor korrelliert mit den Brand-Signalen einer Domain wie z.B. den Brand-Searches.

Mit diesen Fakten kann man sich vom Panda daher  folgendes mentales Modell des Panda-Updates erstellen:

“Der Panda-Algorithmus reduziert die Rankings einer Domain, bis diese wieder ein “gesundes” Verhältnis von Brand-Traffic im Vergleich zum restlichen Search-Traffic hat.”

Hinweis: Ein mentales Modell ist keine exakte Erklärung oder Definition, sondern eine vereinfachende und anschauliche Vorstellung komplexerer Zusammenhänge wie z.B. das bohrsche Atommodell.

Dieses Modell erklärt auch sehr schön, warum einige Domains mehr und andere weniger stark durch den Panda getroffen wurden. Es zeigt darüber hinaus aber auch einen möglichen Weg aus einem Panda-Penalty heraus: entweder sorgt man für mehr Brand-Traffic oder verringert den Anteil an Search-Traffic. Das klingt vielleicht hart, aber besser man sucht sich den Search-Traffic, auf den man verzichten kann selber aus, als wenn der Panda es tut.

Am Ende führen jedoch beide Wege zu dem von Google und uns Suchmaschienen-Nutzern gewünschten Ergebnis: weniger dünne Seiten in den Suchergebnissen.

Leave a Comment

Previous post:

Next post: