WDF*IDF – Keyworddichte 2.0?

Onpage Seo

Onpage Seo

WDF*IDF ist aktuell einer der Hypes in der Suchmaschinenoptimierung. Hinter dem kryptischen Term verbirgt sich eine Formel, die als Konkurrent der Keyworddichte bzw. als deren Nachfolger angesehen. Die „Keyworddichte 2.0“ geht dabei neue Wege und setzt den Inhalt eines Dokuments mit einem Korpus an anderen Dokumenten in Relation. Doch ist die Hype-Funktion in der Lage, die klassische Keyworddensity abzulösen? Und wie funktioniert WDF*IDF überhaupt?

In den letzten Jahren hat sich das Schlagwort Keyworddichte in das Gedächtnis der Online Branche eingebrandt. Doch diese hat Schwächen. Sie steigt linear mit dem Vorkommen von Keywörtern in einem Text an und meist bleiben Synonyme unberücksichtigt. Die Suchmaschinen und die natürliche Sprache setzen aber eine Grenze, wie oft ein Keyword verwendet werden kann, damit ein Text noch sinnvoll und gut lesbar ist. Kurz: Wird das Maß überrissen, drohen schnell eine schlechte Lesbarkeit des Textes und Rankingverluste oder Abstrafungen. Zudem werden Dokumente mit dem klassischen Verfahren nur isoliert betrachtet und nicht in Relation zu Ihrer Umwelt gesetzt.

WDF*IDF kurz erklärt

WDF*IDF hat einen anderen Ansatz. Es ist eine mathematische Funktion aus zwei Faktoren, Der die Website in Relation zu Konkurrenzseiten setzt. Der Einsatz des Logarithmus bremst das Wachstum der Kennzahl. Um die Funktion besser zu verstehen ist es sinnvoll, die Faktoren WDF und IDF getrennt zu betrachten.

Der WDF-Term

Der erste Faktor WDF ist die Within-document Frequency. Es ist eine dokumentspezifische Wortgewichtung, die Wörtern einen Gewichtungswert ähnlich der Keyworddichte zuweist. Als logarithmierte Funktion liefert WDF einen gestauchten Wert, der die Gewichtung deutlich besser widerspiegelt als eine lineare Funktion. Die Formel

WDF (u,v)=log2 (Freq (u,v) +1)/log2(L (v))
u: Keyword
v: Dokument
Freq (u, v): Frequenz (Anzahl) des Keywords u im Dokument v
L (v): Gesamtzahl der Wörter im Dokument v

oder einfach:
WDF=log2(Anzahl des Keywords im Text +1) / log2(Gesamtzahl der Wörter im Dokument)

sieht erst einmal kompliziert aus, lässt sich aber leicht mit einem Taschenrechner oder mit einer Tabellenkalkulation nutzen. Synonyme bleiben jedoch außen vor. Wirklich überlegen ist diese Funktion (isoliert) der Keyworddichte nicht – einmal abgesehen vom gestauchten Wachstum des Ergebnisses.

Der IDF-Part

Die richtige „Power“ kommt mit dem zweiten Teil, mit IDF. Es handelt sich um die Inverse Document Frequency. Es ist ebenfalls eine logarithmierte Funktion. Diese hat als Parameter die gesamte Anzahl an Dokumenten im Korpus und die Zahl der Dokumente, die das fragliche Keyword enthalten. IDF gibt damit eine Gewichtung an, ob ein Wort in vielen Dokumenten vorkommt oder ob es nur wenige Dokumente gibt, die das Keyword enthalten. Kurz: ein Wert also, der zeigt, wie viel Konkurrenz auf ein Dokument wartet.

IDF (u) = log2(1+Dges/Dk (u))
Dges: Menge aller (betrachteten) Dokumente
Dk (u): Anzahl aller Dokumente aus Dges, die das Keyword u enthalten

Werden beide Terme kombiniert, gewinnt die Funktion echte Aussagekraft. WDF*IDF liefert eine Kennzahl, die beschreibt, wie relevant ein Dokument in einem Korpus an Dokumenten in Bezug auf ein bestimmtes Keyword ist. Wird ein Dokument zu einem Keyword erstellt, das selten in anderen Dokumenten verwendet wird, steigt die Gewichtung der Gesamtfunktion WDF*IDF.

Soviel zur Theorie, wie die Funktion in der Praxis genutzt wird. Woher die nötigen Daten für die einzelnen Parameter genommen werden, das verrät Teil 2 WDF*IDF in der Praxis.

One Response to WDF*IDF – Keyworddichte 2.0?

  1. […] Setzt sie schließlich das Dokument in Relation zur Konkurrenz, wie der vorangegangene Beitrag WDF*IDF – Keyworddichte 2.0 näher erläutert. Daher sollten sich auch Hobby-Suchmaschinenoptimierer, Webshop-Betreiber und […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.


− sieben = 2