Projekte

Online Marketing
News

Unser Herz schlägt für
erfolgereiche Webseiten und Shops

WDF*IDF

WDF*IDF:

3 November, 2016
Hinterlasse deinen Kommentar
WDF*IDF ist eine Formel mit der sich berechnen lässt, in welchem Verhältnis bestimmte Keywords oder Wortgruppen (Terme) innerhalb eines Textdokuments bzw. einer Website im Verhältnis zu allen potentiell möglichen Dokumenten/Websites gewichtet werden. Die Formel dient zur Analyse (WDF*IDF Analyse) von Textdokumenten und wird auch als Termgewichtungsanalyse bezeichnet. Die Analyse beschreibt, welche Terme in einem Dokument zu einem bestimmten Thema von Suchmaschinen als relevant erachtet werden und in welcher Art und Anzahl diese Terme vorkommen sollten. Die WDF*IDF Analyse wird für die Onpage Optimierung in der SEO für Online-Texte verwendet, um die Relevanz einer Website zu erhöhen und somit das Ranking zu steigern – also um möglichst weit oben in den Suchergebnissen einer Suchmaschine zu erscheinen, wenn ein User nach einem bestimmten Keyword sucht.

Von der Keyworddichte zur WDF*IDF Analyse

Von der Keyworddichte zur WDF*IDF Analyse In der Vergangenheit wurde für die Text-Optimierung vor allem die Keyworddichte (engl. Keyword Density) herangezogen. Mit der Keyworddichte wird ermittelt wie häufig ein untersuchter Term im Verhältnis zu der Anzahl aller Wörter innerhalb eines Textes vorkommt. Wenn ein Textdokument beispielsweise 100 Wörter enthält und der entsprechende Term 5 Mal im Dokument vorkommt, beträgt die Keyworddichte also fünf Prozent. Da man bei diesem Verfahren den gewünschten Term unendlich oft benutzen kann, um eine hohe Keyworddichte zu erzielen, wird ein empfohlener Richtwert der Keyworddichte zur Textoptimierung berücksichtigt – denn auch Google weiß inzwischen, dass Texte mit Keyword-Spamming nicht lesbar sind und keinen Mehrwert für den Kunden darstellen. Die optimale Keyworddichte wird immer wieder diskutiert, größtenteils geht man aber von einem Richtwert zwischen zwei und vier Prozent aus. Das Problem bei dieser Vorgehensweise ist, dass sich die Analyse lediglich auf einen Term konzentriert, also der Text lediglich für ein Keyword oder eine Wortgruppe optimiert wird. Im Rahmen des Web 4.0 wird jedoch der semantische Zusammenhang der Begriffe für Suchmaschinen immer wichtiger – und hier kommt die WDF*IDF Analyse ins Spiel, die Aufschluss darüber gibt, welche weiteren Terme ein Text enthalten sollte und in welchem Verhältnis all die wichtigen Begriffe auftauchen müssen, um an Relevanz zu gewinnen. Darüberhinaus wird bei der Keyworddichte die Häufigkeit der Verwendung bzw. Einzigartigkeit von Termen nicht berücksichtigt: Warum sollte ein häufig genutzter Begriff genauso berechnet und gleich bewertet werden wie ein seltener Begriff? In der Regel beschreibt ein seltenes Wort den Inhalt des Textes deutlich besser als ein häufig genutzter Begriff, da er die Materie detaillierter beschreiben kann. Ein Beispiel: Der Begriff „Fußball“ ist ein sehr häufig verwendeter Begriff in der Datenbank von Suchmaschinen und das Thema des Textes kann breit gefächert sein – der Inhalt des Textes wird mit dem Begriff nicht wirklich gut beschrieben. „Abseits“ wiederum ist ein nicht ganz so häufig vorkommender Begriff wie Fußball und beschreibt den Inhalt eines Textes besser, da er ihn beschränkt. Die Suchmaschine weiß dann, dass der Text von einer Spielregel des Fußballs handelt und kann ihn besser einordnen.

Berechnung der WDF*IDF Formel

Wie der Name schon verrät, wird die Formel aus zwei Komponenten berechnet. WDF steht für „Within-Document-Frequency“ und beschreibt, wie häufig ein Term in einem Textdokument im Vergleich zu allen anderen Termen innerhalb des Textdokumentes auftritt. IDF bezeichnet die „Inverse-Document-Frequency“. Dieser Wert gibt an wie oft ein Term in einem Korpus genannt wird, also setzt die Anzahl aller bekannter Dokumente ins Verhältnis zur Anzahl der Texte, welche den Term beinhalten.

WDF

Die WDF berechnet das relative Vorkommen des zu optimierenden Terms im Verhältnis zum relativen Vorkommen aller anderen Begriffe im selben Dokument. Der Wert ist im Prinzip sehr ähnlich zu der Keyworddichte, jedoch durch den beinhalteten Logarithmus in der Formel „gestaucht“. Hierdurch wird verhindert, dass eine enorme Erhöhung des zu optimierenden Keywords zu einem verbesserten Wert führt – so wie es bei der Keyworddichte der Fall und zugleich Problem ist. Bei einer WDF*IDF Analyse wird die WDF für jeden Begriff des Textdokumentes berechnet. Somit bekommt man einen Überblick darüber, welche Begriffe nach dem Hauptkeyword noch bedeutend für die Optimierung sind, also welche Begriffe den Inhalt des Textes am stärksten, am zweitstärksten etc. beschreiben.
WDF Formel

WDF Formel

IDF

Bei der IDF wird die Häufigkeit an Dokumenten, die den bestimmten Term beinhalten, mit einbezogen. Das genannte Problem der Keyworddichte –häufige Begriffe, die den Inhalt des Textes weniger beschreiben und seltene Begriffe, die viel über den Inhalt aussagen, bekommen eine gleiche Gewichtung – wird demnach durch die IDF beseitigt. Sie berechnet sich durch die Anzahl aller bekannten Dokumente im Verhältnis zur Anzahl der Dokumente, die den bestimmten Term enthalten. Je weniger Dokumente den Term also beinhalten, desto Höher ist der Wert der IDF. Die IDF beschreibt demnach, wie viel Gewichtung einzelne Terme bekommen und wie viel die Häufigkeiten der Begriffe im Text wert sind. Ein Beispiel: Der Begriff „Abseits“ hat eine größere IDF als der Begriff „Fußball“, da weniger Dokumente mit diesem Begriff vorhanden sind als mit dem Begriff „Fußball“. Dem Keyword „Abseits“ wird durch die größere IDF also eine höhere Bedeutung zugewiesen, da es den semantischen Zusammenhang der Begriffe besser beschreibt und daher besser von den Suchmaschinen zu den Suchergebnissen der User zugeordnet werden kann.
IDF Formel

IDF Formel

WDF*IDF Formel

Der WDF Wert wird mit dem IDF Wert multipliziert und es ergibt sich die relative Termgewichtung eines Textdokumentes im Verhältnis zu allen möglichen Textdokumenten, die den gewünschten Term ebenfalls beinhalten.
WDF*IDF Formel

WDF*IDF Formel

Mit Hilfe der WDF*IDF Analyse können nun also Texte erstellt werden, die durch Einzigartigkeit und Relevanz möglichst weit oben in den Suchergebnissen gelistet werden. Zurück zum Online Marketing Ratgeber

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.