Zum Inhalt springen
Contentcafe.de | Blog | Glossar | WDF*IDF-Analyse

WDF*IDF-Analyse: das I-Tüpfelchen bei SEO

    Die WDF*IDF-Analyse (auch TF-IDF-Analyse) ist eine Technik aus der Textanalyse. In der Suchmaschinenoptimierung (SEO) wird sie verwendet, um Keywords zu identifizieren, die im engen Zusammenhang miteinander stehen. Dazu werden Wörter und ihre Häufigkeit ins Verhältnis gesetzt. Die Abkürzung WDF steht für „Word Document Frequency“ und IDF steht für „Inverse Document Frequency“.

    1. Word Document Frequency (WDF): Dieser Teil der Analyse bezieht sich auf die Häufigkeit eines bestimmten Wortes in einem bestimmten Dokument. Es zählt, wie oft ein Wort in einem Dokument vorkommt. Wörter, die häufig in einem Dokument vorkommen, werden als wichtiger für dieses Dokument angesehen.
    2. Inverse Document Frequency (IDF): Der IDF-Teil bezieht sich auf die Seltenheit eines Wortes in der gesamten Sammlung von Dokumenten. Das bedeutet, je seltener ein Wort in der gesamten Sammlung vorkommt, desto höher ist sein IDF-Wert. Dieser Wert wird berechnet, indem der Kehrwert des Anteils der Dokumente, die das Wort enthalten, genommen wird. Wörter, die in vielen Dokumenten vorkommen, haben einen niedrigeren IDF-Wert, da sie als weniger einzigartig angesehen werden.
    3. Berechnung des TF-IDF-Werts: Der TF-IDF-Wert eines Wortes in einem Dokument wird berechnet, indem der WDF-Wert des Wortes im Dokument mit dem IDF-Wert des Wortes multipliziert wird. Dieser Wert zeigt die relative Bedeutung des Wortes im Dokument im Vergleich zur gesamten Sammlung von Dokumenten. Wörter mit hohen TF-IDF-Werten sind in einem Dokument wichtig, weil sie dort oft vorkommen und gleichzeitig in der gesamten Dokumentensammlung selten sind.

    Die WDF*IDF-Analyse wird zur Textklassifikation sowie zum Information Retrieval und Textmining eingesetzt. Eine praktische Anwendung sind Suchmaschinen. Die WDF*IDF-Analyse hilft bei der Einschätzung der Relevanz von Texten für bestimmte Suchanfragen und Keywords. Der tatsächliche SEO-Mehrwert einer gezielten WDF*IDF-Optimierung ist unter Expert:innen strittig.