WDF*IDF

« Back to Glossary Index

WDF*IDF = Termgewichtung

  • Zusammenführung von WDF und IDF zeigt Relevanz des betrachteten Begriffs, ermöglicht optimale Verteilung themenrelevanter Keywords im Text
  • Wesentlich komplexer als Betrachtung der Keyword Desnity („Keyweord Dichte / Häufigkeitsverteilung)
  • Betrachtet Text als Ganzes (holystische Sichtweise auf ein Thema) – je umfassender ein Thema mit den relevanten Begriffen behandelt wird, destö höher die Wahrscheinlichkeit für ein besseres Ranking.

Formel:

Wi,j = WDFi,j * IDFi

Wi,j entspricht der Gewichtung eines Wortes (i) im Dokument (j)

WDFi;j: Häufigkeit eines Wortes (i) im Dokument (j)

IDFi: Häufigkeit eines Wortes im gesamten Dokumentenkorpus


WDF*IDF steht für „Within-Document Frequency * Inverse Document Frequency“ und ist ein Konzept im Bereich der Information Retrieval und Suchmaschinenoptimierung (SEO). Es handelt sich um eine Methode, die verwendet wird, um die Relevanz von Begriffen oder Worten in einem Dokument in Bezug auf eine Sammlung von Dokumenten zu bewerten.

Die Hauptkomponenten von WDF*IDF sind:

1. WDF (Within-Document Frequency): Dieser Teil misst, wie oft ein bestimmtes Wort in einem einzelnen Dokument vorkommt. Ein höheres WDF würde darauf hinweisen, dass das Wort im Kontext dieses Dokuments wichtiger ist.

2. IDF (Inverse Document Frequency): Dieser Teil misst die Seltenheit eines Wortes in der gesamten Dokumentsammlung. Ein höheres IDF wird einem Wort zugewiesen, das in weniger Dokumenten der Sammlung vorkommt. Das bedeutet, dass das Wort möglicherweise wichtiger oder aussagekräftiger ist, da es nicht in vielen Dokumenten auftaucht.

Die Idee hinter WDF*IDF ist, dass Wörter, die häufig in einem bestimmten Dokument, aber nicht in vielen anderen Dokumenten auftreten, eine höhere Gewichtung für die Relevanz dieses Dokuments haben sollten. Anders ausgedrückt, wenn ein Wort in einem Dokument oft vorkommt, aber selten in der gesamten Dokumentsammlung, wird ihm eine höhere Bedeutung beigemessen.

Diese Methode wird oft von Suchmaschinen-Algorithmen verwendet, um die Relevanz von Dokumenten für eine bestimmte Suchanfrage zu bestimmen. Wenn ein Benutzer beispielsweise nach „WDF*IDF“ sucht, würden Dokumente, in denen dieser Begriff häufig vorkommt und gleichzeitig in einer begrenzten Anzahl von Dokumenten in der gesamten Sammlung auftaucht, als potenziell relevant eingestuft werden.

Es ist wichtig zu beachten, dass WDF*IDF nur eine von vielen Techniken ist, die von Suchmaschinen verwendet werden, um die Relevanz von Inhalten zu bewerten. Moderne Suchalgorithmen berücksichtigen eine Vielzahl von Faktoren, um die besten Ergebnisse für eine bestimmte Suchanfrage zu liefern.

Tools zur WDF*IDF Berechnung und -optimierung

 

 

« Back to Glossary Index