Sonntag, 21. Oktober 2012

Keywordanalyse-richtige Keywords finden mit dem IDF

4,5 Bei der Keywordrecherche bzw. der Keywordanalyse ist es wichtig zu analysieren wie stark der Wettbewerb für meine Keywords sind.

Ich habe schon in verschiedenen Artikel beschrieben, wie man den Wettbewerb mit Hilfe von Google Adwords, allintite- und oder allintitle-Google Befehl analysieren können:


Heute möchte ich eine mathematisch genauere Methode vorstellen:

Inverse Dokumenthäufigkeit

Die inverse Dokumenthäufigkeit (Abk. IDF - inverse document frequency) beschreibt wie häufig ein Begriff oder ein Term, also unser Keyword, in der Datenbank vorkommt.

Somit kann man an Hand des Ergebnisses von IDF erkennen, wie stark die Konkurrenz (Anzahl der schon geschriebenen Artikel mit dem gleichen Keyword) ist.

Mit Datenbank ist dabei die Menge aller (Text-)Dokumente die Google beinhaltet gemeint.

IDF-mathematische Formel:


IDF(k) = log(M/m(k) + 1)

  • k ist das Keyword (somit auch IDF(k); also der IDF-Wert vom Keyword k wird ermittelt)
  • M ist die Menge aller Textdokumente die Google beinhaltet
  • m(k) ist das Textdokument, welches das Keyword k beinhaltet

Somit lässt sich der IDF berechnen, in dem man den Quotienten aus der Gesamtanzahl aller Textdokumente (von Google) und der Anzahl der Textdokumenten, welche das Keyword beinhalten bildet.

Zudem addiert man in der Klammer der Logarithmusfunktion noch eine eins hinzu, denn der Logarithmus von 0 (log(0)) existiert nicht. Dieser Fall tritt auf, falls die Datenbank leer wäre.

Beispiel-IDF berechnen: 
Keyword A kommt in 5 Textdokumenten vor und in der Google Datenbank gibt es 1200 Textdokumente.

Rechnung: IDF(A) = log(1200/5 + 1) ) = log(240 +1) = log(241) = 2,38

Was wenn nun in 15 Textdokumenten das Keyword A vorkommen würde?

Rechnung: IDF(A) = log(1200/15 + 1) ) = log(80 +1) = log(81) = 1,91

Man kann also hier schon erkennen, dass der IDF Wert mit steigendem m(k) (Menge der Textdokumente, welches das Keyword beinhalten) fällt.


 
Interpretation:
je höher die Anzahl der Textdokumente mit dem Keyword A sind, um so größer ist auch die Konkurrenz und der IDF Wert fällt, da m(k) der Teiler ist.

je kleiner m(k) ist, um so größer der Wettbewerb.





 Notiz: M = Menge aller Dokumente:

natürlich kann man nicht alle Dokumente angeben, welche in der Datenbank von Google gespeichert sind.
Trotzdem kann man den IDF-Wert berechnen in dem man für M eine Konstante angibt: M = 500.
In diesem Fall, würde man das Keyword A in 500 URL's suchen (diese 500 URL's stehen für die übliche Anzahl an Konkurrenz-URLs, die über gliche/ähnliche Themen schreiben).

Wie könnt ihr die Berechnung vom IDF für euch nützen?


A. ihr Kombiniert den IDF Wert mit dem WDF Wert (darüber werde ich aber noch einen Artikel schreiben)
     oder
B. ihr erstellt eine Excel Tabelle:

















1.) In dieser Excel Tabelle schreibt ihr euch in der Zeile12 unter den "Keyword"-Spalten eure Keywords auf, die ihr analysieren wollt.

2.) Dann gebt ihr euer Keyword A, also euer erstes Keyword, in der Suchfunktion von Google ein.
Notiert euch dann die ersten zwanzig (könnt auch mehr URLs aufschreiben) Suchergebnisse die euch Google liefern wird.

3.) Wie ihr sehen könnt beinhaltet die Spalte B unter Keyword A nur 1er. Das liegt daran, dass dies die ersten 20 Suchergebisse sind die das Keyword A beinhalten. (1 steht für "Seite beinhaltet das Keyword"; 0 für: "Seite beinhaltet das Keyword nicht")

4.) Nun kontrolliert ihr, ob euer Keyword B in den zwanzig ersten URls vorkommen (diesmal müsst ihr aber die 20 URLs aus Keyword A nehmen).

5.) Das selbe macht ihr dann auch für Keyword C, Keyword D,..... .

6.) Im letzten Schritt berechnet ihr für jedes euerer Keywords auch den IDF Wert (dieser ist natürlich bei allen URLs gleich)

Was bringt euch diese IDF-Excel Tabelle?

 
Ihr könnt sehen, ob eure Konkurrenz sich auf Nischenbereiche spezialisiert hat, denn der IDF zeigt ja an, wie stark der Wettbewerb ist.
Somit könnt ihr euch entscheiden, ob euch dieser Wettbewerb zu stark ist, um einen Artikel mit diesem Keyword(s) zu schreiben.

Für Blogger oder kleinen Online Shops, kann die Berechnung des IDFs helfen einen ersten Eindruck über eine Rubrik zu gewinnen.

Keyword-Notiz:
Schreibt in der IDF-Excel Tabelle nicht unterschiedliche Keywords auf. Sondern Begriffe die mit dem Thema/Rubrik zu tun haben

Dies war nur eine sehr kurzer Beitrag zum IDF und ihrer berechnung.
Wer es noch ein wenig genauer haben möchte dem empfehle ich diese PDF von Karen Spärck Jones.

Kommentare:

  1. Ich finde es schön, dass du uns diese Seo (Information Retrival) Begriffe näher bringst.

    Wäre aber schön wenn du noch ein paar Beispiele mehr zeigen würdest ("Anwendungen")!

    Wie löst du eigentlich das Problem mit dem sog. Korpus bei der IDF Berechnung?

    AntwortenLöschen
  2. Dieser Kommentar wurde vom Autor entfernt.

    AntwortenLöschen
  3. Hi Anonym, :-)

    weitere Beispiele werden folgen!

    Korpus-Problem bei der Berechnung des IDfs:
    Wie ich in meinem Artikel schon beschrieben habe, wähle ich eine beliebige Konstante (500 URLs, es reichen aber auch 100 URLs) als Korpus.

    Warum?
    Wenn man alle URL verwendnen würde, würde der IDF bei vielen Begriffen gegen Null konvergieren. Aber man würde auch viele Keywords erhalten, die zwar eine hohen IDF Wert besitzen, jedoch nichts mit dem Thema (direkt) zutun haben.

    Also wähle ich einen kleinen Raum (Anzahl der URls die eine ähnliche Seite wie ich haben, und berechne dann meinen IDF stets in der Abhängigkeit dieser URLs.

    Lg Armin

    AntwortenLöschen