Donnerstag, 23. August 2012

Problem der Keyworddichte-Keyworddichte berechnen und analysieren

Die Seo Kennzahl "Keyworddichte" besser verstehen lernen

Dies wird mein zweiter Artikel über die Keyworddichte.
In meinem ersten Artikel über die Keyworddichte ging es hauptsächlich um die Definition dieser Seo Kennzahl und darum wie man sie ermitteln kann. Ich habe aber auch einen Tipp zur Anwendung eines (Haupt-)Keyword in Bezug auf die Keyworddichte im ersten Artikel gegeben.

Kommen wir nun zum zweiten Teil:

Problem der Keyworddichte-Keyworddichte berechnen und analysieren

Definition Keyworddichte: relative Häufigkeit eins Schlüsselwortes (Keywords) in einem Textdokument.

Die allgemeine Formel zur Berechnung der Keyworddichte lautet:



Erklärung:
wir multiplizieren also die Häufigkeit eines Keywords in einem Textdokument mit 100 und teilen diese Zahl durch die Anzahl aller Wörter in diesem Textdokument.
Mit dem Summenzeichen Σ beschreibt man mathematisch, dass vom ersten Wort bis zum n-ten Wort alle Wörter (inkl. der Keywords) gezählt werden sollen.


Was ist aber das Problem dieser Formel der Keyworddichte:

1.) Das erste Problem bzw. die Kritik zu dieser Formel der Keyworddichte ist ihre Steigung:

In der Mathematik berechnet man die Steigung einer Funktion, indem man die Funktion differenziert ("ableitet").



Wie ihr vielleicht erkennen könnt steht in der differenzierten Form der Keyworddichten (f '(k)) kein k mehr. Da k für die Anzahl eines Keywords im Textdokument steht, heißt das für diese Formel:

Die Steigungsrate ist unabhängig von der Häufigkeit des Vorkommens eines Keywords im Textdokument.

Egal ob man in einem Artikel ein Wort 5 mal als Keyword verwendet oder 20 mal, die Steigung ist für jedes Keyword gleich groß.
Für jedes neue Keyword nimmt Steigung um den gleichen Wert zu.

Beispiel:
Ein Artikel hat 300 Wörter und ein Keword wird 4 mal verwendet.
Die Keyworddichte ist dann:
f(k) = 4 *100/300 = 400/300 = 4/3 =1,33%

Die Steigung der Keyworddichte:
f '(k) = 100/300 = 1/3 (=0,33%)

Würden wir das gleiche Keyword 6 mal verwenden wäre die Keyworddichte 2% und die Steigung wieder 1/3.

Steigung der Keyworddichte


Wie ihr also sehen könnt nimmt die Steigung gleichmäßig zu, egal wie oft man ein Keyword verwendet.

Thalia.de

Und worin liegt nun das Problem?
Nun ja, seit den 70'er Jahren verwenden Datenbanken die Keyworddichte als ein Kriterium für die Relevanz der Textdokumente.
Da Suchmaschinen ihre Daten in Datenbanken abspeichern und mit einer Rankingformel die Relevanz von Textdokumenten berechnen, spielt die Keyworddichte auch hier eine wichtige Rolle.

Wenn wir nun annehmen, dass es nur ein Kriterium und zwar die Keyworddichte für ein gutes Ranking gibt, dann würde die allgemeine Formel der Keyworddichte aussagen:

Je mehr Keywords um so besser! Denn je öfters ein Keyword verwendet wird, um so größer die Keyworddichte.
Wenn also dein Konkurrent eine Keyworddichte von 50% hat, dann schreibe einen ähnlichen Text mit 51% Keyworddichte und du wirst höher ranken!

Das ist aber falsch und wird nicht klappen!
Denn logisch betrachtet, kann ein Text mit einer Keyworddichte von 40% oder 50% oder sogar 80% nicht einen Leser genügend Informationen bereit stellen.


Wie kann man aber mathematisch erklären, dass:

Suchmaschinen wie Google und Co. diese Formel der Keyworddichte nicht benutzen?


Steigerung-Gossensche Gesetz
Dafür ein kleiner Ausflug zum Gossensche Gesetz (von Hermann Heinrich Gossen):
Dieses mathematisch, volkswirtschaftlich Gesetz sagt aus:
Der Nutzen für ein und die selbe Sache nimmt nicht konstant zu, sondern bei jeder weiteren Verwendung der Sache nimmt der (Grenz-)Nutzen ab!



Beispiel :
gehen wir das erste mal in einem Kinofilm, dann ist der Nutzen groß (große Steigerung des Nutzen), auch beim zweiten mal nimmt noch der Nutzen noch zu.
Für jedes weitere mal aber, nimmt der Nutzen nur sehr wenig (bis fast gar nicht) zu! 
Die Steigerungsrate nimmt ab.(siehe Grafik: Gossensche Gesetz).


Und wie kann man das auf die Suchmaschinenoptimierung anwenden bzw.

wie kann die Keyworddichte eine anfangs starke und dann immer kleinere Steigung enthalten?


Wir verwenden die Logarithmus Funktion, denn die Steigung der Logarithmus Funktion log(k) nimmt mit steigenden k ab.

Logarithmus Funktion-Steigung
Wie ihr auf der Grafik erkennen könnt nimmt die Logaritmus Funktion zu, jedoch wächst sie nicht konstant an. Ihre Steigung nimmt nähmlich ab.

Diese Eigenschaft der Logarithmus Funktion machen wir uns zu nutze und verwenden folgende Formel:

Diese erweiterte Formel dämpft die Steigerung der Keyworddichte.

ld steht für Logarithmus Dualis und wird wie folgt berechnet:
ld(k+1) = log(k+1)/log(2)

[Dies ist keine Formel von mir, sondern wurde von Donna Herman entwickelt]

Interpretation der erweiterten Formel der Keyworddichte:
 
ld(k + 1), die 1 muss in diesen Ausdruck stehen, weil der Definitionsbereich vom Logarithmus größer Null ist:
log(0) existiert nicht, aber log(1) = 0

Sonst verändert sich bei der Berechnung der Keyworddichte nichts:
Wir teilen die Anzahl der Keywords (k+1) durch die Anzahl aller Wörter im Textdokument (a).
Nur fügen wir im Zähler, sowie im Nenner den binären Logarithmus hinzu.

Als Ergebnis bekommen wir die Keyworddichte, jedoch steigt dieser Wert nicht wie üblich konstant an. Sondern steigt mit größer werdender Keyword-Häufigkeit nur noch minimal an.

Beispiel:
Verwendet man in einem Artikel mit 500 Worte ein Keyword 10 mal, dann hat man folgenden  WDF-Wert (erweiterte Formel der Keyworddichte):


Bei der Verwendung der allg. Formel der Keyworddichte hätte man folgenden Wert:
10*100/500 = 2%

Und wenn man für das gleiche Textdokument 20 mal das gleiche Keyword verwendet, dann ist:


(Hier ist ein Fehler es müssten heißen: log(21)/log(500) = 0,4899)
Bei der allg. Formel liegt der Wert der Keyworddichte bei: 4%

Wie ihr sehen könnt nimmt der WDF-Wert nur gering zu (+0,1).
Und mit der allgemeinen Formel ist die Steigerungsrate der Keyworddichte viel höher (+2%).

Folgerung:
Die Keyworddichte ist wichtig für das Ranking, aber da mit dem WDF die Steigung minimal zunimmt spielt die Häufigkeit ab einen bestimmten Wert keine Rolle mehr.

Ich werde noch ein weiteres Problem der Keyworddichte im nächsten Artikel beschreiben
und auch noch über den WDF einen Artikel schreiben.

13 Kommentare:

  1. Mathematisch gesehen magst du vielleicht recht haben, aber Google wertes das vollkommen anders.

    Eine Keyworddichte von 2-5 % manche sagen 2-7 % wird meist empfohlen. Da keiner den genauen Wert weiß, wird hier viel spekuliert. Google macht sich es in der Form einfach, dass ggf. eine Abstufung bei zu hoher Keyworddichte erfolgt.

    AntwortenLöschen
  2. Das stimmt aber nicht das Google das anders bewertet.
    Und diese Aussage von 2 bis... ist komplett falsch!
    Denn hier führt man in jeder Analyse (egal ob Google, Nasa , Deutsche Bundesbank,...) eine Klassifizieren durch und bezieht eine Ø-Kd auf die Klasse!

    AntwortenLöschen
  3. Michael wollte auch einfach nur einen Kommentar-Link. :D

    AntwortenLöschen
    Antworten
    1. na ja, mein kleiner Blog wird ihm keinen merkbar positiven Rankingeinfluss "schenken" :-)

      Löschen
  4. Dieser Kommentar wurde vom Autor entfernt.

    AntwortenLöschen
  5. Ich habe von einer Keywordichte von 3-5 % gelesen. Jeder sagt hier was anderes, da Google die genauen richtlinien nicht preisgibt. Das meiste, was ich darüber weis habe ich mir auf dieser Seite angelesen.
    Im Ãœbrigen ein sehr aufschlussreicher Beitrag, weiter so!

    AntwortenLöschen
  6. Hallo Bernd,

    ich geh jetzt einfach mal davon aus, dass es dir nicht um das setzten eines Links ging.

    So, also warum sollte Pauschal für Sport, Politik, Wissenschaft, Kultur, .... eine Keyworddichte von 3-5% gelten?

    Also egal welches Keyword man sich aussucht immer 3-5 %? Alleine aus logischer Sicht macht das gar keinen Sinn.

    Google wurde von schlauen Menschen programmiert, der Algorithmus wurde von Mathematiker, Ingenieure und Informatiker weiterentwickelt und du denkst bei eienr sitzung, hat man sich gedacht "heyyyy 3-5% Keyworddichte das reicht um oben zu ranken"

    Also tu dir denn gefallen und versuch dich in die Welt des WDF's, IDF's, Termfrequenz, etc. einzulesen.

    Lg Armin

    AntwortenLöschen
  7. das ist ein schöner Artikel über den WDF (IDF).
    Gefällt mir wie Sie die Steigung des WDFs mit der der Keyworddichte vergliechen haben.
    Sie sollten nun aber auch einen Artikel über die Thematik: WDF*P*IDF
    schreiben.

    Lg Prof. Schlittgen

    AntwortenLöschen
    Antworten
    1. Vielen Dank und danke auch für die Anregung weitere Themen bzgl. Information Retrieval zu schreiben.
      Jedohc werden ich zum Thema IDF*P*WDF keinen Artikel schreiben bzw. jetzt noch nicht. Ich muss noch die P (Fehlerfaktor) geanuer analysieren.
      Trotzalle ist diese Gewichtungsformel für Keywords natürlich sehr interessant.

      Lg Armin

      Löschen
  8. Danke erst mal für die vielen guten Artikel! Das ist in dieser analytischen Form leider einzigartig in der deutschen SEO Szene.

    Die WDF als Ersatz für die KW Dichte zu verwenden bringt allerdings rein gar nichts (außer dass die Berechnung komplizierter ist). Jedem sollte eigentlich klar sein, dass die Funktion, die die Relevanz eines Textes beschreibz (in Abhängigkeit der Keywordhäufigkeit), konkav ist. Wenn das aber alles wäre, würde ja immernoch eine WDF von ca 1 (also KW Dichte von 100%) den größten Nutzen bringen. In der Realität wird wohl aber ab einem gewissen WDF ein Spam Filter greifen. So bleibt einem am Ende auch nichts anderes übrig, als ein WDF Intervall zu schätzen, mit dem man gerade noch so unterm Radar bleibt. Also nichts anderes als bei der KW Dichte. Und thematische Unterschiede bei den Keywords machen kann die WDF natürlich auch nicht für uns.

    lg niko

    AntwortenLöschen
  9. Hi Niko,

    danke erstmal!
    ja du hast Recht allein betrachtet bringt das nichts. Ich wollte den Lesern nur diesen Begriff "Wdf" näher bzw. genauer darstellen.

    Der WDF wird [denke ich] nicht als Spam Filter verwendet. Da gibt es ganz andere Verfahren die dafür besser geeignet sind.

    Aber um es komplizierter zu machen hätte ich [wenn man nur den WDF betrachtet] auch die Position der Keys mit einbeziehen müssen.
    Denn dieser hat eine sehr wichtige Rolle.

    Lg Armin und nochmals danke für dein Kommentar

    AntwortenLöschen
  10. Ok, verstehe. Wir müssten dann optimalerweise weitere Faktoren wie Positon der Keys, IWF, Thema etc berücksichtigen. Da hast du Recht.

    Ich hatte nur in letzter Zeit immer wieder das Gefühl, dass die Leute, die keinen Zugang zu Tools zur Berechnung der IWF haben, einfach die Keyworddichte durch die WDF ersetzen. Dazu ist glaube ich sogar schon ein Wordpress Plugin raus gekommen. Naja, wie auch immer - ich freu mich auf weitere Artikel von dir ;) Danke dafür!

    Guten Rutsch!
    Niko

    AntwortenLöschen
  11. Wieso ist hier alles unterstrichen, was kein Link ist???

    AntwortenLöschen