Donnerstag, 23. August 2012

Problem der Keyworddichte-Keyworddichte berechnen und analysieren

Die Seo Kennzahl "Keyworddichte" besser verstehen lernen

Dies wird mein zweiter Artikel über die Keyworddichte.
In meinem ersten Artikel über die Keyworddichte ging es hauptsächlich um die Definition dieser Seo Kennzahl und darum wie man sie ermitteln kann. Ich habe aber auch einen Tipp zur Anwendung eines (Haupt-)Keyword in Bezug auf die Keyworddichte im ersten Artikel gegeben.

Kommen wir nun zum zweiten Teil:

Problem der Keyworddichte-Keyworddichte berechnen und analysieren

Definition Keyworddichte: relative Häufigkeit eins Schlüsselwortes (Keywords) in einem Textdokument.

Die allgemeine Formel zur Berechnung der Keyworddichte lautet:



Erklärung:
wir multiplizieren also die Häufigkeit eines Keywords in einem Textdokument mit 100 und teilen diese Zahl durch die Anzahl aller Wörter in diesem Textdokument.
Mit dem Summenzeichen Σ beschreibt man mathematisch, dass vom ersten Wort bis zum n-ten Wort alle Wörter (inkl. der Keywords) gezählt werden sollen.


Was ist aber das Problem dieser Formel der Keyworddichte:

1.) Das erste Problem bzw. die Kritik zu dieser Formel der Keyworddichte ist ihre Steigung:

In der Mathematik berechnet man die Steigung einer Funktion, indem man die Funktion differenziert ("ableitet").



Wie ihr vielleicht erkennen könnt steht in der differenzierten Form der Keyworddichten (f '(k)) kein k mehr. Da k für die Anzahl eines Keywords im Textdokument steht, heißt das für diese Formel:

Die Steigungsrate ist unabhängig von der Häufigkeit des Vorkommens eines Keywords im Textdokument.

Egal ob man in einem Artikel ein Wort 5 mal als Keyword verwendet oder 20 mal, die Steigung ist für jedes Keyword gleich groß.
Für jedes neue Keyword nimmt Steigung um den gleichen Wert zu.

Beispiel:
Ein Artikel hat 300 Wörter und ein Keword wird 4 mal verwendet.
Die Keyworddichte ist dann:
f(k) = 4 *100/300 = 400/300 = 4/3 =1,33%

Die Steigung der Keyworddichte:
f '(k) = 100/300 = 1/3 (=0,33%)

Würden wir das gleiche Keyword 6 mal verwenden wäre die Keyworddichte 2% und die Steigung wieder 1/3.

Steigung der Keyworddichte


Wie ihr also sehen könnt nimmt die Steigung gleichmäßig zu, egal wie oft man ein Keyword verwendet.

Thalia.de

Und worin liegt nun das Problem?
Nun ja, seit den 70'er Jahren verwenden Datenbanken die Keyworddichte als ein Kriterium für die Relevanz der Textdokumente.
Da Suchmaschinen ihre Daten in Datenbanken abspeichern und mit einer Rankingformel die Relevanz von Textdokumenten berechnen, spielt die Keyworddichte auch hier eine wichtige Rolle.

Wenn wir nun annehmen, dass es nur ein Kriterium und zwar die Keyworddichte für ein gutes Ranking gibt, dann würde die allgemeine Formel der Keyworddichte aussagen:

Je mehr Keywords um so besser! Denn je öfters ein Keyword verwendet wird, um so größer die Keyworddichte.
Wenn also dein Konkurrent eine Keyworddichte von 50% hat, dann schreibe einen ähnlichen Text mit 51% Keyworddichte und du wirst höher ranken!

Das ist aber falsch und wird nicht klappen!
Denn logisch betrachtet, kann ein Text mit einer Keyworddichte von 40% oder 50% oder sogar 80% nicht einen Leser genügend Informationen bereit stellen.


Wie kann man aber mathematisch erklären, dass:

Suchmaschinen wie Google und Co. diese Formel der Keyworddichte nicht benutzen?


Steigerung-Gossensche Gesetz
Dafür ein kleiner Ausflug zum Gossensche Gesetz (von Hermann Heinrich Gossen):
Dieses mathematisch, volkswirtschaftlich Gesetz sagt aus:
Der Nutzen für ein und die selbe Sache nimmt nicht konstant zu, sondern bei jeder weiteren Verwendung der Sache nimmt der (Grenz-)Nutzen ab!



Beispiel :
gehen wir das erste mal in einem Kinofilm, dann ist der Nutzen groß (große Steigerung des Nutzen), auch beim zweiten mal nimmt noch der Nutzen noch zu.
Für jedes weitere mal aber, nimmt der Nutzen nur sehr wenig (bis fast gar nicht) zu! 
Die Steigerungsrate nimmt ab.(siehe Grafik: Gossensche Gesetz).


Und wie kann man das auf die Suchmaschinenoptimierung anwenden bzw.

wie kann die Keyworddichte eine anfangs starke und dann immer kleinere Steigung enthalten?


Wir verwenden die Logarithmus Funktion, denn die Steigung der Logarithmus Funktion log(k) nimmt mit steigenden k ab.

Logarithmus Funktion-Steigung
Wie ihr auf der Grafik erkennen könnt nimmt die Logaritmus Funktion zu, jedoch wächst sie nicht konstant an. Ihre Steigung nimmt nähmlich ab.

Diese Eigenschaft der Logarithmus Funktion machen wir uns zu nutze und verwenden folgende Formel:

Diese erweiterte Formel dämpft die Steigerung der Keyworddichte.

ld steht für Logarithmus Dualis und wird wie folgt berechnet:
ld(k+1) = log(k+1)/log(2)

[Dies ist keine Formel von mir, sondern wurde von Donna Herman entwickelt]

Interpretation der erweiterten Formel der Keyworddichte:
 
ld(k + 1), die 1 muss in diesen Ausdruck stehen, weil der Definitionsbereich vom Logarithmus größer Null ist:
log(0) existiert nicht, aber log(1) = 0

Sonst verändert sich bei der Berechnung der Keyworddichte nichts:
Wir teilen die Anzahl der Keywords (k+1) durch die Anzahl aller Wörter im Textdokument (a).
Nur fügen wir im Zähler, sowie im Nenner den binären Logarithmus hinzu.

Als Ergebnis bekommen wir die Keyworddichte, jedoch steigt dieser Wert nicht wie üblich konstant an. Sondern steigt mit größer werdender Keyword-Häufigkeit nur noch minimal an.

Beispiel:
Verwendet man in einem Artikel mit 500 Worte ein Keyword 10 mal, dann hat man folgenden  WDF-Wert (erweiterte Formel der Keyworddichte):


Bei der Verwendung der allg. Formel der Keyworddichte hätte man folgenden Wert:
10*100/500 = 2%

Und wenn man für das gleiche Textdokument 20 mal das gleiche Keyword verwendet, dann ist:


(Hier ist ein Fehler es müssten heißen: log(21)/log(500) = 0,4899)
Bei der allg. Formel liegt der Wert der Keyworddichte bei: 4%

Wie ihr sehen könnt nimmt der WDF-Wert nur gering zu (+0,1).
Und mit der allgemeinen Formel ist die Steigerungsrate der Keyworddichte viel höher (+2%).

Folgerung:
Die Keyworddichte ist wichtig für das Ranking, aber da mit dem WDF die Steigung minimal zunimmt spielt die Häufigkeit ab einen bestimmten Wert keine Rolle mehr.

Ich werde noch ein weiteres Problem der Keyworddichte im nächsten Artikel beschreiben
und auch noch über den WDF einen Artikel schreiben.