Der Kariesbefall bei Kindern wird heute üblicherweise
anhand des Mittelwerts aller Kinder inklusive des kariesfreien
Anteils der Kinder dargestellt. Diese Angabe ist jedoch wenig
aussagefähig, da sie der tatsächlichen
Häufigkeitsverteilung
des Kariesbefalls nicht gerecht wird. Nur bei rein zufällig
auftretenden Ereignissen, die einer Poisson-Verteilung folgen,
ist die Angabe des Mittelwerts allein sachgerecht. Dieses
Dokument soll zeigen, wie durch Anwendung der negativen
Binomialverteilung mit zwei einfachen Kennwerten eine bessere
Darstellung der Ergebnisse kariesepidemiologischer Studien
erreicht werden kann.
Im Schrifttum wurden die Ergebnisse einer Studie zur
"Kariesfreiheit und dmfs
5-6jähriger Kinder in Österreich" wiedergegeben #[2]. Dabei wurden drei übliche Formen der
Aufbereitung der epidemiologischen Daten gewählt:
Abb. 1: Verteilung der kariösen/gefüllten Zahnflächen (d3fs) bei 467 Kindern, nach #[2]
|
Der Mittelwert ist dann aussagefähig, wenn die Verteilung der
Zahl von d3f-Flächen auf die einparametrige
Poisson-Verteilung zurückgeführt werden kann. Dann
müsste die
Zahl der d3f-Flächen je Kind mit einer
Standardabweichung
um den Mittelwert µ streuen, der wiederum durch den Mittelwert
geschätzt wird. Abbildung 2 zeigt die empirische
Häufigkeitsverteilung in Reihe 1 mit dem Mittelwert
= 4
im Vergleich zur Poisson-Verteilung
mit dem Mittelwert µ = 4. Dass theoretisches
Modell
und empirische Verteilung nicht zusammenpassen, ist
augenscheinlich. Vor allem wird deutlich, dass der hohe Anteil
kariesfreier Kinder mit dem Modell der Poisson-Verteilung allein
nicht erklärt werden kann.
Abb. 2: Vergleich der empirischen Verteilung (R1) mit der Poisson-Verteilung (R2)
|
Ein gemeinsames Erklärungsmodell liefert die negative
Binomialverteilung, die als Überlagerung von zwei Verteilungen
gedeutet werden kann. Dabei wirkt primär eine Verteilung von
Kariesrisiken, die durch die Gamma-Verteilung beschrieben
werden kann. Diese Gamma-Verteilung sorgt für individuell
schwankende Mittelwerte µ. Je nach Ausprägung des
Mittelwerts
folgt dann als sekundäre Verteilung der faktisch betroffenen
Zahnflächen die Poisson-Verteilung.
Demnach lässt sich die Wahrscheinlichkeit für genau x
kariöse/gefüllte Zahnflächen nach #[4],
S. 24 beschreiben als:
mit k > 0 und
0 < p
< 1 (Formel 1)
Sofern k keine ganze Zahl ist und kein Rechner für rationale
Fakultäten zur Verfügung steht, kann Formel 1 durch die
Formeln
5 und 8 ersetzt werden.
Die beiden Parameter p und k werden aus der Stichprobe
geschätzt als Kennwerte
und
. Die
Vorgehensweise kann anhand der Werte aus
Tabelle 1 nachvollzogen werden.
Tabelle 1: Zahl von kariösen/gefüllten Zahnflächen (d3f-Flächen) je Kind in einer Stichprobe von 467 Kindern; nach. #[3].
| d3f-Flächen x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| Kinder nx | 221 | 32 | 42 | 27 | 27 | 13 | 11 | 9 | 8 | 14 | 6 | 5 | 4 | 7 | 6 |
| d3f-Flächen x | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| Kinder nx | 4 | 4 | 1 | 1 | 3 | 3 | 3 | 3 | - | 1 | 1 | - | 1 | 1 | - |
| d3f-Flächen x | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 |
| Kinder nx | - | 1 | 1 | - | 1 | 1 | 1 | 2 | 1 | - | - | - | - | - | - |
| d3f-Flächen x | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 |
| Kinder nx | - | - | 1 | - | - | - | - | - | - | - | - | - | - | - | - |
Berechnet werden zunächst Mittelwert
und Varianz s² anhand der
klassierten Werte:
(Formel 2)
(Formel 3)
Nach #[4], Seite 101 wird der
Schätzwert des Parameters p der negativen Binomialverteilung
folgendermaßen berechnet:
(Formel 4)
Der andere Parameter der negativen Binomialverteilung ist k.
Nach Formel 1 kann er zur Berechnung des Anteil kariesfreier
Kinder g(0) genutzt werden, denn es gilt:
(Formel 5)
Bei stark besetzter Nullklasse, also einem hohen Anteil
kariesfreier Kinder kann g(0) hinreichend genau geschätzt werden
durch:
(Formel 6)
Nach den Formeln 5 und 6 ergibt sich damit ein Kennwert für
den zweiten Parameter der negativen Binomialverteilung:
(Formel 7)
Um den Vergleich zwischen der empirischen Verteilung und der
negativen Binomialverteilung in Abbildung 3 zu ermöglichen,
werden die Werte der Wahrscheinlichkeitsfunktion g(x) unter
Verwendung der Schätzwerte mit p = 0,082 und
k = 0,299 rekursiv berechnet. Startwert ist g(0) nach
Formel 5. Dann gilt für alle weiteren Werte.
(Formel 8)
Abb. 3: Vergleich der empirischen Verteilung (R1) mit der negativen Binomialverteilung (R2)
|
Nach #[4], Seite 101 kann der
Schätzwert des Parameters k der negativen Binomialverteilung
auch so berechnet werden:
(Formel 9)
Diese Berechnung liefert im vorliegenden Fall aber die weniger
gute Anpassung und bietet sich daher vor allem bei schwächer
besetzter Nullklasse an.
Die positive Wahrscheinlichkeitsansteckung nach dem
Motto "Ein Unglück kommt selten allein." ist hier
wirksam. Wenn eine kariöse/gefüllte Zahnfläche auftritt,
folgen oft mehrere. Durch Faktoren wie Ernährung, Zahnpflege,
Fluoridierung, Veranlagung usw. kann das Kariesrisiko für alle
Zähne und Zahnflächen eines Kindes gemeinsam beeinflusst
werden. Diese Einflüsse sorgen dafür, dass der
Mittelwert µ je
nach Risikogruppe schwankt.
Ohne Mittelwertschwankungen liegt eine Poisson-Verteilung vor.
Dann ist das Verhältnis zwischen Mittelwert und Varianz
p = µ/
= 1. Demnach
muss bei einer Poisson-Verteilung
gelten. Wir können den Kennwert
also als den Anteil der Varianz
veranschaulichen,
der aus dem Mittelwert und somit aus der Poisson-Verteilung
erklärt werden kann. Bei
= 0,082 ist
die Streuung demnach maßgeblich von der im Hintergrund wirkenden
Gamma-Verteilung verursacht.
Beschrieben werden die Mittelwertschwankungen durch die
primär wirkende zweiparametrige Gamma-Verteilung mit der
Wahrscheinlichkeitsdichtefunktion:
(Formel 10)
Darin ist e die Eulersche Zahl 2,71828...,
die
Gammafunktion, k der Parameter von negativer
Binomialverteilung und Gamma-Verteilung und
der zweite
Parameter der Gamma-Verteilung, der aus dem Parameter der
negativen Binomialverteilung berechnet wird:
(Formel 11)
Wir wollen nun die Form der in Abbildung 4 gezeigten
Gamma-Verteilung bestimmen und verwenden
= 0,299
anstelle von k und schätzen
durch:
(Formel 12)
Abb. 4: Form der Gamma-Verteilung mit den Parametern k = 0,299 und = 0,089
|
Wie bereits erwähnt, kann die Gamma-Verteilung als Verteilung
des Kariesrisikos angesehen werden. Deshalb soll die
Verteilungsform der Gamma-Verteilung beurteilt werden. Dazu
werden die beiden Parameter k = 0,299 und
= 0,089 jeweils mit dem willkürlich zur
Veranschaulichung gewählten Faktor fünf multipliziert und
durch
den ebenso willkürlichen Divisor fünf geteilt. Die daraus
folgenden Verteilungsformen sind in Abbildung 5 dargestellt. Es
zeigen sich die Eigenschaften der Parameter.
k ist der Formparameter der Gamma-Verteilung. Für
k <= 1 ist die Gamma-Verteilung L-förmig; bei
k > 1 wird die Verteilung eingipflig. Je kleiner k
ausfällt, desto schiefer ist die Verteilung. Wenn
k << 1, bedeutet dies für die Verteilung des
Kariesrisikos, dass die Wahrscheinlichkeit
"kerngesunder" Zähne bei einem hohen Teil der
untersuchten Kinder hoch ist. Mit anderen Worten, je kleiner der
Stichproben-Kennwert
, desto besser kann die
Zahngesundheit der betrachteten Grundgesamtheit per se eingestuft
werden.
ist der Streuparameter der Gamma-Verteilung. Je kleiner
ausfällt, desto größer ist die Streubreite. Ziel einer
flächendeckenden Prophylaxe muss es sein, diese Streuung zu
reduzieren und die "schlechten" Kariesrisiken nach
links zu verschieben, wodurch
steigt. Ziel der Kariesprophylaxe
wäre damit die Maximierung von
.
Der Erwartungswert oder Mittelwert der Gamma-Verteilung E(µ)
und der negativen Binomialverteilung E(x) sind übrigens gleich:
(Formel 13)
Dies verdeutlicht nochmals, dass der Mittelwert
als Schätzwert des Erwartungswerts allein wenig
aussagefähig ist, da sich der Erwartungswert aus unendlich
vielen Wertepaaren {k; p} oder {k;
} erzeugen
lässt.
Abb. 5: Formen der Gamma-Verteilung mit den Parametern k = 0,299, k/5 und k 5 sowie = 0,089, /5 und *5
|
Der Mittelwert allein ist als Kenngröße für
kariesepidemiologische Untersuchungen bzgl. der Zahl befallener
Zahnflächen nicht ausreichend aussagefähig, da er ohne
weitere
Angaben implizit das Modell der Poisson-Verteilung voraussetzt.
Daher wird die negative Binomialverteilung als Alternativmodell
für d3f-Flächen vorgeschlagen, weil es
augenscheinlich eine bessere Übereinstimmung von theoretischem
Modell und empirischen Daten aufweist. Außerdem ist das Modell
der negativen Binomialverteilung in der Literatur für andere
epidemiologische Auswertungen beschrieben; so z. B. als
Verteilung der Zahl von Zecken je Schaf einer Herde - vgl. #[1], Seite 154. Zwei einfach zu berechnende
Kennwerte
und
beschreiben die
Verteilung und sind damit einfach und praktikabel zu handhaben.
Hintergrund der negativen Binomialverteilung ist das Wirken
einer primären Verteilung von Kariesrisiken, das laut Modell
durch eine zweiparametrige Gamma-Verteilung beschrieben werden
kann. Die rechnerisch ebenfalls einfache Bestimmung zweier
Kennwerte
und
der
Gamma-Verteilung dürften einen einfachen Vergleich von
Zahngesundheit und Prophylaxe-Einfluss verschiedener Populationen
ermöglichen.
Dieser Beitrag hat das Ziel, die Fachwelt mit diesem
Analysewerkzeug vertraut zu machen und sie zur Anwendung auf
Daten weiterer Untersuchungen anzuregen.
Danke, dass Sie sich die Zeit zum Lesen genommen haben.
Elmar Hillel, Stand: 2004-09-15
Mail: negbin@hillel.de
Zurück zum Kopf der Seite
Zurück zur Empfangsseite