Wenn Sie herausfinden möchten, ob mehrere Gruppen von Daten statistisch signifikante Unterschiede aufweisen, können Sie die Varianzanalyse (ANOVA) der XL Toolbox verwenden. Die ANOVA-Funktion von Daniel’s XL Toolbox bietet einige Vorteile gegenüber der mitgelieferten Varianzanalyse des ‘analysis toolpaks’. So können Daten in Tabellen oder Listen angeordnet werden, und die XL Toolbox bietet mehrere Posthoc-Analysen zur Auswahl.

Sie können die Varianzanalyse (ANOVA) auch verwenden, um den Unterschied zwischen nur zwei Gruppen zu analysieren. Hierfür wird in der Regel der Studentsche T-Test verwendet. Obwohl die Rechenwege von ANOVA und T-Test sich unterscheiden, ergeben sich bei der Analyse von nur zwei Gruppen jedoch exakt dieselben P-Werte.

Dateneingabe

Anders als viele Statistikprogramme ist die XL Toolbox sehr flexibel, was das Layout der Daten angeht.

Die Daten können in Spalten oder in Zeilen (vgl. Abb.) gruppiert sein.

Sie können die Daten jedoch auch als ungeordnete Liste anordnen. Diese Liste kann vertikal (wie abgebildet) oder auch horizontal sein.

Annahme der Varianzhomogenität (Homoskedastizität)

Eine Voraussetzung für eine Varianzanalyse ist die Homogenität der Varianzen in den einzelnen Datengruppen (Homoskedastizität). Um diese Voraussetzung zu prüfen, verwendet die XL Toolbox eine modifizierte Form von Levene’s Test, die von Glantz und Slinker in dem Buch “Primer of Applied Regression & Analysis of Variance” beschrieben wurde.

Der Test transformiert die Daten, indem er den Absolutwert der Differenz zwischen einem Wert und dem Medianwert der entsprechenden Gruppe berechnet; anschließend wird eine Varianzanalyse der transformierten Daten durchgeführt.

Wenn diese Gruppenmittelwerte der transformierten Daten statistisch signifikant voneinander verschieden sind (p < 0,05), wird die Annahme der Homoskedastizität verworfen. In diesem Falle ist eine Grundvoraussetzung der ANOVA nicht gegeben, und sie sollten die Ergebnisse mit größter Vorsicht interpretieren.

Wenn keine Homoskedastizität gegeben ist, kennt die Statistik die Möglichkeit, einen sog. parameterfreien Test durchzuführen, z.B. einen Kruskal-Wallis-Test. Die Toolbox bietet diesen Test gegenwärtig jedoch nicht an.

ANOVA-Tabellen

Daten können für die Varianzanalyse in Zeilen oder Spalten angeordnet sein.

Listen für ANOVA

Auch Listen können für die Varianzanalyse verwendet werden.

Multiples Testen/Posthoc-Tests

Eine ANOVA gibt nur allgemein darüber Auskunft, ob die Unterschiede der Mittelwerte mehrerer Datengruppen signifikant sind; die ANOVA erlaubt jedoch keinen Aufschluß darüber, welche der zahlreichen möglichen Vergleiche zwischen jeweils zwei der Gruppen signifikant verschieden sind. Für solche multiplen Vergleiche bietet die XL Toolbox drei sogenannte Posthoc-Tests an.

Screenshot der verfügbaren Posthoc-Tests

Die XL Toolbox bietet die folgenden Methoden an:

  • Bonferroni-Holm: Dieser Test ist sehr konservativ. In bestimmten Situationen kann das dazu führen, daß die ANOVA allgemein einen signifikanten Unterschied feststellt, im direkten Vergleich von jeweils zwei Gruppenpaaren jedoch keine Signifikanz gefunden wird.
  • Holm-Sidak: Etwas weniger konservativ als Bonferroni-Holm.
  • Tukey: Tukey ist der am wenigsten konservative Test unter den drei angebotenen.

Die XL Toolbox verwendet Algorihmen aus dem Buch von Jerrold H. Zar, Biostatistical Analysis (ISBN: 0131008463).

Wichtiger Hinweis zum Tukey-Test

Der Tukey-Test berechnet eine sogenannte “studentisierte Spannweite” (studentized range). Daraus resultiert eine sog. G-Verteilung, zu der Excel selbst leider keine p-Werte berechnen kann. Daher wurde ein Algorithmus der StatLib-Programmbibliothek adaptiert (Royal Statistical Society, algorithm no. 190).

Die Berechnung eines p-Wertes anhand eines gegebenen G-Wertes geschieht dabei nur näherungsweise, allerdings mit einer für die meisten Fälle wohl ausreichenden Genauigkeit. Die Werte unterscheiden sich jedoch von den G- und p-Werten, wie sie mit dem Statistikprogramm “R” errechnet werden können (ptukey-Funktion):

Untenstehend ist ein Vergleich der Algorithmen. Die Daten, mit denen diese Berechnungen gemacht wurden, sind nicht mit abgebildet.

q Freiheitsgrade Anzahl Gruppen p Diff.
1.34715 9 3 0.377056 (Toolbox)
0.377143 (R)
0.000087
(0.02 %)
2.88675 9 3 0.841966 (Toolbox)
0.842072 (R)
0.000106
(0.01 %)
0.67934 25 5 0.0114509 (Toolbox)
0.0115197 (R)
0.000069
(0.6 %)

Daraus folgt, daß Sie bei kritischen Analysen, oder wenn Tukey-p-Werte der XL Toolbox nahe am Alpha (0,05) liegen, Ihre Daten mit einer weiteren Software überprüfen sollten (z.B. mit dem frei verfügbaren R-Project).

Berichte

Die ANOVA-Ergebnisse werden auf dem Bildschirm in sehr verkürzter Form wiedergegeben; hier ist hauptsächlich der P-Wert von Interesse. Um auch Zwischenergebnisse der Berechnungen nachvollziehen zu können, drücken Sie auf die Schaltfläche “Bericht”. Die Toolbox wird den ausführlichen ANOVA-Bericht als neues Tabellenblatt in Ihre Datei einfügen.

Einschränkungen

Die XL Toolbox kann die Daten gegenwärtig nicht auf Normalität prüfen, welche eine weitere Voraussetzung ist (neben der Homoskedastizität, siehe oben).

In vielen Anwendungsfällen (vor allem in der biomedizinischen [Grundlagen-]Forschung mit oft nicht mehr als ein paar Dutzend Meßwerten) darf man die Validität eines Tests auf Normalverteilung grundsätzlich anzweifeln, da aufgrund der wenigen Datenpunkte mit geringer Power eines solchen Tests zu rechnen ist. Deshalb wird die Toolbox voraussichtlich auch in Zukunft keine Normalverteilung testen.