Ungepaarter t-Test mit R: Normalverteilung überprüfen | StatistikGuru.de (2024)

ungepaarter t-Test mit R
Ungepaarter t-Test mit R: Normalverteilung überprüfen | StatistikGuru.de (1)

Der t-Test ist ein parametrisches Verfahren. Das bedeutet, dass er auf bestimmten Annahmen über die Parameter der Verteilung der Daten beruht. Viele parametrische Tests basieren auf der Annahme, dass die Daten normalverteilt sind. Das bedeutet, dass die mathematischen Eigenschaften, auf denen die Teststatistik beruht, die Charakteristika einer Normalverteilung voraussetzen.

Wenn die Voraussetzung der Normalverteilung erfüllt ist, ist die statistische Power – also die Wahrscheinlichkeit, eine tatsächlich vorhandene Effektstärke auch statistisch nachweisen zu können – optimiert. Abweichungen von der Normalverteilung können zu einer reduzierten Testpower führen, wodurch echte Effekte möglicherweise nicht erkannt werden.

Die Bedeutung der Normalverteilungsannahme wird jedoch von etlichen Studien in Frag gestellt. Es existieren zahlreiche Belege dafür, dass Regressionsmodelle – und dazu gehört auch der t-Test – gegenüber Verletzungen der Normalverteilung robust sind (Glass, Peckham, & Sanders, 1972; Harwell, Rubinstein, Hayes, & Olds, 1992; Lix, Keselman, & Keselman, 1996).

Wenn unsere Stichprobe ausreichend groß ist (n>30 für jede der beiden Gruppen) können wir auch auf die Überprüfung der Normalverteilung verzichten, da nach dem zentralen Grenzwertsatz die Stichprobenverteilung annähernd normalverteilt sein wird (Bortz & Schuster, 2010; Herzog, Francis, & Clarke, 2019, p. 56; Stone, 2010, p. 1554; Tavakoli, 2013). Bei nur geringen Abweichungen der Normalverteilung können laut Stone (2010,p. 1554) auch „deutlich kleinere Stichprobengrößen [übersetzt]“ als n>30 als normalverteilt angesehen werden.

Kubinger et al. (2009) empfehlen sogar ab einer Stichprobengröße von n>30 gar nicht erst die Normalverteilung zu überprüfen uns stattdessen eine robustereVariante des ungepaarten t-Test zu berechnen (den Welch-Test), auf die wir auf späteren Seiten noch weiter eingehen werden.

Normalverteilung in R überprüfen: Der Shapiro-Wilk-Test

Der Shapiro-Wilk-Test gilt als leistungsfähiges Testverfahren um die Normalverteilung einer Variablen zu überprüfen. Er ist in R direkt über die Funktion shapiro.test() erreichbar, ohne das weitere Pakete installiert werden müssen.

Anderes als bei normalen Testverfahren, wollen wir beim Shapiro-Wilk-Test nicht, das er signifikant wird. Denn, ein signifikanter p-Wert würde darauf hinweisen, dass wir keine Normalverteilung in unseren Daten haben. Anderes ausgedrückt: Ist der p-Wert des Shapiro-Wilk-Test p<.05, dann sind unsere nicht Normalverteilt (in der Regel testen wir auf einem Signifikanzniveau von .05).

Wir können die Normalverteilung in unseren beiden Gruppen testen, indem wir mit dpylr unseren Datensatz nach gruppe gruppieren und dann reaktionszeit in jeder Gruppe mit dem Shapiro-Wilk-Test auf Normalverteilung überprüfen:

R Code

library(tidyverse)library(rstatix)alkohol_reaktionszeit %>% group_by(gruppe) %>% shapiro_test(reaktionszeit)# gruppe variable statistic p# <dbl+lbl> <chr> <dbl> <dbl># 1 1 [Alkohol] reaktionszeit 0.845 0.0000112# 2 2 [kein Alkohol] reaktionszeit 0.769 0.000000184

Der p-Wert ist des Shapiro-Wilk-Tests ist bei unseren Daten p=.003518 (oben in der Ausgabe gelb umrahmt). Gemäß dem Shapiro-Wilk Test sind die Daten in unserem Beispieldatensatz nicht normalverteilt. Da unsere Stichprobengröße jedoch n > 30 ist, ist unsere Stichprobe hinreichend groß, um dennoch von einer Normalverteilung ausgehen zu können (Stone, 2010, p. 1563). Gründe für ein signifikantes Testergebnis bezüglich der Normalverteilung können sein:

  • Die Daten sind nicht normalverteilt.
  • Es gibt Ausreißer in den Daten.
  • Die Daten sind (stark) schief verteilt.
  • Die Stichprobengröße ist hoch.

Wenn unsere Stichprobe nicht ausreißend groß gewesen wäre (n<30), hätten wir das Ergebnis desShapiro-Wilk Test so berichten können:

Deutsch
Beide Gruppen waren waren gemäß dem Shapiro-Wilk Test nicht normalverteilt (p<.001).

English
Both groupswere not normally distributed, as assessed by the Shapiro-Wilk test (p<.001).

Normalverteilung in R überprüfen: Q-Q-Plots

Q-Q-Plots (Quantil-Quantil-Diagramme) sind eine visuelle Methode, um die Normalverteilung zu überprüfen. Sie stellen die Quantile der Stichprobenverteilung gegen die Quantile einer Normalverteilung dar. Wenn die Punkte im Q-Q-Plot nahe an der Diagonalen liegen, die oft als Referenzlinie eingezeichnet wird, deutet dies darauf hin, dass die Stichprobe normalverteilt ist. Große Abweichungen von dieser Linie können auf eine Nicht-Normalverteilung hinweisen.

R stellt standardmäßig die Funktion qqnorm() zur Verfügung, mit der wir Q-Q-Plots erstellen können. Diese Funktion gibt uns zwar einen Q-Q-Plot aus – aber auch nur einen Q-Q-Plot mit Basisausstattung. Bessere Q-Q-Plots können wir mit der Funktion qqPlot() aus dem Paket car erstellen, die wir auch hier verwenden werden. Der große Vorteil von qqPlot() ist auch, das wir eine Grafik für beide Gruppen erstellen können.

R Code

# Wir müssen das car Paket zuerst einbindenlibrary(car)# Dann können wir einen Q-Q-Plot mit der Funktion qqPlot() aus car erstellenqqPlot(reaktionszeit ~ gruppe, data = alkohol_reaktionszeit)

Wenn wir den Code oben in R ausführen, bekommen wir das Diagramm unten erstellt:

Im Idealfall sollten die Datenpunkte entlang der eingezeichneten Diagonale (die dunkelblaue Linie, die sich von einer Seite des Diagramms zur anderen Seite durchzieht) liegen. Diese Linie repräsentiert, wo die Punkte liegen würden, wenn die Daten perfekt normalverteilt wären. Datenpunkte, die entlang dieser Linie liegen, weisen darauf hin, dass die Daten annähernd normalverteilt sind. Kleine Abweichungen sind in der Praxis normal, insbesondere in den Enden (den „tails“) der Verteilung.

Darüber hinaus gibt qqPlot() Konfidenzintervalle für die Quantile aus. Das sind die etwas helleren, blauen Bänder um die Referenzlinie herum. Wenn Punkte innerhalb dieser Bänder liegen, können wir davon ausgehen, dass die Abweichungen von der Normalität nicht signifikant sind. Sollten viele Punkte außerhalb dieser Bänder liegen, wäre dies ein Anzeichen dafür, dass die Normalverteilungsannahme möglicherweise verletzt ist.

In unserem Fall sehen wir größere Abweichungen von der Diagonale im Q-Q-Plot, was dafür spricht, dass die Daten in den beiden Gruppe nicht normalverteilt sind, was auch die Ergebnisse des Shapiro-Wilk-Test widerspiegelt.

Eine systematische Abweichung von der Normalitätslinie deutet auf mangelnde Normalität hin. Wenn die Punkte in den Endbereichen des Plots systematisch über oder unter der Linie liegen, könnte dies auf eine schiefe Verteilung hinweisen – liegen sie oben, ist die Verteilung rechtsschief; liegen sie unten, linksschief. Ein „S“-förmiger Verlauf deutet auf leptokurtische Verteilungen hin, die stärkere Spitzen und schwerere Enden als eine Normalverteilung aufweisen, während eine inverse „S“-Form auf eine platykurtische Verteilung hindeutet, bei der die Daten flacher sind.

Normalverteilung verletzt! Was nun?

Wenn sich herausstellt, dass die Daten nicht normalverteilt sind, ist der t-Test dennoch oft robust genug, um verlässliche Ergebnisse zu liefern, besonders wenn die Stichprobengröße größer als 30 ist. Dies ermöglicht es uns, die Annahme der Normalverteilung in einigen Fällen zu übergehen, wie es auch bei Stone (2010, p. 1563) zu lesen ist. Ist die Stichprobengröße jedoch kleiner oder wenn aus anderen Gründen Bedenken bezüglich der Verletzung der Normalverteilung bestehen, können folgende Strategien verfolgt werden:

  • Daten-Transformation anwenden: Ziel solcher Transformationen ist es, die Daten so zu adjustieren, dass sie weniger von einer Normalverteilung abweichen. Allerdings ist hier Vorsicht geboten, denn die Interpretation von Transformierten Daten kann schwieriger sein.
  • Nicht-parametrische Tests wählen: Nicht-parametrische Tests stellen keine spezifischen Anforderungen an die Verteilung der Daten. Für ungepaarte Stichproben wäre eine Alternative zum ungepaarten t-Test der Mann-Whitney-U-Test (der sich in R über die Funktion wilcox.test berechnen lässt), der Unterschiede zwischen ungepaarten Beobachtungen ohne die Annahme der Normalverteilung untersucht. Allerdings ist auch hier Vorsicht geboten, den nicht-parametrische verfahren haben meist andere Hypothesen, als ihre parametrischen Zwillinge.
  • Ohne Anpassung fortfahren: Der t-Test ist generell robust gegenüber Verletzungen der Normalverteilung. Vor allem der Welch-Test, auf den wir auf den kommenden Seiten noch näher eingehen werden, gilt als robust. Daher kann eine Alternative auch sein, keine weiteren Schritte vorzunehmen und mit der Analyse und der Berechnungen des ungepaarten t-Tests bzw. Welch-Test einfach fortzufahren.

Wir fahren bei unseren Daten mit der weiteren Analyse fort. Wir sind jetzt mit der Prüfung aller Voraussetzungen fertig. Auf der Seite Seite geht es ans Eingemachte: Wir führen die eigentliche Berechnung des t-Tests in R durch.

Literaturverzeichnis

  1. Bortz, J., & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7., vollständig überarbeitete und erweiterte Auflage). Springer-Lehrbuch. Berlin, Heidelberg: Springer-Verlag Berlin Heidelberg.
  2. Glass, G. V., Peckham, P. D., & Sanders, J. R. (1972). Consequences of Failure to Meet Assumptions Underlying the Fixed Effects Analyses of Variance and Covariance. Review of Educational Research, 42(3), 237–288. doi:10.3102/00346543042003237
  3. Harwell, M. R., Rubinstein, E. N., Hayes, W. S., & Olds, C. C. (1992). Summarizing Monte Carlo Results in Methodological Research: The One- and Two-Factor Fixed Effects ANOVA Cases. Journal of Educational and Behavioral Statistics, 17(4), 315–339. doi:10.3102/10769986017004315
  4. Herzog, M. H. a., Francis, G., & Clarke, A. (2019). Understanding statistics and experimental design: How to not lie with statistics. Learning materials in biosciences. Cham, Switzerland: Springer.
  5. Kubinger, K. D., Rasch, D. & Moder, K. (2009). Zur Legende der Voraussetzungen des t-Tests für unabhängige Stichproben. Psychologische Rundschau, 60(1), 26–27. doi:10.1026/0033-3042.60.1.26
  6. Lix, L. M., Keselman, J. C., & Keselman, H. J. (1996). Consequences of Assumption Violations Revisited: A Quantitative Review of Alternatives to the One-Way Analysis of Variance F Test. Review of Educational Research, 66(4), 579–619. doi:10.3102/00346543066004579
  7. Stone, E. R. (2010). t Test, Paired Samples. In N. J. Salkind (Ed.), Encyclopedia of research design (pp.1560–1565). Los Angeles: SAGE.
ZurückUngepaarter t-Test mit R: Umgang mit AusreißernWeiterUngepaarter t-Test mit R: Normalverteilung verletzt – Gegenmaßnahmen
Ungepaarter t-Test mit R: Normalverteilung überprüfen | StatistikGuru.de (2024)

References

Top Articles
Latest Posts
Article information

Author: Virgilio Hermann JD

Last Updated:

Views: 5795

Rating: 4 / 5 (61 voted)

Reviews: 92% of readers found this page helpful

Author information

Name: Virgilio Hermann JD

Birthday: 1997-12-21

Address: 6946 Schoen Cove, Sipesshire, MO 55944

Phone: +3763365785260

Job: Accounting Engineer

Hobby: Web surfing, Rafting, Dowsing, Stand-up comedy, Ghost hunting, Swimming, Amateur radio

Introduction: My name is Virgilio Hermann JD, I am a fine, gifted, beautiful, encouraging, kind, talented, zealous person who loves writing and wants to share my knowledge and understanding with you.