Daten normalverteilt oder nicht?

Allgemeine Fragestellungen zu Statistik mit SPSS.

Daten normalverteilt oder nicht?

Beitragvon Vandervaart2322 » Di 2. Jun 2020, 10:55

Hallo Leute,

ich habe mal wieder eine Frage zu meiner Auswertung, da ich nichts in der Literatur dazu finden kann. Laut Kolmogorov Smirnov und Shapiro-Wilk-Test sind meine Daten NICHT normalverteilt.

Bildschirmfoto 2020-06-02 um 10.49.00.png
Bildschirmfoto 2020-06-02 um 10.49.00.png (41.45 KiB) 1956-mal betrachtet


Nach Blick auf den Graphen finde ich allerdings, dass die Residuen nahezu normalverteilt sind.
Ich habe jetzt für meine Auswertung schon mehrfach nicht parametrische Tests verwendet, da ich auf die Signifikanz geschaut habe. War das ein Fehler? Sind die Daten normalverteilt oder nicht?

Danke für eure Hilfe
Dateianhänge
Bildschirmfoto 2020-06-02 um 10.49.08.png
Bildschirmfoto 2020-06-02 um 10.49.08.png (104.34 KiB) 1956-mal betrachtet
Vandervaart2322
 
Beiträge: 20
Registriert: So 3. Mai 2020, 10:52
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten normalverteilt oder nicht?

Beitragvon Vandervaart2322 » Di 2. Jun 2020, 11:15

Hier noch ein anderes Bild. das sieht mir nicht nach Normalverteilung aus:
Dateianhänge
Bildschirmfoto 2020-06-02 um 11.15.07.png
Bildschirmfoto 2020-06-02 um 11.15.07.png (115.31 KiB) 1953-mal betrachtet
Vandervaart2322
 
Beiträge: 20
Registriert: So 3. Mai 2020, 10:52
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten normalverteilt oder nicht?

Beitragvon ponderstibbons » Di 2. Jun 2020, 11:38

Die Tests sind doch fast völlig wertlos. Es gibt keine perfekt normalverteilten Variablen. Daher wird die
Normalverteilungsannahme bei einer ausreichend großen Stichprobe immer verworfen. Im vorliegenden
Fall ist die Stichprobe fast 600 Fälle groß, da ist statistische Signifikanz so gut wie garantiert. Über die
Relevanz der "statistisch signifikanten" Nicht-Normalverteilung sagen diese Tests nichts aus.

Außerdem ist die Frage, wozu die ganzen Betrachtungen. Da Residuen betrachtet werden, handelt
es sich um eine Varianzanalyse oder lineare Regression, nehme ich an, und bei denen ist Normalverteilung
der Residuen nur für kleine Gesamt-Stichproben (n < 30 oder n < 50, je nach Quelle und Umständen)
relevant. Bei einem n von fast 600 sind diese Verfahren robust gegen nichtnormalverteilte Residuen.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2472
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 1
Danke bekommen: 255 mal in 254 Posts

Re: Daten normalverteilt oder nicht?

Beitragvon Vandervaart2322 » Di 2. Jun 2020, 11:49

Vielen Dank für die schnelle Antwort! :)

Das ist richtig, ich wollte gerade mit einer linearen Regression starten und auf den Grenzwert verweisen, sodass ich trotz nicht normalverteilter Residuen (nach den Tests) eine Regressionsanalyse durchführen kann.

eine weitere Frage an dich:
ich habe jetzt anstatt eines T-Testes und einer ANOVA, einen Mann Whitney-U-Test und einen Kruskal-Wallis-Test durchgeführt, da ich aufgrund der nicht vorhandenen Normalverteilung nicht parametrische Test durchgeführt habe. War dieses Vorgehen nun falsch? Deine Aussagen bezüglich der Normalverteilung haben mich etwas verunsichert.

Vielen Dank für deine Antwort.
Vandervaart2322
 
Beiträge: 20
Registriert: So 3. Mai 2020, 10:52
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten normalverteilt oder nicht?

Beitragvon ponderstibbons » Di 2. Jun 2020, 12:10

Weiß ich nicht. Kommt auf den Zweck an. U-Test und H-Test vergleichen keine Mittelwerte.

Varianzanalyse und t-Test erfordern keine normalverteilten Variablen oder normalverteilte
Residuen, sofern die Stichprobe ausreichend groß ist. Wichtiger sind immer andere Sachen,
z.B. Varianzhomogenität.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2472
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 1
Danke bekommen: 255 mal in 254 Posts

Re: Daten normalverteilt oder nicht?

Beitragvon Vandervaart2322 » Di 2. Jun 2020, 12:17

Okay ich dachte man muss immer auf Normalverteilung prüfen. Scheint so als könnte ich von Vorne anfangen.

Mit beiden Tests sollte ein Unterschied zwischen Gruppen festgestellt werden (Geschlecht z.B.). Es werden ja zentrale Tendenzen und keine Mittelwerte verglichen. Macht das für ein Prüfen einer Hypothese einen Unterschied? (H0 Das Geschlecht hat einen Einfluss auf....)
Vandervaart2322
 
Beiträge: 20
Registriert: So 3. Mai 2020, 10:52
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten normalverteilt oder nicht?

Beitragvon strukturmarionette » Di 2. Jun 2020, 15:20

Hi,

- unterschiedliche Signifikanztests machen einen Sinn bei der Prüfung von Hypothesen.
- wie lauten sie denn ?

Gruß
S.
strukturmarionette
 
Beiträge: 2449
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts

Re: Daten normalverteilt oder nicht?

Beitragvon Vandervaart2322 » Mi 3. Jun 2020, 12:22

1. H0: Das Wettbewerbinvolvement der Befragten hat keinen Einfluss auf die Recall- und Recognitionwerte von Sponsoren
-> Habe ich aufgrund der fehlenden Normalverteilung der Residuen einen Kruskal-Wallis Test durchgeführt. Muss ich nun zwingend eine ANOVA machen? Ponderstibbons meint ja, dass bei einer hohen Stichprobe die Normalverteilung missachtet werden kann.

2. H0: Das Alter der Befragten hat keinen Einfluss auf die Recall- und Recognitionwerte von Sponsoren
-> Hier will ich eine Regressionsanalyse machen. Da meine Daten aber nicht linear sind muss ich noch eine Lösung finden.

3. H0: Das Geschlecht der Befragten hat keinen Einfluss auf die Recall- und Recognitionwerte von Sponsoren
Habe ich aufgrund der fehlenden Normalverteilung der Residuen einen Mann-Whitney-U-Test durchgeführt Muss ich nun zwingend eine T-Test machen? Ponderstibbons meint ja, dass bei einer hohen Stichprobe die Normalverteilung missachtet werden kann.

4. H0: Das Haltung der Befragten gegenüber Sponsoren hat keinen Einfluss auf die Recall- und Recognitionwerte von Sponsoren
-> Habe ich einen Kruskal-Wallis Test durchgeführt aufgrund der fehlenden Normalverteilung der Residuen. Muss ich nun zwingend eine ANOVA machen? Ponderstibbons meint ja, dass bei einer hohen Stichprobe die Normalverteilung missachtet werden kann.

Danke für eure Hilfe :)
Vandervaart2322
 
Beiträge: 20
Registriert: So 3. Mai 2020, 10:52
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten normalverteilt oder nicht?

Beitragvon ponderstibbons » Mi 3. Jun 2020, 14:30

Wer redet von zwingend? U-Test und Kruskal-Wallis testen keine Mittelwerte. Wenn es um Mittelwerte geht, sind sie ungeeignet. Wenn es nicht ausdrücklich um Mittelwerte geht, kommen sie in Betracht.
ponderstibbons
 
Beiträge: 2472
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 1
Danke bekommen: 255 mal in 254 Posts

Re: Daten normalverteilt oder nicht?

Beitragvon Vandervaart2322 » Mi 3. Jun 2020, 16:43

Vielen Dank :)
Vandervaart2322
 
Beiträge: 20
Registriert: So 3. Mai 2020, 10:52
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste