Seite 1 von 2

[Anfängerfrage] Signifikanz zweier nominalverteilter Gruppen

BeitragVerfasst: Di 11. Sep 2012, 09:54
von Dems
tl;dr: Warum unterscheidet sich das Ergebnis des exakten SPSS Fisher Tests von dem Fisher Test / Chi quadrat Tests, den man online machen kann?

Begrüßung und Experimentbeschreibung
Hallo allerseits,
ich bin ein Neuling im Gebiet Statistk / SPSS und habe ein Problem, bei dem ich mir unsicher bin, wo der Denkfehler ist.

Kommen wir zu einem Beispielexperiment:

Es werden zwei Gruppen untersucht, beide Gruppen umfassen jeweils 15 Personen.

Gruppe A hat einen Zeitungstext gelesen, der in der Schrift Times New Roman geschrieben ist.
Gruppe B hat einen Zeitungstext gelesen, der in der Schrift Comic Sans geschrieben ist.

Es wird untersucht, ob sich die Personen im anschließenden Interview zum Vorhandensein bzw. Nichtvorhandensein der Serifen äußern.

Daraus gibt sich folgende Nominalskalierung:

Variable 1 in SPSS, Gruppe A
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert

Variable 2 in SPSS, Gruppe B
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert

Dies wird mit 0 (nicht Äußerung) und 1 (Äußerung) codiert.

Datensatz
Daraus ergibt sich folgende Statistik:


A-B
1-0
1-0
1-0
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1ä

Daraus ergibt sich:
Gruppe A hat sich 3x geäußert und 12x nicht geäußert
Gruppe B hat sich 12x geäußert und 3x nicht geäußert


Unterschiede bei der Online-Auswertung und SPSS:

Gebe ich diese Ergebnisse (3-12, 12-3) auf einer der vielen Online-Plattformen ein, bekomme ich folgendes Ergebnis: p = 0.0028 (bei http://graphpad.com/quickcalcs/contingency2.cfm) oder p = 0.002814etc (bei http://vassarstats.net/tab2x2.html). Auch bei anderen Tests der Seite http://www.statpages.org/#CrossTabs komme ich auf das Ergebnis.

Bei SPSS hingegen bekomme ich mit den Rohdaten folgendes Ergebnis:
https://dl.dropbox.com/u/9584865/SPSS-Rohdaten.png

=>die Exakte Signifikanz (2 Seitig) nach Fisher = 1.0


Fragen

Wie kommt dieser Unterschied zu Stande?

Gibt es zwischen 3 Äußerungen in Gruppe A und 12 Äußerungen in Gruppe B tatsächlich keinen signifikanten Unterschied?

Gibt es andere Methoden, mit denen ich eine Signifikanz der Rohdaten nachweisen könnte? Oder bin ich mit Fisher / Chi Quadrat schon an der richtigen Adresse?

Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Di 11. Sep 2012, 10:29
von strukturmarionette
Hi,

Wie kommt dieser Unterschied zu Stande?


Durch irgendeinen Fehler bei der Anwendung von SPSS.Wahrscheinlich in der Struktur der Rohdaten (Datenansicht)

Gruß
S.

Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Di 11. Sep 2012, 12:50
von Dems
Die Rohdaten sind eingegeben, wie es oben steht:
2 Variablen
die jeweiligen Fälle immer untereinander
alles nominalskaliert

Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Di 11. Sep 2012, 13:06
von strukturmarionette
Hi,

poste doch nochmal die Vierfeldertafel mit den Sig-Tests.

- Oder hat sich die Ursache für die ´1er Signifikanz´ selbsterklärt?

S.

Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Di 11. Sep 2012, 23:38
von Dems
Ne, hat sich noch nicht geklärt. Ich verstehe nicht, warum ich mit Onlinetests, wo ich die "Ergebnisse" eintrage eine sehr hohe Signifikanz bekomme und bei SPSS, wo ich mit Rohdaten arbeite, plötzlich keine Signifikanz mehr habe - das wurmt mich.

Bild

Wobei ich jetzt einen Schritt weiter bin:

Bei den Online Sachen trage ich folgendes ein:
3-12
12-3

für
(Gruppe A, 3x Äußerung) - (Gruppe A, 12x keine Äußerung)
(Gruppe B,12x Äußerung) - (Gruppe B, 3x keine Äußerung)


SPSS macht aus meiner langen 0er und 1er Liste von oben allerdings
3-9
0-3

wodurch 12 und 3 zu den Zeilen und Spaltensummen werden und nicht zum Ergebnis.

Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Di 11. Sep 2012, 23:55
von Dems
Um mit SPSS auf das zu kommen, was ich bei den Online-Seiten eingebe, müsste die Verteilung wie folgt sein:

3x 1 und 1
3x 0 und 0
12x 1 und 0
12x 0 und 1



1 1
1 1
1 1
0 0
0 0
0 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
1 0
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1


Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Mi 12. Sep 2012, 00:01
von strukturmarionette
So muss es in SPSS aussehen:

Var_1 Var_2

1 0
1 0
1 0
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1
0 1

************ Das ist die vier Felder Kreutabelle

VAR_1 * VAR_2 Kreuztabelle

Anzahl
VAR_2 Gesamt
0 1

VAR_1 0 0 9 9
1 3 0 3

Gesamt 3 9 12


Alle Tests werden hoch signifikant. Keine Ahnung, was ´schief´ ist.

Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Mi 12. Sep 2012, 00:23
von Dems
Ich glaube ich habe einen weiteren Teil des Problems erkannt:

SPSS behandelt die beiden Gruppen gleichwertig, d.h. macht aus 15 Zeilen von Gruppe 1 und 15 Zeilen von Gruppe 2 insgesamt ein n=15

Wohingegen es eigentlich n=30 in der Gesamtsumme sein sollte.

---

Sollte das ab "VAR_1 * VAR_2 Kreuztabelle" in deinem Post eine Tabelle sein, die nicht vorhanden ist? Wenn nein, verstehe ich nicht, was du damit meinst.

Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Mi 12. Sep 2012, 09:25
von strukturmarionette
Hi nochmal,

wenn es tatsächlich darum geht, Reaktionen zweier unabhängiger Stichproben zu vergleichen oder einen Zusammenhang aufzudecken (als Arbeitshypothese), dann
schau mal nach, was SPSS unter Nichtparametrische Unabhängige Zweistichprobentests zu bieten hat.

- Einmal lassen sich ein oder mehrere diesbezügliche Tests direkt auswählen (anklicken) [unter: Alte Dialogfelder]. --> Das würde ich empfehlen.
- Andererseits hat SPSS diesbezüglich (alternativ) auch einen "Automatismus" implementiert. [Unter: Unabhängige Stichproben]
(Dabei wird der richtige SignifikanzTest dann ´automatisch´ ausgewählt.)
Vielleicht kannst Du beides mal nachlesen und ausprobieren.

(Die Chi²-Testerei wird oft als ´Zaubertrank´ des Miraculix angesehen, der für alles passt, stimmt aber leider nicht.)

Dei SPSS-Datendatei sollte dann wie folgt aufgebaut sein:

N =30 (d.h zwei Teilstichproben von N =15 entsprechend Deinen Angaben)

- Die eine Variable beinhaltet die Messerergebnisse bzw. Rekationen mit 0 oder 1
- Die zweite Variabel ist die sog. GruppenVariable
(Über Wertelables könnte man 1 für Gruppe 1 definieren und 2 für Gruppe 2.)

Gruß
S.





VIn Variable_1 stehen dann die

Re: [Anfängerfrage] Signifikanz zweier nominalverteilter Gru

BeitragVerfasst: Mi 12. Sep 2012, 10:45
von Dems
Anbei eine detaillierte Erklärung des Problems, wie SPSS arbeitet bzw. wie ich die Funktionsweise von SPSS verstehe, falls jemand mal vor dem selben Problem steht:

Nehmen wir an, es gibt zwei Gruppen, Gruppe X und Gruppe Y. Von Gruppe X sagen 3 Personen ja und 3 Personen nein, von Gruppe Y sagen 3 Personen ja und 3 Personen nein
Dabei steht 1 für JA und 0 für NEIN

GruppeX-GruppeY
1
1
1
0
0
0

Gruppe Y:
0
1
1
0
1
0

SPSS wertet diese Ergebnisse HORIZONTAL aus:
Gruppe X-GruppeY
1-0
1-1
1-1
0-0
0-1
0-0

Daraus ergibt sich:
1x 1-0 => n=1
2x 1-1 => n=2
2x 0-1 => n=2
1x 0-1 => n=1

==> n gesamt = 6

-----

Ich hätte gerne gehabt, dass das Ganze VERTIKAL ausgewertet wird:

Gruppe X-GruppeY
1-0
1-1
1-1
0-0
0-1
0-0

Gruppe X:
3x1 => n=3
3x0 => n=3

Gruppe Y:
3x1 => n=3
3x0 => n=3

n gesamt = 12