Seite 1 von 1

SPSS, automatischer Ausschluss von Dummy-Variablen

BeitragVerfasst: Sa 10. Dez 2022, 13:17
von guuglhupf
Hallo allerseits,

ich bastele schon eine geraume Zeit an einem multivariaten, linearen Regressionsmodell, in dem es u.a. um den Einfluss der Bildung auf Lebenszufriedenheit geht.
Ich nutze die Methode "Einschluss" und führe in 4 Schritten die verschiedenen Variablen in das Modell ein.

Jetzt fiel mir bei den Schritten der Analyse auf, dass diverse Variablen ausgeschlossen wurden. Bei den ersten 3 Modellen, werden die Variablen aufgelistet, die ohnehin erst später ins Modell aufgenommen werden (siehe Syntax unten --> z.B. unabhängige Variable [UAV] 5, 6 etc.). Es wundert mich zwar, dass das extra aufgelistet wird, aber ist ja auch in Ordnung.
Jetzt aber das Problem:
Im letzten Modell bleibt dann eine Dummyvariable augeschlossen, die sich auf meine zentrale Auswertungsvariable bezieht --> "keine Bildung" (wenn "keine Bildung" - dann 1, anderes = 0). DIe anderen Dummys zu "niederiger", "mittlerer" und "hoher" Bildung bleiben drin und haben auch signifikante Ergebnisse.
Was kann das Problem sein? Korrelationen habe ich geprüft, das ist kein Problem.

Hier noch ein paar Detailinfos, die vielleicht sinnvoll sind:

Die Dummy "keine Bildung" hat bei einer Gesamtzahl von ca. 2000 Fällen, ca. 500 Ausprägungen.

Mein Modell ist nicht gerade klein und beinhaltet 14 unabhängige Variablen. Auch mehrere dichotome Dummy-Variablen und eben diese kategoriale Variable mit mehreren AUsprägungen, welche in Dummy-Variable umgewandelt wurde.

Ich rechne wie folgt:

REGRESSION
/DESCRIPTIVES MEAN STDDEV CORR SIG N
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA COLLIN TOL
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT abhaengige Variable
/METHOD=ENTER UAV1 UAV2 ....
/METHOD=ENTER UAV5 UAV6...
/METHOD=ENTER UAV9 UAV10...
/METHOD=ENTER UAV13 UAV14
/PARTIALPLOT ALL
/SCATTERPLOT=(*ZRESID ,*ZPRED)
/RESIDUALS DURBIN HISTOGRAM(ZRESID) NORMPROB(ZRESID).

Was mache ich falsch?

Vielen Dank schon mal für die Hinweise, ich bin gerade ein wenig verzweifelt...
Vorweihnachtliche Grüße von
Micha

Re: SPSS, automatischer Ausschluss von Dummy-Variablen

BeitragVerfasst: Sa 10. Dez 2022, 18:09
von ponderstibbons
ich bastele schon eine geraume Zeit an einem multivariaten, linearen Regressionsmodell

Nur nebenbei, wenn es sich um nur 1 abhängige Variable handelt, lautet die Bezeichnung gängigerweise "multiple Regression".
Im letzten Modell bleibt dann eine Dummyvariable augeschlossen, die sich auf meine zentrale Auswertungsvariable bezieht --> "keine Bildung" (wenn "keine Bildung" - dann 1, anderes = 0). DIe anderen Dummys zu "niederiger", "mittlerer" und "hoher" Bildung bleiben drin und haben auch signifikante Ergebnisse.
Was kann das Problem sein?

Eine Variable mit k Stufen erhält k-1 dummys. Weil der k'te dummy vollkommen redundant wäre. Du würdest für "Geschlecht" (k=2 Stufen) nicht 2 dummys anlegen, einmal männlich ja/nein und zusätzlich weiblich ja/nein.
Vielen Dank schon mal für die Hinweise, ich bin gerade ein wenig verzweifelt...

Ich weiß nicht, inwiefern das zur Problemdarstellung beiträgt.

Mit freundlichen Grüßen

PonderStibbons

Re: SPSS, automatischer Ausschluss von Dummy-Variablen

BeitragVerfasst: So 11. Dez 2022, 02:59
von strukturmarionette
Hi,

- wie wird deine AV gemessen?

Gruß
S.

Re: SPSS, automatischer Ausschluss von Dummy-Variablen

BeitragVerfasst: So 11. Dez 2022, 11:49
von guuglhupf
Vielen Dank für die schnellen Antworten, das hilft mir schon sehr.

@ponderstibbons
"Eine Variable mit k Stufen erhält k-1 dummys. Weil der k'te dummy vollkommen redundant wäre. Du würdest für "Geschlecht" (k=2 Stufen) nicht 2 dummys anlegen, einmal männlich ja/nein und zusätzlich weiblich ja/nein."
--> bei der ursprünglichen Recherche dazu bin ich auch ein eine Seite gestoßen, die emnpfohlen haben alle Kategorien zu deklarieren...? Vielleicht mit dem Wissen, dass SPSS dann ohnehin automatisch auschließt... egal.
An dem Punkt hatte ich jedenfalls noch ein Fragezeichen für mich, hab es jetzt entsprechend umgesetzt und - ES FUNKTIONIERT!!! :-D
DAAAANKEEEEE!

Dann bleibt noch eine Verständnisfrage:
Ich deklariere alle Variablen so, dass sie nur dann 1 sind, wenn Bedingung erfüllt ist und Rest 0.

Also Variable "Dummy_niedrig" = niedrige Bildung = 1; keine Bildung = 0; mittlere Bildung = 0; hohe Bildung = 0.

Entsprechend mache ich das für "mittlere" und "hohe Bildung", lasse "keine" dann undeklariert und somit ist "keine Bildung" dann meine Referenzkategorie?
Dann würde ein Regressionskoeffizient von 0,16 bei "niedriger Bildung" aussagen, dass die Lebensqualität von Menschen mit niedriger Bildung um 0,16 Punkte auf der Skala der Lebenszufriedenheit höher liegt als bei Menschen ohne Bildungsabschluss?

@strukturmarionette:
" wie wird deine AV gemessen?"
--> Ist ein Summenscore, der über verschiedene Likert-skalierte Items gemessen wurde.

Ich danke Euch janz dolle!
:-)

Re: SPSS, automatischer Ausschluss von Dummy-Variablen

BeitragVerfasst: So 11. Dez 2022, 12:56
von ponderstibbons
--> bei der ursprünglichen Recherche dazu bin ich auch ein eine Seite gestoßen, die emnpfohlen haben alle Kategorien zu deklarieren...?

Die k-te dummy-Variable kann man durchaus bilden, da habe ich mich falsch ausgedrückt. Man wird sie nur nicht in die Gleichung aufnehmen können.
Welche der k dummy-Variablen man weglässt und dadurch zur Referenzkategorie macht, ist dem Anwender überlassen.

Mit freundlichen Grüßen

PonderStibbons