Probleme bei Dummy Codierung + logistische Regression

Allgemeine Fragestellungen zu Statistik mit SPSS.

Probleme bei Dummy Codierung + logistische Regression

Beitragvon Maibaum22 » Mi 18. Mai 2022, 23:10

Hallo,
ich verzweifle langsam etwas bei meiner Datenauswertung für meine Bachelorarbeit. Ich habe zwar nicht das beste mathematische Verständnis, kenne mich aber zumindest mit SPSS immer mehr aus und versuche mein Problem zu schildern:

Ich untersuche den negativen Zusammenhang zwischen zwei Laborwerten und dem Gedächtnis. Laut meinem Betreuer soll ich nun eine Missing Data Analyse mit Hilfe einer logistischen Regression durchführen. Als AV's dienen mir jeweils 2 psychologische Testverfahren, 2 Laborwerte als auch das Alter. Mittels Dummycodierung soll ich zunächst eine 0=fehlender Wert und eine 1=vorhander Wert eintragen. Meine Missings hatte ich in SPSS grundlegend immer mit -999 codiert. Nachdem ich die Dummycodierung über Transformieren -> Umcodieren in andere Variable durchgeführt habe und die AV's in meine Syntax für die logistische Regression eingesetzt habe, wird mir bei zwei (Alter und ein Laborwert) der insgesamt fünf Berechnungen folgende Nachricht in der Ausgabe angezeigt:
"Die abhängige Variable weist weniger als zwei nicht-fehlende Werte auf. Für die logistische Regression muß der abhängige Wert an den verarbeiteten Fällen genau zwei Werte annehmen.
Die Ausführung dieses Befehls wurde unterbrochen."

Allerdings kann ich nicht nachvollziehen, wieso das Problem auftaucht. Ich habe, genauso wie bei den anderen 3 Variablen, die Codierung mit 0 und 1 vorgenommen.
In der Variablenansicht habe ich für meine Dummys in der Spalte "Werte" 0 für fehlend und 1 für vorhanden eingetragen, weswegen ich die Nachricht mit weniger als zwei nicht-fehlenden Werten nicht nachvollziehen kann. Weitere Infos aus der Variablenansicht: Typ: Numerisch, Breite: 8, Dezimalzahl: 0, Fehlend: 0, Messniveau: Metrisch.
Syntax für die log. Regression sieht wie folgt aus:
LOGISTIC REGRESSION (Laborwert/Testverfahren/Alter)
/METHOD=ENTER (Eingesetzt werden Testverfahren, Alter, Laborwerte, Geschlecht)
/CLASSPLOT
/PRINT=ITER(1) CI(95)

Sitze seit gestern dran und komme nicht vorwärts, bin also über jede Hilfe super dankbar!
Maibaum22
 
Beiträge: 2
Registriert: Mi 18. Mai 2022, 22:30
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Probleme bei Dummy Codierung + logistische Regression

Beitragvon strukturmarionette » Do 19. Mai 2022, 00:35

Hi,

Als AV's dienen mir jeweils 2 psychologische Testverfahren, 2 Laborwerte als auch das Alter.

- welche? Skalenniveaus?
- Um welche Prädktorvariablen (UVs) handelt es sich bei deinen Fragestellungen?
- Welche Fragestellungen?

Mittels Dummycodierung soll ich zunächst eine 0=fehlender Wert und eine 1=vorhander Wert eintragen.

- Dummycodierung ist etwas anderes

- Es könnte nütze, deine Anliegen zunächst im Statistikforum darzulegen.

Gruß
S.
strukturmarionette
 
Beiträge: 2457
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts

Re: Probleme bei Dummy Codierung + logistische Regression

Beitragvon Maibaum22 » Do 19. Mai 2022, 08:02

Also:
ich habe insgesamt 4 Hypothesen die besagen, besteht ein negativer Zusammenhang zwischen:
der Gedächtnisleistung x und dem Laborwert x,
der Gedächtnisleistung x und Laborwert y,
der Gedächtnisleistung y und Laborwert x,
der Gedächtnisleistung y und Laborwert y.

Als AV werden die Testverfahren eingesetzt, die nach Erhebung in Prozentränge umgerechnet wurden und entsprechend ordinalskaliert sind. Als UV hat man dann bei meiner Fragestellung die Laborwerte, Alter, Geschlecht, Bildung. Für die Hypothesenüberprüfung habe ich eine schrittweise Regression gerechnet.

Da viele Daten fehlen, soll zusätzlich die Missing Data Analyse durchgeführt werden. Habe aber sowas noch nie zuvor berechnet und mein Betreuer hat mir dann folgende schrittweise Erklärung geschickt:
- die 2 Testverfahren, die 2 Laborwerte und das Alter als Dummyvariablen erstellen
- die dummys dienen dann jeweils als AV, weitere Parameter sind Bildung, Geschlecht etc.
- Anschließend werden die AV's mit den Parametern in eine logistische Regression eingesetzt und entsprechend berechnet.

Ist das denn mit der log. Regression gängig oder wird eine Missing Data grundsätzlich anders berechnet?

Ich stelle es auch nochmal ins Statistikforum, vielen Dank für den Tipp!
Maibaum22
 
Beiträge: 2
Registriert: Mi 18. Mai 2022, 22:30
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron