Neue Variable aus mehreren anderen kreieren + Regression

Regressionsmodelle aller Art mit SPSS.

Neue Variable aus mehreren anderen kreieren + Regression

Beitragvon Peter_DD » Do 7. Feb 2019, 21:34

Hallo Zusammen =)

Ich, bzw. wir (also ich und meine Statistik-Retterin, die aber auch nicht mehr weiter kommt) haben folgendes Problem:

Wir wollen zwei einfache Regressionsanalyse durchführen um die Abhängigkeit des EInkommens einerseits von a) Hierarchieebene und b) Führungsverantworung zu ermitteln.
Dafür haben wir einen Datensatz aus geführten Interviews (bereist bereinigt).

Die UVa) (Hierarchieebene) soll berechnet werden aus zwei Variablen im Datensatz (FUEHR1 und FUEHR2). F1 fragt ab, ob jemand überhaupt eine Führungsposition inne hat ( 1 = ja, 2 = nein) und F2 dann fragt, ob es sich dabei um 1= unteres Management, 2 = mittleres Management und 3 = Oberes Management handelt.

Leute, die bei F1 mit neim (2) antworteten, haben bei F2 im Datensatz einen Punkt (.). Jetzt wollen wir diese beiden Variablen in eine zusammenfassen, um 4 Gruppen zu bilden, also 1= keine Führungsposition, 2 = FP im unteren Management usw.. Wir haben unter "Variable berechnen" schon diverse Befehle versucht, der erfolgsversprechenste sah so aus:

((FUEHR1 = 2) = 1 & (FUEHR1 = 1 & FUEHR2 = 1) = 2 & (FUEHR1 = 1 & FUEHR2 = 2) =3 & (FUEHR1 = 1 & FUEHR2 = 3) = 4)

Leider gibt uns SPSS dort nur Nullen und Punkte aus.

Also hier bräuchten wir dringend Hilfe!

Bei UVb), also der Führungsverantwortung, wurden die drei entsprechenden Items (Fragen nach Führungsverantwortung) ausgewählt ( a1 bis a3), die jeweils beantwortet werden konnten mit einer 5-stufigen Skala ( 1= sehr wichtig bis 5 = überhaupt nicht wichtig). Dort bildeten wir den Durchschnitt und nutzten diesen für die Regressionsanalyse als Prädiktor.

Das Einkommen wurde mit einer 9-stufigen Skala abgefragt, wobei 1= unter 500 Euro und 9 mehr als 4000 Euro waren, alles dazwischen in 500er-Schritten.

Da hatten wir am ENde ein r² von 0,066, was jedoch sehr signifikant war und einen Beta-Koeffizienten von -0,577, auch signifikant. Das Minus müssen wir ja jetzt entsprechend der umgedrehten Skalierung "wegdenken". Jedoch finden wir es schwer, das Ganze mit dem niedrigen r², trotz der hohen Signifikanz, zu interpretieren und nehmen auch da gerne Vorschläge oder Ideen an, wie man es besser machen könnte =)

So viel erst mal von uns, vielen Dank schon mal für eure Antworten und fragt gerne alles nach, was ihr noch wissen müsst.

Liebe Grüße!
Peter_DD
 
Beiträge: 2
Registriert: Do 7. Feb 2019, 21:15
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Neue Variable aus mehreren anderen kreieren + Regression

Beitragvon ponderstibbons » Fr 8. Feb 2019, 09:42

Leute, die bei F1 mit neim (2) antworteten, haben bei F2 im Datensatz einen Punkt (.).

Dadurch stecken alle benötigten Informationen in FUEHR2. FUEHR1 ist redundant und entbehrlich.

COMPUTE fuehrpos = FUEHR2 .
VAR LAB fuehrpos "Eingenommene Führungsebene"
EXECUTE .

RECODE fuehrpos (MISSING=0).
EXECUTE.

VALUE LABELS fuehrpos
0 "keine"
1 "unteres MM"
....(etc)...

Da es sich um eine kategoriale Variable handelt, kann man sie nicht in einer Regression verwenden,
sondern müsste aus der 4-stufigen Variable 3 dummy-Variablen machen. Einfacher ginge es mit
einer einfaktoriellen Varianzanalyse, da kommt nebenbei auch ein R² raus. Allerdings ist das
Skalenniveau der abhängigen Variable ein Problem (siehe unten).

((FUEHR1 = 2) = 1 & (FUEHR1 = 1 & FUEHR2 = 1) = 2 & (FUEHR1 = 1 & FUEHR2 = 2) =3 & (FUEHR1 = 1 & FUEHR2 = 3) = 4)

Das ergibt in der Tat keinen Sinn. Vielleicht verwendet Ihr das nächste Mal zunächst
das "Variable berechnen" Fenster.
Das Einkommen wurde mit einer 9-stufigen Skala abgefragt, wobei 1= unter 500 Euro und 9 mehr als 4000 Euro waren, alles dazwischen in 500er-Schritten.

Das ist eine ordinale Skala, für eine lineare Regression an sich nicht geeignet.
Eine ordinal-logistische Regression wäre angebracht.
Da hatten wir am ENde ein r² von 0,066, was jedoch sehr signifikant war

Das bedeutet wohl, Ihr hattet eine sehr große Stichprobe.

Jedoch finden wir es schwer, das Ganze mit dem niedrigen r², trotz der hohen Signifikanz, zu interpretieren

"Hohe Signifikanz" ist bedeutungslos. Die Nullhypothese, dass in der Grundgesamtheit
R²=0,000000000000... beträgt, wird verworfen. Ob mit p < 0,05 oder p < 0,00001 ist
für diese unmittelbare Schlussfolgerung gleichgültig. Außerdem "gerade so eben signifikant"
und "hoch signifikant" statistisch gesehen weitaus näher beieinander, als es die Nullen
suggerieren. Man spare sich grundsätzlich sowas wie "hoch" signifikant, das leitet irre.

Über den Effekt (in der Grundgesamtheit) darf man dabei zwar normalerweise nur vorsichtig
spekulieren, aber sollte die Stichprobe tatsächlich sehr groß sein und damit der Stichprobenfehler
nicht sehr groß, könnte man annehmen, dass der Effekt zwar nicht = 0,00 ist, aber eben
doch recht überschaubar. Wobei es dann eine inhaltliche Frage ist, ob er nicht trotzdem
interessant/relevant ist; oder ob es, andersherum, gerade interessant sein könnte, dass ein
Effekt wider Erwarten nur klein ist. Hängt eben vom Forschungskontext ab.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2477
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 1
Danke bekommen: 255 mal in 254 Posts

folgende User möchten sich bei ponderstibbons bedanken:
Peter_DD

Re: Neue Variable aus mehreren anderen kreieren + Regression

Beitragvon Peter_DD » Mi 20. Feb 2019, 22:08

Hey PonderStibbons,

Vielen Dank für deine Hilfe!

Wir haben jetzt rumprobiert und getestet, haben dank dir auch unsere Variablen und Ergebnisse, nur ein paar Sachen fehlen noch. Wäre super, wenn du dir das nochmal anschauen könntest =)

Vorab mal noch ein paar mehr Informationen:

So lautet die Aufgabe:
Wie unterscheiden sich Personen a) unterschiedlicherer Hierarchieebenen und b) unterschiedlicher
Führungsverantwortung hinsichtlich des Einkommens? Ggf. könnte man auch die Organisationsgröße
in die Betrachtung mit einbeziehen.

Die Stichprobe besteht aus 322 Probanden, bereinigt bleiben 220 übrig (also schon eine größere Stichprobe).

Die Ergebnisse der einfaktoriellen Varianzanalyse sind mit Signifikanzen von ,000 und ,004 entsprechend der Hypothese, das höhere Hierarchieebene, bzw. Führungsverantwortung sich positiv auf das Einkommen auswirken.Allerdings wird uns kein R² ausgegeben... zudem stehen wir da vor dem Problem, dass wir bisher keinen Weg gefunden haben, die Ko-Variable Unternehmensgröße mit einzubeziehen. Kennst du da einen?

Bei der Regressionsanalyse dachten wir uns ursprünglich folgendes, sag mal, was du davon hälst: Die Skalen der UV Hierarchieebene und Führungspostion, sowie auch derAV Einkommen betrachten wir als Likert-Skala, also quasi metrisch. Dann könnte man die Regression anwenden, oder?

Wir freuen uns auf deine Meinung =)

Liebste Grüße!
Peter_DD
 
Beiträge: 2
Registriert: Do 7. Feb 2019, 21:15
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Neue Variable aus mehreren anderen kreieren + Regression

Beitragvon ponderstibbons » Do 21. Feb 2019, 09:28

Die Stichprobe besteht aus 322 Probanden, bereinigt bleiben 220 übrig (also schon eine größere Stichprobe).

Nicht besonders.
Die Ergebnisse der einfaktoriellen Varianzanalyse

Da es sich um eine ordinalskalierte abhängige Variable handelt, wäre ein Kruskal-Wallis H-Test angemessen, nicht eine Varianzanalyse. Die erfordert Intervallskalenniveau.

sind mit Signifikanzen von ,000 und ,004 entsprechend der Hypothese, das höhere Hierarchieebene, bzw. Führungsverantwortung sich positiv auf das Einkommen auswirken.Allerdings wird uns kein R² ausgegeben...

Dann muss man es mit "Allgemeines Lineares Modell" / "Univariat" durchführen, da wird R² ausgegeben.

zudem stehen wir da vor dem Problem, dass wir bisher keinen Weg gefunden haben, die Ko-Variable Unternehmensgröße mit einzubeziehen. Kennst du da einen?

Das wäre mit ein weiterer Faktor (oder eine Kovariate, je nach Skalenniveau) in einer
mehrfaktoriellen Varianzanalyse.

Wie gesagt sind Varianzanalysen der abhängigen Variable unangemessen. Eine multiple
ordinal-logistische Regression könnte ebenfalls mehrere Einflussgrößen simultan einbeziehen.

Bei der Regressionsanalyse dachten wir uns ursprünglich folgendes, sag mal, was du davon hälst: Die Skalen der UV Hierarchieebene und Führungspostion, sowie auch derAV Einkommen betrachten wir als Likert-Skala, also quasi metrisch. Dann könnte man die Regression anwenden, oder?

Diese Variablen haben alle nicht im geringsten etwas mit einer Likert-Skala zu tun.

Ordinale oder kategoriale Skalen mit k Stufen kann man bei Bedarf in k-1 dummy-Variablen
umwandeln und diese dummy-Variablen als Prädiktoren in einer Regression verwenden.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2477
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 1
Danke bekommen: 255 mal in 254 Posts


Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste