Variablen formatieren für Regression

Regressionsmodelle aller Art mit SPSS.

Variablen formatieren für Regression

Beitragvon Nils117 » Mo 27. Mai 2019, 15:23

Hallo zusammen,

ich habe ein Problem mit einer multiplen linearen Regression. Ich muss eine Insolvenzprognose anhand der Regression durchführen und dabei verschieden Jahresabschluss Kennzahlen verwenden. Zum Beispiel ist der Umsatz die abhängige Variable und Eigenkapital, Anzahl Mitarbeiter oder Gewinn, etc. sind die erklärenden Variablen.

Ich habe das Problem, dass ich einen Datensatz von 40 Unternehmen habe bei dem die Kennzahlen aus verschiedenen Jahren stammen und ich somit für jedes Jahr eine Variable habe.

Gewinn Jahr 1 Gewinn Jahr 2 Eigenkapital Jahr 1 Eigenkapital Jahr 2 usw.

Für die Regression brauche ich aber zB die Variable Gewinn für alle Jahre und alle Unternehmen zusammen. Ich habe überlegt die Spalten in der Datenansicht einfach untereinander zu kopieren um so alle Werte in einer Variablen zu haben. Dies kommt mir aber zu leicht und nicht konsistent vor.

Gibt es eine vernünftige Funktion, auch im Hinblick auf die Regression, um die Variablen zu erzeugen?

Ich bin für jede Hilfe dankbar!

Grüße
Nils
Nils117
 
Beiträge: 2
Registriert: Mo 27. Mai 2019, 15:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variablen formatieren für Regression

Beitragvon ponderstibbons » Mo 27. Mai 2019, 18:56

Ich muss gestehen, ich verstehe weder, wie das Modell konkret aussehen soll (welche Fälle und welche Variablen werden wozu einbezogen), noch die gegenwärtige Datenstruktur.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2472
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 1
Danke bekommen: 255 mal in 254 Posts

Re: Variablen formatieren für Regression

Beitragvon Nils117 » Di 28. Mai 2019, 14:45

Verzeihung, wenn ich mich unklar ausgedrückt habe.
Wir haben zwei Gruppen an Unternehmen (jeweils 40). Die eine Gruppe setzt sich ausschließlich aus Unternehmen zusammen die insolvent gegangen sind. Die andere Gruppe sind nur Unternehmen denen es gut geht. Ich möchte jetzt mit den schlechten Unternehmen anfangen und habe dazu Jahresabschlusszahlen dieser Unternehmen in einem Datensatz. Das heißt für 40 Unternehmen jeweils Umsatz, Gewinn, Eigenakapitalquote, usw. für drei Jahre. Die Datenansicht sieht dann folgendermaßen aus, wobei es sich jeweils um Variablen handelt.

Name Umsatz1 Umsatz2 Umsatz3 Gewinn1 Gewinn2 Gewinn3 etc
UnternehmenA 100 150 120 50 30 30
UnternehmenB
etc.

Ich möchte mit der Regression herausfinden, welche Kennzahlen als unabhängige Variablen eine gute Signifikanz haben um die abhängige Variable (zb Gewinn) zu beeinflussen.
So wäre die Annahme, dass der Umsatz eine hohe Signifikanz für den Gewinn hat. Ich würde also dann die multiple lineare Regression laufen lassen, mit 4-5 unabhängigen Variablen und dem Gewinn als abhängige Variable.

Mein Problem ist, dass ich Daten aus 3 Jahren vorliegen habe und daher anstatt eine abhängige Variable Gewinn, Gewinn Jahr 1 Gewinn Jahr 2 Gewinn Jahr 3 habe.
Für die unabhängigen Variablen gilt das selbe.
Ich möchte also diese einzelnen Variablen in einer Variable haben um die Regression mit den Daten der ganzen drei Jahre laufen zu lassen.

Danke auf jeden Fall schonmal!
Nils117
 
Beiträge: 2
Registriert: Mo 27. Mai 2019, 15:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Variablen formatieren für Regression

Beitragvon ponderstibbons » Di 28. Mai 2019, 18:41

Das Konzept einer „guten Signifikanz“ ist mir leider unbekannt, und „hohe Signifikanz“ scheint inferenzstatistische p-Werte mit Relevanz zu verwechseln.

Wenn es lediglich um die Identifizierung von Prädiktoren mit vergleichsweise hoher Vorhersagefähigkeit geht, kannst Du die Beobachtungen desselben Unternehmens aus 3 Jahren wie 3 unabhängige Fälle in einer multiplen linearen Regression verwenden , so wie angedacht, solange Du keine inferenzstatistischen Signifikanztests rechnest (die geschätzten Koeffizienten hätten aller Voraussicht nach die falschen Standardfehler und Tests wären fehlerhaft).

Alternativ rechnest Du 3 Regressionen, mit der Begründung, dass Du schauen kannst, ob Die Ergebnisse stabil sind.

Alternativ rechnest Du ein Mehrebenenmodell.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2472
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 1
Danke bekommen: 255 mal in 254 Posts

Re: Variablen formatieren für Regression

Beitragvon strukturmarionette » Mi 29. Mai 2019, 17:27

strukturmarionette
 
Beiträge: 2449
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts


Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste