Seite 1 von 2

Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Fr 5. Okt 2018, 15:32
von Alma
Hallo zusammen!

Ich hoffe sehr auf Eure Hilfe. Ich rechne momentan allerlei logistische Regressionen und habe bei manchen Ergebnissen das Problem, dass eine Ausprägung zu 100% korrekt und die andere Ausprägung zu 0% korrekt vorhergesagt wird. Eine Spalte der Klassifizierungstabelle ist somit leer, alle Fälle sind entweder 0 oder 1.

Hat jemand eine Idee woran das liegen kann? Und vor allem: Kann ich solche Regressionen weiterverwenden (natürlich vorausgesetzt das Modell ist signifikant)?
Ich schaue übrigens nicht versehentlich auf den Anfangsblock ;)

Die Verteilung ist übrigens sehr sehr schief. Vielleicht liegt das daran? Trotzdem stelle ich mir die Frage, ob ich damit weitermachen kann/darf.

Viele Grüße
Alma

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Sa 6. Okt 2018, 01:08
von strukturmarionette
Hi,

- allerlei?
- N?

Gruß
S.

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Sa 6. Okt 2018, 09:50
von ponderstibbons
Wenn ein Merkmal ungleich verteilt ist, sagen wir einmal Ausprägung 1 mit 85% zu Ausprägung 2 mit 15%, dann hat eine simple Vorhersage von Ausprägung 1 für ALLE Fälle eine Trefferquote von 85%. So eine hohe Trefferquote ist durch ein logistisches Regresionsmodell schwer zu toppen.

Mit freundlichen Grüßen

PonderStibbons

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Mo 8. Okt 2018, 10:50
von Alma
Hallo zusammen und lieben Dank für die Antworten!

@strukturmarionette, was meinst du mit allerlei? Das N beträgt ca. 690.

@PonderStibbons, ja, die Vorhersage ist wirklich gut, teilweise 98%, wenn die Verteilung wirklich, wirklich schief ist. Darf ich das Ergebnis also interpretieren?

Beste Grüße
Alma

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Mo 8. Okt 2018, 14:48
von strukturmarionette
Hi,

Mit 'Allerlei' ' habe ich dich zitiert.

Gruß
S.

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Fr 19. Okt 2018, 14:51
von Alma
Hallo nochmal,

ich bin immer noch nicht glücklich mit meinen Klassifizierungstabellen. Diese sind im Anfangsblock und im Block 1 identisch. Dennoch sind Gesamtmodell und Koeffizienten signifikant, Nagelkerkes R-Quadrat jedoch sehr gering (z.B. 0,011).

Was bedeutet das nun für mich? Warum mit p < 0,001 signifikant, aber so eine Klassifizierungstabelle?

Beste Grüße
Alma

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Fr 19. Okt 2018, 16:11
von strukturmarionette
Hi,

- die Frage nach deinem 'allerlei?' ist noch offen.

Gruß
S.

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Fr 19. Okt 2018, 16:51
von Alma
Hallo,

damit meinte ich eigentlich nur sehr viele logistische Regressionen, aber das Problem habe ich bei jeder Analyse.

Beste Grüße
Alma

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Fr 19. Okt 2018, 20:33
von ponderstibbons
Was soll es groß bedeuten? Hohe Fallzahl, daher kann die Nullhypothese "Koeffizient in der Grundgesamtheit = 1,000000000000000..." bzw. "Vorhersagewert des Modells in der Grundgesamtheit = 0,000000000000..." vergleichsweise leicht zurückgewiesen werden, aber die Verbesserung der Vorhersageleistung in der Stichprobe ist halt sehr, sehr gering.

Re: Logistische Regression - Klassifizierungstabelle

BeitragVerfasst: Sa 20. Okt 2018, 11:01
von Alma
Alles klar danke, dann weiß ich Bescheid.

Ich habe noch eine letzte Frage: Ich habe nur eine UV, falls das relevant ist, und wollte - nach Absprache mit dem Prof - die Exp(B) so interpretieren, dass die Chance x-fach so ist, wenn (...).

Intuitiv widerspricht sich das aber für mich: Wenn die Chance zum Beispiel 1,4-fach so hoch ist, dass Ereignis A eintritt, wenn Gruppe A schreibt, als wenn Gruppe B schreibt, dann ist das ja schon nennenswert. Gleichzeitig ist Nagelkerke aber so gering, was für einen schlechten Gesamtfit spricht? Ist das nicht widersprüchlich?

Vielen Dank für die Hilfe!