Interaktionen als Prädiktoren und Refernzkategorie

Regressionsmodelle aller Art mit SPSS.

Interaktionen als Prädiktoren und Refernzkategorie

Beitragvon Kassandra » Fr 15. Feb 2019, 11:09

Hallo!

Ich arbeite zur Zeit an einem Projekt und möchte herausfinden, ob verschiedene Diagnosegruppen unterschiedlich gut auf eine Therapie ansprechen.

Ich dachte, dass die Cox-Regression eine Möglichkeit darstellt, diesen Zusammenhang herauszufinden.

Ich habe die Überlebenszeit in Monaten für die Zeit eingesetzt und das Ereignis Tod in den Status.

In den Prädiktorenbereich habe ich dann unter anderem den Prädiktor "Therapie" eingegeben.
Dabei handelt es sich um ein Nominalniveau, also ob eine Therapie vorhanden ist oder nicht.

Einer der anderen Prädiktoren ist die Diagnosegruppe.
Die Diagnosegruppe habe ich ebenfalls nominalskaliert (Gruppe 1, Gruppe 2, Gruppe 3, Gruppe 4).

Schliesslich habe ich noch die Interaktion zwischen Therapie und Interaktion über das Feld ">a*b>" als Prädiktor eingeben.

Als Methode nutze ich "Vorwärts: Wald".

Über das Feld "Kategorial" habe ich "Therapie" und "Diagnose" zu den kategorialen Kovarianten hinzugefügt und als Kontrast habe ich "Indikator" gewählt.

Nun sollte es doch eigentlich so sein, dass es bezüglich der Signifikanz in der letzten Stufe bei der Darstellung "Variabeln in der Gleichung" keinen Unterschied macht, ob ich als Referenzkategorie "Letzte" oder "Erste" anwähle, oder?

Allerdings habe ich beides ausprobiert und es macht einen Unterschied: Wenn ich bei der Therapie und Diagnosegruppe "Letzte" als Referenzkategorie wähle, erscheint die Interaktion im letzten Schritt bei der Darstellung von "Variabeln in der Gleichung" aber weder die Therapie, noch die Diagnosegruppe.
Wenn ich dagegen "Erste" als Referenzkategorie für Therapie und die Diagnosegruppe wähle, erscheint die Interaktion nicht im letzten Schritt bei der Darstellung von "Variabeln in der Gleichung", sondern nur die Therapie.

Kann mir jemand bei der Frage helfen, welche Refernzkategorie Sinn macht?
Soll man vielleicht die Refernzkategorie wählen, die am meisten Fälle enthält?

Für eine Antwort und Hilfe wäre ich sehr dankbar!

Mit freundlichen Grüßen
Kassandra
Kassandra
 
Beiträge: 2
Registriert: Fr 15. Feb 2019, 10:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Interaktionen als Prädiktoren und Refernzkategorie

Beitragvon strukturmarionette » Fr 15. Feb 2019, 11:54

Hi,

Als Methode nutze ich "Vorwärts: Wald".

- Was willst Du mit diesem Ausprobierprocedere herausfinden?
- Sind Dir die Ausprobieralgorithmen hierbei vertraut?
- Besser 'Einschluss'.
Und: Natürlich ist die Referenzkategorie unmittelbar relevant.

Gruß
S.
strukturmarionette
 
Beiträge: 2454
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts

Re: Interaktionen als Prädiktoren und Refernzkategorie

Beitragvon Kassandra » Fr 15. Feb 2019, 13:07

strukturmarionette hat geschrieben:Hi,

Als Methode nutze ich "Vorwärts: Wald".

- Was willst Du mit diesem Ausprobierprocedere herausfinden?
- Sind Dir die Ausprobieralgorithmen hierbei vertraut?
- Besser 'Einschluss'.
Und: Natürlich ist die Referenzkategorie unmittelbar relevant.

Gruß
S.


Erst einmal danke für deine schnelle Antwort!

Durch das Ausprobieren wollte ich herausfinden, ob meine Cox-Regression auch Sinn macht, oder ob ich einen Fehler gemacht habe.

Ich dachte, dass es bezüglich der Signifkanz auf das Selbe rauskommen sollte, egal ob ich als Referenzkategorie "Erste" oder "Letzte" nehme und dass sich dadurch nur Exp(B) unterscheidet.

Wenn ich als Referenzgruppe bei Therapie und Diagnosegruppe "Letzte" wähle, sollte bei meiner Kodierung die Therapiegruppe 1 ("Absent"=keine Therapie vorhanden) gegen die Gruppe 2 ("Present"=Therapie vorhanden) verglichen werden und die Diagnosegruppen 1, 2 und 3 jeweils gegen die Diagnosegruppe 4.
Wenn ich die Cox-Regression so durchführe (mit Vorwärts:Wald), kommen im letzten Schritt die Therapie und die Diagnosegruppe in die Darstellung "Variabeln nicht in der Gleichung".
Die Therapie mit eine Signifikanz von 0,728 (also nicht signifikant auf dem 0,05 Niveau) und die Diagnosegruppen mit einer Signifikanz von 0,294 beim Vergleich Gruppe 1 gegen Gruppe 4, 0,706 beim Vergleich Gruppe 2 gegen Gruppe 4 und 0,833 beim Vergleich Gruppe 3 gegen Gruppe 4. Also ebenfalls nicht signifikant.

Bei der Darstellung "Variabeln in der Gleichung" sind in diesem Fall allerdings die Interaktion von Therapie*Diagnosegruppe.
Bei Therapie*Diagnosegruppe erhält man eine Signifikanz von 0,002.
Bei Therapie*Diagnosegruppe(1) erhält man eine Signifkanz von 0,704 und ein Exp(B) von 0,860. Das Exp(B) hat hier allerdings nichts bedeuten, weil keine Signifikanz gegeben ist.
Aber bei Therapie* Diagnosegruppe(2) erhält man eine Signifikanz von 0,005 und eine Exp(B) von 2,662. Das sollte doch bedeuten, dass Menschen ohne Therapie in Diagnosegruppe 2 eine 1,662 mal so hohe Wahrscheinlichkeit haben im nächsten Monat zu versterben als Menschen mit Therapie, die sich in Diagnosegruppe 4 befinden.
Und bei Therapie*Diagnosegruppe(3) erhält man eine Signifikanz von 0,004 und ein Exp(B) von 2,955. Das müsste doch bedeuten, dass Menschen ohne Therapie in Diagnosegruppe 3 eine 1,955 mal so hohe Wahrscheinlichkeit haben im nächsten Monat zu versterben als Menschen mit Therapie die sich in Diagnosegruppe 4 befinden, oder?

Wenn ich als Referenzgruppe bei Therapie und Diagnosegruppe "Letzte" wähle, sollte bei meiner Kodierung die Therapiegruppe 2 ("Present"=Therapie vorhanden) gegen die Gruppe 1("Absent"=keine Therapie vorhanden) verglichen werden und die Diagnosegruppen 2, 3 und 4 jeweils gegen die Diagnosegruppe 4.

In diesem Fall habe ich die Interaktion bei der Darstellung "Variabeln nicht in der Gleichung" und die Therapie in der Darstellung "Variabeln in der Gleichung".
Die Therapie erhält hier eine Signifikanz von 0,040 und ein Exp(B) von 0,644. Dies müsste doch darauf hindeuten, dass ein Mensch mit Therapie eine um den Faktor 0,366 niedrigere Wahrscheinlichkeit hat im nächsten Monat zu versterben als ein Mensch ohne Therapie.

Allerdings verstehe ich nicht, warum nur durch die Änderung der Refernzkategorie keine Signifikanz mehr bei der Interaktion von Therapie und Diagnosegruppe vorliegt.

- Sind Dir die Ausprobieralgorithmen hierbei vertraut?
- Besser 'Einschluss'.


Ich habe das so verstanden, dass "EInschluss" grundsätzlich eher durchgeführt, um einen Überblick zu erhalten und "Vorwärts:Wald" und "Rückwärts:Wald" auch genutzt werden kann, um ein bias by confounding zu vermeiden.
Da ich dieses bias by confounding vermeiden wollte, habe ich "Vorwärts:Wald" genutzt.
Oder ist es sinnvoller für prädiktive Aussagen "Einschluss" zu nutzen und nur für prognostische Aussagen "Vorwärts:Wald" und "Rückwärts:Wald"?

Mit freundlichen Grüßen

Kassandra
Kassandra
 
Beiträge: 2
Registriert: Fr 15. Feb 2019, 10:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron