Seite 1 von 1

Kategorien umkodieren, hilfe

BeitragVerfasst: Mo 4. Sep 2017, 11:07
von cmueller
hey :)
ich schreibe derzeit meine Abschlussarbeit und verzweifle grad ein wenig an einer glaub recht einfachen Geschichte und hoffe ihr könnt mir da etwas helfen.
In meinem Fragebogen habe ich zwecks Datenschutz das Alter mittels Kategorien erhoben. Jeweils in 5 Jahres Schritten von 16J. bis 67. Soweit so gut.
Da ich recht simple Unterschiedsberechnungen anstelle, möchte ich diese Kategorien ganz gern in eine neue Variable umkodieren. Also in Gruppe1: Jung (Kategorien 1-6/Person bis 45J.) und Gruppe2: Alt (Kategorien 7-10/Personen ab 46J.)

Also ich möchte einfach ausgedrückt:
- Kategorien 1-10 umkodieren in 1 Variable mit 2 Ausprägungen: Jung/Alt
- Diese Variable dann deskriptiv auswerten und mit einer UV (Schichtzugehörigkeit) vergleichen

Geht das und macht das Sinn?
Wie muss ich vorgehen um das optimale Ergebnis für das Alter herauszuholen?

Würde mich über Hilfe sehr freuen :)

LG Chris

Re: Kategorien umkodieren, hilfe

BeitragVerfasst: Mo 4. Sep 2017, 11:50
von ponderstibbons
ich schreibe derzeit meine Abschlussarbeit und verzweifle grad

Ja, das ist auffallend im Trend http://tinyurl.com/y6wtr2b4
Da ich recht simple Unterschiedsberechnungen anstelle, möchte ich diese Kategorien ganz gern in eine neue Variable umkodieren. Also in Gruppe1: Jung (Kategorien 1-6/Person bis 45J.) und Gruppe2: Alt (Kategorien 7-10/Personen ab 46J.)

Sowas ist in aller Regel keine gute Idee. Es verschenkt statistisch relevante Informationen und führt zu
Annahmen wie die, dass ein 16jähriger und ein 45jähriger dasselbe sind, aber ein 45jähriger und ein
46jähriger total unterschiedlichen Kategorien angehören sollen. Man kann die Altersklassifizierung doch
ohne weiteres als ordinale Variable belassen und dazu passende Verfahren rechnen.
- Diese Variable dann deskriptiv auswerten und mit einer UV (Schichtzugehörigkeit) vergleichen

Falls Schicht ordinal ist, kannst Du eine Spearman-Korrelation rechnen.
Falls Schicht kategorial ist, kannst Du mit Schicht als Gruppierungfaktor
und Alter als ordinalskalierter abhängiger Variable einen Kruskal-Wallis H-Test rechnen.
LG

wtf

Mit freundlichen Grüßen

PonderStibbons

Re: Kategorien umkodieren, hilfe

BeitragVerfasst: Mo 4. Sep 2017, 12:21
von cmueller
ponderstibbons hat geschrieben:Ja, das ist auffallend im Trend http://tinyurl.com/y6wtr2b4

ja, ist grad die heisse Phase im Semester :D

ohje. das LG war brainafk... Mit freundlichen Grüßen wäre passender gewesen.

Sowas ist in aller Regel keine gute Idee. Es verschenkt statistisch relevante Informationen und führt zu
Annahmen wie die, dass ein 16jähriger und ein 45jähriger dasselbe sind, aber ein 45jähriger und ein
46jähriger total unterschiedlichen Kategorien angehören sollen. Man kann die Altersklassifizierung doch
ohne weiteres als ordinale Variable belassen und dazu passende Verfahren rechnen.

ich glaube ich hab irgendwie die Wald vor lauter Bäumen nicht mehr gesehen. Das macht natürlich wirklich keinen Sinn, Dateninformationen zu verschenken.
Die Argumentation mit dem Vergleich von einem 16J. und einem 45J. ist schlüssig und ich denke ich verwerfe diesen Gedanken schnellstmöglich.

Falls Schicht ordinal ist, kannst Du eine Spearman-Korrelation rechnen.
Falls Schicht kategorial ist, kannst Du mit Schicht als Gruppierungfaktor
und Alter als ordinalskalierter abhängiger Variable einen Kruskal-Wallis H-Test rechnen.

Die Schicht liegt Ordinal vor (Früh=1, Spät=2).

Ich habe bisher mittels Explorativer Datenanalyse mit 'Schicht' als Faktor, und der ordinalskalierten 'Alter in Kategorien' auf Normalverteilung getestet.
und anschließend mit dem Mann-Whitney U-Test auf Unterschiede getestet.

Spearman-korrelation wäre ja dann wenn ich wissen möchte ob sich die beiden Schichten gegenseitig beeinflussen oder?

Re: Kategorien umkodieren, hilfe

BeitragVerfasst: Mo 4. Sep 2017, 12:41
von ponderstibbons
Spearman-korrelation wäre ja dann wenn ich wissen möchte ob sich die beiden Schichten gegenseitig beeinflussen oder?

Nein, ob sie statistisch zusammenhängen. Aber Schicht ist kategorial, nicht ordinal, da ist der U-Test näherliegend.

Mit freundlichen Grüßen

PonderStibbons

Re: Kategorien umkodieren, hilfe

BeitragVerfasst: Mo 4. Sep 2017, 13:00
von cmueller
ponderstibbons hat geschrieben:
Nein, ob sie statistisch zusammenhängen. Aber Schicht ist kategorial, nicht ordinal, da ist der U-Test näherliegend.


oh, okay stimmt.

Eine letzte Frage hätte ich noch. Und zwar hab ich bisher bei allen Variablen mittels explorativer Datenanalyse auf Normalverteilung getestet um dann anschließend zu wissen ob ich ein metrisches oder parametrisches Testverfahren anwenden muss. Muss ich dies immer tun, oder gibt, zb. bei kategorialen oder ordinalen Daten, quasi schon die Datenstruktur vor welches Verfahren verwendet werden muss?

Re: Kategorien umkodieren, hilfe

BeitragVerfasst: Mo 4. Sep 2017, 13:06
von ponderstibbons
Wie soll man denn "Frühschicht/Spätschicht" auf Normalverteilung testen? Das hat doch gar keine Zahlen. Und die Zahlenwerte bei ordinalen Variablen sind nur Hinweisgeber für z.B. groß-größer-noch größer, das kann man 1 2 3 4 nennen oder 1 22 345 100000, wenn man lustig ist.