Daten Aggregieren

Alles rund um SPSS Syntax und Programmierung.

Daten Aggregieren

Beitragvon Lotto King Karl » Sa 15. Aug 2015, 19:29

Hallo liebes Forum!

Ich hoffe, ihr könnt mir bei meiner Frage helfen.. Bei meiner Datenanalyse bin ich auf folgendes Problem gestoßen:

Ich bearbeite einen Datensatz, der mir von einem Forschungsinstitut zur Verfügung gestellt wurde. In diesem Datensatz ist u.a. die Variable Familienstand angegeben - sie kann verschiedene Ausprägungen annehmen (von 1=6 verheiratet bis 6 verwitwet). Da allerdings bei dieser Variable häufig fehlende Werte vorliegen, wurden anhand von 5 verschiedenen Schätzverfahren 5 mögliche Merkmalsausprägungen für den Familienstand ermittelt. D.h. der Teilnehmer "A" ist 5 Mal im Datensatz enthalten, wobei für seinen Familienstand ggf. verschiedene Merkmalsausprägungen angeben sind. Z.B. könnten zwei der Schätzverfahren die Ausprägung 1=verheiratet angeben, die restlichen 3 dagegen die Merkmalsausprägung 6=geschieden.

Da ich mich für meine weiteren Auswertungen jedoch für eine Merkmalsausprägung entscheiden muss, möchte ich hierbei auf den am häufigsten geschätzten Wert beziehen. In meinem Beispiel oben wäre dies die Merkmalsausprägung 6=geschieden, da diese von drei der fünf Schätzverfahren angegeben wird.

Meine Idee war nun, die Daten anhand des Modus zu aggregieren. Per Benutzeroberfläche lassen sich im Menü unter den Funktionen zum Aggregieren jedoch nur der Mittelwert, Median, die Summe und Standardabweichung auswählen.
Gibt es eine Möglichkeit, dies zu umgehen, z.B. per Syntax? Und wie könnte ein solcher Befehl aussehen?

Vielen Dank für eure Hilfe im Voraus!
Grüße,
Alina
Lotto King Karl
 
Beiträge: 1
Registriert: Sa 15. Aug 2015, 18:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten Aggregieren

Beitragvon ponderstibbons » Mo 17. Aug 2015, 10:23

Ungetestet:

SORT CASES by Teilnehmer geschaetzter_familienstand .
EXECUTE .

IF(Teilnehmer ne LAG(Teilnehmer) OR (geschaetzter_familienstand ne LAG(geschaetzter_familienstand)) haeufigkeit = 1.
EXECUTE .

IF(MISSING(haeufigkeit) AND (geschaetzter_familienstand = LAG(geschaetzter_familienstand)) AND (Teilnehmer = LAG(Teilnehmer)) ) haeufigkeit = LAG(haeufigkeit)+1.
EXECUTE .

Jetzt noch das Maximum von haeufigkeit für jeden Tn identifizieren etc.
ponderstibbons
 
Beiträge: 2480
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 1
Danke bekommen: 256 mal in 255 Posts


Zurück zu SPSS Syntax

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron