Seite 1 von 1

Zwei Datasets - Identifizieren relevanter Fälle

BeitragVerfasst: Di 28. Apr 2020, 14:41
von Sarah87
Hallo zusammen,

mein Problem ist Folgendes: Ich habe ein Ausgangs-Data-Set und zusätzlich ein weiteres Dataset, das nur eine Variable (nämlich die Identifikationsnummern der Versuchspersonen) enthält. Hier habe ich eine Vorauswahl getroffen, welche Leute ich quasi betrachten möchte. Jede Nummer gibt es nur einmal.

In meinem Ausgangs-Datenset sind allerdings auch die Daten weiterer Teilnehmer enthalten und somit zusätzliche Identifikationsnummern. Zusätzlich ist die gleiche Identifikationsnnumer über mehrere Zeilen enthalten, weil es für jede Person mehrere Messzeitpunkte gibt, die jeweils in einer neuen Zeile abgelegt sind.

Wie gelingt es mir, in meinem Ausgangs-Datenset nur die Personen, also Identifikationsnummern, zu identifizieren, die auch in meinem anderen Datenset enthalten sind? Also nur, wenn die ID im weiteren Dataset aufgeführt wird, sollen die entsprechenden Zeilen der selben ID in meinem Ausgangsdatenset markiert oder behalten werden.

Ich hoffe, die Frage ist einigermaßen verständlich.

Ich freu mich über jede Hilfe!

Viele Grüße

Sarah

Re: Zwei Datasets - Identifizieren relevanter Fälle

BeitragVerfasst: Di 28. Apr 2020, 16:56
von ponderstibbons
In der 2. Datei berechnest Du eine Variable flag = 1 .
Dann sortierst Du nach Identifikationsnummer und speicherst ab.

In der 1. Datei sortierst Du ebenfalls nach Identifikationsnummer
und verwendest dann "Dateien zusammenfügen"->"Variablen
hinzufügen" und wählst die obige 2. Datei aus, um flag
hinzuzufügen . Du gibst dabei an, dass die 2. Datei als
"Schlüsseltabelle" fungiert und setzt Identifikationsnummer
als Schlüsselvariable.

Mit freundlichen Grüßen

PonderStibbons

Re: Zwei Datasets - Identifizieren relevanter Fälle

BeitragVerfasst: Mi 29. Apr 2020, 11:15
von Sarah87
Vielen Dank schon mal für deine Hilfe!
Das heißt, ich wähle als Zusammenführungsmethode eins-zu-viele aus, oder? Meint die 2. Datei als Schlüsseltabelle auswählen, dass ich diese unter dem Punkt "Referenztabelle" auswähle? Um dann meine relevanten Fälle auszuwählen, muss ich nachher dann einfach die Fälle auswählen, die bei "flag" den Wert 1 haben, richtig?

Sorry, bin mir da noch etwas unsicher mit den Zusammenführungsmethoden...

Und noch eine generelle Frage: Bei Stata gibt es den Befehl "drop if" - gibt es eine äquivalente Funktion in SPSS. Mir ist nur die Methode bekannt, dass ich über Fälle auswählen gerade die Fälle auswählen kann, die ich möchte. Wie kann ich aber genau die löschen, die ich nicht möchte?


Liebe Grüße

Sarah

Re: Zwei Datasets - Identifizieren relevanter Fälle

BeitragVerfasst: Mi 29. Apr 2020, 13:30
von ponderstibbons
Sarah87 hat geschrieben:Vielen Dank schon mal für deine Hilfe!
Das heißt, ich wähle als Zusammenführungsmethode eins-zu-viele aus, oder? Meint die 2. Datei als Schlüsseltabelle auswählen, dass ich diese unter dem Punkt "Referenztabelle" auswähle? Um dann meine relevanten Fälle auszuwählen, muss ich nachher dann einfach die Fälle auswählen, die bei "flag" den Wert 1 haben, richtig?

Sorry, bin mir da noch etwas unsicher mit den Zusammenführungsmethoden...

Probier halt herum.

Mizt freundlichen Grüßen

PonderStibbons