Seite 1 von 1

Clusteranalyse mit nominalen Daten

BeitragVerfasst: Mi 14. Dez 2022, 22:03
von ChrisSaar96
Hallo in die Runde,

im Rahmen meiner Masterarbeit würde ich gerne eine Clusteranalyse mit mehreren (ca. 8) nominalen Variablen (alle für sich genommen nicht dichotom - also mehr als 2 Ausprägungen je Variable) machen. Da meine Statistik-Kenntnisse leider sehr spärlich sind, habe ich dazu leider noch einige Fragen :oops: :

Sind alle drei in SPPS verfügbaren Clustermethoden (Hierarchisch, K-Means, Two-Step-Cluster) prinzipiell für einen Datensatz mit ca. 150 Fällen geeignet?

Welche Einstellungen müssen bei der hierarchischen Clustermethode vorgenommen werden?
--> konkret: SPSS muss die nominalskalierten Daten ja zu Binärdaten umwandeln. Geschieht dies automatisch sobald ich als Maß "binär" anklicke (quasi im Hintergrund), oder muss ich die Maße im Menüfenster durch Anklicken von "Auf Bereiche 0-1 skalieren" transformieren, oder aber muss dies zuvor gar manuell durchs Bilden einer manuellen Dummy-Variable geschehen?
Screenshot 2022-12-14 205248.png
Hier das SPSS-Fenster zur Hierarchischen Clusteranalyse
Screenshot 2022-12-14 205248.png (91.52 KiB) 3318-mal betrachtet


Wäre für jegliche Ratschläge super dankbar!

Re: Clusteranalyse mit nominalen Daten

BeitragVerfasst: Mi 14. Dez 2022, 22:18
von ChrisSaar96
Screenshot2.png
Screenshot2.png (99.09 KiB) 3315-mal betrachtet

Oder aber muss die Codiuerung in Binäre Variablen über das Auswahlfeld "Standardisieren" erfolgen?

Re: Clusteranalyse mit nominalen Daten

BeitragVerfasst: Do 15. Dez 2022, 08:47
von ponderstibbons
Die Stichprobengröße sollte kein Problem darstellen.
Kategoriale Variablen werden durch die Prozedur nicht in eine Reihe von binären Variablen umgewandelt. Diese muss der Nutzer gegebenenfalls selbst anlegen.
Was die möglichen Skalenniveaus der Daten in den drei Prozeduren angeht, siehe Handbuch:
https://www.ibm.com/docs/de/spss-statis ... r-analysis
https://www.ibm.com/docs/de/spss-statis ... r-analysis
https://www.ibm.com/docs/de/spss-statis ... r-analysis

Mit freundlichen Grüßen

PonderStibbons

Re: Clusteranalyse mit nominalen Daten

BeitragVerfasst: Do 15. Dez 2022, 10:30
von ChrisSaar96
Danke für hilfreiche Antwort!

In "Backhaus Multivariate Analysemethoden" habe ich gelesen, dass auch ohne Binär-Codierung geclustert werden kann (siehe Bild). Wissen Sie, oder sonst jemand in der Runde, wann (bei Verwendung dieses Verfahrens) auf Werte zwischen 0 und 1 standartisiert bzw. auf den Bereich zwischen 0-1 transformiert werden muss?
Screenshot3.png
Screenshot3.png (97.86 KiB) 3294-mal betrachtet

Re: Clusteranalyse mit nominalen Daten

BeitragVerfasst: Do 15. Dez 2022, 11:55
von ponderstibbons
Das Chi²-Maß bezieht sich auf Zähldaten. Und die Transformation hat nichts mit binären Variablen zu tun. Es handelt sich
bei "Werte transformieren" um Möglichkeiten zur Transformation von Intervalldaten, um verschieden skalierte Variablen
(z.B. "Gewicht 45 bis 187 kg" und "Schuhgröße 37 bis 47 cm") vergleichbar zu machen, weil sonst Variablen mit numerisch
"breiten" Skalen die Distanzmessungen dominieren. "Maße transformieren" ist eine Re-Skalierung der berechneten
Distanzen.

Mit freundlichen Grüßen

PonderStibbons