Seite 1 von 1

Clusteranalyse von kategorialen Variablen - Bitte um Hilfe

BeitragVerfasst: Mi 17. Apr 2013, 12:40
von DerDani
Hallo liebe Statistiker,

nach einem Semester Datenanalyse bin ich nicht wirklich tief in die Materie eingedrungen, muss nun aber eine Clusteranalyse durchführen:

Es sollen ca. 100 kurze akustische Meldungen bezüglich ihrer Bedeutung und Aussage klassifiziert werden. Ein Merkmal ist z.B. "Aufgabe" mit den Ausprägungen "Feedback", "Information", "Handlungsempfehlung" und "Warnung".
So habe ich nun 6 Merkmale mit jeweils 3-7 Ausprägungen, nach denen ich die Sounds bewertet habe.

Ich habe gelesen, dass solche nominalen Werte "dummy-codiert" werden müssen, um clusteranalysiert werden zu können. Also habe ich z.B. das Merkmal "Aufgabe" mit den 4 genannten Ausprägungen in n-1 binäre Variablen zerlegt. Durch diese drei lassen sich alle vier Ausprägungen darstellen. Ist das so richtig/sinnvoll? Und wie gewichte ich für SPSS die Merkmale?

Ist hierbei die hierarchische Clusteranalyse mit Single Linkage ratsam um Ausreißer zu finden um anschließend mit der Ward-Methode auf die Klassen zu kommen?

Ich wäre sehr dankbar für Tipps, bzw. ob ich überhaupt auf dem richtigen Dampfer bin. Ideal wäre natürlich eine Schema F Anleitung für den Statistik-Amateur, aber ich bin nicht so frech eine solche zu erwarten :D


Vielen Dank schon einmal,
Daniel

Re: Clusteranalyse von kategorialen Variablen - Bitte um Hil

BeitragVerfasst: Mi 17. Apr 2013, 18:44
von strukturmarionette
Schendera, Christian F.G. (2009): Clusteranalyse mit SPSS: Mit Faktorenanalyse. Oldenbourg: Oldenbourg Verlag
aus: http://www.statistik-forum.de/bucher-me ... s-t40.html

Re: Clusteranalyse von kategorialen Variablen - Bitte um Hil

BeitragVerfasst: Do 18. Apr 2013, 16:09
von DerDani
Liegt auf meinem Schreibtisch;)

Was ich aber noch nicht rausfinden konnte ist z.B. wie ich einzelne Merkmale für die Clusteranalyse gewichten kann. Fälle lassen sich ja ganz einfach gewichten, aber ich möchte quasi die Variablen gewichten.
Kann ich einfach Variablen duplizieren, um eine Proximität in den wichtigen Merkmalen mehr zu gewichten?

Danke für die Antwort und viele Grüße,
Daniel