Hierarchische Clusteranalyse auf Prozentverteilung

Faktoren- und Clusteranalysen, Diskriminanzanalysen und weitere multivariate Verfahren aller Art mit SPSS

Hierarchische Clusteranalyse auf Prozentverteilung

Beitragvon Obidamn » Mi 25. Mai 2016, 12:07

Hallo zusammen,

ich möchte eine hierarchische Clusteranalyse durchführen. Es liegen Daten als Prozentverteilung vor. D.h. konkret, 6 Items sollten hinsichtlich ihrer Wichtigkeit eingeschätzt werden, wobei Prozentwerte vergeben wurden, die sich über alle 6 Items hinweg auf 100% summieren.
Das würde für mich doch heißen, ich müsste als Distanzmaß das Chi2-Maß auswählen, richtig? Oder kann ich so eine Verteilung einfach, wie für metrische Daten üblich, mit dem quadrierten euklidischen Distanzmaß rechnen?
Da mit Chi2 jedoch geprüft wird, ob die Verteilung zwischen 2 Fällen aus der gleichen Grundgesamtheit kommt, bin ich ziemlich sicher, dass dies in diesem Falle das richtige Proximitätsmaß ist.
Wenn ich nun Chi2 wähle, erhalte ich eigentlich nur mit der Ward-Methode sinnvolle Ergebnisse (gleiche Ergebnisse mit Phi2). Mit Average Linkage kommt leider keine ordentliche Lösung heraus.
Unter Verwendung der Ward-Methode in Verbindung mit Chi2 wirft SPSS allerdings eine Warunung aus: "Das quadrierte euklidische Distanzmaß sollte verwendet werden, wenn die Cluster-Methoden CENTROID, MEDIAN oder WARD gewünscht sind."

Kurzum:
1. Ist das Proximitätsmaß für diese Daten richtig, oder kann/sollte ich mit der quadrierten euklidischen Distanz rechnen?
2. Ist es ein Fehler, die Clusteranalyse unter Verwendung der Ward-Methode in Verbindung mit dem Chi2-Maß zu rechnen?

Bin dankbar für jegliche Lösungsvorschläge!

Beste Grüße
Obidamn
Obidamn
 
Beiträge: 2
Registriert: So 22. Jun 2014, 11:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hierarchische Clusteranalyse auf Prozentverteilung

Beitragvon strukturmarionette » Mi 25. Mai 2016, 13:10

Hi,

ich möchte eine hierarchische Clusteranalyse durchführen. Es liegen Daten als Prozentverteilung vor. D.h. konkret, 6 Items sollten hinsichtlich ihrer Wichtigkeit eingeschätzt werden, wobei Prozentwerte vergeben wurden, die sich über alle 6 Items hinweg auf 100% summieren.

- das ist eher eine Angelegenheit fürs Statistikforum.

Gruß
S.
strukturmarionette
 
Beiträge: 2457
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts


Zurück zu Multivariate Verfahren

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron