Seite 1 von 1

multiple zufällige Startwerte K-Means in SPSS

BeitragVerfasst: Di 30. Aug 2022, 18:42
von lanina
Liebe Community,

ich möchte meine Clusterlösungen von K Means auf Stabilität (und somit die Gefahr, in einem lokalen Maximum oder Minimum hängen geblieben zu sein, minimieren) prüfen und bin dabei auf den Hinweis gestoßen, dies durch multiple zufällige Startwerte zu tun. Soweit ich das verstehe, kann man das unterschiedlich machen.

Gibt es einen Syntax-Befehl, der meine Startwerte verändern kann?
Mit folgendem Befehl erhalte ich immer die gleichen anfänglichen Clusterzentren.

QUICK CLUSTER
Zev1 Zev2 Zkv Zmv1
/MISSING=LISTWISE
/CRITERIA=CLUSTER (3) MXITER (100) CONVERGE (.0001)
/METHOD=KMEANS (NOUPDATE)
/SAVE CLUSTER (c3) DISTANCE (d3)
/PRINT INITIAL ANOVA.

Ansonsten überlege ich, aus meine Stichprobe bis zu zehn zufällige Stichproben zu ziehen (jeweils auf zwei aufgeteilt ohne Zurücklegen) --> entspricht das auch der Stabilitätsprüfung (im Sinne der multiplen zufälligen Startwerte)?

Ich hoffe, ihr könnt mir weiterhelfen,
Lanina