Seite 1 von 1

Clusteranalyse Voraussetzungsverletzung

BeitragVerfasst: Sa 31. Okt 2020, 18:53
von Julia_
ich habe folgendes Problem: Ich möchte eine Clusteranalyse mit 80 Variablen durchführen, von denen einige stark miteinander korrelieren. Wenn ich es richtig verstehe ist dies eine Voraussetzungesverletzung. Wie kann man damit umgehen? Mögliche Lösungen, die ich ausprobiert habe, bei denen ich mir aber noch unsicher bin:

1) Faktorenanalyse vorgeschaltet - so korrlieren bei leider noch immer ein paar Variablen, die aus der Faktorenanalyse herauskommen und eigentlich nicht ideal, die Variablen zusammenzufassen,
2) Clusteranalyse: Clustern nach Variablen anstelle von Fällen. Das habe ich als Tipp bekommen, verstehe aber noch nicht ganz wie mir das weiterhelfen soll, wenn ich ja eigentlich die Fälle clustern möchte? Ich wäre sehr dankbar, wenn mir jemand dieses Verfahren erklären könnte, leider finde ich durch Googeln nichts.

Vielen Dank im Voraus!
Julia

Re: Clusteranalyse Voraussetzungsverletzung

BeitragVerfasst: Sa 31. Okt 2020, 23:35
von ponderstibbons
Wie lautet das Thema der Studie und die Fragestellung, wie groß ist die Stichprobe, was sind das für Variablen und wie wurden sie gemessen?

Mit freundlichen Grüßen

PonderStibbons

Re: Clusteranalyse Voraussetzungsverletzung

BeitragVerfasst: So 1. Nov 2020, 15:25
von Julia_
Besten Dank für die Antwort. Es geht um eine klassische LIWC Studie / computergestütze Inhaltsanalyse von Texten anhand ihrer sprachlichen Merkmale (Nutzen von Verben, Adjektiven, emotionalen Begriffen etc.). Das heißt für jede Variable wird die Prozentanzahl an Wörtern eines Textes ausgegeben, die in diese Kategorie fallen. Dadurch, dass die Wörter in mehrere Kategorien eingeordnet werden können, ist es auch recht logisch, dass Variablen miteinander korrelieren. In dieser Studie geht es um ca 50 Variablen und ca. 80 Fälle/Texte, die wir ausgewertet haben. Jetzt geht es darum zu schauen, ob die Texte, die wir vorliegen haben anhand dieser sprachlichen/inhaltlichen Variablen geclustert werden können.

Vielen Dank!

Re: Clusteranalyse Voraussetzungsverletzung

BeitragVerfasst: Mo 2. Nov 2020, 09:43
von ponderstibbons
50 Merkmale, um gerade mal 80 Fälle zu clustern, erscheint mir als ein Missverhältnis.
Eine 50dimensionale Struktur zu interpretieren, könnte zudem etwas schwierig werden.
Kann man das nicht aus inhaltlichen Erwägungen drastisch reduzieren?
Faktorenanalyse vorgeschaltet - so korrlieren bei leider noch immer ein paar Variablen, die aus der Faktorenanalyse herauskommen und eigentlich nicht ideal, die Variablen zusammenzufassen,

Offen gestanden verstehe ich nicht, was Du damit sagen möchtest.

Mit freundlichen Grüßen

PonderStibbons