www.vorhilfe.de
Vorhilfe

Kostenlose Kommunikationsplattform für gegenseitige Hilfestellungen.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Vorhilfe
  Status Geisteswiss.
    Status Erdkunde
    Status Geschichte
    Status Jura
    Status Musik/Kunst
    Status Pädagogik
    Status Philosophie
    Status Politik/Wirtschaft
    Status Psychologie
    Status Religion
    Status Sozialwissenschaften
  Status Informatik
    Status Schule
    Status Hochschule
    Status Info-Training
    Status Wettbewerbe
    Status Praxis
    Status Internes IR
  Status Ingenieurwiss.
    Status Bauingenieurwesen
    Status Elektrotechnik
    Status Maschinenbau
    Status Materialwissenschaft
    Status Regelungstechnik
    Status Signaltheorie
    Status Sonstiges
    Status Technik
  Status Mathe
    Status Schulmathe
    Status Hochschulmathe
    Status Mathe-Vorkurse
    Status Mathe-Software
  Status Naturwiss.
    Status Astronomie
    Status Biologie
    Status Chemie
    Status Geowissenschaften
    Status Medizin
    Status Physik
    Status Sport
  Status Sonstiges / Diverses
  Status Sprachen
    Status Deutsch
    Status Englisch
    Status Französisch
    Status Griechisch
    Status Latein
    Status Russisch
    Status Spanisch
    Status Vorkurse
    Status Sonstiges (Sprachen)
  Status Neuerdings
  Status Internes VH
    Status Café VH
    Status Verbesserungen
    Status Benutzerbetreuung
    Status Plenum
    Status Datenbank-Forum
    Status Test-Forum
    Status Fragwürdige Inhalte
    Status VH e.V.

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Dt. Schulen im Ausland: Mathe-Seiten:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Statistik (Anwendungen)" - Clusteranalyse
Clusteranalyse < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Clusteranalyse: Geeigneter Algorithmus
Status: (Frage) beantwortet Status 
Datum: 16:28 So 24.11.2013
Autor: dibbi1234

Aufgabe
Geeigneter Algorithmus für eine "hierarische " Clusteranalyse ...

Hallo zusammen,

ich bin neu in diesem Forum und habe eine Frage im Bereich der Statistik. Meine Aufgabe in der Uni ist es eine Clusteranalyse durchzuführen bei der ich nun eine Algorithmus programmieren soll. Hier die Anforderungen an den Algorithmus:

- Bildung von 3 oder 4 Clustern (muss vorher festgelegt werden)
- In einem (x/y) Diagramm werden jeweils an den Achsen Kennzahlen verwendet
- Kennzahlen gehen von 0 - 100%, je höher desto besser ist das Ergebnis
- es soll mit Bezug auf das Ergebnis Cluster gebildet werden (Bsp.3 Cluster: schlecht-mittel-gut)

Der Algorithmus solo nun quasi nach Rangfolge bzw. Ergebnis 3 Cluster ermitteln.

Beispiel:
C1(Schlechtes Cluster): K1: 10%; K2: 12%
C2(Mittleres Cluster): K1: 50%; K2: 55%
C3(Gutes Cluster): K1:83%; K2: 85%

Wie würdet ihr vorgehen bzw. welche Art von Algorithmus würde sich hier anbieten? Mir ist nicht ganz klar wie der Algorithmus die Unterscheidung von schlechten, mittleren und guten Cluster definieren soll.

Es müsste ja eigentlich irgendwie in die Richtung von Hierarchischen Methoden gehen. Wobei die Festlegung der Cluster (3) z.B. beim k-means Algorithmus möglich ist.

Falls einer von euch sich mit diesem Thema schonmal auseinander gesetzt hat würde ich mich über Ideen sehr freuen.

Vielen dank und schönen Tag noch!

Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.


        
Bezug
Clusteranalyse: Antwort
Status: (Antwort) fertig Status 
Datum: 19:03 Mo 25.11.2013
Autor: wieschoo

Hallo und willkommen bei uns,

es ist schwierig heraus zufinden, was die eigentliche Aufgabe ist und wo deine Probleme stecken.> Geeigneter Algorithmus für eine "hierarische "

> Clusteranalyse ...
> Hallo zusammen,

>

> ich bin neu in diesem Forum und habe eine Frage im Bereich
> der Statistik. Meine Aufgabe in der Uni ist es eine
> Clusteranalyse durchzuführen bei der ich nun eine
> Algorithmus programmieren soll. Hier die Anforderungen an
> den Algorithmus:

>

> - Bildung von 3 oder 4 Clustern (muss vorher festgelegt
> werden)

Das muss bei den (meisten) Clusteralgorithmen vorher festgelegt werden.

> - In einem (x/y) Diagramm werden jeweils an den Achsen
> Kennzahlen verwendet

Ja und vorher kennst du die Kennzahlen? Überhaupt, wie liegen deine Daten vor?

> - Kennzahlen gehen von 0 - 100%, je höher desto besser
> ist das Ergebnis
> - es soll mit Bezug auf das Ergebnis Cluster gebildet
> werden (Bsp.3 Cluster: schlecht-mittel-gut)

Das ist ja das Problem. Solche Clusteralgorithmen sind meistens unsupervised learning Algorithmen, so ein Feedback deiner Kennzahlen kann man da nicht gewinnbringend natürlich einbringen. Nimmst du irgendeine Kostenfunktion, die beim k-means Algo den durchschnittlichen Abstand nimmt, so wird eine größere anzahl von Clustern natürlich besser dastehen.

>

> Der Algorithmus solo nun quasi nach Rangfolge bzw. Ergebnis
> 3 Cluster ermitteln.

>

> Beispiel:
> C1(Schlechtes Cluster): K1: 10%; K2: 12%
> C2(Mittleres Cluster): K1: 50%; K2: 55%
> C3(Gutes Cluster): K1:83%; K2: 85%

>
....
>

> Es müsste ja eigentlich irgendwie in die Richtung von
> Hierarchischen Methoden gehen. Wobei die Festlegung der
> Cluster (3) z.B. beim k-means Algorithmus möglich ist.

Solche hierarchische Clusterideen, wie agglomeratives Clustering und divisives Clustering, clustern sinnvollerweise deine Daten in mehrere Cluster als 3 oder 4.

>

> Falls einer von euch sich mit diesem Thema schonmal
> auseinander gesetzt hat würde ich mich über Ideen sehr
> freuen.

>

> Vielen dank und schönen Tag noch!

>

> Ich habe diese Frage in keinem Forum auf anderen
> Internetseiten gestellt.

>

So wie ich es momentan verstehe suchst du Cluster und das Ergebnis deines Clusteralgorithmus wird per "Kennzahl" bewertet?

-Oder-

Oder aber sind die Kennzahlen deine Daten und du clusterst nur die Kennzahlen?

Beim letzten Fall hast du eine Punktwolke von Daten (Kennzahlen).

> Wie würdet ihr vorgehen bzw. welche Art von Algorithmus
> würde sich hier anbieten? Mir ist nicht ganz klar wie der
> Algorithmus die Unterscheidung von schlechten, mittleren
> und guten Cluster definieren soll.

Das macht ja der Clusteralgorithmus automatisch. Wenn du ihm vorgibst 3 Cluster zu finden, dann wird er auch irgendwelche 3 Cluster finden. Du kannst natürlich bei der Wahl der Start-Zentren für den k-means Algorithmus versuchen den Cluster-Algo zu drängen deine Kennzahlen in die 3 Klassen zu Clustern.
Das Ergebnis lässt sich aber im Allgemeinen nicht forcieren oder vorhersagen, da das meistens immer EM-Algorithmen sind, die eine lokale Konvergenz haben.

Aber erzähl erst einmal wie die Daten (als Toy-Beispiel) aussehen. Vielleicht finden sich da auch andere Algorithmen.

Gruß
wieschoo

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.vorhilfe.de