www.vorhilfe.de
Vorhilfe

Kostenlose Kommunikationsplattform für gegenseitige Hilfestellungen.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Vorhilfe
  Status Geisteswiss.
    Status Erdkunde
    Status Geschichte
    Status Jura
    Status Musik/Kunst
    Status Pädagogik
    Status Philosophie
    Status Politik/Wirtschaft
    Status Psychologie
    Status Religion
    Status Sozialwissenschaften
  Status Informatik
    Status Schule
    Status Hochschule
    Status Info-Training
    Status Wettbewerbe
    Status Praxis
    Status Internes IR
  Status Ingenieurwiss.
    Status Bauingenieurwesen
    Status Elektrotechnik
    Status Maschinenbau
    Status Materialwissenschaft
    Status Regelungstechnik
    Status Signaltheorie
    Status Sonstiges
    Status Technik
  Status Mathe
    Status Schulmathe
    Status Hochschulmathe
    Status Mathe-Vorkurse
    Status Mathe-Software
  Status Naturwiss.
    Status Astronomie
    Status Biologie
    Status Chemie
    Status Geowissenschaften
    Status Medizin
    Status Physik
    Status Sport
  Status Sonstiges / Diverses
  Status Sprachen
    Status Deutsch
    Status Englisch
    Status Französisch
    Status Griechisch
    Status Latein
    Status Russisch
    Status Spanisch
    Status Vorkurse
    Status Sonstiges (Sprachen)
  Status Neuerdings
  Status Internes VH
    Status Café VH
    Status Verbesserungen
    Status Benutzerbetreuung
    Status Plenum
    Status Datenbank-Forum
    Status Test-Forum
    Status Fragwürdige Inhalte
    Status VH e.V.

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Dt. Schulen im Ausland: Mathe-Seiten:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "mathematische Statistik" - Clusteranalyse
Clusteranalyse < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Clusteranalyse: Korrekturlesung
Status: (Frage) beantwortet Status 
Datum: 11:25 Do 09.07.2009
Autor: Marcel08

Aufgabe
[Dateianhang nicht öffentlich]

Hallo Community,


über eine Korrekturlesung meiner nachfolgenden Lösung würde ich mich freuen.



Gemäß der euklidischen Distanz [mm] d_{ij}=\wurzel{\summe_{k=1}^{p}(x_{ik}-x_{jk})^{2}} [/mm] erhalten wir die Einträge der Distanzmatrix D


[mm] d_{12}=\wurzel{(x_{11}-x_{21})^{2}+(x_{12}+x_{22})^{2}}=1.00 [/mm]      
    

[mm] d_{13}=\wurzel{(x_{31}-x_{11})^{2}+(x_{32}+x_{12})^{2}}=4.24 [/mm]

[mm] d_{14}= \vdots [/mm]                   =5.65

[mm] d_{23}= \vdots [/mm]                   =3.61

[mm] d_{24}= \vdots [/mm]                   =5.00

[mm] d_{34}= \vdots [/mm]                   =1.41



Daraus ergibt sich


[mm] D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 } [/mm]



Die City-Block-Distanz [mm] d_{ij}=\summe_{k=1}^{p}|x_{ik}-x_{jk}| [/mm] liefert


[mm] d_{23}=\summe_{k=1}^{2}|x_{2k}-x_{3k}|=|2-5|+|2-4|=5 [/mm]



Wir haben [mm] D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 } [/mm]


Fusionsschritt 1: Die kleinste Distanz (ausgenommen die Einträge der Hauptdiagonalen) ist [mm] d_{12}=1 [/mm]


[mm] \Rightarrow [/mm] (1) und (2) werden verschmolzen.

[mm] \Rightarrow P_{3}=((1,2),(3),(4)) [/mm]

[mm] \Rightarrow D_{(1,2),(3)}=max(4.24,3.61)=4.24 [/mm]

[mm] \Rightarrow D_{(1,2),(4)}=max(5.65,5.00)=5.65 [/mm]



Es ergibt sich die folgende Distanzmatrix


[mm] \pmat{ 0 & 4.24 & 5.65 \\ 4.24 & 0 & 1.41 \\ 5.65 & 1.41 & 0 } [/mm]


Fusionsschritt 2: Die kleinste Distanz der Distanzmatrix (ausgenommen der Einträge der Hauptdiagonalen) ist [mm] d_{34}=1.41 [/mm]


[mm] \Rightarrow [/mm] (3) und (4) werden verschmolzen.

[mm] \Rightarrow P_{2}=((1,2),(3,4)) [/mm]

[mm] \Rightarrow D_{(1,2),(3,4)}=max(4.24,5.65)=5.65 [/mm]



Wir erhalten die letzte Distanzmatrix


[mm] \pmat{ 0 & 5.65 \\ 5.65 & 0 } [/mm]


Fusionsschritt 3: (1,2) und (3,4) werden verschmolzen.


[mm] \Rightarrow P_{1}=(1,2,3,4) [/mm]



Meine Lösungen:


zu a) 1.00

zu b) 5.65

zu c) 5.00

zu d) Objekte: (1) und (2), Klassen: (1,2),(3),(4)

zu e) 5.65

zu f) Objekte: (3) und (4), Klassen: (1,2),(3,4)

zu g) 5.65

zu h) Objekte: (1,2) und (3,4), Klassen: (1,2,3,4)

zu i) 1.00




Vielen Dank im Voraus!





Gruß, Marcel

Dateianhänge:
Anhang Nr. 1 (Typ: jpg) [nicht öffentlich]
        
Bezug
Clusteranalyse: Skizze
Status: (Antwort) fertig Status 
Datum: 12:41 Do 09.07.2009
Autor: Al-Chwarizmi

Hallo Marcel,

das scheint alles zu stimmen. Für die Kon-
trolle brauchte ich keinen Rechner. Ich habe
mir dazu die Punkte A,B,C,D auf kariertem
Papier skizziert. Da sieht man sofort, dass
AB die kürzeste und AD die längste Ver-
bindungsstrecke ist. Ihre Längen bekommt
man mit Pythagoras. Auch die City-Block-
Distanzen zwischen den verschiedenen
Punkten sind leicht ersichtlich.

LG    

Bezug
                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:49 Do 09.07.2009
Autor: Marcel08

Okay, vielen Dank soweit. Ich habe in der Zwischenzeit meinen Eintrag nochmal erweitert. Für weitere Korrekturhinweise wäre ich sehr dankbar.



Gruß, Marcel

Bezug
        
Bezug
Clusteranalyse: Aufgabenblatt
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:47 Do 09.07.2009
Autor: Marcel08

Ein erweitertes Aufgabenblatt liegt dem ersten Eintrag als Anhang bei.

Bezug
        
Bezug
Clusteranalyse: Antwort
Status: (Antwort) fertig Status 
Datum: 13:17 Do 09.07.2009
Autor: Al-Chwarizmi


> Wir haben [mm]D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 }[/mm]


Dies ist die euklidische Distanzmatrix.
Wenn ich richtig gelesen habe, soll die
Clusteranalyse aber aufgrund der
City-Block-Metrik erfolgen ...


> Fusionsschritt 1: Die kleinste Distanz (ausgenommen die
> Einträge der Hauptdiagonalen) ist [mm]d_{12}=1[/mm]
>  
>
> [mm]\Rightarrow[/mm] (1) und (2) werden verschmolzen.
>  
> [mm]\Rightarrow P_{3}=((1,2),(3),(4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(3)}=max(4.24,3.61)=4.24[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(4)}=max(5.65,5.00)=5.65[/mm]
>  
>
>
> Es ergibt sich die folgende Distanzmatrix
>  
>
> [mm]\pmat{ 0 & 4.24 & 5.65 \\ 4.24 & 0 & 1.41 \\ 5.65 & 1.41 & 0 }[/mm]
>  
>
> Fusionsschritt 2: Die kleinste Distanz der Distanzmatrix
> (ausgenommen der Einträge der Hauptdiagonalen) ist
> [mm]d_{34}=1.41[/mm]
>  
>
> [mm]\Rightarrow[/mm] (3) und (4) werden verschmolzen.
>  
> [mm]\Rightarrow P_{2}=((1,2),(3,4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(3,4)}=max(4.24,5.65)=5.65[/mm]


Bezug
                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 15:47 Do 09.07.2009
Autor: oLman

So, habe die Aufgabe jetzt nochmal nach City Metrix Distanzmatrix durchgerechnet:

     A B C D
$ [mm] D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 } [/mm] $

1. Fusions Schritt:

--> 8 wählen {A,D} verschmelzen

[mm] D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 } [/mm]

Rechenbeispiel:

[mm] d_{AD,C}= max{(d_{AC},d_{DC}}) [/mm] = 6

2. Fusions Schritt:

-> 7 wählen {AD,B} verschmelzen

[mm] D*=\pmat{ 0 & 6 \\ 6 & 0 } [/mm]

3 Fusions Schritt:

-> 6 wählen { ADB,C} verschmelzen

Ergebnis = 6

Ist das so korrekt?

lg
olman



Bezug
                        
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 15:58 Do 09.07.2009
Autor: Al-Chwarizmi


> So, habe die Aufgabe jetzt nochmal nach City Metrix
> Distanzmatrix durchgerechnet:
>  
> A B C D
>  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]     [ok]
>  
> 1. Fusions Schritt:
>  
> --> 8 wählen {A,D} verschmelzen       [verwirrt]    [kopfschuettel]
>  
> [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  
> Rechenbeispiel:
>  
> [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  
> 2. Fusions Schritt:
>  
> -> 7 wählen {AD,B} verschmelzen
>  
> [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  
> 3 Fusions Schritt:
>  
> -> 6 wählen { ADB,C} verschmelzen
>  
> Ergebnis = 6
>  
> Ist das so korrekt?
>  
> lg
>  olman



Ich denke, die Reihenfolge der Fusionen sollte
doch bei der kleinsten Distanz beginnen,
nicht bei der größten !

Bezug
                                
Bezug
Clusteranalyse: Verbesserungsvorschlag
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:21 Do 09.07.2009
Autor: Marcel08


> > So, habe die Aufgabe jetzt nochmal nach City Metrix
> > Distanzmatrix durchgerechnet:
>  >  
> > A B C D
>  >  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]
>     [ok]
>  >  



1. Fusions Schritt:


Hier würde ich [mm] d_{12}=1 [/mm] wählen als kleinste Distanz.


[mm] \Rightarrow [/mm] (1) und (2) verschmelzen.

[mm] \Rightarrow P_{3}=((1,2),(3),(4)) [/mm]

[mm] \Rightarrow D_{(1,2)(3)}=max(6,5)=6 [/mm]

[mm] \Rightarrow D_{(1,2)(4)}=max(8,7)=8 [/mm]



Die neue Distanzmatrix sähe dann wie folgt aus:


[mm] D=\pmat{ 0 & 6 & 8 \\ 6 & 0 & 2 \\ 8 & 2 & 0} [/mm]



2. Fusionsschritt:


Kleinste Distanz mit [mm] d_{34}=2 [/mm] wählen.


[mm] \Rightarrow [/mm] (3) und (4) verschmelzen.

[mm] \Rightarrow P_{2}=(1,2)(3,4) [/mm]

[mm] \Rightarrow D_{1,2)(3,4)}=max(6,8)=8 [/mm]



Die neue Matrix würden dann lauten:


[mm] \pmat{ 0 & 8 \\ 8 & 0 } [/mm]



3. Fusionsschritt: Kleinste Distanz mit [mm] d_{(1,2)(3,4)}=8 [/mm] wählen.


[mm] \Rightarrow [/mm] (1,2) und (3,4) verschmelzen.

[mm] \Rightarrow P_{1}=(1,2,3,4) [/mm]




Das wäre mein Vorschlag dazu.





Gruß, Marcel



Vielleicht noch eine kleine Frage dazu:


Ist es denn nicht von vornherein klar, welche Distanzmatrix man nach dem 2. Fusionsschritt erhalten würde? Wenn man im Zuge des Complete-Linkage-Verfahrens bei der Neubestimmung der Distanzmatrix eh immer das Maximum nimmt, ist es doch klar, dass am Ende die 8 (in diesem Beispiel) übrig bleibt, oder sehe ich das falsch?

Analog auch zum Single-Linkage-Verfahren, wo ich mal schätze würde, dass im Zuge des vorliegenden Beispiels die Matrix


[mm] \pmat{ 0 & 1 \\ 1 & 0 } [/mm]


herauskommen würde.



Im Average-Linkage-Verfahren würde ich mal tippen


[mm] \pmat{ 0 & 5 \\ 5 & 0 } [/mm]


Wie gesagt, eine reine Vermutung. Über eine Aufklärung wäre ich sehr dankbar.





> > --> 8 wählen {A,D} verschmelzen       [verwirrt]    
> [kopfschuettel]
>  >  
> > [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  >  
> > Rechenbeispiel:
>  >  
> > [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  >  
> > 2. Fusions Schritt:
>  >  
> > -> 7 wählen {AD,B} verschmelzen
>  >  
> > [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  >  
> > 3 Fusions Schritt:
>  >  
> > -> 6 wählen { ADB,C} verschmelzen
>  >  
> > Ergebnis = 6
>  >  
> > Ist das so korrekt?
>  >  
> > lg
>  >  olman
>  
>
>
> Ich denke, die Reihenfolge der Fusionen sollte
>  doch bei der kleinsten Distanz beginnen,
>  nicht bei der größten !


Bezug
                                        
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:28 Do 09.07.2009
Autor: Marcel08


> > > So, habe die Aufgabe jetzt nochmal nach City Metrix
> > > Distanzmatrix durchgerechnet:
>  >  >  
> > > A B C D
>  >  >  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]
> >     [ok]

>  >  >  
>
>
>
> 1. Fusions Schritt:
>  
>
> Hier würde ich [mm]d_{12}=1[/mm] wählen als kleinste Distanz.
>  
>
> [mm]\Rightarrow[/mm] (1) und (2) verschmelzen.
>  
> [mm]\Rightarrow P_{3}=((1,2),(3),(4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2)(3)}=max(6,5)=6[/mm]
>  
> [mm]\Rightarrow D_{(1,2)(4)}=max(8,7)=8[/mm]
>  
>
>
> Die neue Distanzmatrix sähe dann wie folgt aus:
>  
>
> [mm]D=\pmat{ 0 & 6 & 8 \\ 6 & 0 & 2 \\ 8 & 2 & 0}[/mm]
>  
>
>
> 2. Fusionsschritt:
>
>
> Kleinste Distanz mit [mm]d_{34}=2[/mm] wählen.
>  
>
> [mm]\Rightarrow[/mm] (3) und (4) verschmelzen.
>  
> [mm]\Rightarrow P_{2}=(1,2)(3,4)[/mm]
>  
> [mm]\Rightarrow D_{1,2)(3,4)}=max(6,8)=8[/mm]
>  
>
>
> Die neue Matrix würden dann lauten:
>  
>
> [mm]\pmat{ 0 & 8 \\ 8 & 0 }[/mm]
>  
>
>
> 3. Fusionsschritt: Kleinste Distanz mit [mm]d_{(1,2)(3,4)}=8[/mm]
> wählen.
>  
>
> [mm]\Rightarrow[/mm] (1,2) und (3,4) verschmelzen.
>  
> [mm]\Rightarrow P_{1}=(1,2,3,4)[/mm]
>  
>
>
>
> Das wäre mein Vorschlag dazu.
>  
>
>
>
>
> Gruß, Marcel
>  
>
>
> Vielleicht noch eine kleine Frage dazu:
>  
>
> Ist es denn nicht von vornherein klar, welche Distanzmatrix
> man nach dem 2. Fusionsschritt erhalten würde? Wenn man im
> Zuge des Complete-Linkage-Verfahrens bei der Neubestimmung
> der Distanzmatrix eh immer das Maximum nimmt, ist es doch
> klar, dass am Ende die 8 (in diesem Beispiel) übrig
> bleibt, oder sehe ich das falsch?
>  
> Analog auch zum Single-Linkage-Verfahren, wo ich mal
> schätze würde, dass im Zuge des vorliegenden Beispiels
> die Matrix
>  
>
> [mm]\pmat{ 0 & 1 \\ 1 & 0 }[/mm]
>  
>
> herauskommen würde.
>  
>
>
> Im Average-Linkage-Verfahren würde ich mal tippen
>  
>
> [mm]\pmat{ 0 & 5 \\ 5 & 0 }[/mm]
>  
>
> Wie gesagt, eine reine Vermutung. Über eine Aufklärung
> wäre ich sehr dankbar.
>  

Hat sich erledigt. :-)

>
> > > --> 8 wählen {A,D} verschmelzen       [verwirrt]    
> > [kopfschuettel]
>  >  >  
> > > [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  >  >  
> > > Rechenbeispiel:
>  >  >  
> > > [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  >  >  
> > > 2. Fusions Schritt:
>  >  >  
> > > -> 7 wählen {AD,B} verschmelzen
>  >  >  
> > > [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  >  >  
> > > 3 Fusions Schritt:
>  >  >  
> > > -> 6 wählen { ADB,C} verschmelzen
>  >  >  
> > > Ergebnis = 6
>  >  >  
> > > Ist das so korrekt?
>  >  >  
> > > lg
>  >  >  olman
>  >  
> >
> >
> > Ich denke, die Reihenfolge der Fusionen sollte
>  >  doch bei der kleinsten Distanz beginnen,
>  >  nicht bei der größten !
>  


Bezug
                                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:32 Do 09.07.2009
Autor: oLman

Alles klar, hab jetzt auch 8 raus, mir war nicht bewusst dass immer die kleinste Distanz gewählt werden muss, ich dachte das ist vom verfahren abhängig (single linkage, complete linkage oder average linkage).

Besten Dank!

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.vorhilfe.de