Extremstellen unter NB < Funktionen < eindimensional < reell < Analysis < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Es sei A eine reelle symmetrische Matrix und [mm] q:\IR^n \to \IR [/mm] mit q(x)=x^tAx die zugehörige quadratische Form.
Bestimmen Sie die globalen Extremstellen und die zugehörigen Extremwerte von q auf der Einheitskugel (x [mm] \in \IR^n, [/mm] |x|=1) |
Hallo, ich habe bei der Bestimmung von Extremstellen unter Nebenbedingungen, die Vorgehensweise noch nicht so verstanden was man zuerst machen muss usw. Vielleicht kann es mir ja jemand an diesem Beispiel erklären. Habe auch die Lösung, aber dennoch Schwierigkeiten damit.
Lösung:
Die Aufgabe ist eine Extremwertaufgabe mit Nebenbedingung: q(x) soll extremal werden unter der Bedingung g(x)=|x|-1=0. Zunächst ist klar, dass q als stetige Funktion auf der kompakten Kugelfläche ihre globalen Maxima und Minima annimmt.
Wir benutzen die Methode der Lagrangeschen Multiplikatoren , um diese Extremstellen zu finden. Wegen
[mm] \Delta [/mm] q(x) = [mm] 2(\summe_{i=1}^{n}a_{i1}x_i, \summe_{i=1}^{n}a_{i2}x_i,...,\summe_{i=1}^{n}a_{in}x_i)=2x^tA [/mm] (wobei man die Symmetrie [mm] A=A^t [/mm] benutzt) und
[mm] \Delta [/mm] g(x) = [mm] (2x_1,2x_2,...,2x_n)=2x^t [/mm] ist [mm] x^tA=\lambda x^t [/mm] für ein [mm] \lambda \in \IR [/mm] eine notwendige Bedingung für das Vorliegen einer Extremstelle.
So erstmal: in der lösung war dieses zeichen [mm] \Delta [/mm] eigentlich andersrum.
So meine ersten Fragen sind auch, ich kann irgendwie nicht nachvollziehen, wie die beiden Ausdrücke zustande kommen, also:
[mm] \Delta [/mm] q(x) = [mm] 2(\summe_{i=1}^{n}a_{i1}x_i, \summe_{i=1}^{n}a_{i2}x_i,...,\summe_{i=1}^{n}a_{in}x_i)=2x^tA [/mm] (wobei man die Symmetrie [mm] A=A^t [/mm] benutzt) und
[mm] \Delta [/mm] g(x) = [mm] (2x_1,2x_2,...,2x_n)=2x^t [/mm]
So dann gehts weiter:
Wir müssen also die Lösungen [mm] (x,\lambda) [/mm] des Systems [mm] xA=\lambda [/mm] x mit |x|=1 finden. Bekanntlich ist [mm] \lambda [/mm] ein Eigenwert von A und x ein zugehöriger Eigenvektor mit |x|=1. In einem solchen Punkt ist der Funktionswert
[mm] q(x)=x^tAx=x^t(\lambda x)=\lambda |x|^2=\lambda.
[/mm]
Die globalen Extremwerte von q auf der Einheitskugel sind also der kleinste Eigenwert (Minimum) bzw. der größte Eigenwert (Maximum). Angenommen werden diese Werte auf den zugehörigen normierten Eigenvektoren.
Also wie gesagt, wäre echt super, wenn mir jemand das mit Extremstellen unter Nebenbedingungen erklären könnte.
Danke für hilfe.
Gruß
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:06 Sa 21.06.2008 | Autor: | jaruleking |
Niemand paar Erklärungen parrat?
Gruß
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 23:53 Mo 23.06.2008 | Autor: | jaruleking |
Kann wirklich keiner helfen???
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 11:59 Fr 27.06.2008 | Autor: | jaruleking |
kann echt keiner helfen?
|
|
|
|
|
Hallo,
mir ist trotz Deiner Fragen nicht recht klar, an welcher Stelle Dein Problem liegt:
kannst Du prinzipiell mit dem Lagrangeansatz Extrema unter Nebenbedingungen berechnen? Oder ist Dir die Vorgehensweise des Lagrangeansatzen unklar?(Indizien scheinen mir daraufhinzudeuten.)
Oder ist Dir der Langrangeansatz prinzipiell klar, nur Du stolperst hier über die quadratische Form?
> Wir benutzen die Methode der Lagrangeschen Multiplikatoren
> , um diese Extremstellen zu finden. Wegen
>
> [mm]\Delta[/mm] q(x) = [mm]2(\summe_{i=1}^{n}a_{i1}x_i, \summe_{i=1}^{n}a_{i2}x_i,...,\summe_{i=1}^{n}a_{in}x_i)=2x^tA[/mm]
> (wobei man die Symmetrie [mm]A=A^t[/mm] benutzt) und
>
> [mm]\Delta[/mm] g(x) = [mm](2x_1,2x_2,...,2x_n)=2x^t[/mm] ist [mm]x^tA=\lambda x^t[/mm]
> für ein [mm]\lambda \in \IR[/mm] eine notwendige Bedingung für das
> Vorliegen einer Extremstelle.
>
>
> So erstmal: in der lösung war dieses zeichen [mm]\Delta[/mm]
> eigentlich andersrum.
>
> So meine ersten Fragen sind auch, ich kann irgendwie nicht
> nachvollziehen, wie die beiden Ausdrücke zustande kommen,
Dein Delta-Zeichen, welches eigentlich umgekehrt sein soll, also [mm] \nabla, [/mm] ist der Nabla-Operator. [mm] \nabla [/mm] f ist der Gradient von f, also grad f.
Man hat oben also die Gradienten von q und g berechnet.
(Gradient: Vektor, dessen Komponenten die partiellen Ableitungen sind.)
> So dann gehts weiter:
>
> Wir müssen also die Lösungen [mm](x,\lambda)[/mm] des Systems
> [mm]xA=\lambda[/mm] x mit |x|=1 finden.
Diese Aussagen entspricht der folgenden:
wir müssen das System grad [mm] (q(x)-\lambda [/mm] g(x))=0 lösen.
Aus der umgearbeiteten Aussage [mm] Ax=\lambda [/mm] x mit |x|=1 folgt, daß die Extremstellen normierte Eigenvektoren sind.
> Bekanntlich ist [mm]\lambda[/mm] ein
> Eigenwert von A und x ein zugehöriger Eigenvektor mit
> |x|=1. In einem solchen Punkt ist der Funktionswert
>
> [mm]q(x)=x^tAx=x^t(\lambda x)=\lambda |x|^2=\lambda.[/mm]
Nun wurde der Funktionswert an diesen Stellen berechnet, mit dem Ergebnis: es ist der Funktionswert von q an der Stelle eines normierten Eigenvektors gerade der Eigenwert.
Wir wissen ja, daß das Min. und Max. an Stellen der normierten Einheitsvektoren angenommen wird. Nun muß man also nur noch den größten und kleinsten Funktionswert an diesen Stellen finden, und dies sind gerad der größte und kleinste Eigenwert, welche an den Stellen der zugehörigen Einheitsvektoren angenommen werden.
Gruß v. Angela
>
> Die globalen Extremwerte von q auf der Einheitskugel sind
> also der kleinste Eigenwert (Minimum) bzw. der größte
> Eigenwert (Maximum). Angenommen werden diese Werte auf den
> zugehörigen normierten Eigenvektoren.
>
>
> Also wie gesagt, wäre echt super, wenn mir jemand das mit
> Extremstellen unter Nebenbedingungen erklären könnte.
>
>
> Danke für hilfe.
>
> Gruß
>
>
>
|
|
|
|
|
Hi, danke erstmal.
aber genau bei den Ableitungen habe ich probleme.
wie kommen die von [mm] q:\IR^n \to \IR [/mm] mit [mm] q(x)=x^t*A*x [/mm] auf diese Ableitung q(x) = [mm] 2(\summe_{i=1}^{n}a_{i1}x_i, \summe_{i=1}^{n}a_{i2}x_i,...,\summe_{i=1}^{n}a_{in}x_i)=2x^tA [/mm] ???
das habe ich noch nicht so verstanden.
bei der Einheitskugel ist es ja eigentlich nur [mm] x^2 [/mm] was die ableiten, und dann halt für mehrere koordinatenachsen oder?
und warum ist eigentlich [mm] x^tA=\lambda*x^t [/mm] das gleiche wie [mm] A*x=\lambda*x [/mm] man kann doch nicht einfach das Transponiert weglassen oder? Ist das doch bei der Matrizenmultiplikation nicht erlaubt.
Gruß
|
|
|
|
|
> wie kommen die von [mm]q:\IR^n \to \IR[/mm] mit [mm]q(x)=x^t*A*x[/mm] auf
> diese Ableitung q(x) = [mm]2(\summe_{i=1}^{n}a_{i1}x_i, \summe_{i=1}^{n}a_{i2}x_i,...,\summe_{i=1}^{n}a_{in}x_i)=2x^tA[/mm]
> ???
> das habe ich noch nicht so verstanden.
Hallo,
ich verstehe das auch nicht auf einen Blick.
In solchen Situationen versuche ich mich an den eigenen Haaren aus dem Sump zu ziehen, indem ich das Probleme erstmal weniger allgemein bearbeite.
Nimm doch n=2 und n=3 und berechne hierfür mal den Gradienten.
Nun zum allgemeinen Fall. Sei [mm] A:=(a_i_k) [/mm] mit [mm] A=A^{T}.
[/mm]
Es ist [mm] x^{T}Ax=\summe_{i=1}^{n}\summe_{j=1}^{n}a_i_jx_ix_j.
[/mm]
Jetzt laß uns partiell nach [mm] x_k [/mm] ableiten. Alle Summanden, die nicht [mm] x_k [/mm] enthalten, fallen hierbei weg.
Es ist also [mm] \bruch{\partial }{\partial x_k}(\summe_{i=1}^{n}\summe_{j=1}^{n}a_i_jx_ix_j)=\bruch{\partial }{\partial x_k}(\summe_{j=1}^{n}a_k_jx_kx_j [/mm] + [mm] \summe_{i=1}^{n}a_i_kx_ix_giltk)
[/mm]
Das bekommst Du jetzt bestimmt hin. Bedenke, daß aufgrund der Symmetrie [mm] a_i_j=a_j_i [/mm] ist.
>
> bei der Einheitskugel ist es ja eigentlich nur [mm]x^2[/mm] was die
> ableiten, und dann halt für mehrere koordinatenachsen
> oder?
Die Nebenbedingung ist [mm] 0=|x|²-1=(x_{1}^{2}+...+x_{n}^{2})-1 [/mm] , und der Gradient von [mm] g(x)=(x_{1}^{2}+...+x_{n}^{2})-1 [/mm] wurde berechnet.
>
> und warum ist eigentlich [mm]x^tA=\lambda*x^t[/mm] das gleiche wie
> [mm]A*x=\lambda*x[/mm] man kann doch nicht einfach das Transponiert
> weglassen oder? Ist das doch bei der Matrizenmultiplikation
> nicht erlaubt.
[mm] x^tA=\lambda*x^t [/mm] <==> [mm] (x^tA)^t=(\lambda*x^t)^t [/mm] <==> [mm] A^t(x^t)^t=\lambda (x^t)^t [/mm] <==> [mm] A^tx=\lambda [/mm] x <==> [mm] Ax=\lambda [/mm] x.
Gruß v. Angela
|
|
|
|
|
hi, vielen dank erstmal.
aber um ehrlich zu sein, weiß ich nicht, warum man das $ [mm] \bruch{\partial }{\partial x_k}(\summe_{i=1}^{n}\summe_{j=1}^{n}a_i_jx_ix_j)=\bruch{\partial }{\partial x_k}(\summe_{j=1}^{n}a_k_jx_kx_j [/mm] $ + $ [mm] \summe_{i=1}^{n}a_i_kx_ix_k) [/mm] $ so schreiben kann und wie man dann fortfährt. weil die klammern ja zum schluss die 2 aus, aber ich sehe hier niergends einen exponenten mit 2.
und dass [mm] x^{T}Ax=\summe_{i=1}^{n}\summe_{j=1}^{n}a_i_jx_ix_j\ [/mm] gilt, ist mir auch neu. aber man lernt ja gerne hinzu
gruß
|
|
|
|
|
> und dass
> [mm]x^{T}Ax=\summe_{i=1}^{n}\summe_{j=1}^{n}a_i_jx_ix_j\[/mm] gilt,
> ist mir auch neu. aber man lernt ja gerne hinzu
Hallo,
das ist Matrizenmultiplikation.
> aber um ehrlich zu sein, weiß ich nicht, warum man das
> [mm]\bruch{\partial }{\partial x_k}(\summe_{i=1}^{n}\summe_{j=1}^{n}a_i_jx_ix_j)=\bruch{\partial }{\partial x_k}(\summe_{j=1}^{n}a_k_jx_kx_j[/mm]
> + [mm]\summe_{i=1}^{n}a_i_kx_ix_k)[/mm] so schreiben kann
Hm ein kleiner Fehler ist mir leider hineingeraten, es muß heißen
[mm]\bruch{\partial }{\partial x_k}(\summe_{i=1}^{n}\summe_{j=1}^{n}a_i_jx_ix_j)=\bruch{\partial }{\partial x_k}(\summe_{j=1}^{n}a_k_jx_kx_j[/mm] + [mm]\summe_{i=1, \red{i\not=k}}^{n}a_i_kx_ix_k)[/mm].
Die Ableitungen (!) nach [mm] x_k [/mm] von den beiden Ausdrücken hinter [mm] bruch{\partial }{\partial x_k} [/mm] sind gleich. Warum das so ist, hatte ich doch gesagt: weil die Ableitungen nach [mm] x_k [/mm] von Summanden, die kein [mm] x_k [/mm] enthalten, wegfallen, habe ich sie weggelassen. (im Eindimensionalen: die Ableitungen von x²+3x+7 und x²+3x sind gleich.)
Wenn Dir die Auflösung der Doppelsummen unklar ist, schreib sie doch mal aus für n=2,3,4
> und wie
> man dann fortfährt. weil die klammern ja zum schluss die 2
> aus, aber ich sehe hier niergends einen exponenten mit 2.
Hast Du schon nach [mm] x_k [/mm] abgeleitet? Was erhältst Du denn?
Gruß v. Angela
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:55 Fr 27.06.2008 | Autor: | jaruleking |
achso, jetzt habe ichs rausbekommen. durch diese summe kommt diese 2 zustande, weil man das dann adieren kann und dann einfach 2 ausklammert.
vielen dank
gruß
p.s. kennst du dich vielleicht mit quadriken aus? ich habe unter quadriken zeichnen einen thread eröffnet, der mir sehr, sehr wichtig ist. aber leider gabs noch keine antwort.
|
|
|
|