GLM-general linear models < Versicherungsmat < Finanz+Versicherung < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 21:43 Do 15.07.2004 | Autor: | gaggalo |
Hallo zusammen
Ich hätte da mal eine Frage zu den verallgemeinerten linearen Modellen:
Ich hab da verständnisprobleme mit der Linkfunktion. Was sagt sie mir aus? Wo ist der Unterschied zu den linearen Modellen?
Und wie wird sie gewählt? Ich hab gelesen, dass sie abhängig von der zugrundegelegten Verteilung ist, aber andererseits heisst es dass für die Praxis die log-Linkfkt benutzt wird!
Steh da irgendwie auf dem Schlauch
Hoffe auf Unterstützung!
Gruß
Ich habe diese Frage in keinem weiteren Forum gestellt.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:42 Fr 16.07.2004 | Autor: | Stefan |
Hallo gaggalo!
Das Ziel von statistischen Methoden ist es eine Zielvariable, auch Response genannt (hier mit $Y$ bezeichnet), in Abhängigkeit von unabhängigen Kovariablen [mm] ($x_1,\ldots, x_p$) [/mm] darzustellen.
Ein lineares Modell besitzt die allgemeine Form:
[mm] $Y_i [/mm] = [mm] \beta_0 [/mm] + [mm] \sum\limits_{i=1}^p x_{ik} \beta_k [/mm] + [mm] \varepsilon_i$ ($i=1,\ldots,n$).
[/mm]
In Matrixschreibweise:
$Y = [mm] X\beta [/mm] + [mm] \epsilon$,
[/mm]
mit
[mm] $Y=(Y_1,\ldots, Y_n)^T$ [/mm] : Response
[mm] $\beta [/mm] = [mm] (\beta_0,\beta_1, \ldots, \beta_p)^T$ [/mm] : unbekannter Regressionsparameter
[mm]X= \begin{pmatrix} 1 & x_{11} & x_{12} & \ldots & x_{1p} \\
1 & x_{21}& x_{22} & \ldots & x_{2p} \\
\vdots & \vdots & \vdots & \vdots & \vdots \\ 1 & x_{n1} & x_{n2} & \ldots & x_{np} \end{pmatrix}[/mm] : Designmatrix (mit $p$ Kovariablenvektoren [mm] $x_k [/mm] = [mm] (x_{1k}, x_{2k},\ldots, x_{nk})^T \quad (k=1,\ldots,p))$
[/mm]
(hierbei ist [mm] $x_{ij}$ [/mm] der Wert der $j$-ten Kovariablen von der Beobachtung $i$),
[mm] $\varepsilon =(\varepsilon_1,\ldots \varepsilon_n)^T$ [/mm] : Vektor der Fehlerterme.
Es gilt:
[mm] $\mbox{E}[\varepsilon]=0$ [/mm] und [mm] $\mbox{Var}[\varepsilon] [/mm] = [mm] \sigma^2 \mathbb{I}_n$.
[/mm]
Die Varianz von [mm] $\varepsilon$ [/mm] wird also als homogen angenommen. Außerdem nimmt man an, dass die Fehlerterme [mm] $\varepsilon_i$ $(i=1,\ldots,n)$ [/mm] normalverteilt und i.i.d. sind, d.h. es gilt:
[mm] $\varepsilon_i \sim {\cal N}(0,\sigma^2)$ $(i=1,\ldots)$.
[/mm]
Unter diesen Annahmen ist auch $Y$ normalverteilt!
Es gilt:
[mm] $\mu \stackrel{\mbox{\scriptsize def}}{=} \mbox{E}[Y] [/mm] = [mm] \beta_0 [/mm] + [mm] \sum\limits_{j=1}^p \beta_j x_j [/mm] = [mm] X\beta$,
[/mm]
[mm] $\mbox{Var}[Y] [/mm] = [mm] \sigma^2 \mathbb{I}_n$.
[/mm]
Die klassischen linearen Modelle können verallgemeinert werden, indem man die (häufig unbefriedigende und in der Praxis unrealistische!) Normalverteilungsannahme der [mm] $Y_i$ $(i=1,\ldots,n)$ [/mm] aufhebt und stattdessen auch Verteilungen von (allgemeineren) Exponentialverteilungen zulässt.
Zu den Exponentialverteilungen zählen alle Verteilungen, deren Dichte auf die Form
[mm] $f_{\theta,\Phi}(y) [/mm] = [mm] \exp \left[ \frac{\langle y, \theta \rangle - b(\theta)}{a(\Phi)} + c(y,\Phi) \right]$
[/mm]
gebracht werden kann, wobei [mm] $\phi$ [/mm] der natürliche Parameter und [mm]\Phi[/mm] der Dispersionsparameter ist.
(Spezialfälle hiervon sind die Normalverteilung und die Poissonverteilung.)
Darüber hinaus wird bei den verallgemeinerten linearen Modellen der lineare Prädiktor [mm] $\eta \stackrel{\mbox{\scriptsize def}}{=} X\beta$ [/mm] über die sogenannte Linkfunktion $g$ mit dem Erwartungswert [mm] $\mu$ [/mm] verbunden:
[mm] $\eta [/mm] = [mm] g(\mu)$.
[/mm]
Die Linkfunktion wird zumeist als umkehrbar und differenzierbar vorausgesetzt.
Gilt [mm] $\eta= \theta$, [/mm] wobei [mm] $\theta$ [/mm] (wie gesagt) der natürliche Parameter der Exponentialverteilung ist, dann spricht man von einem kanonischen Link. Im Gegensatz zu den klassichen linearen Modellen wird zudem die Varianz nicht mehr als konstant angenommen.
Wenn man zum Beispiel annimmt, dass $Y$ poissonverteilt ist (wie ja häufig im (Sach-)Versicherungsbereich), dann gilt:
[mm] $\eta [/mm] = [mm] \theta [/mm] = [mm] \log(\mu)$ [/mm] (denn: [mm] $\mu [/mm] = [mm] e^{\theta}$),
[/mm]
d.h. man hat die Linkfunktion: [mm] $g(\mu) [/mm] = [mm] \log(\mu)$.
[/mm]
Liebe Grüße
Stefan
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:30 Fr 16.07.2004 | Autor: | gaggalo |
Vielen Dank Stefan!!!
Das hilft mir vorerst sehr weiter
Gruß
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 23:47 Fr 16.07.2004 | Autor: | Stefan |
Hallo gaggalo!
Das freut mich.
Melde dich einfach wieder, wenn du weitere Fragen hast.
Liebe Grüße
Stefan
|
|
|
|