t-test bei Zeitreihen < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) überfällig | Datum: | 09:08 Do 20.02.2014 | Autor: | path |
Aufgabe | Momentum-Strategie:
Gegeben sind Zeitreihen von Anleihenrenditen. In jedem Monat t werden die Anleihen in Dezil-Portfolios (P1=geringste Rendite, ...., P10=beste Rendite) anhand ihrer kumulativen Renditen über die vorhergehenden Monate t-6 bis t-1 (sog. Formationsperiode) einsortiert. Die Momentum-Strategie besteht darin, Anleihen aus P10 ("Winner") zu kaufen und Anleihen aus P1 ("Loser") zu verkaufen und dieses "Momentum-Portfolio" (also P10-P1) über die Monate t+1 bis t+6 (Halteperiode) zu halten (in Anlehnung an vorhergehende Arbeiten wird der Monat t übersprungen und gehört somit weder zur Formations- noch zur Halteperiode). Portfoliorenditen bestehen aus den gleichgewichteten Renditen der Anleihen, die ihnen angehören.
Die gesamte Momentum-Strategie-Rendite im Monat t ist der gleichgewichtete Durchschnitt aller Renditen im Monat t, die in den letzten sechs Monaten davor geformt worden sind (also Durchschnitt der Renditen der überlappenden Portfolios).
Dieses Vorgehen erlaubt Standard-Inferenzstatistik basierend auf nicht-überlappenden Renditen.
In einer Tabelle werden dann die durchschnittlichen monatlichen Renditen der Momentum-Portfolios P1 bis P10 gezeigt, sowie die Renditen der Momentum-Strategie (P10-P1) während der Halteperiode.
Außerdem werden dazu die t-Statistiken zu P10-P1 angegeben. |
Hallo matheraum!
Zuerst muss ich laut Forenregeln klarstellen, dass ich auf diese Frage im Zuge einer Arbeit für die Uni gekommen bin.
Ich versuche dabei, oben genannte Momentum-Strategie auf einen eigenen Datensatz anzuwenden. Die eigentliche Berechnung der Rendite der Strategie ist dabei nicht mein Problem, sondern ich hadere mit den Grundlagen bzw. der Anwendbarkeit des t-Tests.
Ich habe mehrere andere Artikel aus wissenschaftlichen Zeitschriften, an denen ich mich orientiere. In diesen wird ohne große Erklärung (siehe Aufgabe: "Dieses Vorgehen erlaubt Standard-Inferenzstatistik basierend auf nicht-überlappenden Renditen.") z.B. der t-Test angewendet, ohne zu klären, ob die Voraussetzungen dafür überhaupt gegeben sind.
Da ich erstens wissen möchte, warum der Test scheinbar standardmäßig auf Differenzen von Zeitreihen angewendet wird und ich das zweitens in meiner Arbeit auch angeben möchte, nun dieser Post.
Bevor ich noch weiter um den heißen Brei herum rede, meine Frage:
Wieso gilt in obiger Aufgabenstellung "Dieses Vorgehen erlaubt Standard-Inferenzstatistik basierend auf nicht-überlappenden Renditen", wenn es sich Mittelwerte von Renditen überlappender Portfolios handelt?
Und wieso kann ich den t-Test auf P10-P1 anwenden, wenn P10 bzw. P1 Durchschnitte über alle betrachteten Monate von Durchschnitten aller Anleiherenditen, die in einem bestimmten Monat gehalten werden (und also innerhalb der vorhergehenden sechs Monate in P1 bzw. P10 aufgenommen wurden) darstellen (falls ich das richtig verstanden habe)?
Ich hoffe, dass irgendjemand mit mehr Ahnung von Statistik sich die Mühe macht, sich durch die Aufgabenstellung zu lesen und mir weiterhelfen kann. Bei Unklarheiten in der Aufgabenstellung bitte einfach nachfragen!
Vielen Dank schonmal für die Hilfe,
path
PS: Die "Ur-Studie" zur Momentum-Strategie bei Aktien ist unter http://dx.doi.org/10.1111%2Fj.1540-6261.1993.tb04702.x frei zugänglich. Auf Seite 70 ist dort eine Tabelle zu sehen, bei der t-Statistiken sowohl für P10 ("buy") und P1 ("sell"), als auch für P10-P1 ("buy-sell") angegeben werden (hier auch für andere Formations- bzw. Halteperioden als je 6 Monate).
Warum dürfen hier also t-Statistiken angegeben werden?
Ich habe diese Frage in keinem anderen Forum gestellt.
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 15:51 Do 20.02.2014 | Autor: | path |
Aufgabe | 0 0 0 0 0 0 0 0 4 5 6 8 10 12 14 14 14 15 16 18 17 18 17 17 18 17 14 17 20 20 17 17 14 15 15 17 19 22 25 25 23 22 20 19 21 27 27 30 36 36 36 32 30 28 29 31 33 33 31 25 24 24 21 23 23 26 32 32 29 29 27 27 28 34 32 34 33 36 39 39 39 37 36 31 32 34 37 33 31 31 33 33 40 40 40 38 35 34 34 36 37 31 31 29 33 32 35 40 38 38 38 33 33 35 36 38 37 37 33 29 30 32 32 35 42 45 49 52 57 56 58 52 53 46 52 53 52 52 53 58 60 62 64 60 52 51 52 55 66 74 75 78 81 80 75 67 72 79 88 91 94 87 83 94 99 102 110 118 |
Kann es evtl. daran liegen, dass n groß genug ist, um mit dem zentralen Grenzwertsatz zu argumentieren und den t-Test ohne Normalverteilungsannahme anzuwenden?
Nur um das nochmal klarzustellen: Ich habe beispielsweise in P1 für 168 Monate (bzw. 160 davon nicht-leer) obige Anzahl von Renditen pro Monat, wobei in jeweils 6 aufeinanderfolgenden Monaten jeweils Renditen enthalten sind, die zu EINER Anleihe gehören (z.B. werden in Monat 9 erstmals 4 Anleihen in das Portfolio P1 aufgenommen, deren Renditen werden für die Monate 9 bis einschließlich 14 für die Mittelwertberechnung der monatlichen Portfoliorendite herangezogen).
Wenn ich nun in jedem Monat den Mittelwert über die Renditen berechne, kann ich dann "auf guter Grundlage" einen t-Test durchführen, mit
[mm] H_0: [/mm] der Mittelwert der monatlichen (Durchschnitts-)Portfoliorendite = 0 ?
D.h. meine unabhängigen, identisch verteilten Zufallsvariablen mit endlichem Erwartungswert und endlicher Varianz (=Voraussetzung t-Test) sind die 160 (=n?) DURCHSCHNITTLICHEN Monatsrenditen, OBWOHL die einzelnen Renditen einzelner Anleihen nicht ganz unabhängig voneinander sind ("Markt" geht nach oben -> Anleihe A UND Anleihe B haben unterschiedliche, aber positive Renditen)?
Ist das ungefähr richtig?
Es wäre super, wenn jemand mit fundierten Kenntnissen mir kurz einen Hinweis geben könnte, ob das stimmt.
Vielen Dank,
path
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:37 Do 20.02.2014 | Autor: | path |
Aha!
Nach weiterer (Literatur-)Recherche glaube ich jetzt, dass n die Größe der einzelnen Stichproben (also hier: 0 0 0 0 0 0 0 0 4 5 6 8 10 12 14 ...) bezeichnet und die gesamten Stichprobenmittelwerte sich einer Normalverteilung annähern, wenn n >30 ist.
Aber muss das für jede Stichprobe gelten?
Und müssen alle Stichproben den selben Umfang haben, oder reicht es, wenn alle >30 sind?
Muss ich dann die ersten Stichproben "rauskicken"? Ich hoffe nicht, und glaube auch nicht, dass das in den in der 1. Frage erwähnten Studien gemacht wird...
Ich bin dankbar für jede Antwort
path
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:20 Sa 08.03.2014 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 09:20 So 23.03.2014 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|