Monday 20 March 2017

Autoregressiv Integrierte Moving Average Modelle

Autoregressive Integrated Moving Average - ARIMA DEFINITION Autoregressive Integrated Moving Average - ARIMA Ein statistisches Analyse-Modell, das Zeitreihen-Daten verwendet, um zukünftige Trends vorherzusagen. Es ist eine Form der Regressionsanalyse, die künftige Bewegungen entlang der scheinbar zufälligen Wanderung von Aktien und dem Finanzmarkt vorhersagen will, indem sie die Unterschiede zwischen den Werten in der Reihe untersucht, anstatt die tatsächlichen Datenwerte zu verwenden. Lags der differenzierten Serien werden als autoregressiv bezeichnet und Verzögerungen innerhalb der prognostizierten Daten werden als gleitender Durchschnitt bezeichnet. BREAKING DOWN Autoregressive Integrated Moving Average - ARIMA Dieser Modelltyp wird im Allgemeinen als ARIMA (p, d, q) bezeichnet, wobei die Ganzzahlen sich auf den autoregressiven beziehen. Integrierte und gleitende Mittelteile des Datensatzes. ARIMA-Modellierung kann Trends berücksichtigen, Saisonalität. Zyklen, Fehler und nicht-stationäre Aspekte eines Datensatzes bei der Prognose. Autoregressive Integrated Moving Average ARIMA (p, d, q) Modelle für die Zeitreihenanalyse In den vorherigen Artikeln (Teile 1. 2 und 3) gingen wir in Signifikante Details über die linearen Zeitreihenmodelle AR (p), MA (q) und ARMA (p, q). Wir haben diese Modelle verwendet, um simulierte Datensätze zu generieren, Modelle zu implementieren, um Parameter wiederherzustellen und diese Modelle dann auf finanzielle Aktiendaten anzuwenden. In diesem Artikel werden wir eine Erweiterung des ARMA-Modells diskutieren, nämlich das Autoregressive Integrated Moving Average Modell oder ARIMA (p, d, q) Modell. Wir werden sehen, dass es notwendig ist, das ARIMA-Modell zu betrachten, wenn wir nicht-stationäre Serien haben. Solche Reihen treten in Gegenwart von stochastischen Trends auf. Quick Recap und nächste Schritte Bisher haben wir die folgenden Modelle berücksichtigt (die Links führen Sie zu den entsprechenden Artikeln): Wir haben unser Verständnis von Zeitreihen stetig mit Konzepten wie serieller Korrelation, Stationarität, Linearität, Residuen, Korrelogrammen, Simulation, Anpassung, Saisonalität, bedingte Heterosedastizität und Hypothesentests. Bisher haben wir keine Vorhersage oder Prognose von unseren Modellen durchgeführt und haben daher keinen Mechanismus für die Herstellung eines Handelssystems oder einer Eigenkapitalkurve. Sobald wir ARIMA (in diesem Artikel), ARCH und GARCH (in den nächsten Artikeln) studiert haben, werden wir in der Lage sein, eine grundlegende langfristige Handelsstrategie auf der Grundlage der Vorhersage der Börsenindexrenditen zu erstellen. Trotz der Tatsache, dass ich in ein paar Details über Modelle gegangen bin, die wir kennen, wird letztlich keine große Leistung (AR, MA, ARMA) haben, sind wir nun in der Prozessreihenmodellierung gut vertraut. Dies bedeutet, dass wir, wenn wir kürzlich kommen, um neuere Modelle (und sogar die derzeit in der Forschungsliteratur) zu studieren, eine signifikante Wissensbasis haben, um zu zeichnen, um diese Modelle effektiv zu bewerten, anstatt sie als Schlüsselfertig zu behandeln Rezept oder Black Box. Noch wichtiger ist, dass es uns das Vertrauen geben wird, um sie auf eigene Faust zu erweitern und zu modifizieren und zu verstehen, was wir tun, wenn wir es tun. Ich bedanke mich davor, dass Sie so geduldig geduldig sind, wie es scheint, dass diese Artikel weit weg sind Die wirkliche Handlung des tatsächlichen Handels. Allerdings ist die wahre quantitative Handelsforschung sorgfältig, gemessen und nimmt erhebliche Zeit, um richtig zu werden. Es gibt keine schnelle Lösung oder reiches Angebot im Quanthandel. Wäre sehr beinahe bereit, unser erstes Trading-Modell zu betrachten, das eine Mischung aus ARIMA und GARCH sein wird, also ist es zwingend notwendig, dass wir einige Zeit damit verbringen, das ARIMA-Modell gut zu verstehen. Sobald wir unser erstes Trading-Modell gebaut haben, werden wir mehr darüber nachdenken Fortgeschrittene Modelle wie Langzeit-Prozesse, State-Space-Modelle (dh die Kalman Filter) und Vector Autoregressive (VAR) Modelle, die uns zu anderen, anspruchsvolleren Trading-Strategien führen wird. Autoregressive Integrated Moving Average (ARIMA) Modelle der Ordnung p, d, q ARIMA Modelle werden verwendet, weil sie eine nicht stationäre Serie auf eine stationäre Serie mit einer Folge von differenzierenden Schritten reduzieren können. Wir können uns von dem Artikel über Weißgeräusche und zufällige Spaziergänge erinnern, dass wir, wenn wir den Differenzoperator auf eine zufällige Spaziergangsserie (eine nicht stationäre Serie) anwenden, mit weißem Rauschen (eine stationäre Serie) verlassen werden: begin nabla xt xt - x wt Ende ARIMA führt diese Funktion im Wesentlichen durch, aber so wiederholt d mal, um eine nicht stationäre Serie auf eine stationäre zu reduzieren. Um andere Formen der Nicht-Stationarität jenseits der stochastischen Trends zu bewältigen, können zusätzliche Modelle verwendet werden. Saisonalitätseffekte (wie die, die bei den Rohstoffpreisen auftreten) können mit dem saisonalen ARIMA-Modell (SARIMA) angegangen werden, aber wir werden SARIMA nicht viel in dieser Serie besprechen. Bedingte heteroscedastische Effekte (wie bei Volatilitäts-Clustering in Aktienindizes) können mit ARCHGARCH angegangen werden. In diesem Artikel werden wir nicht-stationäre Serien mit stochastischen Trends und passen ARIMA Modelle zu diesen Serien. Wir werden auch endlich Prognosen für unsere Finanzreihe vorstellen. Definitionen Vor der Definition von ARIMA-Prozessen müssen wir das Konzept einer integrierten Baureihe diskutieren: Integrierte Serienreihenfolge d Eine Zeitreihe ist in der Reihenfolge d integriert. Ich (d), wenn: begin nablad xt wt end Das heißt, wenn wir die Serie d mal unterscheiden, erhalten wir eine diskrete weiße Rauschreihe. Alternativ mit dem Backward Shift Operator ist eine gleichwertige Bedingung: Nun, da wir eine integrierte Serie definiert haben, können wir den ARIMA-Prozess selbst definieren: Autoregressive Integrated Moving Average Modell der Ordnung p, d, q Eine Zeitreihe ist ein autoregressives integriertes gleitendes Mittelmodell Der Ordnung p, d, q. ARIMA (p, d, q). Wenn nablad xt ein autoregressiver gleitender Durchschnitt der Ordnung p, q, ARMA (p, q) ist. Das heißt, wenn die Serie d mal differenziert wird und dann folgt ein ARMA (p, q) Prozess, dann ist es eine ARIMA (p, d, q) Serie. Wenn wir die Polynomnotation aus Teil 1 und Teil 2 der ARMA-Serie verwenden, dann kann ein ARIMA (p, d, q) - Verfahren in Bezug auf den Backward Shift Operator geschrieben werden. : Wo wt ist eine diskrete weiße Rauschen Serie. Es gibt einige Punkte, um diese Definitionen zu beachten. Da der zufällige Spaziergang durch xt x wt gegeben ist, kann man sehen, daß ich (1) eine andere Darstellung ist, da nabla1 xt wt. Wenn wir einen nichtlinearen Trend vermuten, dann könnten wir in der Lage sein, wiederholtes Differenzieren (d. h. d gt 1) zu verwenden, um eine Reihe auf stationäres weißes Rauschen zu reduzieren. In R können wir den diff-Befehl mit zusätzlichen Parametern verwenden, z. B. Diff (x, d3), um wiederholte Unterschiede durchzuführen. Simulation, Correlogram und Model Fitting Da wir bereits den Befehl arima. sim verwendet haben, um einen ARMA (p, q) Prozess zu simulieren, ist das folgende Verfahren ähnlich dem, das in Teil 3 der ARMA Serie durchgeführt wurde. Der Hauptunterschied ist, dass wir nun d1 setzen werden, das heißt, wir produzieren eine nicht-stationäre Zeitreihe mit einer stochastischen Trending-Komponente. Wie zuvor werden wir ein ARIMA-Modell an unsere simulierten Daten anpassen, versuchen, die Parameter wiederherzustellen, Vertrauensintervalle für diese Parameter zu erzeugen, ein Korrelogramm der Residuen des eingebauten Modells zu erzeugen und schließlich einen Ljung-Box-Test durchzuführen, um festzustellen, ob wir haben eine gute Passform. Wir werden ein ARIMA (1,1,1) Modell simulieren, mit dem autoregressiven Koeffizienten alpha0.6 und dem gleitenden Mittelkoeffizienten beta-0,5. Hier ist der R-Code zu simulieren und zu plotten eine solche Serie: Nun, da wir unsere simulierten Serien haben, werden wir versuchen, ein ARIMA (1,1,1) Modell zu passen. Da wir die Bestellung kennen, werden wir sie einfach in der Passung angeben: Die Konfidenzintervalle werden wie folgt berechnet: Beide Parameterschätzungen fallen in die Konfidenzintervalle und liegen in der Nähe der wahren Parameterwerte der simulierten ARIMA-Serie. Daher sollten wir nicht überrascht sein, die Reste zu sehen, die wie eine Realisierung von diskreten weißen Rauschen aussehen: Schließlich können wir einen Ljung-Box-Test durchführen, um statistische Hinweise auf eine gute Passform zu geben: Wir können sehen, dass der p-Wert signifikant größer ist als 0,05 und als solche können wir sagen, dass es starke Beweise für diskrete weiße Rauschen ist eine gute Passung zu den Residuen. Daher ist das ARIMA (1,1,1) Modell eine gute Passform, wie erwartet. Finanzdaten und Vorhersage In diesem Abschnitt werden wir ARIMA-Modelle an Amazon, Inc. (AMZN) und den SampP500 US Equity Index (GPSC, in Yahoo Finance) passen. Wir werden von der Prognosebibliothek Gebrauch machen, geschrieben von Rob J Hyndman. Lets gehen Sie vor und installieren Sie die Bibliothek in R: Jetzt können wir mit quantmod die tägliche Preisreihe von Amazon ab Anfang 2013 herunterladen. Da wir bereits die ersten Bestellunterschiede der Serie gemacht haben, wird die ARIMA fit in Kürze durchgeführt Für die integrierte Komponente ist kein d gt 0 erforderlich: Wie in Teil 3 der ARMA-Serie werden wir nun die Kombinationen von p, d und q durchlaufen, um das optimale ARIMA (p, d, q) Modell zu finden. Durch optimal bedeutet man die Ordnungskombination, die das Akaike Information Criterion (AIC) minimiert: Wir können sehen, dass eine Reihenfolge von p4, d0, q4 ausgewählt wurde. Bemerkenswert d0, da wir bereits die ersten Größenordnungen oben genommen haben: Wenn wir das Korrelogramm der Residuen zeichnen, können wir sehen, ob wir Beweise für eine diskrete weiße Rauschreihe haben: Es gibt zwei signifikante Peaks, nämlich bei k15 und k21, obwohl wir sollten Erwarten, statistisch signifikante Spitzen zu sehen, einfach aufgrund der Stichprobenvariation 5 der Zeit. Lets einen Ljung-Box-Test durchführen (siehe vorheriger Artikel) und sehen, ob wir einen guten Anhaltspunkt haben: Wie wir sehen können, ist der p-Wert größer als 0,05 und so haben wir für eine gute Passform auf der 95-Ebene. Wir können nun den Prognosebefehl aus der Prognosebibliothek verwenden, um 25 Tage im Voraus für die Rückgabeserie von Amazon vorhersagen zu können: Wir können die Punktvorhersagen für die nächsten 25 Tage mit 95 (dunkelblau) und 99 (hellblauen) Fehlerbändern sehen . Wir werden diese Prognosen in unserer ersten Zeitreihenhandelsstrategie verwenden, wenn wir ARIMA und GARCH kombinieren. Für den SampP500 ist die gleiche Vorgehensweise erforderlich. Zuerst erhalten wir die Daten von quantmod und wandeln sie in einen täglichen Log-Return-Stream um: Wir passen ein ARIMA-Modell an, indem wir die Werte von p, d und q umschleifen: Die AIC sagt uns, dass das beste Modell die ARIMA (2,0, 1) Modell Beachten Sie noch einmal, dass d0, wie wir bereits erste Ordnung Unterschiede der Serie genommen haben: Wir können die Residuen des angepassten Modells zu sehen, ob wir Beweise für diskrete weiße Rauschen haben: Das Korrelogram sieht vielversprechend aus, so dass der nächste Schritt zu laufen ist Die Ljung-Box-Test und bestätigen, dass wir ein gutes Modell passen: Da der p-Wert größer als 0,05 ist, haben wir einen guten Modell. Warum ist das im vorigen Artikel unser Ljung-Box-Test für den SampP500 gezeigt, dass die ARMA (3,3) eine schlechte Passform für die täglichen Log-Rücksendungen war. Beachten Sie, dass ich die SampP500-Daten absichtlich ab 2013 in diesem Artikel abschneiden ließ , Die die flüchtigen Perioden um 2007-2008 praktisch ausschließt. Daher haben wir einen großen Teil des SampP500 ausgeschlossen, wo wir übermäßiges Volatilitäts-Clustering hatten. Dies wirkt sich auf die serielle Korrelation der Serie aus und hat daher die Wirkung, dass die Serie stationärer ist als in der Vergangenheit. Das ist ein wichtiger Punkt. Bei der Analyse von Zeitreihen müssen wir sehr vorsichtig auf bedingte heteroscedastische Serien wie Börsenindizes sein. In der quantitativen Finanzierung wird versucht, Perioden unterschiedlicher Volatilität zu bestimmen, oft als Regimierungserkennung bekannt. Es ist eine der härteren Aufgaben zu erreichen Gut diskutieren diesen Punkt in der nächsten Artikel, wenn wir kommen, um die ARCH und GARCH Modelle zu betrachten. Lets jetzt eine Prognose für die nächsten 25 Tage der SampP500 täglichen Log-Renditen: Nun, da wir die Fähigkeit haben, passen und prognostizieren Modelle wie ARIMA, waren sehr nahe in der Lage, Strategie-Indikatoren für den Handel zu schaffen. Nächste Schritte Im nächsten Artikel werden wir uns das Modell der generalisierten autoregressiven bedingten Heteroscedastizität (GARCH) anschauen und es verwenden, um mehr über die serielle Korrelation in bestimmten Aktien und Aktienindexreihen zu erläutern. Sobald wir GARCH besprochen haben, werden wir in der Lage sein, es mit dem ARIMA-Modell zu kombinieren und Signalindikatoren und damit eine grundlegende quantitative Handelsstrategie zu erstellen. Just Getting Started mit quantitativen TradingA RIMA steht für Autoregressive Integrated Moving Average Modelle. Univariate (Einzelvektor) ARIMA ist eine Prognosetechnik, die die zukünftigen Werte einer Serie, die ganz auf ihrer eigenen Trägheit basiert, projiziert. Seine Hauptanwendung liegt im Bereich der kurzfristigen Prognose, die mindestens 40 historische Datenpunkte erfordert. Es funktioniert am besten, wenn Ihre Daten ein stabiles oder konsistentes Muster im Laufe der Zeit mit einem Minimum an Ausreißern aufweisen. Manchmal genannt Box-Jenkins (nach den ursprünglichen Autoren) ist ARIMA in der Regel exponentiellen Glättungstechniken überlegen, wenn die Daten vernünftig lang sind und die Korrelation zwischen vergangenen Beobachtungen stabil ist. Wenn die Daten kurz oder stark flüchtig sind, kann eine Glättungsmethode besser funktionieren. Wenn Sie nicht mindestens 38 Datenpunkte haben, sollten Sie eine andere Methode als ARIMA beachten. Der erste Schritt bei der Anwendung der ARIMA-Methodik ist die Überprüfung der Stationarität. Stationarity impliziert, dass die Serie auf einem ziemlich konstanten Niveau im Laufe der Zeit bleibt. Wenn ein Trend existiert, wie in den meisten wirtschaftlichen oder geschäftlichen Anwendungen, dann sind Ihre Daten nicht stationär. Die Daten sollten auch eine konstante Varianz in ihren Schwankungen über die Zeit zeigen. Dies ist leicht zu sehen mit einer Serie, die stark saisonal und wächst mit einer schnelleren Rate. In einem solchen Fall werden die Höhen und Tiefen in der Saisonalität im Laufe der Zeit dramatischer werden. Ohne dass diese stationären Bedingungen erfüllt sind, können viele der mit dem Prozess verbundenen Berechnungen nicht berechnet werden. Wenn eine grafische Darstellung der Daten eine Nichtstationarität anzeigt, dann sollten Sie die Serie unterscheiden. Das Unterscheiden ist eine hervorragende Möglichkeit, eine nichtstationäre Serie in eine stationäre zu verwandeln. Dies geschieht durch Subtraktion der Beobachtung in der aktuellen Periode von der vorherigen. Wenn diese Umwandlung nur einmal zu einer Serie erfolgt, sagst du, dass die Daten zuerst differenziert wurden. Dieser Prozess eliminiert im Wesentlichen den Trend, wenn Ihre Serie mit einer konstanten Rate wächst. Wenn es mit zunehmender Rate wächst, können Sie das gleiche Verfahren anwenden und die Daten wieder unterscheiden. Ihre Daten würden dann zweiter differenziert. Autokorrelationen sind Zahlenwerte, die angeben, wie sich eine Datenreihe über die Zeit verhält. Genauer gesagt, es misst, wie stark Datenwerte bei einer bestimmten Anzahl von Perioden auseinander mit der Zeit miteinander korreliert sind. Die Anzahl der Perioden auseinander ist in der Regel die Verzögerung genannt. Beispielsweise misst eine Autokorrelation bei Verzögerung 1, wie die Werte 1 Periode auseinander in der ganzen Reihe miteinander korreliert sind. Eine Autokorrelation bei Verzögerung 2 misst, wie die Daten zwei Perioden voneinander getrennt sind. Autokorrelationen können von 1 bis -1 reichen. Ein Wert nahe 1 gibt eine hohe positive Korrelation an, während ein Wert nahe bei -1 eine hohe negative Korrelation impliziert. Diese Maßnahmen werden am häufigsten durch grafische Darstellungen als Korrelate ausgewertet. Ein Korrektogramm zeichnet die Autokorrelationswerte für eine gegebene Reihe bei verschiedenen Verzögerungen auf. Dies wird als Autokorrelationsfunktion bezeichnet und ist bei der ARIMA-Methode sehr wichtig. Die ARIMA-Methodik versucht, die Bewegungen in einer stationären Zeitreihe als Funktion von sogenannten autoregressiven und gleitenden Durchschnittsparametern zu beschreiben. Diese werden als AR-Parameter (autoregessive) und MA-Parameter (gleitende Durchschnitte) bezeichnet. Ein AR-Modell mit nur 1 Parameter kann als geschrieben werden. X (t) A (1) X (t-1) E (t) wobei X (t) Zeitreihe unter Untersuchung A (1) der autoregressive Parameter der Ordnung 1 X (t-1) die Zeitreihe verzögerte 1 Periode E (T) der Fehlerterm des Modells Dies bedeutet einfach, dass jeder gegebene Wert X (t) durch eine Funktion seines vorherigen Wertes X (t-1) plus einen unerklärlichen Zufallsfehler E (t) erklärt werden kann. Wenn der Schätzwert von A (1) 0,30 betrug, würde der aktuelle Wert der Reihe mit 30 seines Wertes 1 verknüpft sein. Natürlich könnte die Serie auf mehr als nur einen vergangenen Wert bezogen werden. Beispielsweise ist X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dies zeigt an, dass der aktuelle Wert der Reihe eine Kombination der beiden unmittelbar vorhergehenden Werte ist, X (t-1) und X (t-2), plus einige zufällige Fehler E (t). Unser Modell ist jetzt ein autoregressives Modell der Ordnung 2. Moving Average Models: Eine zweite Art von Box-Jenkins-Modell heißt ein gleitendes Durchschnittsmodell. Obwohl diese Modelle dem AR-Modell sehr ähnlich sind, ist das Konzept hinter ihnen ganz anders. Bewegliche Durchschnittsparameter beziehen sich auf das, was in der Periode t nur auf die zufälligen Fehler geschieht, die in vergangenen Zeitperioden aufgetreten sind, dh E (t-1), E (t-2) usw. anstelle von X (t-1), X ( T-2), (Xt-3) wie in den autoregressiven Ansätzen. Ein gleitendes Durchschnittsmodell mit einem MA-Term kann wie folgt geschrieben werden. X (t) - B (1) E (t-1) E (t) Der Ausdruck B (1) heißt MA der Ordnung 1. Das negative Vorzeichen vor dem Parameter wird nur für Konvention verwendet und wird üblicherweise ausgedruckt Automatisch von den meisten Computerprogrammen. Das obige Modell sagt einfach, dass jeder gegebene Wert von X (t) direkt nur mit dem zufälligen Fehler in der vorherigen Periode E (t-1) und dem aktuellen Fehlerterm E (t) zusammenhängt. Wie bei autoregressiven Modellen können die gleitenden Durchschnittsmodelle auf Strukturen höherer Ordnung ausgedehnt werden, die unterschiedliche Kombinationen und gleitende Durchschnittslängen abdecken. Die ARIMA-Methodik ermöglicht auch die Erstellung von Modellen, die sowohl autoregressive als auch gleitende Durchschnittsparameter umfassen. Diese Modelle werden oft als gemischte Modelle bezeichnet. Obwohl dies für ein komplizierteres Vorhersage-Tool macht, kann die Struktur tatsächlich die Serie besser simulieren und eine genauere Prognose erzeugen. Pure Modelle implizieren, dass die Struktur nur aus AR - oder MA-Parametern besteht - nicht beides. Die von diesem Ansatz entwickelten Modelle werden in der Regel als ARIMA-Modelle bezeichnet, weil sie eine Kombination von autoregressiven (AR), Integration (I) - beziehen sich auf den umgekehrten Prozess der Differenzierung, um die Prognose zu produzieren, und gleitende durchschnittliche (MA) Operationen. Ein ARIMA-Modell wird üblicherweise als ARIMA (p, d, q) angegeben. Dies stellt die Reihenfolge der autoregressiven Komponenten (p), die Anzahl der differenzierenden Operatoren (d) und die höchste Ordnung des gleitenden Durchschnittsterms dar. Zum Beispiel bedeutet ARIMA (2,1,1), dass Sie ein autoregressives Modell zweiter Ordnung mit einer gleitenden durchschnittlichen Komponente erster Ordnung haben, deren Serie einmal differenziert wurde, um die Stationarität zu induzieren. Kommissionierung der richtigen Spezifikation: Das Hauptproblem in der klassischen Box-Jenkins versucht zu entscheiden, welche ARIMA-Spezifikation - i. e. Wie viele AR - und MA-Parameter enthalten sind. Dies ist, was viel von Box-Jenkings 1976 dem Identifizierungsprozess gewidmet war. Es hing von der grafischen und numerischen Auswertung der Probenautokorrelation und partiellen Autokorrelationsfunktionen ab. Nun, für Ihre Basismodelle ist die Aufgabe nicht allzu schwierig. Jeder hat Autokorrelationsfunktionen, die eine bestimmte Art und Weise aussehen. Wenn du aber in der Komplexität stehst, sind die Muster nicht so leicht zu erkennen. Um die Sache schwieriger zu machen, stellt Ihre Daten nur eine Stichprobe des zugrunde liegenden Prozesses dar. Dies bedeutet, dass Abtastfehler (Ausreißer, Messfehler usw.) den theoretischen Identifikationsvorgang verzerren können. Deshalb ist die traditionelle ARIMA-Modellierung eher eine Kunst als eine Wissenschaft. ARIMA steht für autoregressive integrierte Moving Average Modelle. Univariate (Einzelvektor) ARIMA ist eine Prognosetechnik, die die zukünftigen Werte einer Serie, die ganz auf ihrer eigenen Trägheit basiert, projiziert. Seine Hauptanwendung liegt im Bereich der kurzfristigen Prognose, die mindestens 40 historische Datenpunkte erfordert. Es funktioniert am besten, wenn Ihre Daten ein stabiles oder konsistentes Muster im Laufe der Zeit mit einem Minimum an Ausreißern aufweisen. Manchmal genannt Box-Jenkins (nach den ursprünglichen Autoren) ist ARIMA in der Regel exponentiellen Glättungstechniken überlegen, wenn die Daten vernünftig lang sind und die Korrelation zwischen vergangenen Beobachtungen stabil ist. Der erste Schritt bei der Anwendung der ARIMA-Methodik ist die Überprüfung der Stationarität. Die Stationarityquot impliziert, dass die Serie im Laufe der Zeit auf einem ziemlich konstanten Niveau bleibt. Wenn ein Trend existiert, wie in den meisten wirtschaftlichen oder geschäftlichen Anwendungen, dann sind Ihre Daten nicht stationär. Die Daten sollten auch eine konstante Varianz in ihren Schwankungen über die Zeit zeigen. Dies ist leicht zu sehen mit einer Serie, die stark saisonal und wächst mit einer schnelleren Rate. In einem solchen Fall werden die Höhen und Tiefen in der Saisonalität im Laufe der Zeit dramatischer werden. Ohne dass diese stationären Bedingungen erfüllt sind, können viele der mit dem Prozess verbundenen Berechnungen nicht berechnet werden. Wenn eine grafische Darstellung der Daten eine Nichtstationarität anzeigt, dann sollten Sie die Serie quittieren. Das Unterscheiden ist eine hervorragende Möglichkeit, eine nichtstationäre Serie in eine stationäre zu verwandeln. Dies geschieht durch Subtraktion der Beobachtung in der aktuellen Periode von der vorherigen. Wenn diese Umwandlung nur einmal zu einer Serie erfolgt, sagst du, dass die Daten quittiert worden sind. Dieser Prozess eliminiert im Wesentlichen den Trend, wenn Ihre Serie mit einer konstanten Rate wächst. Wenn es mit zunehmender Rate wächst, können Sie das gleiche Verfahren anwenden und die Daten wieder unterscheiden. Ihre Daten wären dann unterschritten. QuotAutocorrelationsquot sind numerische Werte, die angeben, wie sich eine Datenreihe über die Zeit bezieht. Genauer gesagt, es misst, wie stark Datenwerte bei einer bestimmten Anzahl von Perioden auseinander mit der Zeit miteinander korreliert sind. Die Anzahl der Perioden, die auseinander liegen, wird gewöhnlich als Quoten bezeichnet. Beispielsweise misst eine Autokorrelation bei Verzögerung 1, wie die Werte 1 Periode auseinander in der ganzen Reihe miteinander korreliert sind. Eine Autokorrelation bei Verzögerung 2 misst, wie die Daten zwei Perioden voneinander getrennt sind. Autokorrelationen können von 1 bis -1 reichen. Ein Wert nahe 1 gibt eine hohe positive Korrelation an, während ein Wert nahe bei -1 eine hohe negative Korrelation impliziert. Diese Maßnahmen werden am häufigsten durch grafische Kurven mit dem Namen quotcorrelagramsquot ausgewertet. Ein Korrektogramm zeichnet die Autokorrelationswerte für eine gegebene Reihe bei verschiedenen Verzögerungen auf. Dies wird als die quotautokorrelation functionquot bezeichnet und ist bei der ARIMA-Methode sehr wichtig. Die ARIMA-Methodik versucht, die Bewegungen in einer stationären Zeitreihe als Funktion von sogenannten quer-aggressiven und sich bewegenden Mittelquotten zu beschreiben. Diese werden als AR-Parameter (autoregessive) und MA-Parameter (gleitende Durchschnitte) bezeichnet. Ein AR-Modell mit nur 1 Parameter kann als geschrieben werden. X (t) A (1) X (t-1) E (t) wobei X (t) Zeitreihe unter Untersuchung A (1) der autoregressive Parameter der Ordnung 1 X (t-1) die Zeitreihe verzögerte 1 Periode E (T) der Fehlerterm des Modells Dies bedeutet einfach, dass jeder gegebene Wert X (t) durch eine Funktion seines vorherigen Wertes X (t-1) plus einen unerklärlichen Zufallsfehler E (t) erklärt werden kann. Wenn der Schätzwert von A (1) 0,30 betrug, würde der aktuelle Wert der Reihe mit 30 seines Wertes 1 verknüpft sein. Natürlich könnte die Serie auf mehr als nur einen vergangenen Wert bezogen werden. Beispielsweise ist X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dies zeigt an, dass der aktuelle Wert der Reihe eine Kombination der beiden unmittelbar vorhergehenden Werte ist, X (t-1) und X (t-2), plus einige zufällige Fehler E (t). Unser Modell ist jetzt ein autoregressives Modell der Ordnung 2. Moving Average Models: Eine zweite Art von Box-Jenkins-Modell wird als quellenmodelliert. Obwohl diese Modelle dem AR-Modell sehr ähnlich sind, ist das Konzept hinter ihnen ganz anders. Bewegliche Durchschnittsparameter beziehen sich auf das, was in der Periode t nur auf die zufälligen Fehler geschieht, die in vergangenen Zeitperioden aufgetreten sind, dh E (t-1), E (t-2) usw. anstelle von X (t-1), X ( T-2), (Xt-3) wie in den autoregressiven Ansätzen. Ein gleitendes Durchschnittsmodell mit einem MA-Term kann wie folgt geschrieben werden. X (t) - B (1) E (t-1) E (t) Der Ausdruck B (1) heißt MA der Ordnung 1. Das negative Vorzeichen vor dem Parameter wird nur für Konvention verwendet und wird üblicherweise ausgedruckt Automatisch von den meisten Computerprogrammen. Das obige Modell sagt einfach, dass jeder gegebene Wert von X (t) direkt nur mit dem zufälligen Fehler in der vorherigen Periode E (t-1) und dem aktuellen Fehlerterm E (t) zusammenhängt. Wie bei autoregressiven Modellen können die gleitenden Durchschnittsmodelle auf Strukturen höherer Ordnung ausgedehnt werden, die unterschiedliche Kombinationen und gleitende Durchschnittslängen abdecken. Die ARIMA-Methodik ermöglicht auch die Erstellung von Modellen, die sowohl autoregressive als auch gleitende Durchschnittsparameter umfassen. Diese Modelle werden oft als quotmixed modelsquot bezeichnet. Obwohl dies für ein komplizierteres Vorhersage-Tool macht, kann die Struktur tatsächlich die Serie besser simulieren und eine genauere Prognose erzeugen. Pure Modelle implizieren, dass die Struktur nur aus AR - oder MA-Parametern besteht - nicht beides. Die von diesem Ansatz entwickelten Modelle werden in der Regel als ARIMA-Modelle bezeichnet, weil sie eine Kombination von autoregressiven (AR), Integration (I) - beziehen sich auf den umgekehrten Prozess der Differenzierung, um die Prognose zu produzieren, und gleitende durchschnittliche (MA) Operationen. Ein ARIMA-Modell wird üblicherweise als ARIMA (p, d, q) angegeben. Dies stellt die Reihenfolge der autoregressiven Komponenten (p), die Anzahl der differenzierenden Operatoren (d) und die höchste Ordnung des gleitenden Durchschnittsterms dar. Zum Beispiel bedeutet ARIMA (2,1,1), dass Sie ein autoregressives Modell zweiter Ordnung mit einer gleitenden durchschnittlichen Komponente erster Ordnung haben, deren Serie einmal differenziert wurde, um die Stationarität zu induzieren. Kommissionierung der richtigen Spezifikation: Das Hauptproblem in der klassischen Box-Jenkins versucht zu entscheiden, welche ARIMA-Spezifikation - i. e. Wie viele AR - und MA-Parameter enthalten sind. Dies ist, was viel von Box-Jenkings 1976 wurde dem quotidentifizierungsprozess gewidmet. Es hing von der grafischen und numerischen Auswertung der Probenautokorrelation und partiellen Autokorrelationsfunktionen ab. 275 Aufrufe middot View Upvotes middot Nicht zur Reproduktion


No comments:

Post a Comment