Monday 20 November 2017

Movimento Média E Autorregressivo


A RIMA significa Autoregressive Integrated Moving Average models Único vetor univariante ARIMA é uma técnica de previsão que projeta os valores futuros de uma série inteiramente baseada em sua própria inércia Sua principal aplicação é na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos Funciona melhor quando os seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers Às vezes chamado Box-Jenkins após os autores originais, ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos ea correlação entre observações passadas é Estável Se os dados são curtos ou altamente voláteis, então algum método de alisamento pode funcionar melhor Se você não tiver pelo menos 38 pontos de dados, você deve considerar algum outro método que ARIMA. O primeiro passo na aplicação da metodologia ARIMA é para verificar a estacionaridade Stationarity Implica que a série permaneça a um nível bastante constante ao longo do tempo Se existir uma tendência, como na maioria dos ecossistemas Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo Isso é facilmente visto com uma série que é fortemente sazonal e crescendo a uma taxa mais rápida Em tal caso, os altos e baixos Na sazonalidade se tornará mais dramática ao longo do tempo Sem que estas condições de estacionaridade sejam atendidas, muitos dos cálculos associados ao processo não podem ser computados. Se um gráfico dos dados indicar nonstationarity, então você deve diferenciar a série Differencing é uma excelente maneira de Transformando uma série não estacionária em uma estacionária Isso é feito subtraindo a observação no período atual da anterior Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados Este processo elimina essencialmente a tendência se Sua série está crescendo a uma taxa bastante constante Se está crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferir Os dados novamente Seus dados seriam então segundo diferenciado. As autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, mede quão fortemente os valores de dados em um número específico de períodos separados estão correlacionados entre si ao longo do tempo. Por exemplo, uma autocorrelação no retardo 1 mede como os valores 1 intervalo de tempo são correlacionados entre si ao longo da série. Uma autocorrelação no retardo 2 mede como os dados dois períodos separados estão correlacionados ao longo da série As autocorrelações podem variar de 1 a -1 Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo a -1 implica uma alta correlação negativa. Estas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagrama traça os valores de autocorrelação para uma dada série em diferentes retardos. Função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os Estacionária séries temporais em função do que são chamados de parâmetros auto-regressivos e de média móvel Estes são referidos como parâmetros AR auto-menstruação e MA parâmetros de média móvel Um modelo AR com apenas um parâmetro pode ser escrito como. out X t séries de tempo em investigação. A 1 O parâmetro autorregressivo de ordem 1.X t-1 a série de tempo retardada 1 período. E t o termo de erro do modelo. Isso significa simplesmente que qualquer dado valor X t pode ser explicado por alguma função de seu valor anterior, X t - 1, mais algum erro aleatório inexplicável, E t Se o valor estimado de A 1 era 30, então o valor atual da série seria relacionado a 30 de seu valor 1 período atrás Claro que a série poderia estar relacionada a mais do que apenas Um valor passado Por exemplo. X t A 1 X t-1 A 2 X t-2 E t. Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente precedentes, X t-1 e X t - 2, mais algum erro aleatório E t Nosso modelo é agora um modelo autorregressivo de ordem 2.Moving Aver Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel Embora esses modelos pareçam muito semelhantes ao modelo AR, o conceito por trás deles é bastante diferente Os parâmetros de média móvel relacionam o que acontece no período t somente com os erros aleatórios que Em vez de X t-1, X t-2, Xt-3 como nas abordagens autorregressivas Um modelo de média móvel com um termo de MA pode ser escrito em períodos de tempo passados, ie E t-1, E t-2, Como segue. O termo B 1 é chamado MA de ordem 1 O sinal negativo em frente do parâmetro é usado para convenção só e é geralmente impresso automaticamente pela maioria dos programas de computador O modelo acima simplesmente diz que qualquer dado valor de X T está diretamente relacionada apenas ao erro aleatório no período anterior, E t-1 e ao termo de erro atual, E t Como no caso de modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo diferentes combinações E comprimento médio móvel. Metodologia ARIMA O permite a construção de modelos que incorporam tanto os parâmetros de média móvel como de auto-regressão. Estes modelos são frequentemente referidos como modelos mistos. Embora isto torne uma ferramenta de previsão mais complicada, a estrutura pode de facto simular melhor a série e produzir uma previsão mais precisa Modelos puros Implicam que a estrutura consiste apenas de AR ou MA parâmetros - não both. The modelos desenvolvidos por esta abordagem são geralmente chamados ARIMA modelos porque eles usam uma combinação de AR autorregressivo, integração I - referindo-se ao processo inverso de diferenciação para produzir a previsão, E a média móvel das operações de MA Um modelo ARIMA é geralmente indicado como ARIMA p, d, q Isso representa a ordem dos componentes autorregressivos p, o número de operadores de diferenciação d ea ordem mais alta do termo médio móvel Por exemplo, ARIMA 2, 1,1 significa que você tem um modelo autorregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada onc E para induzir stationarity. Picking a especificação direita. O problema principal em Box-Jenkins clássico está tentando decidir-se que ARIMA especificação para usar - ie quantos parâmetros AR e ou MA para incluir Isto é o que muito de Box-Jenkings 1976 foi dedicado a O processo de identificação Depende da avaliação gráfica e numérica das funções de autocorrelação da amostra e de autocorrelação parcial Bem, para os seus modelos básicos, a tarefa não é muito difícil Cada um tem funções de autocorrelação que parecem uma certa maneira No entanto, quando você sobe em complexidade , Os padrões não são tão facilmente detectados Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente Isso significa que os erros de amostragem outliers, erro de medição, etc pode distorcer o processo de identificação teórica É por isso que a modelagem ARIMA tradicional é uma arte Em vez de uma ciência. Moving Average - MA. BREAKING DOWN Moving Average - MA. As um exemplo de SMA, considere uma segurança com o seguinte closin G mais de 15 dias. Week 1 5 dias 20, 22, 24, 25, 23.Week 2 5 dias 26, 28, 26, 29, 27.Week 3 5 dias 28, 30, 27, 29, 28.A 10 Dia MA iria média dos preços de fechamento para os primeiros 10 dias como o primeiro ponto de dados O próximo ponto de dados iria cair o preço mais cedo, adicione o preço no dia 11 e tomar a média, e assim por diante como mostrado abaixo. Como observado anteriormente , Os MAs atrasam a ação atual do preço porque são baseados em preços passados ​​mais longo o período de tempo para o MA, mais grande o lag Assim um MA de 200 dias terá um grau muito maior do lag do que um MA de 20 dias porque contem preços Para os últimos 200 dias A duração da MA para usar depende dos objetivos de negociação, com MA mais curto usado para negociação de curto prazo e MA de longo prazo mais adequado para investidores de longo prazo O MA de 200 dias é amplamente seguido por investidores e Comerciantes, com quebras acima e abaixo desta média móvel considerada como importante trading signals. MAs também transmitir importantes sinais comerciais por conta própria, ou quando duas médias cro Ss sobre Um aumento MA indica que a segurança está em uma tendência de alta, enquanto um declínio MA indica que está em uma tendência de baixa Da mesma forma, impulso ascendente é confirmada com um crossover de alta que ocorre quando um MA de curto prazo cruza acima de um MA a longo prazo Downward Momentum é confirmada com um crossover de baixa, o que ocorre quando um MA de curto prazo cruza abaixo de um longo prazo MA. Introdução para ARIMA não sazonais models. ARIMA p, d, q equação de previsão ARIMA modelos são, em teoria, a classe mais geral de Modelos para prever uma série de tempo que pode ser feita para ser estacionária por diferenciação, se necessário, talvez em conjunto com transformações não-lineares, como logging ou deflação, se necessário Uma variável aleatória que é uma série de tempo é estacionário se suas propriedades estatísticas são todas constantes ao longo do tempo Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ele wiggles de forma consistente ou seja, seus padrões de tempo aleatório de curto prazo sempre olhar o Mesmo em um sentido estatístico Esta última condição significa que suas correlações de autocorrelações com seus próprios desvios anteriores da média permanecem constantes ao longo do tempo, ou, de forma equivalente, que seu espectro de poder permanece constante ao longo do tempo Uma variável aleatória desta forma pode ser vista como usual como um Combinação de sinal e ruído, eo sinal se for aparente poderia ser um padrão de reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no sinal, e também poderia ter um componente sazonal. Um modelo ARIMA pode ser visto como um Filtro que tenta separar o sinal do ruído eo sinal é extrapolado então no futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação de tipo de regressão linear isto é em que os preditores consistem em defasagens do Variável dependente e / ou defasagens dos erros de previsão Isso é. Valor estimado de Y uma constante e ou uma soma ponderada de um ou mais valores recentes de Y e / ou uma soma ponderada de um Ou valores mais recentes dos erros. Se os preditores consistem somente em valores defasados ​​de Y, é um modelo auto-regressivo autoregressivo puro, que é apenas um caso especial de um modelo de regressão e que poderia ser equipado com software de regressão padrão. Por exemplo, Um modelo AR 1 auto-regressivo de primeira ordem para Y é um modelo de regressão simples no qual a variável independente é apenas Y retardada por um período LAG Y, 1 em Statgraphics ou YLAG1 em RegressIt Se alguns dos preditores são atrasos dos erros, um ARIMA Modelo não é um modelo de regressão linear, porque não há maneira de especificar o erro do último período s como uma variável independente os erros devem ser calculados em uma base período-a-período quando o modelo é ajustado aos dados De um ponto de vista técnico, O problema com o uso de erros defasados ​​como preditores é que as previsões do modelo não são funções lineares dos coeficientes mesmo que sejam funções lineares dos dados passados. Portanto, os coeficientes em modelos ARIMA que incluem erros retardados m Ust ser estimado por métodos de otimização não-lineares hill-climbing em vez de apenas resolver um sistema de equações. A sigla ARIMA significa Auto-Regressive Integrated Moving Average Lags da série estacionária na equação de previsão são chamados termos autorregressivos, atrasos dos erros de previsão São chamados de termos de média móvel e uma série de tempo que precisa ser diferenciada para ser estacionária é dito ser uma versão integrada de uma série estacionária Random-pé e modelos de tendência aleatória, modelos autorregressivos e modelos de suavização exponencial são todos os casos especiais De modelos ARIMA. Um modelo ARIMA não sazonal é classificado como um modelo ARIMA p, d, q, onde p é o número de termos autorregressivos. d é o número de diferenças não sazonais necessárias para a estacionariedade, eq é o número de previsão defasada Erros na equação de previsão. A equação de previsão é construída da seguinte maneira: Primeiro, vamos y representar a d diferença de Y que significa. Note que a segunda diferença de Y th Ed 2 caso não é a diferença de 2 períodos atrás, em vez disso, é a diferença de primeira diferença da primeira diferença que é o análogo discreto de uma segunda derivada, ou seja, a aceleração local da série ao invés de sua tendência local. Aqui, os parâmetros da média móvel s são definidos de modo que seus sinais sejam negativos na equação, seguindo a convenção introduzida por Box e Jenkins. Alguns autores e software, incluindo a linguagem de programação R, os definem para que tenham Mais sinais em vez disso Quando números reais são conectados à equação, não há ambigüidade, mas é importante saber qual convenção seu software usa quando você está lendo a saída Muitas vezes os parâmetros são indicados por AR 1, AR 2, e MA 1, MA 2, etc. Para identificar o modelo ARIMA apropriado para Y você começa determinando a ordem de diferenciação d precisando estacionar a série e remover as características brutas da sazonalidade, talvez em conjunção Com uma transformação estabilizadora de variância, como logging ou deflação Se você parar neste ponto e prever que a série diferenciada é constante, você tem apenas montado um passeio aleatório ou modelo de tendência aleatória. No entanto, a série estacionária pode ainda ter erros autocorrelacionados, sugerindo que Algum número de termos AR p 1 e / ou alguns termos de número MA q 1 também são necessários na equação de previsão. O processo de determinar os valores de p, d e q que são melhores para uma dada série temporal será discutido em seções posteriores Das notas cujos links estão no topo desta página, mas é apresentada uma prévia de alguns dos tipos de modelos não-temporais ARIMA que são comumente encontrados. ARIMA 1,0,0 modelo de auto-regressão de primeira ordem se a série é estacionária e Autocorrelacionada, talvez possa ser predita como um múltiplo de seu próprio valor anterior, mais uma constante A equação de previsão neste caso é. que é Y regressa sobre si mesma retardada por um período Este é um modo constante ARIMA 1,0,0 L Se a média de Y é zero, então o termo constante não seria incluído. Se o coeficiente de inclinação 1 for positivo e menor que 1 em magnitude, deve ser menor que 1 em magnitude se Y estiver parado, o modelo descreve a média revertida Comportamento em que o valor do próximo período deve ser predito como sendo 1 vezes mais distante da média do valor deste período Se 1 for negativo, ele prediz comportamento de reversão de média com alternância de sinais, isto é, também prevê que Y será abaixo O próximo período médio se estiver acima da média desse período. Em um modelo autorregressivo de segunda ordem ARIMA 2,0,0, haveria um termo Y t-2 à direita também, e assim por diante Dependendo dos sinais e Um modelo ARIMA 2,0,0 poderia descrever um sistema cuja reversão média ocorre de forma sinusoidal oscilante, como o movimento de uma massa sobre uma mola sujeita a choques aleatórios. ARIMA 0,1,0 Caminhada aleatória Se a série Y não é estacionária, o modelo mais simples possível para ele é um rando M modelo de caminhada, que pode ser considerado como um caso limitante de um modelo AR 1 em que o coeficiente autorregressivo é igual a 1, ou seja, uma série com inversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como. onde o termo constante é A variação média período-período, ou seja, a deriva a longo prazo em Y Este modelo poderia ser montado como um modelo de regressão sem interceptação em que a primeira diferença de Y é a variável dependente Uma vez que inclui apenas uma diferença não sazonal e um termo constante , É classificado como um modelo ARIMA 0,1,0 com constante. O modelo random-walk-without-drift seria um modelo ARIMA 0,1,0 sem constante. ARIMA 1,1,0 modelo autorregressivo diferenciado de primeira ordem Se Os erros de um modelo de caminhada aleatória são autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente à equação de predição - isto é, regressando a primeira diferença de Y sobre si mesma retardada por um período. Isto renderia a seguinte previsão Equat Que pode ser rearranjado para. Este é um modelo autorregressivo de primeira ordem com uma ordem de diferenciação não sazonal e um termo constante - ou seja, um modelo ARIMA 1,1,0. ARIMA 0,1,1 sem suavização exponencial simples constante Outro Estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Lembre-se de que para algumas séries temporais não-estacionárias, por exemplo, que exibem flutuações barulhentas em torno de uma média de variação lenta, o modelo de caminhada aleatória não funciona tão bem quanto um movimento Média de valores passados ​​Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação, é melhor usar uma média das últimas observações para filtrar o ruído e estimar com mais precisão a média local O modelo de suavização exponencial simples usa uma média móvel exponencialmente ponderada de valores passados ​​para conseguir este efeito A equação de predição para o modelo de suavização exponencial simples pode ser escrita Em um certo número de formas matematicamente equivalentes, uma das quais é a chamada forma de correção de erro, na qual a previsão anterior é ajustada na direção do erro que ele cometeu. Porque e t-1 Y t-1 - t-1 por definição , Isso pode ser reescrito como. que é uma equação de previsão ARIMA 0,1,1 sem constante - com 1 1 - Isso significa que você pode ajustar uma suavização exponencial simples especificando-a como um modelo ARIMA 0,1,1 sem constante , E o coeficiente MA 1 estimado corresponde a 1-menos-alfa na fórmula SES. Lembre-se de que no modelo SES, a idade média dos dados nas previsões de 1 período antecipado é 1, o que significa que tenderão a ficar aquém das tendências Ou pontos de viragem por cerca de 1 períodos. Segue-se que a idade média dos dados nas previsões de um período de 1-período de um ARIMA 0,1,1-sem modelo constante é 1 1 - 1 Assim, por exemplo, se 1 0 8, a média de idade é de 5 Quando 1 se aproxima de 1, o modelo ARIMA 0,1,1 - sem constante torna-se uma média móvel de muito longo prazo, e à medida que 1 se aproxima 0 torna-se um modelo randômico-caminhada-sem-deriva. Qual é a melhor maneira de corrigir a autocorrelação adicionando termos AR ou adicionando termos MA Nos dois modelos anteriores discutidos acima, o problema de erros autocorrelacionados em um modelo randômico foi fixado em Duas maneiras diferentes, adicionando um valor defasado da série diferenciada à equação ou adicionando um valor defasado do erro de previsão Qual abordagem é a melhor Uma regra para esta situação, que será discutida em mais detalhes mais adiante, é que A autocorrelação positiva é geralmente melhor tratada pela adição de um termo AR ao modelo ea autocorrelação negativa é geralmente melhor tratada pela adição de um termo MA Em séries econômicas e de tempo, a autocorrelação negativa surge com freqüência como um artefato de diferenciação Em geral, a diferenciação reduz autocorrelação positiva e Pode até causar uma mudança de autocorrelação positiva para negativa. Portanto, o modelo ARIMA 0,1,1, no qual a diferenciação é acompanhada por um termo MA, é mais freqüentemente usado do que um ARI MA 1,1,0 model. ARIMA 0,1,1 com alisamento exponencial simples constante com crescimento Ao implementar o modelo SES como um modelo ARIMA, você realmente ganha alguma flexibilidade Em primeiro lugar, o coeficiente MA 1 estimado pode ser negativo Isto corresponde a um factor de suavização maior do que 1 num modelo SES, o que normalmente não é permitido pelo procedimento de ajustamento do modelo SES. Em segundo lugar, tem a opção de incluir um termo constante no modelo ARIMA, se desejar, para estimar um Tendência média não nula O modelo ARIMA 0,1,1 com constante tem a equação de predição. As previsões de um período de tempo deste modelo são qualitativamente semelhantes às do modelo SES, exceto que a trajetória das previsões de longo prazo É tipicamente uma linha inclinada cuja inclinação é igual a mu em vez de uma linha horizontal. ARIMA 0,2,1 ou 0,2,2 sem suavização exponencial linear constante Os modelos lineares de suavização exponencial são modelos ARIMA que utilizam duas diferenças não sazonais em conjunção com MA Termos O A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma retardada por dois períodos, mas sim a primeira diferença da primeira diferença - ou seja, a mudança na mudança de Y no período t Assim, a Segunda diferença de Y no período t é igual a Y t - Y t-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2 Uma segunda diferença de uma função discreta é análoga a uma segunda Derivado de uma função contínua mede a aceleração ou curvatura na função em um determinado ponto no tempo. O modelo ARIMA 0,2,2 sem constante prevê que a segunda diferença da série é igual a uma função linear dos dois últimos erros de previsão. Que podem ser rearranjados como. Onde 1 e 2 são os coeficientes MA 1 e MA 2 Este é um modelo de alisamento exponencial linear geral essencialmente o mesmo que o modelo de Holt e o modelo de Brown s é um caso especial Ele usa médias móveis exponencialmente ponderadas para estimar Um nível local e uma tendência local na série As previsões a longo prazo a partir desta Convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA 1,1,2 sem alinhamento exponencial linear de tendência amortecida constante. Este modelo é ilustrado nas slides acompanhantes em modelos ARIMA Extrapola o A tendência local no final da série, mas aplaina-lo em horizontes de previsão mais longo para introduzir uma nota de conservadorismo, uma prática que tem apoio empírico Ver artigo sobre Por que a Tendência de Damped funciona por Gardner e McKenzie eo artigo da regra de ouro Armstrong et Al para detalhes. É geralmente aconselhável aderir a modelos em que pelo menos um de p e q não é maior do que 1, ou seja, não tente encaixar um modelo como ARIMA 2,1,2, como isso é susceptível de levar Para overfitting e questões de fator comum que são discutidos com mais detalhes nas notas sobre a estrutura matemática de modelos ARIMA. Implementação de folha de cálculo modelos ARIMA como os descritos acima são fáceis de implementar em uma planilha A equação de previsão Assim, você pode configurar uma planilha de previsão ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os dados de erros Menos na coluna C A fórmula de previsão em uma célula típica na coluna B seria simplesmente uma expressão linear referindo-se a valores nas linhas precedentes das colunas A e C, multiplicadas pelos coeficientes AR ou MA apropriados armazenados em outras células da planilha.

No comments:

Post a Comment