Thursday 15 November 2018

Índice centrado móvel médio sazonal


Implementação de planilhas de ajuste sazonal e suavização exponencial É fácil executar o ajuste sazonal e ajustar os modelos de suavização exponencial usando o Excel. As imagens e gráficos de tela a seguir são extraídos de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e a suavização linear exponencial nos seguintes dados de vendas trimestrais do Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown8217s, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que tem constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii) então as previsões são geradas para os dados ajustados sazonalmente por meio de suavização exponencial linear e (iii) finalmente as previsões ajustadas sazonalmente são quasi mensuradas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isto pode ser feito tomando a média de duas médias anuais que são compensadas por um período em relação um ao outro. (Uma combinação de duas médias de compensação em vez de uma única média é necessária para fins de centralização quando o número de estações é par.) O próximo passo é calcular a relação com a média móvel - ie. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de componente quottrend-cyclequot do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo o que Permanece após a média de dados de um ano inteiro. Naturalmente, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida. O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para essa estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. As razões médias são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400, neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que ele representa. A média móvel centrada e os dados ajustados sazonalmente acabam parecidos com isto: Note que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Uma outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados ajustados sazonalmente, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência, é atribuído o nome de intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsertNameCreatequot). O modelo LES é inicializado ao definir as duas primeiras previsões iguais ao primeiro valor real da série ajustada sazonalmente. A fórmula usada aqui para a previsão de LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão do LES para o período atual se refere às duas observações precedentes e aos dois erros de previsão anteriores, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar a suavização linear simples em vez de linear, poderíamos substituir a fórmula SES aqui. Podemos também usar Holt8217s ao invés de Brown8217s modelo LES, o que exigiria mais duas colunas de fórmulas para calcular o nível ea tendência Que são utilizados na previsão.) Os erros são calculados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto decorre da identidade matemática: VARIANCE MSE (erros) (AVERAGE (erros)) 2.) No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa realmente a prever até O terceiro período (linha 15 na planilha). O valor ótimo de alfa pode ser encontrado alterando manualmente alfa até que o RMSE mínimo seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alpha que o Solver encontrado é mostrado aqui (alpha0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está um gráfico de séries temporais dos erros (ajustados sazonalmente): As autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas atrasadas por um ou mais períodos - detalhes são mostrados no modelo de planilha . Aqui está um gráfico das autocorrelações dos erros nos primeiros cinco lags: As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas a espiga no intervalo 4 (cujo valor é 0,35) é ligeiramente problemática - sugere que a Processo de ajuste sazonal não foi completamente bem sucedido. No entanto, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de - n-menos-k é de cerca de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 26, ou 0,33. Se você variar o valor de alfa com a mão neste modelo do Excel, você pode observar o efeito sobre as parcelas de tempo de série e autocorrelação dos erros, bem como sobre o erro quadrático médio, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é quotbootstrappedquot para o futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgotou - i. e. Onde o futuro começa. (Em outras palavras, em cada célula onde um valor de dados futuro ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas para baixo de cima: Observe que os erros para previsões de O futuro são todos computados como sendo zero. Isso não significa que os erros reais serão zero, mas sim apenas reflete o fato de que, para fins de previsão, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões de LES resultantes para os dados ajustados sazonalmente são as seguintes: Com este valor específico de alfa, que é ideal para as previsões de um período antecipado, a tendência projetada é ligeiramente alta, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, pode-se obter uma projeção de tendência muito diferente. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa é variado, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0.25: A tendência de longo prazo projetada é agora negativa em vez de positiva Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A sua estimativa do nível e da tendência actuais e as suas previsões a longo prazo reflectem a tendência descendente observada nos últimos 5 anos, em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento para responder a pontos de quotreação nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha. Seus erros de previsão de 1 passo são maiores em média do que aqueles obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente positivamente autocorrelacionados. A autocorrelação lag-1 de 0,56 excede largamente o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como uma alternativa ao avanço do valor de alfa para introduzir mais conservadorismo em previsões de longo prazo, um fator quottrend de amortecimento é às vezes adicionado ao modelo para fazer a tendência projetada aplanar após alguns períodos. O passo final na construção do modelo de previsão é o de ter uma razão razoável para as previsões de LES, multiplicando-as pelos índices sazonais apropriados. Assim, as projeções reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES estacionalmente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo-frente feitas por este modelo: primeiro Calcular o RMSE (erro quadrático médio, que é apenas a raiz quadrada do MSE) e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual à previsão de pontos mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição de erro é aproximadamente normal eo tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão de futuros erros de previsão, porque leva bias, bem como variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então reseasonalized. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso, o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (Dec-93) é 273,2. De modo que o intervalo de confiança ajustado sazonalmente é de 273,2-227,4 218,4 para 273,2227,4 328,0. Multiplicando esses limites por Decembers índice sazonal de 68,61. Obtemos limites de confiança inferior e superior de 149,8 e 225,0 em torno da previsão de ponto Dec-93 de 187,4. Os limites de confiança para as previsões de mais de um período de tempo em geral aumentarão à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como aos fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular limites de confiança para a previsão do LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão mais de um período à frente, tomando todas as fontes de A sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Por bootstrapping a previsão one-step-ahead). Em seguida, calcule o RMSE dos erros de previsão em duas etapas e use isso como a base para um intervalo de confiança de duas etapas. Cálculo de um índice sazonal Este folheto deve ser usado junto com o arquivo do MS Excel seasonalindex. xls localizado em A home page da classe Econ437. 1. Liste os preços mensais em ordem cronológica na Coluna D da planilha. Exemplo. O conjunto de dados fornecido é de janeiro de 1975 a dezembro de 1996, totalizando 264 observações. 2. Calcule um total movimentado de 12 meses centrado adicionando acima os preços para janeiro completamente dezembro. Você deve começar com a 6ª observação. Exemplo. Para Junho de 1975 (observação 6) 3.012.822.632.652.672.652.702.942.762.542.302.30 31.97 3. Repita o passo 2 para o resto do conjunto de dados. Nota. Haverá 5 células em branco no início do conjunto de dados na Coluna E e 6 células em branco no final da Coluna E. 4. Calcule o total móvel de 2 meses da Coluna E e insira isto na Coluna F começando com a 7ª observação. Haverá 6 células em branco no início e no final da coluna F. Exemplo. Para observação 7, 31.9731.3363.30. 5. Divida a Coluna F por 24 e insira isto na Coluna G começando com a observação 7. Esta é a média móvel dupla de 12 meses (MA) centrada. 6. Divida os preços originais na coluna D pela média móvel de 12 meses centralizada na coluna G e insira esses valores mensais individuais na coluna H a partir de julho de 1975, observação 7. Não haverá valores para os primeiros 6 meses de 1975 e Nos últimos 6 meses de 1996. 7. Some todos os índices mensais de cada mês e medie-os para obter o valor do índice Raw. Ver tabela abaixo. Encontre a média dos índices brutos. Divide cada índice de meses Raw pela média dos índices crus para obter o índice ajustado. Médias de movimentação e média móvel centrada Um par de pontos sobre a sazonalidade em uma série de tempo repetir, mesmo que eles parecem óbvias. Um deles é que o termo 8220season8221 não se refere necessariamente às quatro estações do ano que resultam da inclinação do eixo Earth8217s. Na análise preditiva, 8220season8221 muitas vezes significa exatamente isso, porque muitos dos fenômenos que estudamos variam com a progressão da primavera até o inverno: vendas de engrenagens de inverno ou verão, incidência de certas doenças generalizadas, eventos climáticos causados ​​pela localização do Fluxo de jato e mudanças na temperatura da água no oceano Pacífico oriental, e assim por diante. Da mesma forma, os eventos que ocorrem regularmente podem agir como se fossem estações meteorológicas, embora tenham apenas uma ligação tênue com os solstícios e equinócios. Mudanças de oito horas em hospitais e fábricas muitas vezes se expressam na incidência de ingestões e gastos de energia lá, uma estação é de oito horas de duração e as estações ciclo todos os dias, e não todos os anos. As datas de vencimento dos impostos indicam o início de uma inundação de dólares nos tesouros municipais, estaduais e federais, a estação pode ter um ano de duração (impostos sobre o rendimento das pessoas físicas), seis meses (impostos sobre a propriedade em muitos estados), trimestral ), e assim por diante. É um pouco estranho que tenhamos a palavra 8220season8221 para referir-se geralmente ao período de tempo regularmente recorrente, mas não há um termo geral para o período de tempo durante o qual ocorre uma volta completa das estações. 8220Cycle8221 é possível, mas em analítica e previsão, esse termo geralmente é usado para significar um período de comprimento indeterminado, como um ciclo econômico. Na ausência de um termo melhor, usei o período que acompanha 8222 neste capítulo e nos subseqüentes. Isso não é apenas reflexão terminológica. As maneiras pelas quais identificamos as estações e o período de tempo durante o qual as estações se transformam têm implicações reais, embora muitas vezes menores, sobre como medimos seus efeitos. As seções a seguir discutem como alguns analistas variam a maneira como calculam as médias móveis de acordo com o número de temporadas é ímpar ou par. Usando médias móveis em vez de médias simples Suponha que uma grande cidade está considerando a realocação de sua polícia de trânsito para melhor lidar com a incidência de condução, enquanto deficientes, que a cidade acredita que tem vindo a aumentar. Quatro semanas atrás, nova legislação entrou em vigor, legalizando a posse e uso recreativo de maconha. Desde então, o número diário de detenções de tráfego para DWI parece estar tendendo para cima. A complicação é o fato de que o número de prisões parece aumentar nas sextas-feiras e nos sábados. Para ajudar a planejar as necessidades de mão-de-obra no futuro, você gostaria de prever qualquer tendência subjacente que esteja sendo estabelecida. Você também gosta de tempo a implantação de seus recursos para ter em conta qualquer sazonalidade relacionada com o fim de semana que acontece. A Figura 5.9 tem os dados relevantes com os quais você tem que trabalhar. Figura 5.9 Com este conjunto de dados, cada dia da semana constitui uma estação. Mesmo observando apenas o gráfico na Figura 5.9. Você pode dizer que a tendência do número de prisões diárias é para cima. You8217ll tem que planejar para expandir o número de agentes de trânsito, e espero que os níveis de tendência em breve. Além disso, os dados confirmam a noção de que mais detenções ocorrem rotineiramente às sextas-feiras e aos sábados, portanto, sua alocação de recursos precisa abordar esses picos. Mas você precisa para quantificar a tendência subjacente, para determinar quantos adicionais polícia você tem que trazer. Você também precisa quantificar o tamanho esperado dos picos do fim de semana, para determinar quantos policiais adicionais você precisa assistindo para drivers erráticos naqueles dias. O problema é que, como de ainda você don8217t saber quanto do aumento diário é devido à tendência e quanto é devido ao efeito fim de semana. Você pode começar por detrending a série de tempo. No início deste capítulo, em 8220Simple Seasonal Averages, 8221 você viu um exemplo de como desviar uma série de tempo para isolar os efeitos sazonais usando o método de médias simples. Nesta seção, você verá como fazê-lo usando médias móveis, provavelmente, a abordagem de médias móveis é usada com mais freqüência na análise preditiva do que a abordagem de médias simples. Existem várias razões para a maior popularidade das médias móveis, entre elas, que a abordagem das médias móveis não pede que você colapse seus dados no processo de quantificação de uma tendência. Lembre-se que o exemplo anterior tornou necessário colapsar médias trimestrais para médias anuais, calcular uma tendência anual e, em seguida, distribuir um quarto da tendência anual em cada trimestre no ano. Esse passo era necessário para eliminar a tendência dos efeitos sazonais. Em contraste, a abordagem de médias móveis permite que você detrend a série de tempo sem recorrer a esse tipo de maquinação. A Figura 5.10 mostra como a abordagem de médias móveis funciona no exemplo atual. Figura 5.10 A média móvel no segundo gráfico esclarece a tendência subjacente. A Figura 5.10 adiciona uma coluna de média móvel, e uma coluna para estações específicas. Para o conjunto de dados da Figura 5.9. Ambas as adições exigem alguma discussão. Os picos em prisões que ocorrem nos fins de semana dá-lhe razão para acreditar que você está trabalhando com as estações que repetem uma vez por semana. Portanto, comece por obter a média para o período abrangente, ou seja, as primeiras sete temporadas, de segunda a domingo. A fórmula para a média na célula D5, a primeira média móvel disponível, é a seguinte: Essa fórmula é copiada e colada para baixo através da célula D29, então você tem 25 médias móveis com base em 25 execuções de sete dias consecutivos. Observe que, para mostrar as primeiras e as últimas observações na série de tempo, eu tenho escondido linhas de 10 a 17. Você pode exibi-los, se você quiser, neste livro do capítulo 8217s, disponível no site do publisher8217s. Faça uma seleção múltipla de linhas visíveis 9 e 18, clique com o botão direito do mouse em um de seus cabeçalhos de linha e escolha Unhide no menu de atalho. Quando você oculta linhas de uma planilha de trabalho, como fez na Figura 5.10. Qualquer dados gráficos nas linhas ocultas também está oculto no gráfico. Os rótulos do eixo x identificam apenas os pontos de dados que aparecem no gráfico. Como cada média móvel na Figura 5.10 engloba sete dias, nenhuma média móvel é emparelhada com as três primeiras ou três últimas observações reais. Copiar e colar a fórmula na célula D5 até um dia para a célula D4 é executado fora de observações 8212não há observação registrada na célula C1. Da mesma forma, não há média móvel registrada abaixo da célula D29. Copiar e colar a fórmula em D29 em D30 exigiria uma observação na célula C33, e nenhuma observação está disponível para o dia que a célula representaria. Seria possível, naturalmente, encurtar o comprimento da média móvel para, digamos, cinco em vez de sete. Fazer assim significaria que as fórmulas de média móvel na Figura 5.10 poderiam começar na célula D4 em vez de D5. No entanto, nesse tipo de análise, você quer que a duração da média móvel seja igual ao número de estações: sete dias em uma semana para eventos que se repetem semanalmente implica uma média móvel de comprimento sete e quatro trimestres em um ano para eventos que Recur anualmente implica uma média móvel de comprimento quatro. Em linhas semelhantes, geralmente quantificamos os efeitos sazonais de tal forma que eles totalizam a zero dentro do período abrangente. Como você viu na primeira seção deste capítulo, em médias simples, isso é feito calculando a média de (digamos) os quatro trimestres em um ano, e subtraindo então a média para o ano de cada figura trimestral. Assim fazendo garante que o total dos efeitos sazonais é zero. Por sua vez, that8217s útil porque ele coloca os efeitos sazonais em um efeito footing8212a verão comum de 11 é tão longe da média como um efeito de inverno de 821111. Se você quiser média cinco temporadas em vez de sete para obter a sua média móvel, você8217re melhor Off encontrar um fenômeno que se repete a cada cinco temporadas em vez de cada sete. No entanto, quando você toma a média dos efeitos sazonais mais tarde no processo, essas médias são improváveis ​​de somar a zero. É necessário, nesse ponto, recalibrar ou normalizar. As médias para que sua soma seja zero. Quando isso é feito, as médias sazonais médias expressam o efeito em um período de tempo de pertencer a uma estação particular. Uma vez normalizadas, as médias sazonais são denominadas os índices sazonais que este capítulo já mencionou várias vezes. Compreendendo Sazonais Específicos A Figura 5.10 também mostra o que são chamados de sazonais específicos na coluna E. Eles são o que restou depois de subtrair a média móvel da observação real. Para ter uma noção do que os sais específicos representam, considere a média móvel na célula D5. É a média das observações em C2: C8. Os desvios de cada observação da média móvel (por exemplo, C2 8211 D5) são garantidos para somar a zero 8212 que é uma característica de uma média. Portanto, cada desvio expressa o efeito de estar associado com aquele dia particular naquela semana particular. É um período específico sazonal, então específico porque o desvio se aplica a essa segunda-feira ou terça-feira e assim por diante, e sazonal, porque neste exemplo nós tratamos cada dia como se fosse uma estação no período abrangente de uma semana. Como cada temporada específica mede o efeito de estar nessa estação em relação à média móvel para esse grupo de (aqui) sete temporadas, você pode, em seguida, calcular a média dos períodos sazonais específicos para uma determinada temporada (por exemplo, todas as sextas-feiras no seu Séries temporais) para estimar que o efeito geral, em vez de específico, da estação 8217s. Essa média não é confundida por uma tendência subjacente na série temporal, porque cada estação específica expressa um desvio de sua própria média móvel particular. Alinhando as Médias Móveis Há também a questão de alinhar as médias móveis com o conjunto de dados original. Na Figura 5.10. Alinhei cada média móvel com o ponto médio da gama de observações que inclui. Assim, por exemplo, a fórmula na célula D5 faz a média das observações em C2: C8 e alinhei-a com a quarta observação, o ponto médio da faixa média, colocando-a na linha 5. Esta disposição é denominada média móvel centrada . E muitos analistas preferem alinhar cada média móvel com o ponto médio das observações que médias. Tenha em mente que, neste contexto, 8220midpoint8221 refere-se ao meio de um período de tempo: quinta-feira é o ponto médio de segunda a domingo. Não se refere à mediana dos valores observados, embora, naturalmente, possa funcionar dessa forma na prática. Outra abordagem é a média móvel à direita. Nesse caso, cada média móvel está alinhada com a observação final de que ela média 8212 e, portanto, trilhas por trás de seus argumentos. Este é frequentemente o arranjo preferido se você quiser usar uma média móvel como uma previsão, como é feito com suavização exponencial, porque sua média móvel final ocorre coincidente com a observação disponível final. Centered Moving Averages with Even Numbers of Seasons Nós costumamos adotar um procedimento especial quando o número de estações é mesmo em vez de estranho. Esse é o típico estado de coisas: tendem a haver números pares de estações no período abrangente para épocas típicas, como meses, trimestres e períodos quadrienais (para as eleições). A dificuldade com um número par de estações é que não há ponto médio. Dois não é o ponto médio de um intervalo começando em 1 e terminando em 4, e nenhum é 3 se pode ser dito ter um, seu ponto médio é 2.5. Seis não é o ponto médio de 1 a 12, e nem é 7 seu ponto médio puramente teórico é 6,5. Para agir como se houvesse um ponto médio, você precisará adicionar uma camada de média sobre as médias móveis. Consulte a Figura 5.11. Figura 5.11 O Excel oferece várias maneiras de calcular uma média móvel centrada. A idéia por trás dessa abordagem para obter uma média móvel centrada em um ponto médio existente, quando há um número par de estações, é puxar esse ponto médio para a frente por meia temporada. Você calcula uma média móvel que seria centrada em, digamos, o terceiro ponto no tempo se cinco estações em vez de quatro constituíam uma volta completa do calendário. That8217s feito, tendo duas médias consecutivas móveis e em média deles. Assim, na Figura 5.11. Existe uma média móvel na célula E6 que calcula a média dos valores em D3: D9. Como existem quatro valores sazonais em D3: D9, a média móvel em E6 é pensada como centrada na estação imaginária 2,5, meio ponto aquém da primeira temporada candidata disponível, 3. (As estações 1 e 2 não estão disponíveis como pontos médios para Falta de dados para a média antes da primeira temporada). Note-se, no entanto, que a média móvel na célula E8 média os valores em D5: D11, o segundo através do quinto na série temporal. Essa média é centrada no (imaginário) ponto 3.5, um período completo à frente da média centrada em 2,5. Ao calcular a média das duas médias móveis, então o pensamento vai, você pode puxar o ponto central da primeira média móvel para a frente por meio ponto, de 2,5 para 3. That8217s o que as médias na coluna F da Figura 5.11 fazer. A célula F7 fornece a média das médias móveis em E6 e E8. E a média em F7 é alinhada com o terceiro ponto de dados na série de tempo original, na célula D7, para enfatizar que a média é centrada naquela temporada. Se você expandir a fórmula na célula F7, bem como as médias móveis nas células E6 e E8, você verá que ele se torna uma média ponderada dos cinco primeiros valores na série de tempo, com o primeiro eo quinto valor dado um peso De 1 e o segundo a quarto valores dado um peso de 2. Isso nos leva a uma maneira mais rápida e simples de calcular uma média móvel centrada com um número par de estações. Ainda na Figura 5.11. Os pesos são armazenados na gama H3: H11. Esta fórmula retorna a primeira média móvel centrada, na célula I7: Essa fórmula retorna 13.75. Que é idêntico ao valor calculado pela fórmula de média dupla na célula F7. Fazendo a referência aos pesos absolutos, por meio dos sinais de dólar em H3: H11. Você pode copiar a fórmula e colá-lo para baixo, na medida do necessário para obter o resto das médias móveis centradas. Detrender a série com médias móveis Quando você subtraiu as médias móveis das observações originais para obter os valores sazonais específicos, você removeu a tendência subjacente da série. O que é deixado nos sazonais específicos é normalmente uma série estacionária, horizontal, com dois efeitos que fazem com que os sazonais específicos partam de uma linha absolutamente reta: os efeitos sazonais e erro aleatório nas observações originais. A Figura 5.12 mostra os resultados para este exemplo. Figura 5.12 Os efeitos sazonais específicos para sexta-feira e sábado permanecem claros na série detrended. O gráfico superior na Figura 5.12 mostra as observações diárias originais. Tanto a tendência ascendente geral como os picos sazonais de fim de semana são claros. O gráfico inferior mostra os dados sazonais específicos: o resultado da desvirtuação da série original com um filtro de média móvel, conforme descrito anteriormente em 8220. Compreendendo Sazonais Específicos.8221 Você pode ver que a série detrended é agora virtualmente horizontal (uma linha de tendência linear para os sazonais específicos Tem uma ligeira deriva para baixo), mas os picos sazonais de sexta e sábado ainda estão no lugar. O próximo passo é ir além dos sazonais específicos para os índices sazonais. Consulte a Figura 5.13. Figura 5.13 Os efeitos sazonais específicos são primeiro calculados pela média e depois normalizados para atingir os índices sazonais. Na Figura 5.13. Os sais sazonais específicos na coluna E são rearranjados na forma tabular ilustrada na gama H4: N7. O objetivo é simplesmente tornar mais fácil o cálculo das médias sazonais. Essas médias são mostradas em H11: N11. No entanto, os números em H11: N11 são médias, não desvios de uma média, e, portanto, não podemos esperar que eles somem a zero. Nós ainda precisamos ajustá-los para que eles expressam desvios de um grande meio. Essa grande média aparece na célula N13, e é a média das médias sazonais. Podemos chegar aos índices sazonais subtraindo a grande média em N13 de cada uma das médias sazonais. O resultado está na gama H17: N17. Esses índices sazonais não são mais específicos para uma determinada média móvel, como é o caso das espécies na coluna E. Como elas são baseadas em uma média de cada instância de uma determinada estação, elas expressam o efeito médio de uma determinada estação na Quatro semanas na série de tempo. Além disso, são medidas de uma estação, um dia em que as detenções de trânsito são visíveis à média durante um período de sete dias. Podemos agora usar esses índices sazonais para dessazonalizar a série. Utilizaremos a série dessazonalizada para obter previsões por meio de regressão linear ou método Holt8217s de suavização de séries tendenciosas (discutidas no Capítulo 4). Então nós simplesmente somamos os índices sazonais de volta às previsões para reseasonalize eles. Tudo isso aparece na Figura 5.14. Figura 5.14 Depois de ter os índices sazonais, os toques finais aplicados aqui são os mesmos que no método de médias simples. As etapas ilustradas na Figura 5.14 são em grande parte as mesmas que as das Figuras 5.6 e 5.7. Discutido nas seções a seguir. Desestacionando as Observações Subtraia os índices sazonais das observações originais para dessazonalizar os dados. Você pode fazer isso como mostrado na Figura 5.14. Em que as observações originais e os índices sazonais são organizados como duas listas começando na mesma linha, colunas C e F. Este arranjo torna um pouco mais fácil de estruturar os cálculos. Você também pode fazer a subtração como mostrado na Figura 5.6. No qual as observações trimestrais originais (C12: F16), os índices trimestrais (C8: F8) e os resultados dessazonalizados (C20: F24) são mostrados em formato tabular. Esse arranjo torna um pouco mais fácil se concentrar nos índices sazonais e nos trimestrais dessazonalizados. Previsão das Observações desestacionalizadas Na Figura 5.14. As observações dessazonalizadas estão na coluna H e na Figura 5.7 estão na coluna C. Independentemente de você querer usar uma abordagem de regressão ou uma abordagem de suavização da previsão, é melhor organizar as observações dessazonalizadas em uma lista de uma única coluna. Na Figura 5.14. As previsões estão na coluna J. A seguinte fórmula de matriz é inserida no intervalo J2: J32. Anteriormente neste capítulo, eu indiquei que se você omitir o argumento x-values ​​dos argumentos de função TREND () function8217s, o Excel fornece os valores padrão 1. 2. N. Onde n é o número de valores y. Na fórmula dada, H2: H32 contém 31 valores y. Como o argumento normalmente contendo os valores x está faltando, o Excel fornece os valores padrão 1. 2. 31. Esses são os valores que nós gostaríamos de usar de qualquer maneira, na coluna B, então a fórmula como dado é equivalente a TREND (H2: H32, B2: B32). E isso é a estrutura usada em D5: D24 da Figura 5.7: Fazendo a Previsão de Um Passo Ahead Até agora, você arranjou previsões das séries temporais dessazonalizadas de t 1 a t 31 na Figura 5.14. E de t 1 a t 20 na Figura 5.7. Estas previsões constituem informações úteis para vários fins, incluindo a avaliação da exactidão das previsões através de uma análise RMSE. Mas seu objetivo principal é prever, pelo menos, o próximo, ainda não observado período de tempo. Para conseguir isso, você poderia primeiro prever a função TREND () ou PROJ. LIN () se você estiver usando a regressão, ou a partir da fórmula de suavização exponencial se você usar o método Holt8217s. Depois, você pode adicionar o índice sazonal associado à projeção de regressão ou suavização, para obter uma previsão que inclua tanto a tendência quanto o efeito sazonal. Na Figura 5.14. Você obtém a previsão de regressão na célula J33 com esta fórmula: Nesta fórmula, os valores de y em H2: H32 são os mesmos que nas outras fórmulas de TREND () na coluna J. Assim são os valores de x (padrão) de 1 Até 32. Agora, porém, você fornece um novo valor x como terceiro argumento da função8217, que você diz para TREND () procurar na célula B33. It8217s 32. O próximo valor de t. E Excel retorna o valor 156.3 na célula J33. A função TREND () na célula J33 está dizendo ao Excel, na verdade, 8220Calcule a equação de regressão para os valores em H2: H32 regrediu nos valores t de 1 a 31. Aplicar essa equação de regressão para o novo valor x de 32 e retornar o resultado.8221 Você encontrará a mesma abordagem na célula D25 da Figura 5.7. Onde a fórmula para obter a previsão um passo adiante é esta: Adicionando os índices sazonais Voltar Na etapa final é reseasonalize as previsões, adicionando os índices sazonais para as previsões de tendência, reverter o que você fez quatro passos para trás quando você subtraiu o Índices das observações originais. Isso é feito na coluna F na Figura 5.7 e na coluna K na Figura 5.14. Não esqueça de adicionar o índice sazonal apropriado para a previsão de um passo à frente, com os resultados mostrados na célula F25 na Figura 5.7 e na célula K33 na Figura 5.14. Você pode encontrar gráficos de três representações dos dados de detenção de trânsito na Figura 5.15. A série dessazonalizada, a previsão linear a partir dos dados dessazonalizados, e as previsões reseasonalized. Observe que as previsões incorporam tanto a tendência geral dos dados originais quanto os seus picos de sexta-feira. Figura 5.15 Gráfico das previsões.6.2 Médias móveis ma 40 elecsales, ordem 5 41 Na segunda coluna desta tabela, é mostrada uma média móvel de ordem 5, fornecendo uma estimativa do ciclo tendencial. O primeiro valor nesta coluna é a média das cinco primeiras observações (1989-1993) o segundo valor na coluna 5-MA é a média dos valores 1990-1994 e assim por diante. Cada valor na coluna 5-MA é a média das observações no período de cinco anos centrado no ano correspondente. Não há valores para os dois primeiros anos ou últimos dois anos porque não temos duas observações de cada lado. Na fórmula acima, a coluna 5-MA contém os valores de hat com k2. Para ver como é a estimativa do ciclo tendencial, traçamos o gráfico juntamente com os dados originais da Figura 6.7. Parcela 40 elecsales, venda de eletricidade principal quotResidential, ylab quotGWhquot. 41 Observe como a tendência (em vermelho) é mais suave do que os dados originais e captura o movimento principal da série de tempo sem todas as flutuações secundárias. O método da média móvel não permite estimativas de T em que t está próximo das extremidades da série, portanto, a linha vermelha não se estende para os bordos do gráfico em nenhum dos lados. Posteriormente, usaremos métodos mais sofisticados de estimativa de ciclo tendencial que permitem estimativas próximas aos pontos finais. A ordem da média móvel determina a suavidade da estimativa de tendência-ciclo. Em geral, uma ordem maior significa uma curva mais suave. O gráfico a seguir mostra o efeito de alterar a ordem da média móvel para os dados de vendas de eletricidade residencial. As médias móveis simples como estas são normalmente de ordem ímpar (por exemplo, 3, 5, 7, etc.). Isto é assim que são simétricas: numa média móvel de ordem m2k1, existem k observações anteriores, k observações posteriores e a observação do meio Que são médias. Mas se m fosse uniforme, não seria mais simétrico. Médias móveis de médias móveis É possível aplicar uma média móvel a uma média móvel. Uma razão para fazer isso é fazer uma média móvel de ordem uniforme simétrica. Por exemplo, podemos pegar uma média móvel de ordem 4 e, em seguida, aplicar outra média móvel de ordem 2 aos resultados. Na Tabela 6.2, isso foi feito para os primeiros anos dos dados da produção de cerveja trimestral australiana. Beer2 lt - window 40 ausbeer, início 1992 41 ma4 ltm 40 beer2, ordem 4. center FALSE 41 ma2x4 ltm 40 cerveja2, ordem 4. center TRUE 41 A notação 2times4-MA na última coluna significa um 4-MA Seguido por um 2-MA. Os valores na última coluna são obtidos tomando uma média móvel de ordem 2 dos valores na coluna anterior. Por exemplo, os dois primeiros valores na coluna 4-MA são 451,2 (443410420532) 4 e 448,8 (410420532433) 4. O primeiro valor na coluna 2times4-MA é a média destes dois: 450,0 (451.2448.8) 2. Quando um 2-MA segue uma média móvel de ordem par (como 4), ele é chamado de média móvel centrada de ordem 4. Isso é porque os resultados são agora simétricos. Para ver que este é o caso, podemos escrever o 2times4-MA da seguinte forma: begin hat amp frac Bigfrac (y y y y) frac (y y y y) Big frac fray frac14y frac14y frac14y frac18y. Fim É agora uma média ponderada de observações, mas é simétrica. Outras combinações de médias móveis também são possíveis. Por exemplo, uma 3 x 3 MA é frequentemente utilizada e consiste numa média móvel de ordem 3 seguida por outra média móvel de ordem 3. Em geral, uma ordem par MA deve ser seguida por uma ordem par MA para torná-la simétrica. Similarmente, uma ordem ímpar MA deve ser seguida por uma ordem ímpar MA. Estimativa do ciclo tendencial com dados sazonais O uso mais comum de médias móveis centradas é estimar o ciclo tendencial a partir de dados sazonais. Considere o 2x4-MA: fracasso do chapéu frac14y frac14y frac14y frac18y. Quando aplicados aos dados trimestrais, cada trimestre do ano recebe igual peso, uma vez que o primeiro eo último termo se aplicam ao mesmo trimestre em anos consecutivos. Conseqüentemente, a variação sazonal será média e os valores resultantes de hat t terão pouca ou nenhuma variação sazonal restante. Um efeito semelhante seria obtido utilizando um 2-8 MA ou um 2-12 MA. Em geral, um m-MA 2x é equivalente a uma média móvel ponderada de ordem m1 com todas as observações tomando peso 1m exceto para o primeiro e último termos que tomam pesos 1 (2m). Portanto, se o período sazonal é par e de ordem m, use um m-MA 2x para estimar o ciclo tendencial. Se o período sazonal é ímpar e de ordem m, use um m-MA para estimar o ciclo de tendência. Em particular, um 2 x 12 MA pode ser usado para estimar o ciclo de tendência de dados mensais e um 7-MA pode ser usado para estimar a tendência-ciclo de dados diários. Outras escolhas para a ordem do MA normalmente resultarão em estimativas de ciclo de tendência sendo contaminadas pela sazonalidade nos dados. Exemplo 6.2 Fabricação de equipamentos elétricos A Figura 6.9 mostra um 2 x 12-MA aplicado ao índice de ordens de equipamentos elétricos. Observe que a linha suave não mostra nenhuma sazonalidade, é quase o mesmo que o ciclo de tendências mostrado na Figura 6.2 que foi estimado usando um método muito mais sofisticado do que as médias móveis. Qualquer outra escolha para a ordem da média móvel (exceto para 24, 36, etc.) teria resultado em uma linha suave que mostra algumas flutuações sazonais. Plot 40 elecequip, ylab quotNovas ordens indicequot. Col quotgrayquot, main quotred 41 Química média ponderada As combinações de médias móveis resultam em médias móveis ponderadas. Por exemplo, o 2x4-MA discutido acima é equivalente a um 5-MA ponderado com pesos dados por frac, frac, frac, frac, frac. Em geral, uma m-MA ponderada pode ser escrita como hat t sum k aj y, onde k (m-1) 2 e os pesos são dados por a, dots, ak. É importante que todos os pesos somem a um e que sejam simétricos para que aj a. O m-MA simples é um caso especial onde todos os pesos são iguais a 1m. Uma grande vantagem das médias móveis ponderadas é que elas produzem uma estimativa mais suave do ciclo tendencial. Em vez das observações que entram e que deixam o cálculo no peso cheio, seus pesos são aumentados lentamente e então lentamente diminuídos resultando em uma curva mais lisa. Alguns conjuntos específicos de pesos são amplamente utilizados. Alguns deles são apresentados na Tabela 6.3.

No comments:

Post a Comment