Saturday 11 May 2019

Loess vs moving average


Há uma série de abordagens para a modelagem de séries temporais. Descrevemos algumas das abordagens mais comuns abaixo. Tendência, Decomposições Sazonais, Residuais Uma abordagem consiste em decompor as séries temporais em uma componente tendencial, sazonal e residual. A suavização exponencial tripla é um exemplo desta abordagem. Outro exemplo, chamado loess sazonal, é baseado em mínimos quadrados ponderados localmente e é discutido por Cleveland (1993). Não discutimos o loess sazonal neste manual. Métodos baseados em freqüência Outra abordagem, comumente utilizada em aplicações científicas e de engenharia, é analisar as séries no domínio da freqüência. Um exemplo desta abordagem ao modelar um conjunto de dados de tipo sinusoidal é mostrado no estudo de caso de deflexão de feixe. O gráfico espectral é a principal ferramenta para a análise de freqüência de séries temporais. Modelos Autoregressivos (AR) Uma abordagem comum para modelar séries temporais univariadas é o modelo autorregressivo (AR): Xt delta phi1 X phi2 X cdots phip X Em, onde (Xt) é a série temporal, (At) é ruído branco e delta Esquerda (1 - sum p phii direita) mu. Com (mu) denotando a média do processo. Um modelo autorregressivo é simplesmente uma regressão linear do valor atual da série contra um ou mais valores anteriores da série. O valor de (p) é chamado a ordem do modelo AR. Os modelos AR podem ser analisados ​​com um de vários métodos, incluindo técnicas de mínimos quadrados lineares padrão. Eles também têm uma interpretação direta. Modelos de média móvel (MA) Outra abordagem comum para a modelagem de modelos de séries temporais univariadas é o modelo de média móvel (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, onde (Xt) é a série temporal ) É a média da série, (A) são termos de ruído branco, e (theta1,, ldots,, thetaq) são os parâmetros do modelo. O valor de (q) é chamado a ordem do modelo MA. Isto é, um modelo de média móvel é conceitualmente uma regressão linear do valor actual da série contra o ruído branco ou choques aleatórios de um ou mais valores anteriores da série. Os choques aleatórios em cada ponto são assumidos como provenientes da mesma distribuição, normalmente uma distribuição normal, com localização em zero e escala constante. A distinção neste modelo é que estes choques aleatórios são propogated aos valores futuros das séries de tempo. Ajustar as estimativas MA é mais complicado do que com modelos AR, porque os termos de erro não são observáveis. Isto significa que procedimentos de montagem não-linear iterativos precisam ser usados ​​em vez de mínimos quadrados lineares. Os modelos MA também têm uma interpretação menos óbvia do que os modelos AR. Às vezes, o ACF e PACF sugerem que um modelo de MA seria uma melhor escolha de modelo e às vezes tanto AR e MA termos devem ser utilizados no mesmo modelo (ver Secção 6.4.4.5). Observe, entretanto, que os termos de erro após o ajuste do modelo devem ser independentes e seguir os pressupostos padrão para um processo univariável. Box e Jenkins popularizaram uma abordagem que combina a média móvel e as abordagens autorregressivas no livro Análise de Séries Temporais: Previsão e Controle (Box, Jenkins e Reinsel, 1994). Embora as abordagens da média autorregressiva e da média móvel fossem já conhecidas (e foram originalmente investigadas por Yule), a contribuição de Box e Jenkins foi no desenvolvimento de uma metodologia sistemática para identificar e estimar modelos que poderiam incorporar ambas as abordagens. Isso torna Box-Jenkins modelos uma classe poderosa de modelos. As próximas seções abordarão esses modelos em detalhes. BLESS é um dos muitos métodos modernos de modelagem que se baseiam em métodos clássicos, como a regressão linear e não linear dos mínimos quadrados. Métodos de regressão moderna são projetados para lidar com situações em que os procedimentos clássicos não funcionam bem ou não podem ser efetivamente aplicados sem trabalho indevido. O LOESS combina grande parte da simplicidade da regressão linear dos mínimos quadrados com a flexibilidade da regressão não linear. Faz isto ajustando modelos simples aos subconjuntos localizados dos dados para construir uma função que descreva a parte deterministic da variação nos dados. ponto por ponto. De fato, uma das principais atrações deste método é que o analista de dados não é obrigado a especificar uma função global de qualquer forma para ajustar um modelo para os dados, apenas para caber segmentos dos dados. O trade-off para esses recursos é o aumento da computação. Por ser tão computacionalmente intensivo, o LOESS teria sido praticamente impossível de usar na época em que a regressão dos mínimos quadrados estava sendo desenvolvida. A maioria dos outros métodos modernos de modelagem de processos são semelhantes ao LOESS a este respeito. Estes métodos foram conscientemente concebidos para utilizar a nossa capacidade computacional actual para a mais completa vantagem possível para atingir objectivos não facilmente alcançados por abordagens tradicionais. Definição de um LOESS Modelo LOESS, originalmente proposto por Cleveland (1979) e posteriormente desenvolvido por Cleveland e Devlin (1988). Denota especificamente um método que é (de certa forma) mais descritivamente conhecido como regressão polinomial localmente ponderada. Em cada ponto do conjunto de dados, um polinômio de baixo grau é ajustado a um subconjunto dos dados, com valores de variáveis ​​explicativas próximos ao ponto cuja resposta está sendo estimada. O polinômio é ajustado usando quadrados mínimos ponderados, dando mais peso a pontos próximos ao ponto cuja resposta está sendo estimada e menos peso a pontos mais afastados. O valor da função de regressão para o ponto é então obtido avaliando o polinômio local usando os valores da variável explicativa para esse ponto de dados. O ajuste LOESS está completo depois que os valores das funções de regressão foram computados para cada um dos pontos de dados (n). Muitos dos detalhes deste método, tais como o grau do modelo polinomial e os pesos, são flexíveis. O intervalo de opções para cada parte do método e os padrões padrão são brevemente discutidos a seguir. Subconjuntos localizados de dados Os subconjuntos de dados usados ​​para cada ajuste de mínimos quadrados ponderados em LOESS são determinados por um algoritmo de vizinhos mais próximo. Uma entrada especificada pelo usuário para o procedimento chamado de largura de banda ou parâmetro de suavização determina quanto dos dados é usado para ajustar cada polinômio local. O parâmetro de alisamento (q) é um número entre ((d1) n) e (1), com (d) indicando o grau do polinômio local. O valor de (q) é a proporção de dados utilizados em cada ajuste. O subconjunto de dados utilizado em cada ajuste de mínimos quadrados ponderados é composto pelos pontos (nq) (arredondado ao próximo maior inteiro) cujos valores das variáveis ​​explicativas estão mais próximos do ponto em que a resposta está sendo estimada. (Q) é chamado de parâmetro de suavização porque controla a flexibilidade da função de regressão LOESS. Valores grandes de (q) produzem as funções mais suaves que movimentam o menos em resposta a flutuações nos dados. Quanto menor (q), mais próxima a função de regressão estará de acordo com os dados. No entanto, utilizar um valor demasiado pequeno do parâmetro de suavização não é desejável, uma vez que a função de regressão eventualmente começará a capturar o erro aleatório nos dados. Valores úteis do parâmetro de suavização encontram-se tipicamente na gama de 0,25 a 0,5 para a maioria das aplicações LOESS. Grau de Polinômios Locais Os polinômios locais ajustados a cada subconjunto dos dados são quase sempre de primeiro ou segundo grau que é, ou localmente linear (no sentido de linha reta) ou localmente quadrático. Usando um polinômio de zero graus transforma LOESS em uma média móvel ponderada. Esse modelo local simples pode funcionar bem em algumas situações, mas nem sempre pode aproximar-se suficientemente da função subjacente. Os polinômios de grau mais alto funcionariam em teoria, mas produzem modelos que não estão realmente no espírito de LOESS. LOESS baseia-se nas idéias de que qualquer função pode ser bem aproximada em um bairro pequeno por um polinômio de baixa ordem e que modelos simples podem ser ajustados facilmente aos dados. Os polinômios de alto grau tendem a sobrecarregar os dados em cada subconjunto e são numericamente instáveis, dificultando cálculos precisos. Como mencionado acima, a função de peso dá maior peso aos pontos de dados mais próximos do ponto de estimativa e o menor peso para os pontos de dados que estão mais distantes. O uso dos pesos baseia-se na idéia de que pontos próximos uns dos outros na variável explicativa espaço são mais propensos a estarem relacionados uns aos outros de uma maneira simples do que pontos que estão mais distantes. Seguindo esta lógica, os pontos que provavelmente seguem o modelo local influenciam melhor as estimativas dos parâmetros do modelo local mais. Os pontos que são menos propensos a realmente se conformar com o modelo local têm menor influência sobre as estimativas dos parâmetros do modelo local. A função de peso tradicional usada para LOESS é a função de peso tri-cubo, w (x) esquerda (1 - x3) 3 mboxmike, primeira instalação R (se você ainda não tiver), execute R e instale o pacote TeachingDemos (exatamente como depende Em seu sistema), carregue o pacote com a biblioteca (TeachingDemos), em seguida, digite loess. demo para exibir a página de ajuda para ver como executá-lo, você pode rolar para a parte inferior onde o exemplo é e copiar e colar esse código para o comando R39s Linha para ver os exemplos e, em seguida, executar com seus próprios dados para explorar mais. Ndash Greg Snow Mar 23 12 às 17:15 Aqui está uma resposta simples, mas detalhada. Um modelo linear ajusta uma relação através de todos os pontos de dados. Este modelo pode ser de primeira ordem (outro significado de linear) ou polinomial para contabilizar a curvatura, ou com splines para considerar diferentes regiões com um modelo de governo diferente. Um ajuste LOESS é uma regressão ponderada localmente com base nos pontos de dados originais. O que significa que um ajuste LOESS ajusta os valores originais X e Y, mais um conjunto de valores X de saída para os quais calcular novos valores Y (usualmente os mesmos valores X são usados ​​para ambos, mas freqüentemente são usados ​​menos X para pares XY ajustados Devido ao aumento da computação necessária). Para cada valor X de saída, uma porção dos dados de entrada é usada para computar um ajuste. A porção dos dados, geralmente 25 a 100, mas tipicamente 33 ou 50, é local, o que significa que é a parte dos dados originais mais próxima de cada valor X de saída particular. É um ajuste em movimento, porque cada valor de saída X requer um subconjunto diferente dos dados originais, com pesos diferentes (veja o próximo parágrafo). Esse subconjunto de pontos de dados de entrada é usado para executar uma regressão ponderada, com pontos mais próximos do valor de saída X dado maior peso. Esta regressão é geralmente de primeira ordem de segunda ordem ou superior é possível, mas requerem maior poder de computação. O valor Y desta regressão ponderada calculada na saída X é usado como o valor Y dos modelos para este valor X. A regressão é recalculada em cada valor X de saída para produzir um conjunto completo de valores Y de saída. Respondeu 21 de fevereiro às 15:08

No comments:

Post a Comment