Sunday, 25 March 2018

R moving average prediction


Introdução à Previsão Média Móvel. Como você pode imaginar, estamos analisando algumas das abordagens mais primitivas da previsão. Mas espero que isso seja pelo menos uma introdução válida para alguns dos problemas de computação relacionados à implementação de previsões em planilhas. Nesse sentido, continuaremos iniciando no início e começaremos a trabalhar com as previsões da Média móvel. Média móvel de previsões. Todos estão familiarizados com as previsões médias móveis, independentemente de acreditarem que sejam. Todos os estudantes universitários fazem isso o tempo todo. Pense nas pontuações dos seus testes em um curso onde você terá quatro testes durante o semestre. Vamos supor que você tenha um 85 no seu primeiro teste. O que você prevê para a sua segunda pontuação no teste? O que você acha que seu professor poderia prever para a sua próxima pontuação no teste? O que você acha que seus amigos podem prever para a sua próxima pontuação? Com toda a tagarelice que você pode fazer com seus amigos e pais, eles e seu professor provavelmente esperam que você consiga algo na área dos 85 que você acabou de receber. Bem, agora vamos supor que, apesar de sua autopromoção para seus amigos, você superestima a si mesmo e acha que pode estudar menos para o segundo teste e então obtém um 73. Agora, quais são todos os preocupados e despreocupados que vão antecipar-se você vai entrar em seu terceiro teste Existem duas abordagens muito prováveis ​​para que eles desenvolvam uma estimativa, independentemente de eles compartilharem com você. Eles podem dizer para si mesmos: "Esse cara está sempre fumando sua inteligência. Ele vai pegar outro 73 se tiver sorte. Talvez os pais tentem ser mais compreensivos e digam: “Bem, até agora você conseguiu um 85 e um 73, então talvez devesse figurar em um (85 73) / 2 79. Eu não sei, talvez se você fizesse menos Festejando e werent abanando a doninha em todo o lugar e se você começou a estudar muito mais você poderia obter uma pontuação mais alta. Ambas as estimativas estão realmente se movendo previsões médias. O primeiro é usar apenas sua pontuação mais recente para prever seu desempenho futuro. Isso é chamado de previsão de média móvel usando um período de dados. O segundo também é uma previsão de média móvel, mas usando dois períodos de dados. Vamos supor que todas essas pessoas que atacaram em sua grande mente o deixaram irritado e que você decidiu se dar bem no terceiro teste, por suas próprias razões, e colocar uma nota mais alta na frente de suas cotações. Você faz o teste e sua pontuação é na verdade uma 89. Todo mundo, inclusive você, está impressionado. Então agora você tem o teste final do semestre chegando e como de costume você sente a necessidade de incitar todos a fazerem suas previsões sobre como você vai fazer no último teste. Bem, espero que você veja o padrão. Agora, esperamos que você possa ver o padrão. Qual você acredita ser o mais apito enquanto trabalhamos? Agora voltamos à nossa nova empresa de limpeza iniciada por sua meia-irmã chamada Whistle While We Work. Você tem alguns dados de vendas anteriores representados pela seção a seguir de uma planilha. Primeiramente, apresentamos os dados para uma previsão média móvel de três períodos. A entrada para a célula C6 deve ser Agora você pode copiar essa fórmula de célula para as outras células C7 a C11. Observe como a média se move sobre os dados históricos mais recentes, mas usa exatamente os três períodos mais recentes disponíveis para cada previsão. Você também deve perceber que nós realmente não precisamos fazer as previsões para os períodos anteriores, a fim de desenvolver nossa previsão mais recente. Isso é definitivamente diferente do modelo de suavização exponencial. Incluí as previsões quotpast porque nós as usaremos na próxima página para medir a validade de previsão. Agora quero apresentar os resultados análogos para uma previsão média móvel de dois períodos. A entrada para a célula C5 deve ser Agora você pode copiar essa fórmula de célula para as outras células C6 a C11. Observe como agora apenas as duas partes mais recentes de dados históricos são usadas para cada previsão. Mais uma vez incluí as previsões da semana passada para fins ilustrativos e para uso posterior na validação de previsões. Algumas outras coisas que são importantes para perceber. Para uma previsão média móvel de período m, apenas os valores de dados mais recentes são usados ​​para fazer a previsão. Nada mais é necessário. Para uma previsão de média móvel de período m, ao fazer previsões de cotpas, observe que a primeira previsão ocorre no período m 1. Esses dois problemas serão muito significativos quando desenvolvermos nosso código. Desenvolvendo a Função Média Móvel. Agora precisamos desenvolver o código para a previsão da média móvel que pode ser usada de forma mais flexível. O código segue. Observe que as entradas são para o número de períodos que você deseja usar na previsão e a matriz de valores históricos. Você pode armazená-lo em qualquer pasta de trabalho desejada. Função MovingAverage (Histórico, NumberOfPeriods) Como Single Declarando e inicializando variáveis ​​Dim Item As Variant Dim Contador As Integer Dim Acumulação Único Dim HistoricalSize As Integer Inicializando variáveis ​​Counter 1 Acumulação 0 Determinando o tamanho da matriz histórica HistoricalSize Historical. Count Para Counter 1 Para NumberOfPeriods Acumulando o número apropriado de valores observados anteriormente mais recentes Acumulação Acumulação Histórico (HistoricalSize - NumberOfPeriods Counter) MovendoCúmulo Médio / NumberOfPeriods O código será explicado na classe. Você deseja posicionar a função na planilha para que o resultado da computação apareça onde deveria seguir o seguinte.8.4 Modelos de média móvel Em vez de usar valores passados ​​da variável de previsão em uma regressão, um modelo de média móvel usa erros de previsão anteriores em um modelo semelhante à regressão. y c et teta e theta e dots teta e, onde et é ruído branco. Nós nos referimos a isso como um modelo MA (q). Naturalmente, não observamos os valores de et, por isso não é realmente a regressão no sentido usual. Observe que cada valor de yt pode ser considerado uma média móvel ponderada dos últimos erros de previsão. No entanto, os modelos de média móvel não devem ser confundidos com a suavização de média móvel que discutimos no Capítulo 6. Um modelo de média móvel é usado para prever valores futuros enquanto a suavização média é usada para estimar o ciclo de tendência de valores passados. Figura 8.6: Dois exemplos de dados de modelos de média móvel com diferentes parâmetros. Esquerda: MA (1) com yt 20e t 0.8e t-1. Direita: MA (2) com yt e t-e t-1 0.8e t-2. Em ambos os casos, e t é normalmente distribuído ruído branco com média zero e variância um. A Figura 8.6 mostra alguns dados de um modelo MA (1) e um modelo MA (2). Alterar os parâmetros theta1, dots, thetaq resulta em diferentes padrões de séries temporais. Como nos modelos autorregressivos, a variância do termo de erro et só alterará a escala da série, não os padrões. É possível escrever qualquer modelo AR (p) estacionário como um modelo MA (infty). Por exemplo, usando a substituição repetida, podemos demonstrar isso para um modelo AR (1): begin phi1y phi1y ph amp e phi1y phi1y e phi12y phi1y phi1e phi1 phi e phi1 phi1e et amptext end Fornecido -1 lt phi1 lt 1, o valor de phi1k diminuirá quando k for maior. Então, eventualmente, obtemos os arquivos cd, phi12 e phi13 e um processo MA (infty). O resultado inverso é válido se impusermos algumas restrições nos parâmetros MA. Então o modelo MA é chamado de invertível. Ou seja, podemos escrever qualquer processo MA invertido (q) como um processo AR (infty). Modelos invertíveis não são simplesmente para nos permitir converter de modelos MA para modelos AR. Eles também têm algumas propriedades matemáticas que os tornam mais fáceis de usar na prática. As restrições de invertibilidade são semelhantes às restrições de estacionariedade. Para um modelo MA (1): -1lttheta1lt1. Para um modelo MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Condições mais complicadas são válidas para qge3. Mais uma vez, o R cuidará dessas restrições ao estimar os modelos. Previsão aprimorada com médias móveis e escores Z Andrew Creager 0 A previsão é parte integrante do gerenciamento de negócios. Quanto melhor a previsão, melhor a gestão será capaz de planejar o futuro. Embora existam muitos métodos para fazer previsões, alguns são mais adequados do que outros para situações específicas. Para previsão de curto prazo, os Black Belts podem se beneficiar da análise de tendências de produção e da busca por causas especiais de variação. Ao fazer previsões de longo prazo, um método que usa uma curva normal e escores Z pode ser a melhor aposta. Ambos os métodos são simples de aplicar. Métodos na prática O cenário a seguir fornece uma compreensão de como esses métodos funcionam. Neste exemplo, um gerente de produção, que foi recentemente certificado como Black Belt, quer usar ferramentas Six Sigma e software de análise estatística para fazer previsões. O gerente acompanha a produção semanal de pallets do departamento8217. Cada palete contém um número constante de casos de produto e o gerente usa uma média móvel simples de quatro semanas em uma planilha. A Tabela 1 mostra uma amostra, a partir do final de um ciclo de 52 semanas, da produção de paletes do departamento8217s. Tabela 1: Produção de paletes por semana O gerente tem os dois ingredientes básicos necessários para gerar previsões: dados de produção e um período de previsão. O período, ordivisor, neste caso é semanas. Com essas informações, ela pode executar os métodos de previsão de curto e longo prazos. Curto Prazo: Procurando Tendências em Movimentos de Média Móvel O software estatístico pode fornecer aos Black Belts várias opções para concluir as previsões. Nesse caso, para uma previsão de curto prazo, o gerente escolhe plotar a média móvel usando um comando de série temporal. Para fazer isso, ela insere a variável e o comprimento quando solicitado. Figura 1: Plotagem Média Móvel de Quatro Semanas para Produção de Paletes A Figura 1 mostra a média móvel de quatro semanas do gerente de manufatura8217s do ano passado, como apareceria em um programa de software. Embora a representação visual da análise seja útil, o verdadeiro foco aqui é as medidas de precisão, que representam as diferenças entre as quantidades reais e previstas de paletes. Uma dessas medidas de precisão é o desvio absoluto médio (MAD). Ele gagueja a precisão dos valores de série temporal ajustados e expressa o desvio nas mesmas unidades que os dados, o que facilita a compreensão da quantidade de erros. A fórmula para MAD: onde y é o valor real de cada vez, y-hat é o valor ajustado e n é o número de observações. Tabela 2: MAD para várias iterações médias móveis Comprimento da média móvel Como o gerente está procurando uma previsão com o menor número possível de erros de previsão, é melhor iterar por diferentes comprimentos da média móvel para encontrar valores mais baixos de MAD. A Tabela 2, à esquerda, mostra os resultados de cinco diferentes iterações de média móvel. A tabela ilustra que o gerente teria uma previsão um pouco mais precisa com uma média móvel de cinco ou seis semanas. Ao examinar o gráfico na Figura 1, o gerente também pode notar que existem valores extremos nos pontos 40 e 45 e que os valores previstos foram essencialmente puxados para baixo em torno desses pontos. Isso deve criar interesse para uma análise mais aprofundada. Uma maneira de o gerente conduzir essa revisão e avaliar os efeitos dos dois pontos extremos é colocar os dados em um gráfico de controle de indivíduos, conforme mostrado na Figura 2, e verificar se há desvio fora dos limites de controle do 3-sigma. Figura 2: Gráfico de controle de indivíduos dos pontos de produção 40 e 45 excedem os limites de controle. É claro que a produção não é um processo único e não pode ser controlada simplesmente aplicando-se controle estatístico de processo, mas o gráfico de indivíduos é uma ferramenta familiar para os Black Belts e pode fornecer informações valiosas para a previsão do gerente. Após a revisão dos pontos fora dos limites de controle, o gerente encontra uma explicação provável: Eles ocorreram em dois feriados, Ação de Graças e Natal, quando o departamento foi fechado por vários dias. Sabendo disso, o gerente remove os dois pontos do conjunto de dados e executa novamente as médias móveis para ver se o MAD diminui. O gerente descobre que o MAD diminui depois de remover os dois pontos extremos que os dados atualizados são mostrados na Tabela 3. Tabela 3: MAD para Várias Iterações Médias Móveis Após Remover Outliers Comprimento da Média Móvel O gerente agora pode esperar melhores previsões de curto prazo usando um período de cinco semanas. As operações são dinâmicas, no entanto, e seria melhor revisar a previsão periodicamente e ajustar conforme necessário. Longo Prazo: Usando a Curva Normal Para o planejamento de longo prazo do gestor, como prever a produção anual para o próximo ano, a previsão usando a curva normal e os escores Z é um método mais adequado. Como o gerente está olhando para probabilidades usando a curva normal, ela primeiro certifica-se de que a distribuição é, de fato, normal. Isso pode ser feito usando o teste de normalidade Anderson-Darling (AD). O valor p (a gt .10) para a produção de paletes, ajustado para excluir as semanas de férias, indica que a distribuição é aproximadamente normal. O próximo passo do gerente é usar o software estatístico para encontrar estatísticas resumidas, conforme mostrado na Figura 3, porque elas contêm componentes-chave de previsão. Figura 3: Resumo da produção ajustada Com os dados reunidos aqui, o gerente pode iniciar a previsão da produção do próximo ano, presumindo que não foram feitas alterações significativas. Para começar, o gerente usa um programa de software para criar um gráfico de distribuição de probabilidades, como mostrado na Figura 4. Figura 4: Gráfico de Distribuição de Probabilidade Este gráfico mostra que aproximadamente 34% da produção estará entre a média de 203 paletes e 1 desvio padrão (13 paletes) mais do que a média, ou 216 paletes. Embora essa porcentagem possa ser encontrada usando um programa de software, o cálculo manual é quase tão fácil. Um Black Belt pode calcular a mesma porcentagem usando o Z-score e referindo-se a uma tabela de distribuição normal. Neste exemplo, onde z (número de s a representa um valor) (216 203) / 13 13/13 1. A área sob a curva representa um desvio padrão (positivo). Uma tabela de distribuição normal mostra que um z de 1 .841 8211 .500 .341. ou 34 por cento. Para estimar quantas semanas fora do ano o departamento pode produzir em 216 paletes ou mais de produto, ou mais de 1 desvio padrão da média, o gerente atualiza o gráfico de distribuição (Figura 5). Figura 5: Probabilidade de produzir mais de um desvio padrão da média Usando o gráfico acima, o gerente estima que o departamento pode estar em 216 paletes ou mais para 16% do ano, ou aproximadamente oito das próximas 52 semanas. O gerente também quer bater o recorde do ano anterior de fabricar 231 paletes de produto em uma única semana. Portanto, ela define uma meta de alcançar 235 paletes pelo menos uma vez. Para descobrir quantas vezes nas próximas 52 semanas o departamento pode preencher 235 paletes, o gerente começa calculando o Z-score: z (235 202) / 13 32/13 cerca de 2,46 s. A resposta vem de procurar este Z - score na tabela de distribuição normal ou produzindo outro gráfico de distribuição no programa de software (Figura 6). Figura 6: Probabilidade de produzir mais de 2,46 desvios padrão da média As perspectivas para a produção de 235 paletes não são boas, há menos de 1% de chance, o que significa que pode acontecer uma vez. Usando os escores Z e os gráficos de distribuição, no entanto, o gerente pode prever esses resultados com antecedência e estabelecer metas razoáveis. Se você amou este artigo, você também pode amar deixar um comentário

No comments:

Post a Comment