Modelagem de Séries Temporais para o Custo da Cesta Básica, na Cidade de Belém do Pará, Via Metodologia de Box e Jenkins



Waldeci do Nascimento Azulay

 

Resumo

 

O objetivo deste trabalho é analisar o comportamento do custo da cesta básica na cidade de Belém do Pará ao longo do período de janeiro de 2005 a dezembro de 2009, utilizando a metodologia de Box e Jenkins para descrever o comportamento da série temporal e fazer previsões de curto prazo. Por meio do teste de Wald-Wolfowitz, verificou-se que a série é estacionária para a posterior modelagem dos dados. A partir da aplicação da metodologia de Box e Jenkins, verificou-se que o modelo AR (1) é significativo, os resíduos deste modelo se comportam como ruído branco e que o critério de validação usado (MAPE), resultou em 2,57%. Além disso, verificou-se através do modelo construído que os custos da cesta básica na cidade de Belém do Pará nos meses de janeiro, fevereiro e março de 2010 situaram-se acima do previsto.

 

Palavras Chaves: Cesta Básica; Metodologia de Box e Jenkins; Séries Temporais.

 

 

1. Introdução

 

Os alimentos são elementos essenciais para a sobrevivência do ser humano. Dentre eles destacam-se: carne, leite, feijão arroz, farinha de trigo/mandioca, batata, tomate, pão, café, banana, açúcar, óleo e manteiga que compõem a cesta básica. No Brasil, o Departamento Intersindical de Estatísticas e Estudos Socioeconômicos é o órgão responsável em coletar informações que permitam estimar o valor da cesta básica dentro de um período de tempo e a partir daí realizar estudos sobre o impacto da evolução temporal dos preços na renda do trabalhador.

 

Do ponto de vista econômico, a evolução dos preços gera a diminuição do poder de compra do salário mínimo, gerando conflitos entre sindicatos e a classe patronal, o DIEESE aparece como um dos intermediadores nas negociações mostrando o comportamento dos preços no tempo e qual o impacto dos aumentos de preços sobre o salário real e consequentemente na quantidade de itens que se pode adquirir com uma determinada renda, quando defasada por aumentos de preços ao longo do tempo.

 

 

2. Metodologia Estatística

 

2.1. Dados

 

Os dados utilizados neste trabalho são referentes aos custos em reais (R$) da cesta básica comercializada, na cidade de Belém do Pará de janeiro de 2005 a dezembro de 2009. E são referenciados pelo Departamento Intersindical de Estatísticas e Estudos Socioeconômicos (DIEESE).

 

2.2. Análise de Séries Temporais

 

Uma série temporal é uma realização particular de um processo estocástico de uma variável aleatória que evolui e guarda uma estrutura de dependência no tempo, onde o objetivo é modelar esta dependência e transformar a série num ruído branco.

 

A ferramenta básica para modelar uma série temporal é a função de autocorrelação. A autocorrelação de um processo (série) é uma medida padronizada da dependência linear de lag K, definida por:

 

 (teórica).

 

A dependência serial é denotada quando:  para todos os lags 1, 2, 3,...

 

A autocorrelação estimada de lag K é definida por:

 

Cujo gráfico é chamado de correlograma e pode ser utilizado para identificar características de uma série temporal.

O objetivo de modelar uma série temporal, consiste em tornar o processo puramente aleatório chamado de ruído branco. Um ruído branco é uma sequência de observações com média e variância constantes e autocorrelações nulas em todos os lags.

 

Na prática, se uma série temporal exibe uma estrutura de dependência, deve-se achar o melhor modelo matemático que descreva esta dependência serial e a transforme num ruído branco. Para tal, pode-se utilizar a metodologia de Box e Jenkins.

 

2.2.1. Metodologia de Box e Jenkins

 

Segundo Morettin e Toloi (2004), uma metodologia bastante utilizada na análise de modelos paramétricos é conhecida como abordagem de Box e Jenkins. A metodologia consiste em ajustar modelos auto-regressivos integrados de médias móveis, ARIMA (p,d,q), a um conjunto de dados.

 

A estratégia para a construção do modelo adequado representativo da série temporal é baseada em um ciclo iterativo, no qual a escolha da estrutura do modelo é baseada nos próprios dados. Segundo Box & Jenkins (1976), os estágios do ciclo iterativo são:

 

1. Identificação: consiste em descobrir qual dentre as várias versões dos modelos de Box-Jenkins, sejam eles sazonais ou não, descreve o comportamento da série. A identificação do modelo a ser estimado ocorre pelo comportamento das funções de autocorrelações (ACF) e das funções de autocorrelações parciais (PACF).

Outra proposta de identificação apresentada na literatura de séries temporais, consiste em selecionar o modelo cujo critério de informação acumulada seja mínimo. E um dos critérios mais utilizados é o Critério de Informação de Akaik (AIC) que é dado por:

 

Onde m é o número de parâmetros (em modelos ARMA (p, q) ). Para dados normalmente distribuídos e usando-se estimativas de máxima verossimilhança para os parâmetros pode-se mostrar que:

Onde

 

2. Estimação: consiste em estimar os parâmetros do componente auto-regressivo, os parâmetros do componente de médias móveis e a variância de et.

 

3. Verificação: consiste em avaliar se o modelo estimado é adequado para descrever o comportamento dos dados.

Um teste simples do modelo escolhido é ver se os resíduos estimados do modelo são ruídos brancos; se são, podemos aceitar o ajuste específico; se não são, devemos começar tudo de novo. Assim, a metodologia de Box e Jenkins é um processo iterativo.

 

Dentre os testes de diagnósticos do modelo ajustado a uma série, podemos utilizar o teste de Ljung-Box baseado nas autocorrelações dos resíduos. A estatística teste é definida por:

Sendo  a j-ésima autocorrelação estimada e n o número de observações. A estatística segue uma distribuição qui-quadrado ( ) com  graus de liberdade, onde p é o número de parâmetros auto-regressivos e q o número de parâmetros de médias móveis no modelo ajustado.

 

A estatística de Ljung-Box, é um teste estatístico de hipótese nula de ausência de autocorrelação. Assim, se para toda defasagem  a estatística , podemos considerar que os resíduos se comportam como ruído branco e que, portanto, o modelo ajustado é adequado.

Caso o modelo não seja adequado, o ciclo é repetido, voltando-se à fase de identificação. Um procedimento muito utilizado é identificar não só um único modelo, mas alguns modelos que serão então estimados e verificados. Quando se obtém um modelo satisfatório, passa-se para a última etapa da metodologia de Box-Jenkins, que constitui o objetivo principal da metodologia: realizar previsões.

 

2.2.2.Critério de Validação

 

Segundo Russo (2002), um dos critérios muito utilizados para escolher o melhor modelo é o critério de Erro Percentual Absoluto Médio de Previsão (MAPE). O MAPE é calculado a partir das previsões um passo à frente gerado por cada modelo estimado.

 


Onde  é o valor observado da série, , o valor previsto e  é o número de previsões.

 

3. Análise e Discursão dos Dados

 

A Tabela 1 apresenta o Resumo Estatístico dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará de Janeiro de 2005 a Dezembro de 2009. Nela, verifica-se que ao longo desse período, o custo médio mensal da cesta básica foi de R$ 174,66 com variabilidade em torno do custo médio de R$ 23,49.

 

 

 

 

Tabela 1: Resumo Estatístico dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará de Janeiro de 2005 a Dezembro de 2009.

 

 

 

Medidas

 

Valor

Média

 

174,66

 Mediana

 

165,14

Desvio Padrão

23,49

 

 

 

 

 

 E como o custo médio é maior que o custo mediano, pode-se dizer que a série apresenta assimetria positiva.

 

 

3.2. Metodologia de Box e Jenkins

 

A Figura 1 apresenta a Evolução Temporal dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009. Nela, verifica-se que o custo da cesta básica apresentou variação no tempo, entre R$ 100,00 e R$ 250,00.

Figura 1: Evolução Temporal dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009.

 

E que em julho de 2008, atingiu o custo mais alto do período. Atingindo o custo comercial de R$ 211,13, situando-se acima do custo médio do período que foi de R$ 174,66.

 

A partir da Figura 1, verifica-se também, que os custos da cesta básica não apresentaram forte tendência de crescimento, conforme se pode observar na Tabela 1 que apresenta o Teste de Wald-Wolfowitz para a Verificação de Tendência partindo-se das seguintes hipóteses ao nível de significância de 0,05.

 

·        H0: Não existe tendência, versus

·        H1: Existe Tendência.

 

Tabela 2: Teste de Wald-Wolfowitz Para a Verificação de Tendência dos Custos da Cesta Básica.

 

 

 

Mediana

 Z (Calculado)

Z (Tabelado)

165,14

0,6098

0,2709

 

 

 

 

Nela, verifica-se que o Z calculado igual a 0,6098 é maior que o Z tabelado igual a 0,2709, indicando a não rejeição da hipótese nula ao nível de 0,05% de probabilidade, ou seja, a série é estacionária e não precisa ser diferenciada.

 

Dada a estacionária da série, as Figuras 2 e 3 apresentam respectivamente, a Função de Autocorrelação e a Função de Autocorrelação Parcial da Série Original dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009.

Figuras 2 e 3: Função de Autocorrelação e Função de Autocorrelação Parcial da Série Original dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009.

 

Nelas, verificam-se coeficientes de correlação fora do limite de 95% de confiança, mostrando que os dados da série são autocorrelacionados.

 

Assim, de acordo com o comportamento da Função de Autocorrelação e da Função de Autocorrelação Parcial da série original foram propostos os seguintes modelos autorregressivos: AR (1) e AR (2), cujos resultados são apresentados na Tabela 3.

A Tabela 3 apresenta os Resultados das Estimativas dos Parâmetros, do Teste t-Student, do Nível descritivo e do Critério AIC dos Modelos AR (1) e AR (2 da Série. Nela, verifica-se que o processo autorregressivo de primeira ordem, AR (1), com  igual a 0,9743, o teste t-Student igual a 36,23 maior que 2 e o nível descritivo igual a 0,000 é significativo ao nível de 0,05% de probabilidade. Enquanto que o processo autorregressivo AR (2) com  igual a 0,0878, o módulo do teste t-Student igual a 0,1800 menor que 2 e nível descritivo igual a 0,1673, não é significativo ao nível de 0,05% de probabilidade.

 

Tabela 3: Resultados das Estimativas dos Parâmetros, do Teste t-Student, do Nível Descritivo e do Critério AIC dos Modelos AR (1) e AR (2) da Série.

 

 

 

 

 

Modelo

Estimativa dos Parâmetros

Teste t-Student

Nível Descritivo

Critério AIC

AR (1)

36,23

0,000

381,8307

AR (2)

9,0275

0,000

381,8712

-0,1800

0,1673

 

A partir da Tabela 1, verifica-se, também, que pelo Critério de Informação AIC, o modelo AR (1) com coeficiente estimado igual a 381,8307, mostrou-se adequado por apresentar menor coeficiente quando comparado com o valor do modelo AR (2) igual a 381,8712.

 

 Assim, considerando os resultados do Teste t-Student e do Coeficiente de Estimação AIC, o processo autorregressivo, AR (1), é o melhor modelo identificado para representar a série.

 

Analisando a Função de Autocorrelação e Autocorrelação Parcial Estimadas dos Resíduos do Processo AR (1), Figuras 4 e 5, respectivamente. Verifica-se que todas as quinze primeiras autocorrelações se encontram dentro do limite de 95% de confiança, mostrando que o modelo autorregressivo de primeira ordem, AR (1), ajustou adequadamente a série e que os resíduos podem ser considerados ruído branco, indicando que a dinâmica da série estudada pode ser bem explicada pelo coeficiente do modelo ajustado,conforme mostra o Teste de Ljung e Box.

 

 

Figura 4 e 5: Função de Autocorrelação e Função de Autocorrelação Parcial Estimada dos Resíduos da Série Original dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009.

 

 

 As hipóteses a serem testadas ao nível de significância de 0,05%, para o Teste de Ljung e Box, são:

 

H0: Os resíduos são não correlacionados; versus.

H1: Os resíduos são correlacionados.

 

A Tabela 4 apresenta o Teste de Ljung e Box para as Autocorrelações Estimadas dos Resíduos da Série dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009. Nela, verifica-se que o teste de Ljung e Box Q(K), não rejeita a hipótese de resíduos não correlacionados para qualquer defasagem K, bem como, para todo valor de K, a probabilidade é significativamente diferente de zero. Logo, o modelo AR (1) ajustado à série é adequado, pois os resíduos estimados são não correlacionados, ou seja, os resíduos se comportam como ruído branco e o modelo é significativo ao nível de 0,05% de probabilidade.

 

Tabela 4: Teste de Ljung e Box para as Autocorrelações Estimadas dos Resíduos da Série dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009.

 

 

 

 

 

 

K

Autocorrelação

Erro Padrão

Teste de Ljung e Box

Probabilidade

2

-0,0006

0,1249

0,0000

1,0000

3

-0,0008

0,1238

0,0001

1,0000

4

-0,0011

0,1227

0,0002

1,0000

5

-0,0014

0,1216

0,0003

1,0000

6

-0,0017

0,1205

0,0005

1,0000

7

-0,0020

0,1194

0,0008

1,0000

8

-0,0022

0,1182

0,0011

1,0000

9

-0,0026

0,1171

0,0016

1,0000

10

-0,0028

0,1159

0,0022

1,0000

11

-0,0031

0,1148

0,0029

1,0000

12

-0,0034

0,1136

0,0038

1,0000

13

-0,0037

0,1124

0,0049

1,0000

14

-0,0040

0,1112

0,0062

1,0000

15

-0,0042

0,1100

0,0076

1,0000

 

 Nestas condições, o modelo AR (1) pode ser utilizado para fazer previsões de curto prazo do custo da cesta básica na cidade de Belém do Pará, cuja previsão pode ser feita através da seguinte equação:

 

         ;

Onde;

 

: é o coeficiente da variável em estudo;

: é o valor da série no instante  (origem);

: é o nível médio do processo (constante).

 

            A Tabela 5 apresenta o Sumário do Parâmetro do Modelo AR (1) Ajustado à Série dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009.

 

Nela, verifica-se que o valor predito para o modelo AR (1) no tempo t+1 é dado por:

Tabela 5: Sumário do Parâmetro do Modelo AR (1) Ajustado à Série dos Custos da Cesta Básica, em Reais (R$), Comercializada na Cidade de Belém do Pará entre os Meses de Janeiro de 2005 a Dezembro de 2009.

 

 

 

 

Modelo

Estimativa do Parâmetro

Média

AR (1)

0,9743

176,67

 

 

 

 

 

 

 

A Tabela 6 apresenta os Valores Previstos Para o Custo da Cesta Básica na Cidade de Belém do Pará nos Próximos Três Meses de 2010. Nela, verifica-se que a partir do modelo construído os custos da cesta básica comercializada na cidade de Belém do Pará nos meses de janeiro, fevereiro e março de 2010 situaram-se acima dos custos previstos, conforme pode ser visualizado na Figura 6. O erro médio previsto para o modelo AR (1) é igual a 2,57%.

 

Tabela 6: Valores Previstos Para o Custo da Cesta Básica na Cidade de Belém do Pará nos Próximos Três Meses de 2010.

 

 

 

 

 

 

 

 

Mês/Ano

t

h

Zt Observado

Zt Previsto

et(h)

MAPE

jan/10

61

1

204,62

203,61

1,01

0,005

fev/10

62

2

204,93

202,92

2,01

0,010

mar/10

63

3

215,72

202,25

13,47

0,062

 

 

 

                              

____ Valores Observados _____ Valores Previstos

 

 

Figura 6: Gráfico Representativo de Previsões do Custo da Cesta Básica na Cidade de Belém do Pará, Segundo o Modelo AR (1).

 

4. Conclusão

 

A partir da análise dos gráficos representativos da série, tabelas e demais cálculos estatísticos, verificou-se que a série é estacionária, o melhor modelo de ajuste é um processo autorregressivo de primeira ordem AR (1), que permite fazer simulações de previsões futuras do custo da cesta básica na cidade de Belém do Pará através da equação: . Por sua vez, o critério de validação (MAPE) para o modelo AR (1) da série, resultou em 2,57%.

 

 

 

Referências

 

 

MORETTIN, P. A.; TOLOI, C. M. Análise de Séries Temporais, 2. ed., São Paulo: Edgard Blucher, 2006.

 

 RUSSO, S. L. Gráficos de Controle para Variáveis Não-Conformes Autocorrelacionadas. Tese de Doutorado. Programa de Pós-graduação em Engenharia de Produção, UFSC, Florianópolis/SC, 2002.

 

 


Autor: Waldeci Do Nascimento Azulay


Artigos Relacionados


Como As Commodities Influenciam O Bolso Da Dona De Casa

Escore De Framingham - Faça O Teste E Veja Qual O Seu Risco Estimado Para Desenvolver Doenças Cardiovasculares.

Menos Hipocrisia E Mais Dignidade

O Idoso No Contexto Da Atenção Básica à Saúde Do Município De Almadina-ba

BelÉm-pb

Avaliação De Empresas Pelo Método Do Fcd - Um Estudo De Caso Da Empresa Paranapanema S.a.

Uma Abordagem Sobre Custo De Software