Forecast: Como prever o fluxo de passageiros no aeroporto de Maceió

Armando Barbosa
4 min readJan 18, 2019

--

utilizando ciência de dados e dados abertos para prever o futuro

Neste artigo iremos utilizar dados sobre indicadores do aeroporto retirados do observatório de turismo de Maceió. Como podemos ver na tabela abaixo as colunas são os anos e as linhas são os meses.

tabela original (fonte: http://observatorioturismo.maceio.al.gov.br/indicadores-aeroporto/)

Vale ressaltar que para ter acesso é necessário extrair as informações do corpo do documento, pois eles não disponibilizam o arquivo csv com os dados. Além disso, é possível notar que estão faltando os três últimos meses.

Após a extração dos dados temos um arquivo csv que segue a mesma estrutura da tabela original.

Tabela csv (Fonte: Autor)

Para realizar a análise usando a técnica de forecast é necessário reestruturar os dados. Nessa nova estrutura há apenas duas colunas: Datas e valores registrados, respectivamente. Criando assim uma série temporal.

Exemplo de série temporal (Fonte: Autor)

A partir da série temporal é possível visualizar a evolução da movimentação ao longo dos anos.

Apesar de uma pequena retraída entre 2014 e 2015, é possível notar que o número de passageiros que pousam e decolam deste aeroporto é cada vez maior. Além disso, é visível a sazonalidade ao longo dos meses, que pode ser facilmente notado pelos picos no início de cada ano.

Até o momento foi trabalhado a extração, limpeza, e visualização dos dados. A seguir iremos utilizar todas as informações que já conhecemos para tentar prever a movimentação no aeroporto em datas futuras, mais especificamente as datas entre 01/10/2018 e 31/12/2019. E para isso foi utilizada a técnica chamada Forecast através do Prophet.

datas utilizadas na previsão (Fonte: Autor)

Forecasting é uma técnica que busca aprender padrões em dados do passado com o objetivo de prever essa informação no futuro. Sendo útil em diferentes cenários, tais como: prever fluxo de venda, valor de ativos, consumo elétrico e etc.

O Prophet é uma solução open-source desenvolvida pelo facebook para realizar previsões em séries temporais de forma simples. O modelo padrão que é utilizado para realizar as previsões utiliza três componentes.

y(t) = g(t) + s(t) + h(t) + e

onde:
- g é a função de tendência, que modela mudanças não periódicas nas séries temporais

- s é a função de sazonalidade, que modela mudanças periódicas nas séries

- h representa os efeitos dos feriados nas séries

- e representa o erro

Vale a pena ressaltar que é possível estender o modelo e adicionar novos componentes. O artigo sobre o Prophet pode ser visto aqui.

O resultado do Prophet pode ser visto a seguir:

valores previstos para as datas futuras (Fonte: Autor)

A coluna yhat representa o valor previsto, já as colunas yhat_lower e yhat_upper representam uma janela de incerteza para um intervalo de confiança de 95%. Para facilitar o entendimento é possível gerar gráficos a partir do próprio modelo.

gráfico com previsão de movimentação (Fonte:autor)

Como pode ser visto no gráfico os valores previstos respeitaram o comportamento dos anos anteriores. Isso graças à capacidade de aprender as sazonalidades do modelo. Os pontos pretos são as entradas. A linha azul representa os valores previstos e o fundo azulado representa a incerteza.

Tendência e sazonalidade anual do modelo (Fonte: autor)

De acordo com a linha de tendência existe um número cada vez maior de pessoas embarcando e desembarcando do aeroporto. É possível notar que o nível de incerteza começa a ficar cada vez maior quando a data se torna cada vez mais distante.

Já no gráfico de sazonalidade temos uma movimentação maior no aeroporto quando se aproxima dos meses finais do ano. Isso pode ocorrer por motivos de férias para pessoas que estão voltando para suas casas e para aqueles que tem Maceió como destino turístico.

Conclusão

A possibilidade de prever tal movimentação permite
que as decisões sejam tomadas de forma estratégica. Para os gestores do aeroporto ou até mesmo por pessoas que planejem visitar Maceió na baixa temporada.

Extra

Caso tenha curiosidade em ver como análise foi realizada o código fonte está disponível aqui. Este repositório também contém análise de outros indicadores como: Hotelaria, Eventos e Rodoviária.

--

--

Armando Barbosa

Msc. Informática, Engenheiro de Dados e apaixonado por aprender/ensinar