ABSTRACT This paper presents the application of data mining techniques for pattern identification obtained from the analysis of meteorological variables and their correlation with the occurrence of intense rainfall. The used data were collected between 2008 and 2012 by the surface meteorological station of the Polytechnic Institute of Rio de Janeiro State University, located in Nova Friburgo - RJ, Brazil. The main objective is the automatic prediction related to extreme precipitation events surrounding the meteorological station location one hour prior its occurrence. Classification models were developed based on decision trees and artificial neural networks. The steps of consistency analysis, treatment and data conversion, as well as the computational models used are described, and some metrics are compared in order to identify their effectiveness. The results obtained for the most accurate model presented a rate of 82. 9% of hits related to the prediction of rainfall equal to or greater than 10 mm h-1 one hour prior its occurrence. The results indicate the possibility of using this work to predict risk events in the study region.RESUMO Este artigo apresenta a aplicação de técnicas de mineração de dados visando à identificação de padrões, a partir da análise de variáveis meteorológicas e sua correlação com a ocorrência de precipitações intensas. Os dados observados foram coletados pela estação meteorológica de superfície do Instituto Politécnico da Universidade do Estado do Rio de Janeiro, localizada na cidade de Nova Friburgo - RJ, Brasil, entre os anos 2008 e 2012. O principal objetivo é a previsão automática, com antecedência de uma hora, relacionada a eventos extremos de precipitação no entorno do local onde se encontra instalada a estação meteorológica. Foram desenvolvidos modelos de classificação baseados em árvores de decisão e redes neurais artificiais. As etapas de análise de consistência, tratamento e conversão de dados, bem como os modelos computacionais utilizados são descritos, sendo comparadas algumas métricas relacionadas à sua eficácia. Os resultados obtidos para o modelo mais preciso apresentaram uma taxa de 82.9% de acertos relacionados à previsão, com antecedência de uma hora, de precipitações iguais ou maiores que 10 mm h-1, indicando a possibilidade de utilização desse trabalho para previsão de eventos de risco na região de estudo.
CITATION STYLE
Charles, A. C., Namen, A. A., & Rodrigues, P. P. G. W. (2017). Comparison of data mining models applied to a surface meteorological station. RBRH, 22(0). https://doi.org/10.1590/2318-0331.0217170029
Mendeley helps you to discover research relevant for your work.