Este artigo descreve um comparativo entre dois algoritmos da área de mineração de textos, os quais são utilizados na tarefa de sumarização automática de documentos. Foram comparados nos experimentos o algoritmo clássico de Luhn e o algoritmo GistSumm, sendo realizadas dois tipos de avaliação, ambas utilizando o Português do Brasil como idioma alvo. A primeira consistiu em gerar um resumo de um texto fonte com cada algoritmo,e a avaliação foi conduzida utilizando avaliadores humanos que indicaram a coerência nos resumos de cada um. Por outro lado, a segunda foi conduzida por meio de uma avaliação baseada no resumo, no qual os avaliadores responderam perguntas sobre o texto original possuindo como fonte de consulta somente o resumo gerado pelos algoritmos. Após as análises, foi demonstrado que o algoritmo GistSumm possui maior capacidade para gerar resumos que mantenham a ideia principal do texto, sendo classificado com 81,6% de eficiência no primeiro experimento e 90% no segundo experimento.
CITATION STYLE
Muller, E., Granatyr, J., & Lessing, O. R. (2015). Comparativo entre o algoritmo de Luhn e o algoritmo GistSumm para sumarização de documentos. Revista de Informática Teórica e Aplicada, 22(1), 75. https://doi.org/10.22456/2175-2745.47524
Mendeley helps you to discover research relevant for your work.