El acto de tomar parcial o totalmente contenidos generados por otras personas, y presentarlos como propios, sin dar el crédito correspondiente a los autores, es una forma indebida de reutilizacíon de contenidos, considerada como plagio. Desafortunamente, en la actualidad, dada la amplia disponibilidad de contenidos a trav´es de Internet, esta pr´actica se ha incrementado. La gran mayor´ıa de los contenidos disponibles en la Web son materiales multimedia, aplicaciones y sobre todo textos, y todos ellos son susceptibles de plagio. En este art´ıculo se hace ´enfasis en una clase de textos en particular: los programas escritos en alg´un lenguaje de programaci´on, denominados c´odigo fuente. Dada la facilidad de acceso y las pr´acticas de reutilizaci´on de contenidos sin citar las fuentes (el abuso de la posibilidad de “Copiar y Pegar”, derivado de deficiencias metodol´ogicas o bien como acci´on deliberada), surge la necesidad de contar con herramientas para combatir el plagio, en especial, de código fuente. En el presente trabajo se propone una herramienta orientada a detectar la reutilización de código fuente en programas escritos en un mismo lenguaje de programación. Las técnicas aplicadas se basan en la detección de la similitud entre dos programas, a través del uso de su Frecuencia de Términos (TF) y su Frecuencia Inversa (TF-IDF), considerando como términos conjuntos de n-gramas de caracteres presentes en cada uno de ellos
CITATION STYLE
Picazo-Alvarez, R., Villatoro-Tello, E., Luna-Ramírez, W. A., & Jaimez-González, C. R. (2014). Herramienta de apoyo en la detección de reutilización de código fuente. Research in Computing Science, 73(1), 45–57. https://doi.org/10.13053/rcs-73-1-3
Mendeley helps you to discover research relevant for your work.