Transferencia de estilo entre audios mediante redes neuronales

Hernán Ordiales; Gabriel Martín Barrera

Journal ArticleOPEN ACCESS

Transferencia de estilo entre audios mediante redes neuronales

Ordiales H
Barrera G

ReDDI: Revista Digital del Departamento de Ingeniería (2019) 4(1) 1-14

DOI: 10.54789/reddi.4.1.6

N/ACitations

6Readers

Abstract

Este trabajo tiene como objetivo aplicar en archivos de audio las técnicas de procesamiento con redes neuronales desarrolladas para la transferencia de estilo en imágenes. En particular, aquellas que son de reciente publicación y dentro de su arquitectura utilizan una o más capas de redes neuronales convolucionales. Para ello, se construyen representaciones de la señal audible en matrices de estructura similar a las que normalmente se utilizan para procesar imagenes. Se evaluan diferentes aproximaciones al problema utlizando técnicas de análisis/síntesis como la transformada de tiempo corto de Fourier (STFT) y la descomposición de la señal de entrada en sinusoides y residuo, derivada del Spectral Modelling Synthesis, históricamente utilizado en señales de voz. Aunque la definición de estilo puede ser subjetiva, se ensayan algunas aproximaciones en su definición y reconocimiento. Para esto, se desarrollan e implementan diferentes programas en Python utilizando el framework TensorFlow, pensado para construir y entrenar redes neuronales. El resultado es un enfoque diferente para la aplicación de efectos digitales en señales de audio.

Cite

CITATION STYLE

APA

Ordiales, H., & Barrera, G. M. (2019). Transferencia de estilo entre audios mediante redes neuronales. ReDDI: Revista Digital Del Departamento de Ingeniería, 4(1), 1–14. https://doi.org/10.54789/reddi.4.1.6

Transferencia de estilo entre audios mediante redes neuronales

Abstract

Cite

Register to see more suggestions