Statistical analysis of kernel-based least-squares density-ratio estimation

Takafumi Kanamori; Taiji Suzuki; Masashi Sugiyama

Journal ArticleOPEN ACCESS

Statistical analysis of kernel-based least-squares density-ratio estimation

Machine Learning (2012) 86(3) 335-367

DOI: 10.1007/s10994-011-5266-3

74Citations

76Readers

Abstract

The ratio of two probability densities can be used for solving various machine learning tasks such as covariate shift adaptation (importance sampling), outlier detection (likelihood-ratio test), feature selection (mutual information), and conditional probability estimation. Several methods of directly estimating the density ratio have recently been developed, e.g., moment matching estimation, maximum-likelihood density-ratio estimation, and least-squares density-ratio fitting. In this paper, we propose a kernelized variant of the least-squares method for density-ratio estimation, which is called kernel unconstrained leastsquares importance fitting (KuLSIF). We investigate its fundamental statistical properties including a non-parametric convergence rate, an analytic-form solution, and a leave-oneout cross-validation score. We further study its relation to other kernel-based density-ratio estimators. In experiments, we numerically compare various kernel-based density-ratio estimation methods, and show that KuLSIF compares favorably with other approaches. © The Author(s) 2011.

Author supplied keywords

Cite

CITATION STYLE

APA

Kanamori, T., Suzuki, T., & Sugiyama, M. (2012). Statistical analysis of kernel-based least-squares density-ratio estimation. Machine Learning, 86(3), 335–367. https://doi.org/10.1007/s10994-011-5266-3

Statistical analysis of kernel-based least-squares density-ratio estimation

Abstract

Author supplied keywords

Cite

Register to see more suggestions