Training conditional random fields using incomplete annotations

Yuta Tsuboi; Hisashi Kashima; Shinsuke Mori; Hiroki Oda; Yuji Matsumoto

Conference Proceedings

Training conditional random fields using incomplete annotations

Coling 2008 - 22nd International Conference on Computational Linguistics, Proceedings of the Conference (2008) 1 897-904

DOI: 10.3115/1599081.1599194

69Citations

128Readers

Get full text

Abstract

We address corpus building situations, where complete annotations to the whole corpus is time consuming and unrealistic. Thus, annotation is done only on crucial part of sentences, or contains unresolved label ambiguities. We propose a parameter estimation method for Conditional Random Fields (CRFs), which enables us to use such incomplete annotations. We show promising results of our method as applied to two types of NLP tasks: a domain adaptation task of a Japanese word segmentation using partial annotations, and a part-of-speech tagging task using ambiguous tags in the Penn treebank corpus. © 2008. Licensed under the Creative Commons.

Cite

CITATION STYLE

APA

Tsuboi, Y., Kashima, H., Mori, S., Oda, H., & Matsumoto, Y. (2008). Training conditional random fields using incomplete annotations. In Coling 2008 - 22nd International Conference on Computational Linguistics, Proceedings of the Conference (Vol. 1, pp. 897–904). Association for Computational Linguistics (ACL). https://doi.org/10.3115/1599081.1599194

Training conditional random fields using incomplete annotations

Abstract

Cite

Register to see more suggestions