CRF

理解条件随机场

Submitted by huzhenda on Sat, 07/14/2018 - 11:47

        条件随机场(conditional random fields,简称 CRF),是一种判别式概率模型,是给定一组输入序列条件下另一组输出序列的条件概率分布模型,常用于标注或分析序列资料。

1、哪些问题需要用到CRF模型

         我们以自然语言处理中的词性标注(POS Tagging)作为例子。词性标注的目标是给出一个句子中每个词的词性(名词,动词,形容词等)。而这些词的词性往往和上下文词的词性有关,因此,使用CRF来处理是很适合的。

2、从随机场到马尔可夫随机场

        首先,我们来介绍随机场。随机场是由若干个位置组成的整体,当给每一个位置中按照某种分布随机赋予一个值之后,其全体就叫做随机场。以词性标注为例:假如我们需要对一个包含十个词的句子做词性标注。这十个词每个词的词性可以在我们已知的词性集合(名词,动词...)中选择。当我们为每个词选择完词性后,这就形成了一个随机场。