构建中文分词器 - 隐马尔科夫模型

利用 隐马尔科夫模型(HMM) 的解码能力,能从一个观察序列(字符串序列)解码成另一个隐藏状态序列(分词符号序列)。 ...

八月 20, 2018 · 1 分钟 · Xiaoquan Kong

构建中文分词器 - 双向最大匹配法

结合 正向最大匹配法 和 反向最大匹配法 的优点,按照一定的规则选择其中表现最优秀的结果作为 双向最大匹配法 的结果。 ...

八月 14, 2018 · 1 分钟 · Xiaoquan Kong

构建中文分词器 - 反向最大匹配法

最大匹配每次寻找和确定最佳分词的时候按照最长(最大)匹配作为依据,从字符串的右边到左边(反向)依次寻找最大匹配。 ...

1 分钟 · Xiaoquan Kong

构建中文分词器 - 正向最大匹配法

最大匹配每次寻找和确定最佳分词的时候按照最长(最大)匹配作为依据,从字符串的左边到右边(正向)依次寻找最大匹配。 ...

1 分钟 · Xiaoquan Kong