LAC 分词模型的 crf_decoding 层 transition 矩阵维度问题
收藏
我在使用默认 LAC 模型分词时,把模型打出来,发现 viterbi decoding 的 transition 矩阵维度不同,这里不应该是一个 num_tags*num_tags 的矩阵吗?多出来的 2 是因为什么?文档哪里有解释吗?
size = emission.shape[1] fluid.layers.create_parameter(shape=[size + 2, size], dtype=emission.dtype, name='crfw') crf_decode = fluid.layers.crf_decoding( input=emission, param_attr=fluid.ParamAttr(name='crfw'))
我在源码中看到了一个 size+2,这里 +2 是什么意思?
GitHub issue:https://github.com/baidu/lac/issues/204
0
收藏
请登录后评论
我也不会
您好, +2 表示 [START]和[STOP]两个状态。是tag表以外的两个特殊tag。