DNN语言模型 不太好用啊
大爷你啥样 发布于2019-07 浏览:3968 回复:3
0
收藏

In [6]: client.dnnlm('特别好的老师,耐心纠正错误,拓展丰富')
Out[6]:
{'log_id': 4511065252635538769,
'text': '特别好的老师,耐心纠正错误,拓展丰富',
'items': [...],
'ppl': 2792.31}

In [7]: client.dnnlm('规范国家恢复光滑 v 和 v 把 v 居家环境斤斤计较斤斤计较哈哈哈哈哈哈姐姐')
Out[7]:
{'log_id': 5254519005520011345,
'text': '规范国家恢复光滑 v 和 v 把 v 居家环境斤斤计较斤斤计较哈哈哈哈哈哈姐姐',
'items': [....],
'ppl': 1608.04}

 

文档里解释: ppl是描述句子通顺的值:数值越低,句子越通顺

第一句多正常,结果出来,通顺程度(ppl)还不如随便乱打的第二句。是我对这个接口有什么误解么?

 

 

收藏
点赞
0
个赞
共3条回复 最后由用户已被禁言回复于2022-04
#4荷大米回复于2021-01

我DNN通顺度的检测原理只是测试,词组一起出现的概率,通顺度要结合同一个句子换了词来看。

0
1
#317600181232回复于2020-06

百度的DNN和用飞桨提供的LM训练得到的模型,获取PPL时都会出现不准的情况,两个东西得到的PPL趋势都不一样......

0
#2奇迹斗牛士回复于2019-07

理解没问题,但建议这块综合整体来看,单个case会有不准

0
TOP
切换版块