【语言与知识主题月】DNN语言模型评测

首页版块访问AI主站注册发帖

【语言与知识主题月】DNN语言模型评测

才能我浪费99 发布于2020-07 浏览:5473 回复:5

【语言与知识主题月】DNN语言模型评测

快速回复

1.功能描述：
DNN语言模型依托全网海量优质数据和深度神经网络技术，判断一句话是否符合语言表达习惯，帮助您实现文本分析、纠错、对话等多种语义应用

2.平台接入

具体接入方式比较简单，可以参考我的另一个帖子，这里就不重复了：
http://ai.baidu.com/forum/topic/show/943327

3.调用攻略（Python3）及评测

3.1首先认证授权：

在开始调用任何API之前需要先进行认证授权，具体的说明请参考：

http://ai.baidu.com/docs#/Auth/top

具体Python3代码如下：

# -*- coding: utf-8 -*-
#!/usr/bin/env python

import urllib
import base64
import json
#client_id 为官网获取的AK， client_secret 为官网获取的SK
client_id =【百度云应用的AK】
client_secret =【百度云应用的SK】

#获取token
def get_token():
host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret
request = urllib.request.Request(host)
request.add_header('Content-Type', 'application/json; charset=UTF-8')
response = urllib.request.urlopen(request)
token_content = response.read()
#print (token_content)
if token_content:
token_info = json.loads(token_content)
token_key = token_info['access_token']
return token_key

3.2百度词向量表示接口调用：

详细说明请参考：https://ai.baidu.com/ai-doc/NLP/0k6z52fb4

说明的比较清晰，这里就不重复了。

大家需要注意的是：请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v2/dnnlm_cn

Body请求示例:
{
"text": "百度是一家高科技公司"
}

Python3调用代码如下：

def dnnlm_cn(text):
    token=get_token()
    url = 'https://aip.baidubce.com/rpc/2.0/nlp/v2/dnnlm_cn'
    params = dict()
    params['text'] = text
    params = json.dumps(params).encode('utf-8')
    access_token = token
    url = url + "?access_token=" + access_token
    request = urllib.request.Request(url=url, data=params)
    request.add_header('Content-Type', 'application/json')
    response = urllib.request.urlopen(request)
    content = response.read()
    if content:
        content=content.decode('GBK')
        data = json.loads(content)
        print (data)

4.功能评测：
dnnlm_cn('今天天气真不错')
{'log_id': 3297982206021368514, 'text': '今天天气真不错', 'items': [{'word': '今天', 'prob': 0.00124328}, {'word': '天气', 'prob': 0.00425616}, {'word': '真', 'prob': 0.00535392}, {'word': '不', 'prob': 0.150294}, {'word': '错', 'prob': 0.415348}], 'ppl': 56.296}

dnnlm_cn('今天太阳真不错')
{'log_id': 6607228999651078402, 'text': '今天太阳真不错', 'items': [{'word': '今天', 'prob': 0.00124328}, {'word': '太阳', 'prob': 0.000211695}, {'word': '真', 'prob': 0.00142492}, {'word': '不', 'prob': 0.0711383}, {'word': '错', 'prob': 0.03952}], 'ppl': 248.543}

对比内容发现句子越通顺，PPL的值越低。

5.测试结论和建议
中文DNN语言模型接口用于输出切词结果并给出每个词在句子中的概率值,判断一句话是否符合语言表达习惯。使用起来很方便，会有很好的应用前景。

热门活动

个赞

共5条回复最后由用户已被禁言回复于2022-04

#6worddict回复于2020-07

对#5 笔墨哥回复

大佬具体哪它做啥啦？

看文章介绍是文本分析、纠错等方面

#5笔墨哥回复于2020-07

对#4 才能我浪费99回复

识别的很准确

大佬具体哪它做啥啦？

#4才能我浪费99回复于2020-07

识别的很准确

#3worddict回复于2020-07

期待后续的优化

#2worddict回复于2020-07

百度的NLP技术非常强大

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服