百度语音自训练平台行业和场景维度案例详解
用户已被禁言 发布于2019-11 浏览:53431 回复:1453
0
收藏

尊敬的百度AI开放平台用户:

自训练平台4月份公测以来,不少用户已经率先体验了简单易用的自训练平台,自训练平台通过自助训练语言模型的方式大大降低了用户垂直业务的高后处理成本,基本解决了语音识别模型针对性优化训练存在技术门槛、成本高、训练周期长的问题。

在农业、医疗、基建等领域,自训练平台帮助各个企业训练模型提高专业术语的识别率,使语音识别在特殊场景下也能准确识别,客户需求的功能完美落地。下面我们就从行业和场景的维度来了解语音自训练平台是如何帮助客户优化识别率、实现产品预期需求。

 

 语音采集——农业 

华智水稻生物技术公司旗下研发的华智育种管家APP,通过结合百度AI语音自训练平台的模型训练能力与长语音识别技术,让一线育种信息采集人员通过手机APP即可语音采集农作物的名称、性状、指标等数据,实现了将录入到系统上的育种信息可数据化管理及专业的数据化分析等能力。

通过百度语音自训练平台技术的科学训练后,整体语音识别率从71.09%提高到了98.75%,采集一个测试田地性状信息从300人工时降低到160人工时,工作效率提升一倍,有效解决了行业专业词汇识别率低的问题,能为更多的智能农业公司提供一体化的解决方案。

育种人员语音输入信息采集流程如下:

第1步:打开华智育种管家APP,点击底部语音功能按钮;

第2步:在信息录入页面点击语音输入,然后直接按照 “试验田编号+植物性状+指标”;

第3步:可以看到语音输入并转换成文字的结果,同时还能查看录音或直接上传数据。

 呼叫中心语音质检——金融 

与过去将积蓄在银行存定期的理财观念相比,如今的年轻人更喜欢超前消费,各种便捷贷款的网贷平台应运而生,但是很多年轻人并不能按时还款或忘记还款,这也加大了网贷平台的坏账风险,而得体有效的催收电话则可以减少部分的坏账风险。为了能够让业务员更文明准确有效的进行沟通,同时保障借款人的情绪以及业务员的权益,会将业务员与客户对话的音频识别为文字进行关键词分析,进行质检。

客户选择了百度的呼叫中心语音转写产品,在大量的电话数据识别结果中可以看到,由于金融行业中含有大量金融词汇与业务专用词汇,关键词音频转文字的识别率整体不高,进而一定程度影响了质检效率。后来客户进一步使用百度语音自训练平台,投入了大量业务语料对语言模型进行自助训练后,金融业务关键词的识别率显著提升,也大大增强了质检效率。

 

 语音采集——医疗护理 

在医疗场景下,临床护理数据采集是一项繁重的工作,需要护理人员通过手写、手记、手录完成各类护理数据的采集与录入。某医疗公司在引入百度AI技术能力后医疗机构的护理人员仅需要通过定制的手持终端上只需要简单操作,就可以把所要录入的临床护理数据(时间、单位、药品名称、特殊符号、数字、长文本)以语音转为文字的方式完成,几秒内完成各类混合医疗数据的采集与录入。

由于是医疗数据专业性较强,普通语音识别模型识别率较低,在通过语音自训练平台上多次训练后,将识别率从64.72%提高到82.99%,高识别率满足了临床数据采集人员的实际需求。在百度AI技术加持下,极大地提高护理数据采集效率,降低护理人员工作强度,赋能医院高效率运营与成本管理。

 

 智能语音助手——健康 

随着人们生活水平的日益提高,身体健康成了每个人生活质量的重要标准,合理的运动可以让处在繁忙工作的人保持一个健康的身体状态,运动工具类App也成了每一个追求健康用户的手机必装应用。运动中不方便将手机带在身上,语音助手的功能可以在运动App中帮助用户更加快捷地获得需要的运动信息,提高用户体验,增加用户粘性。

运动类专业名词和一些热点词汇往往是行业术语或者生造词,这类词语的识别率在基础模型识别率很难得到较高的准确率,也影响了助手的唤醒及使用效果。某上千万日活的运动App在使用百度语音自训练平台后将识别率从84.82%提高到98.21%,使App内的语音助手真的做到了灵活易用,能根据用户的语音内容查询对应的数据结果和知识文章,还能直接进行开始跑步、查看比赛等指令操作。优秀的语音助手大大提高了应用的留存率,日活也处于稳步上升阶段。

 

 语音采集——餐饮 

互联网行业的蓬勃发展,赋予了一群爱学习的年轻人更多的机会和能力。拥有多年开发经验的年轻烧烤店老板小李希望能给自己的烧烤店带来更多的科技感和AI化,在了解到百度大脑之后便想到了给自己的顾客增加语音点菜的功能,让客户点餐更快捷有趣有开心。

实践起来并不难,很快便调通接口开始测试,但由于点菜内容包括了菜品、口味、数量等信息,识别效果并不好。了解到百度有提高识别率的语音自训练平台,上传了音频并开始训练,最终将识别率从57.84%提高至91.18%,是语音点菜功能完美实现,目前客户完全自主通过语音下订单进行点菜。不少顾客都反馈自己点菜的过程流畅且充满了乐趣,小李通过自己的能力与百度AI技术相结合,为餐厅正确了一拨又一拨忠实的食客。

 

 智能语音助手——智能外设 

人工智能与传统行业的结合,要当数智能茶壶了。对于爱喝茶的人来说,没有什么比茶和茶具更重要的了,某科技公司开发了一款智能茶壶,希望给客户提供完整的智能交互服务,这里包括了语音识别、语音唤醒、语音合成、语音交互理解和自然语言处理。该公司希望可以通过语言对只能茶壶进行热水、查资料播报等功能。

由于茶叶名词的种类众多,常见的茶类虽然识别起来没有问题,但碰到一些少见的茶品如“复窨花香”“常山银毫”各厂商都无法准确识别,在百度语音自训练平台上经过训练后便将整体识别率从79.37%提高到98.41%。可以成功识别包含300种以上的功夫茶、原叶茶、花茶、果茶、西式茶品等,并对客户提出的问题通过语音交互能力和语音合成能力,直接播报对应的内容。

 

 语音采集——医疗门诊 

伴着经济的发展,人均寿命和高年龄段人群的慢性疾病发病率都在同步增长,而医疗资源却越来越紧张,合理分配医疗资源并服务好自主医疗人群是整个社会的刚需。某医疗机构则开放了通过电话、网站以及手机App等多渠道方式进行提前预约就诊,但部分老年人因为不会打字和眼花看不清屏幕,依旧无法解决这一问题,在接触百度AI开放平台后,便想到了通过在各个渠道增加语音识别来进行预约 。

开始测试时发现对于大夫名称和疾病名称都无法做到比较高效的识别效果,在和产品运营反馈沟通后开始测试语音自训练平台,在几次科学训练下,将模型识别率从79.87%提高到87.06%,将语音识别进行预约就诊成功落地,解决了老年人看病难看病麻烦的问题,通过AI技术解决社会焦点问题。

 

 语音采集——基建 

中国的基建能力在实际属于绝对领先地位,世界十大最难难度桥梁全部在中国,桥梁长度更是遥遥领先。桥梁需要定期检测并实时记录病害信息,一线作业人员在检测桥梁的同时还需要手工输入检测到的信息,不仅效率低下且一边作业一边记录的方式极大提高了危险性,语音输入检测信息成了桥梁软件开发公司的重点工作。

桥梁检测信息专业性强,超过90%的内容是专业术语的罗列,这就大大增加了语音输入的难度。某桥梁软件开发公司在经过百度语音自训练平台的几次迭代训练后,便将识别率从77.23%提高到99.3%,高识别率令语音输入桥梁检测的专业信息变得可能,从此作业人员可以专注于检测和安全,检测信息完全依靠语音输入,同时提高了检测作业人员的工作效率,为企业进一步降低成本。

百度语音自训练平台简介:https://ai.baidu.com/tech/smartasr

百度语音自训练平台文档说明:https://ai.baidu.com/docs#/SmartASR-intro/top

百度语音自训练平台视频教学:http://abcxueyuan.cloud.baidu.com/#/play_video?id=15006&courseId=15006&mediaId=mda-jgin7xynx757aveb&videoId=2690

收藏
点赞
0
个赞
共1453条回复 最后由192******42回复于2023-10
#30柯含year回复于2020-12

不错

0
#22wangwei8638回复于2020-12

用的什么数据库

0
#15富黄兹zdzzd缘回复于2020-11

不错

0
#12用户已被禁言回复于2020-10
该评论已删除

是的,完全解放了双手,效率的提升有目共睹。

0
#10wangwei8638回复于2020-10
#9 jango2015回复
降低了使用门槛,语音交互解放了双手,交互更简单

未来主流的交互方式

0
#9jango2015回复于2020-09

降低了使用门槛,语音交互解放了双手,交互更简单

0
#8Randcase回复于2020-08

方便

0
#7用户已被禁言回复于2020-08
#6 sslin3295回复
模块化,简单易用,

是的,而且效果还是非常明显的。

0
#6sslin3295回复于2020-08

模块化,简单易用,

0
#5wangwei8638回复于2020-07
#2 蓝兰兰111回复
语音交互解放了双手,交互更简单

降低了使用门槛

0
#4超级小马哥323回复于2019-12

111

0
#3用户已被禁言回复于2019-11
#2 蓝兰兰111回复
语音交互解放了双手,交互更简单

在这个场景上还提高了工作效率,在其他行业和领域也能将核心功能落地

0
#2蓝兰兰111回复于2019-11

语音交互解放了双手,交互更简单

0
TOP
切换版块