我最亲爱的妈妈,该做晚饭了
我最亲爱的妈妈,我晚饭想吃饺子
我最亲爱的妈妈,饺子里不要香菜
我最亲爱的妈妈….
用过语音助手的你一定有过这样的体验,感觉每次跟机器对话的节奏都特别卡顿,因为每抛出一个问题都要喊一遍它的名字,也就是“唤醒词”。有时候“聊”的正开心呢,却发现手机或者音箱根本没有在听你说话。不少用户都对类似的状况印象深刻。
________________我是分割线___________________
更“自然”的人机交互方式
那么有没有更“聪明”的人机交互方式呢,请看百度董事长兼CEO李彦宏为大家打个样:
视频地址:https://v.qq.com/iframe/preview.html?vid=q0505hqxe7q&
正如李彦宏在百度世界大会上说的:“日常生活当中人和人进行交流的时候,不会拉着手才能说话,也不会每说一句话都叫一次对方的名字。”
不难想见,去掉唤醒词之后的人机交流体验会自然得多。
________________我是分割线___________________
免唤醒词语音交互
如视频所见,一旦进入语音交互环节,手机就不再需要“唤醒词”,也就是说,手机一直“醒着”,听你说话。
百度AI免唤醒词语音交互技术,具体来说是“tts播报场景下的全双工语音交互技术”会不间断地聆听用户的语音输入信号,并进行语音识别,在此步骤中利用VAD技术判断当前语音输入是否结束,关键点为聆听和识别并发进行,且聆听不会停止,防止遗漏用户的语音请求。
________________我是分割线___________________
听清你,听懂你
所谓“听话要听音”,收听语音指令就需要具备两个硬本领,一是“听清”、一是“听懂”。
日常使用语音助手的时候难免会遇到嘈杂的环境音干扰,比如视频中的食堂就餐就是一个经典场景。本套系统利用回声抵消技术去除智能设备本身输出的声音,利用噪声抑制技术来减少环境噪声影响。做到“听清”用户说话的基本要求。
一方面不能太“灵敏”,一有“风吹草动”就被干扰、做出动作;另一方面,又不能太“迟钝”,需要听清主人说的很多句话里到底哪句话才是“指令”。
后端服务对语音识别出来的内容进行语义分析,并根据智能设备当前上下文信息进行意图分析,判断是否为有效的语言交互数据。
同时根据上线设备当前状态和上下文信息,利用用户输入的语音信息,利用声纹等技术判断当前语音输入信号是否为有效输入。
________________我是分割线___________________
李彦宏同款语音交互?
手机百度抢先体验
这么聪明的语音交互技术,还不赶紧上线?!想问哪里可以get到李彦宏同款的,其实视频中已经露出了一些线索……
没错,无需唤醒词的语音交互已经可以在手机百度(语音版)App体验到啦!
在这里,你可以无间断地发出语音指令,比如“下一条”;
“大一点声”,调大语音播报的音量;
“介绍一下XXX”,用更自然的语言交流,获取更多信息:
——————————————————
抛开唤醒词的束缚,更自然地与机器进行对话,让“冷冰冰”的语音助手像真人一样聆听你、理解你,让我们共同创造一个更加智能、更加懂你的未来世界!
“当你的眼睛需要看别的地方,当你的手需要做别的事情的时候,你仍然可以自然地和机器、和手机、和各种各样的设备进行自然语言的对话,这是AI带给大家的方便。”
手机百度语音版下载链接:https://mo.baidu.com/mo/yuyinhome
本文来自百度AI,因社区限制,小幅删除部分内容。
我用的百度语音唤醒..反正音乐声音大了肯定死.
不会有影响吧 我试过呀。哈哈
用耳机的时候唤醒很爽。但是麦克风和播放在一起的话。就尴尬了
嗯 但是有个问题就是一定要带耳机 不然那个录音不会一直在跑。。。
最近还在搞这套.下周估计要出成果了.
嗯,这样很不错呢
所以现在百度也控制唤醒词最多十个..不过常用的算是够了.
嗯,确实是这样
昨晚就体验过了吧。。。
多唤醒词...嘿嘿..不过唤醒词越多.误唤醒越多啊.
不错不错 嘿嘿~