我最亲爱的妈妈,该做晚饭了
我最亲爱的妈妈,我晚饭想吃饺子
我最亲爱的妈妈,饺子里不要香菜
我最亲爱的妈妈….
用过语音助手的你一定有过这样的体验,感觉每次跟机器对话的节奏都特别卡顿,因为每抛出一个问题都要喊一遍它的名字,也就是“唤醒词”。有时候“聊”的正开心呢,却发现手机或者音箱根本没有在听你说话。不少用户都对类似的状况印象深刻。
________________我是分割线___________________
更“自然”的人机交互方式
那么有没有更“聪明”的人机交互方式呢,请看百度董事长兼CEO李彦宏为大家打个样:
视频地址:https://v.qq.com/iframe/preview.html?vid=q0505hqxe7q&
正如李彦宏在百度世界大会上说的:“日常生活当中人和人进行交流的时候,不会拉着手才能说话,也不会每说一句话都叫一次对方的名字。”
不难想见,去掉唤醒词之后的人机交流体验会自然得多。
________________我是分割线___________________
免唤醒词语音交互
如视频所见,一旦进入语音交互环节,手机就不再需要“唤醒词”,也就是说,手机一直“醒着”,听你说话。
百度AI免唤醒词语音交互技术,具体来说是“tts播报场景下的全双工语音交互技术”会不间断地聆听用户的语音输入信号,并进行语音识别,在此步骤中利用VAD技术判断当前语音输入是否结束,关键点为聆听和识别并发进行,且聆听不会停止,防止遗漏用户的语音请求。
________________我是分割线___________________
听清你,听懂你
所谓“听话要听音”,收听语音指令就需要具备两个硬本领,一是“听清”、一是“听懂”。
日常使用语音助手的时候难免会遇到嘈杂的环境音干扰,比如视频中的食堂就餐就是一个经典场景。本套系统利用回声抵消技术去除智能设备本身输出的声音,利用噪声抑制技术来减少环境噪声影响。做到“听清”用户说话的基本要求。
一方面不能太“灵敏”,一有“风吹草动”就被干扰、做出动作;另一方面,又不能太“迟钝”,需要听清主人说的很多句话里到底哪句话才是“指令”。
后端服务对语音识别出来的内容进行语义分析,并根据智能设备当前上下文信息进行意图分析,判断是否为有效的语言交互数据。
同时根据上线设备当前状态和上下文信息,利用用户输入的语音信息,利用声纹等技术判断当前语音输入信号是否为有效输入。
________________我是分割线___________________
李彦宏同款语音交互?
手机百度抢先体验
这么聪明的语音交互技术,还不赶紧上线?!想问哪里可以get到李彦宏同款的,其实视频中已经露出了一些线索……
没错,无需唤醒词的语音交互已经可以在手机百度(语音版)App体验到啦!
在这里,你可以无间断地发出语音指令,比如“下一条”;
“大一点声”,调大语音播报的音量;
“介绍一下XXX”,用更自然的语言交流,获取更多信息:
——————————————————
抛开唤醒词的束缚,更自然地与机器进行对话,让“冷冰冰”的语音助手像真人一样聆听你、理解你,让我们共同创造一个更加智能、更加懂你的未来世界!
“当你的眼睛需要看别的地方,当你的手需要做别的事情的时候,你仍然可以自然地和机器、和手机、和各种各样的设备进行自然语言的对话,这是AI带给大家的方便。”
手机百度语音版下载链接:https://mo.baidu.com/mo/yuyinhome
本文来自百度AI,因社区限制,小幅删除部分内容。
这个你都去参加了?不愧是面向未来的开发者呀~
风能 风能 还有什么 hhh
上海上次一个新能源展会。石墨烯 还有新能源充电桩 以及工厂新能源循环
电池硬伤啊...下一代电池出现之前.电子产品还不会有很大的飞跃吧
这这这。。光伏发电怎么样。。风能呢。。
就是费电...不环保.
还谈不上浏览。。。改变世界吧。。
打开APP就算是 唤醒了,只不过以前需要喊一声,现在是手动,不过一直处于聆听状态体验还是很好的
我还没出过省呢.嘿嘿.程序猿就在电脑前浏览世界.
哇。。吃遍天南海北火锅后的吃后感么
成都的火锅就是麻.花椒多.重庆的火锅就是辣.辣椒多.
其他地方的都不叫火锅.
哈哈,成都的火锅有什么区别么
最终你们都被duerOS温暖了。。。然后对duerOS越来越爱
热度不减.持续升温.
快来吃火锅儿.安逸.
哈哈,好地方很多呀。迷失都去过哪里啦?
成都是一个好地方。有机会去看看。哈哈
我也很关注百度AI产品线滴
哈哈,怕你们冻到。。多贴心的duerOS
哟...这你都知道..老司机啊.