首页 版块 访问AI主站 注册 发帖
苗珥翎
7
积分 积分商城
19
获赞
原帖已删除
Ta的回复 :【应用案例】智能语音助力智能眼镜穿戴设备恢复活力 A.背景介绍、适用场景 背景介绍:目前我们看到的智能眼镜均是突出视觉类应用,随着VR、AR技术的市场反应热度减少,智能眼镜也渐渐淡出大众视野。但是不得否认该产品具有极大的商业价值,只是缺乏一个好的应用点去引爆它。 适用场景:借助智能语音为智能眼镜的应用开启新的应用市场。 B.需求分析 1、智能眼镜作为穿戴设备不同于人们目前最常用的手机,它的自身特点决定不能频繁的通过手控去使用,而智能语音则是一个很好的解决方案。 2、颠覆输入框,将麦克风矩阵作为智能体默认输入渠道。 3、借助优秀的语音交互实现语音与操作指令的实时翻译。 4、借助语音交互实现基于语音的新的应用,比喻云端合唱、直播互动。 5、目前手机上大火的应用,有些移植到只能眼镜能得到另一番体验,如明星演唱会、直播互动、直播带货,除了结合VR和AR提升用户体验外,发弹幕其实也能用语音。 6、甚至很多传统应用场景也能迁移优化,如翻译助手,不但可以实时翻译不同语种,还能将字母显示出来;再比如会议助手,可以辅助录音、为演讲者展示演讲提纲、根据演说内容自动翻页 7、智能眼镜除了根据语音指令给眼镜做眼保健操外,它还能监测用眼状况、检测眼镜健康、展示绿色自然画面舒缓眼部疲劳,化身护眼专家。 8、结合智能语音技术带来全新的互联网安全体系,传统互联网上即使实名认证的用户也很难保证是本人操作,但基于智能语音技术的智能眼镜则可以通过声纹认证实现可靠的身份认证。 C、运用范围 1、未来可能和手机同等地位普遍运用于各行各业、各类人群。 2、发展早期将首先运用于年轻群体、语言障碍群体(包括身体原因、外语不熟、不会打字等情况)。 3、发展早期可运用于商务会议、快递员外卖员、语言唱歌教学等等领域。 D、项目实现及方案 1、该项目工程庞大,发挥价值的大小直接与生态正相关,初期可建立基本框架,后期通过通过开发者开发语音应用来不断丰富生态。 2、采用多端分离、多企业协作开发的模式,硬件厂商专心研发硬件,智能语音提供商负责研发云服务平台和语音服务框架(包括自然语言处理),优秀的视觉厂商负责研发虚拟屏幕、VR、AR接入。 3、硬件上目前技术应该已经足够成熟,技术核心还是在服务平台和智能语音服务能力上。 4、智能语音核心服务目前在手机等传统智能设备应用已经取得市场认可,可基于该体系设计适用于智能眼镜的新的智能语音服务。 5、目前我能想到的主要有以下几点:一是基于声纹的统一身份认证体系;二是服务平台的治理体系,如用户隐私保护机制、应用接入管理规范;三是进一步提升语音服务的智能程度,如在嘈杂环境降噪问题、多人交谈的应答策略等等,后面想到再补充。 E、项目成果 建城一套基于智能语音的智能眼镜技术基座,解决目前部分人群在智能机时代难以消除的痛点,技术上仅依靠应用开发者就能迅速丰富生态。
0
原帖已删除
Ta的回复 :【应用案例】智能语音助力智能眼镜穿戴设备恢复活力 https://ai.baidu.com/forum/topic/show/990459
0
原帖已删除
Ta的回复 :AI+开发者=基于异体字的广告识别 百度AI能力 文本审核( https://ai.baidu.com/tech/textcensoring ) 语音识别( https://ai.baidu.com/tech/speech/asr ) 通用文字识别( https://ai.baidu.com/tech/ocr/general ) 案例 文本审核广泛应用于垃一圾邮件识别、垃·圾短信识别、论坛内容审核、视频弹幕审核等众多领域。有效识别色一情、暴一恐一涉一政、恶一意推广、辱一骂、违反广告一法、涉及违一禁一品等文本内容,推动网络文明建设。 优化建议 目前很多内容为了避开文本审核,引入异体字,比如用“踩票”替换“彩一票”,用“V信”替换“微信”,在不影响阅读的情况下又能避开文本审核。建议融合多项能力,增强文本审核效果,比如基于谐音的违禁词、基于近形的违禁词。一方面结合语音识别增加读音匹配,包括in和ing、L和N等读音的模糊处理;另一方面是结合文字识别,降低置信度增加外形相似异体字的识别率。通过以上手段可以极大提高基于异体字的广告识别率。 PS:如果我发出来了文本审核就有改进空间
0
切换版块
智能客服