首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
PaddlePaddle工程师详解热门视觉模型
使机器“看”的科学,更进一步的说,是使用摄像机机和脑代替人眼对目标进行识别、跟踪和测量等的机器视觉,并通过脑处理成为更适合人眼观察或传送...
AAC文件转为PCM文件,转文字,报错-3005
"); #pragma mark -- 语音转文字,放入转换后的音频pcm文件       [self transformVoiceToString...
中英文OCR结构化StrucTexT预训练模型
光学字符识别(OCR)是目前应用最为广泛的视觉AI技术之一。随着OCR技术在产业应用的快速发展,现实场景对OCR提出新的需求:从感知走向...
离线下载listener一直失败
我使用的服务是:Android语音合成 开发平台和机型:Android Nexus5 SDK版本号:2.3.0 复现步骤、现象及其他描述...
【恭喜没有检测到任何问题】后授权失败
返回的JSON里面的确有audio_voice_assistant_get,表示具有语音识别功能 请问有任何解决思路吗? ...
ios 离线合成配置问题
我使用的服务是:  百度语音合成 ios 离在线合成版 调用的接口是: [[BDSSpeechSynthesizer...
视频智能生产及内容分析应用工具开源了!​
:视频的标题、字幕、画面、语音等信息中蕴含了丰富的视频信息,如何利用多维信息,提升模型高层次语义理解能力仍有很大难度。2、计算资源消耗:视频...
卷积神经网络表征可视化研究综述(4)
依靠网络的权重与激活值, 而非特征图和通道等图像领域的概念. 因此, 它不仅适应于图像识别任务的解释, 还可以用于可视化机器翻译、语音...
第三课-深度学习模型训练和关键参数调优
、图像分割、文本生成、语音合成、强化学习等。 人像分割 文字识别 二、模型训练 1.基于高层API训练模型 2.使用PaddleX训练模型 3....
人民日报关注人脸识别:警惕滥用带来的隐患和危害
人信息都将暴露。 “更关键的是,人脸识别的滥用,将容易形成‘我还是我吗?’的困境。”薛军说,依托被抓取的人脸信息和AI换脸技术,敲诈勒索、...
引擎初始化tts接口出现异常
我使用的服务是:语音合成 调用的接口是: mSpeechSynthesizer.initTts(TtsMode.MIX); 参数设置情况...
唤醒错误:11;错误消息:未知错误:11; 原始返回{"error":11,"desc":"Wakeup engine has no license","sub_error":11002}
我使用的服务是:语音唤醒 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题...
Android SDK采用流的方式无法识别写过来的pcm数据
我使用的服务是:语音识别服务 调用的接口是: asr.send(SpeechConstant.ASR_START, json, null...
卷积神经网络表征可视化研究综述(4)
依靠网络的权重与激活值, 而非特征图和通道等图像领域的概念. 因此, 它不仅适应于图像识别任务的解释, 还可以用于可视化机器翻译、语音...
开源展现百度之气度
凭借着在语音技术、图像技术、视频技术、深度学习等人工智能领域的核心底层技术实力,百度倾力打造了阿波罗、DuerOS等核心人工智能平台...
7月26日第一课回顾总结
应用程序,树莓派,服务器,小程序,app用项目记录进度Parakeet:有意思的语音合成项目PGL:门槛较高又热门的神经网络EasyEdge:潜力强大的全流程部署平台...
百度飞桨第一课|让人拍案叫绝的创意都是如何诞生的?
,服务器,小程序/app… 深度学习训练过程: 一个想法 大胆尝试 用项目记录进度 小众模型库: Parakeet:有意思的语音合成项目...
Transfer Learning核心技术开发
语音识别、图像处理、小样本分析等领域相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生等相关人员,以及深度迁移学习广大爱好者。 ...
Transfer Learning 核心技术研修
、自治区从事人工智能、机器学习、深度学习、迁移学习、计算机视觉、自然语言处理、语音识别、图像处理、小样本分析等领域相关的企事业单位技术骨干...
【资讯】深度学习技术行话合辑
的过程。P (Programming) 是指为产生某种后果而要执行的一套具体指令。即指我们思维上及行为上的习惯,就如同脑中的程序,可以透过...
切换版块
智能客服