问:百度在线语音支持视位吗?
就是识别一段wav文件,然后输出视位信息;
视位就是对应说话的口型,如a w l t等口型,
因为我在sapi看到有相关的支持,如下:
CSpEvent event;
while (event.GetFrom(m_cpVoice) == S_OK)
{
switch (event.eEventId)
{
case SPEI_VISEME:
}
}
问百度语音有这相关信息吗?如果没有如何通过识别结果获取到这些信息,谢谢。
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块
要不然时间轴也可以啊?就是输入文本,输出有哪个时间点播放哪个字吗?
等了两年了,现在有这样接口吗?
你们我的SDK 支持原始的PCM格式的文件识别,你上面说的那些视位信息,暂时也没有相关的接口支持。
怎样才有人回复啊?晕倒,不知道哪里咨询好?
官方怎么没有人回复下啊?是不是免费就是这样啊?
如果没有带上面所说的视位信息,那么输出的识别汉字有带时间轴信息吗?就是到哪个时间点上,识别哪个汉字?