语音识别LinuxSDK(C++)正式发布
卖萌吗sky 发布于2018-01 浏览:23009 回复:60
5
收藏
最后编辑于2023-10

尊敬的百度AI开放平台用户:

百度AI开放平台LinuxSDK(C++)正式发布啦!

百度AI开放平台LinuxSDK(C++)正式发布啦!

百度AI开放平台LinuxSDK(C++)正式发布啦!

为解决服务端调用实时语音识别和长语音识别能力,百度AI开放平台,开放了LinuxSDK(C++)。大家可以在服务端使用和安卓、iOSSDK一样的在线识别功能了。

【技术特色】

支持语言:中文、英文、粤语、四川话
支持实时长语音识别,识别时间不设上限
支持流式:边说边传,返回临时结构和最终接口
支持输出识别任务起始时间戳 ,可应用于视频转字幕功能
支持多实例,多任务无压力
基于DNN的高性能端点检测技术,节约带宽而且有更好的识别效果
支持64位linux系统
【如何使用】

文档地址:http://ai.baidu.com/docs#/ASR-Android-SDK/top

SDK下载地址:http://ai.baidu.com/sdk

本月内,还会有更多的语音技术升级,敬请持续关注!

语音识别产品详细介绍:http://ai.baidu.com/tech/speech

语音技术社区交流平台:http://ai.baidu.com/forum/topic/list/166

收藏
点赞
5
个赞
共60条回复 最后由192******42回复于2023-10
D
#42djcardcn回复于2018-05
#41 黯然销魂贴回复
问题解决了吗?,我感觉应该是获取linux实时语音流,而不是处理文件,但是如何获取实时语音流是我现在要解决的问题
展开

你好,我也在想要处理这个问题,请问你解决了么?

0
#41黯然销魂贴回复于2018-04
#32 _TroyBarlow回复
支持流式:边说边传,返回临时结构和最终接口; 这个是怎样实现?demo中只是一个录制好的文件,如果想实现流式应该怎样实现音频文件的实时上传
展开

问题解决了吗?,我感觉应该是获取linux实时语音流,而不是处理文件,但是如何获取实时语音流是我现在要解决的问题

0
#40fujiayi1984回复于2018-04
#39 wxc200回复
居然还有一堆的编译问题, 百度的工程师不自己先搞一遍的吗?

肯定都先测试过再放出的,使用常见的linux x64测试下

0
#39wxc200回复于2018-04

居然还有一堆的编译问题, 百度的工程师不自己先搞一遍的吗?

0
#38goJhou回复于2018-03
#37 踏岸寻柳回复
不错,支持一个

请遵守社区规章制度,如果觉得帖子很赞,请点一下文章右上角或右下角的心形,无需回复

0
#37踏岸寻柳回复于2018-03

不错,支持一个

0
#36张飞项目回复于2018-03

同问,是否有支持ARM平台的意愿?

0
#35fujiayi1984回复于2018-03
#33 ypchenn327回复
按照文档说明,使用sample的demo,未改动任何代码。 ## 运行 sample目录下有两个实例工程 sample/asr 运行 sh build_and_run.sh build成功。运行出错 。。。 [2018-03-21 11:40:44.041]push_audio data, size 320 [2018-03-21 11:40:44.051]push_audio data, size 320 [2018-03-21 11:40:44.061]push_audio finish 其它状态16 [2018-03-21 11:40:44.062]检测到说话结束 [2018-03-21 11:40:49.939]识别出错, err_code: -3011, err_domain: 33,                 err_desc: Server unkown error., sn: 41FE2C27-D3EE-4BE8-98A9-1675E9275D62 [2018-03-21 11:40:49.946]thread[0] finish   环境在公司内服务器上,通过http代理可以访问外网,wget能成功。
展开

linux SDK没设置http代码的参数

0
#34风搅火回复于2018-03
#20 fujiayi1984回复
看下文档,x64的

可以下载使用这种语音识别吗

0
#33ypchenn327回复于2018-03

按照文档说明,使用sample的demo,未改动任何代码。


## 运行

sample目录下有两个实例工程

sample/asr 运行 sh build_and_run.sh

build成功。运行出错


。。。

[2018-03-21 11:40:44.041]push_audio data, size 320

[2018-03-21 11:40:44.051]push_audio data, size 320

[2018-03-21 11:40:44.061]push_audio finish

其它状态16

[2018-03-21 11:40:44.062]检测到说话结束

[2018-03-21 11:40:49.939]识别出错, err_code: -3011, err_domain: 33,                 err_desc: Server unkown error., sn: 41FE2C27-D3EE-4BE8-98A9-1675E9275D62

[2018-03-21 11:40:49.946]thread[0] finish

 


环境在公司内服务器上,通过http代理可以访问外网,wget能成功。

0
#32_TroyBarlow回复于2018-03

支持流式:边说边传,返回临时结构和最终接口;

这个是怎样实现?demo中只是一个录制好的文件,如果想实现流式应该怎样实现音频文件的实时上传

0
#31fujiayi1984回复于2018-03
#30 Davy4fg回复
有没有计划同时支持32位linux系统?

近期没有

0
#30Davy4fg回复于2018-03

有没有计划同时支持32位linux系统?

0
#28fujiayi1984回复于2018-02
#26 MyWisest回复
是不是不支持debain 9啊? root@VM-0-16-debian:~/output# g++ --version g++ (Debian 6.3.0-18+deb9u1) 6.3.0 20170516 Copyright (C) 2016 Free Software Foundation, Inc. This is free software; see the source for copying conditions. There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
展开

debain 9 应该没问题的,请尝试编译运行下

0
#27MyWisest回复于2018-02
#25 daizuhua888回复
libBDSpeechSDK.a不提供源码吗?这个都是和百度云端交互的代码,有保密的必要吗? 如果百度希望自己的语音识别平台能得到大家的认可,这些代码应该全部对外开放,而不是遮遮掩掩。 我们又不需要你语音识别算法的代码,只是语音交互的源代码而已。 相比百度,亚马逊可是全部公开的。
展开

可以选择使用亚马逊的。

 

0
#26MyWisest回复于2018-02

是不是不支持debain 9啊?

root@VM-0-16-debian:~/output# g++ --version
g++ (Debian 6.3.0-18+deb9u1) 6.3.0 20170516
Copyright (C) 2016 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

0
#25daizuhua888回复于2018-02

libBDSpeechSDK.a不提供源码吗?这个都是和百度云端交互的代码,有保密的必要吗?

如果百度希望自己的语音识别平台能得到大家的认可,这些代码应该全部对外开放,而不是遮遮掩掩。

我们又不需要你语音识别算法的代码,只是语音交互的源代码而已。

相比百度,亚马逊可是全部公开的。

0
#24wackyking回复于2018-02

大神 看不懂你们在说什么

我就想问下我下载完这个东西了怎么使用?是PC端还是手机,支持会议录音转文字吗?

0
#23fujiayi1984回复于2018-02
#21 redleaf3000回复
undefined symbol: _ZNSt8__detail15_List_node_base7_M_hookEPS0_**  cc --version gcc (GCC) 4.4.7 20120313 (Red Hat 4.4.7-18) Copyright (C) 2010 Free Software Foundation, Inc. centos 6.9 64位 看看怎么链接。
展开

升级到g++ 4.8以上

0
#22redleaf3000回复于2018-02

[root@svpbx asr]# ./build_and_run.sh
g++ -o src/main ./src/main.cpp -I../../include -I../../include/ASR -Wall -O0 -fPIC -g -D__LINUX__ -Wno-unknown-pragmas ../../lib/libBDSpeechSDK.a ../../extern/lib/libcurl.a ../../extern/lib/libiconv.a ../../extern/lib/libz.a ../../extern/lib/libssl.a ../../extern/lib/libcrypto.a ../../extern/lib/libuuid.a -lrt -ldl -lpthread
../../lib/libBDSpeechSDK.a(bds_Timer.cpp.obj): In function `insert':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/list.tcc:102: undefined reference to `std::__detail::_List_node_base::_M_hook(std::__detail::_List_node_base*)'
../../lib/libBDSpeechSDK.a(bds_Timer.cpp.obj): In function `_M_insert':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1554: undefined reference to `std::__detail::_List_node_base::_M_hook(std::__detail::_List_node_base*)'
../../lib/libBDSpeechSDK.a(bds_Timer.cpp.obj): In function `_M_erase':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1570: undefined reference to `std::__detail::_List_node_base::_M_unhook()'
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1570: undefined reference to `std::__detail::_List_node_base::_M_unhook()'
../../lib/libBDSpeechSDK.a(bds_Timer.cpp.obj): In function `insert':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/list.tcc:102: undefined reference to `std::__detail::_List_node_base::_M_hook(std::__detail::_List_node_base*)'
../../lib/libBDSpeechSDK.a(bds_Timer.cpp.obj): In function `_M_insert':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1554: undefined reference to `std::__detail::_List_node_base::_M_hook(std::__detail::_List_node_base*)'
../../lib/libBDSpeechSDK.a(bds_Timer.cpp.obj): In function `_M_erase':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1570: undefined reference to `std::__detail::_List_node_base::_M_unhook()'
../../lib/libBDSpeechSDK.a(bds_Timer_refresh.cpp.obj): In function `insert':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/list.tcc:102: undefined reference to `std::__detail::_List_node_base::_M_hook(std::__detail::_List_node_base*)'
../../lib/libBDSpeechSDK.a(bds_Timer_refresh.cpp.obj): In function `_M_insert':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1554: undefined reference to `std::__detail::_List_node_base::_M_hook(std::__detail::_List_node_base*)'
../../lib/libBDSpeechSDK.a(bds_Timer_refresh.cpp.obj): In function `_M_erase':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1570: undefined reference to `std::__detail::_List_node_base::_M_unhook()'
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1570: undefined reference to `std::__detail::_List_node_base::_M_unhook()'
../../lib/libBDSpeechSDK.a(bds_EventManagerAsr.cpp.obj): In function `_M_insert':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1554: undefined reference to `std::__detail::_List_node_base::_M_hook(std::__detail::_List_node_base*)'
../../lib/libBDSpeechSDK.a(bds_EventManagerAsr.cpp.obj): In function `erase':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1570: undefined reference to `std::__detail::_List_node_base::_M_unhook()'
../../lib/libBDSpeechSDK.a(bds_EMOfflineEngineBase.cpp.obj): In function `bds_push_rohdise_clnt(void*)':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1554: undefined reference to `std::__detail::_List_node_base::_M_hook(std::__detail::_List_node_base*)'
../../lib/libBDSpeechSDK.a(bds_EMOfflineEngineBase.cpp.obj): In function `_M_erase':
/home/opt/gcc-4.8.2.bpkg-r4/gcc-4.8.2.bpkg-r4/include/c++/4.8.2/bits/stl_list.h:1570: undefined reference to `std::__detail::_List_node_base::_M_unhook()'

0
TOP
切换版块