视频行业老铁们,是时候展示你们的AI技能啦!
笔墨哥 发布于2018-04 浏览:2605 回复:10
2
收藏

有多少个加班夜晚,让你审核黄反、暴恐等不良信息熬白了头?

有没有什么神操作可以分分钟给视频配上音?加上实时字幕?

不同于纯文字的内容筛查,视频、直播中包含着大量图像、声音等信息,这会消耗很多机器、人工成本。随着内容消费升级,内容生产越发猛烈,内容制作和筛查成本也越来越高。

快来看看视频老铁们是如何利用 AI 能力,特别是语音技术,告别扎心时刻的!


不扎心配方:

百度提供了完整的语音技术、自然语言处理、图像技术、文字识别等多项 AI 技术,人工智能将为视频、直播行业在内容审核、视频配音、实时字幕配置、内容搜索等方面提供神助攻,降低企业人工成本,加速视频、直播行业的规模、规范化发展。

【场景一】视频/直播内容审核——语音识别

痛点:视频、直播平台方逐步加强内容审核、把控,纯粹利用人工审核,成本过高。

解决方案:

(1)音频质检——调用百度语音识别,将原始音频转写为文字,再结合自然语言处理技术对内容进行质检。

(2)图像质检——抽取视频中某些画面帧,调用百度图像审核技术,对抽取的图像画面进行审核。

效果/收益:有效降低视频审核的成本。


【场景二】视频配音——语音合成

痛点:制作视频内容时,人工录制声音成本较高。

解决方案:

调用百度语音合成技术,将文字转化为流畅自然的语音,与文字、图像等内容整合后形成完整视频。支持普通男声、普通女声、度逍遥、度丫丫四种不同发音人,语调、语速可调。

效果/收益:降低因文字变化而重新录制音频的成本。

https://vd3.bdstatic.com/mda-idag1xehxwgg9sh8/mda-idag1xehxwgg9sh8.mp4


【场景三】实时字幕配置——语音识别

痛点:直播、视频、会议场景,通过增加实时字幕,可使内容更清晰地传达给用户。

解决方案:

调用百度语音识别技术,实时将语音内容转化为文字,显示到屏幕上展示给用户。支持中文、英文、四川话和粤语。

效果/收益:实时匹配字幕,内容传达更清晰。

【场景四】视频内容搜索——语音识别

痛点:传统文字搜索用户输入成本高,手机场景下语音输入更高效。

解决方案:

调用百度语音识别技术,精准识别用户语音转化为文字,根据识别文字结果进行视频内容搜索。

效果/收益:提高用户搜索效率和操作体验。对于视力障碍用户(老年人、视力障碍者),语音搜索更友好、方便。使用场景可覆盖智能电视、智能投影等多种智能硬件。


视频、直播场景持续优化中,还有更多视频场景应用等你一起开脑洞~~

这么多语音技术的应用,

收费吗?NO!

先进吗?Yes!

稳定吗?Yes!

敲黑板!!!基础服务全部免费!

语音识别、合成、唤醒技术服务,零成本、无门槛使用。

语音识别准确率高,近期更新搜索模型、英文模型,效果业内领先。

语音合成技术,多音色中英文可选,语速、音调随意调。

唤醒词预设+自定义,实现个性化设置。

多平台多方式接入,提供 API 及多种语言 SDK,demo 级别代码,可在1小时内迅速接入。

 

内容来源:百度AI

收藏
点赞
2
个赞
共10条回复 最后由用户已被禁言回复于2022-04
#11卡农LLLL回复于2019-05
#10 用户已被禁言回复
Linux c++ 你可以试试

android sdk就可以啊.

0
#10用户已被禁言回复于2019-05
#5 chewanjia168回复
请问我想要实现视频中的语音识别成字幕,是使用rest api吗?实时性如何保证?文字结果返回的时间能保证多少毫秒以内?返回的文字有没有加时间戳?
展开

Linux c++ 你可以试试

0
#9果断叫小黑回复于2019-05
#5 chewanjia168回复
请问我想要实现视频中的语音识别成字幕,是使用rest api吗?实时性如何保证?文字结果返回的时间能保证多少毫秒以内?返回的文字有没有加时间戳?
展开

速度还挺快的。不过他是一段话一段话识别的。你这个需求恐怕有点难。

0
#8果断叫小黑回复于2019-05
#6 阿萨德去23123回复
我们老板说了,为什么百度语音的发音人没有小姐姐型的

普通女声和度丫丫吧。。调整语速和语调吧。。

0
#7wangwei8638回复于2019-05

功能强大吖

0
#6阿萨德去23123回复于2018-10

我们老板说了,为什么百度语音的发音人没有小姐姐型的

0
#5chewanjia168回复于2018-10

请问我想要实现视频中的语音识别成字幕,是使用rest api吗?实时性如何保证?文字结果返回的时间能保证多少毫秒以内?返回的文字有没有加时间戳?

0
#4zhangyi0829回复于2018-05

的确用处很大,适应性相当强

0
#3酩酊醉酉回复于2018-05

看起来很厉害的样子,不过有点没看懂

0
#2用户已被禁言回复于2018-04

厉害了

0
TOP
切换版块