视频行业老铁们，是时候展示你们的AI技能啦！

首页版块访问AI主站注册发帖

笔墨哥发布于2018-04 浏览:3210 回复:10

视频行业老铁们，是时候展示你们的AI技能啦！

快速回复

有多少个加班夜晚，让你审核黄反、暴恐等不良信息熬白了头？

有没有什么神操作可以分分钟给视频配上音？加上实时字幕？

不同于纯文字的内容筛查，视频、直播中包含着大量图像、声音等信息，这会消耗很多机器、人工成本。随着内容消费升级，内容生产越发猛烈，内容制作和筛查成本也越来越高。

快来看看视频老铁们是如何利用 AI 能力，特别是语音技术，告别扎心时刻的！

不扎心配方：

百度提供了完整的语音技术、自然语言处理、图像技术、文字识别等多项 AI 技术，人工智能将为视频、直播行业在内容审核、视频配音、实时字幕配置、内容搜索等方面提供神助攻，降低企业人工成本，加速视频、直播行业的规模、规范化发展。

【场景一】视频/直播内容审核——语音识别

痛点：视频、直播平台方逐步加强内容审核、把控，纯粹利用人工审核，成本过高。

解决方案：

（1）音频质检——调用百度语音识别，将原始音频转写为文字，再结合自然语言处理技术对内容进行质检。

（2）图像质检——抽取视频中某些画面帧，调用百度图像审核技术，对抽取的图像画面进行审核。

效果/收益：有效降低视频审核的成本。

【场景二】视频配音——语音合成

痛点：制作视频内容时，人工录制声音成本较高。

解决方案：

调用百度语音合成技术，将文字转化为流畅自然的语音，与文字、图像等内容整合后形成完整视频。支持普通男声、普通女声、度逍遥、度丫丫四种不同发音人，语调、语速可调。

效果/收益：降低因文字变化而重新录制音频的成本。

https://vd3.bdstatic.com/mda-idag1xehxwgg9sh8/mda-idag1xehxwgg9sh8.mp4

【场景三】实时字幕配置——语音识别

痛点：直播、视频、会议场景，通过增加实时字幕，可使内容更清晰地传达给用户。

解决方案：

调用百度语音识别技术，实时将语音内容转化为文字，显示到屏幕上展示给用户。支持中文、英文、四川话和粤语。

效果/收益：实时匹配字幕，内容传达更清晰。

【场景四】视频内容搜索——语音识别

痛点：传统文字搜索用户输入成本高，手机场景下语音输入更高效。

解决方案：

调用百度语音识别技术，精准识别用户语音转化为文字，根据识别文字结果进行视频内容搜索。

效果/收益：提高用户搜索效率和操作体验。对于视力障碍用户（老年人、视力障碍者），语音搜索更友好、方便。使用场景可覆盖智能电视、智能投影等多种智能硬件。

视频、直播场景持续优化中，还有更多视频场景应用等你一起开脑洞~~

这么多语音技术的应用，

收费吗？NO！

先进吗？Yes！

稳定吗？Yes！

敲黑板！！！基础服务全部免费！

语音识别、合成、唤醒技术服务，零成本、无门槛使用。

语音识别准确率高，近期更新搜索模型、英文模型，效果业内领先。

语音合成技术，多音色中英文可选，语速、音调随意调。

唤醒词预设+自定义，实现个性化设置。

多平台多方式接入，提供 API 及多种语言 SDK，demo 级别代码，可在1小时内迅速接入。

内容来源：百度AI

其他

个赞

共10条回复最后由用户已被禁言回复于2022-04

#11卡农LLLL回复于2019-05

对#10 用户已被禁言回复

Linux c++ 你可以试试

android sdk就可以啊.

#10用户已被禁言回复于2019-05

对#5 chewanjia168回复

请问我想要实现视频中的语音识别成字幕，是使用rest api吗？实时性如何保证？文字结果返回的时间能保证多少毫秒以内？返回的文字有没有加时间戳？

展开

Linux c++ 你可以试试

#9果断叫小黑回复于2019-05

对#5 chewanjia168回复

请问我想要实现视频中的语音识别成字幕，是使用rest api吗？实时性如何保证？文字结果返回的时间能保证多少毫秒以内？返回的文字有没有加时间戳？

展开

速度还挺快的。不过他是一段话一段话识别的。你这个需求恐怕有点难。

#8果断叫小黑回复于2019-05

对#6 阿萨德去23123回复

我们老板说了,为什么百度语音的发音人没有小姐姐型的

普通女声和度丫丫吧。。调整语速和语调吧。。

#7wangwei8638回复于2019-05

功能强大吖

#6阿萨德去23123回复于2018-10

我们老板说了,为什么百度语音的发音人没有小姐姐型的

#5chewanjia168回复于2018-10

请问我想要实现视频中的语音识别成字幕，是使用rest api吗？实时性如何保证？文字结果返回的时间能保证多少毫秒以内？返回的文字有没有加时间戳？

#4zhangyi0829回复于2018-05

的确用处很大，适应性相当强

#3酩酊醉酉回复于2018-05

看起来很厉害的样子，不过有点没看懂

#2用户已被禁言回复于2018-04

厉害了

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

用户已被禁言 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服