揭秘百度AI开放平台 最全干货都在这
用户已被禁言 发布于2017-10 浏览:3150 回复:1
0
收藏

  “我的应用如何才能开口说话?”“初学者接入UNIT平台有技术上的要求吗?”“UNIT平台支持哪些场景?未来会扩展到哪里?”……在今年的AI开发者大会上,百度首次开放了面向第三方开发者的理解与交互技术平台UNIT,通过这个开放平台,开发者可以大幅降低对话系统研发门槛。UNIT平台也由此吸引了一批又一批开发者的期待与好奇。

  9月2日,百度技术沙龙“百度智能交互全流程技术方案解析”如期展开,旨在帮助开发者深入了解百度UNIT开放技术、语音能力,更加充分利用百度人工智能技术进行开发与上线。本次技术沙龙异常火爆,在开场前半小时已吸引近300人到场参加。一众“极客”表示,这绝对是一场干货满满、不可错过的技术沙龙。

2

  那么,在这4个小时内,百度的演讲嘉宾分享了什么“超级秘籍”?下面我们将从UNIT核心技术解析、远场语音识别方案、语音和语义理解应用实践、百度开放平台使用指南这四个维度为大家快速盘点百度智能交互全流程技术解析的重要内容。即使你没去现场,也能立刻马上get最全干货。

2

  应用实践 语音和语义理解应用案例

  本次沙龙,百度AI技术生态部高级运营顾问张扬通过视频展示了司机在开车过程中跟“小度”进行语音指令和语音交流,为开发者解析语音、语义理解的实际应用案例。视频中,“小度”通过司机的语音指令将其导航到清华大学西门,司机在途中还询问路线、堵车情况、预计到达时间,与小度进行多轮会话。

  此外,通过百度语音合成技术可合成有声小说,其语速用户可以进行调整,目前百度语音合成支持中文普通话播报、中英文混读播报,音色除了支持普通男声、女声,还有度丫丫和度逍遥。百度语音技术还可以被应用于不同场景中,比如《逍遥西游》将游戏场景中游戏玩家可以通过语音识别功能将语音转成文字,在不中断游戏操纵的情况下与队友保持沟通协作,提高了游戏的互动性。

2

  远场语音识别技术方案

  百度语音技术部架构师李超在一个演示中,视频中的演示者与智能音箱对话距离从近到远,一直到5米位置依旧很流畅。据介绍,百度现在的远场语音识别方案涵盖了前端信号处理和后端语音识别技术,李超着重介绍了远场语音识别中数据仿真、迁移学习、声学建模等关键技术,并分析了不同应用场景下声学特性及解决的方案。

  李超介绍,受限于设备通用性,现在暂时没有通用性模型提供给开发者,目前百度主要是提供2B的方案给予设备厂商,比如与音箱和车机厂商的合作。

2

  语言理解与交互技术UNIT

  百度理解与交互技术UNIT技术负责人孙珂带来了有关UNIT的整体框架与技术的分享,帮助大家更好地熟悉理解与交互技术,完成对话系统的研发。

  理解与交互技术UNIT,是建立在百度多年积累的自然语言处理与对话技术以及大数据的基础上,面向第三方开发者提供的对话系统开发平台,旨在能够降低开发者的产品研发门槛。

  对话系统的组成包括除了语音识别与语音合成之外,对话系统还包括语言理解、对话状态维护、动作候选排序、语言生成等层层递进、相互配合的NLP技术环节。

  据孙珂介绍,我厂的NLP技术有着十余年的深厚积累,UNIT将其中有关对话理解的技术整合开放,其目的是希望更多创业者与开发者在消耗更少的研发成本的基础上,打造更多的具有想象力和创造力的人工智能产品,并进一步的构建开放的技术生态,与开发者建立更长期的伙伴关系。

  在演讲中,孙珂介绍了UNIT在语言理解、多轮交互、定制化等方面的强大功能——基于多套理解引擎联合驱动的语言理解、功能强大且能够智能生成的多轮交互能力、基于百度大数据的数据推荐功能……

2

  百度开放平台的基础介绍与使用指南

  最后,百度AI平台部高级产品经理吴延宇介绍了百度AI开放平台如何提供各项人工智能服务,如何在这里找到所需的AI能力,并且介绍如何进行快速调用并与项目进行集成。目前,百度AI开放平台所有服务都具备服务端的SDK,在客户端上支持iOS、安卓、Windows、Linux等操作系统,每个接口的代码文档都可以在平台中找到。

2

  值得一提的是,百度AI每周都会有新产品上线,所以如果随时关注百度AI开放平台的官网和官方微信,就可以第一时间获得一手资讯。

收藏
点赞
0
个赞
共1条回复 最后由用户已被禁言回复于2017-11
#2用户已被禁言回复于2017-11

百度AI开放平台所有服务几乎都具备服务端的SDK,在客户端上支持iOS、安卓、Windows、Linux等操作系统,每个接口的代码文档都可以在平台中找到。

0
TOP
切换版块