产业智能化提速,5G元年,顶尖科技企业、创新力量的技术更迭代与应用推进,正在将全球AI市场引入新阶段。9月6日,由国内知名IT社区CSDN主办的2019 AI开发者大会(AI ProCon)主论坛上,百度深度学习技术平台部总监马艳军以《飞桨大规模分布式训练和高速推理引擎》为题分享了百度深度学习平台飞桨(PaddlePaddle)的最新技术进展及应用实践。日渐成熟的的开源深度学习平台,已为应用普及打好了坚实地基。
从惊叹AI已至到察觉AI已无处不在不过短短数年,人工智能正在各个产业领域掀起变革浪潮。而深度学习框架可谓这个智能时代的“操作系统”,通过对底层语言和重要算法模型进行封装,开发者无需重复造轮子,可以将更大精力投入研发,对于应用普及无疑意义重大。“深度学习框架起到了承上启下的作用,下接芯片,上承各种业务模型、行业应用,助力开发者进行组网、训练、预测,极大降低了研发门槛。”马艳军表示。
早在2012年百度就开始着手研究和应用深度学习技术,2016年,百度飞桨正式开源,成为中国首个也是目前国内唯一开源开放、功能完备的深度学习平台。经过多年的产业实践,百度飞桨已成长为集核心框架、工具组件和服务平台为一体的端到端开源深度学习平台,拥有五大核心特性,包括同时支持静态图与动态图,提供应用效果最佳官方模型,支持大规模分布式训练以及端到端部署,并提供系统化的深度学习服务。现场,马艳军着重介绍了飞桨在训练和部署两方面的优势及最新进展。
首先在训练方面,源于百度搜索、推荐等产品的挑战,飞桨的大规模分布式训练能力始终是其重要亮点。飞桨同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练,支持万亿规模参数、数百个节点的高效并行训练,也是最早提供如此强大的深度学习并行技术的深度学习平台,高效、稳定、成本低廉。以前段时间发布的ERNIE2.0知识增强的语义理解框架为例,其核心特征“可持续学习”正需基于超大规模语料、大规模GPU集群每天持续进行多种任务下的预训练。目前ERNIE已累计学习超10亿知识,全面刷新中文NLP任务效果。
对于开发者来说,除了模型的训练,还会遇到很多在产品工程化问题。在部署环节,飞桨完整支持多框架、多平台、多操作系统,为用户提供高兼容性、高性能的多端部署能力。近日,飞桨端侧推理引擎也重磅升级为Paddle Lite,通过对底层架构设计的改进拥有更高通用性和更极致的性能,配合模型压缩工具库PaddleSlim可在端侧实现全面领先的高速推理,满足人工智能应用落地终端侧的严苛要求。
如今,涉及国计民生的重要产业智能化升级正在不断提速,行业头部企业人工智能应用深度、广度已相当可观。经过踏实探索,百度飞桨已经深入各行各业,带来了切实价值,有大批感兴趣的产业开发者聚集在百度飞桨展台进行深入交流。
在互联网领域,百度地图应用飞桨,为用户打造更精准的“通行时间智能预估”能力,大幅提升了开发和调试的便捷性、训练效率、部署和预测性能,实现每天响应近百亿次道路计算请求,并为十万行业伙伴提供服务;工业上,百度飞桨推出能够高效离线检验大量小零件的深度学习框架,基于此框架打造的1台“端设备”可完成8个质检员的工作量,大幅提升了质检效率,且经过简单培训的工厂操作员即可独立完成操作。不仅于此,百度飞桨已助力零售、人力、通讯、地产等多个产业实现智能化升级。
人工智能与产业的深度结合不仅蕴含着海量的市场机会,同时也是中国在全球市场竞争中的新机遇。作为开源的深度学习平台,百度飞桨所承担的正是让顶尖技术更通用,让昂贵艰深的“手工打造”转化为平台化的生产。门槛的降低,正意味着应用的发端,AI大生产已不再遥远。
推进应用落地