2017百度世界大会
Edit:2017-11-17
视频地址:http://www.iqiyi.com/v_19rre224ns.html
北京时间9点30分。2017年百度世界大会成功开始,开场白用一部短片简单介绍了什么是复杂,从而引出了本次大会的目的,什么是简单。
在李彦宏演讲的过程中,最让我眼前一亮的是侧边小屏幕的字幕,他并不是预先准备好的。他引入了语音流识别,和基于NLP的百度翻译。这可广泛用于国际会议、公司会议等场景。
在大会开头,李彦宏谈及了apollo无人驾驶的未来发展,及无人驾驶的量产计划,预计在2020年无人车可实现量产。并且金龙已达成共识明年7月可实现量产无人小巴车,明年可在封闭道路上投入运营。
其亮点就是完全没有驾驶位,没有方向盘,如图所示:
2019年 江淮、北汽将投入制造。2020年奇瑞将推出自动驾驶汽车。并且Apollo将为雄安打造成一座智能出行城市。
接着李彦宏开始介绍百度从去年开始推崇的百度大脑。百度大脑具有四项基本技能。语音识别、图像识别、自然语言处理、用户画像,都以开放平台的形式分享给开发者。开放了80+种AI能力,提供给开发者使用。百度大脑目前日平均调用次数为2188亿次,在诸多品牌设备的背后其实调用着百度大脑的能力。
--语音:
李彦宏就会场环境介绍了当时会场使用的语音识别能力,在会场环境下识别率经过特别调优后可以达到95%的成功识别率,翻译能力在6级英语能力测试中,15分的翻译题,百度翻译可拿到13.6分
已经远远超过了大学生参加六级考试的平均成绩,这意味着百度大脑翻译能力已经突破了平均大学生水平。
--DuerOS
李彦宏用电视遥控器的例子讲解了,一个遥控器上有20+个按钮,一个人并不会全部了解每个按钮会干什么,有什么功能,而将人工智能融入到了电视中,将完全解放双手,释放遥控器的束缚。
--播放战狼2
--快进到张翰出场的那一段
--最左边那个人是谁
--那最右边呢
--快进到吴京开坦克漂移的那一段
--这首背景音乐叫什么?作者是谁?
--帮我收藏这首插曲
--帮我搜索吴京所有的电影,要和战狼同一题材的
加入了人工智能,会比所有遥控器按钮都要有能力,符合人为的需求。
--唤醒词:
李彦宏在就唤醒词的演讲表现中,使用了一部视频来进行演示。演示环境是百度食堂,迎面而来的就是人脸识别支付的功能,应该算是顺带的一个安利吧。
李彦宏不停的对空气说,下一条,下一条,鬼兰的百科,返回,下一条,声音大一点。
这个月底,手机百度app将引入语音系统,在无法解放双手的时候,可语音交互,引入了AI的方便。
--机器视觉分析:
疲劳驾驶监测系统。Demo中由一个司机表现整个系统,由人脸识别开始。
当司机查看手机时,系统将提示 请集中驾驶。
打哈气时,系统提示请注意行车安全。
当微闭双眼时,系统提示:检测到轻度疲劳驾驶,将播放推荐音乐帮助提神。
司机带上了深色墨镜,但是机器视觉可穿透墨镜检测眼部细节。
当司机出现紧闭双眼并头部跌下,系统提示检测到重度疲劳驾驶,自动导航至最近的休息区。
李彦宏称未来将由车自己开到休息区。 AI,让每个人安全回家。
这一切才刚刚开始,我们仍处于AI时代的黎明。
AI技术的发展,可以使得机器越来越学会使用各种工具,听人的话,适应人的需求。让人的负担变的更低,更少。
人工智能,将使生活更简单、
接着用了一部视频展现了在AI到临之前及之后的两个时代所带来的改变。 0:22:55 – 0:24:40
接下去是百度运营官 陆琦 的演讲,他将重点介绍百度是如何推动AI产品化、加速AI商业化落地,让AI更快地走进每个人的生活。
DuerOS可实现非常漂亮的能动用户对话内容的产品,在将来DuerOS可打造全新的新一代电视产品,更振奋人心的是AI,将移动互联网带入了全新时代,百度称为新移动,每个手机都能听能看能说能移动。
手机百度将把搜索与个性化信息流有机融合在一起,打造一款更懂用户的应用。
0:29:15 沈抖 手机百度 技术负责人 新时代的新体验
现在的手机具有强大的听说看能力和强大的计算能力,极大程度丰富了我们的生活。在中国平均一个网民有1.4部手机,平均消费3.5个小时在手机上。
我们面临以下挑战
1.我们这时代有着太多的信息。
从2012年到2016年,中国的网页从1200亿增长至2360亿。出版书籍从79亿册到16年的平均每年发行513亿。即使每个用户每天看一本,那他需要1400万年看完中国一年发行的出版物,但其中与我们相关的信息却很少。
2.我们的大脑没什么变化,但在近年来要处理的信息翻了几千倍
键盘、鼠标、智能手机,越来越多的东西出现,需要人们学习如何去使用。
用科技,让复杂的世界更简单。
所谓的自然交互,是指和人当时环境和认知能力相符合的交互方式,能讲,能看,能触摸。
介绍了什么是获取、什么是交互、什么是体验之后,沈抖发布了新移动时代新体验的旗舰产品
手机百度10.0
有事搜一搜-搜索
没事看一看-信息流
接着用一个人的现实故事介绍了搜索、信息流两项服务,是如何引导一个门卫打造成软件研发工程师的励志故事。0:34:18 – 0:35:45
互联网时代,百度使用超链的技术打造了世界上最强的搜索引擎。到了新移动时代,百度使用知识图谱来构建关系,有着世界上最大的知识图谱。
在上个月上班的路上,通过广播听到三位科学家通过引力波获得了诺贝尔奖,我通过搜索引力波以获得更多信息,通过手机百度搜索,但由于时间问题没看太多,但后来再打开的时候,信息流为我推荐了更多引力波的推送,点进去之后又推荐了更多。从引力波开始向周边扩散,包容了更多兴趣知识。
短视频值不值得看,看完意犹未尽,又想知道来自什么电影、电视剧。手机百度完美的解决了这个问题
视频介绍短视频分析 0:40:13 – 0:40:40
长短视频自动匹配 1000万+短视频从100万小时长视频中去匹配,准确率达到了99%之高,这大量节省了人力成本。
接着沈抖使用自己的例子介绍了百度的语音分析能力。 0:41:45 – 0:42:20
语音已经可以做到年龄分析。然而这只是其中一个维度。
沈抖称,手机目前已具备强大的看的能力。就兵马俑案例展示了百度AR平台。
0:43:45 – 0:45:20 结合听说看,展现了AI新时代。
陆琪称,新移动时代,视频和娱乐将成为主流。接下去有请爱奇异 龚宇 讲话。
爱奇异与百度有7年的合作关系,爱奇异为什么这么优秀,有好的演员好的摄影,这就够了吗?
爱奇异的愿景是做一家以科技创新为驱动的伟大娱乐公司,与众不同的就是科技创新。
1. 更懂内容
星你、太阳的后裔、楚乔传、花千骨等等,都是热播。都是爱奇异采购的。为什么这么多热播剧,爱奇异能够踩准了点,能踩对,AI技术起到了很大的作用。基于深度学习的多时间窗口预测,可分析出爱奇异在一年以后的播出流量预测,准确率能达到88%。
图中背景中,蓝色表示真实流量,绿色表示半年或一年前所做的预测。
所以爱奇异能够非常准确的采购片源。对于电影的方差准确率可达到77%,票房预测可以帮助爱奇异是否采购,价格应该是多少,对投资和原创有很大的作用。诸如去年的几部热门网剧例如余罪、无证之罪、河神、老九门,前年的盗墓笔记等等。
爱奇异的系统甚至可以分析预测出明年的一线女星排行榜。
是否能够有一个非语言类节目能否成为爆款,甚至突破综艺节目。今年4月实现了,那就是中国有嘻哈。视频介绍:0:55:15 – 0:57:15
为什么吴一凡一句freestyle就红遍了中国。在他粉丝的用户画像中,奢侈品占大多数,并且文化水平都偏高。而freestyle并非摇滚那种厮杀、呐喊诞生的风格,在中国有一定的基础。
利用同样的逻辑,看来AI又推荐了几个节目出来,爱奇异已计划了明年三档大型节目。
根据用户的行为、弹幕表情、充值等等计算出合适用户的个性化推荐。爱奇异,更懂用户。
爱奇异也广泛的将AI技术投入到了视频处理中,如图所示。
AI对于视频精彩内容的理解与分析展示 01:03:00 – 01:06:00
DuerOS 2.0更新,新增一系列能力。百度率先使用DuerOS 2.0打造了一部智能产品。这个产品由Jacy创作,这是来自RavenTech(渡鸦科技)的一名90后创作者,并揭开本次大会白盒子的真面目。
Raven H 介绍视频 01:13:45 – 01:14:20.
这是一款搭载了DuerOS 2.0 的使用新型材料(使用原色,不会掉色、RAL色系)、19x19触摸LED点阵屏幕,wifi+蓝牙4.0+zigbee的接入方式、USB-TYPE-C的接口、麦克风物理静音按钮、TYMPHANY特质腔体等为一体的智能音箱。
可以说这个音箱,集颜、音、智为一体。在常规智能音箱,难以解决的是语音识别的最大距离,默认的解决方案是再提供一个手机APP进行操作。而Raven H可将顶部19x19的LED点阵屏卸下,手持使用,这块面板命名为了Touch。
在1:43:05开始,Jacy向会场展示语音控制能力。
可以从中看出,小度在2代中,上下文能力得到了很大的提升。能明白用户的意图,继承上一轮的对象,甚至对当前有效对象的更多属性进行查询。
甚至支持了同级别多词槽的意图。甚至展示了无唤醒词操作 详见01:45:00 – 01:45:50
听词识曲(无需音调) 详见01:46:10 – 01:46:30
不知道以上的功能是否和正式的DuerOS 2.0保持一致。也可能是DuerOS 2.0针对智能音箱和自家产品的特殊优化。
Raven H 与 爱奇异|电视果 只需连到一个网络中,即可实现语音操作视频。
并且接入了针对体育、音乐垂类特殊优化的搜索、知识图谱。渴望被客户尽管问。
在语音唤醒率方面,H做到了1-3米99%的唤醒率,无唤醒率0.042次/时。平均的响应时间1.4秒
并且公布了白盒子内真正的内容,1699元。并称这款产品要打造成像iphone一样的标杆型产品。
随后基于点阵屏幕Touch开发了另两款产品。
紧接着发布了一款,可以根据音乐节奏韵律舞动的六轴机械手臂机器人Raven R。并现场展示了该机器人与音乐的互动能力。详见02:06:20
我对该机器人比较有兴趣,稍作分析,感觉大致原理如下:
可以看出,刚开始的几个拍子机器人没做出反映,在稍后的几个8拍中,鼓点声被合声盖过,机械手臂陷入了沉默动作。随后鼓点声最响的或是贝斯音最响的几个时间段,手臂摆动尤为剧烈。可能该互动臂对音乐流的分析将会以低音为key进行分析。再融入了几个sin的乒乓式运动曲线在合适的时机对舵机进行控制。
以上仅个人看法。
之后,Raven R展现了最新的语音合成能力,可定制化声线是一大看点。
接着因为R没有脚,就提到了脚,从而又开发出了一款Raven Q产品。他结合了百度最新的机器视觉技术,有避障、脸型识别等功能。但是头上一直有个东西一直在转,群里估摸着是个雷达和实体空间感知。但是似乎没有见到Touch在哪。
以上就是本届百度世界大会的全部内容。参杂了一些个人看法,删减了一些个人感觉多余的陈述,谢谢观看。
现在这种活动好像少了
大佬们都知道很多...
产品也在变,好在,一直在做
景鲲大神很厉害的
现在主事的人都换了几茬了
还请明星来?太厉害了
你了解的很细致啊
应该也不是核心之上~你好,核心贡献者~
下面有个萌新等大家带一下~大佬们一起上啊
主要是我不了解,这才尴尬啊....所以精心推荐楼主上,GO
那时候度秘一周年生日趴邀请的明星还是很给力的,现在这代言人...
现在不是也有那种底座了嘛,那种配件厂定制的那种
哈哈,那个时候恩达才来百度吧,发布了度秘,说是人工智能时代的智能秘书,但最开始只有一个APP,效果也很差,景鲲从微软来的,,他以前开发的小冰,,那个APP我记得下载量几万。隔壁家讯飞灵犀下载量我记得几千万,后来qi来了,才把景鲲的地位升上来的,我记得看过一篇采访,当时景鲲都想走的,qi找他聊了一次然后开始做dueros
哈哈哈哈 我在仰望,月亮之上 有多少梦想~在自由的飞翔
那就是说你在核心者之上
你肯定也是核心吧
笔墨快来看啊
笔墨不要太谦虚了
大佬又在自谦了
这个听起来非常不错啊
啊?笔墨精心为你推荐——这个帖子的楼主就非常有才华