2017年百度世界大会主论坛观后有感
goJhou 发布于2017-11 浏览:107087 回复:919
7
收藏

2017百度世界大会

Edit:2017-11-17

视频地址:http://www.iqiyi.com/v_19rre224ns.html

 

北京时间9点30分。2017年百度世界大会成功开始,开场白用一部短片简单介绍了什么是复杂,从而引出了本次大会的目的,什么是简单。

在李彦宏演讲的过程中,最让我眼前一亮的是侧边小屏幕的字幕,他并不是预先准备好的。他引入了语音流识别,和基于NLP的百度翻译。这可广泛用于国际会议、公司会议等场景。

在大会开头,李彦宏谈及了apollo无人驾驶的未来发展,及无人驾驶的量产计划,预计在2020年无人车可实现量产。并且金龙已达成共识明年7月可实现量产无人小巴车,明年可在封闭道路上投入运营。

其亮点就是完全没有驾驶位,没有方向盘,如图所示:

2019年 江淮、北汽将投入制造。2020年奇瑞将推出自动驾驶汽车。并且Apollo将为雄安打造成一座智能出行城市。

接着李彦宏开始介绍百度从去年开始推崇的百度大脑。百度大脑具有四项基本技能。语音识别、图像识别、自然语言处理、用户画像,都以开放平台的形式分享给开发者。开放了80+种AI能力,提供给开发者使用。百度大脑目前日平均调用次数为2188亿次,在诸多品牌设备的背后其实调用着百度大脑的能力。

 

--语音:

李彦宏就会场环境介绍了当时会场使用的语音识别能力,在会场环境下识别率经过特别调优后可以达到95%的成功识别率,翻译能力在6级英语能力测试中,15分的翻译题,百度翻译可拿到13.6分

已经远远超过了大学生参加六级考试的平均成绩,这意味着百度大脑翻译能力已经突破了平均大学生水平。

 

--DuerOS

李彦宏用电视遥控器的例子讲解了,一个遥控器上有20+个按钮,一个人并不会全部了解每个按钮会干什么,有什么功能,而将人工智能融入到了电视中,将完全解放双手,释放遥控器的束缚。

--播放战狼2

--快进到张翰出场的那一段

--最左边那个人是谁

--那最右边呢

--快进到吴京开坦克漂移的那一段

--这首背景音乐叫什么?作者是谁?

--帮我收藏这首插曲

--帮我搜索吴京所有的电影,要和战狼同一题材的

 

加入了人工智能,会比所有遥控器按钮都要有能力,符合人为的需求。

 

--唤醒词:

李彦宏在就唤醒词的演讲表现中,使用了一部视频来进行演示。演示环境是百度食堂,迎面而来的就是人脸识别支付的功能,应该算是顺带的一个安利吧。

李彦宏不停的对空气说,下一条,下一条,鬼兰的百科,返回,下一条,声音大一点。

这个月底,手机百度app将引入语音系统,在无法解放双手的时候,可语音交互,引入了AI的方便。

 

--机器视觉分析:

疲劳驾驶监测系统。Demo中由一个司机表现整个系统,由人脸识别开始。

当司机查看手机时,系统将提示 请集中驾驶。

打哈气时,系统提示请注意行车安全。

当微闭双眼时,系统提示:检测到轻度疲劳驾驶,将播放推荐音乐帮助提神。

司机带上了深色墨镜,但是机器视觉可穿透墨镜检测眼部细节。

当司机出现紧闭双眼并头部跌下,系统提示检测到重度疲劳驾驶,自动导航至最近的休息区。

 

李彦宏称未来将由车自己开到休息区。  AI,让每个人安全回家。

 

这一切才刚刚开始,我们仍处于AI时代的黎明。

 

AI技术的发展,可以使得机器越来越学会使用各种工具,听人的话,适应人的需求。让人的负担变的更低,更少。

人工智能,将使生活更简单、

接着用了一部视频展现了在AI到临之前及之后的两个时代所带来的改变。 0:22:55 – 0:24:40

 

 

 

接下去是百度运营官 陆琦 的演讲,他将重点介绍百度是如何推动AI产品化、加速AI商业化落地,让AI更快地走进每个人的生活。

DuerOS可实现非常漂亮的能动用户对话内容的产品,在将来DuerOS可打造全新的新一代电视产品,更振奋人心的是AI,将移动互联网带入了全新时代,百度称为新移动,每个手机都能听能看能说能移动。

手机百度将把搜索与个性化信息流有机融合在一起,打造一款更懂用户的应用。

 

0:29:15 沈抖 手机百度 技术负责人 新时代的新体验

现在的手机具有强大的听说看能力和强大的计算能力,极大程度丰富了我们的生活。在中国平均一个网民有1.4部手机,平均消费3.5个小时在手机上。

 

我们面临以下挑战

1.我们这时代有着太多的信息。

从2012年到2016年,中国的网页从1200亿增长至2360亿。出版书籍从79亿册到16年的平均每年发行513亿。即使每个用户每天看一本,那他需要1400万年看完中国一年发行的出版物,但其中与我们相关的信息却很少。

 

2.我们的大脑没什么变化,但在近年来要处理的信息翻了几千倍

键盘、鼠标、智能手机,越来越多的东西出现,需要人们学习如何去使用。

用科技,让复杂的世界更简单。

所谓的自然交互,是指和人当时环境和认知能力相符合的交互方式,能讲,能看,能触摸。

 

介绍了什么是获取、什么是交互、什么是体验之后,沈抖发布了新移动时代新体验的旗舰产品

手机百度10.0

有事搜一搜-搜索

没事看一看-信息流

接着用一个人的现实故事介绍了搜索、信息流两项服务,是如何引导一个门卫打造成软件研发工程师的励志故事。0:34:18 – 0:35:45

 

互联网时代,百度使用超链的技术打造了世界上最强的搜索引擎。到了新移动时代,百度使用知识图谱来构建关系,有着世界上最大的知识图谱。

 

在上个月上班的路上,通过广播听到三位科学家通过引力波获得了诺贝尔奖,我通过搜索引力波以获得更多信息,通过手机百度搜索,但由于时间问题没看太多,但后来再打开的时候,信息流为我推荐了更多引力波的推送,点进去之后又推荐了更多。从引力波开始向周边扩散,包容了更多兴趣知识。

短视频值不值得看,看完意犹未尽,又想知道来自什么电影、电视剧。手机百度完美的解决了这个问题

视频介绍短视频分析 0:40:13 – 0:40:40

长短视频自动匹配 1000万+短视频从100万小时长视频中去匹配,准确率达到了99%之高,这大量节省了人力成本。

接着沈抖使用自己的例子介绍了百度的语音分析能力。 0:41:45 – 0:42:20

语音已经可以做到年龄分析。然而这只是其中一个维度。

沈抖称,手机目前已具备强大的看的能力。就兵马俑案例展示了百度AR平台。

0:43:45 – 0:45:20 结合听说看,展现了AI新时代。

 

陆琪称,新移动时代,视频和娱乐将成为主流。接下去有请爱奇异 龚宇 讲话。

 

爱奇异与百度有7年的合作关系,爱奇异为什么这么优秀,有好的演员好的摄影,这就够了吗?

爱奇异的愿景是做一家以科技创新为驱动的伟大娱乐公司,与众不同的就是科技创新。

 

1.     更懂内容

星你、太阳的后裔、楚乔传、花千骨等等,都是热播。都是爱奇异采购的。为什么这么多热播剧,爱奇异能够踩准了点,能踩对,AI技术起到了很大的作用。基于深度学习的多时间窗口预测,可分析出爱奇异在一年以后的播出流量预测,准确率能达到88%。

图中背景中,蓝色表示真实流量,绿色表示半年或一年前所做的预测。

所以爱奇异能够非常准确的采购片源。对于电影的方差准确率可达到77%,票房预测可以帮助爱奇异是否采购,价格应该是多少,对投资和原创有很大的作用。诸如去年的几部热门网剧例如余罪、无证之罪、河神、老九门,前年的盗墓笔记等等。

爱奇异的系统甚至可以分析预测出明年的一线女星排行榜。

是否能够有一个非语言类节目能否成为爆款,甚至突破综艺节目。今年4月实现了,那就是中国有嘻哈。视频介绍:0:55:15 – 0:57:15

为什么吴一凡一句freestyle就红遍了中国。在他粉丝的用户画像中,奢侈品占大多数,并且文化水平都偏高。而freestyle并非摇滚那种厮杀、呐喊诞生的风格,在中国有一定的基础。

利用同样的逻辑,看来AI又推荐了几个节目出来,爱奇异已计划了明年三档大型节目。

 

 

根据用户的行为、弹幕表情、充值等等计算出合适用户的个性化推荐。爱奇异,更懂用户。

爱奇异也广泛的将AI技术投入到了视频处理中,如图所示。

 

AI对于视频精彩内容的理解与分析展示 01:03:00 – 01:06:00

 

DuerOS 2.0更新,新增一系列能力。百度率先使用DuerOS 2.0打造了一部智能产品。这个产品由Jacy创作,这是来自RavenTech(渡鸦科技)的一名90后创作者,并揭开本次大会白盒子的真面目。

       

        Raven H 介绍视频 01:13:45 – 01:14:20.

        这是一款搭载了DuerOS 2.0 的使用新型材料(使用原色,不会掉色、RAL色系)、19x19触摸LED点阵屏幕,wifi+蓝牙4.0+zigbee的接入方式、USB-TYPE-C的接口、麦克风物理静音按钮、TYMPHANY特质腔体等为一体的智能音箱。

        可以说这个音箱,集颜、音、智为一体。在常规智能音箱,难以解决的是语音识别的最大距离,默认的解决方案是再提供一个手机APP进行操作。而Raven H可将顶部19x19的LED点阵屏卸下,手持使用,这块面板命名为了Touch。

在1:43:05开始,Jacy向会场展示语音控制能力。

可以从中看出,小度在2代中,上下文能力得到了很大的提升。能明白用户的意图,继承上一轮的对象,甚至对当前有效对象的更多属性进行查询。

甚至支持了同级别多词槽的意图。甚至展示了无唤醒词操作 详见01:45:00 – 01:45:50

听词识曲(无需音调) 详见01:46:10 – 01:46:30

不知道以上的功能是否和正式的DuerOS 2.0保持一致。也可能是DuerOS 2.0针对智能音箱和自家产品的特殊优化。

 

Raven H 与 爱奇异|电视果 只需连到一个网络中,即可实现语音操作视频。

并且接入了针对体育、音乐垂类特殊优化的搜索、知识图谱。渴望被客户尽管问。

 

在语音唤醒率方面,H做到了1-3米99%的唤醒率,无唤醒率0.042次/时。平均的响应时间1.4秒

并且公布了白盒子内真正的内容,1699元。并称这款产品要打造成像iphone一样的标杆型产品。

随后基于点阵屏幕Touch开发了另两款产品。

紧接着发布了一款,可以根据音乐节奏韵律舞动的六轴机械手臂机器人Raven R。并现场展示了该机器人与音乐的互动能力。详见02:06:20

我对该机器人比较有兴趣,稍作分析,感觉大致原理如下:

可以看出,刚开始的几个拍子机器人没做出反映,在稍后的几个8拍中,鼓点声被合声盖过,机械手臂陷入了沉默动作。随后鼓点声最响的或是贝斯音最响的几个时间段,手臂摆动尤为剧烈。可能该互动臂对音乐流的分析将会以低音为key进行分析。再融入了几个sin的乒乓式运动曲线在合适的时机对舵机进行控制。

以上仅个人看法。

之后,Raven R展现了最新的语音合成能力,可定制化声线是一大看点。

 

接着因为R没有脚,就提到了脚,从而又开发出了一款Raven Q产品。他结合了百度最新的机器视觉技术,有避障、脸型识别等功能。但是头上一直有个东西一直在转,群里估摸着是个雷达和实体空间感知。但是似乎没有见到Touch在哪。

 

以上就是本届百度世界大会的全部内容。参杂了一些个人看法,删减了一些个人感觉多余的陈述,谢谢观看。

收藏
点赞
7
个赞
共919条回复 最后由用户已被禁言回复于2022-04
#926笔墨哥回复于2019-02
#921 才能我浪费99回复
还请明星来?太厉害了

现在这种活动好像少了

0
#925笔墨哥回复于2019-02
#920 才能我浪费99回复
你了解的很细致啊

大佬们都知道很多...

0
#924笔墨哥回复于2019-02
#922 才能我浪费99回复
现在主事的人都换了几茬了

产品也在变,好在,一直在做

0
#923hellyhua回复于2019-02

景鲲大神很厉害的

0
#922才能我浪费99回复于2019-02
#915 婉嫕男回复
哈哈,那个时候恩达才来百度吧,发布了度秘,说是人工智能时代的智能秘书,但最开始只有一个APP,效果也很差,景鲲从微软来的,,他以前开发的小冰,,那个APP我记得下载量几万。隔壁家讯飞灵犀下载量我记得几千万,后来qi来了,才把景鲲的地位升上来的,我记得看过一篇采访,当时景鲲都想走的,qi找他聊了一次然后开始做dueros
展开

现在主事的人都换了几茬了

0
#921才能我浪费99回复于2019-02
#917 笔墨哥回复
那时候度秘一周年生日趴邀请的明星还是很给力的,现在这代言人...

还请明星来?太厉害了

0
#920才能我浪费99回复于2019-02
#915 婉嫕男回复
哈哈,那个时候恩达才来百度吧,发布了度秘,说是人工智能时代的智能秘书,但最开始只有一个APP,效果也很差,景鲲从微软来的,,他以前开发的小冰,,那个APP我记得下载量几万。隔壁家讯飞灵犀下载量我记得几千万,后来qi来了,才把景鲲的地位升上来的,我记得看过一篇采访,当时景鲲都想走的,qi找他聊了一次然后开始做dueros
展开

你了解的很细致啊

0
#919笔墨哥回复于2019-02
#913 秘密花园jay回复
那就是说你在核心者之上

应该也不是核心之上~你好,核心贡献者~

下面有个萌新等大家带一下~大佬们一起上啊

0
#918笔墨哥回复于2019-02
#911 worddict回复
笔墨快来看啊

主要是我不了解,这才尴尬啊....所以精心推荐楼主上,GO

0
#917笔墨哥回复于2019-02
#915 婉嫕男回复
哈哈,那个时候恩达才来百度吧,发布了度秘,说是人工智能时代的智能秘书,但最开始只有一个APP,效果也很差,景鲲从微软来的,,他以前开发的小冰,,那个APP我记得下载量几万。隔壁家讯飞灵犀下载量我记得几千万,后来qi来了,才把景鲲的地位升上来的,我记得看过一篇采访,当时景鲲都想走的,qi找他聊了一次然后开始做dueros
展开

那时候度秘一周年生日趴邀请的明星还是很给力的,现在这代言人...

0
#916婉嫕男回复于2019-02
#901 荒墨丶迷失回复
主要是电池待机不给力呢  连电脑待机一天都这么需要电,不过苹果耳机这种小型的都可以支持电池。
展开

现在不是也有那种底座了嘛,那种配件厂定制的那种

1
#915婉嫕男回复于2019-02
#799 笔墨哥回复
duer的话,那时候关注度秘,就会了解到这些啊,而度秘的前身应该是 百小度----度秘app 吧,那时候就经常和小度玩了
展开

哈哈,那个时候恩达才来百度吧,发布了度秘,说是人工智能时代的智能秘书,但最开始只有一个APP,效果也很差,景鲲从微软来的,,他以前开发的小冰,,那个APP我记得下载量几万。隔壁家讯飞灵犀下载量我记得几千万,后来qi来了,才把景鲲的地位升上来的,我记得看过一篇采访,当时景鲲都想走的,qi找他聊了一次然后开始做dueros

1
#914goJhou回复于2019-02
#913 秘密花园jay回复
那就是说你在核心者之上

哈哈哈哈 我在仰望,月亮之上 有多少梦想~在自由的飞翔

0
#913秘密花园jay回复于2019-02
#903 笔墨哥回复
我记得小编 核心没要我,不符合条件...

那就是说你在核心者之上

0
#912worddict回复于2019-02
#902 荒墨丶迷失回复
把小编@出来 问问有什么样的福利

你肯定也是核心吧

0
#911worddict回复于2019-02
#906 aiyouwok回复
笔墨哥您好,我是华中科技大学的学生,我的大创项目是关于百度云智能图文技术的,我的老师建议我把他转变为一个创业项目,您好像对云智能的推广和技术都很了解,能和您聊一聊吗?
展开

笔墨快来看啊

0
#910worddict回复于2019-02
#907 笔墨哥回复
啊?笔墨精心为你推荐——这个帖子的楼主就非常有才华

笔墨不要太谦虚了

0
#909风允摩羯回复于2019-02
#907 笔墨哥回复
啊?笔墨精心为你推荐——这个帖子的楼主就非常有才华

大佬又在自谦了

0
#908风允摩羯回复于2019-02
#890 goJhou回复
不仅仅这些喔,加入核心贡献者大家庭,还能欢乐抢夺笔墨的音箱~

这个听起来非常不错啊

0
#907笔墨哥回复于2019-02
#906 aiyouwok回复
笔墨哥您好,我是华中科技大学的学生,我的大创项目是关于百度云智能图文技术的,我的老师建议我把他转变为一个创业项目,您好像对云智能的推广和技术都很了解,能和您聊一聊吗?
展开

啊?笔墨精心为你推荐——这个帖子的楼主就非常有才华

0
TOP
切换版块