新闻稿来源:阿里巴巴杭州云栖大会
主题:阿里人工智能实验室峰会
时间:年10月13日下午
地点:云栖大会b2会议室
主持人:尊敬的各位嘉宾,大家下午好!欢迎各位来到本场云栖大会阿里人工智能实验室峰会,创新交互引爆产业变革。
在这个技术驱动万物的时代,人工智能已经成为未来发展的风向标。本场峰会的主题创新交互引爆产业变革,就是希望借由本场峰会与大家共同探讨人工智能技术以及创新交互发展与未来。为此我们邀请到了在人工智能领域有着丰富经验和成果的技术专家,期待他们与在座各位技术研发者分享他们的思考与洞见,来开阔广大行业研究者的视野。
接下来我将为大家介绍本次峰会的嘉宾,他们是:
阿里巴巴复杂性科学中心主任张翼成
世界智能机器人顶级会议IROS总主席张建伟
杭州市商贸旅游集团总经理陆晓亮
美的集团智慧研究院院长廖紫纬
青岛海尔多媒体有限公司产品平台负责人*俊杰
南方航空信息中心副院长郑炜旸
阿里巴巴人工智能实验室总经理浅雪
非常欢迎大家来到这里,下面有请阿里巴巴人工智能实验室总经理浅雪,来与我们进行分享。
浅雪:各位来宾、各位朋友,以及媒体朋友们,大家下午好!没想到来云栖大会三天,每天都有演讲,今天这场演讲竟然还有这么多人,我还是表示很激动的。
今天我是代表阿里巴巴人工智能实验室来做这么一个分享的。前两天我们都是围绕在天猫精灵上面,今天我会在这个专场里面发布阿里巴巴人工智能其他相关产品。
首先可以了解一下目前的行业发展趋势。上个月9月无锡物联网大会上马总提出来智联网概念,他说物联本质是智联网,人类将开始进入数据时代。我们实验室对于智联网本身怎么理解的呢?第一,我们认为未来机器智能。第二,万物会在线。第三,我们会形成一个更大的网络,而这个网络里面会有非常多的生态与服务加载在里面。我们目前发布的第一款个人语音助手天猫精灵,既有在线能力又有机器学习能力,也有生态服务的能力。
在座的朋友们有多少人已经使用过天猫精灵?请举一下手。到今天为止天猫精灵正式面市短短两个月时间,它在过去两个月时间里面变化也是非常多的,我们也加载了很多新的能力和服务。今天因为还有很多媒体朋友们,或者是嘉宾们没有看过天猫精灵到底是怎么样的,所以今天有请天猫精灵产品经理杜海涛给大家做一次现场的体验。
杜海涛:各位下午好!就像浅雪说的,云栖大会三天,跟着浅雪演讲了三天,我保证今天是最后一场,也是最精彩的一场。
天猫精灵到底体现在什么样的先进性,我觉得还是要回答这个问题,作为一个语音助手做到你听懂你的话并不难,但是我最主要的是三个能力,第一是进化力,也就是不能是一个死的系统。第二是理解力,不同能够听懂你的话,并且能进化。第三是执行力,听懂并且真的能干一些事。这三个能力都是非常重要的。
我想讲的是关于进化力。从7月5号发布大概35项功能,到今天已经有了93项功能,不出意外的话,今年年底这个数字应该还会打着翻往上涨。这说明整个团队系统处于非常好的状态才能够进行快速迭代,进化力指了是能够对信息进行比较好的信息,而不是以前的检查查询。
现在先来秀一下。天猫精灵精灵,*是谁?
(演示……)
大家都听到了,它还说出了他的女朋友,这个进化能力就需要非常快。所以像这样一些问题、这样一些知识,每天都会被这个语音助手所消化、吸收,然后贡献给用户。第一个就是这样的能力。
第二个我想说的,我们发的时候很多人说它不就是一款音响吗?对,它既然就是一款音响,就应该有音响的担当。作为音响的担当,最基本的是它有多少音乐、音频,到今天为止天猫精灵能兼容的音乐版权总数量超过了1千万首,能兼容的音频总数量已经超过了4百万个。这样基本上你通过媒体、朋友圈或任何手段所知道的最新、最热的内容都可以出来。我们再来随便秀一下。
(演示……)
大家可以试一个耿,马总昨天晚上还是前天晚上那三首歌,应该在里面了,你可以听马总在云栖大会上唱的那些歌,我个人觉得不太好听,但是他是我老板,得有。
除了这个以外,它对儿童是比较友好的,因为儿童不会打字,所以需要听睡前故事或者其他的都可以。我们对它做了音纹的区分,成人声音的和儿童的是不同的。
(演示……)
除了这个以外还有日常小工具,像查股票、航班信息,这些都可以做到。比如我们查一下阿里巴巴现在值多少钱了。
(演示……)
还有是日程安排,这也是现在在我们所有技能应用里面排在前面的,也就是关于备忘录和记事这件事情它是非常在意的。比如天猫精灵提醒我今天晚上马总请我吃饭。
(演示……)天猫精灵:好的,已经全部帮你记录下来,请在手机上查阅。
最主要的功能我想秀一个,我们一直说我们公布了全球第一个声纹系统,就像我们指纹和人脸识别一样,它可以进行机器和人之间更好的交流。声纹被我们用在两个地方,第一个是所有领域的都跟个人匹配。第二个,声纹再往前递进一步是声纹支付,比如今天我们充话费。
(演示……)
这就是一个声纹的过程,声纹过程由两部分构成,一部分叫天猫精灵,另外一部分叫,一个静态密码,一个动态密码,两个密码在一起就可以进行,手机充值已经到帐了。这个功能还可以往前拓展,比如其他的快捷支付,都可以,水电煤都可以,交通罚款也可以,叫外卖可以,大家可以根据这个功能往前进行设想。
我们是一个生态,所以生态最重要的是能够让别人进来,而不是自己不停做应用。现在上面有90多个应用,基本上只有大概三十七八个应用是我们自己做的,剩下的都是其它开发者帮助我们做的,这些开发者有内容开发者、技能开发者、智能家居的开发者,都不太一样,有各种笑话。比如我们希望这种功能集思广益,我们来听听今天的笑话是什么。
(演示……)
还比如说,我昨天在主会场秀过一个骚扰电话防诈骗的,有人说家里老人还在用功能机,问天猫精灵,它会告诉你这是诈骗电话、快递电话又或者是干扰电话。这个功能对家里谨慎的老人非常有用,比如天猫精灵,我要查号码。
(演示)天猫精灵:这个是骚扰电话,看您心灵接通。
它告诉了你这是一个骚扰电话,可以不接听。
总结下来,刚才我说了最重要的三个能力,一个是进化力,一个是理解力,再一个是执行力。理解力看到了,所有演示过程并没有按照传统语音助手那样做很多严格的中文句式,比如天猫精灵请帮我打开海尔的空调,不用这样的。你就告诉它:天猫精灵,太冷了,温度调高一点。你说天猫精灵今天杭州天气怎么样?你如果非得问它天猫精灵明天要不要穿秋裤,它也会告诉你今天25度不用穿。这是我想讲的它的理解力,这点很重要。
今天就讲到这里,谢谢。
浅雪:谢谢海涛。
我们在过去上线的两个月时间里面,上线了非常多的技能,一个技能可能大家认为很简单,其实非常难,什么叫技能?点外卖就是一个技能,点外卖意味着这是一个网站,一个APP,一家公司该做的事情。但是我们在过去这点时间里面上线了非常多的能力,也欢迎大家能够深入体会和使用。
天猫精灵在AI方面具备了从语音识别唤醒、语音识别、声纹识别、语义理解、语音合成、知识图谱、云服务等等能力了。昨天我在展区亲眼看到一个男人,突然对他身边另外一个男人说:这是天猫精灵。另外一个人说:这是什么。他说:你得赶紧看一下,我刚买了一个,可好玩了。我们目前所有的信心和快乐都是来自于用户很正面的反馈,所以我整天没事干也是在公司里刷一下APP,看一下评价,这是我的能量来源。
天猫精灵在过去彻底成了网红,它有很多场景,比如墨西哥总统、香港的特首、发改委的主任等等都点击过天猫精灵,为什么呢?因为天猫精灵见不同人可以说不同话,这就是它非常智慧和智能的地方。
昨天我们重磅发布了第一个产品,就是天猫精灵背后人机交互系统开发者平台阿里Genie。在这个平台里面,今天有内容的服务商和APP应用的提供商,以及智能家居设备商,都已经成功入驻到这个大的生态里面。所以这意味着马老师说的智联网的网在非常快速有效的成长和建设过程当中。很多用户可能没有使用过点外卖的能力,我们这段时间已经跟肯德基也打通了,所以以后你可以在家里面一边躺在沙发上看电视,一边跟天猫精灵说帮我来一个炸鸡块,这不都不是梦。
整个阿里Genie系统还提供了硬件输出能力,意味着这套软件服务可以加载在任何一个硬件当中的。我们支持从一个麦克风到六个麦克风的方案,也可以用户升级自己的按键。同时目前市面上几乎你能看到的所有热门主流的芯片也都支持,这意味着什么呢?意味着硬件生产商是有非常大的自主选择能力,你可以定义自己的硬件,最后非常轻松,直接用我们这个语音系统就可以完成自己的能力。
年的春季,会有一个非常有体感的产品,托马斯小火车会正式上线。以前儿童玩具是上面安装一个灯、颜色会发一点光,或者叫两声就已经非常不错了。但是在未来,所有的儿童玩具也好,它都能带交流能力,比如未来的托马斯小火车,你们家小朋友可以跟托马斯小火车说:小火车过来吧,小火车就真的过来了。所以这是非常有想象空间的。同时阿里巴巴还会为我们的合作伙伴提供整合资源的能力,所以这里面无论是天猫双11、聚划算、有好货等等,阿里巴巴目前电商里面做的很棒的这些营销资源也会拿出来提供给我们的客户。所以这是非常完整的解决方案。
在过去两个月时间里面,我们也提供了很多行业解决方案,这里面有三个不同的行业,分别有酒店行业、新零售行业、航旅行业。今天我们也很荣幸邀请到了西溪天堂和南方航空的两位嘉宾,后面请这两位嘉宾来做介绍。我想给大家介绍的是一个新零售里面阿里Genie和天猫精灵的应用场景。
(PPT图示)这是天猫小店一个实体店铺,叫维*超市,刚好今天把天猫精灵入驻到这个超市当中去了,天猫精灵可以做一些什么事情呢?它可以跟店主说,刚刚收到了99块钱,客户走入店铺的时候,也可以问天猫精灵酱油放在什么货架。除此以外店长还可以问天猫精灵我的牛奶库存还有多少。这意味着什么呢?我们今天背后阿里Genie系统跟店铺的POS系统、净销存系统、客服系统可以做无缝连接和打通。阿里Genie系统在整个行业的解决方案和应用场景还在不断增加当中,我相信在座有来自不同行业的朋友和客户,大家也可以开一下脑洞,想想还有什么更好玩和有意思的场景。
这个篇幅天猫精灵就到这里,接下来我要发布第二个产品,一款为智联网而生的天猫路由器,这是我们人工智能实验室推出的第二款硬件产品。这里面有两个信息,第一个信息是阿里巴巴人工智能实验室不完全等同于天猫精灵,我们还是有非常多其它应用的。第二个,我们还有别的硬件产品,这是我们的路由器产品。
这款路由器有什么特别之处呢?它为什么叫为智联网而生呢?第一个它的核心功能是这款路由器连接能力极其强,可以连接个连接数,我没有说设备数,因为每个连接数后面可能有很多个设备。这是什么意思?大家可能没有仔细想过,目前你们在家里面的路由器,可能大概连10个设备差不多了,你的手机,假设你有两台,你太太也有两台,你们家宝宝有一个IPAD,这就是目前市面上所有路由器的大概容量。但是这是什么概念呢?意味着未来你们家所有设备都可以连接上来,这是对于路由器本身能力一个很强的拓展。因为我们认为在智联网时代,万物联网的在线能力非常重要。
第二个天猫路由的一大特点,是它集成了蓝牙5.0,这在以前是不可想象和不可理解的。蓝牙这个应用大部分的人都只在手机上用过,它有一个很不方便的地方在哪里呢?举一个例子,比如你给你的家长买了一台血压计,这个血压计是通过蓝牙和手机APP连接的,一旦手机出了家门之后,你就再也没有办法知道血压计上面的信息了。所以通过路由器里面集成了蓝牙能力,它会让所有的蓝牙设备也永久在线。这是我们第二个非常棒的地方。另外一点,我不知道大家是否对于蓝牙Mesh自组网络是否熟悉,这是一个什么样的市场呢?意味着你们家里如果有盏灯,如果每盏灯里集成了蓝牙Mesh网络,它就会形成新的体系,而这盏灯对于我们路由器来说只是一个连接点。
第三个特别的地方,是我们集成协议的能力。因为今天LT行业里面有非常多的客户是自己在打造自己的网关,不同网关之间有不同协议,所以今天可以无缝把这个协议集成到天猫路由里面,意味着客户可以省去一半的资金投入到网关建设里面。
对于消费者来说,这款路由器还有一个很大的亮点,就是路由器之间可以完全无缝自由组网。相信大家在家里面碰到过一些挑战,比如你在厨房里面信号特别差,或者你打王者荣耀的时候,打游戏的时候,有些信号不是特别好。我们这款路由器的特点,第一个它的覆盖面非常广,假设您有平米的豪宅它轻松搞定,全方位无死角。假设你家里有平米,恭喜你,把天猫路由带回家,直接在家里三个地方放上天猫路由,它就会自动组建成一个网络。怎么理解呢?相信在座的各位朋友都去酒店住过,酒店里面最早升级带路由器的时候,每个房间WIFI名字都不一样,比如房间、房间。后来酒店终于做了一些升级,你到酒店里面,非常高端的酒店只有一个WIFI,比如只叫喜来登。在达成这个技术过去需要花费非常高的资金,一个AP的价格就要十几万,所以很贵,所以这个技术一直没有在家用里面使用。但是今天阿里巴巴非常希望能把这样企业级联网的能力带到家庭里面来,所以我们认为一个普通家庭,无论你是买一台、两台、三台路由器,到家里就可以自组网络。事实上今天大家在现场,大家可以观察一下,这边有一个小方块,这个小方块就是阿里巴巴的一个路由器。这边也有一个小方块,你们在这个屋子里面是感受不到我们有很多个路由器的。这是一个自组网,它也是一个很特点的能力。
同时我们有5根天线,双频,这是基本的一个消费者参数。我们使用了非常好的高通芯片,这是企业级的配置。同时我们也使用了机器学习,用机器学习的能力去提升整个网络的使用体验。举个例子,比如你一边在下载东西,一边在打游戏,它可以根据当前的流量使用习惯来给你做动态的调节。无论是影音、游戏、智能家具这些非常小和细碎的流量进行自动分配,而且是实时的。最后,它具备了手机端管理能力。有一部分市面上智能路由器可以做到管理,但是需要通过手机APP设置,但是我们的路由器完全不需要。
所以这项技术是阿里巴巴积累了非常多年的企业级的网络技术。(PPT图示)这里是阿里巴巴的园区,双11的时候就是这样灯光灿烂的,保证我们双11工作一定是不能没有网络的。所以今天非常高兴的告诉大家,我们把阿里巴巴企业级网络技术共享给每一个人和每一个客户。
我们觉得未来路由器应该就是WIFI+蓝牙就够了,不需要再有其它的不一样的协议。用这两个连接的方式,无论你是可穿戴设备,还是家装产品,还是智能家电,都可以无缝连接到路由器上。而且它有一个好处,大家后面可以购买一个路由器,购买一个天猫精灵,这两个产品放在一起可以自己发现和自己完成更方便的配网。
所以我们的路由器长什么样子呢?我们的路由器非常精致,传统的路由器无数根天下在外面,消费者购买的时候是考验数学题目的,说:哎呀,这个路由器有两根天线,那个路由器有四根天线。我们觉得这是上个世纪的事情了,路由器也应该有颜值。路由器的天线完全是内置在里面的,大家可以看到,在海外高端产品当中要两千元以上的路由器才会有这样高端的颜值。我们非常追求极致和用户体验,我们希望未来我们应该生活在一个什么都很美好的世界。
演示:这个产品已经在这里了,我们阿里巴巴的技术非常愿意共享,这样的路由器我相信大部分人都没有见过,我们追求颜值,就像我追求颜值一样。
所以第二个大家很关心的问题是价格,我们的上线时间是年11月11号,购物狂欢节。请大家再观看一下Google的产品和Orbi的产品,它们的产品价格是+和2+,而我们天猫路由的价格是。
我们真正地呼唤和渴望未来智联网时代和智联生活的到来。谢谢大家。
已经在讨论了,大家不要着急,我们还有一款产品要发布。所以刚才说了,今天是我的第三场演讲,
(PPT图示)这是阿里巴巴园区,我们园区里面竟然出现了一个恐龙,让我们反复来看一下。所以第三个发布的跟AR相关,什么意思呢?我们在未来不仅有语音,还有机器视觉,甚至还有很多别的。AR这项技术在阿里巴巴内部已经不是第一天在使用,这是一个演示,这里有一个洗衣机,可以直接把它拖到你的家里面,来看一下这个洗衣机的大小、位置。这是在天猫家装行业,你可以直接拖动一个小椅子放在家庭环境里面,来看一下它跟你的家居是否合适和协调。
(演示)有请我们的科学家。这边有一本杂志,我拿出来给大家看一下,这个杂志里面有非常多的内容,这个杂志能做什么呢?请大家来看看屏幕,这里面有一个阿里火眼的APP,它打开了阿里火眼,本来是一幅画,火眼可以在地上乱扫,但什么都没有发现。把它移动到书上的一幅画上面,结果这幅画就出现了,这幅画是马总在技术大会上介绍我们的新技术和新未来,而且它是有声音的。这是我们的第一个演示。
第二个是有一辆小汽车在这里面,这辆小汽车变成了一辆真车,当你看到一辆小汽车的时候真车会出现,你可以进入这里面看看沙发什么样子,内饰什么样子。这跟刚才马老师讲话的最大差异是有一个模型在里面。
第三个是有一只恐龙,这只恐龙变成真的了。这个技术跟车也不一样,这只恐龙是可以行动的,它是一个非常好的2D模型,这个恐龙非常逼真。
这两个都是当你看到一个2D视频之后看到增强现实背后的效果,大家可以看一下它背后的应用场景,假设你到星巴克,星巴克忽然有一个小产品放在你的面前,你可以通过扫描它知道它背后很多东西。再想象一下,如果你到博物馆里面,很多你不知道的内容都可以通过这种形式表现出来。这是在静态图片的能力,除了这个之外,我们另外一位科学家即将给大家演示目前行业里面从来没有人做过的非常有挑战性的一项技术。
(演示)桌子上有一个天猫精灵,是一个实物,我们的科学家从这个桌子边走的过程当中,无论什么角度都能识别出来它是天猫精灵。同时在底部也可以像刚才2DAR一样,我们可以增加内容上去。我们点进去看一下,这是一个青花瓷淘公仔。
所以刚才给大家演示了几个能力,一个是2D图像的识别和视频渲染能力。第二是微端次世代3D动画渲染引擎。第三个是弱纹理的物品跟踪,像天猫精灵这样一个产品放在这里,你是很难知道它到底是什么,以及深度学习的物体识别能力。这些能力目前在行业里非常少,而在我们阿里巴巴内部,双11也好、聚划算也好、天猫家装也好,都用了这样的AR能力。所以今天我们会把这个AR能力免费向行业开放,至于这个AR能力能怎么用,我也希望各个行业可以继续脑洞大开,来看一下它未来能给我们带来什么东西。
我们的AR能力包含了2D识别跟踪、3D识别跟踪、内容制作平台、标记物训练工具、微观次世代渲染、GPU加速、高品质3D素材库、稳定的云服务。
我们有两套灵活的解决方案,这套方案里面的SDK我们是完全开放的,你们可以集成我们的SDK,打造你们的专属解决方案。进入流程也非常方便。
目前已经服务的客户,中国国家图书馆、翰墨书香智能书法文具盒。国家图书馆希望未来的书法可以变得更较好,让每个小朋友、成年人,对中国的文化有想法、想了解的可以更快的知道怎么做。第二个是长江少年儿童出版社,打开任何一幅画,无论里面是诗歌也好还是图片也好,都能变成3DAR内容。
(PPT图示)这是我们AiGenie开放平台的入口。
我们今天总共回顾了三款产品,回顾一下。AiGenie语音开发者平台、AR开发者平台,以及天猫路由器。我们人工智能实验室致力解决智联网的各种问题,我们非常愿意创新,我们非常愿意把语音技术、图像技术等等带给所有的客户。也希望大家多多