最近几年,人工智能大火,同时也引发了不少行业的兴起,智能音箱就是其中之一。作为人工智能落地的载体之一,在智能音箱这个战场上挤压了太多玩家:苹果、谷歌、亚马逊、阿里、腾讯、百度、小米。而在智能音箱汇总最关键的语音交互功能,表现如何呢?
一、调研背景
年11月发布亚马逊低调发布智能音箱Echo,内测半年后于年正式发售;当年销量为万台,16年销量万台,超越传统音箱领头羊Sonos,成为在线音箱行业霸主,一度在细分的智能音箱市场占据了99%的市场份额。
亚马逊发布的智能音箱Echo受到市场强烈反响以后,google在年5月发布googlehome,苹果在年WWDC发布智能音箱HomePod,国内厂商京东和科大讯飞合作推出叮咚音箱……一时间国际互联网和硬件行业巨头纷纷加入战局,争夺语音交互流量入口,带动了AI落地的一轮热潮。
智能音箱已经成为全球增长最快的消费级硬件。年6月苹果homepod发布以来,下半年至今,每月都有一两家科技公司发布智能音箱新产品或二代、三代产品。
目前为止,国内科技巨头BAT、小米,老牌电器厂商联想、苏宁,语音技术企业科大讯飞、思必驰,硬件技术创业公司出门问问、若琪等都陆续通过自研或合作的方式入局。
二、技术厂商
智能音箱的爆发离不开语音技术的支撑,掌握语音技术的有两类厂商。一是互联网巨头如Amzon、Google、BAT、苹果、微软等,二是专研语音交互技术的厂商如科大讯飞、思必驰等。
语音技术厂商通过自主研发软硬件产品,或对外输出技术,赋能传统智能音箱厂商、内容和互联网服务厂商,获取用户和数据,建立平台生态。
[仅代表笔者个人立场]
2.1国外一线语音技术提供商
1.AmzonAlexa
基本信息:AmzonAlexa是亚马逊的智能虚拟助理和开放平台,年启动研发,于年11月和Echo同时发布。Alexa具备语音技术能力,并通过运行独立的程序,称为“技能”(Skills)来实现不同功能应用(类似手机里在操作系统上运行APP),支持音乐播放、语音购物、智能家控、智能通讯等一系列功能。
由于其先发优势与大量的落地产品,不论是从产品搭载数量和智能水平上,alexa都已远超其他技术厂商(CNET在CES的统计)。
开放情况:Alexa年6月,亚马逊将Alexa开放给第三方开发者,发布了AlexaSkillsKit(ASK)和AlexaVoiceService(AVS)两套开发工具包,让开发者能够更加容易开发Alexa的“技能”;并设有了风险投资基金alexafound专门扶持语音交互领域的初创企业,以及大学生开发竞赛Alexaprize。
从年发布时的29余项技能,到如今近4w项技能,积极开放*策和不断优化的开发工具,使得Alexa拥有了远超其他技术厂商的海量技能。
应用范围:截止目前AmzonAlexa已陆续在全球38个国家开通(中国暂未开通),涵盖英语、德语、法语、意大利语、西班牙语和日语等6种语言(暂不支持中文)。
除了搭载自家echo系列音箱产品外,Alexa也赋能sonos、联想、哈曼卡顿等音箱产品,amzonfireTV等智能电视,amzonfire、华为mate9、HTC等平板电脑和智能手机,华硕、惠普、联想等笔记本电脑和PC,智能冰箱、智能灯、智能开关等智能家居产品,智能耳机、智能手表等可穿戴设备,以及包含福特、宝马、雷克萨斯、丰田等品牌的智能汽车。
2.GoogleAssistant
基础信息:Googleassistant是谷歌的虚拟助理,于年5月在谷歌开发者大会正式发布,支持语音交互,搭载在Google的智能手机和智能音箱中。
开放情况:年12月,Google推出开发者平台ActionsonGoogle,年4月发布了SDK(软件开发工具包)以便第三方开发者为Googleassistant开发应用程序,并进一步扩展支持智能汽车和其他智能家居设备。Googleassistant支持语音输入和视觉响应,可通过设备的相机识别物体并收集视觉信息。
应用范围:当前Googleassistant已支持英语、日语、法语、德语、西班牙语等8种语言,预计年底将支持30多种语言,覆盖95%的Android手机(暂不支持中文)。
除了搭载自家Googlehome系列音箱和Pixel系列智能手机外,Googleassistant还赋能索尼、诺基亚等智能手机,松下、LG、Sonos等品牌的智能电视、智能机顶盒、智能音箱产品,联想、爱可视等电脑及沃尔沃等智能汽车产品。
3.MicrosoftCortana
基础信息:Cortana是微软的虚拟智能助理,于年1月正式发布,逐步应用于搭载windows操作系统和Android/ios系统的移动设备。Cortana具备语音交互功能,并使用bing的搜索引擎信息回答问题,能够调用应用程序、查询天气、提供餐厅和景点推荐,控制智能家居。
开放情况:年的build开发者会议上,微软退出Cortana技能开发平台,允许第三方开发者为cortana开发技能。
应用范围:截止目前cortana支持包括中文(简/繁)、英语、德语、法语、日语在内的近10种语言。Cortana已集成到微软众多产品,如Edge浏览器、windows10、车机系统、Skype(微软的即时通讯服务),并赋能微软与harmankardon合作的智能音箱invoke等。
4.Applesiri
基础信息:Siri(SpeechInterpretationandRecognitionInterface)是苹果的虚拟助理。Siri公司创建于年。
起初Siri只是iOS平台的一个应用程序,苹果在年4月收购了Siri公司并重新开发后,Siri成为了苹果设备的内置软件,于年重新发布,并只允许在iOS、macOS中运行。
Siri支持语音交互,可以完成数据搜索、天气查询、设置闹钟等许多服务。
开放情况:年6月苹果开发者大会上开放了Siri接口,在IOS开发平台中新增Sirikit,支持开发者调用Siri展示应用内容。Siri目前暂无独立的技能开发平台。
应用范围:截止目前Siri支持包括中文(简/繁)、英文、法文、德文、意大利文在内的20余种语言,并赋能苹果全线产品,如iPhone、iPad、iPod、Applewatch、mac等。
2.2国内一线语音技术提供商
1.科大讯飞
基本信息:科大讯飞成立于年,是国内最大智能语音技术厂商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、识别、评测等多项技术上拥有国际领先的成果,与中国官方关联密切,堪称“中文语音产业国家队”。
科大讯飞占有中文语音技术市场70%以上市场份额,语音合成产品市场份额达到70%以上。
开放情况:讯飞开放平台是全球首个提供移动互联网智能语音交互能力的讯飞开放平台,基于讯飞开放平台陆续推出讯飞输入法、灵犀语音助手、AI+教育、AI客服、AI医疗(语音电子病历、医学影像辅助诊断系统、智能助理等)、晓译翻译机、飞鱼智能车载系统、家庭场景的讯飞魔飞麦克风系统等是多宽人工智能产品。
应用范围:科大讯飞支持34种语言,包括中文各地方言,目前已赋能长虹、海信、康佳等国内大牌智能电视、GlassX、ZWatch等可穿戴设备,奥迪、宝马、奔驰、通用、福特、上汽、广汽、长安、吉利、长城、奇瑞等国内外智能汽车,智能音箱(京东叮咚音箱)、聊天机器人(小鱼在家)等智能硬件产品,窗帘、空调等智能家居产品,为包括滴滴打车、高德地图、个App提供智能语音交互服务,覆盖聊天通讯、工具、视频、新闻、导航等生活领域的方方面面。
2.百度DuerOS·小度
基本信息:DuerOS是百度的对话式人工智能系统,于年7月百度AI开发者大会上正式发布。DuerOS具备影音娱乐、信息查询、生活服务、出行路况等10大类目共多项能力,用户可在不同场景下实现指令控制、信息查询、知识应用、寻址导航、日常聊天、智能提醒和多种O2O生活服务;同时支持第三方开发者的能力接入。
开放情况:DuerOS开放平台包括智能设备开放平台和技能开放平台,分别适应不同类型的硬件厂商和为开发者。为方便“上手”,百度发布了针对个人、产品厂商、特殊厂商的DuerOS套件,并融合包括声智科技、先声互联、Intel、Rockchip等第三方解决方案,上线了技能商店APP“小度之家”。
应用范围:DuerOS支持普通话、英语、粤语、四川话等多种语言,已赋能智能音箱、电视、冰等大小家电与智能家居产品,智能手机、手表等随身设备,车机、智能后视镜等智能车载产品,累计搭载万设备,日活超过万,有万DuerOS合作伙伴,落地80多家主控设备,积累了超过0名DuerOS开发者,DuerOS累计回答问题数已达24亿。
3.小爱开放平台·小爱同学
基本信息:小爱开放平台(原水滴平台)于年5月对外开放语音能力与SDK,基于小米的硬件生态和海量数据,提供全球领先的语音识别、NLP等多项人工智能技术,为开发者提供一站式的人工智能服务。
应用范围:小爱开放平台能力已在小米电视、小米AI音箱、小米金服‘米小贝’等小米软、硬件产品中集成,为小米生态链中万台IoT连接设备赋能,虚拟助手小爱同学的日活跃用户也达万。
4.AliGenie语音开发者平台·天猫精灵
基本信息:AliGenie开放平台于年10月12日云栖大会发布,由阿里巴巴人工智能实验室发起的,面向企业/机构/创业者/开发者,将阿里巴巴在人工智能领域积累的技术以API或SDK等形式对外共享的在线平台,目前已经拥有涵盖影音娱乐、新闻资讯、购物外卖、家居控制、生活助手、儿童教育等的多项技能。
应用范围:AliGenie开发者平台主要包括三大部分:精灵技能市场、硬件开放平台、行业解决方案,全面赋能智能家居、制造、零售、酒店、航空等服务场景
5.腾讯云·小微
基本信息:腾讯云的智能服务系统和智能服务开放平台,帮助智能硬件厂商实现语音人机互动和音视频服务能力。