华为小艺无处不在
2021 年 3 月,上海。沈飞你要不要出来立个 flag?聊到智能座舱的「极致流畅」时,坐在会议室中间的领导看了一眼身旁的沈飞。在同事们的笑声中,这位车载小艺产品经理的心情,觉得无奈又尴尬。华为终端业务 CEO 余承东曾亲自打电话施加压力:「车上的语音一定要做到极致!一定要带给用户最好的体验!」
华为常务董事、终端 BG CEO、智能汽车解决方案 BU CEO 余承东入职华为十几年以来,沈飞也经历过很多从 0 到 1 的项目,但产品会有一个迭代和市场反馈的过程,要求第一个版本就做出竞争力,而且还是在一个完全没进入过的领域,难度可想而知。因此,他并没有太大的信心。「极致流畅」,是华为内部对于鸿蒙座舱最重要的要求,沈飞看到这个词就头疼,觉得这个词给了他很大压力。他认为,在座舱场景,语音交互变得前所未有的重要,而现有的座舱网络以及能够与手机相比拟的算力,简直就是站在语音「极致流畅」的对立面。
根据世界卫生组织的数据,每年约有 130 万人死于交通事故,分心驾驶是主要原因之一。在此背景下,能够让驾驶员脱离屏幕的语音功能,自然就成为了评判智能座舱好坏的重要标准。华为很早就意识到了这一点——如果语音做不好,即便鸿蒙座舱再怎么优秀,都无法真正获得用户的认可。可是,要做得多好才算好?在产品初期,沈飞把目光放到了小鹏汽车身上。华为的标准一向都是做到第一、做到最好,「如果做不出竞争力,余总就要把我『干掉了』,在产品初期最起码能做到对标小鹏的水平。」
发现一个问题,解决一类问题从沈飞的话中不难看出,余承东非常看重车载小艺,践行「发现一个问题,解决一类问题」这一宗旨的余承东,还十分热衷于给员工找 bug。据不完全统计,从 AITO 问界 M5 开始样车测试到上市交付后的几个月里,余承东一共往测试群里丢了 200 多个问题。他要求相关责任人必须在 2 小时内给到反馈,并在 24 小时内拿出明确的解决方案。
2021 年华为冬季旗舰新品发布会现场尽管工作压力大了些,但沈飞认为,余承东还是为团队树立了一个非常好的导向。首先,做语音交互是一个「团体赛」,需要各生态、各部门的通力协作,而终端业务 CEO 的直接领导,模糊了各部门的边界,大幅提升了团队协同力。这种跨团队,甚至跨层级的组织,没有余总这个级别领导的关注,付出 3 倍、5 倍的努力也未必能有这么好的效果。「余总在群里面是不批评人的,」沈飞说。尽管余承东会闭门教训员工,但在群里,他会就具体的问题与工程师进行有效的沟通,「你只会觉得他怎么老提这么细节的问题?门把手的阻尼感、接缝的大小,他都要管。」
去年 5 月,有人向余承东反映,说遇到了小艺打不开充电口的情况,余承东照常将这一问题抛到了群里。按理来说,这时的小艺已经非常稳定了,沈飞觉得自己的团队不可能还犯这么低级的错误。余承东回复了一句:「兄弟们还是要谦虚点,深入看下这个问题?这可能就是一类不容易复现的问题。」在随后的三天里,这位 CEO 每天在自己车上反复执行「打开充电口」这一指令,试图复现这个 bug。「他就是想把问题和体验搞得非常明白,通过自己大量的使用体验和问题来牵引团队改进,从这个角度来说,余总才是我们所有产品的首席产品经理。」沈飞说。余承东不仅喜欢自己找 bug,还喜欢拉上别人和他一起找。
华为门店里的 AITO 问界 M5,图片来自:DearAuto当时距离 AITO 问界 M5 的交付还有几个月的时间,小艺仍不成熟,匆忙进店将面临两大难题:一是语音唤不醒,二是唤醒后容易「翻车」。但余承东坚持要让车子进门店,认为「不接受消费者的『炮轰』,没有办法快速成长」。2022 年 1 月到 3 月,是沈飞这些年工作压力最大的一个阶段,他到处跟不同团队就业务争论,分析后续的改进措施,期间也掉了很多头发。如今的他,特别讨厌「翻车」二字。回忆起 AITO 问界 M5 进店的第一天,沈飞表现得异常激动:「我一整天都在抖,不是在开玩笑。」他完全不知道进店后会出现什么样的问题,不知道云侧的服务器会不会宕机,不知道端云架构会不会出问题,不知道在长期使用的情况下小艺会不会无法唤醒……对于做产品的人来说,产品就相当于他的小孩,「产品的成功还是第一位的,我也要考虑这么长时间整个团队的付出和努力,小艺本身也迫切需要正向的回馈。这点情绪甚至都不能算作委屈,只是小插曲。」外部的意见永远是最敏感的。做语音交互,不仅要注重技术,更要关心消费者如何去感知。「爱的反向是冷漠,用户给我们提意见是爱小艺。用户和小艺实际上是一种正面的双向奔赴。」沈飞说。通过展出样车,沈飞和他的团队拿到了很多消费者的反馈,小艺也在不断进化。
这时,沈飞觉得已经能给小艺打 60 分了。AI 无处不在,小艺无处不在小艺,小艺,帮我把温度调到 23 度,窗户留个缝。
这句话出自余承东的一次对外演示,接到指令后,小艺出色地完成了它的任务。
实际上,「车窗留缝」这个场景,一开始并不支持,窗户只能全开、全关,或者有一个明确的百分比。这么一个小细节的加入,背后是一系列的需求评审和需求决策。2021 年 12 月 23 日,AITO 问界 M5 发布会后,华为专为车载语音成立了一个专项体验提升团队,智选车、车 BU,包括赛力斯的人都有参与。直到现在,该团队都在每周开会,讨论需求。他们将车载语音体验分解到 4 个 KEP:车控、导航、媒体,以及电话。「我们重点去攻这几个,花的力气比较大,要求 KEP 的所有路径不能有任何体验的『断裂』」 沈飞说。我们当时把业界车载场景下的语音助手的所有特性,每个特性要解决什么问题,都拎出来讨论了很长时间,再套上华为 CBG 这么多年积累的 KEP/KEI,目的就是通过这一整套用户体验路径,做一个能够覆盖消费者所有体验路径的助手。
其中最典型的就是
多音区和
语义拒识。
在车载场景下,乘客的位置是相对固定的,多音区的识别和语义拒识就变得非常重要。要做好这两点,不仅要考虑 CPU 的算力,还要考虑边界问题。比如,用户习惯看着屏幕说话,但麦克风实际并不在屏幕上;或是用户在下达指令期间,又和另外一位乘客进行交流。沈飞团队也很早识别出了问题的关键:
算法上优化音区边界,解决串扰问题;
模型上叠加多层语音、语义拒识,让车内用户交互不被干扰。
除了对指令的及时响应,用户还需要更多的主动服务。华为认为,小艺不只是一个交互工具,它还是一个助理,能够在合适的时候主动为用户完成一些事情。沈飞提到了「小艺建议」。小艺建议以服务卡片的形式出现在屏幕底部,除了日程上的提醒,小艺还会根据用户的使用习惯和所处场景,智能动态地推荐服务,甚至是进行车辆的主动控制。例如,进入隧道时,为了保持车内空气清新,小艺会自动开启内循环,并告知驾驶员;当车辆油量/电量低时,则会推荐附近的加油站或是充电站;用户即将到家时,小艺还会自动提醒有未取快递,并提供取件码。
沈飞表示,这些主动服务的背后,涉及到了环境、位置、场景,甚至是对驾驶员的感知。同时,感知跟决策又是放在一起的,为了确保小艺做出正确的决策,可能要拉动整个座舱域。在合适的时间、合适的地点,把合适的内容推送给合适的人,带给用户智能化的感知,成为用户出行并不可少的贴心助手,正是小艺努力的方向。
智能座舱,还有很多想象空间这个行业其实也很卷。
在立项之初,沈飞的目标就是「做用户最喜爱的语音助手」,只做到和竞争对手同等的水平,远远不够,只有持续提供改进和创新,常用常新,消费者才能持续关注你。如今一年多过去了,各家在车载语音上都卷出了差异化。如小艺背后的「端云协同」架构,在保护了用户隐私的同时,利用云侧的充足算力带来更高的准确性。但小艺与竞争对手最大的不同,还是其背后的华为全场景战略。
对于华为来说,小艺不仅是语音助手,更是一套能够实现更多场景联动的解决方案。其中一个例子就是在 AITO 问界 M7 上实现的「手机遗落提醒」功能。
华为一直在思考,怎样才能更好地发挥数据的价值?怎样才能在特定的地点更好地理解消费者?同时又不会让用户有被打扰的感觉?沈飞透露,当前有超过 99%的服务需求是用户主动向小艺发起的,而小艺主动发起的服务只有不到 1%,但在未来,后者的占比只会越来越高。这与智能座舱的发展潮流一样,是不可逆的。在沈飞看来,座舱的智能化应该分为两个层次。初级的智能座舱只是为用户带来了一个更智能的操作系统,提供了更丰富、更强大的功能,是一种很浅层的智能化,类似于智能手机与功能手机形成的对比。
往上一层就来到了人工智能,这是一种数据的智能化,一种感知的智能化。「大家都在专攻这个东西,这确实不是一年半载可以搞定的。」目前的小艺,已然有了这样的特征,沈飞觉得,「AI+数据+服务+平台」的价值,将陆续在鸿蒙座舱的升级迭代中体现。与此同时,软件的发展也在不断促进硬件的进步。沈飞举了一个例子。