今天文章的背景,是我前些天组织的一场线上研讨会,跟一些行业的朋友在一起做的交流和讨论:如何科学有效地评价智能座舱的用户体验?针对智能座舱以及汽车智能化方向的用户体验评测,如何创建一个可操作、可量化、可信可靠的评测模型?
会上参与讨论的大约30位朋友,他们分别来自理想、蔚来、一汽、智己、上汽、亿咖通、极氪、长安、阿维塔、华为、广汽、丰田、腾讯、德赛西威、等同行企业。大家经过交流和分享,碰撞出一些有价值的观点和启发,值得分享出来!
用户体验度量就是一种测量或评价用户体验的方法、数据体系。通过度量,使得所有用户体验度量都是可观测、可量化并以数字的形式表示出来的。对于一套科学的度量体系,通常具备以下特征。
可测量:可以测量采集得到,同一形式测量得到的数据可以相互比较。
可量化:把「这个产品体验好吗」转化为可以测量的概念,如用户留存率、流失率等。
可信可靠:保证度量结果的内在一致性和稳定性,确保质量。
可持续性:指标可以持续观察、跟踪和优化,利于产品迭代优化后指标数据的前后对比。
创建用户体验评测模型,第一步是筛选评价维度。
这些维度可以根据产品或系统的特点进行扩展或缩减,但是应该始终考虑用户的需求和体验,比如
目标用户的需求和期望——了解目标用户的需求和期望,以便确定哪些维度最重要。
经验法则——使用通用的经验法则,例如Nielsen的十项启发式原则,以确定可能的维度。
行业标准——在特定行业中,可能存在一些常见的评估维度或指标,可以使用这些标准作为参考。
专家评估——请专家评估产品或服务,并记录他们关注的重要维度和指标。
用户反馈——收集用户的反馈和意见,以确定他们认为哪些方面最重要。
通过这些方法,可以确定一组适当的维度来评估体验。企业可以制定自己的体验评测维度。
以下是互联网公司自建的评测方法:
Google的UX团队提出了GSM模型。G是Goal,S是Signal,M是Metric,是遵从 「目标-信号-指标」的过程来定义数据指标的方法。
PULSE模型是传统的网站衡量指标,从技术、用户忠诚度、商业收益来追踪产品的整体表现,无法直接通过模型去观测到用户体验是怎么样的。
HEART模型由Google于2010年发表于,是以用户为中心的度量模型。HEART模型的出发点是做以用户为中心的,能够用于大范围的用户体验度量方法。
支付宝UED团队提供以用户为中心的UBA(用户行为分析)+ APM(应用性能监测)闭环下的体验洞察,让产品体验可量化、可优化、可监控。更多还是To B的。
UES是阿里云设计中心通过多年设计实践中沉淀下来的云产品使用体验度量系统,在设计、产品、技术各团队对体验度量模型的认可度上,以及实际应用上,都是做的最为落地的。
五度模型是阿里1688UED团队在Google的HEART模型的基础上,结合国内互联网的特点,加上多年的设计经验总结出来的。五度模型的应用场景更加适合C端产品。
不同的评测维度,反映了企业对体验和业务理解,不能生搬硬套。
受互联网企业的启发和智能座舱体验评价普遍缺失的现实需要,,我们这次的研讨的目标就是创建一种如何科学有效地评价智能座舱用户体验的方法。
结合用户体验评测的经典方法和智能座舱的产品技术特征,我们把评测的维度分为6个。
功能做的多不如做的对,做的对是指功能是有用的。只有用户觉得有用的功能,才值得去做
交互的过程是否便捷和友好,反映的是产品的可用性。
系统的速度、响应时间、流畅性和稳定性等方面的表现,是支持用户体验的基石。
汽车不同于一般电子消费品或者互联网产品,行车用车的安全体验对于驾驶者和乘客来说非常重要。安全体验可以通过多种维度来衡量,例如车辆的安全性能、驾驶员辅助系统、碰撞安全性等。为了确保汽车的安全体验,汽车制造商需要对车辆进行全面的测试和评估,并考虑不同的使用情况和场景。此外,驾驶员和乘客的教育和培训也是提高安全体验的重要因素。最终,汽车的安全体验将直接影响消费者对汽车品牌和制造商的信任和忠诚度。
情感层面是用户对产品或服务所产生的情感和情绪。情感体验可以直接影响用户的感受和行为,对于提高用户的满意度和忠诚度非常重要。
NPS(Net Promoter Score)是一种客户满意度度量方法,可用于衡量客户对产品或服务的忠诚度和推荐度。NPS评分通常在0到10之间,通过将得分分类为推荐、中立和不推荐三个级别,可以了解客户在多大程度上愿意推荐产品或服务。较高的NPS评分通常表示客户更倾向于推荐产品或服务,因此也意味着更高的客户满意度和忠诚度。
对以上的六个评测维度,我们根据智能座舱的产品特性,进行下一步的的拆解,使其更有可用性。
如何理解和定义功能层面的有用性呢?
首先,功能必须具有价值,必须符合用户的预期,能给用户增益;
其次,功能是有效的,功能必须能有效地解决用户的问题;
同时,功能必须是实用的,功能必须有合适的场景触;
以及,其他可以补充的更有价值的细分。
对交互层面的有效性进步细化,比如易发现、易理解、可帮助、一致性、响应性、灵活性。
剩余评价维度的细化,包括系统层面的高效性、安全层面的安全感、情感层面的满意度、NPS层面的忠诚度,由于篇幅和阅读完成度的关系,不再正文中展示,但读者可以通过私信获取完整内容。
直觉上来说,体验评测的用例越多,评测的颗粒度越细,似乎数据就越可靠,但实际并不是如此。
我们在建立评测任务的时候,首先要明确评测的目的和重点。在实际的评测工作中,一定是先按照功能和模块进行测评,然后汇总座舱内容的全部功能的体验。这里就有一个Know—How,因为座舱不同的功能,渗透率不一致,所以不分轻重按照同样数量的用例去测,最后取得均值是不符合用户实际感受的。
那么怎么解决的这个问题的呢?我的建议,先按照功能模块去测试,得出各功能模块的体验数据,然后按照体验用例和用户场景的频度进行第二次加权统计,最终得出一份相对更加可靠的数据。
下面是建立具有代表性的评测任务和场景的示例:
要计算这些指标,必须以结构化的方式收集和分析数据。例如,要计算NPS,用户被要求在0-10的评分尺度上评估其推荐产品或服务的可能性,而批评者(评0-6的人)的百分比将从推荐者(评9-10的人)的百分比中减去。
总的来说,体验评估需要仔细的规划和执行,以确保收集和分析相关数据的有意义。通过使用定量和定性指标的组合,可以全面了解用户需求和偏好,并确定产品或服务设计的改进领域。
体验测评的用例库是不断完善和积累的,体验评测的用例库可以包括以下内容:
用户使用场景:记录用户在使用产品或服务的场景和环境,包括使用时间、地点、情境等信息,以评估产品的适用性和用户体验。
用户需求和期望:记录用户的需求和期望,包括功能、性能、界面、交互、安全等方面的要求和期望,以评估产品的满足度和竞争力。
用户行为和反馈:记录用户在使用产品或服务时的行为和反馈,包括操作、反应、意见、建议等信息,以评估产品的可用性和用户体验。
系统数据和指标:记录系统的数据和指标,包括性能、安全、稳定性、兼容性等方面的数据和指标,以评估产品的质量和可靠性。
以上为研讨成果的整理,如果对以上成果——用户体验评价模型进行命名,可以根据6个体验维度的首字母组合,权且称为UUPSSN模型。
所以你看,智能座舱或者汽车智能化的体验评测也没有那么难嘛~