背景: 沃尔沃汽车公司率先在汽车行业中大规模地先进行敏捷转型。一般来说,汽车软件开发的社会心理逻辑方面是一个研究不足的领域。在汽车软件工程领域,很少有关于团队成熟度或群体动态的研究。目的: 本研究旨在通过调查问题和问题报告与团队成熟度之间的联系,作为填补这一空白的第一步。方法: 我们对来自14个团队的84名参与者进行了定量研究,并通过发布培训工程师对所有参与团队的概述定性地验证了结果。结果: 我们发现,一个团队越成熟,他们似乎越快解决通过外部反馈提供的问题,至少在两个初始团队成熟阶段是如此。结论: 这项研究表明,在现代汽车软件开发部门,团队动态工作可能会提高生产力,但这需要进一步研究。
1 引言
敏捷方法在软件开发内部和外部都已经变得非常流行。与传统的计划驱动的开发(瀑布式流程)相比,这种模式被命名为敏捷,其字面意思是能够快速、轻松和灵活地进行。针对客户需求的可行的解决方案应该在与客户的紧密合作中开发,而不是受制于大量前期设计和计划的不确定性。随着汽车软件的爆发性增长,这种复杂性迫使汽车公司不仅要关注客户价值,而且还要依靠团队,以及团队的团队,来开发具有大约1.5亿行代码的现代汽车。这意味着,为了扩大开发项目的规模,需要了解团体动态的社会方面。汽车项目的不同之处还在于,敏捷方法在软件、混合和纯硬件团队中都有使用。不过,本研究的重点是在这种完全不同的背景下的软件团队,因为约800个团队基本上都是一起建造一个单一的产品。
关于汽车软件工程的研究主要集中在测试和建立软件模型方面。除了与个人有关的 "人为因素 "的研究(如Maro等人),我们无法找到很多关于组织心理学的研究。我们没有找到任何在汽车软件开发方面关于社会心理学的研究,特别是关于团队成熟度的研究。
在更广泛的软件工程背景下,对一般敏捷软件开发(即非汽车)团队的自组织进行了一些研究,也被称为团队自主性。Moe等人认为,敏捷团队自主的障碍之一是缺乏对团队的系统支持,减少了外部自主权。最近,Hodgson和Briand[11]研究了团队如何随着时间推移采用敏捷实践。他们得出的结论是,一些团队进行 "大爆炸",而其他团队则逐一实施敏捷实践。他们看到一个趋势,即没有多少敏捷知识的团队成员更喜欢后者,而有经验的敏捷实践者更喜欢前者。沃尔沃汽车公司在过去五年中经历了敏捷转型,并大力推动为团队提供授权,让他们在更大程度上领导自己,即在非常大的规模上进行 "大爆炸",影响到近800个团队。
Hoda等人的研究表明,高级管理层在实现团队敏捷性方面具有关键作用。
Hodgson和Briand也指出,在软件工程背景下,将敏捷方法纳入传统管理是一个挑战。在更广泛的领导力研究中,有一些特质是一个好的领导者必须具备的,但最重要的是,所有领域的优秀领导者都会根据情况动态地调整他们的领导风格。领导力也可以被视为群体行动的一种功能,而不是一种角色,这使得它有可能随着时间的推移而共享或改变。这意味着不存在最好的领导风格,因为根据不同的环境、不同的团体和不同的人,需要许多不同的风格。在敏捷领域,例如,服务式领导被认为是领导力的基础,但其定义仍然模糊不清。领导力是一个很难研究的概念,因为它发生在复杂的系统中,并受到大量因素的影响。
Gren等人发现初步迹象表明,敏捷团队的定义与社会心理学中成熟团体的含义相重叠。敏捷团队取决于在协作行为方面是否成熟,以及是否经历了团体发展的初始阶段。成熟的团队也被认为可以更好地与其他团队合作,这在沃尔沃汽车公司扩展敏捷工作方式时很有意义。根据Wheelan,我们在本研究中将团队成熟度定义为团队在团队发展阶段中导航的程度。在韦兰(Wheelan)的群体发展整合模型(IMGD)中,小团体(或团队)开始于依赖和包容阶段,团队成员在沟通中是试试性的和礼貌的,需要建立一个初始的心理安全水平。团队成员对团体目标没有一个共同的心理模型,也不知道其他团队成员的真正能力。当更高的心理安全水平开始出现时,团队就会过渡到第二个阶段,即反依赖性和斗争。这是一个冲突阶段,但对于确定谁能做出什么贡献,并为团队的目的建立一个共同的心理模型,是绝对必要的。第二阶段之后,团队可以更好地组织工作,制定富有成效的团体规范。随着信任程度的提高和工作组织的不断改善,团队可以达到第四阶段,即工作和生产力阶段。
因此,领导力、自我组织和敏捷性可以被映射到团队发展阶段。从心理学的角度来看,随着发展周期的推进,团队的所有成员(包括管理者或领导者)必须改变他们的行为。团队成熟度,正如团队开发问卷(GDQ)所测量的那样,已经被证明与软件工程的生产力测量相关。在这项研究中,我们使用了一个最近开发的简短版本的GDQ,它包含13项,而不是60项,考虑到团队的可用时间,这使它实际上更有用。
如果社会心理学中关于团队成熟度和团队生产力之间联系的结果适用于汽车软件开发,那么在这种情况下,生产力的各个方面也应该与团队成熟度的测量联系起来。
2 方法
我们向沃尔沃汽车公司的14个从事纯软件开发的团队分发了GDQ的简短版本(GDQS)。这些团队还记录了他们在同一个月内对所交付的软件所产生的问题的数量。问题可以是例如bug或其他类型的修改请求。由于许多问题仍未得到解决,问题的数量可能会累积起来,所以它可能不是衡量当前团队表现的一个好方法。因此,我们转而考察了团队填写GDQS时同一个月问题的平均年龄。平均数对异常值很敏感,但沃尔沃汽车公司选择该指标作为KPI,因为所有问题都需要解决。来自所有14个团队的82名团队成员回答了GDQS。由于这是每个团队响应的平均值,而团队通常是3到12个人,估计这个响应率约为80%。
我们描述了数据及其模式或缺乏模式,并根据McShane等人的研究,避免使用𝑝值进行无效假设的意义检验。相反,我们使用基于贝叶斯数据分析(BDA)的方法,即我们将绘制所有参数的再抽样(使用马尔科夫链蒙特卡罗)分布,并明确我们的假设(见补充材料)。关于应用于软件工程的描述和教程参阅Furia等人。
注意,本文中所有的共享数据、图表和补充材料都是用任意的线性变换进行转换的。这样做是为了不暴露问题和团队成熟度的基本值,因为这被公司认为是敏感信息。问题的平均年龄是从沃尔沃汽车公司的Jira实例中下载的,团队成熟度的数据是通过公司自己的调查工具收集的。
在第二步,我们采访了发布培训工程师(RTE),这是一个对这一整组团队有全面了解的角色。受访者被要求描述围绕数据收集的情况,也被要求批判性地评估团队成熟度和团队解决报告问题的能力之间的联系。
根据以前对团队成熟度和生产力方面的研究(见第1节),我们假设前两个阶段(第1和第2阶段)应该与问题的平均年龄呈正相关,也就是说,在这些阶段要解决的合作方面越多,解决报告问题的时间就越长。我们还假设,后几个阶段(第三和第四阶段)将与报告的问题有相反的关系,因为这两个量表的数值越高,意味着越成熟(例如,更高的信任水平等)。
3 结果
3.1 定量分析结果
如图1所示的结果表明,线的方向与假设的方向一致。然而,图2显示,只有阶段1和阶段2的分布与零不同,接近95%可信区间。
如前所述,我们不想使用经典的NHST推断,这意味着我们认为这个定量结果是指示性的,但需要进一步研究。相反,我们想强调下面这些定性数据的重要性。
总之,当团队刚成立(或不太成熟),或处于创建团队目标的共同心理模式的冲突阶段,试图弄清楚谁能真正为实现这些目标做出什么贡献时,这些团队的问题平均年龄会更高。
图2 四个独立模型的重新抽样分布。每个模型以团队成熟度的一个发展阶段作为自变量,问题的平均年龄作为因变量
3.2 定量验证
以下是RTE在采访中评论的内容摘要:
在收集数据的时候,这些团队正专注于消除那些永远不会被处理的问题。该团队在内部开发了他们的软件,并希望消除他们从供应商那里继承的问题。这些团队在两个不同的平台上工作,一个是旧的,一个是新的。不同的团队在不同的平台上工作。与在新平台上工作的团队相比,在旧平台上的团队工作的积极性较低。在旧平台上工作的团队更愿意在新平台工作。在新平台上工作的团队甚至被安排在不同的城市。
关于这些团队的表现和合作的描述非常不同。关于他们报告的问题,一些团队可以在内部解决,而其他团队则高度依赖供应商。对于一些团队来说,解决问题是一项复杂的任务,有许多步骤。
在旧平台上工作的团队已经关闭了大量的问题,其他团队收到的缺陷报告被失误地认为是错误的。
与在新平台上工作的团队相比,在旧平台上工作的团队被评估为具团队成熟度较低。他们关闭了很多他们意识到永远不会被处理的问题。修复问题报告中的问题是所有团队日常工作的一部分。
这项研究的结果表明,汽车软件的开发已经转变为敏捷的工作方式,可能取决于团队的成熟度,以解决交付过程中的问题来提供价值。由于团队作为一个分析单位是敏捷组织的核心,对汽车敏捷软件开发的研究也应该使用社会心理学的理论和模型,以了解其中的机制。
在对变化做出更多反应的必过程中,沃尔沃汽车公司在过去五年中一直在进行敏捷转型。在进行这项研究时,该公司的一些部门比其他部门走得更远,但汽车软件和电子部门是转型的先驱者。
现在,汽车行业把软件作为获得竞争优势的关键,因此需要对适应汽车行业的软件工程进行研究以了解这个有点特殊的领域。不过,汽车软件工程的心理学方面还没有得到太多的关注,这项研究为填补这一空白跨出了小小的一步。迄今为止的研究主要集中在测试和建立软件模型,所调查的人为因素与个人心理有关(例如,Maro等人)。由于敏捷团队的自主性现在也出现在汽车软件的开发中,我们需要进一步研究这个背景下的自组织。Moe等人总结说,敏捷团队自主的障碍之一是缺乏团队支持系统。这也是沃尔沃汽车公司的敏捷转型中发现的一个方面,参与的团队(以及许多其他的团队)都接受了至少3个小时的Wheelan小组发展综合模型的培训。在填写完GDQS后,他们还可以使用与不同阶段相关的工具箱,希望这能帮助他们作为一个团队进一步成熟起来,但这还有待研究。
4.1 实际意义
我们认为,在沃尔沃汽车公司的汽车软件开发中,团队的成熟度会与生产力的各个方面相联系,但目前的研究是第一个显示出实际情况的数据。如果这项研究的结果适用于一般的汽车软件工程,那么它对开发此类软件有很多影响。许多挑战与敏捷转型同步进行,但也提供了让团队更快成熟的方法。其中一个意义是更加注重培训领导者和管理者(当然,除了培训团队之外),使他们的领导风格动态地适应团队的成熟度。一个团队不会在第一天就自我组织起来,因为团队成员不可能以前就认识。此外,还有领导方面的挑战,即设计好团队,确保良好的工作原则和规范,而不是对技术细节进行微观管理。敏捷领导被描述为“服务型领导”,这仍然是模糊的。但服务型领导的一个关键方面是,它挑战了许多管理者基于等级权力的领导思维模式,然而,敏捷型领导需要成为服务型领导,以一种服务于团队的方式,满足他们当前的实际需求。这也可能是面对不能建立心理安全的行为,例如[7]提到的。
目前的研究与Al-Sabbagh和Gren的结果一致,即通过GDQ衡量的团队成熟度与软件开发的生产力有关,并将其扩展到了汽车软件开发领域。对汽车行业来说,一个非常实际的意义是通过简短的验证调查来衡量团队的成熟度,比如GDQS,对管理人员、敏捷领导和团队成员进行团队发展方面的培训,比如使用团队发展综合模型,以提高团队交付中问题的修复速度。我们通过逻辑和定性数据推断出这种因果关系,因为快速修复问题会导致团队成熟的假设是没有意义的,然而,团队成熟度在团队建设干预措施和解决问题的速度之间的中介作用需要更多的研究。
4.2 对有效性的威胁
我们使用Gren创建的检查表的相关部分,用于行为软件工程研究。
可靠性。在GDQ和GDQS的开发过程中,内部一致性和稳定性都经过多次检验。在沃尔沃汽车公司的问题报告中,缺乏对问题的正式定义,这对我们实际测量团队的平均问题年龄的可靠性是一个威胁。进一步的研究应该明确要求有这样的定义,如果不存在这样的定义,则应该帮助定义。我们不知道极端值会如何影响沃尔沃汽车选择作为KPI的这个平均值。也许问题的中位数年龄可能更可靠。
结构有效性。被调查的结构是四个团队发展量表和问题的平均年龄。GDQS是一个验证良好的衡量团队成熟度的量表,我们只选择了沃尔沃汽车一部分中我们知道的团队,他们不断报告并维护问题报告。因此,所使用的结构的有效性被评估为高。
内部有效性。我们试图从理论上论证团队成熟度和问题的平均年龄之间的因果关系,但我们没有衡量任何其他混杂因素。潜在的混杂因素可能是工作类型、团队组成、对流程的一致性、个人能力等,而在一个社会复杂的适应性系统中,可能还存在很多。
[23]L. Williams. 2012. What agile teams think of agile principles.CACM 55, 4 (2012), 71–76.
分享不易,恳请点个【👍】和【在看】