一、电路是设计出来的。不要做个画图,要做个设计师。
一个电解电容紧挨着散热片焊接的,与电解电容相关联的那部分电路参数容易漂,现象和结果就是机器参数不稳; 绿色发光二极管的色调不一致,外观看起来不美观,发光管都有个波长的要求,即使都是绿光,波长的细微差别也会导致色差,而设计文件上并没对发光管的波长做出规定; 某块电路工作不好,发现将PCB板信号线的一个电感换成磁珠就好了,于是就改了BOM单,电路板上趴着个磁珠大肆生产了。常规理解看来,磁珠似乎和电感的特性是相同的,但事实上磁珠表现的是一个随频率变化的电阻特性,是消耗性的,而电感是储能特性,是储存性的削峰填谷。即使从实际结果来看,似乎更换器件后没问题,但其实并没有搞通真正的器件机理。病虽然莫名其妙的好了,但病毒的隐患仍在。
还有很多类似的问题,比如散热,似乎热设计只和机箱内温度有关,却忽视了一个致命的问题,温度系数,即使温度不够高到烫手的地步,温度的升高是否会导致温漂,温漂后的参数值是否会将器件的特征参数推到电路正常工作的边缘?
比如降额,几乎所有工程师都说“我们降额了,基本降了50%,余量是足够的,这个问题肯定没有”。那么降额时,所有该降额的参数都降到了安全范围吗?同一类功能的器件,换了不同封装形式或生产工艺的时候,一样的降额系数能降出一样的效果来吗?在特定位置、特定电路下的器件,明确哪个特定参数该降的更大一点吗?
还有电磁兼容、振动、可维修性、测试等等多方面的问题,知己知彼,百战不殆,在实际的考察中,发现既不知己、也不知彼的设计太多,不知己是不知道自己不知道什么,不知彼是不知道设计所面对的对象的诸多参数、条件、工艺、特性,而恰恰是由此引出了太多的技术问题。
二、电子可靠性设计原则
电子可靠性的设计原则包括:RAMS定义与评价指标、电子设备可靠性模型、系统失效率的影响要素、电子产品可靠性指标、工作环境条件的确定、系统设计与微观设计、过程审查与测试、设计规范与技术标准。
钱学森的水平和优势是什么?电子、机械、软件、测试、管理?
都不是,是系统方法论和工程计算。
当我们要决策一个电路的器件选型的时候,如果有一个基本公式,直接告诉了我们应该重视哪个指标,器件选型和电路设计就遵循规范,自然可以提升我们的可靠性设计了。
例如一个插座电缆,上面要通过10A的电流,是用2根8A的导线并联分流好呢?还是用一根14A的电缆好呢?通过可靠性模型可以轻松得到答案。
驱动一个发光管,是用三极管好呢,还是用运放好呢?
电子产品的可靠性设计需要注意以下基本准确:
1、产品结构和电路应尽量简便。
2、尽量选用成熟的结构和典型的电路。
3、结构要简单化、积木化、插件化。
4、如采用新电路,应注意标准化。
5、采用新技术要充分注意继承性。
6、尽量采用数字电路。
7、尽量采用集成电路。
8、逻辑电路要进行简化设计。
9、对性能指标、可靠性指标要综合考虑。
10、应尽量采用传统工艺和习惯的操作方法。
11、应不断采用新的可靠性设计技术。
12、在电子产品中,常采用的可靠性设计技术包括元器件的降额设计、冗余化设计、热设计、电磁兼容设计、维修性设计、漂移设计、容错设计与故障弱化设计等,有些还包括软件的可靠性设计。
三、提高电路可靠性设计方法
电路可靠性设计方法包括降额设计(降额参数和降额因子)、热设计(热设计计算、热设计测试、热器件选型)、电路安全性设计规范、EMC设计、PCB设计(布局布线、接地、阻抗匹配、加工工艺)、可用性设计(可用性要素、用户操作分析、设计准则)、可维修性设计(可维修性等级、评估内容、设计方法)
电路可靠性设计规范的一个核心思想是监控过程,而不是监控结果。
比如热设计,按照热功率密度、热流密度的计算确定下来的散热方法,您就不必担心散热不够了;按照热阻和结温的计算方法,选定了风扇和散热片,只要有足够的余量。
1、降额设计
所谓降额设计,就是使元器件运用于比额定值低的应力状态的一种设计技术。为了提高元器件的使用可靠性以及延长产品的寿命,必须有意识地降低施加在器件上的工作应力(如:电、热、机械应力等),降额的条件及降额的量值必须综合确定,以保证电路既能可靠地工作,又能保持其所需的性能。降额的措施也随元器件类型的不同而有不同的规定,如电阻降额是降低其使用功率与额定功率之比;电容降额是使工作电压低于额定电压;半导体分立器件降额是使功耗低于额定值;接触元件则必须降低张力、扭力、温度和降低其它与特殊应用有关的限制。
电子元器件的降额,通常有一个最佳的降额范围,在这个范围内,元器件的工作应力的变化对其失效率有显著的影响,设计也易于实施,而且不需要设备的重量、体积、成本方面付出太大的代价。因此,应根据元器件的具体应用情况来确定适当的降额水平。因为若降额不够则元器件的失效率会比较大,不能达到可靠性要求;反之,降额过度,将使设备的设计发生困难,并将在设备的重量、体积、成本方面付出较大的代价,还可能使元器件数量产生不必要的增加,这样反而会使设备可靠性下降。
降额的等级分为三个等级,分别称为Ⅰ级降额、Ⅱ级降额和Ⅲ级降额。
Ⅰ级降额是最大降额,超过它的更大降额,元器件的可靠性增长有限,而且使设计难以实现。Ⅰ级降额适用于下述情况:设备的失效将严重危害人员的生命安全,可能造成重大的经济损失,导致工作任务的失败,失败后无法维修或维修在经济上不合算等。
Ⅱ级降额指元器件在该范围内降额时,设备的可靠性增长是急剧的,且设备设计较Ⅰ级降额易于实现。Ⅱ级降额适用于设备的换效会使工作水平降级或需支付不合理的维修费用等场合。
Ⅲ级降额指元器件在该范围内降额时设备的可靠性增长效益最大,且在设备设计上实现困难最小,它适用于设备的失效对工作任务的完成影响小、不危及工作任务的完成或可迅速修复的情况。
2、 热设计
由于现代电子设备所用的电子元器件的密度越来越高,这将使元器件之间通过传导、辐射和对流产生热耦合。因此,热应力已经成为影响电子元器件失效率的一个最重要的因素。对于某些电路来说,可靠性几乎完全取决于热环境。所以,为了达到预期的可靠性目的,必须将元器件的温度降低到实际可以达到的最低水平。有资料表明:环境温度每提高10℃,元器件寿命约降低1/2。这就是有名的“10℃法则”。热设计包括散
热、加装散热器和制冷三类技术,这里笔者主要谈一谈散热技术。应用中常采用的方法:
第一种是传导散热方法,可选用导热系数大的材料来制造传热元件,或减小接触热阻并尽量缩短传热路径。
第二种是对流散热方式,对流散热方式有自然对流散热和强迫对流散热两种方法。自然对流散热应注意以下几点:
设计印制板和元器件时必须留出多余空间;
安排元器件时,应注意温度场的合理分布;
充分重视应用烟囱拨风原理;
加大与对流介质的接触面积。
强迫对流散热方式可采用风机(如计算机上的风扇)或双输入口推拉方式(如带换热器的推拉方式)。
第三种是利用热辐射特性方式,可以采用加大发热体表面的粗糙度、加大辐射体周围的环境温差或加大辐射体表面的面积等方法。
在热设计中,最常采用的方法是加散热器,其目的是控制半导体的温度,尤其是结温Tj,使其低于半导体器件的最大结温TjMAX,从而提高半导体器件的可靠性。半导体器件和散热器安装在一起工作时的等效热路图如图2所示。图中各参数的含义如下:
RTj—半导体器件内热阻,℃/W;
Tj—半导体器件结温,℃;
Tc—半导体器件壳温,℃;
Tf—散热器温度,℃;
Ta—环境温度,℃;
Pc—半导体器件使用功率,W。
根据图2,散热器的热阻RTf应为:
RTf=(RTj-Ta)/Pc-RTj-RTc
散热器热阻RTf是选择散热器的主要依据。Tj、RTj是半导体器件提供的参,Pc是设计要求的参数,RTc可以从热设计专业书籍中查到。下面介绍一下散热器的选择。
(1)自然冷却散热器的选择
首先按以下式子计算总热阻RT和散热器的热阻RTf,即:
RT=(Tjmax-Ta)/Pc
RTf=RT-RTj-RT。
算出RT和RTf之后,可根据RTf和Pc来选择散热器。选择时,根据所选散热RTf和Pc曲线,在横坐标上查出已知Pc,再查出与Pc对应的散热器的热阻R'Tf。
按照R'Tf≤RTf的原则选择合理的散热器即可。
(2)强迫风冷散热器的选择
强迫风冷散热器在选择时应根据散热器的热阻RTf和风速υ来选择合适的散热器和风速。
3、 冗余设计
冗余设计是用一台或多台相同单元(系统)构成并联形式,当其中一台发生故障时,其它单元仍能使系统正常工作的设计技术。冗余按特点分为热冗余储备和冷冗余储备;按冗余程度分,有两重冗余、三重冗余、多重冗余;安冗余范围分,有元器件冗余、部件冗余、子系统冗余和系统冗余。这种设计技术通常应用在比较重要,而且对安全性及经济性要求较高的场合,如锅炉的控制系统、程控交换系统、飞行器的控制系统等。
4、电磁兼容性设计
电磁兼容性设计也就是耐环境设计。首先要明白什么是电磁兼容性问题,电磁兼容性问题可以分为两类:一类是电子电路、设备、系统在工作时由于相互干扰或受到外界的干扰使其达不到预期的技术指标;另一类电磁兼容性问题就是设备虽然没有直接受到干扰的影响,但不能通过国家的电磁兼容标准,如计算机设备产生超过电磁发射标准规定的极限值,或在电磁敏感度、静电敏感度上达不到要求。为了使设备或系统达到电磁兼容状态,通常采用印制电路板设计、屏蔽机箱、电源线滤波、信号线滤波、接地、电缆设计等技术。印制电路板在设计布置时,应注意以下几点:
各级电路连接应尽量缩短,尽可能减少寄生耦合,高频电路尤其要注意;
高频线路应尽量避免平行排列导线以减少寄生耦合,更不能象低频电路那样连线扎成一束;
设计各级电路应尽量按原理图顺序排列布置,避免各级电路交叉排列;
每级电路的元器件应尽量靠近各级电路的晶体管和电子管,不应分布得太远,应尽量使各级电路自成回路;
各级均应采用一点接地或就近接地,以防止地电流回路造成干扰,应将大电流地线和沁电流回路的地线分开设置,以防止大电流流进公共地线产生较强的耦合干扰;
对于会产生较强电磁场的元件和对电磁场感应较灵敏的元件,应垂直布置、远离或加以屏蔽以防止和减小互感耦合;
处于强磁场中的地线不应构成闭合回路,以避免出现地环路电流而产生干扰;
电源供电线应靠近(电源的)地线并平行排列以增加电源滤波效果。
5、 漂移设计技术
产生漂移的原因主要是元器件的参数标准值与实际数值存在公差、环境条件变化对元器件性能产生影响或是使用在恶劣环境而导致元件性能退化等因素。
如果元器件参数值发生的漂移超出其设计参数范围,就会使设备或系统不能完成规定的功能。漂移设计是通过在设计阶段根据线路原理写出特性方程,然后通过收集元器件的分布参数来计算它们的漂移范围以使漂移结果处在设计范围内来保证设备正常使用的一种设计方法。
6 、互连可靠性设计
由于在大部分电子产品中都有接插件,为了降低这些连接部分的故障率,因此有必要进行互连可靠性设计,常采用的方法有:
注意接插件的选型,印制电路板应尽量采用大板或多层板,以减少接插点:
尽量减少可拔插点,以提高其可靠性,重要部件可采用冗余设计;
两个插头同时相对时,应采用将其中一个固定,另一个浮动的方式,来保证对准和拔插;
采用机械固定方式;
对于常插拔的部件,最好设计成单面走线;
连接空间应选择有序分割;
馈线和地线应隐蔽安装。
此外,在电子产品在可靠性设计中,有时还采用维修性设计技术、软件可靠性设计技术、机械零件可靠性设计技术、故障安全设计技术以及一些新的可靠性设计技术等。
四、可靠性工程
可靠性工程是在产品全寿命过程中同故障作斗争的工程技术,是研究产品故障的发生、发展,故障发生后的处理,修理、保障,以及如何预防故障发生、直到消灭故障的工程技术。
提高系统(或产品或元器件)在整个寿命周期内可靠性的一门有关设计、分析、试验的工程技术。系统可靠性是指在规定的时间内和规定条件(如使用环境和维修条件等)下能有效地实现规定功能的能力。系统可靠性不仅取决于规定的使用条件等因素,还与设计技术有关。有组织地进行可靠性工程研究,是20世纪50年代初从美国对电子设备可靠性研究开始的。到了60年代才陆续由电子设备的可靠性技术推广到机械、建筑等各个行业。后来,又相继发展了故障物理学、可靠性试验学、可靠性管理学等分支,使可靠性工程有了比较完善的理论基础。
产品的可靠性是设计出来的,生产出来的,管理出来的。可靠性工程是为了达到系统可靠性要求而进行的有关设计、管理、试验和生产一系列工作的总和,它与系统整个寿命周期内的全部可靠性活动有关。可靠性工程是产品工程化的重要组成部分,同时也是实现产品工程化的有力工具。利用可靠性的工程技术手段能够快速、准确地确定产品的薄弱环节,并给出改进措施和改进后对系统可靠性的影响。可靠性工程具体如下图1所示。
产品在需求分析阶段、设计阶段、工程研制阶段和生产制造阶段都需开展一定的可靠性设计分析、管理、试验工作。
按照产品的层次结构,产品的系统层次、装置层次、部件层次和零件层次都分别有相应的可靠性工作内容,即产品不同层次的可靠性影响因素和薄弱环节各有特点,需要分别开展相应的可靠性设计、管理、试验工作项目解决。系统设计师和项目管理者需要在产品的工程化角度把握可靠性工程的开展和实施。影响器件可靠性的主要因素包括器件的种类和数量、器件的额定工作电参数和电应力、额定工作温度和环境温度、元器件的质量等级和品质保证等级,器件的降额特性和热敏感特性,器件的储存可靠性;影响部件可靠性的主要因素包括器件本身的可靠性与器件相互影响,主要需要考虑的因素为热分析、电磁兼容、耐环境、信号完整性、潜通路和工艺工装;影响装置可靠性的主要因素包括部件之间的相互影响和结构、工艺、连接;影响系统可靠性的主要因素包括冗余设计、人机工程和系统可靠性设计。
建立可靠性工程体系,开展和实施可靠性工程是产品高可靠性的必要条件,可靠性设计分析是可靠性工程的基础,可靠性设计水平差的产品可靠性必然低;可靠性的设计需要可靠性管理,可靠性管理是开展可靠性设计的技术管理保证和组织结构保证;设计出的产品在生产阶段难免引入“瑕疵”,需要可靠性试验“暴露”。
按照鼓掌原因的统计,分析主要故障原因。针对主要矛盾,有针对性的制定措施,实现快速的可靠性提升。
可靠性工程,是将可靠性测试和设计,融入到设计过程中。
在概念阶段,汇总所有可靠性需求;在计划阶段,从设备组网、架构设计、冗余设计、FMEA设计等方面,对可靠性哦啊进行考虑。
在开发阶段,对计划的可靠性设计进行落实;在验证阶段对可靠性需求进行验证和测试。
五、可靠性测试
从硬件角度出发,可靠性测试分为两类:
以行业标准或者国家标准为基础的可靠性测试。比如电磁兼容试验、气候类环境试验、机械类环境试验和安规试验等。
企业自身根据其产品特点和对质量的认识所开发的测试项目。比如一些故障模拟测试、电压拉偏测试、快速上下电测试等。
下面分别介绍这两类可靠性测试。
1 基于行业标准、国家标准的可靠性测试方法
产品在生命周期内必然承受很多外界应力,常见的应力有业务负荷、温度、湿度、粉尘、气压、机械应力等。各种行业标准、国家标准制定者给出了某类产品在何种应用环境下会存在多大的应力等级,而标准使用者要根据产品的应用环境和对质量的要求选定相应的测试条件即应力等级,这个选定的应力等级实质上就是产品测试规格。
在产品的测试阶段,我们必须在实验室环境下对足够的测试样本一一施加相应的应力类型和应力等级,考察产品的工作稳定性。对于通信设备而言,常见的测试项目至少包括电磁兼容试验、安规试验、气候类环境试验和机械环境试验,而上述四类测试项目还包含很多测试子项,比如气候类环境试验还包括高温工作试验、低温工作试验、湿热试验、温度循环试验等。此类测试项目还有很多,这里就不做详细介绍。总的而言,所有的测试项目都属于规格符合性测试(即PASS或者FAIL测试),试验的目的都是模拟产品在生命周期内承受应力类型和应力等级,考察其工作稳定性。
2 企业设计的可靠性测试方法
由于网络产品的功能千差万别,应用场合可能是各种各样的,而与可靠性测试相关的行业标准、国家标准,一般情况下只给出了某类产品的测试应力条件,并没有指明被测设备在何种工作状态或配置组合下接受测试,因此在测试设计时可能会遗漏某些测试组合。比如机框式产品,线卡种类、线卡安装位置、报文类型、系统电源配置均可灵活搭配,这涉及到的测试组合会较多,这测试组合中必然会存在比较极端的测试组合。再如验证该机框的系统散热性能,最差的测试组合是在散热条件机框上满配最大功率的线卡板;如果考虑其某线卡板低温工作性能,比较极端的组合时是在散热条件最好的机框上配置最少的单板且配置的单板功耗最小,并且把单板放置在散热最好的槽位上。
总之,在做测试设计时,需要跳出传统测试规格和测试标准的限制,以产品应用的角度进行测试设计,保证产品的典型应用组合、满配置组合或者极端测试组合下的每一个硬件特性、硬件功能都充分暴露在各种测试应力下,这个环节的测试保证了,产品的可靠性才得到保证。
以下举两个例子来说明如何根据产品特点设计出可靠性测试方法。
2.1实例一:包处理器外挂缓存(Buffer)的并行总线测试
为了应对网络的突发流量和进行流量管理,网络设备内部的包处理器通常都外挂了各种随机访问存储器(即RAM)用来缓存包。由于包处理和RAM之间通过高速并行总线互连,一般该并行总线的工作时钟频率可能高达800Mhz,并且信号数量众多,拓扑结构复杂,在产品器件密度越来越高的情况下,产品很可能遇到串扰、开关同步噪音(SSN)等严重的信号质量问题,针对上述可能遇到的问题,我们需进行仔细的业务设计,让相应硬件电路的充分暴露在不利的物理条件下,看其工作是否稳定。
串扰,简单的来说是一种干扰,由于ASIC内部、外部走线的原因,一根信号线上的跳动会对其他信号产生不期望的电压噪声干扰。为了提高电路工作速率和减少低功耗,信号的幅度往往很低,一个很小的信号干扰可能导致数字0或者1电平识别错误,这会对系统的可靠性带来很大影响。在测试设计时,需要对被测设备施加一种特殊的业务负荷,让被测试总线出现大量的特定的信号跳变,即让总线暴露在尽可能大的串扰条件下,并用示波器观察个总线信号质量是否可接受、监控业务是否正常。以16位并行总线为例,为了将这种串扰影响极端化,设计测试报文时将16根信号中有15根线(即攻击信号线Agressor)的跳变方向一致,即15根信号线都同时从0跳变到1,同时让另一根被干扰的信号线(即Victim)从1下跳到0,让16根线都要遍历这个情况。
开关同步噪音也是RAM高速并行接口可能出现的我们所不期望的一种物理现象。当IC的驱动器同时开关时,会产生瞬间变化的大电流,在经过回流途径上存在的电感时,形成交流压降,从而产生噪音噪声(称为SSN),它可能影响信号接收端的信号电平判决。这是并行总线非常恶劣的一种工作状态,对信号驱动器的高速信号转变能力、驱动能力、电源的动态响应、电源的滤波设计构成了严峻的考验。为了验证产品在这种的工作条件下工作是否可靠,必须被测设备(DUT)加上一种特殊的测试负荷,即特殊的测试报文。
举例:
如果被测总线为16位宽,要使所有16跟信号线同步翻转,报文内容应该为:
FFFF0000FFFF0000
如果被测总线为32位宽,要使所有32跟信号线同步翻转,测试报文内容应该为:
FFFFFFFF00000000FFFFFFFF00000000
如果被测总线为64位宽,要使所有64根信号线同步翻转,测试报文内容应该为:
FFFFFFFFFFFFFFFF0000000000000000FFFFFFFFFFFFFFFF0000000000000000
如果报文在DUT内部的业务通道同时存在上述位宽的总线,业务测试必须加载上述的报文,看DUTUUT在每种报文下工作是否正常,同时在相应总线上进行信号测试,看信号是否正常。
2.2实例二:热测试
热测试通过使用多通道点温计测量产品内部关键点或关键器件的温度分布状况,测试结果是计算器件寿命(如E-Cap)、以及产品可靠性指标预测的输入条件,它是产品开发过程中的一个重要的可靠性活动。
一般而言,热测试主要是为了验证产品的热设计是否满足产品的工作温度范围规格,是实验室基准测试,这意味着为了保证测试结果的一致性,必然对测试环境进行严格要求,比如要求被测设备在一定范围内无热源和强制风冷设备运行、表面不能覆盖任何异物。但实际上很多产品的工作环境跟上述测试环境是有差异的:
有些产品使用时可能放在桌子上,也可能挂在墙上,而这些设备基本上靠自然散热,安装方法不同会直接影响到设备的热对流,进而影响到设备内部的温度分布。因此,测试此类设备时必须考虑不同的安装位置,在实验室条件把设备摆放在桌子热测试通过,并不代表设备挂在墙上热测试也能通过。
有些网络设备在网吧行业用得比较多,几台设备叠在一起使用比较常见,做类似产品的热测试时,必须考虑到产品在此情况下热测试是否符合要求。
一些机框式设备,由于槽位比较多,风道设计可能存在一定的死角。如果被测对象是一块业务板,而这块可以随便插在多个业务卡槽位,热测试时必须将被测板放在散热最差的槽位,并且在其旁边槽位插入规格所能支持的大功耗业务板,后让被测单板辅助单板和满负荷工作,在这种业务配置条件下进行热测试。
针对不同的产品形态,硬件可靠性测试项目可能有所差异,但是其测试的基本思想是一致的,其基本的思路都是完备分析测试对象可能的应用环境,在可能的应用环境下会承受可能工作状态包括极限工作状态,在实验室环境下制造各种应力条件、改变设备工作状态,设法让产品的每一个硬件特性、硬件功能都一一暴露在各种极限应力下,遗漏任何一种测试组合必然会影响到对产品的可靠性。
中国航天之父 钱学森手稿
锤子手机似乎好像已经淡出人们的视线。锤子T1手机追求罗永浩的理想主义,而导致手机生产不出来的惨痛教训,先帮助大家回顾一下:
1、罗永浩团队耗费精力、频获好评的设计细节,在一线工人眼中导致多道生产工序繁琐,甚至直接导致此前低良品率问题。
2、锤子手机采用的是玻璃纤维增强树脂与不锈钢骨架一体成型的特殊材质,在这种材质上打孔,经常遇到碎裂的问题。
3、一位工人回忆,刚来新产线的第一天,经过包装后的锤子成品,300台当中做出7台合格品。经过一个多月的磨合,虽然良率有所提高,但每天也只有不到20%的良品率。
4、对外观造型的苛刻直接导致了生产过程的复杂和繁琐。富士康生产线上的抱怨声,也因此有迹可循。
5、大灰屏,和红米差不多。原因是屏幕贴合的不好,导致屏幕反光发灰,类似你贴膜没贴好气泡反光发灰。
6、屏易碎,推测原因是在屏幕上加了三个实体键之后,导致屏幕受力不均,这是设计问题,无可挽回。生产过程中就出现碎屏。
定义:
可制造性设计的核心是在不影响产品功能的前提下,从产品的初步规划到产品的投入生产的整个设计过程进行参与,使之标准化、简单化,让设计利于生产及使用。减少整个产品的制造成本(特别是元器件和加工工艺方面)。减化工艺流程,选择高通过率的工艺,标准元器件,选择减少模具及工具的复杂性及其成本。
简单的说,就是设计出来的东西不能让产线生产很麻烦,导致生产人员骂娘!设计出来的产品不要跟锤子手机一样良率比较低,生产成本昂贵。
执行:
由于DFx很少在小公司提及,或者类似可靠性设计、节能、环保、可供应性等范畴,只不过不是通过“DFx”这个装逼神词被提及的。所以很多人看到DFx这个词觉得高大上。
我们解构一下DFM这词的执行过程:
第一步、建立意识。设计人员考虑的不只是功能实现这一首要目标,还要兼顾生产制造方面的问题。这就是讲,不管你设计的产品功能再完美、再先进,但不能顺利制造生产或要花费巨额制造成本来生产,这样就会造成产品成本上升、销售困难、失去市场。(设计人员兼顾到生产制造方面的问题,不但需要设计人员本身提升生产考虑方面的技能和经验,同时需要全员提升DFM的意识,特别是生产和设计部门这两方面的领导更要确信DFM的必要。)
第二步,提升设计的生产考虑。统一设计部门和生产部门之前的信息,建立有效的沟通机制。这样设计人员就能在设计的同时考虑生产过程,使自己的设计利于生产制造。
第三步,生产人员辅助设计。选择有丰富生产经验的人员参与设计,对设计成果进行可制造方面的测试和评估,辅助设计人员工作。
第四步,让设计人员去生产线。安排合理的时间给设计人员,以及DFM工程师到生产第一线了解生产工艺流程及生产设备,了解生产中的问题。以便更好、更系统地改善自己的设计。
DFM的意义
降低成本、提高产品竞争力
低成本、高产出是所有公司永恒的追求目标。通过实施DFM规范,可有效地利用公司资源,低成本、高质量、高效率地制造出产品。如果产品的设计不符合公司生产特点,可制造性差,即就要花费更多的人力、物力、财力才能达到目的。同时还要付出延缓交货,甚者失去市场的沉重代价。
优化生产过程,提高生产效率
DFM把设计部门和生产部门有机地联系起来,达到信息互递的目的,使设计开发与生产准备能协调起来、。统一标准,易实现自动化,提高生产效率。同时也可以实现生产测试设备的标准化,减少生产测试设备的重复投入。
利于技术转移,加强公司协作
现在很多企业受生产规模的限制,大量的工作需外加工来进行,通过实施DFM,可以使加工单位与需加工单位之间制造技术平稳转移,快速地组织生产。可制造性设计的通用性,可以使企业产品实现全球化生产。
新产品开发及测试的基础
没有适当的DFM规范来控制产品的设计,在产品开发的后期,甚至在大批量生产阶段才发现这样或那样的组装问题,此时想通过设计更改来修正,无疑会增加开发成本并延长产品生产周期。所以新品开发除了要注重功能第一之外,DFM也是很重要的。
适合电子组装工艺新技术
现在,电子组装工艺新技术的发展日趋复杂,为了抢占市场,降低成本,公司开发一定要使用最新最快的组装工艺技术,通过DFM规范化,才能跟上其发展的脚步。
PCBA相关的DFM设计
电子产品的可制造性设计核心在于印制电路板PCBA的DFM,印制电路板的DFM即是指板级电路模块面向制造的设计技术,此技术旨在开展高密度、高精度板级电路模块的组装设计、制造系统资源能力与状态的约束性分析,最终形成支持开发人员对电路模块的可制造性设计标准及指导性规范。涉及主要研究内容如下。
(1)基于公司产品特点的电子元器件的选择技术、新型封装元器件的焊盘图形设计技术;
不同电子产品采用的元器件封装类型有很大的差别,比如便携类电子产品,如手机、PDA、笔记本电脑、数码相机等,采用的元器件一定是微型化的表面贴装器件,因为这样封装的器件有助于产品的微型化和便携性,而对于电源类产品,由于受表贴器件功率太小的限制,一般使用较多的插装类大功率器件,因此不同产品在制定器件选择的原则时会有较大的不同。这些器件的不同选择准则在产品概念设计阶段非常重要,它会影响到产品工艺路线的设计和制造效率。比如,对于便携式产品98%以上的器件都是SMD器件,如果设计人员没有DFM概念,选择了2%的THT器件,这样就会给后续的工艺路线设计带来极大的不便,如何为2%的THT器件设计加工路线将会成为一大困扰,如果在器件选择阶段避免了这个问题,后续的工艺路线设计就非常简单和高效。
(2)PCB几何尺寸设计、自动化生产所需的传送边、定位孔、定位符号设计。
尽管印制电路板种类繁多,制造工艺不尽相同,但是体现在产品可制造性上主要反映在以下设计要素上:印制电路的外形尺寸和精度,受设备加工尺寸和精度要求限制,设计时应考虑最大和最小加工尺寸,尺寸精度和工艺边的设计。在考虑印制电路板电气性能的前提下,要考虑多层印制板最多层数的限制,中间介质层和板的总厚度要求,比如层数增加而总厚度又有限制,这时对PCB的可制造性就会带来挑战。
(3)PCB加工能力设计,如最小线宽、最小线间距、最小过孔孔径、最小厚径比设计
(4)组装工艺辅助材料的选用技术
组装工艺的辅助材料也是DFM设计的重要内容,比如采用无铅焊接后,相应的助焊剂就需要更换为与无铅焊料相兼容的;又比如,对于散热器与IC器件之间的导热材料选择时必须考虑和分析器件的功率大小和散热需求。
(5)印制电路板工艺路线设计
工艺路线是整个电路板组装的加工流程,工艺路线决定了PCBA的加工效率成本和元器件的选择,常见的组装工艺路线有以下几种:
图1 电子组装常见工艺路线
对于不同的工艺路线,在选择器件时就要考虑,如果PCBA设计为双面SMT工艺,这时就要保证所有的元件都是SMD器件,并且在PCB布局时要考虑到那些较重的IC器件不布局到第一次加工面(B面),因为对于双面SMT工艺来说,加工T面时,B面的器件会再次经受一次回流过程,太重的器件可能会在焊膏融化时出现掉件问题。同样对于正面是SMT工艺,而背面是波峰焊工艺的单板,必须考虑到有些器件是不能用波峰焊来焊接的,比如细间距的SOP和QFP器件,BGA器件,即使对于间距较大的SOP器件,在布局设计时也要考虑到波峰焊特点,对器件的布局方向做要求,使用的焊盘要考虑到波峰焊的特点,使用偷锡焊盘设计,以避免在波峰焊过程中器件引脚间连锡缺陷的发生。
图2 不能进行波峰焊接的IC器件:BGA和QFN
图3 考虑波峰焊工艺的SOP偷锡焊盘设计及布局要求
图4 考虑波峰焊工艺的QFP偷锡焊盘设计及布局要求
(6)印制电路板印刷钢网设计
钢网是进行SMT焊料印刷必须的工具,钢网设计主要包括根据PCB和元器件的特点来选择钢网的加工类型,比如对于有细间距IC器件的PCB,其组装时对印刷精度有较高的要求,这时就需要选择钢网开口精度准确的加工方式,比如激光切割加电抛光,或电铸钢网。而对于没有细间距器件的PCB组装来说,加工时选择普通激光切割的钢网就可以了。对于那些比较复杂的PCB,往往在PCB上有细间距的IC器件,同时也会有些器件对焊膏的需求量很大,细间距IC器件要求的锡膏量较少,所以钢网的厚度要求薄,比如0.12mm厚,而要求锡膏量多的器件需要厚的钢网才能保证焊接的可靠,这时就会出现矛盾,怎么办?因为只有一张钢网,这种情况阶梯形钢网就是一个很好的选择,阶梯钢网是在钢网的不同位置有不同的厚度,厚的地方可以是0.15mm,而薄的地方可以是0.12mm,这样通过使用阶梯钢网就满足了不同器件对锡膏量的不同要求。
图5 化学蚀刻与激光切割钢网的对比
图6 Step Stencil用于使用不同器件锡膏量不同要求的阶梯钢网
(7)组装设备资源能力分析技术
DFM有两层含义,一层含义是在产品设计时要考虑到制造能力的限制,保证设计满足制造能力的要求,另一层含义是在规划一条生产线时,要根据产品的特点来进行设备的配置,对组装设备的资源进行规划和分析。比如对于手机产品的制造来说,由于手机电路板大量使用0402以下的CHIP器件,这样的小器件的检测必须配备AOI设备。
(8)印制电路板的可制造性设计规范
印制电路板的可制造性设计规范作为指导产品进行DFM设计的纲领性文件是必不可少的,应根据公司产品特点、质量要求和加工能力制定本公司的DFM设计规范。DFM设计规范应对PCB设计的主要方面进行明确而具体的要求,用来指导公司PCB的工艺设计。
(9)印制电路板的可制造性设计流程与平台
可制造性流程与工艺平台是进行DFM设计的保证,DFM设计不仅是一个技术工作,还是一个管理工作,因为DFM的工作实现必须有流程的保证和平台的支撑,只有流程建立了,节点定义了,人员责任明确了,DFM的工作才能落实;同样这些工作的技术支撑就是平台,比如DFM软件分析平台,如VALOR软件工具,可以对PCB的可制造性进行详细的分析,将公司的设计规范加入VALOR规则中,它就可以自动对PCB进行可制造性分析。
图7 DFM分析软件VALOR对PCB设计的分析
电子产品DFM设计案例
一般来说,在电子产品中价格最昂贵的元件是印制电路板PCB,没有推行DFM设计的公司在产品概念设计阶段很少分析PCB制造成本的影响,比如拼版方式的不同就会对PCB的制造成本产生较大影响,下图8和图9所示就是考虑DFM要求进行拼版优化和未进行拼版优化时PCB利用率的巨大差异。通过拼版优化PCB板材的利用率可以从58%提高到83%。
图8 原始设计的PCB布局
图9 拼版优化后的PCB布局
图10(a)所示为焊盘设计时没有考虑到波峰焊接过程的特点,即器件焊盘设计太短,导致波峰焊焊接时由于器件遮挡锡波的阴影效应作用,使得左侧焊盘漏焊;而图10(b)则通过焊盘加长就解决了此问题。这是一个典型的DFM问题。
图10 焊盘设计太短在波峰焊阴影效应作用下出现漏焊缺陷及改正焊盘长度后问题得以解决
结构相关的DFM
1、连接器
连接器应有识别栓以免配合时插错位置;连接器接片材料应一致(镀层应为金-金,锡-锡等),同一产品禁止使用不同供应商的连接器避免兼容性的问题;
连接器导向柱
2、进行整体机械装配和公差公析
如结合件的配合;对设计进行评估,以减少组件数目;进行工艺兼容性审核;进行共用性检查,以确保单一物料的订购和再设计最少化;元器件参考代码(如R1,R2等)是否与元器件、图纸、工艺指导一致;电路板上的元器件是否按标签格删配置,以避免特殊工装;电路板间距是否合理,以免影响后续插装等操作;
3、关于螺钉
如果可能,应避免使用螺钉;只使用标准件而且尺寸种类最小化;带螺丝紧固件的种类及数量应该最少化且应尽可能使用自锁性垫圈;应尽可能使用自紧式、带螺丝的插装件;紧固件的扭力必须在正式图纸文件上有明确规定;是否有足够的间距允许紧固件装配工具进入;避免使用铆钉,而使用螺钉;
4.电路板上的安装孔几组装/测试用的工装孔应是非电镀孔;
5.同等尺寸形状的电路板的工装孔尺寸/位置应一致,一减少专门夹具并节约机器设置时间;
6.减少装配时间
电缆连接器是否有自锁设计而不需另有工具?装配设计中是否考虑了最小电缆弯曲半径?所有预装的电缆都应明确标识并与图纸一致;是否易于拆卸维护/再利用/维修?应尽可能多地使用标准件;
工艺相关DFM
尽量避免在PCB两面均安放PTH元件,因为大幅度增加装配的人工和时间。 如果元件必须放在底面,则应使其物理上尽量靠近以便一次完成防焊胶带的遮蔽与剥离操作。尽量使元件均匀的分布在PCB上,以降低翘曲并有助于使其在过波峰焊时热量分布均匀!
2.元件引角的形状对焊膏通孔工艺(Paste-in-hole)选用圆形或方形是最好的。少选长方形或交叉形的。元件间距波峰焊时建议0.070",焊膏通孔工艺0.100".选用焊膏印孔工艺的元件能够耐回流焊接的温度,但波峰焊和焊膏通孔工艺都需要有支持块(stand-off)以便在散热时孔中的空气散出,防止气泡的产生。小于0.062”厚的PCB选用焊膏通孔工艺比较好,当厚度大于0.093”时对波峰焊和焊膏通孔工艺都比较难。
3.在自动化程度越来越高的组装工艺中,手工焊接和侵焊是不得已的做法。一般因为:SMT元件不能过回流焊接;双面PTH;第二面元件太重;第二面元件太高不能用选择性波峰焊;非常少的第二面元件不值得使用整条自动生产线。
4.特殊工艺如用于固定散热器的材料;低温的附件和返修所需的特殊焊锡丝;手工操作需要新的设备和工具;组装和返修空孔在焊盘内的元件等。另外看有没有新的工艺和新的设备需求。
5.导线与连接器:不要将导线或者电缆线直接接在PCB上,而应使用连接器,如果导线一定要直接焊到板子上,则导线末端要用一个导线对板子的端子进行端接。从线路板连出的导线应集中在板子的某个区域,这样可以将他们套在一起,以免影响其他的元件。使用不同颜色的导线以防止装配过程中出现错误,各公司可采用自己的一套颜色方案,如所有产品数据线的高位用蓝色表示而低位用黄色表示等.
关于华为的DFM
1、生产人员在IPD流程的各个环节,都参与关键文档的评审,参与所有关键技术评审点的审核。
2、研发阶段,结构件、电路板、所有组件经历大量的试装。提早进行各种试装,提早发现装配方式,结构干涉,装配效率等问题。
3、新生产导入(NPI)
4、制造的发言权非常高,生产对设计中,不满足DFM要求的设计,有一票否决权。
DFM文件应结合本公司的生产设计特点、工艺水平、设备硬件能力、产品特点等进行合理的制订。这样,在进行设计时,选择组装技术就要考虑当前和未来工厂的生产能力。从工业造型创意设计方面做出独特的思路,根据人体工程学原理设计出合理又实用的产品。这些文件可以是很简单的一些条款,进而也可以是一部复杂而全面的设计手册。另外,文件必须根据公司生产发展进行适时维护,以使其能更准确地符合当前设计及生产需求。
在对产品设计进行策划的同时,根据公司DFM规范文件建立DFM检查表。检查表是便于系统、全面地分析产品设计的工具,其应包括检查项目、关键环节的处理等。从内容上讲主要包含以下信息:
a. 产品信息、数据(如电路原理图、PCB图、组装图、CAD结构文件等内容)。
b. 选择生产制造的大致加工流程:AI、SMT、波峰焊、手焊等。
c. PCB尺寸及布局。
d. 元器件的选择和焊盘、通孔设计。
e. 生产适用工艺边、定位孔及基准点的设计。
f. 执行机械组装的各项要求。
如果说硬件工程师工作的对象是单板,软件工程师工作的对象是代码,那么项目经理工作的主要对象就是人,而且是一群性格各异,彼此之间可能毫不熟悉的攻城狮。要在最短的时间内完成团队的磨合,有效的开展工作,并且最好能在规定的时间和经费的范围内,顺利完成项目交付,项目经理没有十八般武艺,那怎么能hold住呢?
一张图说明项目经理是怎样累成狗的。
整体管理:影响一个研发项目成功的因素有很多,要确保一个研发项目能在规定的时间,规定的经费下顺利完成,更不容易。所以项目经理需要整体把握项目中的各个环节,协调各个模块之间的关系,确保项目的整体进度和质量。这些都需要项目经理对项目的各个环节了如指掌。虽然质量方面有QA辅助,需求有SE把握,人力资源有HR帮忙,但是我认为项目经理是整个项目中最能看到项目全貌的人,所以这些领域都要熟悉,才能够协调好质量,进度,人员,资金等各方面的问题。同时,比起单板和项目,人才是最难管理的,要做到项目团队都能服从安排,有一个良好的团队氛围,更是不容易。
曾经呆过一家做网站开发的公司,因为进度延迟,所以项目经理天天召集会议,甚至用上了番茄工作法,让开发人员每十五分钟填写一次日志,然后进度并没有得到改善。我觉得这个现象很奇怪,就跟参加会议的研发人员打听了开发的具体情况。原来是这样的:1.没有分析过功能模块的难度,计划都是拍脑袋出来的,这个模块3天,那个模块5天。导致了有的模块简单的,工程师很快完成后就坐等,有的模块复杂,工程师加班加点也完不成,这种情况更没办法 2.模块前端和后端有关联的部分没有规定协商的机制,一方出了问题影响到另外一方,大家就开始扯皮,这个说这部分工作不是我们负责的,那个说这部分工作该你们负责。到后来,大部分开会的时间都是扯皮。3.空闲出来的工程师没有提前做下一步的工作,闲置了一部分人力。结果有的工程师累死累活,还看着旁边的人逛淘宝,怎不心生怨言?
价值管理:分析和管理项目的价值,包括项目的投入产出,项目运作过程中产生的价值等。在华为,项目的价值分为外部价值和内部价值。外部价值对市场和客户而言,内部价值主要是指内部能力提升,技术储备等方面。
这个道理其实很简单,我们做任何工作,都要考虑为什么做这个项工作,需要我们投入多少精力,投入多少金钱,项目的收益是什么。特别是客户价值方面,我们的产品是否有竞争力,是否能提升客户的满意度,产品面世后是否能带来更多的潜在客户,都些都是在项目开始之前需要充分考虑的。对于华为这样的大公司来说,会做一些技术储备或则某些特定领域人员能力提升的项目,但是在大多数的小公司来说,需要考虑最多的一块,是客户价值。
价值的基本公式:V=F/C(V=价值,F=特性,C=成本)
可以看到价值是受很多方面的影响,特性,费用,进度,人力投入,资金投入等等。所以项目不能单纯追求某方面的突出,而是整体权衡的结果。
价值分析的方法有很多种:workshop,SWOT分析,产品竞争力分析等等,都可以综合运用。
强调一点:千万不要打着客户价值的幌子,过设计。过设计在大家身边应该不在少数,大家可以仔细回想一下。
对于客户价值的分析结果,我们可以用一张客户价值跟踪表来描述:
特性编号 | 特性描述 | 关键资源投入 | 价值藐视 | 评价标准 |
范围管理:明确项目的需求,并在项目实施的过程中确保需求的实现。如果在项目过程中出现需求的删减,增加,更改,都需要依据流程进行评审,决策,并且持续跟踪。
市场人员最头大的是:我让你给我开发一个保温杯,结果你给我了一个热水瓶。
研发人员最头大的是:今天你告诉我要开发一个保温杯,结果明天又给我说要一个热水瓶。
范围管理的重要不言而喻。虽然有时候市场的需求会变化,客户会抽风突然提出一个什么新功能,但是我们的项目经理一定要保持清醒。在项目的概念阶段,就要把项目的范围明确下来,包括产品的功能,性能,特殊实现需求,以及产品的交付时间,验收标准等,而且要给所有的需求进行排序,并且持续的跟踪管理。
在项目进行的过程中,任何需求的变更都需要召集相关人员,做严谨的评审,有时候看上去是一个小需求,其实会牵涉到各方面的问题,所以不能头脑发热。
又要拿前面那可怜的项目经理举例了,啊,他简直就是项目经理黑榜上的典范啊。公司开发的网站是一个差旅管理网站,在攻城师们动手码代码之前,先进行了客户需求访谈,并且整理了需求清单。结果到了项目黑盒测试的时候,市场人员对着需求清单对网站进行测试,发现A需求少了,B需求变样了,又跑出来一些需求清单上没有的功能,我们拿着需求清单和测试报告去问项目经理的时候,他居然来了一句:我也不知道,不知道研发人员是怎么搞的,怎么会变成这样子呢?搞得市场人员真的是苦笑不得,您天天开会是干嘛呢?睡大觉去了吗? 如果说客户是上帝的话,那么项目经理就是觉得上帝会不会发怒的关键人物啊,所以一定要睁大了眼睛盯着你的项目,ok?
质量管理:如果说需求管理决定开发一个热水瓶还是一个保温杯,那么质量管理就是来决定这个保温杯到底可以用十年还是用五年的。
质量管理包括制定项目质量策略、目标,定义支撑目标达成的过程活动和关键措施。可以看到,质量管理包括了交付件的质量管理和过程的质量管理。在华为的项目中,质量管理是由QA帮助项目经理一起完成的。在制定质量策划的时候,要根据项目的具体情况,客户的要求,再结合公司的基线数据,团队能力,制定合适的质量策划,并且对照公司流程活动,对本项目要执行的质量活动进行适配和裁剪。
这里要注意的一点是:对于交付产品的质量,大家都还比较重视,但是对于开发过程中的质量活动和交付件的质量,很多研发人员都不以为然,认为结果做好了就行,过程不重要。我觉得这是一个大误区,规范的过程是对好的结果的保障;高质量的交付件,既是对开发过程的记录,便于事后追溯,也是对经验的一个传承,当项目有新成员加入的时候,一份正确的高质量的过程文档,就是对项目最好的说明。
成本管理:分析产品的成本要求,明确产品的成本构成,并且要制定成本实现方案。这里的成本指的是交付产品的成本。其他资源成本属于财务管理的范围。
成本管理的内容我们用一张图来说明(不限于此):
成本管理的关键在于对成本的分解。大组件的成本解构成小模块的成本,影响成本的因素都一一列出,那么当所有成本项细分到不能再细分的时候,产品的成本构成就一目了然了。
在设计过程中,有很多细节都会决定成本的高低,比如关键器件的选择,独家供货器件,产品的制造工艺,软件的升级方式等。这些都需要在设计开发的过程中仔细考虑。
财务管理:对项目所需的经费进行预算和管理。直接费用主要包括两方面的内容:人员费用(员工工时工资,差旅费用,合作费用),物料费用(芯片样片,结构件,资料等)。财务管理的方式和成本管理大同小异,主要是做好预算,分解,和跟踪管控,就不再多说。
时间管理:管理和控制项目的进度,确保项目能按时完成。
时间管理,也是时间和项目活动分解与组合的一个过程。在华为的项目过程中,项目团队会根据确定好的项目范围,参照流程定义的标准活动个,来定义项目中的具体活动和完成活动需要的时间。在项目执行的过程中,对活动进行监控。如果进度出现偏差,则要调整进度计划或则采取其他的措施,来保证项目目标的达成。
时间管理要做好几方面的工作:1.在定义活动的时候,要对每个活动进行充分的估计,避免在计划期间,就将时间卡得过于严格。虽然说我们的攻城狮们对于加班加点已经习以为常,但是我们也不能把时间定得累死狗也完不成啊。2.对于相互之间有关联有依赖的活动,要注意时间交叠期,不能因为一个活动的偏差造成对其他关联活动的大的影响。最好在制定计划的时候就给出补充解决方案,以防事发突然。3.项目过程中的监控。如果项目都进行了一两个月了,你才发现项目的进度有问题,我只能说,你真的不适合当项目经理啊。
周四的时候,我和另外两个老师开车去珠海,给一家公司做培训。结果行程到一半的时候,发电机故障的标志灯亮了,亮了大概有5分钟,又灭了。以防万一,我们在最近的一个路口下了高速,并快速的找了一个修车店检查车辆。so sad!发电机是真的坏了,而且店铺里没有现成的零件替换,需要厂家送配件。结果就是我们比原定计划晚了三个多小时到达。如果把这件事当做风险管理的一个例子,那我认为我们的处理是妥当的。1.我们提前一天出发,没有因为这件事导致培训的延误;2.在标志灯亮了又灭的过程中,没有抱侥幸心理继续开,那样可能我们就真的躺在高速路上了更麻烦(一路上看到了5辆坏在高速路上的车) 3.事情发生后,团队成员没有互相抱怨,影响后面的情绪。
风险管理:风险是指项目中可能发生的某种不确定的事件,这些事件可能影响项目的进度,质量,范围。风险管理就是指对这种不确定的消极事件进行主动应对和管理,降低或消除它们对项目的影响。
风险管理主要有以下几个活动:风向管理计划——识别风险——分析风险——制定风险应对计划——控制风险。
风险管理计划指决定如何进行项目风险管理活动的过程。这个计划确定了项目管理过程中风险管理活动需要遵循的规则,例如:风险管理的方法,风向管理的活动,责任人,已经风险的类别定义等。
识别、分析风险:识别可能影响项目的风险并进行记录,同时对风险发生的概率和影响进行分析,对风险进行等级排序,识别出top风险。这一环节是整个风险管理过程中最重要的一个环节,并且是持续循环的一个活动。也就是说在项目的每个阶段,我们都要进行风险识别和分析,而不是在项目开始做过一次就了事。
制定风险应对计划:根据风险的优先级来定制应对风险的措施,包括需要的资源,责任人等。华为通常采用的几种应对风险办法:规避,转移,减轻,接受。
控制风险:跟踪已经识别的风险,实施风险应对计划,并且评估风险对项目的实际影响。
沟通,沟通,再沟通。以上所有的管理,都少不了这个最重要的环节。特别是研发出生的各位技术宅,更要多注意沟通方式和技巧,尽量做到事成人爽。好了,有空我们再来聊沟通的那些事吧。
上篇关于研发流程版本管理的文章发布之后,又有一些朋友来咨询关于流程建设方面的问题。我们先抛开其他的不谈,大家都先问问自己,流程到底是什么?什么样的公司需要流程?带着这两个问号,我们先看看一些例子。
昨天和好友逛街,她在一家店里买了好几件衣服,结账后就离开了。结果晚上到家后,给我发微信:一条裙子上配的皮带没有装进袋子,估计是店员不小心给漏了,也怪我们离开的时候没有再检查一下袋子里的衣服齐不齐,以后要完善购物的流程。她还说,你又多一个案列可以写了。呵呵,确实如此,如果把买衣服写个流程,我觉得一个简易的购物流程是这样的吧(忽略中间选择困难症的纠结):
如果我们每次都把核对商品这个环节做了,是不是就可以避免粗心犯下的错误?
前一阵到一个朋友的公司参观。他是某种进口工业用产品的中国总代理,产品的应用范围还比较广。他让我帮他定制一些流程规范,我说你需要什么样的流程规范?他说不出来,让我直接和他的职员们聊。分别聊了三个职员,一个负责网络销售兼文员,我们先看看她的工作内容。
这几样工作她具体是怎么做的呢?
找新图片,在各网站重新发布商品(这项工作占据半天的时间)。
公司网站维护,不定时。
在招聘网站发布招聘信息。
你们说说她的工作有没有流程?她的工作结果是怎样的?我先告诉你们她的工作结果:无论是阿里巴巴也好还是其他B2B网站也好,都没有产生订单,招聘也是毫无进展。那么她的工作有没有流程呢?当然有,先做哪一项再做哪一项,一共要做多少项,她很清楚。但是这样的流程有效吗?她已经忘记了工作的根本目标是什么,而在做简单重复的却毫无意义的工作。
还有一个销售兼发货的小伙子。发货是他的主要工作,销售是他的爱好。就不展开他的工作了,看看他问我的问题:发货记录和货的数量对不上,是怎么回事呢?我问:发货都有记录吗?他:有发货单。我:那怎么对不上?他:晚上发货是仓库另外一个人管理,他的单子要一个礼拜给我一次,不好对。我:你每天都去仓库吧?以后每天上午拿前一天晚上发货的单子,对好账。以后每半个月盘点一次。Ok,问题不就解决了吗,其实很简单,对不对。
看到这里,什么样的公司需要流程这个问题能回答了吧?我认为什么样的公司都需要流程。只是流程有简单有复杂,有的已经书面化了,有的还没有书面化而已。那么到底什么是流程呢?百度文库是这样讲的:指一个或一系列连续有规律的行动,这些行动以确定的方式发生或执行,导致特定结果的实现。在我的理解里,流程就是将一组特定的活动按照一定的顺序固化下来,什么人在什么时间做什么事应该达到什么样的效果,把这些要求明确在活动中,确保整个过程是可以复制成功的。
那我们到底应该怎样建流程?在流程建设的过程中应该注意什么呢?还是先讲个故事。那天有个朋友加我好友,说想了解IPD。我说,IPD的范围太广了,可能得讲两个月。他说:我想把我们公司用IPD规范。我就问他的公司规模有多大。然后他告诉我就一个硬件一个采购一个打杂(我估计这个打杂的就是老板自己)还有三个销售。然后我就没有继续聊关于IPD的话题,而是直接问他现在公司有什么样的问题。从后续的聊天中,我了解到,他的公司是做某种定制硬件产品的,客户非常多,但是每个客户只有几台的量,基本上也是一次性采购。他认为目前最大的问题是效率不够高,硬件打板的次数多,希望硬件生产采购形成稳定的三角关系。
根据他的描述和后来又提的一些问题,我给他的业务现状画了一张图:
我给的一点建议是:
1.客户和需求管理的流程要做。给需求排序有利于根据需求调整采购、生产安排。同时也能将定制化产品归类,为后续的订单提供一些数据参考。同时对客户的资料也是一个收集整理的过程,有利于为公司后续发展提供数据参考。
2.将组装过程流程化。简单重复又耗费大量时间的工作,通过流程将组装环节标准化流程化,后续招聘工资更低的工人来做组装,将硬件工程师投入到更重要的硬件设计环节中去。
3.硬件设计规范制定。制定基础的硬件设计规范,checklist,让其他人能够做一些最基本的检查,预防一些基本错误。比如说有次重新打板是因为一个元器件的封装不对导致的,我认为这种问题可以通过设计规范和检视规避掉。
流程的建设一定要基于公司的业务现状和流程现状。不要想当然,更不要指望能从哪里拿来一套现场的东西就可以用。华为的IPD是好,但是那只是华为的IPD,也是华为根据自身的业务特点一年一年优化出来的,并不是从IBM拿来就用的。要跟华为学IPD,也只能是学华为IPD的思想和方法,将好的思想方案运用到自己公司的流程建设中,才能为自己所用。
流程的建设和产品的开发其实是同样的道理。我把整个过程分为下面几个阶段,每一个阶段或则几个阶段之间,其实又有一些小的循环,就不再一一体现了。
梳理业务、流程现状:都不要再说自己的公司没有流程了,流程肯定有,只是能不能用,好不好用的问题。大的流程体系没有,也会有小的流程。那么一开始就要建设流程体系吗?我认为答案是否定的。中医有句话叫虚不受补,我觉得用于流程建设也是一样,当你觉得公司一团糟,什么流程都没有,或则都是混乱的时候,千万别一来就要建什么体系。你能想明白体系怎么建吗?而且建设一个体系岂是一朝一夕的事情?绝对不是反对建体系,只是要根据公司的具体情况人力投入已经各方面的情况来综合考虑,体系要建立,但并不是第一位的。
建设流程,我认为最开始是建设最能用到的,最能解决改善目前问题的流程。需要提高自己,就要先认识自己。所以建设流程的第一步,是认清自己的业务现状和流程现状。头脑风暴,白板讲解,思维导图,都可以帮助我们来理清业务现状。注意一点,一定是具体的业务现状,我们做了什么,怎么做的,责任人,涉及到的周边部门,现在的效果如何,都要一一的列出来,越细越好。千万不要来一句我们的销售流程有问题,这叫人从何下手?
分析痛点和需求:把业务流程现状梳理出来,第二步就是分析痛点,挖掘需求。就像有时候我们腿痛是腰椎间盘突出引起的一样,我们看到的业务痛点也不像表面看到的那么简单。所以面对问题的时候,我们不要轻易的被表象迷惑,而要冷静下来,去寻找问题的根源所在。就像上面的第三个案列讲到的,老板认为硬件和生产之间的衔接不顺畅,所以要建立硬件的规范,实际上的根本原因不在于硬件的规范,而在于需求的管理,以及硬件工程师的人力解放的问题。所以最先建立的不是硬件规范,而是组装机器的流程。
产品开发的过程本来就比较复杂,涉及到硬件,软件,结构,生产,采购各个环节,其中还掺杂了绩效管理,团队建设方面的人的问题。所以我们在面对问题的时候,一定要多从几个方面去找原因,综合解决,效果才会更好。
制定解决方案(输出流程文件):根据业务现状、流程现状的梳理结果,以及痛点和需求的分析结果,制定新的流程文件,流程文件包括流程图,规范,指导书,模板,checklist,IT系统等等。在制定流程文件的过程中,我觉得有几点需要注意的地方:
不要为了过程而过程,一定要考虑业务的绩效目的,过程是为了帮助我们更好的达成目标的。
责任主体要清晰明确。每个角色负责的活动以及交付件一定要清晰明白。不要给任何人有推诿的借口。就算是需要合作的部分,也尽量把合作的方式明确下来。
注意责权分立。特别是一些敏感的职位,不要出现监守自盗的问题。
试行:少部分业务先按照新的流程执行,看看执行过程中是否会遇到一些没有遇见的问题,根据试行的情况,再对整个流程进行修改。
发布:公司的相关部门正式发布流程文件,表示流程生效。相关的业务人员按照新的流程执行业务。(流程的适配和推行就不再多讲,参考上篇文章即可。)
除了上面这些,我觉得当你团队有下面的问题的时候,你就得去看看你的流程了:
1、同样的事情,犯过的错误,一直在错;
2、老员工不犯错,但每个新员工都犯一遍错误;
3、做一件事情,每个同事犯不同的错误,每个人都有自己的经验,但是没有分享;技巧都不统一。都是凭着工程师的经验做事情。
任何事情都不是一蹴而就的,包括流程的建设。我们每个公司,都应该在每个具体的细节上,去反思总结,持续改进。平时把一些可以参考的经验动作,都整理出来;每个人犯的错误,都书面化描述出来,整理成规范、checklist、模板;长此以往,自然就会有我们的流程规范了。