光纤通讯网络的一个1,000W电源模块严重烧毁,就在一天前这个模块还能正常工作。公司高层选择用10美元的组件修复,以避免重新部署所有电源模块需承担的百万美元成本…但经过3年却又出现问题,为了保住钱包,本文作者该如何是好…?

这个故事发生在好些年前了。

光纤通信网络的一个1000W电源模块(PM)严重烧毁了,就在一天前这个模块还能正常工作呢。

每秒传输多Gb数据的网络突然中断,这件事立刻引起了最高管理层的注意。我开始研究这些原本“必须”永久工作的电信系统电源模块。为达到永远工作的目标,电源分配应采用冗余设计:尽管一个电源模块就可以完成工作,还是使用两个电源模块为同一机架供电,这样在另一个电源模块发生故障时可以随时切换。切换通过“热插入”完成,在热插入过程中机架不断电。

将电源模块热插入到40~60V电信总线是一件棘手的事。流入模块的电流由一个板载MOSFET控制。要处理1 kW,它必须完全打开或关闭。在插入模块时,从关闭到打开的瞬变必须快,但又不能太快,否则,为板载电容器充电的输入浪涌电流可能会使电信总线掉电。同一个MOSFET还兼作断路器。如果怀疑是板子内短路,则反应必须快,但必须忽略电源环境中常见的“讨厌”尖峰。

电源模块在部署之前已经通过了插入测试,但并没有全面完成可怕的短路测试。事实证明,如果反应太慢,MOSFET就会短路。在现场,电源模块的一个电容器发生了短路,随后MOSFET出现了故障,数百安培电流流入电路板。几秒钟后,集线器就被烟雾包围,主断路器跳闸,大部分网络中断。

为了修复这一故障,需要重新设计热插拔时序(通过几个电阻和电容设置)。尽管这听起来就像计算其值一样简单,但这一任务却十分重要。在由各种原因引起短路时,电源模块能够以可控的方式停止运行并重启,这证明了上述方法是有效的。

这时,最高管理层来到现场。当时已经部署了1000多个电源模块。修复方案的零件成本为10美元,而召回、修改并重新部署所有电源模块的成本超过100万美元。管理层决定继续修复。我很感激领导的信任。公司已接近收支平衡点,必须节约每一分钱。

三年后,我收到一封让我吃惊的电子邮件,说那个电源模块现场可能存在遥测故障。遥测在几周前就已经停了,但集线器工作正常,因此服务访问延迟了。我们拿到的替换部件看起来没什么问题,但是一装到测试架上马上就开始冒烟。尽管当时不知道这个模块是不是修订版,但凭直觉我感觉这个模块被改过。由于事关100万美元,我不能让自己“名声扫地”。

我意识到许多人很快可能遇到同样的问题,除非有奇迹发生,接下来必须进行令人头痛的计算。我不记得什么时候发生过奇迹,所以还是乖乖地跑到实验室去查看电源模块。在冲向实验室的路上,我一直在想是不是向公司赔偿100万美元的损失算了。我确实希望公司慈悲为怀,但即使免去90%的赔偿仍会让人不开心。一想到要损失这么多钱,我的感觉就很不好。到了实验室,我一眼就看到了测试机架上那块冒烟的电源模块,但我将注意力集中在与测试机架相连的实验室电源上。现在我的大脑开始高速运转,检查实验室电源设置。问题找到了! 实验室电源的电流限制设置为18A,达到这一水平会把这个电源变成电流源。

现在我不用担心银行存款不保了,于是开始梳理思路。所有已部署的电源模块都将MOSFET断路器设置为30A(在40V时,1 kW的裕度为20%)。 在舒适的实验室条件下(50V,20°C),测试机架的功率始终约为800W。随后,将实验室电源的电流限制设置为18A。我的猜测是,替换的PM发生短路后,由于外部18A电流限制,电源模块无法识别发生了短路。上电时,MOSFET强制保持线性模式,直到烧毁。

电源模块已经部署运行了数周,多亏采用了冗余设计:一块电源模块使机架保持运行,短路的电源模块则利用自己的无限能力轻松响应30A浪涌,使MOSFET以每隔几秒的间隔不停开关而保持工作状态。实验室过保护设置在20ms内毁坏了MOSFET。回到办公室时,我已经很清楚自己有办法修复这一故障了,我的钱包保住了。但是我仍然不确定整件事的罪魁祸首是不是那个便宜的电容。

编译:Jenny Liao, EDN China

责编:Luffy Liu

(原文刊登于ASPENCORE旗下EDN英文网站,参考链接:The $1 million recall,By Samuel Kerem)

  • 认真查找故障的精神值得推荐
阅读全文,请先
您可能感兴趣
金刚石以其优异的性能而闻名,长期以来一直有望应用于各种领域,但其作为半导体的潜力却一直面临着商业化的障碍。Advent Diamond公司在解决关键技术难题方面取得了长足进步,特别是制造出了掺磷的单晶金刚石,从而形成了n型层。
能量采集是低功耗电子设备供电技术发展的基本支柱,为实现对环境影响最小的可持续技术的未来铺平了道路。
台积电(TSMC)公布了最新的A16芯片制造工艺,改变了技术领先者的游戏规则。该工艺可能领先英特尔的18A节点。但目前还不清楚哪家公司将赢得工艺技术冠军。
希荻微表示,通过吸收Zinitix成熟的专利技术、研发资源和客户资源,可以快速扩大其产品品类,特别是在手机和可穿戴设备等领域的技术与产品布局。此外,Zinitix的摄像头自动对焦芯片产品线与希荻微现有的音圈马达驱动芯片产品线有较强的协同性。
电动汽车的核心部件是为车轮提供机械动力和转矩的电机。
BLDC的应用持续增长,主要市场驱动力来自于以下几个方面:工业类电机应用节能指令提出了新要求;印度对于吊扇应用,致力于实现50%的节能目标;越来越多设备的终端客户,希望有更好的使用体验。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
点击蓝字 关注我们德州仪器全球团队坚持克服挑战,为电源模块开发新的 MagPack™ 封装技术,这是一项将帮助推动电源设计未来的突破性技术。  ■ ■ ■作为一名经验丰富的马拉松运动员,Kenji K
在全球智能手机竞争日益激烈的情况下,谁能在高端市场站稳脚跟,谁就占据了主动权。一直以来全球智能手机市场格局都是,苹果专吃高端,其他各大厂商分食全球中低端市场。但现在市场正在其变化。根据Canalys最
文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
天眼查信息显示,天津三星电子有限公司经营状态9月6日由存续变更为注销,注销原因是经营期限届满。该公司成立于1993年4月,法定代表人为YUN JONGCHUL(尹钟撤),注册资本约1.93亿美元,
在当今人工智能飞速发展的时代,AI Agent正以其独特的方式重塑着企业的生产运营方式。澜码科技作为AI Agent领域的先行者,其创始人兼CEO周健先生分享了对大模型与AI Agent发展现状的深刻
‍‍据龙芯中科介绍,近日,基于龙芯3A6000处理器的储迹NAS在南京师范大学附属小学丹凤街幼儿园、狮山路小学、南京大学附属中学等学校相继落地。储迹NAS是基于最新的龙芯CPU--3A6000,其代表
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
[关注“行家说动力总成”,快速掌握产业最新动态]9月6日,据“内江新区”消息,晶益通(四川)半导体科技有限公司旗下IGBT模块材料和封测模组产业园项目已完成建设总进度的40%,预计在明年5月建成。据了
随着汽车智能化升级进入深水区,车载ECU(域)以及软件复杂度呈现指数级上升趋势。尤其是多域、跨域和未来的中央电子架构的普及,以及5G/V2X等车云通信的增强,如何保障整车的信息与网络安全,以及防范外部