光纤通讯网络的一个1,000W电源模块严重烧毁,就在一天前这个模块还能正常工作。公司高层选择用10美元的组件修复,以避免重新部署所有电源模块需承担的百万美元成本…但经过3年却又出现问题,为了保住钱包,本文作者该如何是好…?

这个故事发生在好些年前了。

光纤通信网络的一个1000W电源模块(PM)严重烧毁了,就在一天前这个模块还能正常工作呢。

每秒传输多Gb数据的网络突然中断,这件事立刻引起了最高管理层的注意。我开始研究这些原本“必须”永久工作的电信系统电源模块。为达到永远工作的目标,电源分配应采用冗余设计:尽管一个电源模块就可以完成工作,还是使用两个电源模块为同一机架供电,这样在另一个电源模块发生故障时可以随时切换。切换通过“热插入”完成,在热插入过程中机架不断电。

将电源模块热插入到40~60V电信总线是一件棘手的事。流入模块的电流由一个板载MOSFET控制。要处理1 kW,它必须完全打开或关闭。在插入模块时,从关闭到打开的瞬变必须快,但又不能太快,否则,为板载电容器充电的输入浪涌电流可能会使电信总线掉电。同一个MOSFET还兼作断路器。如果怀疑是板子内短路,则反应必须快,但必须忽略电源环境中常见的“讨厌”尖峰。

电源模块在部署之前已经通过了插入测试,但并没有全面完成可怕的短路测试。事实证明,如果反应太慢,MOSFET就会短路。在现场,电源模块的一个电容器发生了短路,随后MOSFET出现了故障,数百安培电流流入电路板。几秒钟后,集线器就被烟雾包围,主断路器跳闸,大部分网络中断。

为了修复这一故障,需要重新设计热插拔时序(通过几个电阻和电容设置)。尽管这听起来就像计算其值一样简单,但这一任务却十分重要。在由各种原因引起短路时,电源模块能够以可控的方式停止运行并重启,这证明了上述方法是有效的。

这时,最高管理层来到现场。当时已经部署了1000多个电源模块。修复方案的零件成本为10美元,而召回、修改并重新部署所有电源模块的成本超过100万美元。管理层决定继续修复。我很感激领导的信任。公司已接近收支平衡点,必须节约每一分钱。

三年后,我收到一封让我吃惊的电子邮件,说那个电源模块现场可能存在遥测故障。遥测在几周前就已经停了,但集线器工作正常,因此服务访问延迟了。我们拿到的替换部件看起来没什么问题,但是一装到测试架上马上就开始冒烟。尽管当时不知道这个模块是不是修订版,但凭直觉我感觉这个模块被改过。由于事关100万美元,我不能让自己“名声扫地”。

我意识到许多人很快可能遇到同样的问题,除非有奇迹发生,接下来必须进行令人头痛的计算。我不记得什么时候发生过奇迹,所以还是乖乖地跑到实验室去查看电源模块。在冲向实验室的路上,我一直在想是不是向公司赔偿100万美元的损失算了。我确实希望公司慈悲为怀,但即使免去90%的赔偿仍会让人不开心。一想到要损失这么多钱,我的感觉就很不好。到了实验室,我一眼就看到了测试机架上那块冒烟的电源模块,但我将注意力集中在与测试机架相连的实验室电源上。现在我的大脑开始高速运转,检查实验室电源设置。问题找到了! 实验室电源的电流限制设置为18A,达到这一水平会把这个电源变成电流源。

现在我不用担心银行存款不保了,于是开始梳理思路。所有已部署的电源模块都将MOSFET断路器设置为30A(在40V时,1 kW的裕度为20%)。 在舒适的实验室条件下(50V,20°C),测试机架的功率始终约为800W。随后,将实验室电源的电流限制设置为18A。我的猜测是,替换的PM发生短路后,由于外部18A电流限制,电源模块无法识别发生了短路。上电时,MOSFET强制保持线性模式,直到烧毁。

电源模块已经部署运行了数周,多亏采用了冗余设计:一块电源模块使机架保持运行,短路的电源模块则利用自己的无限能力轻松响应30A浪涌,使MOSFET以每隔几秒的间隔不停开关而保持工作状态。实验室过保护设置在20ms内毁坏了MOSFET。回到办公室时,我已经很清楚自己有办法修复这一故障了,我的钱包保住了。但是我仍然不确定整件事的罪魁祸首是不是那个便宜的电容。

编译:Jenny Liao, EDN China

责编:Luffy Liu

(原文刊登于ASPENCORE旗下EDN英文网站,参考链接:The $1 million recall,By Samuel Kerem)

  • 认真查找故障的精神值得推荐
阅读全文,请先
您可能感兴趣
物理世界对智能的需求正在推动边缘设备支持复杂计算,如人工智能、机器学习、数字信号处理和数据分析等。这增加了能源需求,而这些设备通常处于能源匮乏状态。因此,迫切需要从根本上重新考虑制造这些设备的计算硬件以提高能源效率。
英诺赛科此次上市标志着作为氮化镓功率半导体领域的龙头企业正式进入资本市场,并成为港股“第三代半导体”第一股。英诺赛科的开盘价为31港元,较发行价上涨了0.5%,但随后股价跌破了发行价,市值约为270亿港元......
SiC的特定特性要求对MOSFET器件和栅极驱动电路进行仔细选择,以确保安全地满足应用需求,并尽可能提高效率。在本文中,我们将讨论为SiC MOSFET选择栅极驱动器时应考虑的标准。
由于在满足所有要求方面存在不同的权衡,因此很难采用一种适用于所有情况的电流检测方法。
本文整理分析了30家本土上市半导体公司2024三季度财报数据,结合第三季部分企业的重点新闻,让读者了解目前本土电源管理芯片市场现状及企业布局。
宽禁带半导体材料的兴起成为了电力电子领域最为显著的变化之一。作为行业领导者,PI公司不仅敏锐地捕捉到了这一趋势,而且通过自主研发和技术创新,积极地适应了市场的变化。借该公司1700V氮化镓功率器件发布之机,笔者有幸对PI营销副总裁Doug Bailey进行了专访。
大多数研发人员和导热界面材料配方设计师可能会推荐使用具备诸多优异特性的硅。然而,也存在一些例外情况。这些问题强调了在选择导热界面材料时考虑终端产品最终应用的重要性.....
在与芯科科技(Silicon Labs)首席技术官Daniel Cooley的交谈中,我们了解到该公司在物联网(IoT)和智能边缘领域所发挥的作用和未来发展。
虽然绕过产品防伪保护的手段变得越来越高级,但是最新的 NFC 芯片技术提高了信息安全性,让品牌能够保护知识产权,预防客户误买假冒商品。
西门子推出Simcenter更新版本,助力客户简化工作流程,加快航空航天认证,同时提供深入洞见
会议推介2025中国国际LED产业发展大会暨首届JM Insights春茗会 主办单位:JM Insights 支持单位:深圳市平板显示行业协会 论坛时间:2025年2月20日 论坛地址:深圳·国展皇
“什么是5G,用户说了算”。记得在5G商用之前,当人们都在谈论5G是什么、5G到底能做啥时,这句话引起了业界广泛共鸣——5G建设和发展需倾听用户的声音,以消费者和各行各业日益增长的需求为导向。时至今日
● 第六届半导体湿电化学品与电子气体论坛将于3月19日在杭州召开1月20日消息,据外媒报道,英特尔已成为“某家公司”的收购目标,而特斯拉CEO马斯克被认为是该传闻中英特尔的潜在收购者!据悉,这一收购传
本文来源:智能通信定位圈《2025中国高精度定位技术产业白皮书》正在调研阶段,目前已经参与调研的企业有:长沙驰芯半导体科技有限公司北京瀚巍创芯电子技术有限公司深圳捷扬微电子有限公司深圳芯邦科技股份有限
论坛信息名称:第六届半导体湿电子化学品与电子气体论坛时间:2025年3月19日地点:浙江杭州主办方:亚化咨询日程安排3月18日16:30~20:00   会议注册3月19日09:00~12:00   
    三极管的电流放大作用应该算是模拟电路里面的一个难点内容,我想用这几个动画简单的解释下为什么小电流Ib能控制大电流Ic的大小,以及放大电路的原理。    我这里的三极管也叫双极型晶体管,模电的放
目前,联想已经在印度工厂生产笔记本电脑和台式电脑,后续还将生产 AI 服务器,而摩托罗拉智能手机、平板电脑和笔记本电脑也在由代工商 Dixon Technologies 进行生产。联想印度公司总经理
文|温风2024是所有豪华品牌都不好过的一年。中国市场豪华品牌在参与价格战和不参与价格战中反复横跳,也牵动着跨国品牌全球市场的销量和财报数字。想在全球豪华市场榜单脱颖而出,就必须在销量占全球近1/3,
1月20日,市场调查机构 CounterPoint Research发布的报告显示,2024 全年 PC 出货量达到 2.53 亿台,同比增长 2.6%,PC 市场已恢复到正常季节性波动,并随着 AI
一凡 发自 副驾寺智能车参考 | 公众号 AI4Auto给Cybercab装上方向盘,不就是Model Q?网友们的设想和期盼,似乎成真了,就在最近,有博主拍到特斯拉Cybercab居然有方向盘了,引