解密一颗芯片设计的全生命周期算力需求

陌上风骑驴看IC 2022-08-17 08:00


对广大半导体设计公司而言,算力资源规划和现金流之间的平衡,啧啧,是一门艺术。

多一分是浪费,少一分则崩溃。


我们曾经在初创型IC企业必备白皮书成长型IC企业必备白皮书里分别画过以下两张图:

左图名字叫做:守护现金流

这年头现金流的重要性,不必多说。


右图名字叫做:人生就是一场豪赌

不管是初创IC设计公司还是成熟公司,新开始一个项目,总是面临着前路未知的情况:

1. 周期性存在突发算力高峰需求,涉及到先进制程问题更加显著;

2. 每次调整制程,都面临新的资源预估永远估不准

3. 可能需要某些内部不可用的内存和计算资源


我们今天认真盘一盘,怎么把这门艺术拉下神坛。



先给大家一个直观感受。


下图是我们某客户全生命周期月度算力实际用量曲线整个芯片项目全流程为18个月,涉及前端、验证、后端三大团队。


1.  前4个月,只涉及到前端布局与架构,对于算力需求不高,因此月度算力需求较少;

2.  从5月开始,前端、验证、后端均开始工作,算力开始逐步提升,第11个月达算力小高峰,在第16个月达算力最高峰,月度调度峰值达到百万级核时以上

3.  算力波峰和波谷的核数差距在20倍以上

4.  算力在第16个月达到最高峰后,迅速下降。


下面我们手把手教你怎么把算力规划拉下神坛:


Part 1  小白版算法

Part 2  老司机版算法

Part 3  全年现实算力需求折算

Part 4  一个并不艰难的选择



Part 1 小白版算法针对的是:项目全新,团队人员也比较新,需要从零计算
Part 2 老司机版算法针对的是:项目全新,但有类似经验的老人在团队,可以凭经验值估算
PS:Part 1和Part 2 二选一阅读即可

为了简化计算,我们根据现实情况作以下假设:

1.  研发团队总人数为100;

2.  团队分为前端、验证和后端3部分,人数比值2:1:1;
3.  芯片的全周期分为3个阶段,每阶段4个月  (仅适用小白版算法);
4.  三个团队主要使用资源类型:前端团队使用计算型机器;验证团队前期使用计算型机器,之后使用内存型机器;后端团队使用内存型机器 。

Part1 :小白版算法


这套小白版算法是我们根据N家客户的实际情况,得出的经验参考值:包括不同阶段,不同团队的人员配比与人力占用比例,每人job数,每人每job峰值核数
因实际团队并非全程在此项目中,部分阶段人力需折算,即人力占用比例。
在我们的参考值基础上略做调整,大家就能大致得出自己公司的相应数值啦。

这套算法通过估算不同阶段内、各个团队所需的算力峰值之和,得出每阶段的算力峰值。
各团队的峰值计算公式为每人每job峰值核数(多台机器则为每台核数*机器数)*团队人数*每人job数(每个阶段计算方式一致)。

Stage 1:前期阶段(第1-4个月)



① 阶段工作详情:前端从事设计相关工作,验证团队同步参与,工作状态都较为稳定,此阶段每月峰值核数趋于一致;
② 涉及团队:前端、验证团队;
③ 资源并发需求:前端团队每人1台10核、验证团队每人1台20核。


该阶段峰值核时计算(计量单位:核小时):
1月:10核*50人*1job=500
2-4月:前端团队峰值核数=10*50*1=500 ;
验证团队峰值核数=20*25*1=500;
峰值核数总计为500+500=1000;
则该阶段的峰值核数在2-4月,为1000
(下同,不再详述这一计算过程)

Stage 2:中期阶段(5-8月)


① 阶段工作详情:涉及到前端仿真、验证和部分模块的版图工作。6月在前仿最后阶段做一次大仿真,是算力小波峰,随后算力下降;
② 涉及团队:前端、验证和后端团队;
③ 资源并发需求峰值:
5月:前端团队每人1台18核节点,每人1个job;验证团队每人4个job,每个job约18核(人力占用比例:75%);后端团队每人1台18核节点;
6月:前端团队每人1台24核节点,每人1个job;验证团队每人6个job,每个job约24核(人力占用比例:75%);后端团队每人1台18核节点;
7月:前端团队每人1台18核节点,每人1个job(人力占用比例:40%);验证团队每人3个job,每个job约18核;后端团队每人1个job,每job约4台18核节点;
8月:前端团队每人1个job,每个job18核(人力占用比例:40%);验证团队每人2个job,每个job18核;后端团队每人1个job,每个job约4台24核节点。


计算结果如下


Stage 3:后期阶段(9-12月)

① 阶段工作详情:主要涉及后端仿真相关工作;
② 涉及团队:验证和后端团队;
③ 资源并发需求:
9月:验证团队,每人4个job,每个job约18核;后端团队每人1-2个job,每个job约4台24核节点(后端人均完成1.6个job,取值1.6);
10月:验证团队每人6个job,每个job约24核;后端团队每人1-2个job,每job约6台24核工作节点(后端人力占用比例:80%,每人2个job)
11月:验证团队每人6个job,每个job约24核;后端团队每人1个job,每job约4台24核工作节点;
12月:验证团队每人6个job,每个job约18核;后端团队每人1个job,每job约3台24核工作节点。

计算结果如下
最终全生命周期力需求图如下(计量单位:核小时):
可以看出:
1. 和文章开头的实际用户算力曲线趋势一致
2. 不同月份间的峰值算力差异很大,能达到20倍左右;
3. 不同团队在不同月份的峰值算力需求差异明显。

Part2 :老司机版算法


如果对于未来芯片项目,你们有过来人能预估出不同团队不同阶段的算力需求,这套老司机版算法将完全适配你。
这套算法是我们根据有项目经验的芯片研发团队的实际情况,通过填入各月每job峰值核数、每月最大并行job数,计算出各团队每月所需的算力峰值。

下面为大家奉上这份《XXX芯片项目-资源需求调研模板》


左边项目为不同的项目团队。
项目团队内部可分为:前端、验证和后端组。

Step 1将不同组、每个job所需核数或内存的峰值需求,依次填入中间的“每job峰值核数”和“每job峰值内存”栏目下,负责人填入团队负责人”栏目下




例如:每个job需要的峰值核数为10,每个job需要峰值内存为20据经验值统计),前端负责人为Andy。


Step 2在每月栏目下,填入各团队预期的每月并行最大job数(简称:job数)




Job数可根据研发内部统计,也可根据job数=每人最大并行job数*人数进行计算,如团队并非全程在此项目中,人力还需折算统计。

例如:2022年2-5月,前端团队每人最大并行job数为1,团队有50人,均100%投入在此项目中,则填入下表的job数均为:50*1*100%=50。


Step 3计算各团队当月峰值算力并相加,得出峰值算力总计(计量单位:核小时)




各团队的峰值计算公式:每job峰值核数*job数(每个阶段计算方式一致)。


例如:2022年2-5月,前端团队每job峰值核数为10,job数为50;2月验证团队还未开始任务,3-5月,验证团队的每job峰值核数为20,job数为25;2-5月,后端团队还未开始任务。

计算过程如下
前端团队:2-5月:10*50=500
验证团队:3-5月:20*25=500
将各团队每月算力峰值相加,得到每月项目的算力峰值,计算得出项目各月算力峰值表

《XXX芯片项目-资源需求调研模板》Server一栏的Middle /High 型是用户自己设定的不同机器配置,后期计算不同机型费用时会用到,跟算力需求计算无关。

Part3 :全年现实算力需求折算


不管是小白版算法还是老司机版算法,都是一个月每天全部按峰值需求跑任务的前提下进行计算的。但实际情况下,肯定不需要一直按峰值顶格跑。

我们折算一下:
全月全资源峰值用量:峰值核数*30天*24小时
全月实际用量可能是:峰值核数*22天*8小时

用小白版算法的数据来调整:
6月算力小波峰:后端按30天*18小时估算,验证按30天*16小时估算;
10月算力大波峰:后端按30天*24小时估算,验证按照30天*16小时估算。

得出下表,并绘制成相应曲线图:


灰色曲线为按峰值计算的算力需求
橙色曲线为折算后实际需要的算力 

Part4 :一个并不艰难的选择


好了,全生命周期算力需求算完了。
到了算账的环节了。

灰色代表当月按峰值顶格算的用量橙色代表月度实际用量。
绿色代表本地资源,必须按这一阶段需求峰值准备,也就是按灰色来准备。买不到峰值,肯定会影响到芯片项目进度。

如果是纯本地,就是按绿色这根线买。现金流是必须要动用一大笔的了,采购周期也是必须要考虑的。
按照本文开头我们某客户全生命周期月度算力实际用量曲线波峰、波谷间差距可高达20倍,月调度核时峰值能达到百万级以上。顶格买……

如果是全云端,就是按橙色这根线花钱。想用就用,不想用就关掉,用了才花钱。现金流逐步平缓支出。

绿色线橙色线中间的差距(图中阴影部分),各人可能有各人的体会。
算力资源规划VS现金流
芯片项目周期VS市场竞争格局
具体怎么权衡和取舍,还是要看企业自己。

一颗芯片设计完整生命周期下,不同阶段,不同应用场景,对算力更精细的需求差异,我们相应的推荐和建议,以后再聊。

END -

我们有个一站式IC设计云平台
集成多种EDA应用,大量任务多节点并行
应对短时间爆发性需求,连网即用
跑任务快,原来几个月甚至几年,现在只需几小时
5分钟快速上手,拖拉点选可视化界面,无需代码

现在!我们的IC设计研发云平台支持免费试用,还送300元体验金
扫码免费试用~


如果你对这个一站式IC设计云平台还有更多想问的,比如:
1、你们支持哪些EDA应用?能覆盖到我常用的软件吗?
2、EDA应用所需的计算资源非常大,你们如何解决这个问题?
3、把EDA研发环境部署到云上有什么好处?
4、除了CPU,GPU/TPU/大内存的机器都有吗?
5、你们说的“一整套即开即用的IC研发设计环境”是什么意思?从本地到云上,操作方式会改变很大吗?
6、云端输出计算结果是否与本地完全一致?
7、云端这么多的机器,管理得过来吗?
8、云上有些资源很贵,有没有节约成本的方案?
9、任务监控也能用来省钱,你们是怎么做到的?
10、很多PDK,就有几十T,怎么到云上,而且需要持续更新?
11、如何云上保护我们的IP资产?
12、脚本每日都有变动,云上要增加工作量?工作脚本如何更新?
13、云上的EDA软件怎么部署安装?
14、License Server配置在本地和云端对计算性能/一致性/稳定性是否有影响?
15、使用平台的工作人员比较多,能否对每个人设置使用资源的上限?
16、公司有海外研发部门,用你们平台方便吗?
17、怎么保障数据安全?
……
答案都在这里,欢迎扫码添加小F微信(ID:iamfastone)免费获取~

关于为应用定义的云平台
居家办公=停工?nonono,移动式EDA芯片设计,带你效率起飞
续集来了:上回那个“吃鸡”成功的IC人后来发生了什么?
缺人!缺钱!赶时间!初创IC设计公司如何“绝地求生”?
一次搞懂速石科技三大产品:FCC、FCC-E、FCP
速石科技成三星Foundry国内首家SAFE™云合作伙伴
EDA云平台49问
国内超算发展近40年,终于遇到了一个像样的对手
帮助CXO解惑上云成本的迷思,看这篇就够了
花费4小时5500美元,速石科技跻身全球超算TOP500


陌上风骑驴看IC 闲情偶寄,谈天说地,拔草锄地
评论
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 33浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 41浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 81浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 48浏览
  • 文/Leon编辑/cc孙聪颖作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减K
    华尔街科技眼 2025-03-12 17:37 146浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 32浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 44浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 60浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 47浏览
  •        随着人工智能算力集群的爆发式增长,以及5.5G/6G通信技术的演进,网络数据传输速率的需求正以每年30%的速度递增。万兆以太网(10G Base-T)作为支撑下一代数据中心、高端交换机的核心组件,其性能直接决定了网络设备的稳定性与效率。然而,万兆网络变压器的技术门槛极高:回波损耗需低于-20dB(比千兆产品严格30%),耐压值需突破1500V(传统产品仅为1000V),且需在高频信号下抑制电磁干扰。全球仅有6家企业具备规模化量产能力,而美信科
    中科领创 2025-03-13 11:24 40浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 40浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦