解密一颗芯片设计的全生命周期算力需求

陌上风骑驴看IC 2022-08-17 08:00


对广大半导体设计公司而言,算力资源规划和现金流之间的平衡,啧啧,是一门艺术。

多一分是浪费,少一分则崩溃。


我们曾经在初创型IC企业必备白皮书成长型IC企业必备白皮书里分别画过以下两张图:

左图名字叫做:守护现金流

这年头现金流的重要性,不必多说。


右图名字叫做:人生就是一场豪赌

不管是初创IC设计公司还是成熟公司,新开始一个项目,总是面临着前路未知的情况:

1. 周期性存在突发算力高峰需求,涉及到先进制程问题更加显著;

2. 每次调整制程,都面临新的资源预估永远估不准

3. 可能需要某些内部不可用的内存和计算资源


我们今天认真盘一盘,怎么把这门艺术拉下神坛。



先给大家一个直观感受。


下图是我们某客户全生命周期月度算力实际用量曲线整个芯片项目全流程为18个月,涉及前端、验证、后端三大团队。


1.  前4个月,只涉及到前端布局与架构,对于算力需求不高,因此月度算力需求较少;

2.  从5月开始,前端、验证、后端均开始工作,算力开始逐步提升,第11个月达算力小高峰,在第16个月达算力最高峰,月度调度峰值达到百万级核时以上

3.  算力波峰和波谷的核数差距在20倍以上

4.  算力在第16个月达到最高峰后,迅速下降。


下面我们手把手教你怎么把算力规划拉下神坛:


Part 1  小白版算法

Part 2  老司机版算法

Part 3  全年现实算力需求折算

Part 4  一个并不艰难的选择



Part 1 小白版算法针对的是:项目全新,团队人员也比较新,需要从零计算
Part 2 老司机版算法针对的是:项目全新,但有类似经验的老人在团队,可以凭经验值估算
PS:Part 1和Part 2 二选一阅读即可

为了简化计算,我们根据现实情况作以下假设:

1.  研发团队总人数为100;

2.  团队分为前端、验证和后端3部分,人数比值2:1:1;
3.  芯片的全周期分为3个阶段,每阶段4个月  (仅适用小白版算法);
4.  三个团队主要使用资源类型:前端团队使用计算型机器;验证团队前期使用计算型机器,之后使用内存型机器;后端团队使用内存型机器 。

Part1 :小白版算法


这套小白版算法是我们根据N家客户的实际情况,得出的经验参考值:包括不同阶段,不同团队的人员配比与人力占用比例,每人job数,每人每job峰值核数
因实际团队并非全程在此项目中,部分阶段人力需折算,即人力占用比例。
在我们的参考值基础上略做调整,大家就能大致得出自己公司的相应数值啦。

这套算法通过估算不同阶段内、各个团队所需的算力峰值之和,得出每阶段的算力峰值。
各团队的峰值计算公式为每人每job峰值核数(多台机器则为每台核数*机器数)*团队人数*每人job数(每个阶段计算方式一致)。

Stage 1:前期阶段(第1-4个月)



① 阶段工作详情:前端从事设计相关工作,验证团队同步参与,工作状态都较为稳定,此阶段每月峰值核数趋于一致;
② 涉及团队:前端、验证团队;
③ 资源并发需求:前端团队每人1台10核、验证团队每人1台20核。


该阶段峰值核时计算(计量单位:核小时):
1月:10核*50人*1job=500
2-4月:前端团队峰值核数=10*50*1=500 ;
验证团队峰值核数=20*25*1=500;
峰值核数总计为500+500=1000;
则该阶段的峰值核数在2-4月,为1000
(下同,不再详述这一计算过程)

Stage 2:中期阶段(5-8月)


① 阶段工作详情:涉及到前端仿真、验证和部分模块的版图工作。6月在前仿最后阶段做一次大仿真,是算力小波峰,随后算力下降;
② 涉及团队:前端、验证和后端团队;
③ 资源并发需求峰值:
5月:前端团队每人1台18核节点,每人1个job;验证团队每人4个job,每个job约18核(人力占用比例:75%);后端团队每人1台18核节点;
6月:前端团队每人1台24核节点,每人1个job;验证团队每人6个job,每个job约24核(人力占用比例:75%);后端团队每人1台18核节点;
7月:前端团队每人1台18核节点,每人1个job(人力占用比例:40%);验证团队每人3个job,每个job约18核;后端团队每人1个job,每job约4台18核节点;
8月:前端团队每人1个job,每个job18核(人力占用比例:40%);验证团队每人2个job,每个job18核;后端团队每人1个job,每个job约4台24核节点。


计算结果如下


Stage 3:后期阶段(9-12月)

① 阶段工作详情:主要涉及后端仿真相关工作;
② 涉及团队:验证和后端团队;
③ 资源并发需求:
9月:验证团队,每人4个job,每个job约18核;后端团队每人1-2个job,每个job约4台24核节点(后端人均完成1.6个job,取值1.6);
10月:验证团队每人6个job,每个job约24核;后端团队每人1-2个job,每job约6台24核工作节点(后端人力占用比例:80%,每人2个job)
11月:验证团队每人6个job,每个job约24核;后端团队每人1个job,每job约4台24核工作节点;
12月:验证团队每人6个job,每个job约18核;后端团队每人1个job,每job约3台24核工作节点。

计算结果如下
最终全生命周期力需求图如下(计量单位:核小时):
可以看出:
1. 和文章开头的实际用户算力曲线趋势一致
2. 不同月份间的峰值算力差异很大,能达到20倍左右;
3. 不同团队在不同月份的峰值算力需求差异明显。

Part2 :老司机版算法


如果对于未来芯片项目,你们有过来人能预估出不同团队不同阶段的算力需求,这套老司机版算法将完全适配你。
这套算法是我们根据有项目经验的芯片研发团队的实际情况,通过填入各月每job峰值核数、每月最大并行job数,计算出各团队每月所需的算力峰值。

下面为大家奉上这份《XXX芯片项目-资源需求调研模板》


左边项目为不同的项目团队。
项目团队内部可分为:前端、验证和后端组。

Step 1将不同组、每个job所需核数或内存的峰值需求,依次填入中间的“每job峰值核数”和“每job峰值内存”栏目下,负责人填入团队负责人”栏目下




例如:每个job需要的峰值核数为10,每个job需要峰值内存为20据经验值统计),前端负责人为Andy。


Step 2在每月栏目下,填入各团队预期的每月并行最大job数(简称:job数)




Job数可根据研发内部统计,也可根据job数=每人最大并行job数*人数进行计算,如团队并非全程在此项目中,人力还需折算统计。

例如:2022年2-5月,前端团队每人最大并行job数为1,团队有50人,均100%投入在此项目中,则填入下表的job数均为:50*1*100%=50。


Step 3计算各团队当月峰值算力并相加,得出峰值算力总计(计量单位:核小时)




各团队的峰值计算公式:每job峰值核数*job数(每个阶段计算方式一致)。


例如:2022年2-5月,前端团队每job峰值核数为10,job数为50;2月验证团队还未开始任务,3-5月,验证团队的每job峰值核数为20,job数为25;2-5月,后端团队还未开始任务。

计算过程如下
前端团队:2-5月:10*50=500
验证团队:3-5月:20*25=500
将各团队每月算力峰值相加,得到每月项目的算力峰值,计算得出项目各月算力峰值表

《XXX芯片项目-资源需求调研模板》Server一栏的Middle /High 型是用户自己设定的不同机器配置,后期计算不同机型费用时会用到,跟算力需求计算无关。

Part3 :全年现实算力需求折算


不管是小白版算法还是老司机版算法,都是一个月每天全部按峰值需求跑任务的前提下进行计算的。但实际情况下,肯定不需要一直按峰值顶格跑。

我们折算一下:
全月全资源峰值用量:峰值核数*30天*24小时
全月实际用量可能是:峰值核数*22天*8小时

用小白版算法的数据来调整:
6月算力小波峰:后端按30天*18小时估算,验证按30天*16小时估算;
10月算力大波峰:后端按30天*24小时估算,验证按照30天*16小时估算。

得出下表,并绘制成相应曲线图:


灰色曲线为按峰值计算的算力需求
橙色曲线为折算后实际需要的算力 

Part4 :一个并不艰难的选择


好了,全生命周期算力需求算完了。
到了算账的环节了。

灰色代表当月按峰值顶格算的用量橙色代表月度实际用量。
绿色代表本地资源,必须按这一阶段需求峰值准备,也就是按灰色来准备。买不到峰值,肯定会影响到芯片项目进度。

如果是纯本地,就是按绿色这根线买。现金流是必须要动用一大笔的了,采购周期也是必须要考虑的。
按照本文开头我们某客户全生命周期月度算力实际用量曲线波峰、波谷间差距可高达20倍,月调度核时峰值能达到百万级以上。顶格买……

如果是全云端,就是按橙色这根线花钱。想用就用,不想用就关掉,用了才花钱。现金流逐步平缓支出。

绿色线橙色线中间的差距(图中阴影部分),各人可能有各人的体会。
算力资源规划VS现金流
芯片项目周期VS市场竞争格局
具体怎么权衡和取舍,还是要看企业自己。

一颗芯片设计完整生命周期下,不同阶段,不同应用场景,对算力更精细的需求差异,我们相应的推荐和建议,以后再聊。

END -

我们有个一站式IC设计云平台
集成多种EDA应用,大量任务多节点并行
应对短时间爆发性需求,连网即用
跑任务快,原来几个月甚至几年,现在只需几小时
5分钟快速上手,拖拉点选可视化界面,无需代码

现在!我们的IC设计研发云平台支持免费试用,还送300元体验金
扫码免费试用~


如果你对这个一站式IC设计云平台还有更多想问的,比如:
1、你们支持哪些EDA应用?能覆盖到我常用的软件吗?
2、EDA应用所需的计算资源非常大,你们如何解决这个问题?
3、把EDA研发环境部署到云上有什么好处?
4、除了CPU,GPU/TPU/大内存的机器都有吗?
5、你们说的“一整套即开即用的IC研发设计环境”是什么意思?从本地到云上,操作方式会改变很大吗?
6、云端输出计算结果是否与本地完全一致?
7、云端这么多的机器,管理得过来吗?
8、云上有些资源很贵,有没有节约成本的方案?
9、任务监控也能用来省钱,你们是怎么做到的?
10、很多PDK,就有几十T,怎么到云上,而且需要持续更新?
11、如何云上保护我们的IP资产?
12、脚本每日都有变动,云上要增加工作量?工作脚本如何更新?
13、云上的EDA软件怎么部署安装?
14、License Server配置在本地和云端对计算性能/一致性/稳定性是否有影响?
15、使用平台的工作人员比较多,能否对每个人设置使用资源的上限?
16、公司有海外研发部门,用你们平台方便吗?
17、怎么保障数据安全?
……
答案都在这里,欢迎扫码添加小F微信(ID:iamfastone)免费获取~

关于为应用定义的云平台
居家办公=停工?nonono,移动式EDA芯片设计,带你效率起飞
续集来了:上回那个“吃鸡”成功的IC人后来发生了什么?
缺人!缺钱!赶时间!初创IC设计公司如何“绝地求生”?
一次搞懂速石科技三大产品:FCC、FCC-E、FCP
速石科技成三星Foundry国内首家SAFE™云合作伙伴
EDA云平台49问
国内超算发展近40年,终于遇到了一个像样的对手
帮助CXO解惑上云成本的迷思,看这篇就够了
花费4小时5500美元,速石科技跻身全球超算TOP500


陌上风骑驴看IC 闲情偶寄,谈天说地,拔草锄地
评论
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 180浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 66浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 167浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 98浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 103浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 113浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 40浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 83浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 63浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦