文章来源于求是缘半导体联盟会员单位:杭州基尔区块链科技有限公司
杭州基尔区块链科技有限公司以区块链基础平台、协同研发云平台为主要产品形式,为航空航天、集成电路等领域的研发企业提供集成知识产权保护、远程接入、工程设计、高性能分布式计算、软硬件管理、数据管理、模型库管理等的一体化解决方案,帮助企业快速、高效、低成本地实现产品迭代开发。
基尔科技凭借稳定的产品质量、领先的技术水平、快速的响应速度、良好的服务得到了客户的高度评价,公司的知名客户包括航天科技、航天科工、中电科等集团下属研究所以及业内数家芯片上市公司。
在数字化时代的浪潮下,半导体行业作为推动科技进步的关键驱动力之一,扮演着越来越重要的角色。芯片设计是半导体行业中至关重要的环节,它涉及复杂的电路设计、验证和仿真过程。随着芯片设计的复杂性和规模的不断增加,传统的计算资源往往难以满足大规模仿真的需求。仿真算力集群是半导体行业中关键的工具和技术,在仿真算力集群中引入高性能计算(HPC)调度平台,以提供更强大的计算能力和资源管理,加速仿真任务的执行、缩短设计周期和优化芯片设计流程。高性能计算平台主要包含以下几个功能模块:
弹性资源管理:芯片设计中的仿真任务可能具有不同的规模和资源需求。HPC调度平台可以根据任务的需求,动态分配计算资源,包括处理器核心、内存容量和存储空间等。弹性资源管理能够满足不同任务的需求,提高资源利用率和灵活性。
自动化调度和优化:芯片设计中的仿真任务通常是复杂且具有依赖关系的。HPC调度平台可以采用自动化调度算法,智能地分配计算资源,优化任务的执行顺序和资源利用,减少等待时间和执行时间,提高整体仿真效率。
资源管理与监控:HPC调度平台具备强大的资源管理和监控功能,实时监测和管理计算资源的使用情况,包括处理器利用率、内存占用和网络带宽等。资源管理与监控能够避免资源冲突和过载,提高系统的稳定性和可靠性。
高效协同合作:芯片设计往往需要多个团队的协同合作,共同完成设计任务。HPC调度平台可以提供分布式计算环境和资源共享机制,实现多个团队之间的协同工作,加速设计流程并提高团队的协作效率。
总体而言,未来芯片仿真算力HPC平台调度的发展趋势将聚焦于自动化调度、弹性资源管理、任务调度优化和资源管理与监控。这些趋势将进一步提高仿真任务的执行效率、资源利用率和系统的可靠性,推动半导体行业的创新和发展。
目前基尔科技研发了一套协同设计云平台KTeam软件,应用于集成电路设计领域,提高并行计算速度,可视化提交作业任务,全程动态感知集群状态,为用户提供设计、仿真、运维、监控一体化平台;可大幅提高仿真效率,简化平台管理。KTeam平台由应用工作台、作业调度模块、文件管理模块、集群监控模块、资源统计模块组成。选用KTeam平台软件及其相关服务,可以帮助用户部署操作系统,安装和调试应用环境、应用软件,基于高性能集群硬件设备,提供传统的设计环境和高速的仿真体验。
系统架构
高性能协同设计仿真平台系统架构可以分为硬件层、系统软件层、集群软件层、应用环境层和应用层,KTeam及其相关服务涵盖了硬件层以上、应用层以下的三层,即系统软件层、集群软件层和应用环境层,这是保证各种应用软件能在集群硬件设备上运行的基本条件。
在集群软件层,KTeam提供集群部署、工作台、平台管理、文件管理、用户管理、集群监控、作业调度、集群统计等功能模块,同时提供网页端实现界面交互操作界面。这些功能集中管理和监控系统中所有节点的资源,实现了整个集群系统的单一系统映像,使用户感觉只是在使用一台计算机。
关键特性一:应用工作台模块
//工作台可以任意增删软件,或分享工作台给其他用户。
//从应用中心增加需要使用的软件到工作台,不需要时可直接删除,无需安装、卸载。
//应用软件可以根据需要选择不同的版本。
//正在运行的工作台可以分享给其他用户,共同完成设计仿真。
关键特性二:作业调度模块
//作业统一调度,支持作业灵活提交和随时查看。可以选择作业模板方式提交作业,也可以在应用中直接提交作业到集群服务器。
//可以在作业运行中,随时查看作业状态,访问作业日志,或在应用软件中查看作业详情。
//提供作业查询功能,根据作业状态(提交中、排队、运行、挂起、等待、完成、失败、未知)、节点队列、应用软件、时间等不同条件筛选和统计作业。
//支持作业断点续算,确保作业的稳定运行。
关键特性三:文件管理模块
//提供基于Web的文件管理功能,支持文件和文件夹的创建、上传、下载、删除、重命名、压缩、解压、权限更改。
//支持文件快速查询,根据文件特殊后缀名或设计仿真项目设定的关键字,可以直接弹出应用软件。
关键特性四:集群监控模块
//动态监控,可以实时或历史监控集群状态,获取某个时间某个节点的CPU、内存、硬盘、网络、负载的运行状况。
//提供集群状态、作业统计、监控数据图形化显示。
//支持平台异常情况告警通知,帮助用户及时处理问题。
//支持平台运行日志报表查看,通过运行日志报表可以快速了解集群运行历史状况,协助日常巡检工作。
//支持队列查询,提供使用用户、部门名称、作业数量等信息。
关键特性五:资源统计模块
//资源统计,全局分析计算资源使用情况,提供丰富的统计报表,展示集群资源运行和使用情况。
//用户信息管理,安全配置用户权限,包括应用软件访问权限、上传和下载审批限制。
//提供用户/用户组的创建、显示、修改和删除,及用户账户信息,密码修改,集群切换,应用中心等服务。
推荐应用组网架构
支持计算节点无限扩展;
支持计算网络高速传输;
支持Linux和Windows节点异构;
支持以太网或IB网络协议灵活应用。
注:本文所含软件截图均为测试环境,平台提供并行计算解决方案,商软License由客户提供。
【征稿启事】
长按二维码,获取“求是缘技术沙龙”投稿微信
求是缘半导体联盟是全球半导体产业生态链上的多个高校的校友、公司、组织机构、政府园区及科研院校等自愿组成的跨区域的非营利性公益组织。联盟由浙江大学校友发起,总部位于上海,其主要职能是为半导体和相关行业的人才、技术、资金、企业运营管理、创新创业等方面提供交流合作和咨询服务的平台,致力于推动全球,特别是中国大陆区域的,半导体及相关产业的发展。
目前联盟不定期举办线上、线下专题活动,有一周芯闻、名家专栏、招聘专栏、活动报道、人物访谈等多种资讯栏目,同时提供咨询、资源对接、市场拓展等服务。