Tachyum开发了世界上最强大的处理器之一:Prodigy T16128通用处理器。Prodigy T16128拥有128个64位CPU核(最高可以跑到5.7GHz)、16个DDR5内存控制器和64个PCIe 5.0通道,可以在一个芯片上处理通用计算、高性能计算(HPC)和AI工作负载。
Tachyum称Prodigy是世界上第一个“通用处理器”,并表示这个处理器是从头开始设计的,是一个多用途的CPU,能够运行世界上最密集的计算应用程序。Prodigy不仅可以在一个芯片上处理所有这些不同的任务,而且功耗会比传统硬件低10倍,成本只有传统硬件的三分之一。
Tachyum大胆宣称,Prodigy超级计算机芯片的性能是目前市场上最快的英特尔Xeon的4倍,是英伟达H100在高性能计算应用中的3倍;而它们的功耗至少是Prodigy的10倍。
为了在一个单一的核心架构中创造如此令人印象深刻的性能,Tachyum表示,他们从设计之初就开始使用矩阵和向量处理能力来构建Prodigy。Prodigy支持多种数据类型,包括FP64、FP32、TF32、BF16、Int8、FP8和TAI,这些数据都来自各个CPU内核本身。
Prodigy处理器将于2023年面市,到时可能会改变整个市场。目前,AMD、英特尔和英伟达都依赖于单独的芯片来执行不同的工作负载。例如英伟达的RTX系列GPU, AI工作需要专用的机器学习Tensor核,光线追踪应用需要专用的RT核。
对比之下,Prodigy将能够在单个核心上运行光线追踪和AI应用程序,不需要将数据移到微处理器内部的另一个芯片上。
在一个芯片中运行所有这些不同的HPC工作负载可能会极大地改变服务器的部署:由于功耗降低和冷却需求的减少,我们可以将更多的芯片打包到一个服务器群中。
Prodigy T16128采用5nm工艺技术,并在极小的(针对其提供的功率)64mm x 84mm FCLGA封装内运行。Tachyum表示,在高性能计算的工作负载下,该芯片能够执行12 AI PetaFLOPS和90 TeraFLOPS(一台英伟达A100只能进行5 AI PetaFLOPS)。Prodigy芯片还可以运行x86、ARM、RISC-V和ISA的二进制文件。
每个核心都有2x 1024位向量单位、4096位矩阵操作和单时钟执行4条乱序指令的能力。该芯片支持虚拟化和高级RAS,包括超过128MB的L2+L3缓存,并具有纠错功能。为了满足其所有核心,芯片配备了16个额定7200MT/s的DDR5内存控制器,每个插槽最大容量为8TB。
T16128是Tachyum的Prodigy系列的旗舰产品,64核的T864和32核的T832分别填为产品线中的中端和入门级产品。量产要等到2023年,所以我们在明年应该会看到这些芯片的实际基准测试结果。
原文链接:
https://www.tomshardware.com/news/tachyum-128-core-all-purpose-cpu
高端微信群介绍 | |
创业投资群 | AI、IOT、芯片创始人、投资人、分析师、券商 |
闪存群 | 覆盖5000多位全球华人闪存、存储芯片精英 |
云计算群 | 全闪存、软件定义存储SDS、超融合等公有云和私有云讨论 |
AI芯片群 | 讨论AI芯片和GPU、FPGA、CPU异构计算 |
5G群 | 物联网、5G芯片讨论 |
第三代半导体群 | 氮化镓、碳化硅等化合物半导体讨论 |
存储芯片群 | DRAM、NAND、3D XPoint等各类存储介质和主控讨论 |
汽车电子群 | MCU、电源、传感器等汽车电子讨论 |
光电器件群 | 光通信、激光器、ToF、AR、VCSEL等光电器件讨论 |
渠道群 | 存储和芯片产品报价、行情、渠道、供应链 |
< 长按识别二维码添加好友 >
加入上述群聊
带你走进万物存储、万物智能、
万物互联信息革命新时代