比GPU快几百倍!中国首发光电混合计算卡:128×128光子矩阵

芯通社 2025-03-26 16:42


曦智科技今天正式发布全新光电混合计算卡“曦智天枢”,首次实现了光电混合计算在复杂商业化模型中的应用。

曦智科技是全球领先的光电混合算力提供商,在集成光子领域取得了开创性的突破,掌握了光子矩阵计算(oMAC)、片上光网络(oNOC)、片间光网络(oNET)三大核心技术,打造了光子计算、光子网络两大产品线。

2021年12月,曦智科技首次对外发布光电混合计算产品,成功验证了光电混合计算在特定算法下,相较于主流GPU的速度优势多达数百倍。

曦智科技认为,光电混合将会为人工智能、大语言模型、智能制造等领域带来算力革新。

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

本次发布的曦智天枢,深度融合了光芯片、电芯片各自的优势,并采用3D先进封装技术,支持可编程。

它在光电集成度、光子矩阵规模、精度、可编程性等方面,都比前代产品实现了明显的性能提升。

比如在支持科学计算(如伊辛算法)基础上,加强了对于ResNet50等商业算法应用的支持,既保持了光计算优势,还大幅提升了产品通用适配性。

天枢采用非相干架构,不仅易于系统扩展,还具备出色的抗干扰能力、更高的计算精度。

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

它的核心处理器包括光学处理单元(OPU)、电学专用集成电路(ASIC),光芯片和电芯片通过3D TSV硅通孔、FlipChip倒装芯片封装技术进行整合、协同工作,可显著降低延迟、提升信号传输完整性,其中光芯片面积达到600平方毫米,比上代增大3倍。

芯片主频为1GHz,输出精度8bit,比上代提升8倍。

光芯片上的器件数量超4万个,但器件尺寸进一步缩小,集成度显著提升。

最大可支持128x128矩阵规模,是上一代64×64的4倍,运算能力、灵活性都得到了极大的提升。

此外,用户可以通过API自由配置计算矩阵系数,拥有更强的适应性和优化空间。

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

据悉,光子计算是一种被动运算,运算任务在光通过光子矩阵的过程中即可完成,颠覆了传统CMOS电子芯片的运算逻辑。

光子芯片的性能提升与光子矩阵规模、主频速率、波长数量等参数相关,而不依赖晶体管的密度及芯片制程的提升。

曦智科技还首次提出了等效光算力(EOPP)标准,是一种考虑了矩阵规模、输出精度、权重刷新速度等的综合算力评价方法,相比当前主流的电芯片指标计算方法,更符合光计算的原理和特点。

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵

软件方面,天枢搭载了曦智光电混合计算软件栈,算子库包含RVV(RiscV Vector)算子,电矩阵(dMAC)加速算子、光矩阵(oMAC)加速算子,支持CV类和LLM类模型,以及包括Ising、LineSolver在内的non-AI算子。

用户借助曦智编译器,可以灵活地运用这些算子来构建高效的应用模型。

此外,平台还支持用户自定义算子,通过OpenCL C/C++语言进行编译和优化,进一步扩展了算法开发的灵活性。

曦智科技的软件栈与Pytorch、ONNX等主流框架深度集成,可通过软件栈直接使用天枢的光矩阵和电矩阵加速单元对模型和算法进行加速和验证,也可以将模型通过曦智编译框架编译部署在端侧进行推理。

通过软件栈,天枢成功运行了ResNet50深度卷积神经网络模型、Llama 2 AI大语言模型,首次实现了光电混合计算在商业化场景中的应用。

目前,曦智科技已启动下一代光电混合计算产品的研发,将会进一步提升计算能力。

比GPU快几百倍!曦智科技首发新一代光电混合计算卡:128×128光子矩阵



免责声明

本平台所刊载的所有资料及图表仅供参考使用。刊载这些文档并不构成对任何股份的收购、购买、认购、抛售或持有的邀约或意图。投资者依据本网站提供的信息、资料及图表进行金融、证券等投资项目所造成的盈亏与本网站无关。除原创作品外,本平台所使用的文章、图片、视频及音乐属于原权利人所有,因客观原因,或会存在不当使用的情况,如部分文章或文章部分引用内容未能及时与原作者取得联系,或作者名称及原始出处标注错误等情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系及时处理,共同维护良好的网络创作环境。




芯通社

- SemiWebs -


专注半导体-手机通信-人工智能

请长按下面二维码关注芯通社


伙伴们

错过也许就是一辈子
还不快关注我们?






芯通社 专注半导体/手机通信/人工智能/区块链等科技领域!
评论 (0)
  • WT588F02B是广州唯创电子推出的一款高性能语音芯片,广泛应用于智能家电、安防设备、玩具等领域。然而,在实际开发中,用户可能会遇到烧录失败的问题,导致项目进度受阻。本文将从下载连线、文件容量、线路长度三大核心因素出发,深入分析烧录失败的原因并提供系统化的解决方案。一、检查下载器与芯片的物理连接问题表现烧录时提示"连接超时"或"设备未响应",或烧录进度条卡顿后报错。原因解析接口错位:WT588F02B采用SPI/UART双模通信,若下载器引脚定义与芯片引脚未严格对应(如TXD/RXD交叉错误)
    广州唯创电子 2025-03-26 09:05 150浏览
  • 在当今竞争激烈的工业环境中,效率和响应速度已成为企业制胜的关键。为了满足这一需求,我们隆重推出宏集Panorama COOX,这是Panorama Suite中首款集成的制造执行系统(MES)产品。这一创新产品将Panorama平台升级为全面的工业4.0解决方案,融合了工业SCADA和MES技术的双重优势,帮助企业实现生产效率和运营能力的全面提升。深度融合SCADA与MES,开启工业新纪元宏集Panorama COOX的诞生,源于我们对创新和卓越运营的不懈追求。通过战略性收购法国知名MES领域专
    宏集科技 2025-03-27 13:22 218浏览
  • 在嵌入式语音系统的开发过程中,广州唯创电子推出的WT588系列语音芯片凭借其优异的音质表现和灵活的编程特性,广泛应用于智能终端、工业控制、消费电子等领域。作为该系列芯片的关键状态指示信号,BUSY引脚的设计处理直接影响着系统交互的可靠性和功能拓展性。本文将从电路原理、应用场景、设计策略三个维度,深入解析BUSY引脚的技术特性及其工程实践要点。一、BUSY引脚工作原理与信号特性1.1 电气参数电平标准:输出3.3V TTL电平(与VDD同源)驱动能力:典型值±8mA(可直接驱动LED)响应延迟:语
    广州唯创电子 2025-03-26 09:26 218浏览
  • 在智能语音产品的开发过程中,麦克风阵列的选型直接决定了用户体验的优劣。广州唯创电子提供的单麦克风与双麦克风解决方案,为不同场景下的语音交互需求提供了灵活选择。本文将深入解析两种方案的性能差异、适用场景及工程实现要点,为开发者提供系统化的设计决策依据。一、基础参数对比分析维度单麦克风方案双麦克风方案BOM成本¥1.2-2.5元¥4.8-6.5元信噪比(1m)58-62dB65-68dB拾音角度全向360°波束成形±30°功耗8mW@3.3V15mW@3.3V典型响应延迟120ms80ms二、技术原
    广州唯创电子 2025-03-27 09:23 180浏览
  • 案例概况在丹麦哥本哈根,西门子工程师们成功完成了一项高安全设施的数据集成项目。他们利用宏集Cogent DataHub软件,将高安全设施内的设备和仪器与远程监控位置连接起来,让技术人员能够在不违反安全规定、不引入未经授权人员的情况下,远程操作所需设备。突破OPC 服务器的远程连接难题该项目最初看似是一个常规的 OPC 应用:目标是将高安全性设施中的冷水机(chiller)设备及其 OPC DA 服务器,与远程监控站的两套 SCADA 系统(作为 OPC DA 客户端)连接起来。然而,在实际实施过
    宏集科技 2025-03-27 13:20 121浏览
  • 长期以来,智能家居对于大众家庭而言就像空中楼阁一般,华而不实,更有甚者,还将智能家居认定为资本家的营销游戏。商家们举着“智慧家居、智慧办公”的口号,将原本价格亲民、能用几十年的家电器具包装成为了高档商品,而消费者们最终得到的却是家居设备之间缺乏互操作性、不同品牌生态之间互不兼容的碎片化体验。这种早期的生态割裂现象致使消费者们对智能家居兴趣缺失,也造就了“智能家居无用论”的刻板印象。然而,自Matter协议发布之后,“命运的齿轮”开始转动,智能家居中的生态割裂现象与品牌生态之间的隔阂正被基于IP架
    华普微HOPERF 2025-03-27 09:46 133浏览
  • 汽车导航系统市场及应用环境参照调研机构GII的研究报告中的市场预测,全球汽车导航系统市场预计将于 2030年达到472亿美元的市场规模,而2024年至2030年的年复合成长率则为可观的6.7%。汽车导航系统无疑已成为智能汽车不可或缺的重要功能之一。随着人们在日常生活中对汽车导航功能的日渐依赖,一旦出现定位不准确或地图错误等问题,就可能导致车主开错路线,平白浪费更多行车时间,不仅造成行车不便,甚或可能引发交通事故的发生。有鉴于此,如果想要提供消费者完善的使用者体验,在车辆开发阶段便针对汽车导航功能
    百佳泰测试实验室 2025-03-27 14:51 221浏览
  • 在电子设计中,电磁兼容性(EMC)是确保设备既能抵御外部电磁干扰(EMI),又不会对自身或周围环境产生过量电磁辐射的关键。电容器、电感和磁珠作为三大核心元件,通过不同的机制协同作用,有效抑制电磁干扰。以下是其原理和应用场景的详细解析:1. 电容器:高频噪声的“吸尘器”作用原理:电容器通过“通高频、阻低频”的特性,为高频噪声提供低阻抗路径到地,形成滤波效果。例如,在电源和地之间并联电容,可吸收电源中的高频纹波和瞬态干扰。关键应用场景:电源去耦:在IC电源引脚附近放置0.1μF陶瓷电容,滤除数字电路
    时源芯微 2025-03-27 11:19 186浏览
  • ​2025年3月27日​,贞光科技授权代理品牌紫光同芯正式发布新一代汽车安全芯片T97-415E。作为T97-315E的迭代升级产品,该芯片以大容量存储、全球化合规认证、双SPI接口协同为核心突破,直击智能网联汽车"多场景安全并行"与"出口合规"两大行业痛点,助力车企抢占智能驾驶与全球化市场双赛道。行业趋势锚定:三大升级回应智能化浪潮1. 大容量存储:破解车联网多任务瓶颈随着​车机功能泛在化​(数字钥匙、OTA、T-BOX等安全服务集成),传统安全芯片面临存储资源挤占难题。T97-415E创新性
    贞光科技 2025-03-27 13:50 170浏览
  • 六西格玛首先是作为一个量度质量水平的指标,它代表了近乎完美的质量的水平。如果你每天都吃一个苹果,有一间水果店的老板跟你说,他们所卖的苹果,质量达到六西格玛水平,换言之,他们每卖一百万个苹果,只会有3.4个是坏的。你算了一下,发现你如果要从这个店里买到一个坏苹果,需要805年。你会还会选择其他店吗?首先发明六西格玛这个词的人——比尔·史密斯(Bill Smith)他是摩托罗拉(Motorloa)的工程师,在追求这个近乎完美的质量水平的时候,发明了一套方法模型,开始时是MAIC,后来慢慢演变成DMA
    优思学院 2025-03-27 11:47 169浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦