再见,电芯片!Hello,光子芯片!

SSDFans 2020-07-08 00:00


点击蓝字
关注我们



人类文明的进步,与“光”的使用密不可分。19世纪晚期,英国物理学家丁达尔向人们揭示了光的全反射原理,这也解释了光为何能在弯曲的水流或玻璃棒里向前传播。自此,人们就开始了对光传输介质的探寻。


上世纪中叶,高锟发表名为《光频率介质纤维表面波导》的论文。他创造性的提出,使用基于石英的玻璃纤维作为光传输介质,可以进行长距离的信息传输。由此,光纤逐渐登上历史舞台。和电缆相比,光纤在性能、可靠性、安全性等很多方面都有极大的提升,这也使得光纤成为了现代文明主要的通信介质之一,并引发了一系列通信行业的根本性变革。


在半导体领域,当前芯片间的主要互联方式还是基于电气连接。随着距离的增加,数据传输带宽会急剧下降,而由此带来的能耗则会大幅上升。下图就展示了芯片内部、芯片与电路板、电路板之间等不同维度下,数据传输带来的带宽损失与能耗增长。可以看到,即使在板级通信时采用光缆传输,相比芯片内部的传输速度和能效仍然下降了4个数量级



为了解决这个问题,业界已经开始探寻能否在芯片互联时使用光传输代替电传输,从而极大提升数据带宽、减少传输能耗、并延长数据传输的距离。在这其中,硅光子芯片技术正在获得越来越多的关注。


近日,一家名为Ayar Labs的初创公司展示了一款名为TeraPHY的光学收发器。这个光学收发器以芯粒(chiplet)的形式集成在英特尔Stratix10 FPGA上,可以达到2Tbps的数据带宽,传输距离最高可达2公里,而传输功耗则不超过每比特1pJ(10的-12次方)


动图,左侧是两个光子芯粒,中间是Stratix10


相比之下,目前FPGA使用的PAM4收发器速率最高为58Gbps,NRZ收发器最高速率为30Gbps,而当前电气收发器的路线图也只不过安排到了112Gbps。也就是说,这种光学收发器至少可以取得近20倍的性能提升,传输距离和功耗更不可同日而语,而这也将FPGA收发器的性能带到了一个全新的高度。


Ayar Labs与光子芯片


Ayar Labs成立于2015年,总部位于美国加州。它是MIT的孵化企业,创始团队大都来自MIT、UC Berkeley等美国顶尖高校。Ayar Labs先后获得了英特尔资本、格罗方德(GlobalFoundries)以及洛克希德马丁等公司的数千万美元战略投资


Ayar Labs专攻的主要领域就是芯片级的光子传输,前文提到的TeraPHY就是该公司目前的主打产品。TeraPHY的研发主要得到了美国国防高级研究计划局(DARPA)的项目支持。


在2019年的HotChips大会上,Ayar Labs正式推出了TeraPHY,并在前不久正式对这个光学收发器的性能进行了在线演示。在接下来的文章中,我将详细介绍TeraPHY的技术细节,特别是它的光学数据传输方式,以及它是如何与FPGA进行异构集成的。



Ayar Labs在2019年HotChips大会的讲稿幻灯片,已上传至知识星球“老石谈芯-进阶版”,请在文末扫码进入星球查看。


TeraPHY:光电转换的奥秘


光学收发器TeraPHY最重要的技术创新,在于它解决了光信号的“调制”和“解调”两个主要问题。这其中具体的物理学细节在本文不再赘述,下一段中,我尝试简单介绍其中的主要原理,不感兴趣的同学可以直接略过这部分。


简言之,它利用了类似于定向耦合器的原理,当两个光传输介质足够靠近时,其中一个介质里的能量就能耦合到另一个。此时如果在一个介质上加入电场,就可以改变光在这个介质中的传播速度,从而控制光波的相位。通过这个过程,电信号的变化就转变成了光信号的变化。之后当两个介质里的光再次耦合时,由于光波的干涉原理,就会产生不同振幅。如果把波峰看成1,波谷看成0,那光波的不同振幅就可以解码成由0和1组成的数字信号,也就完成了光到电的转换。这个过程就是著名的马赫-曾德尔干涉仪的工作原理。


Ayar Labs发明了一种环形谐振器(microring resonator),来实现上述的过程。相比马赫-曾德尔干涉仪,这种环形谐振器的尺寸要小100倍,能效高50倍,数据传输密度也要高25-50倍。通过使用这种装置,可以实现25Gbps到100Gbps的传输带宽。



此外,由于不同波长的光在同一介质里传输时不会相互影响,可以采用多种不同的波长代表不同的比特位,这样就实现了一定程度上的并行数据传输。


下图展示了TeraPHY单个通道的收发过程,可以看到,这里采用了四种不同波长的光。在发送端,利用环形谐振器将不同比特位的数据分别调制到这四种光波上,并利用光纤进行传输。在接收端,再利用环形谐振器进行解调,将不同波长的光信号转化成相应的电信号。



值得注意的是,为了提供稳定的初始光源,Ayar Labs还开发了一款名为SuperNova的激光源,它能够提供最多256种波长的光波,等效8.192Tbps的数据带宽。


SuperNova激光源


在HotChips19大会上,Ayar Labs公布了一个TeraPHY的测试芯片设计。在发送端,包含5个光学宏单元,每个宏单元支持16个通道,每通道25Gbps带宽,共计2Tbps。


发送端光学宏单元的芯片版图和架构图


在接收端则包含3个宏单元,共计1.2Tbps带宽。


接收端光学宏单元的芯片版图和架构图


光学芯粒与FPGA的异构集成


TeraPHY刚面世时,它被同构集成到一个RISC-V CPU芯片中,并代替了原有的CPU IO收发器。然而,这种同构设计的灵活性十分有限,例如,如果需要把TeraPHY用于其他芯片系统,则需要重新设计和生产整个芯片。


在芯粒(chiplet)设计大行其道的今天,将TeraPHY做成芯粒就成为了非常合理的选择。在之前的文章中,曾详细介绍过英特尔的EMIB技术。EMIB最大的优点在于它降低了系统的制造复杂度,并降低了不同硅片与芯粒间的传输延时。由于无需制造覆盖整个芯片的硅中介层、以及遍布在硅中介层上的大量硅通孔,EMIB只需使用较小的硅桥在硅片间进行互联就可以满足硅片间的互联需求。同样的,由芯片I/O至封装引脚的连接和普通封装技术相比并未变化,因而无需再通过TSV或硅中介层进行走线。对于模拟器件(如收发器)而言,由于不存在通用的中介层,因此对高速信号的干扰明显降低。


英特尔的Stratix10 FPGA中就使用了EMIB技术集成了不同速率的收发器和高带宽存储器(HBM)。此外,EMIB还能用来连接多个FPGA硅片,通过这种方法,英特尔制造出了目前世界上最大的FPGA – Stratix10 GX 10M。


这样,Ayar Labs就将TeraPHY做成了芯粒的形式,它使用了格罗方德的45纳米RF SOI CMOS工艺制造,在光学输出端包含10个光学宏单元,最高传输速率可达2.56Tbps。



在电气连接端,使用了名为AIB(Advanced Interface Bus)的物理层协议。AIB是英特尔推出的一个异构互联的开放物理层协议,关于它的技术细节在本文不再详述。



最后,TeraPHY与FPGA硅片之间通过EMIB进行互联,并完成芯片封装,这也就是所谓的多芯片封装:Multi-Chip Package(MCP)



这是又一个使用EMIB进行快速异构集成的典型实例。通过使用这种方式,不用重新制造完整的芯片,只需要将现有的FPGA芯片与芯粒进行互联和封装即可,极大提升了产品的灵活性,也大大降低了制造风险与成本。



在Ayar Labs最新发布的在线演示中,他们使用这个集成了光学收发器的FPGA进行了数据传输演示,并在8个光学链路下得到了2Tbps的数据吞吐量。Ayar Labs预计将在未来达到超过100Tbps的吞吐量,同时每比特的传输功耗不超过1pJ。


集成光学收发器的Stratix10 FPGA测试板卡,图片来自Ayar Labs


结语


制造玻璃的石英和制造芯片的半导体材料都源于沙子。正是这种取之不尽、用之不竭的材料,成为了推动人类文明进步的重要基石。而“点石成金”的背后,则是无数研究者的不断钻研与创新。如今,光和电在FPGA里进行融合,并进一步扩展了数据传输的前景。老石相信,这样的技术创新还会不断涌现,并继续推动技术和文明向前进步。



高端微信群介绍

创业投资群


AI、IOT、芯片创始人、投资人、分析师、券商

闪存群


覆盖5000多位全球华人闪存、存储芯片精英

云计算群


全闪存、软件定义存储SDS、超融合等公有云和私有云讨论

AI芯片群


讨论AI芯片和GPU、FPGA、CPU异构计算

5G群


物联网、5G芯片讨论

第三代半导体群

氮化镓、碳化硅等化合物半导体讨论

储芯片群

DRAM、NAND、3D XPoint等各类存储介质和主控讨论

汽车电子群

MCU、电源、传感器等汽车电子讨论

光电器件群

光通信、激光器、ToF、AR、VCSEL等光电器件讨论

渠道群

存储和芯片产品报价、行情、渠道、供应链




< 长按识别二维码添加好友 >

加入上述群聊




长按并关注

带你走进万物存储、万物智能、

万物互联信息革命新时代

微信号:SSDFans
SSDFans AI+IOT+闪存,万物存储、万物智能、万物互联的闪存2.0时代即将到来,你,准备好了吗?
评论
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 83浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 109浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 79浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 71浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 102浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 141浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 88浏览
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 71浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 85浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 50浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 51浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦