Xilinx 系列FPGA Select IO简介连载二

FPGA开发圈 2021-10-25 15:19

  在SelectIO简介连载一中介绍了其架构,本章会继续介绍如何使用其gearbox功能来实现不同的比率的串并转换功能。

 

  7 Series FPGA中LVDS使用了ISERDESE2,SDR Rate可设为2,3,4,5,6,7,8。DDR Rate可设为4,6,8,10,14。


   从UG471的Bitslip部分可以看出在SDR和DDR移位的位数不一样。在SDR模式下,一个Bitslip脉冲使数据左移一位;而在DDR模式下,一个Bitslip脉冲使数据右移一位或左移三位。


   所以在某些传输过程中,可以先传预设值,等待接收方调整Idelay和Bitslip解出正确的预设值后再传输有效数据。


    对习惯使用7 Series FPGA用户在接触Xilinx®UltraScale™和UltraScale +™器件 SelectIO时感觉不习惯,原因Xilinx®UltraScale™和UltraScale +™是ISERDESE3和OSERDESE3组件,使用Select IO需要在IP catlog中选择high_speed_selectio IP Configuration interface 在Serialization Factor选项中只有8或者4可以选择。


    在Pin Selection选择时会发现IO选择会有一定限制,在Sensor的应用中HP bank理想的硬件设计是在同一个bank中连续放置设备I/O,部分Sensor输出的Serialization Factor需要7:1,6:1,5:1,不能直接使用ISERDES。

    对这类应用Xilinx 提供了XAPP1315 7:1的参考设计,那么对6:1,5:1这种应用用户需要在参考设计上改哪里,怎样去改?下面我们提供修改方式供参考。


1、从Data Reception看需要把ISERDESE3 输出的8位数据(Serialization Factor=8)通过gearbox模块转成7,6,5位的数据。其中7位的数据XAPP1315已经做过了,这里我们用6:1的数据为例, 需要从ISERDES3实现Read8 bit 数据通过gearbox 转换为6bit数据。

2、对于Read 8 to 6 gearbox设计方式:

  从数据排列可以分析到8 bit数据在每次读取6 bit数据,经过4次后开始循环,我们通过状态机设计gearbox的代码需只需要实现;

// Read 8 to 6 gearbox

//

always @ (posedge px_clk)

begin

    case (px_rd_seq )

      3'h0 : begin

         px_data <=px_rd_curr[5:0];

         end

      3'h1 : begin

         px_data <={px_rd_curr[3:0], px_rd_last[7:6]};

         end

      3'h2 : begin

         px_data <={px_rd_curr[1:0], px_rd_last[7:4]};

         end

      3'h3 : begin

         px_data <={px_rd_last[7:2]};

         end

    endcase

end


3、Data Transmission,OSERDES3使用4 bit 输入,参考例程是把ISERDES的数据接到OSERDES,这里我们在参考例程上任然使用ISERDE 到OSERDES的数据传送方式验证。分析知道需要一个6 bit 转4 bit数据的 Gearbox.

  4、Gearbox设计思路是把6 bit的数据按4bit大小去读取直到数据开始循环。


  通过表格客户分析出设计代码做3次循环可以满足要求


Read state machine and gear box

//

always @ (posedge tx_clkdiv4)

begin

   if(!tx_enable) begin

      rd_addr  <= 4'b0;

      rd_state <= 3'h0;

  end else begin

      case (rd_state )

        3'h0 : begin

           rd_addr <= rd_addr + 1'b1;

           tx_data <= rd_curr[3:0];

           rd_state<= rd_state + 1'b1;

           end

        3'h1 : begin

           rd_addr <= rd_addr;

           tx_data <= {rd_curr[1:0], rd_last[5:4]};

           rd_state<= rd_state + 1'b1;

           end

        3'h2 : begin

           rd_addr <= rd_addr + 1'b1;

           tx_data <= rd_last[5:2];

           rd_state<= 3'h0;

           end

      endcase

  end

end

  5、到这来我们已经完成gearbox 模块的设计,实现LVDS Source Synchronous 6:1。在Serialization and Deserialization部分还需要修改输入的数据


//

// Transmit Data Generation

//

always @ (posedge tx_px_clk)

begin

   if(tx_px_reset) begin

     tx_px_data[ 5:0 ] <= 6'h01;

     tx_px_data[11:6 ] <= 6'h02;

     tx_px_data[17:12] <= 6'h03;

     tx_px_data[23:18] <= 6'h04;

     tx_px_data[29:24] <= 6'h05;

  end

  else begin

     tx_px_data[ 5:0 ]<= tx_px_data[ 5:0 ]+1'b1;

     tx_px_data[11:6 ]<= tx_px_data[11:6 ]+1'b1; 

     tx_px_data[17:12]<= tx_px_data[17:12]+1'b1; 

     tx_px_data[23:18]<= tx_px_data[23:18]+1'b1; 

     tx_px_data[29:24]<= tx_px_data[29:24]+1'b1;

  end

end

 

 

// Receiver 1 - Data checking per pixelclock

//

always @(posedge rx1_px_clk or negedgerx1_px_ready)

begin

  rx1_px_last <= rx1_px_data;

   if(!rx1_px_ready) begin

        rx1_match <= 1'b0;

  end

  else if ((rx1_px_data[ 5:0 ]==rx1_px_last[ 5:0 ]+1'b1)&&

           (rx1_px_data[11:6 ]==rx1_px_last[11:6 ]+1'b1)&&

           (rx1_px_data[17:12]==rx1_px_last[17:12]+1'b1)&&

           (rx1_px_data[23:18]==rx1_px_last[23:18]+1'b1)&&

           (rx1_px_data[29:24]==rx1_px_last[29:24]+1'b1)) begin

     rx1_match <= 1'b1;

  end

  else begin

     rx1_match <= 1'b0;

  end

end


  6、对用户的系统可能需要的lane数量为8,在对应的数据部分需要做对应的修改


    Receiver使用ISERDESE3在1:8 DDR模式与8:6分布式RAM基于齿轮箱反序列化和对齐输入数据流。这个实现需要三个时钟域,1/2速率采样时钟(rx_clkdiv2), 1/8速率反序列化数据时钟(rx_clkdiv8),和1/6像素时钟(px_clk),它等于Receiversource clock。

    Receiver source clock在MMCM或PLL中乘以6或12以满足VCO频率范围,然后除以2生成1/2速率采样时钟(rx_clkdiv2),除以6生成织物像素时钟(px_clk)。

//

// Instantiate PLL or MMCM

//

generate

if (USE_PLL == "FALSE")begin                   // use an MMCM

  MMCME3_BASE # (

        .CLKIN1_PERIOD     (CLKIN_PERIOD),

        .BANDWIDTH         ("OPTIMIZED"),

        .CLKFBOUT_MULT_F   (6*VCO_MULTIPLIER),

        .CLKFBOUT_PHASE     (0.0),

        .CLKOUT0_DIVIDE_F  (2*VCO_MULTIPLIER),

        .CLKOUT0_DUTY_CYCLE (0.5),

        .CLKOUT0_PHASE      (0.0),

        .DIVCLK_DIVIDE      (1),

        .REF_JITTER1        (0.100)

     )

     tx_mmcm (

        .CLKFBOUT       (px_pllmmcm),

        .CLKFBOUTB      (),

        .CLKOUT0        (tx_pllmmcm_div2),

        .CLKOUT0B       (),

        .CLKOUT1        (),

        .CLKOUT1B       (),

        .CLKOUT2        (),

        .CLKOUT2B       (),

        .CLKOUT3        (),

        .CLKOUT3B       (),

        .CLKOUT4        (),

         .CLKOUT5        (),

        .CLKOUT6        (),

        .LOCKED         (cmt_locked),

        .CLKFBIN        (px_clk),

        .CLKIN1         (clkin),

        .PWRDWN         (1'b0),

        .RST            (reset)

    );

  end else begin           // Use aPLL

  PLLE3_BASE # (

        .CLKIN_PERIOD      (CLKIN_PERIOD),

        .CLKFBOUT_MULT     (6*VCO_MULTIPLIER),

        .CLKFBOUT_PHASE     (0.0),

        .CLKOUT0_DIVIDE    (2*VCO_MULTIPLIER),

        .CLKOUT0_DUTY_CYCLE (0.5),

        .REF_JITTER         (0.100),

        .DIVCLK_DIVIDE      (1)

     )

     tx_pll (

         .CLKFBOUT       (px_pllmmcm),

         .CLKOUT0        (tx_pllmmcm_div2),

         .CLKOUT0B       (),

         .CLKOUT1        (),

         .CLKOUT1B       (),

         .CLKOUTPHY      (),

         .LOCKED         (cmt_locked),

         .CLKFBIN        (px_clk),

         .CLKIN          (clkin),

         .CLKOUTPHYEN    (1'b0),

         .PWRDWN         (1'b0),

         .RST            (reset)

     );

  end

   7、代码中对应的源语需要升级到ULTRASCALE_PLUS对应的部分

类似的地方:localparam DELAY_VALUE    = ((CLKIN_PERIOD*1000)/6 <= 1100.0) ?(CLKIN_PERIOD*1000)/6 : 1100.0;

ULTRASCALE_PLUS maximumvalue for 1100.0

 

  IDELAYE3 SIM_DEVICE(“ULTRASCALE_PLUS”), // Set the device version for simulationfunctionality (ULTRASCALE// ULTRASCALE_PLUS,recommended to re-call IDELAYE3 in the ULTRASCALE_PLUSdirectory


   8、所以以模块修完之后通过软件仿真验证修改的数据跟XAPP1315的数据对比,设计中采用parameter  DATA_FORMAT = "PER_CLOCK",数据格式会安装PER_CLOCK方式排列LVDS Source Synchronous 6:1 Serializationand Deserialization Using Clock Multiplication。

Xapp1315 LVDS Source Synchronous 7:1Serialization and Deserialization Using Clock Multiplication仿真数据:


   综上所述,通过数据比对分析数据没有问题,从而实现此功能。


如果您在SelectIO方面有问题,欢迎联系:
simonyang@comtech.com.cn
charlesxu@comtech.com.cn



FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 412浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 1151浏览
  • 随着AI大模型训练和推理对计算能力的需求呈指数级增长,AI数据中心的网络带宽需求大幅提升,推动了高速光模块的发展。光模块作为数据中心和高性能计算系统中的关键器件,主要用于提供高速和大容量的数据传输服务。 光模块提升带宽的方法有两种:1)提高每个通道的比特速率,如直接提升波特率,或者保持波特率不变,使用复杂的调制解调方式(如PAM4);2)增加通道数,如提升并行光纤数量,或采用波分复用(CWDM、LWDM)。按照传输模式,光模块可分为并行和波分两种类型,其中并行方案主要应用在中短距传输场景中成本
    hycsystembella 2025-01-25 17:24 290浏览
  • 书接上回:【2022年终总结】阳光总在风雨后,启航2023-面包板社区  https://mbb.eet-china.com/blog/468701-438244.html 总结2019,松山湖有个欧洲小镇-面包板社区  https://mbb.eet-china.com/blog/468701-413397.html        2025年该是总结下2024年的喜怒哀乐,有个好的开始,才能更好的面对2025年即将
    liweicheng 2025-01-24 23:18 260浏览
  • 不让汽车专美于前,近年来哈雷(Harley-Davidson)和本田(Honda)等大型重型机车大厂的旗下车款皆已陆续配备车载娱乐系统与语音助理,在路上也有越来越多的普通机车车主开始使用安全帽麦克风,在骑车时透过蓝牙连线执行语音搜寻地点导航、音乐播放控制或免持拨打接听电话等各种「机车语音助理」功能。客户背景与面临的挑战以本次分享的客户个案为例,该客户是一个跨国车用语音软件供货商,过往是与车厂合作开发前装车机为主,且有着多年的「汽车语音助理」产品经验。由于客户这次是首度跨足「机车语音助理」产品,因
    百佳泰测试实验室 2025-01-24 17:00 159浏览
  • 前篇文章中『服务器散热效能不佳有解吗?』提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。本篇将为您延伸说明我们如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。AI服务器的散热架构三大重点:GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。
    百佳泰测试实验室 2025-01-24 16:58 141浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 224浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 265浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 347浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 654浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 915浏览
  • 项目展示①正面、反面②左侧、右侧项目源码:https://mbb.eet-china.com/download/316656.html前言为什么想到要做这个小玩意呢,作为一个死宅,懒得看手机,但又想要抬头就能看见时间和天气信息,于是就做个这么个小东西,放在示波器上面正好(示波器外壳有个小槽,刚好可以卡住)功能主要有,获取国家气象局的天气信息,还有实时的温湿度,主控采用ESP32,所以后续还可以开放更多奇奇怪怪的功能,比如油价信息、股票信息之类的,反正能联网可操作性就大多了原理图、PCB、面板设计
    小恶魔owo 2025-01-25 22:09 385浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 238浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦