随着摩尔定律中的物理尺寸逐渐逼近极限,但实际应用中人们逐渐通过软件的硬件定制化加速来继续延续着摩尔定律的加速使命,这里面最典型的场景就是计算机网络。如软件的TCP/IP协议栈时延较大,于是就有了硬件化的TOE(TCP Offload Engine),把三次握手建立连接和四次挥手断开连接用硬件的方式来实现了。有了硬件实现的高效的TCP session建立/断开的机制,人们又在此基础上做了网络的存储协议硬件化实现,于是就有了大家平常生活中常用的网盘。上篇文章中Nick McKeown教授团队已经把带有传输层的低延迟NIC线对线RPC响应时间降低到69ns,并且开发了一种带有寄存器文件的直接消息接口的新型CPU-nanoPU,本文继续推荐Nick教授团队在相同的开源工程nanoPU的基础上做的进一步工作,将传输层进行硬件化的定制加速,可以在不到10ns的时间内处理传输层中的数据包,并且可以每2.6ns发出一个新数据包。同时,该硬件化的传输层nano Transport还支持自定义的通信协议,支持P4编程语言,这就意味着,在保障性能的同时,还兼顾了灵活性。 以下内容翻译自论文《NanoTransport: A Low-Latency, Programmable Transport Layer for NICs》。
01
介绍
02
传输层剖析
03
架构设计
04
硬件实现
05
评估
06
讨论
07
总结
THE END
翻译:温正遥 图文排版:祝钊华 责任编辑:潘伟涛
我知道你
哦