Intel公司表示将推出发表8篇技术论文,论述该公司对将来的可编程多核体系结构的研究结果。
论文将在Intel Technical Journal上发表,详细披露该公司将来使用简化并行编程模型的处理器如何发展。随着商业服务器市场快速向功能越来越强大的多核处理器发展,需要新工具来帮助程序员开发能够充分利用这些平台优势的软件。
为多核环境开发软件的不同之处在于并行编程,即将应用程序发出的任务分配到多个处理器,同时执行任务。这种环境的复杂性要求使用不同于现在使用的工具。
Intel公司的技术策略官员Sean Koehl在公司的blog上表示,其中三篇论文分析三个典型的未来多核应用程序。其中一篇论文分析片上数据中心(data center-on-a-chip)的概念。研究人员正研究在一台基于32核万亿级处理器的系统上的超过133个处理器上运行电子商务数据中心的可能性。每核可拥有能利用称为同时多线程(SMT)技术的4个线程。SMT通过允许多个独立线程来执行任务来提高总体效率。
该论文对内存结构提出修改建议,以平衡在这个强大的系统中的所有处理。这些变化包括一个共享缓存体系结构模型、一个新高带宽L4高速缓存、以及一个对多个线程共享高速缓存空间进行优化的高速缓存质量服务。
另两篇论文论证了两个基于模型的应用程序的并行伸缩性:游戏和电影中的现实性以及家庭多媒体搜索和数据挖掘。然而,这两篇论文也指出需要更高的高速缓存/内存带宽,这将有一个大型L4高速缓存来提供。
另两片相关的论文更多的讨论硬件问题。一篇讨论L4高速缓存的封装和集成,另一篇关于多核的on-die集成。第一篇论文讨论提供高带宽内存如何影响在die上制造内存,即芯片的集成电路。Koehl表示,我们的封装和测试技术开发部门正评估完成这些人物的各种选择。
第二篇论文讨论Intel如何设计和集成各核之间共享的高速缓存,并研究了on-die互联网络和可能集成的其他非核部分,如内存控制器、输入输出桥和图形引擎。
另一篇论文提出一种能够使用多线程来加速应用程序的具体体系结构变化。具体来讲,Intel提出在硬件内部实现称为任务调度的功能,即将工作分配到各核进行执行。目前使用的基于软件的方法用于高度并行的工作量时需要太多的开销。
最后,其余两篇论文Intel正在开发的简化并行编程的硬件/软件创新技术。一篇论文讨论集成非Intel体系结构加速器核,如媒体加速器。因为这些加速器具有不同的指令集,所以它们需要为Intel体系结构开发的不同的编译器、工具和知识。这篇论文概述了扩展Intel体系结构处理加速器需要扩展的体系结构、语言和运行库。
另一篇论文讨论了对运行库进行修改以适应万亿级平台的特殊环境。Koehl认为,为高效、低开销地使用万亿级处理器上的多核和线程而设计的运行库对软件的可伸缩性至关重要。
论文中讨论的运行库称为McRT,对fine-grain并行化和新并行抽象提供支持,使易于进行并行编程。Koehl表示,结果表明使用这种运行库栈的一个应用程序可使用多达64个硬件线程。McRT提供了一个高性能事务内存库,通过市程序员避免易于发生错误且难于扩展的加锁机制,简化并行编程。