2024年7月6日下午,由上海开放处理器产业创新中心和芯原微电子(上海)股份有限公司主办的“RISC-V和生成式AI论坛”,在上海世博中心成功召开。而作为此次论坛的重头戏,压轴的圆桌讨论环节不仅聚焦于AI的前沿进展,还涉及了开源硬件的产业化路径和全球AI治理的关键议题。
中国RISC-V产业联盟理事长;芯原创始人、董事长兼总裁戴伟民博士担任了此次圆桌会议的主持人,RISC-V国际基金会理事长戴路、华东政法大学政治学研究院院长兼人工智能与大数据指数研究院院长高奇琦、知合计算CEO孟建熠博士、芯来智融半导体科技(上海)有限公司CEO彭剑英女士、乌镇智库理事长张晓东担任了此次圆桌会议的嘉宾。
各专家深度探讨了生成式AI与RISC-V架构的融合创新,以及由此引发的经济、社会与技术挑战。
何时可达到超级智能?
戴伟民博士引用了Aschenbrener于2024年6月发布的《警世预言》,这份报告分析了AI从当前状态进化到AGI(通用人工智能),乃至超人工智能的路径及其潜在影响。
那么ASI的到来会给我们带来何种影响?何时可以达到超级智能?会给能源、环境、人类安全带来哪些潜在影响?
高奇琦教授认为AGI的迅速发展,尤其是基于大模型的推动,将在2027年左右实现,这一预测若成真,将对全球社会造成巨大冲击。他提出了“三失”理论,即失业、失序与失控,警示AI技术分级管控的紧迫性,类比核武器安全控制机制,呼吁对大模型必须要做好分级,包括在硬件AGI的加速卡的分级,采取类比于核武器那种安全级别的方法,不能有太多的行为体拥有这样的超能力,以防患未然。
此外,还可以参考碳排放的治理模式,用交税的方法来调节速度,即使用AI的同时要交一笔税来解决AI带来的负面的问题,并解决它产生的问题。
而在谈及“失序”中,戴伟民博士提到了ChatGPT的“幻觉”现象。高奇琦教授和张晓东博士都认为“幻觉”是AI创造力的表现,尤其在文学创作领域,它体现了机器的想象力。然而,孟建熠先生提醒,在技术层面上,“幻觉”可能带来危险,需要通过检索增强等手段进行“对齐”,确保AI行为符合人类期望。
如何看待大模型的集中化“专制”和分布化“民主”的模型部署策略?
去年,前谷歌首席执行官在麻省理工学院(MIT)的一场引人深思的演讲中,提出了一种可能的未来情景:“是否有一天,全球范围内将仅存五座或更少的超级巨型AI模型,矗立于科技之巅?”他构想了这样的分布:“或许两个源自美国,两个来自中国,还有一个可能在欧洲或其他地方。”随之而来的问题是:“这是我们所期望的未来吗?”
近期,这一议题再次成为热议焦点,人们纷纷探讨:“撇开地缘政治因素不谈,是否会出现一个时代,超级AI模型的构建需要等同于一千万张NVIDIA H100级别的显卡作为算力支撑?”这引发了对于资源分配的忧虑:“届时,少数的个体或企业是否会垄断绝大部分的计算资源?这真的是我们所期待的局面吗?”
这是一个双面问题,既关乎理想中的技术未来,也触及现实世界的考量。一方面,是否真的会如Aschenbrener去年所预测,四年后的世界仅由几家独大的AI模型统治?另一方面,哪种前景更为可能?是四年之后见证仅有的几座超级模型屹立不倒,还是我们将目睹众多虽不及前者规模,但数量庞大的大型AI模型共存?
张晓东表示,技术发展可能超越人类理解(如AlphaZero的棋类表现),显示了超级AI模型的潜在威胁。他认为超级人工智能超越人类智力的可能性很大,而是否有办法来控制超级人工智能尚不明确:“但是现在我们看到的情况,至少不容乐观、就是从我个人的观点来看,不容乐观。”
高奇琦院长指出,大型AI模型作为知识生产的基石,对全球文化的塑造具有不可忽视的作用。当全球范围内仅存少数几个以英语为中心的大模型时,那些致力于维护本土文化特色的国家可能会感受到被边缘化的威胁,因为这些模型的训练数据集中,本土文化的内容往往只占据极小的比例。
高奇琦院长提到了 “主权AI”的兴起,一位Transformer框架的创建者,目前正投身于为日本打造专属的主权大模型。这一举措的背后,是对知识统一化趋势的警惕——一旦全球范围内由少数几个大模型主宰,实质上将形成一种知识同质化,这将对文化多样性构成严重威胁。
主权AI的倡导者认为,倘若不采取行动,本土文化在未来的全球竞争中将面临消失的风险。然而,现实往往更为复杂,小国或小型社区可能因资源有限,难以独自承担构建大模型的重任。这便触及了一个核心难题:如何在维护文化特色与参与全球知识竞赛之间找到平衡点。
面对这一挑战,高奇琦院长指出,理想的状态应是在全球一体化与本土文化保护之间取得微妙的平衡。这意味着既要拥抱技术进步带来的便利,又要确保文化身份不受侵蚀,这是一个复杂且艰巨的任务。
AI和RISC-V到底怎么结合?
在AI技术飞速发展的今天,算力成为了支撑这一变革的核心力量。练维汉指出,尽管AI的算法和应用已经取得了巨大进步,但算力的问题仍然是制约其进一步发展的关键瓶颈。RISC-V作为一种开源的指令集架构,因其灵活性和可扩展性,在AI算力的发展中扮演了重要角色。
孟建熠先生强调了RISC-V架构在AI领域的核心作用,认为其开放性和可定制性使其成为AI应用的理想选择。RISC-V的包容性能够吸纳各种硬件创新,促进软件生态系统的繁荣,为AI时代的技术革新提供了坚实基础,他表示:“RISC-V始于CPU,但是盛于AI应用上。”
戴伟民博士提到了国外初创公司Etched Al推出了Transformer专用ASIC"Sohu",其性能是英伟达产品的20倍,这就是架构创新方面非常好的尝试。孟建熠认为,他们未来应该也会用RISC-V。
现场66.67%的投票认为,ASIC取代GPU,孟建熠则认为应该加一个“并存”选项。
张晓东博士表示,尽管Transformer架构在实现神经网络方面表现出显著的有效性,学术界与工业界仍在不懈探索,试图提出全新的、与Transformer截然不同的神经网络架构。
张晓东认同孟博士的观点,认为在可预见的未来,多种架构将共存于世。他指出,这种共存状态的持续时间取决于时机。如果某一团队能在新的、不同于Transformer的算法出现之前,将Transformer架构优化至极致,那么他们将暂时领先。然而,一旦有更新颖、更高效的算法出现,超越了Transformer的局限,那些依赖旧架构的公司将面临严峻挑战。因此,在短期内,我们很可能看到的是一个架构共存的时期。
戴伟民先生提及,Transformer最初被设计用于处理文本翻译任务,但如今,其应用范围已扩展至视频和音频领域。对此,张晓东解释,视频与语言曾被视为截然不同的数据类型,但在最新模型中,视频被分解成多个片段,每个片段作为一个Token,后续处理过程与文本处理极为相似,这极大地提升了处理效率,某种程度上验证了“第一性原理”的有效性。
高奇琦院长补充道,Sora项目将Transformer应用于图像生成领域,通过与扩散模型的结合,实现了显著的性能提升。他以特斯拉的端到端自动驾驶技术为例,指出以前人们普遍认为仅凭图像无法实现自动驾驶,但借助Transformer方法,机器学会了图像理解,这颠覆了人们的认知。他强调,人类对于机器理解语言的方式仍知之甚少,正如我们难以完全理解自身语言理解的过程,两者在预测下一个单词或符号上有着惊人的相似性。
x86、Arm以及RISC-V架构目前呈现出三强争霸的局面。当谈及从x86迁移到Arm架构,尤其是针对运行Windows操作系统的场景时,确实存在一定的复杂性和挑战。高通公司在这方面投入了大量资源,力图打破壁垒,将Arm架构的芯片引入PC市场,因为消费者和企业用户长期以来都倾向于使用基于x86架构且搭载Windows系统的计算机。同样的情况也出现在数据中心领域,这里依然是x86架构的天下。
然而,当我们聚焦于人工智能(AI)领域时,哪种架构更具有优势呢?现场44.44%的观众认为RISC-V更具优势。
戴路表示,在x86、Arm和RISC-V这三种主流架构中,x86作为历史最为悠久的一员,尽管其原始设计并非针对AI,但通过不断演进和扩展,x86架构已能更好地适应AI计算。然而,即便如此,x86在AI生态中的地位并不突出,真正占据主导的仍是英伟达的CUDA生态。这解释了为何众多公司热衷于GPU研发,究其根本,皆因GPU在AI计算中的卓越表现。
他认为,Arm和RISC-V均属精简指令集(RISC)架构家族,两者各有千秋。Arm架构以低功耗著称,这使其在移动设备和边缘计算领域大放异彩。而RISC-V架构,除了同样具备低功耗优势外,更胜在高度的灵活性和可定制化。这为AI应用提供了更多可能性,尤其是当用户希望在AI模型中融入独家秘籍时,RISC-V允许添加自定义指令,既满足个性化需求,又降低了芯片设计的成本。
安全是另一个备受关注的领域,尤其是在AI保护方面,各国政府和企业都不愿自己的技术轻易被他国破解。RISC-V的可定制特性恰好能满足这一需求,允许不同地区根据自身安全标准进行定制,从而构筑更为坚固的防护墙。
Chiplets技术有望在汽车行业率先落地
彭剑英表示,在讨论x86、ARM架构以及诸如“Sohu”这样的定制化架构时,我们不得不思考它们各自在不同领域的优劣,以及与通用架构相比有何独特之处。多年来,处理器设计并未发生根本性变革,流水线架构等核心原则依旧。然而,AI的兴起彻底改变了游戏规则,无论是汽车、服务器还是终端设备,都孕育了全新的市场机遇和增长点。
许多企业正在DSA(Domain-Specific Architecture,特定领域架构)与通用CPU或GPU之间寻找平衡点。高性能硬件若缺乏适用性或编程难度过高,将难以获得市场青睐。例如,早期的DSP(Digital Signal Processor,数字信号处理器)要求编写汇编代码,对程序员提出了极高要求。随着时代变迁,精通C语言的开发者越来越少,AI领域的专业人才更是稀缺。对于新兴创业公司而言,平衡DSA的特化优势与通用架构的广泛适用性成为一项挑战。
以芯来智融为例,该公司去年获得了最高等级的产品认证,这得益于其前瞻性的战略定位,将汽车市场视为未来增长的重要引擎。传统燃油车的封闭系统正被新能源汽车所颠覆,特斯拉为首的新势力引领了自动驾驶算法与芯片的潮流。车身控制、预控、ADS(Autonomous Driving System,自动驾驶系统)、智能座舱等功能的集成,标志着软件驱动的架构设计已成为行业共识。在新能源汽车的驾驶体验中,无需手动干预即可实现变道和避障,这一切离不开软件与算法的进步,同时也对芯片架构和设计产生了深远影响。
戴伟民博士最后强调,终端推理卡和云端训练卡的开发是当务之急,目标是与英伟达相媲美,至少在功耗上取得优势。汽车领域蕴含巨大商机,而Chiplets(小芯片)技术则是下一个重要赛道。在国际标准的引领下,Chiplets技术有望在汽车行业率先落地,推动汽车产业标准的制定与发展。