从0变成1是需要能量的,乌镇智库理事长张晓东预计摩尔定律还能走到2100年以后,半导体行业至少还可以蓬勃发展80到100年。

西方哲学的传统经历了一场深刻的转型,其焦点从早期对物质世界的深入探索逐步转向了对心智与意识现象的细致剖析。这一哲学重心的迁移,恰好与人类历史上的技术跃迁相互呼应,尤其是步入第三次和第四次工业革命的时代,我们目睹了传统工业时代的力量象征——蒸汽与钢铁,逐渐让位于数字时代的双刃剑:算力与智能。这一进程被广泛誉为“算力与智能的革命”。

在由芯原与上海开放处理器产业创新中心联合主办的“智”由“芯”生——RISC-V和生成式AI论坛上,乌镇智库理事长张晓东分享中深入探究了大语言模型背后的发展原理,指出全球工业革命从前两次的能源驱动演进到当前的算力驱动。

ChatGPT的出现掀起了生成式人工智能热潮。然而,语言与思维之间的关系一直是哲学上的争议话题,尽管语言可能无法完全等同于思维,但其在表达和理解思维方面的作用不容小觑。张晓东表示:“图灵不仅是现代计算机科学的奠基人,他的理论更是智能语言的核心,正如费曼将微积分誉为上帝的语言,图灵机则被视为智能的语言。”

而大语言模型则主要基于四个基础原理。

图灵机的概念简洁而强大,通过一个“读、写”头在无限长的带上移动,执行写入“0”或“1”的操作,展示了计算的本质。这种看似简单的机制实际上涵盖了所有已知计算设备的功能,这便是所谓的原理1:丘奇-图灵论题——计算机科学的基石。张晓东表示:“芯片、算力的起点就是图灵机,我们现在已知的所有计算的装置都等价于图灵机。”

原理2则是“学习就是图灵机求逆”。

学习的本质,长久以来一直是哲学与心理学探讨的热点话题,不同学科从各自的视角出发,提出了多元化的见解,却往往难以达成共识。然而,当我们追溯到人工智能的起源点——1956年的达特茅斯会议,达特茅斯会议组织者之一John McCarthy写了一篇7页纸的文章,提出了一种新颖且深刻的观点,试图从数学角度界定学习的概念,他说:“学习就是图灵机的逆”。

具体而言,如果有一系列数据输入,学习的目标就是通过分析这些数据,推断出背后潜在的“图灵机”规则,即能够生成这些数据的算法或模型。这种将学习视为从结果回溯至原因的过程,实际上是在尝试重构数据生成的逻辑。

这一定义,虽然源于1954年,却意外地与现代大模型训练的理念相吻合。在机器学习中,我们提供大量的数据给算法,通过训练,算法(或称大模型)逐步逼近能够模拟或解释这些数据的内在规律,这正是对McCarthy定义的生动实践。

十年后的1964年,另一位参与过达特茅斯会议的数学家进一步深化了这一概念,他证明了所谓的图灵机求逆问题,实质上等同于预测序列中下一个元素(Next token Prediction)的能力。这意味着,一旦掌握了预测序列中任意位置下一个元素的方法,理论上就能解决所有与学习相关的计算难题,这是大语言模型训练的核心任务。

谷歌提出的Transformer模型及其衍生的BERT和GPT模型,展示了不同学习策略的效能。那BERT和GPT有和区别吗?张晓东表示:“BERT是双向的,即给出X 1到X N,然后将X 2拿掉,再猜出X 2。而GPT是给出X 1到X N,预测出X N+1。我发现,GPT相对来说是一个比较简单的机制。”

张晓东指出人工智能的发展经历了三种主要路线:人工智能的主要路线之一是逻辑主义,即从专家系统到知识图谱;之二是联结派,神经网络,深度学习;之三是从细胞自动机到强化学习。

他表示,自然语言处理的进步在过去七十年中发生了五次范式变迁,开源对于自然语言处理的进步至关重要。

原理3:“深度学习的充分性依据是Kolmogorov–Arnold叠加”

Robert Hecht-Nielsen(HNC 创始人)证明了三层以上神经网络可以无限逼近任意连续函数。而数学根据是Kolmogorov在1956年证明的Kolmogorov–Arnold表示定理,也称叠加定理或映射定理。

张晓东提到,近来,业界对于是否应当使用医疗数据来训练模型存在争议,但即便在不直接利用医疗数据的情况下,某些模型的表现已经超越了IBM的Watson等前辈系统。此外,AI设计AI的概念也正在成为现实,其中芯片设计是一个引人注目的应用方向。谷歌在2021年展示了一项成就,他们运用AlphaGo背后的强化学习技术,仅需6小时即可完成通常需数十人花费数月才能完成的电路布局设计。尽管有人质疑这一成果的宣传效果有所夸大,但不可否认的是,它揭示了AI在加速复杂任务处理方面的巨大潜力。

张晓东还提到了近期公众热议的话题之一“大型预训练模型(大模型)的未来走向”,他表示尤其是受到一个多月以来OpenAI一位年轻研究员撰写的一篇长达160页论文的影响。该论文大胆预测,在不远的将来,或许类似于2017年或2018年“Room”项目中的超智能机器,将配备多达一千万个高性能GPU(如H100),其能耗相当于中国一个中等省份的电力消耗,这一设想引发了诸多连锁思考。

这正是大模型的发展引发的对未来计算资源分配和能耗的担忧,兰道尔原则(Landauer's Principle)指出,信息处理过程中的比特翻转需要消耗最小能量,这暗示了计算能力增长的物理极限。这也是张晓东给出的原理4:能耗与智能,Landauer Principle。

张晓东表示,从0变成1是需要能量的,他预计摩尔定律还能走到2100年以后,半导体行业至少还可以蓬勃发展80到100年。

责编:Demi
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
近年来,AWS还积极投资于人工智能(AI)、机器学习(ML)、大数据分析和边缘计算等前沿技术,以保持其在这些领域的竞争优势。
有鉴于电动汽车、自动驾驶和人工智能业务等未来增长潜力,以及在马斯克在当选总统特朗普政府中的“特殊地位”,多家分析机构认为,马斯克的财富未来还将进一步增长。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
据悉,此次交易是通过马斯克亲自与英伟达CEO黄仁勋进行沟通促成的。这批GB200 AI芯片将被用于强化其旗舰级超级计算集群——Colossus(巨人)。Colossus作为xAI的技术基石,将借此机会实现计算能力的飞跃。
Arm预计,到2025年将会有1,000亿台基于Arm架构的设备可具备人工智能功能,包括由Cortex-A、Cortex-M驱动的设备。
人工智能(AI)功能已经在各种移动设备中变得至关重要。尤其是2024年,AI PC陆续推向市场,甚至可以称为“边缘设备AI元年”。 这次我们就来盘点一下2024年下半年发布的主要AI PC和处理器。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
在科技浪潮翻涌的硅谷,马克·扎克伯格不仅是“脸书”帝国的掌舵人,更是以其谦逊低调的形象,在公众心中树立了独特的领袖风范。然而,在镁光灯难以触及的私人领域,扎克伯格与39岁华裔妻子普莉希拉·陈的爱情故事
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1