过去的一年,大家都感受到了大模型取得了令所有人所称道的成绩,其背后实际上是强大的算力支撑。如果从2012年这一轮深度学习开始实现有效应用算起,它的算法网络结构其实就是持续极高速的增长,大概每六个多月可能就要翻一倍。单一AI算法对于算力的需求就增加了30万倍。

2023年,随着以ChatGPT为代表的AI大模型爆火,算力需求大幅上升,也推升了算力的核心AI芯片的需求。如何在新趋势、新挑战下快速响应需求,推出切实可用的软硬件解决方案,成为了摆在AI芯片企业面前的重要课题。在2023中国临港国际半导体大会上,商汤科技联合创始人、大装置事业群总裁杨帆以“AI大模型技术发展对芯片的关键挑战”为主题,分享了当前AI技术趋势下的新挑战,以及商汤科技在AI大模型方面的布局情况。

汤科技联合创始人大装置事业群总裁

杨帆表示,最近一年,AI大模型实现了快速的增长。可以说,人工智能新范式(AGI)已经到来。今年4月,商汤科技也推出了“商汤日日新SenseNova”大模型,主要包括中文语言大模型应用平台、AI 内容创作社区平台、AI 数字人视频生成平台、场景 3D 内容生成平台、物体 3D 内容生成平台5大应用平台,“我们相信下一代大模型还是会进入到多模态的领域。”

据介绍,商汤科技大模型可以应用于智能客服、营销内容生成(主要包括AI营销素材生成和数字人直播)、选股问答等智能化服务,同时还可以满足“大模型+”多行业应用,比如能源、汽车、医疗、文旅等。

“最近半年,我们可能感受还不强烈,主要在于很多基于大模型的应用还处在试用或者小范围市场化阶段,但到了2024年绝大多数人应该能感受到大模型带来的力量。这些新的技术和应用的出现,会让我们感受到过去AI所提供的内容和服务还是太简单了,同时我们相信未来它可以拥有更大的力量。”杨帆这样看AI大模型未来发展趋势。

“过去的一年,大家都感受到了大模型取得了令所有人所称道的成绩,其背后实际上是强大的算力支撑。如果从2012年这一轮深度学习开始实现有效应用算起,它的算法网络结构其实就是持续极高速的增长,大概每六个多月可能就要翻一倍。单一AI算法对于算力的需求就增加了30万倍。”杨帆表示,“其实数据规模就决定需要一个更复杂的网络,就像人的大脑一样,需要更多的大脑的节点连成一个网络,才能够承载和消化这些数据中隐含的价值、规律和信息。虽然我们并不知道它是怎么去提炼的,但是这个规模关系是明确的。一个更加复杂的网络结构或者大脑结构势必需要更大规模的算力。”

杨帆介绍,随着技术门槛的不断提高,算力成为发展的关键基石。近期热点技术应用如ChatGPT、大模型等技术应用对AI算力及数据的需求逐步上涨。作为一个大型语言模型,ChatGPT使用了大量的训练数据,因此需要高效的存储系统来存储这些数据。此外,训练模型需要大量的计算资源来进行训练,需要高性能的处理器来支持训练。

杨帆指出,过去十年,数据、模型、算力这三大AI要素持续的规模化,推动着整个人工智能的技术进步,但至今我们还没有触及到极限所在。

“可以看到,伴随着数据进一步提升,我们仍然没有触摸到AI的能力极限。我们也不知道,如果能够获得更高一个量级的数据,我们用再大一个量级的算力支撑去训练它的时候会发生什么?这是今天在人工智能领域所面临的挑战。”杨帆表示,如果把人工智能领域未来面临的挑战再映射到集成电路上,我们在芯片算力上将面临更大的挑战。而在国外新的AI禁令下,中国企业在AI大模型发展上正面临更大的挑战,不仅国外AI芯片出口受限,而且国内AI芯片供给不足,特别是要进行更大数量级的AI大模型训练,需要耗费更多的资源。

当然,他也坚信,正是在这样的挑战之下,中国产业链生态将形成更深度的合作,包括芯片制造、软硬件适配等。为此,商汤科技也做了很多工作以及相关布局,比如加大与国内AI芯片厂商合作,成立算力产业生态联盟,推动一些行业标准的建立,同时还在临港建设智能计算中心(目前国内最大单体人工智能计算中心)。

此外,杨帆也希望包括人工智能软件厂商、芯片厂商在内的产业链企业协同配合,共同推进人工智能的发展。

责编:Jimmy.zhang
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
最近收到一款Jetson Orin Nano Super开发套装,我打算拿它来做个简单的AI应用开发...在没有任何AI应用和嵌入式应用开发经验的基础上...主打传说中的零代码开发~
这一新指导政策不仅反映了中国在芯片产业中减少对外依赖的战略意图,也体现了RISC-V架构在中国芯片产业中的重要地位和发展潜力。
“祖冲之三号” 具备105个可读取比特和182个耦合比特,处理量子随机线路采样问题的速度比目前最快的超级计算机快15个数量级,超过谷歌2024年10月公开发表的最新成果6个数量级。
目前英特尔采取了“产能匹配”策略,即需确保“投资节奏与市场需求一致”,避免过度投入导致产能闲置。这番说辞或意味着英特尔面对巨大财务压力作出了不得已的战略调整。
微软还强调,拜登政府的《人工智能扩散出口管制框架》限制了美国向许多快速增长且具有战略意义的市场出口关键AI组件,破坏了特朗普政府的两项优先事项:加强美国的AI领导地位以及减少美国近万亿美元的贸易逆差。
Ocelot是AWS与加州理工学院合作开发的,集成了两个堆叠在一起的小型硅微芯片。 AWS表示,该芯片的设计可将与纠错相关的成本降低多达90%。
TEL宣布自2025年3月1日起,现任TEL中国区地区总部——东电电子(上海)有限公司高级执行副总经理赤池昌二正式升任为集团副总裁,同时兼任东电电子(上海)有限公司总裁和东电光电半导体设备(昆山)有限公司总裁。
预计在2025年,以下七大关键趋势将塑造物联网的格局。
领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCON China 2025一展全看,速登记!
本次股东大会将采取线上和线下相结合的混合形式召开,股东们可选择现场出席或线上参会。
小米宣布全球首发光学预研技术——小米模块光学系统,同时发布官方宣传视频。简单来说,该系统是一个磁吸式可拆卸镜头,采用定制M4/3传感器+全非球面镜组,带来完整一亿像素,等效35mm焦段,配备f/1.4
插播:历时数月深度调研,9大系统性章节、超百组核心数据,行家说储能联合天合光能参编,发布工商业储能产业首份调研级报告,为行业提供从战略决策到产品方向、项目资源的全维参考!点击下方“阅读原文”订阅又一地
今日光电     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!----追光逐电 光引未来----图1 采用自上而下方法实
点击上方蓝字谈思实验室获取更多汽车网络安全资讯01摘要近年来,电子控制单元(ECU)不再局限于简单的便利功能,而是将多种功能整合为一体。因此,ECU 拥有比以往更多的功能和外部接口,各种网络安全问题也
差分运算放大电路,对共模信号得到有效抑制,而只对差分信号进行放大,因而得到广泛的应用。差分电路的电路构型    上图是差分电路。    目标处理电压:是采集处理电压,比如在系统中像母线电压的采集处理,
前不久,“行家说三代半”报道了长安汽车采用氮化镓OBC车载电源(点击查看)。近期,比亚迪、广汽埃安两家车企又相继公布了氮化镓应用进展:比亚迪&大疆:车载无人机采用氮化镓技术3月2日,比亚迪、大疆共同发
高通又放大招了!3月3日,也就是MWC世界移动通信大会的第一天,高通正式宣布,推出自家的最新5G调制解调器及射频解决方案——高通X85。高通X85对于高通X85的发布,行业早有关注。因为高通的手机So
今日光电     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!----追光逐电 光引未来----来源: 逍遥设计自动化申
如果说华为代表了国产手机芯片的最高水平,那么紫光展锐无疑就是国产中低端芯片最大的依持了。3月3日,巴塞罗那MWC世界移动通信大会上,紫光展锐正式发布手机芯片T8300。据了解,T8300采用的是6nm
2025年3月11-13日,亚洲激光、光学、光电行业年度盛会的慕尼黑上海光博会将在上海新国际博览中心-3号入口厅N1-N5,E7-E4馆盛大召开。本次瑞淀光学展示方案有:■ MicroOLED/Min