首先是OpenAI 推出的全新生成式人工智能模型Sora,是这几天全网讨论最多的话题了。说Sora将改变世界,马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁、周鸿祎、李志飞等科技人物纷纷下场评论;其中红衣主教周鸿祎说:“AGI实现将从10年缩短到1年”!最具代表性了!但飙叔更关注的是Sora代表的人工智能爆火背后的AI算力;自从前两年ChatGPT爆火,从而带动了AI算力需求的热潮,受益最大的无疑是黄仁勋的英伟达了。在此热潮之下,英伟达AI芯片供不应求、大规模短缺,可谓赚得盆满钵满。但最近有两个AI芯片事件,可能意味着英伟达即将遭遇强力挑战,或许危险真的来临了!就在全世界还沉浸在Sora带来的视觉震撼时,一个初创芯片企业Groq给全球AI芯片领域投下了一个“王炸”产品。2月20日,初创公司Groq开放了免费试用其最新研制的AI芯片,初试芯片响应速度震撼了业界。搭载Groq芯片的大模型回复用户的速度极快,达到普通人打字速度的75倍,比英伟达芯片的响应速度快10倍以上。
专业测评显示,Groq芯片搭配Llama二代模型可以达到每秒近500个token,如果搭配其他小厂商的模型甚至能达到每秒700token的文字处理速度。而根据公开数据测算,英伟达旗下芯片驱动的GPT大模型的文字生成速度大约为每秒40个token。评测出来的速度足以让整个AI芯片圈震撼得目瞪口呆的了。但王炸不仅仅在速度,更重要的是Groq芯片的制程工艺和相关配置。根据Groq公司官网介绍,其芯片为LPU(语言处理单元)芯片,Groq公司也是全球范围内首个创造了LPU(语言处理单元)技术路线的芯片厂商,而英伟达采用的是主流的GPU(图形处理单元)路线。LPU架构是Groq公司专为AI推理所设计的,线路极其精简,也没有GPU需要的高性能且昂贵的内存结构;是专为AI计算提供高确定性的低延迟和高性能的芯片!
值得一提的是,不需要高性能而昂贵的内存,也就是不需要HBM。使用的是SRAM即静态随机存取存储器。SRAM是用触发器来存储信息,不需要对数据进行刷新,也可以同时送“行、列”地址。因此SRAM的运行速度就有了显著的优势。另外,LPU还有一个巨大的不同,Groq的芯片采用14nm制程,不需要动不动就5nm制程、3nm制程;同时也不需要使用昂贵的先进封装技术。
这是不是为国产芯片及半导体产业,尤其是国产AI芯片厂商们开辟了一条全新国产算力之路呢?在飙叔看来,至少给国产芯片信心,半导体制程并不是决定一切的,很多时候芯片设计思想和方法也可以发挥巨大作用。回到LPU对英伟达的影响,首先我们得知道Groq公司是一家专门的芯片设计公司,其成立于2016年,总部位于美国加利福尼亚,创始团队中有很多人都参与过谷歌TPU项目。其中,Groq创始人兼CEO乔纳森·罗斯(Jonathan Ross)曾设计并制作出了第一代谷歌TPU芯片的核心元件,TPU 20%的研发项目都由他完成。因此,Groq公司直接对标的就是英伟达,而此次LPU产品对于英伟达GPU来说,可以说是釜底抽薪了;不客气得说,一旦LPU产品线成熟对于英伟达来说绝对是迄今最为强劲的竞争对手。何况英伟达不仅要面对Groq这些初创公司,各大巨头们起义之声也是此起彼伏。
据 the information 透露,科技巨头微软正在开发一种新的网卡芯片,替代英伟达ConnectX SmartNIC智能网卡产品,以确保 AI 模型数据可以在微软云服务器之间快速传输。微软方面确认了此消息。实际上,作为英伟达GPU(图形处理器)的最大客户之一,微软事件是一个重要“信号”。除了省成本之外,微软还希望新网卡能够提高其英伟达芯片服务器的性能,将有助于使用微软云的OpenAI 研发更多 AI 大模型。
对于微软来说,除了自身本来的团队以外,在去年收购的 Fungible,从而为进入AI芯片市场做好了准备。微软在收购 Fungible 的公告中说,Fungible 一家可组合基础设施提供商,旨在通过高效、低功耗的数据处理单元 ( DPU ) 加速数据中心的网络和存储性能。从 Fungible 的背景看来,微软收购对其 DPU 业务来说无疑是如虎添翼。
不止是微软。谷歌于2023年底发布了其新的人工智能模式——Gemini,认为其已经超越了Openai的ChatGPT4,已经成为业界最先进的模型。其使用的AI芯片是谷歌自己研发的——TPU。
TPU正式名称是“张量处理单元”(Tensor Processing Units,简称TPU),其是谷歌花了近十年时间自己开发出来的人工智能芯片。
另外,AMD、英特尔、Meta、亚马逊等巨头们也是蠢蠢欲动!而更让英伟达颤抖的是奥特曼宣称要筹集7万亿美元用于搭建全球人工智能基础设施;孙正义则向全世界要1000亿美元,用于创建一家新的芯片公司。
这些全球科技巨头们,不同于新创公司,他们几乎都是英伟达的大客户,不仅每年购买了英伟达大部分的GPU;而且这些巨头们本身资金、技术、各种资源触手可得,在技术路线与产品方向确定的情况下,巨头们“独立”只是时间早晚问题,没有意外。
因此,前面有初创公司不断的拱火;后方各大客户大举“独立的起义旗帜”;对英伟达来说,现在到了“最危险时刻”也就不为过了。
三、国产AI芯片的曙光
如上所述,Groq用14nm工艺做出的大模型推理芯片,响应速度竟然比英伟达快十倍,直接吊打了英伟达的H100。
这对国产AI芯片产业来说,从思路和方向上开辟了一条全新的发展道路;让国产芯片在受到美国极限打压之下看到了曙光——可以不需要EUV光刻机,摆脱所谓先进制程的限制,也就是说用现有光刻设备及其配套完全可以生产出国产高性能的人工智能芯片。
当然在飙叔看来,也给国产芯片注入一剂强心剂,半导体制程并不是决定一切的,很多时候芯片设计思想和方法也可以弯道超车!
而各巨头们纷纷进入人工智能芯片参与竞争,对于国产芯片厂商来说同样不是什么坏消息。从现占据市场主导地位的英伟达来说,在全球市场越激烈时,其对于中国市场的依赖就会越强,也变相强迫其更为重视中国市场的需求;而巨头们投入巨资研发的TPU也好,或是其他类型AI芯片也罢,也都可以为国产AI芯片厂商们提供技术路线以及产品方向的参考及其借鉴意义。
当然,无论如何“打铁还需自身硬”,加大投入,加快国产AI芯片的研发始终是根本;只有国产AI芯片具备足够的实力,也才能为国产算力提供强大的后盾;也才能真正打破美国阻扰中国获取先进算力的计划!
飙叔感谢您花时间关注与分享,感谢在我的人生道路中多了这么多志同道合的朋友,一起关注国产光刻机、国产芯片、国产半导体艰难突破之路;一起分享华为海思、华为鸿蒙及华为手机等华为产业为代表的中国ICT产业崛起的点点滴滴;从此生活变得不再孤单,不再无聊!
| 勾搭飙叔,请扫码
|