据知情人士透露,TikTok母公司字节跳动正加快自研人工智能芯片的步伐,意在提升在中国人工智能聊天机器人市场中的竞争优势。
两位知情人士证实,字节跳动计划与芯片制造巨头台积电合作,力争在2026年前实现两款自研半导体芯片的量产。这一举措可能会减少字节跳动在开发和运行人工智能模型过程中对昂贵的英伟达芯片的依赖。
对于字节跳动来说,降低芯片成本至关重要。与其他中国大型科技公司及众多初创企业一样,字节跳动已经推出了自家大语言模型,供内部使用和对外销售。然而,市场竞争异常激烈,导致包括阿里巴巴和百度在内的中国科技巨头纷纷将其模型使用价格大幅下调,降幅高达97%。
字节跳动去年发布了其首款人工智能聊天机器人“豆包”,该机器人提供了类似于OpenAI ChatGPT的文本和图像生成功能。今年,字节跳动又推出了一批低成本的大语言模型,其中部分产品的定价比OpenAI的同类产品低了高达99%。
与此同时,字节跳动在开发生成式人工智能模型方面的费用也在不断上升。据知情人士透露,今年,该公司已订购了超过20万颗英伟达H20芯片,这款芯片是美国出口管制下允许出售给中国的最先进英伟达芯片。该订单的总金额超过20亿美元,目前字节跳动仍在等待英伟达交付全部订单。
不过,字节跳动正计划从台积电订购数十万颗自家设计的训练和推理芯片。预计这些内部设计的芯片成本将比从英伟达购买芯片节省数十亿美元。然而,这些芯片目前仍处于设计阶段,因此字节跳动的计划可能会有所调整。
与此同时,业界消息称,谷歌准备撤离三星代工,2025年投靠台积电,接下来两代的Tensor G5、G6系列处理器将分别使用台积电的3nm、2nm制程。
谷歌Tensor G4芯片采用了三星电子4nm制程,相比起Pixel 8搭载的Tensor G3只有小幅升级。Tensor G4仍使用三星较旧的FOWLP(扇出晶圆级封装)技术、而非新版FOPLP(扇出型面板级封装)技术。FOWLP跟之前几代技术不同,能顺利解决Exynos 2400芯片的过热问题。
如今,谷歌Tensor G5(用于Pixel 10)将做出改变,搭载台积电最新3nm制程,并使用台积电InFO-POP先进封装技术。支持Pixel 11系列的Tensor G6也会交由台积电代工,使用最新2nm制程。