从商汤“三位一体”新战略,看大模型竞争的关键胜负手

趣味科技v 2024-10-29 17:14

成立十周年,商汤开启新长跑。

在商汤迎来十岁生日那一天,商汤科技董事长兼CEO徐立发布了一封内部信《商汤十周年再出发:专注聚焦、知行合一》,宣布启动“大装置-大模型-应用”的三位一体新战略,以及成为“最懂算力的大模型服务商,和最懂大模型的算力服务商”的新目标,并围绕战略和核心资源,启动构建更加集中和高效的组织架构,推动资源的集中和集约化投入。

此番战略调整,可以看作是商汤全面拥抱AI 2.0时代的重要举措。过去一年多,商汤对于大模型和生成式AI的投入极为坚定,日日新大模型从去年4月发布以来已快速迭代至5.5版,商汤大装置算力规模不到半年激增近70%,突破20000P大关。

今年8月商汤公布的中期业绩显示,2024年上半年整体收入同比增长21%,其中生成式AI收入大幅增长256%贡献6成收入,标志商汤全面向生成式AI转型升级的战略目标已阶段性达成。

尽管业务体量快速增长,但大模型研发所需要的巨额投入,也给持续性发展提出新的挑战,更是整个行业面临的全新难题。商汤在这个节点上提出“三位一体”战略,反映的是其在AI 2.0时代的一个更加清晰且独有的全新商业逻辑。

潮水之后,拼的是成本

去年,ChatGPT的到来把AI行业推向了2.0时代,国内也随之掀起“百模大战”,各路厂商频频打榜,各种大模型应用和行业需求更是全面开花。不过到了今年,基础大模型企业的数量已快速收敛,甚至有玩家已经放弃了基础大模型的研发,转而拥抱开源。其中一个重要的原因便是收入与成本的严重倒挂。

徐立在内部信中提到,AI 1.0和AI 2.0的重要区别,在于成本结构的变化。AI 1.0时代,模型生产的主要成本在于研发人员的投入,而在AI 2.0时代,主要在于算力资源的投入。随着尺度定律在大语言模型、多模态模型、视频生成模型以及慢思考推理过程中得到验证,生产和使用大模型的成本可以直接等价于算力资源的消耗。

换言之,在尺度定律下,堆参数带来的效果的确很诱人,但背后所需算力成本付出也的确很感人。如何控制大模型的生产和使用成本,成为当下行业竞争的关键胜负手。

在高昂算力成本的重压下,一些大模型公司商业变现的速度,远远赶不上研发投入的速度,迫使在“做模型”和“做应用”之间二选一。但是,同时拥有算力、大模型和应用的商汤不做选择题,而是形成三位一体布局——以应用驱动模型的研发,以模型带动算力的优化,并根据算力的特点来迭代大模型设计和应用。

徐立表示,如果只有基础设施,不懂大模型的话,就没有竞争力。今天使用算力主要有两类,一是训练模型,二是使用模型。训练模型时,需要优化算力使用效率;使用模型的时候,则需要节约算力成本。

三位一体的本质,就是通过集约化投入,实现“大装置-大模型-应用”的无缝集成,把资源以最有效的方式利用起来,一方面给自己“挤出”更多利润空间,提供更具性价比和竞争力的MaaS等服务,另一方面也能为客户降本增效,反哺自身业务增长。

比如在基础设施层面,商汤已实现了“训推一体"调度能力,一方面可以帮助各地方自建的算力中心做更好的运营,从而为下游提供更高效、更具性价比的算力服务;另一方面可以帮助其他企业把训好的模型放到商汤大装置上来做推理,获得更高的推理弹性性价比。在推理场景上,商汤以创新的技术架构实现了相同算力及电力成本下的每秒请求数(QPS)提升4倍,并实现了推理服务弹性按需伸缩,优化了大规模AI推理的整体成本。

用徐立的话概括就是“最懂算力的大模型服务商,和最懂大模型的算力服务商”,这也是其对行业价值最直白易懂的诠释。

垂直领域是中国大模型差异化发展的重要方向

自OpenAI推出ChatGPT之后的短短两年多时间以来,又接连发布了GPT-4o以及o1。从单模态到多模态,再到慢思考推理。面对OpenAI不断刷新技术的制高点,很多人不禁会问,中国大模型公司的机会,到底在哪里?

此前,徐立将大模型的能力划分为三层“知识层(世界知识的全面灌输),推理层(知识背后的内在联系,需要大量思维链数据),执行层(与世界进行交互)”,并指出,垂直领域的高阶思维链数据构造的模型差异化能力,可能是中国接下来大模型很重要的道路。

而数字化办公、软件代码开发,以及金融等领域,正是商汤“三位一体”在应用层所聚焦的垂直方向,这些领域的共通之处,在于都极大依赖于思维链数据的价值。

比如,在人力资源领域,商汤近期与行业龙头中智股份达成合作。目前,基于日日新大模型,商汤已经打造出“招聘助手Agent、AI面试官、AI人才盘点助手Agent”等多种角色。

招聘助手Agent可实现从候选人信息总结、生成面试问题或建议、协助安排面试、AI面试到生成报告的自动化闭环。AI面试官可进行千人千面的提问和适时有效的追问。AI人才盘点助手Agent则融合了商汤大模型的慢思考推理能力,可深入分析和挖掘每个员工的工作内容,描绘综合能力图谱,助力管理者实现精准的人岗匹配。

在AI代码生成领域,商汤代码助手、办公助手产品“小浣熊”成为内地增长最快的Copilot产品之一,个人用户和开发者达数十万,亦服务于金山办公等头部应用。其中,“代码小浣熊”背后的代码大模型已落地互联网、金融、新能源汽车等行业,服务200+企业客户;“办公小浣熊”则入驻了联想应用商店,将便捷的文档处理、数据分析等体验带给广大PC用户。

包括商汤面向金融行业推出的大模型一体机产品,不光是满足金融行业对数据隐私的需求,更是能够通过算力、模型和应用的无缝集成,以更高效的推理能力,辅助于金融业务的各类决策。在垂直行业上,商汤的大模型一体机有望依托“三位一体”战略实现规模化推广。

为什么是商汤?

回顾这些年发展,商汤所做的事情可以用六个字来概括,解决AI的“能不能”和“廉不廉”的问题。

所谓“能不能”,就是指AI在特定任务上超过人的水平,即“工业红线”。最典型的应用就是以人脸识别为代表的各类图像识别任务,在智慧城市、轨交、园区、商业,包括工业生产等各种垂直行业形成了广泛应用。但这个阶段AI只解决了整个业务链条的其中一个环节,还无法真正带来成本的下降。

所谓“廉不廉”,就是AI要覆盖更多业务环节,打通价值闭环,因此要解决更多长尾问题,也就需要更多的模型数量。在这个阶段,商汤开始研发通用模型,并构建大算力集群,通过预训练模型+大算力的方式,实现针对各类长尾细分模型的工业化快速生产,降低单个模型的生产和应用成本。比如早在2022年ChatGPT发布之前,商汤就成功研发了320亿参数量当时全球最大的通用视觉模型。

在“能不能”和“廉不廉”两个阶段,商汤积累了通用模型的研发能力、丰厚的算力储备和优化能力,以及在多个垂直行业的实践经验和上下游生态资源。

这些源于AI 1.0时代的积累,如今都能转化为商汤在AI 2.0时代快速构建竞争力的重要基础,进一步解决大模型“用得上、用得好、用得起”的问题。用得上是指能真正为用户创造价值;用得好是要进入客户的生产和流程中;用得起,则是需要大幅降低训练、推理和部署成本,这也是商汤下一步的产品和业务目标。

这就如同一个最优的资源池,任何有模型训练部署需求或算力需求的人,都有望在商汤这里获得成本更低、效率更高的服务。而也只有像商汤这种既做算力、又做模型,还做应用的AI公司,才能提供这样的服务。

从这个角度来看,“三位一体”战略既可以说是商汤对AI 1.0商业闭环的一个总结,同时也是撬动AI 2.0商业闭环的一个支点。

趣味科技v 资深媒体人彭承文和他的小伙伴们耕耘打理的科技自媒体,传播趣味文章,八卦前卫科技,年度十大媒体人,十佳科技自媒体,美通社媒体传播专家,2018平昌冬奥会火炬手.
评论
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 116浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 92浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 158浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 202浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 141浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 93浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 122浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 61浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 108浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 70浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 124浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 58浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 223浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 164浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦