商汤发布第六代大模型,可推理中长视频

WitDisplay 2025-04-11 16:43

不得了!“沪牌”大模型,给人形机器人装上大脑、眼睛、耳朵和嘴巴了!

傅利叶通用人形机器人GRx,能辨别眼前的两瓶饮料,还能根据“想减肥”的需求,给出选择矿泉水而非可乐的建议。

另一位具身智能机器人“飞燕”,能准确地描述“所见所闻”,包括室内环境如何、人们在做什么。

这些多模态能力,来自商汤科技最新发布的新一代“日日新SenseNova V6”大模型。

技术交流日现场,傅利叶通用机器人和观众互动

在10日的商汤技术交流日上,日日新V6风头十足,实现“长思维链+数理能力+推理能力+全局记忆”的能力升级,包括最长64K思维链、大幅领先GPT-4o的数据分析能力、多模态深度推理国内第一、10分钟长视频理解及深度推理等强项。

“AI之道,在于百姓之日用。商汤日日新V6将跨越多模态边界,释放推理与智能的无限可能。”商汤科技董事长兼首席执行官徐立如是说。

商汤科技董事长兼首席执行官徐立发布全新升级的“日日新SenseNova V6”

自研训练技术“硬啃”多模态能力

2025年,大模型发展有三大重要技术趋势:效率至上、多模态、深度推理。

徐立说,有人预计互联网上可用的人类文本数据将在2028年耗尽,但这不代表整个知识都“学完”了——很多知识都蕴藏在大量的图像、视频,甚至3D等其他模态中。

“从人类学习的路径来讲,即使知识的含量一样,多模态的学习方式效率也会更高。”他指出。

这也是为什么,商汤要“硬啃”多模态的原因了。

记者了解到,全新升级的日日新V6原生多模态通用大模型,采用混合专家架构(MoE),拥有6000亿参数,做到三合一:多模态长思维链+多模态强化学习+多模态全局记忆。

商汤科技“办公小浣熊”

技术交流日上,商汤也展示了日日新V6与OpenAI、谷歌、DeepSeek等先进模型在纯文本、多模态、纯文本推理、多模态推理上的具体分数对比,可以看到纯文本任务综合性能优秀,比肩国际一线模型;多模态性能领先,各方面性能突出;具体分数上略有参差。

商汤科技联合创始人、执行董事及人工智能基础设施和大模型首席科学家林达华告诉新民晚报记者,日日新V6采用了自研的原生多模态融合训练技术——这是一种能够将多种模态信息在模型架构和训练过程中进行深度融合的AI模型架构。

“与传统的将语言模型和多模态模型分立的方式不同,它通过桥接技术,如补充训练数据和模态关联机制来实现模态间的协同,避免传统方法中‘跷跷板效应’——增强某一模态能力导致另一模态能力下降。”林达华解释。

现场展示搭载了“日日新V6”的各项应用

视频理解打破限制

只需“喂”上一段柯南片段,日日新V6就摇身一变成“名侦探”展开剖析——它会对整个视频的内容先做一个总结,再按照秒级,对视频片段做内容上的推演。

再给日日新V6“喂”上一段《黑神话悟空》的打斗片段,它不仅能将精彩时刻剪辑出来,还会秒变资深解说员……

技术交流日上,日日新V6在视频理解上的表现,赢得了阵阵掌声。徐立介绍,凭借“全局记忆”能力,它打破了传统模型仅支持短视频的限制,可支持10分钟级视频全帧率解析。

“商汤自研技术可将视觉信息、听觉信息、语言信息和时间轴逻辑进行对齐,形成多模态统一时序表征。”徐立解释,“在此基础上通过细粒度级联信息压缩和内容敏感的动态过滤,实现长视频的高比例压缩,10分钟视频可以压缩到 16K tokens,仍然保留关键语义。”

林达华透露说,今年商汤将把视频理解支持时长进一步提升到1小时。

现场演示了给小朋友辅导数学题的场景,传统大模型只会提供千篇一律的标准答案,无法基于不同的解题思路提供指导;而日日新V6不但能识别手写体,还能够提供针对错误点的一对一引导式讲解,并给予精准辅导。

在家庭场景,很多家长没有时间读绘本,或者得绞尽脑汁地给孩子讲故事——现在也可以由大模型代劳了。日日新V6能实现连续记忆与时序逻辑理解,讲述更完整生动的故事,还能挖掘故事深意,升华主旨。

泰州学派提出,“圣人之道无异于百姓之日用”。在徐立看来,“AI之道无异于百姓之日用”——在通用人工智能时代,大模型变成了老百姓的日用品,在很多的细分场景中能带来价值闭环。

日日新V6的多模态能力可用于文旅

实现更生动、更智能人机互动体验

商汤认为,大模型在商业应用上有两个关键价值:融入真实的业务应用,优化与人交互体验。

真实世界发生的对话,不会像和大模型“沟通”时那般把每个指令都描述得完整清晰,可能随手指着一个东西提问:“那个是啥?”“这有什么用?”

对应到机器人亦是如此。技术交流日上,商汤还开启了与多家具身智能头部企业的战略合作——多模态大模型可以成为机器人的大脑和眼睛,增强感知能力,像人一样进行深入思考和自然表达,还有更强的记忆力。

傅利叶与商汤科技战略合作签约

“通过合作,傅利叶GRx实现了更生动、更智能的人机互动体验,显著增强了它在导览咨询、医疗康复、教育培训等多样化应用场景中的表现。”现场展台工作人员表示,伴随大模型技术的进步与演进,GRx也将持续优化机器人本体能力,更好地适应复杂环境,完成更多元任务的能力,加速人形机器人更广泛地融入日常生活。

上海归墟机器人科技有限公司也把日日新搭载到了“飞燕”机器人上,使其具备全景视界感知、情感交互及心理健康筛查功能。

值得一提的是,大模型技术的高效落地与规模化应用,离不开高效稳定的算力底座。商汤科技联合创始人、大装置事业群总裁杨帆透露,商汤大装置已经将多模态推理应用的成本降到和大语言模型一样。

据悉,国产芯片参与了日日新V6的训练,而商汤也将持续对进口及国产芯片做适配和优化,希望能提供市场最优的性价比。

商汤大装置宣布今年发放1亿代金券,全栈赋能场景落地

“日日新”,源自我国古代经典《礼记·大学》中的名句“苟日新,日日新,又日新”。其本意是如果一天能够自新,就该天天自新,持续不断地革新。回过头来看,从V1到V6版本,商汤日日新的发展速度确实做到了“日日新”:平均3—4个月便会有一次迭代。新民晚报记者了解到,当前,商汤正致力于通过基础设施、大模型和应用的协同迭代,成为“最懂算力的大模型服务商”和“最懂大模型的算力服务商”。

商汤董事长兼CEO徐立认为,大模型发展这么多年,其实已经用完互联网上大部分文本数据。也有观点预测,到2028年互联网上所有文本数据将被消耗完。

不过,在徐立看来,这并不意味着整个知识(体系)都被消耗完了。徐立认为,很多知识都蕴藏在图像、视频或者3D模态中。但到目前为止,还没有完全把这些知识真正用来提升原来的文本,甚至是智力的能力,因为模态的融合没有做到那么好。

徐立认为,从人类学习的路径来讲,即使是知识的含量一样,多模态的学习方式可能效率会更高。从小到大学习数学、几何、物理、化学实验,甚至学习交通规则、玩游戏的说明书等都是多模态的,从数据量来讲,多模态是补充人类智能的核心要素,而从学习方法上也是更有效的。

关于商汤“日日新V6”,徐立表示,一些核心的指标,在纯文本和多模态的单任务和复杂任务的推理之上,商汤都居于行业前列。

徐立称,最早大家在做大模型的时候,领先的有OpenAI。但到今年,中国在很多情况下,能够同步发布出对标甚至超越美国同期发布的模型,这也是行业认知逐步刷新的一个必然结果。

值得注意的是,此次技术开放日,商汤也推出用于人形机器人领域的世界模型,并与傅利叶机器人达成合作。

对于机器人自主决策,傅利叶创始人顾捷表示,机器人现在类似于会走路的大模型。当机器人能够预测下一步动作,它就能产生大模型。但是,目前还不确定什么时候能够真正完成VLA(视觉语言动作模型),即语言、视觉和动作的打通。目前的卡点在于大模型的思考能力是慢性的,而机器人是快速走动的。快系统与慢系统的连接,是未来研究的方向。(新民晚报、每日经济新闻)

AI行业交流群
图片




WitDisplay 智慧显示(Wit Display)由资深科技媒体人创立,跟踪全球显示产业链、AIoT产业最新动态.
评论 (0)
  •   航空兵训练与战术对抗仿真平台系统解析   北京华盛恒辉航空兵训练与战术对抗仿真平台系统是现代军事训练的关键工具,借助计算机技术构建虚拟战场,支持多兵种协同作战模拟,为军事决策、训练及装备研发提供科学依据。   应用案例   目前,已有多个航空兵训练与战术对抗仿真平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润航空兵训练与战术对抗仿真平台。这些成功案例为航空兵训练与战术对抗仿真平台的推广和应用提供了有力支持。   一、系统架构与核心功能   系统由模拟器、计算机兵力生
    华盛恒辉l58ll334744 2025-04-24 16:34 122浏览
  • 前言本文主要演示基于TL3576-MiniEVM评估板HDMI OUT、DP 1.4和MIPI的多屏同显、异显方案,适用开发环境如下。Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:VMware16.2.5、Ubuntu22.04.5 64bitU-Boot:U-Boot-2017.09Kernel:Linux-6.1.115LinuxSDK:LinuxSDK-[版本号](基于rk3576_linux6.1_release_v
    Tronlong 2025-04-23 13:59 144浏览
  •   高海拔区域勤务与装备保障调度系统平台解析   北京华盛恒辉高海拔区域勤务与装备保障调度系统平台专为高海拔特殊地理环境打造,致力于攻克装备适应、人员健康保障、物资运输及应急响应等难题。以下从核心功能、技术特点、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个高海拔区域勤务与装备保障调度系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润高海拔区域勤务与装备保障调度系统。这些成功案例为高海拔区域勤务与装备保障调度系统的推广和应用提供了有力支持。   一、核心
    华盛恒辉l58ll334744 2025-04-24 10:13 105浏览
  •   电磁频谱数据综合管理平台系统解析   一、系统定义与目标   北京华盛恒辉电磁频谱数据综合管理平台融合无线传感器、软件定义电台等前沿技术,是实现无线电频谱资源全流程管理的复杂系统。其核心目标包括:优化频谱资源配置,满足多元通信需求;运用动态管理与频谱共享技术,提升资源利用效率;强化频谱安全监管,杜绝非法占用与干扰;为电子战提供频谱监测分析支持,辅助作战决策。   应用案例   目前,已有多个电磁频谱数据综合管理平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁频谱数
    华盛恒辉l58ll334744 2025-04-23 16:27 196浏览
  •   有效样本分析决策系统平台全面解析   一、引言   北京华盛恒辉有效样本分析决策系统在当今数据驱动的时代,企业、科研机构等面临着海量数据的处理与分析挑战。有效样本分析决策系统平台应运而生,它通过对样本数据的精准分析,为决策提供有力支持,成为提升决策质量和效率的关键工具。   应用案例   目前,已有多个有效样本分析决策系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润有效样本分析决策系统。这些成功案例为有效样本分析决策系统的推广和应用提供了有力支持。   二、平台概述
    华盛恒辉l58ll334744 2025-04-24 11:13 98浏览
  • 一、技术背景与市场机遇在智能家居高速发展的今天,用户对家电设备的安全性、智能化及能效表现提出更高要求。传统取暖器因缺乏智能感知功能,存在能源浪费、安全隐患等痛点。WTL580-C01微波雷达感应模块的诞生,为取暖设备智能化升级提供了创新解决方案。该模块凭借微波雷达技术优势,在精准测距、环境适应、能耗控制等方面实现突破,成为智能取暖器领域的核心技术组件。二、核心技术原理本模块采用多普勒效应微波雷达技术,通过24GHz高频微波信号的发射-接收机制,实现毫米级动作识别和精准测距。当人体进入4-5米有效
    广州唯创电子 2025-04-23 08:41 161浏览
  •   陆地边防事件紧急处置系统平台解析   北京华盛恒辉陆地边防事件紧急处置系统平台是整合监测、预警、指挥等功能的智能化综合系统,致力于增强边防安全管控能力,快速响应各类突发事件。以下从系统架构、核心功能、技术支撑、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个陆地边防事件紧急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润陆地边防事件紧急处置系统。这些成功案例为陆地边防事件紧急处置系统的推广和应用提供了有力支持。   一、系统架构   感知层:部
    华盛恒辉l58ll334744 2025-04-23 11:22 128浏览
  • 故障现象一辆2016款奔驰C200L车,搭载274 920发动机,累计行驶里程约为13万km。该车组合仪表上的防侧滑故障灯、转向助力故障灯、安全气囊故障灯等偶尔异常点亮,且此时将挡位置于R挡,中控显示屏提示“后视摄像头不可用”,无法显示倒车影像。 故障诊断用故障检测仪检测,发现多个控制单元中均存储有通信类故障代码(图1),其中故障代码“U015587 与仪表盘的通信存在故障。信息缺失”出现的频次较高。 图1 存储的故障代码1而组合仪表中存储有故障代码“U006488 与用户界
    虹科Pico汽车示波器 2025-04-23 11:22 112浏览
  •   海上训练与保障调度指挥平台系统解析   北京华盛恒辉海上训练与保障调度指挥平台系统是现代海上作战训练的核心枢纽,融合信息技术、GIS、大数据及 AI 等前沿技术,旨在实现海上训练高效组织、作战保障科学决策。以下从架构功能、应用场景、系统优势及发展挑战展开解读。   应用案例   目前,已有多个海上训练与保障调度指挥平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润海上训练与保障调度指挥平台。这些成功案例为海上训练与保障调度指挥平台的推广和应用提供了有力支持。   一
    华盛恒辉l58ll334744 2025-04-24 15:26 109浏览
  •   通用装备论证与评估系统平台解析   北京华盛恒辉通用装备论证与评估系统平台是服务军事装备全生命周期管理的综合性信息化平台,通过科学化、系统化手段,实现装备需求论证、效能分析等核心功能,提升装备建设效益。   应用案例   目前,已有多个通用装备论证与评估系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润通用装备论证与评估系统。这些成功案例为通用装备论证与评估系统的推广和应用提供了有力支持。   一、系统分层架构   (一)数据层   整合装备性能、作战、试验等多源异
    华盛恒辉l58ll334744 2025-04-24 16:14 110浏览
  •   无人机结构仿真与部件拆解分析系统平台解析   北京华盛恒辉无人机结构仿真与部件拆解分析系统无人机技术快速发展的当下,结构仿真与部件拆解分析系统平台成为无人机研发测试的核心工具,在优化设计、提升性能、降低成本等方面发挥关键作用。以下从功能、架构、应用、优势及趋势展开解析。   应用案例   目前,已有多个无人机结构仿真与部件拆解分析系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机结构仿真与部件拆解分析系统。这些成功案例为无人机结构仿真与部件拆解分析系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-23 15:00 206浏览
  •   后勤实验仿真系统平台深度解析   北京华盛恒辉后勤实验仿真系统平台依托计算机仿真技术,是对后勤保障全流程进行模拟、分析与优化的综合性工具。通过搭建虚拟场景,模拟资源调配、物资运输等环节,为后勤决策提供数据支撑,广泛应用于军事、应急管理等领域。   应用案例   目前,已有多个后勤实验仿真系统平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润后勤实验仿真系统平台。这些成功案例为后勤实验仿真系统平台的推广和应用提供了有力支持。   一、核心功能   (一)后勤资源模拟
    华盛恒辉l58ll334744 2025-04-23 15:39 177浏览
  •   复杂电磁环境模拟系统平台解析   一、系统概述   北京华盛恒辉复杂电磁环境模拟系统平台是用于还原真实战场或特定场景电磁环境的综合性技术平台。该平台借助软硬件协同运作,能够产生多源、多频段、多体制的电磁信号,并融合空间、时间、频谱等参数,构建高逼真度的电磁环境,为电子对抗、通信、雷达等系统的研发、测试、训练及评估工作提供重要支持。   应用案例   目前,已有多个复杂电磁环境模拟系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润复杂电磁环境模拟系统。这些成功案例为复杂电
    华盛恒辉l58ll334744 2025-04-23 10:29 185浏览
  •   陆地装备体系论证与评估综合平台系统解析   北京华盛恒辉陆地装备体系论证与评估综合平台系统是契合现代军事需求而生的专业系统,借助科学化、智能化手段,实现对陆地装备体系的全方位论证与评估,为军事决策和装备发展提供关键支撑。以下从功能、技术、应用及展望展开分析。   应用案例   目前,已有多个陆地装备体系论证与评估综合平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润陆地装备体系论证与评估综合平台。这些成功案例为陆地装备体系论证与评估综合平台的推广和应用提供了有力支持。
    华盛恒辉l58ll334744 2025-04-24 10:53 113浏览
  • 一、行业背景与市场需求高血压作为全球发病率最高的慢性病之一,其早期监测与管理已成为公共卫生领域的重要课题。世界卫生组织数据显示,全球超13亿人受高血压困扰,且患者群体呈现年轻化趋势。传统血压计因功能单一、数据孤立等缺陷,难以满足现代健康管理的需求。在此背景下,集语音播报、蓝牙传输、电量检测于一体的智能血压计应运而生,通过技术创新实现“测量-分析-管理”全流程智能化,成为慢性病管理的核心终端设备。二、技术架构与核心功能智能血压计以电子血压测量技术为基础,融合物联网、AI算法及语音交互技术,构建起多
    广州唯创电子 2025-04-23 09:06 177浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦