商汤科技发布“日日新5.0”大模型，性能对标GPT-4 Turbo-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 海报

 扫一扫

扫码查看更多文章

商汤科技董事长兼CEO徐立表示：“商汤在尺度定律的指导下，会持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”

4月23日，商汤科技在上海临港AIDC举办技术交流日活动上发布了日日新SenseNova 5.0大模型体系，并声称其性能对标GPT-4 Turbo，成功吸引了市场的广泛关注和积极响应，导致其股价涨停。

商汤科技董事长兼CEO徐立 图源：商汤科技

据悉，最新的6000亿参数大模型(日日新5.0)，在知识、数学、推理和代码能力方面大幅提升，综合性能全面对标GPT-4Turbo。

图源：商汤科技

从训练数据量来看，日日新5.0基于超过10TB的tokens进行训练，这一点与GPT-4 Turbo的数据量相当。同时，在多模态能力方面，日日新5.0也进行了显著升级，可以推断其在自然语言处理、图片生成等方面有所增强。

此外，日日新5.0采用了混合专家架构，并且在推理时的上下文窗口可以有效扩展到200K左右，这与GPT-4 Turbo的128k上下文窗口相比，显示了其在处理长文本方面的优势。这种架构和上下文窗口的设计使得日日新5.0在处理复杂查询和长篇幅内容时更为高效。

在性能方面，商汤科技宣称日日新5.0的综合能力全面对标GPT-4 Turbo，并且在主流客观评测上达到或超越GPT-4 Turbo。

在人工智能发展的最基本法则——尺度定律（Scaling Law）的准则下，商汤持续寻求最有数据配比并建立数据质量评价体系，推动自身大模型研发的同时，也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

商汤科技董事长兼CEO徐立表示：“商汤在尺度定律的指导下，会持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”

当天，商汤科技还推出了行业首个云、端、边全栈大模型产品矩阵。端侧大语言模型可在中端平台实现18.3字/s的平均生成速度，旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒，支持输出1200万像素及以上的高清图片，支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。对此，徐立在技术交流日上表示：“端侧是行业应用铺开的关键。”

同时，商汤科技还推出企业级大模型一体机，可同时支持企业级千亿模型加速和知识检索硬件加速，实现本地化部署。相比行业同类产品，推理成本节约80%，CPU工作负载50%。

此外，商汤科技发布了基于昇腾原生的行业大模型，共同打造面向金融、医疗、政务、代码等大模型产业生态。

值得一提的是，徐立还现场展示了商汤科技的文生视频能力，并表示会在很短时间发布文生视频平台。

4月24日，商汤科技股价盘中大幅拉升，盘中涨超30%。

根据商汤科技年报资料，公司生成式AI的客户包含三大运营商、招商银行、海通证券等机构，京东、小米、阅文等头部互联网公司，以及清华大学、上海交大等学术机构。此外，根据商汤科技旗下官方公众号发布的信息，日日新大模型已经应用于小米SU7汽车之中，用于助力小爱同学在车载语音场景中的应用。

责编：Jimmy.zhang

阅读全文，请先

人工智能处理器/DSP 业界新闻

您可能感兴趣

传台积电将在台湾再建两座CoWoS先进封装厂

台积电计划在 3 月前投资超过 2000 亿新台币（约合 61.2 亿美元），扩建其位于台湾南部科学园区三期的CoWoS生产设施。知情人士透露，台积电之所以做出这一决定，是因为人工智能（AI）驱动的先进封装需求比预期更为强劲......

索尼新专利：利用AI技术解决游戏延迟问题

索尼新专利利用人工智能（AI）技术来预测玩家的操作输入，从而显著减少在线游戏中常见的延迟问题。这项创新技术被称为“定时输入/动作释放”，通过智能AI模型提前判断玩家的意图，并在实际操作完成之前执行相应的指令，从而提升游戏的流畅度和响应速度......

将人工智能应用于射频设计

人类的发明，即工程系统，依赖于物理学和数学基本原理，如麦克斯韦方程、量子力学和信息论等，以实现特定目标。然而，随着工程系统复杂性和规模迅速增长，其子组件的功能可能呈现出非线性特性，这使得基于第一原理的设计方法受到限制。

2025年全球将启动18个新的晶圆厂项目建设，中国有5个

半导体行业正迎来一个新的建设高峰期，SEMI预测，2025年，全球范围内将有18个新的晶圆厂项目开始建设，其中15座为12英寸晶圆厂，3座为8英寸晶圆厂，大部分预计将于 2026 年至 2027 年开始运营......

TCL正式发布“世界上第一款模块化人工智能伴侣机器人”

这款机器人头上的摄像头可以录制视频或使用人工智能识别物体，虽然该机器人的动作仅限于挥动细小的手臂和眨动动画眼睛，但它可以与一把小型电动椅子配对，自动在家中导航。

四大合作揭秘新兴AI芯片设计模型

IP供应商、芯片设计服务提供商和AI专家在以AI为中心的设计价值链中的地位正变得更加突出。本文给出了四个设计用例，强调了服务于AI应用的芯片设计模型的重新调整。

初步评估0121地震未造成台南晶圆厂重大损害，但恐加剧1Q25电视面板供给紧张

嘉义地区里氏规模6.4地震，台南亦是重要面板产地，厂商实际受影响情况尚待确认，只是此次地震可能加大2025年第一季电视面板供给压力......

2025年中国云终端市场七大洞察

前瞻未来市场将面对的机遇和挑战，IDC总结并给出了2025年中国云终端市场七大洞察……

智能化加速标准和协议的更新并推动验证IP（VIP）在芯片设计中的更广泛应用

本文诠释了为什么在今天的电子行业中更加需要使用VIP在验证环境中来改进调试、覆盖收敛和提升质量，以加快项目交付和增加投资回报，并减少芯片重新流片的风险。

芯原与新基讯联合推出云豹系列第二代5G RedCap/4G LTE双模调制解调器IP

推动蜂窝移动通信技术不断迭代，加速轻量级5G应用落地

茁壮：我所见证的鸿蒙之路

这两年很流行一句话，叫“你的日常生活，连在一起可能就是世界的剧变”。不知道大家对这句话感受如何，作为科技博主的我，经常心有戚戚。这些年来，我似乎见证了太多堪称历史性的变革，AI技术从无人问津到街谈巷议

传统相机开发基本流程参考请收藏！

点击蓝字关注我们视觉系统在许多应用中日益普及，提高了人们的整体生活质量。无论是检查食品缺陷的幕后工作、拍摄华丽的电影、在当地杂货店扫描条形码，还是通过视频会议连接全球各地的家人、朋友和同事，这些系统

高压放大器在力-电耦合作用下材料压电系数研究中的应用

实验名称：力-电耦合作用下铁电材料的性能研究测试设备：高压放大器、信号发生器、A/D采集卡、应变仪、压电陶瓷等。

青岛半导体重大事件！

青岛迎来了2025年的第一个IPO。1月23日，歌尔微向港交所递交了上市申请，这家全球第八大、中国第一大智能传感交互解决方案提供商终于踏上了资本市场的征程。从2004年作为歌尔股份的一个部门开始，到2

14家面板厂去年业绩预告出炉：接连亏损，仅三赢家！

近日，京东方、TCL华星、深天马、龙腾光电、华映科技、和辉光电、LGDisplay、三星显示、友达、群创、彩晶、凌巨、铼宝、华凌等面板厂商公布业绩或者业绩预告，大部分出现亏损。京东方去年净利润52亿元

【光电智造】使用OpenCV实现摄像头测距

今日光电有人说，20世纪是电的世纪，21世纪是光的世纪；知光解电，再小的个体都可以被赋能。追光逐电，光引未来...欢迎来到今日光电！----追光逐电光引未来----摄像头测距就是计算照片中

京东方华灿光电去年预亏超4.7亿

1月22日，华灿光电（300323）发布公告，预计2024年度归母净利润亏损4.7亿元至6.7亿元，较上年同期亏损8.46亿元有所改善。同时，扣除非经常性损益后的净利润预计亏损6.3亿元至8.3亿元，

让中国电信走向伟大！

/记得星标我/比大部分人早一步看见未来中国电信的历史可以追溯到改革开放初期，那时它作为中国固网通信的骨干力量，见证了从模拟通信到数字通信的飞跃，为社会经济发展提供了坚实的通信保障。进入移动通信时代，

日本电装联手芬兰Canatu，合作推进碳纳米管技术应用

近日，株式会社电装（以下简称“电装”）与芬兰Canatu公司（以下简称“Canatu”）签署了关于碳纳米管技术应用的合作备忘录。双方计划通过深化合作，致力于推动自动驾驶技术的发展。随着自动驾驶技术的持

Aigtek电压放大器都被用在哪些领域

电压放大器是电子电路中一种重要的器件，其主要功能是将输入电压信号放大到更高的电压水平，通常用来增强信号的幅度和功率。电压放大器在各种领域都有广泛的应用，包括通信、音频、医疗、工

文章评论

最新
热门

换一换

EE直播

更多>

商汤科技发布“日日新5.0”大模型，性能对标GPT-4 Turbo

杂志声明