GPT-4.1的成本价格比GPT-4o便宜26%,GPT-4.1 nano则是OpenAI迄今最便宜、最快的模型。除了OpenAI有大动作,DeepSeek于4月14日公布推理引擎开源计划,字节跳动公开其最新思考模型Seed-Thinking-v1.5的技术细节......

OpenAI发布新一代AI模型GPT-4.1系列,4月15日,OpenAI正式公布,GPT-4.1系列模型包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三个版本。据介绍,GPT-4.1系列模型专注于提升编程能力、指令遵循和长上下文理解。不过,这些模型目前仅通过开发者API提供,ChatGPT暂未集成,部分改进已融入GPT-4o最新版。

由于GPT-4.1系列在关键性能上变现更好,和成本上更低,OpenAI决定将GPT-4.5预览版于2025年7月14日关闭。

GPT-4.1系列包含的三个不同定位的模型变体,共享相同的基础架构,但在模型规模、处理速度和价格上进行了差异化设计。

GPT-4.1作为旗舰版,提供最佳性能和智能水平,适合需要高精度和长上下文处理的任务。

GPT-4.1 mini在小型模型性能上实现了显著飞跃,甚至在多项基准测试中超越了GPT-4o。它在智能评估方面与GPT-4o相当甚至超越,同时将延迟降低了近50%,成本降低了83%。

GPT-4.1 nano是最快的模型,适合需要低延迟的任务,如分类或自动补全。它在MMLU测试中得分80.1%,GPQA得分为50.3%,Aider多语言编码得分为9.8%,均高于GPT-4o mini。

GPT-4.1与GPT-4o的比较,以延迟为横轴,以智能为纵轴

在性能提升的同时,GPT-4.1的成本价格比GPT-4o便宜26%,GPT-4.1 nano则是OpenAI迄今最便宜、最快的模型。GPT-4.1对于重复传递相同上下文的查询,提示缓存折扣提高到了75%。此外,长文本请求不再收取额外费用,仅按标准的每标记费用计费。

OpenAI的这些技术优化措施旨在通过提高效率、减少重复计算和优化资源利用,来降低用户使用GPT-4.1系列模型的成本,并提升用户体验。

在多项基准测试中,GPT-4.1系列模型均超越了GPT-4o及其mini版本,特别是在编程、指令遵循和长上下文理解方面表现突出。

资料显示,在编码能力上,GPT-4.1在行业标准编码测试SWE-bench Verified中得分54.6%,较GPT-4o提升21.4%(绝对值),较GPT-4.5提升26.6%。指令遵循上,GPT-4.1在Scale MultiChallenge基准中得分38.3%,较GPT-4o提升10.5%(绝对值)。长文本理解上,这三个版本都支持100万个token的上下文窗口,较GPT-4o模型支持的128,000个token上下文窗口,GPT-4.1系列模型能够处理的上下文信息量是GPT-4o模型的8倍左右。GPT-4.1在Video-MME基准(无字幕长视频理解)中创下72.0%的纪录,较GPT-4o提升6.7%(绝对值)。

微软提到,GPT-4.1、4.1-mini 和 4.1-nano 已在Microsoft Azure OpenAI 服务和GitHub上线。本周晚些时候,我们将为 GPT-4.1 和 4.1-mini 启用监督式微调功能,使开发者能够根据自身独特的业务需求调整这些模型。

除了OpenAI有大动作,DeepSeek于4月14日公布推理引擎开源计划,字节跳动公开其最新思考模型Seed-Thinking-v1.5的技术细节,将于4月17日通过火山引擎开放接口供用户体验。

OpenAI 凭借千亿级参数优势,在​​长上下文理解​​和​​跨模态任务​​中保持领先。DeepSeek 则在​​数学推理​​与​​中文语义处理​​上展现锋芒。

OpenAI延续其闭源API的商业模式,通过规模化优势进一步压低成本。DeepSeek的开源路径支持双重选择:开发者可免费自部署模型,或购买商业托管服务;自建成本取决于硬件与运维投入,而托管 API 的报价约为 GPT-4.1 nano 的 60%。

DeepSeek公布的开源推理引擎,旨在推动技术普惠与社区共建。

DeepSeek 发布的官方公告内容表示,“几周前,在开源周期间,我们开源了几个库。社区的反应非常积极 —— 激发了许多鼓舞人心的合作、富有成效的讨论和宝贵的错误修复。

受到这一鼓舞,我们决定再迈出一大步:将我们的内部推理引擎贡献给开源社区

我们对开源生态系统深表感激,没有它,我们向通用人工智能(AGI)的进步将不可能实现。我们的训练框架依赖于 PyTorch,我们的推理引擎建立在 vLLM 之上,这两者都在加速深度探索模型的训练和部署方面发挥了至关重要的作用。

随着对部署 DeepSeek-V3 和 DeepSeek-R1 等模型的需求不断增长,我们希望尽可能地为社区做出贡献。虽然我们最初考虑开源我们的完整内部推理引擎,但我们发现了一些挑战:

代码库改动大:我们的引擎基于一年多前的 vLLM 早期分支。尽管结构相似,但我们已经为 DeepSeek 模型进行了大量定制,这使得它难以扩展到更广泛的应用场景。

基础设施依赖:该引擎与我们的内部基础设施紧密耦合,包括集群管理工具,这使得在没有重大修改的情况下进行公开部署变得不切实际。

维护资源有限:作为一个专注于开发更好模型的中小研究团队,我们缺乏维护大型开源项目的资源。

鉴于这些挑战,我们决定与现有的开源项目合作,作为更可持续的替代方案。

未来,我们将与现有的开源项目紧密合作,以:

提取独立功能:模块化并贡献可重用的组件作为独立库。

分享优化:直接贡献设计改进和实现细节。

我们衷心感谢开源运动 —— 从操作系统和编程语言到机器学习框架和推理引擎。能够为这个蓬勃发展的生态系统做出贡献,并看到我们的模型和代码受到社区的广泛欢迎,我们深感荣幸。让我们携手突破通用人工智能 (AGI) 的界限,并确保其造福全人类。

注:需要说明,本文仅概述了我们开源 DeepSeek-Inference-Engine 代码库的路径。对于未来的模型发布,我们将对开源社区和硬件合作伙伴保持开放和协作的态度。我们承诺在新模型发布之前主动同步与推理(inference)相关的工程工作,目标是使社区能够从第一天起就获得 SOTA 级支持。我们的最终目标是建立一个同步的生态系统,使尖端的 AI 功能能够在模型正式发布后无缝地应用于各种硬件。”

DeepSeek 公开推理引擎开源策略,主要体现在模块化复用,优化共享和可持续协作,将内部推理引擎的可复用组件(如通信库、文件系统)独立为开源项目,向现有开源项目(如PyTorch、vLLM)贡献设计改进与实现细节, 通过“分立功能提取”解决代码库差异和维护带宽限制,与社区共建同步生态系统。

DeepSeek 通过开源构建的“护城河”,正在企业级市场加速扩张。已有开发者尝试用 DeepSeek 开源版处理数据清洗,再调用 GPT-4.1 进行创意生成,通过 API 网关实现智能路由。这种分层策略,可能成为企业平衡成本与效果的更优方案。

责编:Amy.wu
您可能感兴趣
智谱华章由中金公司担任辅导机构,将于2025年8月至2025年10月完成对智谱华章的上市辅导。这意味着最早10月,智谱华章可能正式提交IPO申请。
为了减轻这些负面影响,韩国政府采取了一系列措施,包括增加对半导体产业的支持、扩大出口融资规模以及推动国内市场需求。同时,韩国政府也在积极寻求与美国进行谈判,以争取降低关税税率。
未来,Altera计划通过独立运营优化产品组合,重点拓展人工智能、云计算等高增长市场,并可能在未来寻求IPO。
字节跳动的AI眼镜项目自去年起便已正式启动。为了推动这一项目的发展,字节跳动积极招募了多名具有硬件设计经验的工程师,加入到开发团队中,致力于攻克技术上的难关......
关苹果供应链厂商否认了关于“中国组装美国iPhone机型产线停工”的传闻,郭明錤对此事回应,称其表述存在关键限定条件被外界忽视的情况。根据其最新回应,原意并非指“中国所有iPhone组装产线停线”......
4月12日,中国对原产于美国的进口商品加征关税措施的公告》(税委会公告2025年第5号)规定的加征关税税率,由84%提高至125%!
本研究提出一种新颖的软硬件协同设计系统—基于随机电阻存储器的深度极限点云学习机(DEPLM),可支持高效统一的点集分析。
如何针对芯粒异构集成的复杂性,提出新的热仿真方法,这对Chiplet热管理技术提出了新的要求。
Pickering通过扩展其广受欢迎的63系列舌簧继电器产品线,将开关触点间的耐压能力提升至20kV,从而树立了新的行业标杆。
德州仪器 (TI)今日宣布,将于4月15日至17日亮相2025 electronica China慕尼黑上海电子展,展示一系列面向汽车、机器人与工业自动化、能源基础设施和边缘 AI 领域的创新成果。
今日有报道称,小米最新在手机部产品部组织架构下成立芯片平台部,任命秦牧云担任芯片平台部负责人,向产品部总经理李俊汇报。对此,王化发文回应称,手机产品部的芯片平台部一直存在,其部门工作主要是负责手机产品
近年来,随着电车的兴起,越来越多的车企开始炒作和应用智能驾驶,车企在宣传智能驾驶方面一个比一个浮夸,发布会乱吹牛,抖音大量推广智能驾驶小视频。车企高管宣称:“想撞都难”,“回家1314公里零接管”,“
▲ 点击上方蓝字关注我们,不错过任何一篇干货文章!DigiKey应用探索站带您继续电源解决方案和技术第二趴,长按识别下方二维码,一起阅览实用干货,开启电源技术学习之旅,解锁新技能。关于DigiKey 
作者 | 不可说出品 | 汽车电子与软件#01概  述  AUTOSAR中的防火墙作为一个额外的安全层,负责检查网络流量并根据预设的规则集进行过滤。防火墙的一般行为描述如下:防火墙管理一个预期网络数据
有博主在社交平台上晒出了iPhone 17 Pro Max的保护壳,其摄像头开孔跟小米11 Ultra近乎一致,因为两款机型都是横向大矩阵相机DECO设计,拥有极高的辨识度。不过两款机型的按键开孔并不
一凡 铁鹰发自 智车入库 | 公众号 AI4Auto2025,智能驾驶怎么卷、卷什么?那要结合现在的能力和体验来看。2024年,「全国都能开」成为新的第一梯队门票,但很快不再「领先一代」。两个「端到端
电子设计创新大会·EDICON 2025电磁兼容大会(EMC)同期同地举行电子设计创新大会 (EDICON)自2013年至今已举办9届。第10届EDICON将于4月23-24日在北京·国家会议中心举行
4月14日消息,据Counterpoint Research公布的最新数据,2025年第一季度全球手机市场同比增长 3%。这背后,除了拉丁美洲、亚太地区和中东和非洲等主要新兴市场崛起之外,中国市场的国