Qwen2.5-Math还增加了对中文的支持,并通过CoT、PoT和TIR的能力来加强其推理能力。其中Qwen2.5-Math-72B的整体性能超越了Qwen2-Math-72B指令微调和著名闭源模型GPT4-o。

9月19日,阿里云CTO周靖人在云栖大会上发布了通义千问新一代开源模型Qwen2.5,并且其旗舰模型Qwen2.5-72B在性能上超越了Llama 405B,成为全球开源大模型的新标杆。

图源:阿里云

Qwen2.5系列模型不仅包括了大语言模型、多模态模型、数学模型和代码模型,还提供了不同尺寸的版本以适应不同的应用需求,总计上架超过100个版本。

在MMLU-redux等十多个基准测评中,Qwen2.5-72B表现超越Llama3.1-405B  图源:阿里云

Qwen2.5系列支持中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文等超过29种主流语言。与Qwen2类似,Qwen2.5语言模型支持高达128K tokens,并能生成最多8K tokens的内容。

从技术角度来看,与前一版本相比,Qwen2.5的理解能力、逻辑推理、指令遵循和代码能力分别提升了9%、16%、19%和10%,中文能力持续领先业界。

具体来说,Qwen2.5系列模型在中文能力方面领先业界的技术细节主要体现在以下几个方面:

一是多语言支持和上下文长度:Qwen2.5系列模型支持高达128K的上下文长度,能够生成最多8K内容。这种长文本处理能力使得模型在理解和生成中文文本时更加灵活和准确。

二是预训练数据的质量和规模:该系列模型使用了大规模的高质量数学数据进行预训练,并包括由Qwen2-Math生成的合成数据。此外,其预训练数据共3TB,主要涉及公共网络文档、百科全书、书籍、代码等,其中以中文和英文为主,这保证了模型在中文上的表现。

三是指令执行和结构化数据理解:Qwen2.5-LLM在指令执行、长文本处理以及结构化数据理解等方面有显著提升,这些特性对于中文处理尤为重要,因为中文常常需要更复杂的语境理解和语法分析

同时,本次发布的Qwen2.5-Math在更大规模的高质量数学数据上进行了预训练,包括由Qwen2-Math生成的合成数据。在融合了Qwen2-math的技术后,Qwen2.5的数学能力也得到了快速提升。在MATH基准上,Qwen2.5-7B/72B-Instruct的得分从Qwen2-7B/72B-Instruct的52.9/69.0提高到75.5/83.1。

Qwen2.5-Math还增加了对中文的支持,并通过CoT、PoT和TIR的能力来加强其推理能力。其中Qwen2.5-Math-72B的整体性能超越了Qwen2-Math-72B指令微调和著名闭源模型GPT4-o。

此外,Qwen2.5系列模型采用了Apache2.0许可证进行开源,这使得开发者可以自由地使用和修改这些模型。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
最近收到一款Jetson Orin Nano Super开发套装,我打算拿它来做个简单的AI应用开发...在没有任何AI应用和嵌入式应用开发经验的基础上...主打传说中的零代码开发~
“物理智能(Physical AI)”,黄仁勋在CES 2025上发表主题演讲时提出的新概念。他指出,即将全面到来的“Physical AI”时代,将是在1000万工厂、20万仓库、15亿汽车和卡车及海量人形机器人之上应用的下一波万亿规模市场驱动力。
微软还强调,拜登政府的《人工智能扩散出口管制框架》限制了美国向许多快速增长且具有战略意义的市场出口关键AI组件,破坏了特朗普政府的两项优先事项:加强美国的AI领导地位以及减少美国近万亿美元的贸易逆差。
该标准旨在为养老机器人的设计、制造、测试和认证提供统一规范,推动全球养老机器人产业的健康发展,通过明确养老机器人的功能与性能分类,确保其在互联家居环境中的有效应用。
2月以来,一些人形机器人头部企业高薪案例值得关注。其中,宇树科技招聘机器人感知算法工程师、机器人控制算法专家等岗位,月薪可达7万元至10万元。智元机器人SLAM算法专家月薪4-7万元,年薪超百万(15薪制)。
在应对美国加码措施上,中国一方面应该依托自身庞大的垂直应用场景,特别是工业制造领域,在做大做强中国制造的同时,推动国产AI芯片的替代,另一方面仍需加大基础研究投入,重点突破AI芯片设计、半导体设备和先进工艺制程。
TEL宣布自2025年3月1日起,现任TEL中国区地区总部——东电电子(上海)有限公司高级执行副总经理赤池昌二正式升任为集团副总裁,同时兼任东电电子(上海)有限公司总裁和东电光电半导体设备(昆山)有限公司总裁。
预计在2025年,以下七大关键趋势将塑造物联网的格局。
领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCON China 2025一展全看,速登记!
本次股东大会将采取线上和线下相结合的混合形式召开,股东们可选择现场出席或线上参会。
今日光电     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!----追光逐电 光引未来----编者荐语特征提取是计算机
在 AI 时代,高校正逐渐成为 AI 创新的重要策源地。AI 的强大潜力不仅能够推动科学研究,提升研究效率和加速进程,还能在教育领域实现个性化学习,模拟复杂实验场景,拓宽学习方式。聆听全球专家的分享,
DeepSeek的崛起不仅是技术革新,更是一场从“机器语言”到“人类语言”的范式革命,推动了AGI时代到来。各个行业的应用场景不断拓展,为企业数字化发展带来了新机遇,同时也面临诸多挑战。不同企业在落地
数据民主化终极拷问:借助大模型问数,究竟能不能实现灵活、准确、深入的数据洞察?“华东区会员复购率是多少?”——业务提需求3天,IT排期2周,口径对齐5轮。“为什么A产品毛利异常?”——指标定义模糊,数
市值一夜蒸发2900亿”作者|王磊编辑|秦章勇特斯拉陷入一个怪圈。马斯克的权力越来越大,但特斯拉的股价却跌得越来越惨。就在昨天,特斯拉股价又下跌了4.43%,一天之内蒸发406亿美元,约合人民币295
前不久,“行家说三代半”报道了长安汽车采用氮化镓OBC车载电源(点击查看)。近期,比亚迪、广汽埃安两家车企又相继公布了氮化镓应用进展:比亚迪&大疆:车载无人机采用氮化镓技术3月2日,比亚迪、大疆共同发
据报道,小米集团总裁卢伟冰在西班牙巴塞隆纳的全球发表会上表示,小米汽车计划于2027年进军海外市场。小米的立足之本在于深耕本土市场,作为一家中国车企,唯有在国内市场站稳脚跟,方能谈及海外扩张。因此,小
今日光电     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!----追光逐电 光引未来---- 来源:时光沉淀申明:感
如果说华为代表了国产手机芯片的最高水平,那么紫光展锐无疑就是国产中低端芯片最大的依持了。3月3日,巴塞罗那MWC世界移动通信大会上,紫光展锐正式发布手机芯片T8300。据了解,T8300采用的是6nm
2025年3月11-13日,亚洲激光、光学、光电行业年度盛会的慕尼黑上海光博会将在上海新国际博览中心-3号入口厅N1-N5,E7-E4馆盛大召开。本次瑞淀光学展示方案有:■ MicroOLED/Min