Qwen2.5-Math还增加了对中文的支持,并通过CoT、PoT和TIR的能力来加强其推理能力。其中Qwen2.5-Math-72B的整体性能超越了Qwen2-Math-72B指令微调和著名闭源模型GPT4-o。

9月19日,阿里云CTO周靖人在云栖大会上发布了通义千问新一代开源模型Qwen2.5,并且其旗舰模型Qwen2.5-72B在性能上超越了Llama 405B,成为全球开源大模型的新标杆。

图源:阿里云

Qwen2.5系列模型不仅包括了大语言模型、多模态模型、数学模型和代码模型,还提供了不同尺寸的版本以适应不同的应用需求,总计上架超过100个版本。

在MMLU-redux等十多个基准测评中,Qwen2.5-72B表现超越Llama3.1-405B  图源:阿里云

Qwen2.5系列支持中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文等超过29种主流语言。与Qwen2类似,Qwen2.5语言模型支持高达128K tokens,并能生成最多8K tokens的内容。

从技术角度来看,与前一版本相比,Qwen2.5的理解能力、逻辑推理、指令遵循和代码能力分别提升了9%、16%、19%和10%,中文能力持续领先业界。

具体来说,Qwen2.5系列模型在中文能力方面领先业界的技术细节主要体现在以下几个方面:

一是多语言支持和上下文长度:Qwen2.5系列模型支持高达128K的上下文长度,能够生成最多8K内容。这种长文本处理能力使得模型在理解和生成中文文本时更加灵活和准确。

二是预训练数据的质量和规模:该系列模型使用了大规模的高质量数学数据进行预训练,并包括由Qwen2-Math生成的合成数据。此外,其预训练数据共3TB,主要涉及公共网络文档、百科全书、书籍、代码等,其中以中文和英文为主,这保证了模型在中文上的表现。

三是指令执行和结构化数据理解:Qwen2.5-LLM在指令执行、长文本处理以及结构化数据理解等方面有显著提升,这些特性对于中文处理尤为重要,因为中文常常需要更复杂的语境理解和语法分析

同时,本次发布的Qwen2.5-Math在更大规模的高质量数学数据上进行了预训练,包括由Qwen2-Math生成的合成数据。在融合了Qwen2-math的技术后,Qwen2.5的数学能力也得到了快速提升。在MATH基准上,Qwen2.5-7B/72B-Instruct的得分从Qwen2-7B/72B-Instruct的52.9/69.0提高到75.5/83.1。

Qwen2.5-Math还增加了对中文的支持,并通过CoT、PoT和TIR的能力来加强其推理能力。其中Qwen2.5-Math-72B的整体性能超越了Qwen2-Math-72B指令微调和著名闭源模型GPT4-o。

此外,Qwen2.5系列模型采用了Apache2.0许可证进行开源,这使得开发者可以自由地使用和修改这些模型。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
凭借先进的3nm制程工艺和SoIC-MH封装技术,M5芯片在性能、能效和AI能力上均实现了显著提升。首批搭载M5芯片的设备陆续上市......
随着AI模型规模越来越大,所需的训练硬件也需同步升级。然而,目前缺乏一种开放的互连标准来支持AI加速器间的高效通信。
AI正稳步改变半导体行业,这一趋势在领先EDA公司和硅片代工厂表现得尤为突出。三大EDA工具制造商(Cadence、Synopsys和西门子EDA)已宣布与台积电合作,致力于为先进芯片制造节点开发AI驱动的设计流程。本文将简要回顾这些合作的现状。
最近发布的GeForce RTX 5080显卡晶体管数量、die size相比前代RTX 4080都没什么大变化,这真的能有性能提升吗?
台积电计划在 3 月前投资超过 2000 亿新台币(约合 61.2 亿美元),扩建其位于台湾南部科学园区三期的CoWoS生产设施。知情人士透露,台积电之所以做出这一决定,是因为人工智能(AI)驱动的先进封装需求比预期更为强劲......
尽管市场上有传言称英伟达大幅削减了对台积电CoWoS-S封装的需求,甚至有报告指出砍单幅度高达80%,但台积电和英伟达均对此进行了否认......
全球人形机器人领域上市公司的百强名单将人形机器人产业链区分为大脑、身体以及集成三大核心环节,覆盖全球共计100家上市公司。中国共37家企业上榜(中国大陆32家,台湾5家),其中深圳7家,占中国大陆上榜企业近四分之一,包括比亚迪、腾讯、优必选、速腾聚创、雷赛智能、兆威机电、汇川技术等......
DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块......
凭借新一代3nm制程工艺与全新架构,骁龙® 8至尊版的单核和GPU 性能提升均超过 40%,使得Find N5在性能上实现质的飞跃……
简化物联网连接:应用就绪型软件构建模块
2月10日晚,比亚迪举办了“天神之眼 开创全民智驾时代”智能化战略发布会,正式发布了全民智驾战略,并推出了首批21款智驾车型,覆盖7万级至20万级价格区间,全部保持原价。           其中,海
UN高性能10W开关电源芯片U95143能效领跑小家电有很多功能上的创新可以随着技术的发展而进行,也能给终端的客户带来有效且实际的操作理念,最重要是能保障产品品质。而零件产品的品质会对出品整体效果有所
当地时间2025年2月10日,恩智浦半导体公司 (NXP) 宣布,已与高性能、节能和可编程离散神经处理单元 (NPU) 领域的行业领导者 Kinara 达成最终收购协议。此次收购将以全现金方式进行,
据业内人士2月11日透露,三星显示器近期限时推出名为“平衡假期”的特别假期。具体内容是,每周平均工作超过52小时的员工可获得三天带薪休假,每周工作超过60小时的员工可获得六天带薪休假。上个月,三星显示
2月10日消息,天眼查App显示,近日,杉杉控股有限公司发生工商变更,周婷卸任法定代表人,并由董事长变更为董事;周顺和接任法定代表人并担任董事长;孙伟卸任董事职务。 2月7日,杉杉集团在宁波市鄞州区人
据IT业界9日报道,苹果公司最近进入了“可折叠iPhone”零部件供应商选择的最后阶段,据观察,三星显示器已决定独家供应初期面板量。据悉,三星将供应约1500万至2000万片,并将于明年5月开始量产,
2022年下半年以来,需求下降,芯片价格跳水,芯片行情趋向寒冷,拼价格、拼服务、拼账期成为常态,持续的低迷之下,芯片人都开始靠省钱过日子。同时,我们发现,行情冷淡的时候,订货、配单、PPV(Purch
近年来,贵港市港北区深入实施产业转型升级三年攻坚行动,紧盯全国产业链布局和东部产业转移趋势,确立PCB(印制电路板)产业作为重点产业发展,加大招商引资力度,推动PCB产业“从无到有”,聚链成势。目前,
  电子无尘车间在设计时需要重视多个问题,以确保生产环境的洁净度、生产效率和安全性。以下是需要重视的设计问题,具体随合洁科技电子洁净工程公司一起来了解下吧! &emsp
我是芯片超人花姐,入行20年,有40W+芯片行业粉丝。有很多不方便公开发公众号的,关于芯片买卖、关于资源链接等,我会分享在朋友圈。扫码加我本人微信👇2月15日,芯片超人开年首场芯片大会,2025年AI