群英荟萃:盘点2024年的大语言模型

陈芝麻 2024-12-18 14:49

随着人工智能技术的迅猛发展,大语言模型(LLM)已成为推动语言理解和生成能力进步的关键力量。2024年,无论是在学术研究还是商业应用领域,LLM都取得了显著的进展。大语言模型在2024年有哪些成功的案例?本文将对2024年国内外大语言模型的进展进行总结,并展望2025年的发展。2024年大语言模型(LLM)在多个领域的成功案例有以下内容。

2024的大语言模型汇总

国外大语言模型汇总

1. Open AI

o1大模型

OpenAI在2024年9月13日公开了一系列全新AI大模型,旨在专门解决难题。这些新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。o1模型在一系列高难基准测试中展现出了超强实力,相比GPT-4o有巨大提升。

2. Meta

Llama 3.1

Meta发布了Llama 3.1,这是当时最大的开源AI模型,拥有4050亿参数。该模型在多个基准测试中的表现超过了GPT-4o和Anthropic的Claude 3.5 Sonnet。Llama 3.1主要处理文本任务,包括编程、回答基本数学问题以及用八种语言(英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语)总结文件。

Llama 3.2

Meta发布了其首款能够处理图像和文本的开源模型Llama 3.2。Llama 3.2包括两个视觉模型(分别拥有110亿和900亿参数)和两个轻量级仅文本模型(分别拥有10亿和30亿参数),旨在在高通、联发科等Arm硬件上运行。

MovieGen

Meta推出了MovieGen,这是一个能够根据文本输入生成视频的AI模型,具备高达300亿个参数的能力,使其能够生成长达16秒的高质量视频。MovieGen的Audio版本则可以为视频提供同步的高保真音频,标志着Meta在多模态生成技术上的重要进展

3. Google

Gemini系列模型

v Gemini 1.5 Pro:这是Gemini系列的一个进阶版本,提供了100万Tokens的上下文长度,并支持35种语言。它在多模态和长上下文处理方面取得了突破,能够处理长达2小时的视频、22小时的音频、超过60,000行代码或超过140万个单词。

v Gemini 1.5 Flash:这是一个更轻量级的模型,针对需要快速响应和成本效益的任务进行了优化。它在AI Studio和Vertex AI中提供,并且是为规模化构建的。

Gemma 2

Google DeepMind在2024年6月27日发布了Gemma 2,这是Gemma系列轻量级开放语言模型的最新成员。Gemma 2在架构和训练方法上都有重大创新,在多项基准测试中取得了显著进步,甚至可以与参数规模大2-3倍的模型相媲美。Gemma 2模型的训练数据量约为其第一代的两倍,总计13万亿Tokens(27b模型)和8万亿Tokens(9b模型)的网页数据(主要是英语)、代码和数学数据。

4. Microsoft

GPT-4o

Microsoft推出了GPT-4o,这是OpenAI的新旗舰模型,集成了文本、视觉和音频能力,为生成性和会话AI体验树立了新标准。GPT-4o现在可以在Azure OpenAI服务中以预览版的形式试用,支持文本和图像输入。

Med42

Microsoft通过Azure AI Studio提供了Med42,这是一个领先的临床大型语言模型(LLM),利用AI的力量颠覆传统医疗系统,为临床医生、科学家和患者提供价值。

LLM2CLIP:

Microsoft研究团队提出了LLM2CLIP,这是一种新方法,利用大型语言模型(LLMs)的力量来解锁CLIP的潜力。通过在标题空间中微调LLM进行对比学习,将LLM的文本能力提取到输出嵌入中,显著提高了输出层的文本可区分性。

5. NVIDIA

NVLM 1.0系列模型

NVIDIA发布了NVLM 1.0系列多模态大语言模型,其中以72亿参数的NVLM-D-72B为代表,展示了在视觉和语言任务上的卓越性能,并增强了仅文本能力。NVLM-D-72B模型在处理复杂视觉和文本输入方面表现出色,提升了多模态训练后仅文本任务的性能,平均准确度提高了4.3个百分点。

NVIDIA NIM微服务

NVIDIA宣布了针对OpenUSD语言的NVIDIA NIM™微服务,这些AI模型可以生成OpenUSD语言回答用户查询、生成OpenUSD Python代码、对3D对象应用材料,并理解3D空间和物理以帮助加速数字孪生开发。

 

国内大语言模型汇总

在国内,截至2024年11月30日,多家大模型企业和机构正式宣布其服务已经上线,并向全社会开放。目前,百度、金山、智谱、百川、字节等多家企业和机构的大模型已经落地,它们可以正式上线并向公众提供服务。

 

1. 百度

文心大模型

百度文心大模型的日均调用量已经超过了15亿次,相较一年前首次披露的5000万次,增长了近30倍。文心大模型家族持续拓展,支持企业和开发者灵活调用,百度文心大模型4.0 Turbo对企业用户全面开放。

千帆大模型平台3.0(千帆3.0)

百度智能云千帆大模型平台正式发布的功能,旨在帮助企业快速开发出面向复杂对话场景的AI应用,快速拥有专业水平的“数字员工”。

2. 金山

WPS AI 2.0

金山办公在2024年7月发布了WPS AI 2.0,该版本在AI写作助手、AI阅读助手、AI数据助手、AI设计助手四个维度实现了范式革新。

金山云瀚海大模型平台

金山云在2024年3月发布了qzhou-72B基座模型和金山云瀚海大模型平台,为企业开发者提供一站式大模型训练及推理服务平台。

3. 智谱AI

GLM-4

智普AI在2024年1月16日的「智谱技术开放日(Zhipu DevDay)」上发布了新一代基座大模型GLM-4。GLM-4的整体性能相比上一代大幅提升,十余项指标逼近或达到GPT-4。GLM-4支持更长上下文、更强的多模态能力、更快推理速度,更多并发,大大降低推理成本。

GLM-4-Voice

智普AI推出并开源端到端语音模型GLM-4-Voice,能够直接理解和生成中英文语音,进行实时语音对话,并能遵循用户的指令要求改变语音的情感、语调、语速、方言等属性。

GLM-4-Plus

智普AI在KDD国际数据挖掘与知识发现大会上发布了GLM-4-Plus基座模型,通过多种方式构造出了海量高质量数据,并利用PP0等多项技术,有效提升了模型推理、指令遵循等方面的表现。

4. 阿里

通义千问新一代开源模型Qwen2.5

阿里云全面升级AI基础设施,发布了通义千问新一代开源模型Qwen2.5,其旗舰版本Qwen2.5-72B在多项基准测试中表现强劲,超越行业对手。Qwen2.5系列是一个超级AI模型「百宝箱」,涵盖了多个尺寸的大语言模型、多模态模型、数学模型和代码模型。每个尺寸都有基础版本、指令跟随版本和量化版本,总计上架了100多个模型,刷新了业界纪录。

八观气象大模型

阿里巴巴达摩院发布的八观气象大模型,通过融合多源数据,提升了气象指标预测的准确性,尤其在新能源电力系统的应用上,时空精度达到了1小时1公里。该模型显著提高了辐照度、风速等气象数据的预测准确率,提升了新能源发电功率和电力负荷预测的准确率,分别达到了96%和98%以上。

 

5. 字节跳动

豆包大模型家族

包括通用模型pro、通用模型lite、语音识别模型等九款模型,其中主力模型在企业市场的定价仅为0.0008元/千Tokens。

PixelDance视频生成模型

字节跳动视频生成模型PixelDance将很快在即梦AI上线,面向公众开放使用。PixelDance在语义理解、多个主体运动的复杂交互画面,还是多镜头切换的内容一致性方面,都表现出不错的效果。

这些案例展示了大语言模型在不同领域的广泛应用和深远影响,从智能体的创建到特定领域的专业应用,大模型技术正在推动各行各业的创新和发展。

 

2024年大语言模型技术突破与应用前景

 

2024年ACL会议揭示了检索增强生成(RAG)技术的重大进展。这项技术通过结合检索和生成,提升了LLMs在复杂任务中的性能。例如,“CallMeWhenNecessary: LLMs Can Efficiently and Faithfully Reason over Structured Environments”的研究通过定义标准化的推理路径,优化了模型表现,提升了推理的准确性。此外,“LLMs as Prompter: Low-resource Inductive Reasoning on Arbitrary Knowledge Graphs”探索了低资源场景下的知识图谱归纳推理,为资源受限环境中应用AI提供了新的可能性。

中国市场的大语言模型产业发展迅速,百度、阿里、华为等巨头厂商陆续宣布研发或已发布大语言模型产品。这些模型不仅服务于公司战略业务拓展,还形成了差异化的商业路线。例如,百度的“文心千帆”产品剑指B端市场,意图带动云服务营收。

OpenAI的GPT-4o模型通过添加文本、图像和音频集成,扩展了多模态功能,同时降低了成本,提高了响应速度。此外,Qwen-1.5模型能以较低成本提供接近GPT-4的能力,还能通过自定义数据集进行微调,以适应特定的使用需求。

IMLIP 2024大会汇聚了全球AI语言处理专家,探讨了语言技术的未来。会议涵盖了大模型与语音技术的融合、视觉域适应与深度视频压缩的研究等多项前沿技术,推动了AI语言处理技术的深入发展。

2025年大语言模型发展展望

1. 个性化体验与对话式AI

2025年,生成式AI将在个性化体验和对话式AI领域取得重大进展。企业将利用大语言模型为客户提供定制化的内容和服务,提升客户黏性和转化率。对话式AI将提升传统的客户服务体验,通过自然语言处理(NLP)和深度学习,生成式对话系统能够理解上下文并适应用户的需求。

2. 科学研究与素材生成

基于大语言模型的工具将加速各学科对复杂数据集的分析,推动药物发现、材料科学等领域的创新。图像和视频生成技术也将消除传统创作过程中的瓶颈,广泛应用于广告、游戏等领域。

3. 多语言模型与全球协作

2025年,大语言模型在语言翻译和本地化中的应用将取得显著进展,彻底改变个人和企业跨语言沟通的方式。随着全球化的不断扩大,对精准且符合文化背景的翻译需求也将不断增加,大语言模型将提升机器翻译的能力,为用户提供更自然、理解语境的翻译。

4. 隐私保护与负责任的AI实践

隐私保护技术的集成以及负责任的AI实践将有助于建立用户信任,确保大语言模型的应用符合伦理标准。随着各类组织利用这些进展,我们可以预见大语言模型将越来越擅长理解语境、生成类似人类的文本,并在各行各业提供定制化的解决方案。

结论

2024年,大语言模型在技术突破、产业发展、多模态与多语言能力等方面取得了显著进展。展望2025年,大语言模型将继续在个性化体验、对话式AI、科学研究、素材生成等领域发挥重要作用,同时注重多语言能力的提升和隐私保护技术的集成。随着技术的不断进步,大语言模型将在智能化需求中扮演越来越关键的角色,为全球的协作与沟通提供强大的支持。


陈芝麻 Altium Designer 22 电路设计与仿真实战从入门到精通一书作者
评论
  •        随着对车载高速总线的深入研究,以电信号为媒介的传输方式逐渐显露出劣势,当传输速率超过25Gbps时,基于电信号传输已经很难保证长距离传输下的信号质量与损耗。在这样的背景下,应用于工业领域的光通信技术因其高带宽、长距离、低电磁干扰的特点得到了密切的关注,IEEE在2023年发布了802.3cz[1]协议,旨在定义一套光纤以太网在车载领域的应用标准。MultiGBASE-AU总览       以下是Mult
    经纬恒润 2024-12-17 17:29 67浏览
  • 2003年买的电子管功放机,俗称胆机,坏过几次,咨询厂家,购买零件,自己修理,干中学,学中干。有照片记录的是2011年3月,一天,发现整流管比之前红亮了很多,赶紧关机,想找原因,反反复复折腾了几个月,搞好了。就此,还在网上论坛咨询和讨论,欧博Rererence 5.0电子管发粉红色光,何故?-『胆艺轩音响技术论坛』-胆艺轩[Tubebbs]论坛 发表于2011-5-7同时与厂家联系得到支持,见文:29kg胆机修理之联想——环保简易,做到真难!-面包板社区 发表于2011-6-13又继续使用了多年
    自做自受 2024-12-17 22:18 118浏览
  • 【富芮坤FR3068x-C】+开发环境疑问非常荣欣参加了这次《富芮坤FR3068x-C》评测活动,在搭建开发环境时,本人就遇到很大问题,主要有3个。第1个问题:本人按照《FR306x开发环境说明书》中的1章安装软件,keil5.36版本以上,并且打开sdk中uart工程,按照要求设置了Device配置如下: ARM Compiler选项链接文件配置但是编译结果如下:有23个warning,都是连接脚本中找不到,请问这样工程是否有问题?第2个问题:按照《FR306x开发环境说明书》中要求,需要电脑
    shenwen2007_656583087 2024-12-17 00:59 102浏览
  • 上汽大通G90是一款集豪华、科技与舒适于一身的中大型MPV,号称“国产埃尔法”。在国内市场,作为“卷王”的G90主要面向中大型MPV市场,满足家庭出行、商务接待和客运租赁等多元化场景需求,在国内市场上取得了不错的销售成绩。在海外市场,上汽大通G90也展现出了强大的竞争力,通过技术创新和品质提升,上汽大通的产品在国际市场上获得了广泛认可,出口量持续增长,如果你去过泰国,你就应该可以了解到,上汽的品牌出海战略,他们在泰国有建立工厂,上汽大通G90作为品牌的旗舰车型之一,自然也在海外市场上占据了重要地
    lauguo2013 2024-12-18 10:11 63浏览
  •   前言  作为一名电子专业的学生,半导体存储显然是绕不过去的一个坎,今天聊一聊关于Nand Flash的一些小知识。  这里十分感谢深圳雷龙发展有限公司为博主提供的两片CS创世SD NAND的存储芯片,同时也给大家推荐该品牌的相关产品。  一、定义  存储芯片根据断电后是否保留存储的信息可分为易失性存储芯片(RAM)和非易失性存储芯片(ROM)。  非易失性存储器芯片在断电后亦能持续保存代码及数据,分为闪型存储器 (Flash Memory)与只读存储器(Read-OnlyMemory),其中
    雷龙发展 2024-12-17 17:37 44浏览
  •  2024年下半年,接二连三的“Duang Duang”声,从自动驾驶行业中传来:文远知行、黑芝麻、地平线、小马智行等相继登陆二级市场,希迪智驾、Momenta、佑驾等若干家企业在排队冲刺IPO中。算法模型的历史性迭代与政策的不断加码,让自动驾驶的前景越来越清晰。由来只有新人笑,有谁听到旧人哭。在资本密集兑现的自动驾驶小元年里,很多人可能都已经遗忘,“全球自动驾驶第一股”的名号,曾经属于一家叫做图森未来的公司。曾经风光无两的“图森”,历经内讧与退市等不堪往事之后,而今的“未来”似乎被锚
    锦缎研究院 2024-12-18 11:13 55浏览
  • 擎天柱,这个名字听起来就像是从科幻电影里走出来的英雄。但今天,我们要聊的不是那个变形金刚,而是一款同样令人兴奋的实验板——Ai8051U-LQFP48 转 89C52-DIP40 核心功能实验板。这款实验板就像是电子世界的“擎天柱”,它拥有强大的力量和无限的潜力,等待着我们去发掘和探索。 想象一下,你手中握着的不是一块普通的电路板,而是一张通往未来科技世界的门票。Ai8051U芯片,这颗强大的心脏,内置了硬件浮点运算单元(TFPU@120MHz),让你的计算速度飞起来,就像给机器人装上了翅膀。
    丙丁先生 2024-12-16 13:02 154浏览
  • 全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)于10月23日在深圳益田威斯汀酒店举办了艾迈斯欧司朗中国发展中心(以下简称,CDC)圆桌论坛。本次论坛以“智能化时代,以多元应用场景和技术 助力中国市场加速发展”为核心议题,探讨在人工智能驱动的市场趋势下,CDC如何助力中国伙伴把握时代机遇,推动大中华地区业务稳健增长,展示了艾迈斯欧司朗对中国市场的信心。立足中国 贴近本土客户需求在全球经济增速放缓和国际形势复杂多变的背景下,中国市场依然保持了稳定的增长势态,并释放出强大的
    艾迈斯欧司朗 2024-12-16 18:00 143浏览
  • 近年来,云终端凭借便捷、高效、高性价比的优势正逐步在各行各业渗透。研究机构IDC的数据显示,2024上半年,中国云终端市场总体出货量达到166.3万台,同比增长22.4%,销售额29亿元人民币,同比增长24.9%,均超预期。紫光展锐积极携手各大合作伙伴,共同打造云端生态,大力推动云终端在政企、金融类等领域应用落地。 云终端增长势头良好 两大应用场景被看好云电脑将传统个人电脑的硬件资源和软件应用虚拟化,并通过网络提供给用户。这种模式的核心在于:用户不需要高性能的本地硬件,仅通过互联网连接
    紫光展锐 2024-12-16 18:11 115浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-18 14:02 43浏览
  • 随着国家对环保要求日趋严格。以铅酸电池为动力的电动自行车、电动摩托车,将逐渐受到环保管制。而能量密度更高的磷酸铁锂等锂电池成为优先的选择,锂电池以其高能量密度、快速充电、轻量化等特点,已经大量应用于电动车领域。光耦在锂电池系统PMU中的应用,能提供完善的安全保护和系统支撑。BMS和电池被封装成安装所需要的尺寸外形,高速的CAN以及RS-485等通信总线,被应用在与控制器、中控之间通信。晶台光耦,被广泛应用于通信隔离、双MCU系统应用地隔离、电机驱动隔离等。下图例举在电动摩托车上的应用中包含的部件
    晶台光耦 2024-12-17 13:47 51浏览
  • 在现代软件开发领域,效率和可靠性是企业在竞争中取胜的关键。本文将深入探讨 ANA Systems 如何通过引入业界领先的 CI/CD 平台——CircleCI,克服传统开发流程的瓶颈,实现开发运营效率的全面提升。同时,本文还将详细解析 CircleCI 的核心优势,包括其强大的自动化功能、广泛的工具整合能力,以及为企业量身定制的支持服务,揭示其如何助力 ANA Systems 在「新一代国内旅客项目」中脱颖而出。这一案例将为企业优化开发流程、提升竞争力提供重要的实践参考。ANA Systems
    艾体宝IT 2024-12-16 16:44 131浏览
  • 随着现代汽车工业的不断发展,驾驶安全与舒适性成为消费者关注的焦点。在这个追求极致体验的时代,汽车ASF随动转向LED大灯技术应运而生,它不仅代表了车辆操控辅助系统的最新进展,更是对未来智能安全出行愿景的一次大胆探索。擎耀将深入探讨ASF随动转向技术的原理及落地方案,旨在为汽车LED照明升级行业提供一份详尽且实用的参考。首先,ASF随动转向技术不是什么高精尖的技术,一般的汽车大灯制造厂商都可能完成,通过软硬件的逻辑加上传感器,基本就可以实时监测车辆的行驶状态,包括但不限于车速、转向角度等关键参数。
    lauguo2013 2024-12-17 14:43 47浏览
  • 车载光纤通信随着ADAS(高阶驾驶辅助系统)、汽车智能网联、V2X和信息娱乐技术的不断发展,车载电子系统和应用数量迅速增加。不断增长的车内传输数据量对车载通信网络造成了巨大的数据带宽和安全性需求,传统的车载总线技术已经不能满足当今高速传输的要求。铜缆的广泛使用导致了严重的电磁干扰(EMI),同时也存在CAN、LIN、FlexRay等传统总线技术不太容易解决的问题。在此背景下,车载光纤通信技术逐渐受到关注和重视,除了大大提高数据传输率外,还具有抗电磁干扰、减少电缆空间和车辆质量等优点,在未来具有很
    广电计量 2024-12-18 13:31 44浏览
  • 1. 磁性材料的磁化曲线磁性材料是由铁磁性物质或亚铁磁性物质组成的,在外加磁场H 作用下,必有相应的磁化强度M 或磁感应强度B,它们随磁场强度H 的变化曲线称为磁化曲线(M~H或B~H曲线)。磁化曲线一般来说是非线性的,具有2个特点:磁饱和现象及磁滞现象。即当磁场强度H足够大时,磁化强度M达到一个确定的饱和值Ms,继续增大H,Ms保持不变;以及当材料的M值达到饱和后,外磁场H降低为零时,M并不恢复为零,而是沿MsMr曲线变化。材料的工作状态相当于M~H曲线
    锦正茂科技 2024-12-17 10:40 122浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦