群英荟萃:盘点2024年的大语言模型

陈芝麻 2024-12-18 14:49

随着人工智能技术的迅猛发展,大语言模型(LLM)已成为推动语言理解和生成能力进步的关键力量。2024年,无论是在学术研究还是商业应用领域,LLM都取得了显著的进展。大语言模型在2024年有哪些成功的案例?本文将对2024年国内外大语言模型的进展进行总结,并展望2025年的发展。2024年大语言模型(LLM)在多个领域的成功案例有以下内容。

2024的大语言模型汇总

国外大语言模型汇总

1. Open AI

o1大模型

OpenAI在2024年9月13日公开了一系列全新AI大模型,旨在专门解决难题。这些新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。o1模型在一系列高难基准测试中展现出了超强实力,相比GPT-4o有巨大提升。

2. Meta

Llama 3.1

Meta发布了Llama 3.1,这是当时最大的开源AI模型,拥有4050亿参数。该模型在多个基准测试中的表现超过了GPT-4o和Anthropic的Claude 3.5 Sonnet。Llama 3.1主要处理文本任务,包括编程、回答基本数学问题以及用八种语言(英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语)总结文件。

Llama 3.2

Meta发布了其首款能够处理图像和文本的开源模型Llama 3.2。Llama 3.2包括两个视觉模型(分别拥有110亿和900亿参数)和两个轻量级仅文本模型(分别拥有10亿和30亿参数),旨在在高通、联发科等Arm硬件上运行。

MovieGen

Meta推出了MovieGen,这是一个能够根据文本输入生成视频的AI模型,具备高达300亿个参数的能力,使其能够生成长达16秒的高质量视频。MovieGen的Audio版本则可以为视频提供同步的高保真音频,标志着Meta在多模态生成技术上的重要进展

3. Google

Gemini系列模型

v Gemini 1.5 Pro:这是Gemini系列的一个进阶版本,提供了100万Tokens的上下文长度,并支持35种语言。它在多模态和长上下文处理方面取得了突破,能够处理长达2小时的视频、22小时的音频、超过60,000行代码或超过140万个单词。

v Gemini 1.5 Flash:这是一个更轻量级的模型,针对需要快速响应和成本效益的任务进行了优化。它在AI Studio和Vertex AI中提供,并且是为规模化构建的。

Gemma 2

Google DeepMind在2024年6月27日发布了Gemma 2,这是Gemma系列轻量级开放语言模型的最新成员。Gemma 2在架构和训练方法上都有重大创新,在多项基准测试中取得了显著进步,甚至可以与参数规模大2-3倍的模型相媲美。Gemma 2模型的训练数据量约为其第一代的两倍,总计13万亿Tokens(27b模型)和8万亿Tokens(9b模型)的网页数据(主要是英语)、代码和数学数据。

4. Microsoft

GPT-4o

Microsoft推出了GPT-4o,这是OpenAI的新旗舰模型,集成了文本、视觉和音频能力,为生成性和会话AI体验树立了新标准。GPT-4o现在可以在Azure OpenAI服务中以预览版的形式试用,支持文本和图像输入。

Med42

Microsoft通过Azure AI Studio提供了Med42,这是一个领先的临床大型语言模型(LLM),利用AI的力量颠覆传统医疗系统,为临床医生、科学家和患者提供价值。

LLM2CLIP:

Microsoft研究团队提出了LLM2CLIP,这是一种新方法,利用大型语言模型(LLMs)的力量来解锁CLIP的潜力。通过在标题空间中微调LLM进行对比学习,将LLM的文本能力提取到输出嵌入中,显著提高了输出层的文本可区分性。

5. NVIDIA

NVLM 1.0系列模型

NVIDIA发布了NVLM 1.0系列多模态大语言模型,其中以72亿参数的NVLM-D-72B为代表,展示了在视觉和语言任务上的卓越性能,并增强了仅文本能力。NVLM-D-72B模型在处理复杂视觉和文本输入方面表现出色,提升了多模态训练后仅文本任务的性能,平均准确度提高了4.3个百分点。

NVIDIA NIM微服务

NVIDIA宣布了针对OpenUSD语言的NVIDIA NIM™微服务,这些AI模型可以生成OpenUSD语言回答用户查询、生成OpenUSD Python代码、对3D对象应用材料,并理解3D空间和物理以帮助加速数字孪生开发。

 

国内大语言模型汇总

在国内,截至2024年11月30日,多家大模型企业和机构正式宣布其服务已经上线,并向全社会开放。目前,百度、金山、智谱、百川、字节等多家企业和机构的大模型已经落地,它们可以正式上线并向公众提供服务。

 

1. 百度

文心大模型

百度文心大模型的日均调用量已经超过了15亿次,相较一年前首次披露的5000万次,增长了近30倍。文心大模型家族持续拓展,支持企业和开发者灵活调用,百度文心大模型4.0 Turbo对企业用户全面开放。

千帆大模型平台3.0(千帆3.0)

百度智能云千帆大模型平台正式发布的功能,旨在帮助企业快速开发出面向复杂对话场景的AI应用,快速拥有专业水平的“数字员工”。

2. 金山

WPS AI 2.0

金山办公在2024年7月发布了WPS AI 2.0,该版本在AI写作助手、AI阅读助手、AI数据助手、AI设计助手四个维度实现了范式革新。

金山云瀚海大模型平台

金山云在2024年3月发布了qzhou-72B基座模型和金山云瀚海大模型平台,为企业开发者提供一站式大模型训练及推理服务平台。

3. 智谱AI

GLM-4

智普AI在2024年1月16日的「智谱技术开放日(Zhipu DevDay)」上发布了新一代基座大模型GLM-4。GLM-4的整体性能相比上一代大幅提升,十余项指标逼近或达到GPT-4。GLM-4支持更长上下文、更强的多模态能力、更快推理速度,更多并发,大大降低推理成本。

GLM-4-Voice

智普AI推出并开源端到端语音模型GLM-4-Voice,能够直接理解和生成中英文语音,进行实时语音对话,并能遵循用户的指令要求改变语音的情感、语调、语速、方言等属性。

GLM-4-Plus

智普AI在KDD国际数据挖掘与知识发现大会上发布了GLM-4-Plus基座模型,通过多种方式构造出了海量高质量数据,并利用PP0等多项技术,有效提升了模型推理、指令遵循等方面的表现。

4. 阿里

通义千问新一代开源模型Qwen2.5

阿里云全面升级AI基础设施,发布了通义千问新一代开源模型Qwen2.5,其旗舰版本Qwen2.5-72B在多项基准测试中表现强劲,超越行业对手。Qwen2.5系列是一个超级AI模型「百宝箱」,涵盖了多个尺寸的大语言模型、多模态模型、数学模型和代码模型。每个尺寸都有基础版本、指令跟随版本和量化版本,总计上架了100多个模型,刷新了业界纪录。

八观气象大模型

阿里巴巴达摩院发布的八观气象大模型,通过融合多源数据,提升了气象指标预测的准确性,尤其在新能源电力系统的应用上,时空精度达到了1小时1公里。该模型显著提高了辐照度、风速等气象数据的预测准确率,提升了新能源发电功率和电力负荷预测的准确率,分别达到了96%和98%以上。

 

5. 字节跳动

豆包大模型家族

包括通用模型pro、通用模型lite、语音识别模型等九款模型,其中主力模型在企业市场的定价仅为0.0008元/千Tokens。

PixelDance视频生成模型

字节跳动视频生成模型PixelDance将很快在即梦AI上线,面向公众开放使用。PixelDance在语义理解、多个主体运动的复杂交互画面,还是多镜头切换的内容一致性方面,都表现出不错的效果。

这些案例展示了大语言模型在不同领域的广泛应用和深远影响,从智能体的创建到特定领域的专业应用,大模型技术正在推动各行各业的创新和发展。

 

2024年大语言模型技术突破与应用前景

 

2024年ACL会议揭示了检索增强生成(RAG)技术的重大进展。这项技术通过结合检索和生成,提升了LLMs在复杂任务中的性能。例如,“CallMeWhenNecessary: LLMs Can Efficiently and Faithfully Reason over Structured Environments”的研究通过定义标准化的推理路径,优化了模型表现,提升了推理的准确性。此外,“LLMs as Prompter: Low-resource Inductive Reasoning on Arbitrary Knowledge Graphs”探索了低资源场景下的知识图谱归纳推理,为资源受限环境中应用AI提供了新的可能性。

中国市场的大语言模型产业发展迅速,百度、阿里、华为等巨头厂商陆续宣布研发或已发布大语言模型产品。这些模型不仅服务于公司战略业务拓展,还形成了差异化的商业路线。例如,百度的“文心千帆”产品剑指B端市场,意图带动云服务营收。

OpenAI的GPT-4o模型通过添加文本、图像和音频集成,扩展了多模态功能,同时降低了成本,提高了响应速度。此外,Qwen-1.5模型能以较低成本提供接近GPT-4的能力,还能通过自定义数据集进行微调,以适应特定的使用需求。

IMLIP 2024大会汇聚了全球AI语言处理专家,探讨了语言技术的未来。会议涵盖了大模型与语音技术的融合、视觉域适应与深度视频压缩的研究等多项前沿技术,推动了AI语言处理技术的深入发展。

2025年大语言模型发展展望

1. 个性化体验与对话式AI

2025年,生成式AI将在个性化体验和对话式AI领域取得重大进展。企业将利用大语言模型为客户提供定制化的内容和服务,提升客户黏性和转化率。对话式AI将提升传统的客户服务体验,通过自然语言处理(NLP)和深度学习,生成式对话系统能够理解上下文并适应用户的需求。

2. 科学研究与素材生成

基于大语言模型的工具将加速各学科对复杂数据集的分析,推动药物发现、材料科学等领域的创新。图像和视频生成技术也将消除传统创作过程中的瓶颈,广泛应用于广告、游戏等领域。

3. 多语言模型与全球协作

2025年,大语言模型在语言翻译和本地化中的应用将取得显著进展,彻底改变个人和企业跨语言沟通的方式。随着全球化的不断扩大,对精准且符合文化背景的翻译需求也将不断增加,大语言模型将提升机器翻译的能力,为用户提供更自然、理解语境的翻译。

4. 隐私保护与负责任的AI实践

隐私保护技术的集成以及负责任的AI实践将有助于建立用户信任,确保大语言模型的应用符合伦理标准。随着各类组织利用这些进展,我们可以预见大语言模型将越来越擅长理解语境、生成类似人类的文本,并在各行各业提供定制化的解决方案。

结论

2024年,大语言模型在技术突破、产业发展、多模态与多语言能力等方面取得了显著进展。展望2025年,大语言模型将继续在个性化体验、对话式AI、科学研究、素材生成等领域发挥重要作用,同时注重多语言能力的提升和隐私保护技术的集成。随着技术的不断进步,大语言模型将在智能化需求中扮演越来越关键的角色,为全球的协作与沟通提供强大的支持。


陈芝麻 Altium Designer 22 电路设计与仿真实战从入门到精通一书作者
评论
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 126浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 187浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 488浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 202浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 538浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 108浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 163浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 82浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 76浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 132浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 201浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 68浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 167浏览
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 340浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦