AI热潮带动服务器、交换机、光模块及芯片蓬勃发展

智能计算芯世界 2023-11-01 07:44

本文内容来自“AI产业热潮带动服务器、交换机、光模块及相关芯片行业蓬勃发展”,重点分析国外大模型厂商产品、国内主要大模型产品,以及AI热潮给服务器、交换机、光模块及芯片产业带来的发展机会。

2022年 11 月,美国 OpenAI 公司在 GPT-3.5 的基础上推出聊天机器人 ChatGPT。相比于之前的主流 AI 模型,ChatGPT 通过采用 Transformer 算法以进行自然语言处理。

2023 年 3 月,OpenAI 公司应势推出新的 GPT-4。GPT-4 是对ChatGPT 的重大升级迭代,不仅具备更加强大的语言理解能力,还能够处理图像内容。GPT-4可以生成更长、更复杂、更准确、更多样化的文本字符串,并在人们输入图像时做出响应,可以更好地避免 GPT-3.5 在处理某些问题时可能出现的错误,保证问题解决过程的规范和准确。

截至目前,GPT 经历了从 GPT-1 发展至 GPT-4 的迭代升级。

自 ChatGPT 推出以来,国内外各企业纷纷入局,大模型发展如火如荼。目前市面主流的 AI 服务器配备 Nvidia Ampere 架构的计算卡 A100。

A100 的性能比上一代产品 V100 提升高达 20 倍,可划分为七个 GPU 实例,根据变化的需求进行动态调整。A100 的单精度浮点计算能力峰值可达 19.5TFLOPS,双精度浮点算力可达9.7TFLOPS。相比 V100,A100 80GB 可针对大型模型提供高达三倍的 AI 训练速度;相比 CPU,A100 80GB 可提供高达 249 倍的 AI 推理性能。OpenAI 公司在推出 GPT-3 和 ChatGPT 时即使用英伟达的 NVIDIA A100 GPU 来训练和运行。

针对算力需求巨大的 ChatGPT 及其他大模型,英伟达推出 NVIDIA H100 NVL。NVIDIA H100NVL 是具有 94GB 内存和加速 Transformer 引擎的大语言模型(LLM)专用解决方案。H100 的单精度浮点计算能力峰值可达 34 TFLOPS,双精度浮点算力可达 67 TFLOPS。与 NVIDIA A100GPU 相比,NVIDIA H100 在大型语言模型上具有高达 9 倍的训练速度和 30 倍的 AI 推理性能,进一步巩固英伟达在 AI 芯片市场的领先地位。

1、海外巨头争夺 AI 领域主动权

3 月 16 日微软推出 AI 版 Office“全家桶”:Microsoft 365 Copilot。2023 年 7 月 18 日,微软于 Inspire 合作伙伴大会上宣布,面向 Office 365 E3、E5、商业标准版和商业进阶版的订阅商户,Microsoft 365 Copilot的定价为每个用户每月 30 美元。

2022 年,谷歌推出了 5400 亿参数大模型 PaLM,而 2023 年 5 月 10 日,谷歌又发布了 PaLM2,部分能力已经超越了 GPT-4。谷歌推出基于 LaMDA 的 Bard 用来对标 ChatGPT。Bard 的 LaMDA模型训练参数达 1370 亿个。在 2023 年 3 月 21 日,谷歌宣布开放 Bard 公测,并于 2023 年 4月 10 日改用更强大的 PaLM 大型语言模型以增加其运算能力。随着全球 AI 接入潮兴起,谷歌也将 Bard 应用到谷歌搜索和办公软件中。DuetAI 是应用于 GoogleWorkspace 的办公类 AI工具,用来对标微软 Copilot,可以自动生成文档、表格和图片。

2022 年 5 月,MetaAI 发布了基于 1750 亿参数的超大模型 OPT-175B。2023 年 2 月,Meta 宣布将推出针对研究社区的“Meta 人工智能大型语言模型”系统“LlaMA”。2023 年 7 月,MetaAI 发布了第二代语言大模型 Llama2,模型开源且可免费用于商业用途。依照测试结果,700亿参数的结果同常见的闭源模型 GPT-3.5 在 MMLU 和 GSM8K 水平上较为接近,但在生成代码的能力上存在较大差距。微软在随后的 Inspire 合作伙伴大会上同时宣布在 Azure 云计算平台上相应深度整合 Llama2 模型框架。亚马逊的 AWS 云也加入和 Meta 的合作中。

2023 年 4 月 13 日,亚马逊云服务部门宣布推出自有大型语言模型泰坦,模型初始可分为两种,第一类名为 Titan Text,为生成式 LLM,可用于总结、文字生成等。第二类名为 TitanEmbedding,专注于将文字输入转换为参数化的表达,相应的技术已被用于亚马逊商品的推荐算法中。

2、国内大厂加速布局大模型

国内厂商也在加速研发大模型,各大互联网巨头纷纷入局 AI 大模型。

百度最早于 2019 年推出预训练模型 ERNIE 1.0,历经多次迭代,百度文心大模型形成了基础大模型、任务大模型、行业大模型三级体系。框架层面上,百度提供了中国首个开源的产业级深度学习框架-飞桨PaddlePaddle,百度构建了文心大模型+飞桨深度学习平台的商业模式,落地应用方向广泛,涵盖金融、能源、电力、航天、互联网等领域。

2022 年 9 月,阿里发布通义大模型系列。通义大模型分为统一模型底层、通用模型层和专业模型层。目前,阿里通义大模型已落地应用于电商、医疗、娱乐、设计、金融等行业,服务超过 200 个场景。2023 年 4 月 11 日,阿里正式推出大语言模型通义千问。此外,阿里还推出了用户共建 AI 模型服务型平台“魔搭社区”,目前社区内已集聚了 180 多万 AI 开发者和900 多个优质 AI 模型。2023 年 7 月 7 日上海世界人工智能大会上公司 CTO 表示,阿里云将向大模型创业公司提供全方位的服务,包括最强大的算力和开发工具。

华为云团队 2020 年开始发展 AI 大模型,2021 年 4 月发布盘古大模型。2023 年 7 月 7 日,华为于公司开发者大会 2023 上正式发布 AI 大模型华为盘古大模型 3.0。模型提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化基础大模型。此外,华为一站式 AI 开发平台 ModelArts 为盘古大模型的训练、推理迭代发展持续提供优化支持。目前,盘古大模型已在 100 多个行业场景完成验证,涵盖能源、零售、金融、工业、医疗、环境、物流等。

腾讯于 2022 年 12 月推出了万亿中文 NLP 预训练模型混元 AI 大模型。目前,腾讯混元大模型涵盖 NLP 大模型、CV 大模型、多模态大模型和众多行业模型。腾讯也打造了一站式机器学习生态服务平台——太极机器学习平台,为混元大模型提供底层支持。受益于腾讯自身业务广泛,混元大模型在腾讯内部已与腾讯广告、微信、QQ、游戏等产品结合,在广告提效层面效果显著。同时,混元大模型还通过腾讯云实现对外的商业化。

2023 年 4 月 18 日,字节跳动旗下火山引擎发布自研 DPU 等系列云产品,并推出升级版的机器学习平台,支持万卡级大模型训练。2023 年 6 月 28 日,字节跳动公布了公司在大模型业务的最新进展,并发布了大模型服务平台“火山方舟”,提供模型的训练、推理、评测、精调等功能服务。目前集成了百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI 等多家公司及团队的大模型。

科大讯飞于 2023 年 5 月推出星火认知大模型,目前已在教育、办公、汽车、数字员工等行业中落地应用。在发布会上,董事长刘庆峰表示未来科大讯飞将在保护伦理和安全的前提下发展认知大模型,同时联合开发者推动认知大模型应用落地,共建人工智能“星火”生态。2023年 6 月 13 日,360 集团发布认知型通用大模型“360 智脑 4.0”,并宣布 360 智脑已接入 360旗下产品,如搜索引擎、浏览器和安全卫士中。同时,借助 360 长期在互联网安全方面的积累,公司建立了“安全大脑”大模型,以监管大模型中的不当行为。

2023 年 7 月 7 日,商汤推出大模型体系“商汤日日新 SenseNova”的多方位全面升级及体系下一系列大模型产品的落地成果,其中包括金融领域的客服、投研分析降本增效;医疗场景内辅助导诊问诊、辅助决策;移动终端内智能交互、内容交互;线下场景的故障识别、缺陷判断;线上直播短视频平台的数字人应用及营销工具;智能汽车领域的集安全效率为一体的智能座舱体验等。

3、人工智能行业加速服务器、AI 芯片、交换机、光模块产业

人工智能的快速发展推动数据使用量的飙升,推动数据中心基础设施建设的快速增长。数据中心基础设施主要包括 IT 设备、非 IT 设备、软件及建设工程。在 IT 设备采购成本中,服务器占比最大达 69%。网络设备(即交换机和路由器)、安全设备、存储设备和光模块/光纤等分别占数据中心设备采购成本的 11%、9%、6%和 5%,不同方案成本占比略有不同,但总体上服务器成本占 IDC 硬件成本70%左右。

到 2023 年中旬,AI 服务器市场出货量接近 60 万台,相比上年同期增长约 39%。根据TrendForce 预估,2023 年全球 AI 服务器出货量将接近 120 万台,同比增长 38.4%,占整体服务器出货量的比重约 9%。到 2025 年将增长至近 190 万台,2022-2025 年期间年平均增长率达 41.2%。预计 2030 年全球算力规模达到 56 ZFlops,平均年增速达到 65%。

从全球市场份额占比来看,2021 年浪潮信息市占率达 20.9%,位列行业第一。其次为戴尔、HPE、联想、IBM,占比分别为 13.0%、9.2、5.8%、4.1%。

下载链接:
AI产业热潮带动服务器、交换机、光模块及相关芯片行业蓬勃发展
华为鲲鹏生态及产业发展趋势
无服务器架构系列标准解读
无服务器计算测试集
2023年AI基础设施技术词条报告
2023年算力技术词条报告
中国AI基础软件市场研究报告(2023)
面向工业智能化时代的新一代工业控制体系架构白皮书
《2023中国人工智能系列白皮书(3)》
7、2023中国人工智能系列白皮书(AI+Art) 8、2023中国人工智能系列白皮书(人工智能原理)
《2023中国人工智能系列白皮书(2)》
4、2023中国人工智能系列白皮书(心智计算) 5、2023中国人工智能系列白皮书(大模型技术) 6、2023中国人工智能系列白皮书(智慧电网)
《2023中国人工智能系列白皮书(1)》
1、2023中国人工智能系列白皮书(深度学习) 2、2023中国人工智能系列白皮书(风险挑战与治理应对) 3、2023 中国人工智能系列白皮书(智能协同控制与人工智能)
2023年中国人工智能行业概览
精华:CPU中央处理器技术
物联网边缘计算安全技术与应用研究报告
计算机行业报告:鲲鹏展翅,昇腾万里(2023)
2023中国人工智能系列白皮书(智能协同控制与人工智能)
数据中心液冷报告:大模型&大算力带来高功耗,液冷技术有望加速导入
《HPC高性能计算集群调度技术合集》
1、HPC技术之Slurm调度系统管理和使用介绍 2、HPC技术之调度系统概述、原理和部署 3、HPC技术之高性能计算集群原理及管理
《ODCC-2023技术白皮书(液冷技术)》
1、ODCC 2023 单相浸没式冷却系统及其AI-Cooling 2、2023 ODCC冷板式液冷服务器可靠性测试规范 3、ODCC-2023冷板液冷服务器设计白皮书 4、ODCC-2023边缘浸没服务器技术白皮书
《ODCC-2023技术白皮书(计算规范)》
《ODCC-2023技术白皮书(存储)》
《ODCC-2023技术白皮书(服务器)》
《ODCC-2023技术白皮书(网络通信)》
《ODCC-2023技术白皮书(边缘计算)》

《ODCC-2023技术白皮书(数据中心)》

1、ODCC-2023数据中心自适应AI节能白皮书 2、ODCC-2023数据中心高性能网络拥塞检测技术白皮书 3、ODCC-2023数据中心氢能应用白皮书 4、ODCC-2023数据中心制冷系统AI节能技术及其应用白皮书 5、ODCC-2023数据中心低压开关技术白皮书

《2023 ODCC技术研究报告(合集)》
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。



免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。


温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。

智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 306浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 343浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 204浏览
  • 想不到短短几年时间,华为就从“技术封锁”的持久战中突围,成功将“被卡脖子”困境扭转为科技主权的主动争夺战。众所周知,前几年技术霸权国家突然对华为发难,导致芯片供应链被强行掐断,海外市场阵地接连失守,恶意舆论如汹涌潮水,让其瞬间陷入了前所未有的困境。而最近财报显示,华为已经渡过危险期,甚至开始反击。2024年财报数据显示,华为实现全球销售收入8621亿元人民币,净利润626亿元人民币;经营活动现金流为884.17亿元,同比增长26.7%。对比来看,2024年营收同比增长22.42%,2023年为7
    用户1742991715177 2025-05-02 18:40 190浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 509浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 213浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 620浏览
  • 5小时自学修好BIOS卡住问题  更换硬盘故障现象:f2、f12均失效,只有ESC和开关机键可用。错误页面:经过AI的故障截图询问,确定是机体内灰尘太多,和硬盘损坏造成,开机卡在BIOS。经过亲手拆螺丝和壳体、排线,跟换了新的2.5寸硬盘,故障排除。理论依据:以下是针对“5小时自学修好BIOS卡住问题+更换硬盘”的综合性解决方案,结合硬件操作和BIOS设置调整,分步骤说明:一、判断BIOS卡住的原因1. 初步排查     拔掉多余硬件:断开所有外接设备(如
    丙丁先生 2025-05-04 09:14 83浏览
  • 某国产固态电解的2次和3次谐波失真相当好,值得一试。(仅供参考)现在国产固态电解的性能跟上来了,值得一试。当然不是随便搞低端的那种。电容器对音质的影响_电子基础-面包板社区  https://mbb.eet-china.com/forum/topic/150182_1_1.html (右键复制链接打开)电容器对音质的影响相当大。电容器在音频系统中的角色不可忽视,它们能够调整系统增益、提供合适的偏置、抑制电源噪声并隔离直流成分。然而,在便携式设备中,由于空间、成本的限
    bruce小肥羊 2025-05-04 18:14 149浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 77浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 82浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 338浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 66浏览
  •  一、‌核心降温原理‌1、‌液氮媒介作用‌液氮恒温器以液氮(沸点约77K/-196℃)为降温媒介,通过液氮蒸发吸收热量的特性实现快速降温。液氮在内部腔体蒸发时形成气-液界面,利用毛细管路将冷媒导入蒸发器,强化热交换效率。2、‌稳态气泡控温‌采用‌稳态气泡原理‌:调节锥形气塞与冷指间隙,控制气-液界面成核沸腾条件,使漏热稳定在设定值。通过控温仪调整加热功率,补偿漏热并维持温度平衡,实现80K-600K范围的快速变温。二、‌温度控制机制‌1、‌动态平衡调节‌控温仪内置模糊控制系统,通过温度
    锦正茂科技 2025-04-30 11:31 79浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦