全球已发布大模型超200个,中美数量占全球的九成。虽然ChatGPT点燃了大模型发布的热情,不过早在ChatGPT发布之前,全球已经发布了不少大模型,《中国人工智能大模型地图研究报告》显示,2019年美国已经有了4个大模型,而中国2020年有了2个大模型,此后每年都有大模型发布,仅仅2023年的前五个月,中美分别有19、18个大模型发布。硅光技术产业深度研究:芯片出光,硅光技术开启高速与高集成度传输时代半导体检测行业报告:集成电路国产化加速,第三方检测发展空间广阔算力国产化大势所趋,昇腾构建自主高端AI计算竞争力2023人工智能专题报告:AI大模型应用中美比较研究华为发布会:Mate60系列引领创新,全场景新品技术升级400+份重磅ChatGPT专业报告(合集)
截至2023年5月底,国内10亿级参数规模以上基础大模型至少已发布79个,而美国这一数字为100个,全球累计发布大模型202个,中美两国大模型的数量占全球大模型数量的近90%,中国大模型数量已进入第一梯队。发布大模型的机构可以分为四种类型,互联网公司、学术/研究机构、Al公司及行业公司。国内大模型呈快速发展之势,在以下几个方面表现突出:一是,大模型应用越来越广泛,在自然语言处理、图像识别、语音识别、内容生成等多个领域有着广泛应用。二是,大模型算法丰富,国内的模型上除了GPT之外,还对BERT、ALBERT、NEZHA等进行了广泛的探索。三是,大模型性能不断提升,国内大模型玩家纷纷加大对Al的研发投入,据钛媒体·钛度图闻不完全统计,2022年,华为在研发费用上投入1615亿元,成为研发投资资金最多的企业;其次,腾讯以614亿元排名第二,阿里以555亿元排名第三,他们在硬件和软件领域的大规模投入,大大提高了大模型的运算速度和效率。四是,大模型研究成果不断涌现,国内以清华、复旦、哈工大等高校也推出了自己的大模型,国内机构在NLP、CV等领域也拿到了多个国际级别的冠军。然而不得不承认的是,国内大模型迅猛发展的同时也面临着基础模型研发能力不足,部分行业数据搜集整理难度大等问题。据国外风投数据分析公司PitchBook的数据,2023上半年,全球人工智能领域共计发生融资1387件,筹集融资金额255亿美元,平均融资金额达2605万美元。根据Crunchbase数据库,2011-2023年共计3658个Al领域融资项目(仅统计500万以上融资金额的项目,且融资公司所在地为美国),美国Al领域融资项目数及融资金额稳步增长。2022年美国风投Al领域融资项目数为574个,2011-2022年CAGR达29.3%;2022年美国AI领域融资金额为243.5亿美元,2011-2022年CAGR达422.5%。据业界不完全统计,2023年上半年,美国AIGC一级市场中,硅谷在人工智能领域共完成了42起融资,总金额约140亿美元,占世界总融资金额的55%。平均轮次融资金额为3.3亿美元,是平均融资水平的近13倍之多。其中,8家人工智能明星独角兽公司拔地而起,平均轮次融资金额3.3亿美元。虽然大模型发布数量不断增长,然而对于大模型如何落地变现,仍在不断探索中,据中国电信研究院分析,国外行业大模型发展模式主要有三种,且以前两种发展模式为主。一是。目前国际巨头多采用这种模式,如谷歌、微软、Meta等龙头厂商利用大模型重构原有业务,比如微软利用GPT-4全面“龙头大模型+原有业务”赋能Azure云、Office365、Dynamics365等传统业务。这种模式的优势在于可以利用大模型的强大语言能力,提升原有业务的智能化水平,同时也可以借助原有业务的数据和用户资源,增强大模型的应用相关性和准确性。二是“龙头大模型+外部行业数据”。这种模式是国内创业公司普遍采用的方式,通过直接调用API或基于GPT大模型微调改进自身Al产品,比如哈维基于GPT及行业数据推出“Al法律助手”。这种模式的优势在于可以利用龙头大模型的先进技术和算力,快速打造出具有行业特色和竞争力的Al产品,同时也可以借助外部数据源,增强行业相关性和准确性。三是“开源大模型+自有行业数据搭建行业大模型”。这种模式多适用于有着丰富的行业数据积累的中大型企业。例如基于开源模型研发,实现LLM与金融垂直领域知识的深度融合。这种模式的优势在于可以充分利用自有数据的质量和数量级,打造出更专业、更精准的行业大模型,同时也可以借鉴开源大模型的技术和经验,提升训练效率和效果。总体而言,基础大模型训练成本高,研发难度大,这决定了大模型会遵照“赢者通吃”的规律,未来市场上仅存几个龙头大模型,而围绕龙头大模型的创业生态将逐步形成。
1、AI大模型落地的前景和痛点,兼谈工程师架构师所面临的机会和挑战
2、AIGC驱动下高校数字化转型
3、大模型趋势下的企业数据体系思考
4、大模型时代下数据中台该何去
5、大模型重塑软件开发以及实践案例展示
6、当GPT遇到低代码低代码平台AIGC开发落地实战7、迈向通用人工智能时代之路——边缘与管力网络演进及思考1、未来网络白皮书(2023):算网操作系统白皮书 2、未来网络白皮书(2023):以网络IO为中心的无服务器数据中心白皮书 3、未来网络白皮书(2023):光电融合服务定制广域网白皮书人工智能专题报告:智算中心—赋能AI产业化、产业AI化(2023)
中国超导体行业:立足科技前沿,满足能源战略需求(2023)多样性算力:新一代计算架构超异构计算
聚力“高广深”打造先进算力网络
生成式AI:产业变革与机会(2023论坛合集)
《“东数西算”技术分析合集》
《2023年液冷技术白皮书汇总》
1、浸没式液冷数据中心热回收白皮书(2023)
2、数据中心绿色设计白皮书(2023)世界AI大会系列:数据为核,迈向多模态AI大模型时代
AI精华系列报告:AMD发布MI300,指引Chiplet等AI芯片新方向2、CXL-Forum CXL-Consortium技术方案.pdf3、CXL-Forum Elastics cloud技术方案.pdf 4、CXL-Forum Intel技术方案.pdf 5、CXL-Forum Marvell技术方案.pdf 6、CXL-Forum MemVerge技术方案.pdf 7、CXL-Forum Micron技术方案.pdf1、芯来科技:基于RISC-V的MCU软硬件解决方案2、芯来科技:高可靠高安全性RISC-V处理器设计与实现
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。