大模型、生成式AI、通用人工智能,如今已经是几乎每个互联网人都能讲个几句的通识概念。
作为2023年上半年最受关注的热门赛道,国产大模型争相出世,谁将成为“中国版GPT-4”惹人注目。“百模大战”空前激烈,华为、阿里、腾讯、商汤、京东等企业陆续发布或更新大模型。比如,百度智能云的“文心”系列、阿里云的“通义”系列、华为云的“盘古大模型”、京东云的“言犀”、商汤的“日日新”、科大讯飞的“星火”、出门问问的“序列猴子”、第四范式的“式说”等产品。
AI大模型兴起和快速发展即将推动我们进入第四次工业革命,以云计算、物联网、大数据、机器人等为代表,正在推动社会生产、生活方式的变革。大模型热掀起了整个人工智能产业全新浪潮。如今各行各业都在探索跟大模型的结合。派财经将聚焦于“AI大模型”开展系列专题分析,该篇为第一篇。
值得关注的是,大模型产品的批量涌现呈现了一定程度的同质化,尤其展现在“文生文”领域,各家大模型在文生文方面,关注的重点比较类似,集中于流畅的上下文理解、减少幻觉问题、符合伦理安全等。
在“文生图”上略有区别,百度文心一格称能够实现对人物面部表情、毛发等部位的精细刻画;商汤科技的“秒画SenseMirage”则能够帮用户补全提示词,生成摄影级图像……围绕着“通用大模型”这一热门概念,市面上分为了大厂派、创业派和学院派三类。其中,大厂派布局范畴广,普遍在ToB与ToC两级进行布局。在ToB行业解决方案方面,大厂派一方面纷纷发布了覆盖各行业的端到端解决方案,其中金融、文旅、传媒、医疗、政务等行业也几乎是各家大厂关注的重点;同时,大厂也致力于为其余大模型研发企业提供算力、数据管理等基础设施服务。创业派企业则更多专注于将大模型能力应用到其优势业务领域中,比如商汤科技、第四范式等企业。此外,拥有高校、科研院背景的学院派企业也是不可忽视的力量。比如,仅有2021年成立、由全球NLP(自然语言处理)技术专家周明创办的“学院派”代表企业澜舟科技和拥有“清华系”创业北京的生数科技等企业。目前发布的通用大模型已超过80个,但随着入局者激增,通用大模型头顶的光环正在变得黯淡下来。
大语言模型是具有能力边界的,不仅落地成本高昂,其准确率也需要反复商榷。通用性大模型技术仍然没走到成熟阶段,比起在C端的运用,大模型的真正价值在产业落地方向更能体现。
早在2015年,深度学习的算法突破带来智能语音和计算机视觉领域的一波AI创业浪潮,AI四小龙横空出世,但长期以来AI技术如何落地到应用层面,自我造血能力颇为困扰。当前,仅以人脸识别为代表的技术在安防领域实现了大规模落地,并未在某个产业端实现稳定应用。在烧光了600多亿融资后,AI四小龙们一度陷入生存困境。直到ChatGPT的出现,再次加固了人们对于AI技术的信心,以大模型为商业模式的AI创业公司如雨后春笋般涌现。对于大模型创业热潮的火热,经纬创投创始管理合伙人张颖引用了一个调研数据——从今年3月到5月,召开业绩电话会议的标普500指数的公司中,有110家公司的高管提到了AI,这是过去十年的3倍。截至今年6月底,有十几家大模型初创公司宣布获得融资。根据公开信息显示,当前融资规模最大的是MiniMax,今年6月获得腾讯公司超过2.5亿美元A轮融资;王慧文创办的光年之外在被美团以收购前,也获得了2.3亿美元的天使+轮融资。一波AI智能公司,蹭着这波热潮纷纷开始排队申请IPO。近期,AI 智能驾驶芯片公司“黑芝麻智能”、AI 语音公司“云知声”、生成式 AI公司出门问问、AI制药公司“英矽智能”等多家 AI 公司密集向港交所递交上市申请。其中,作为亚太首家启动IPO的 AI 制药公司英矽智能备受资本关注,若能成功上市,将有望成为“亚太 AI 制药第一股”。不过值得注意的是,英矽智能并没有实现新药量产销售,且在2022年年亏损高达2.21亿美元,收入仅3014.7万美元。在上一轮AI热潮中未能成功上市的AI企业均呈现短期亏损、盈利难的情况。与上一轮AI技术热潮相比,ChatGPT为代表的通用大模型同样具备技术门槛高,开发训练和运营所需的成本巨大等特点,大模型的训练成本要更高,动辄一次训练就能耗光数百万美元。在人工智能领域对于技术研发的费用支出,数额庞大且惊人。2022年在研发费用上投入最大企业是华为,累计投入了1615亿元;其次是腾讯,614亿元;第三是阿里,投入研发费用高达555亿元。另据公开资料显示,百度作为较早入局人工智能的玩家,过去十年,其在AI领域的投入超过1000亿元。不同的是,有了AI1.0科技热潮的教训,AI2.0时代,技术在产业层的落地更快了。聚焦特定领域、针对特定场景、解决特定问题的行业大模型,取代了通用大模型,成为了关注重心。人们普遍意识到走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。当前,已有一些行业大模型在金融、制造、医药研发、煤矿、铁路等诸多领域发挥了作用。
AI大模型的商业化落地,可能还得回到成本核算这件事上。通用大模型的市场需求尚且不高,且已经呈现同质化竞争的趋势。
虽然大模型很火,但本质上还是一场门槛极高的“烧钱游戏”,只有具备雄厚资金实力和强研发能力的头部企业才有望坐上“大模型”的牌桌,而创业公司一味盲目跟风,将容易带来投资浪费,增加能源、算力等消耗,产生低质量产品。将目光放远至全球范围,资本对于AI技术的信心尚未恢复。研究公司PitchBook的数据称,今年前六个月,全球风险投资资金几乎减少了一半,下降48%至1739亿美元,交易数量也下降了19%。在达到热点高度后,这一波人工智能热潮将逐步回归冷静阶段,回归到寻找商业化路径解决方案的商业本质上。当下ChatGPT热度已经开始下降。作为现象级产品,ChatGPT在发布5天后便获得了100万用户,又用了两个月时间用户迈过了1亿大关。今年6月,ChatGPT迎来了自去年11月上线以来的首度流量负增长。根据 SimilarWeb 的数据,今年 6 月 ChatGPT 的网站与移动客户端的全球流量(PV)环比下降了 9.7%,美国地区的流量环比下降了 10.3%。同时,ChatGPT 的独立访客数量(UV)下降了 5.7%,访客在网站上花费的时间也下降了 8.5%。究其原因,C端用户对于大模型的初步应用已经“审美疲劳”了。用户对于ChatGPT的尝试仍处于浅尝辄止的阶段,之回答了一些基本问题,对于其数据分析和编写代码的强大功能并不熟悉。不过,作为史上最成功的To C产品之一,ChatGPT仍占据人工智能市场的主要地位。业内一种普遍观念认为,以大模型为代表的人工智能应用将会触发下一个“互联网”时代的到来,但当前仍处于初期。在大模型发展初期,技术短板和隐私安全问题都是在实际操作过程中频发的隐患。近期,国家互联网信息办公室等7部门日前联合公布《生成式人工智能服务管理暂行办法》,对生成式人工智能产品及服务提供者作出了一定要求和规范,但目前尚缺乏对使用者的有力约束。此外,大模型生成内容的知识产权、数据来源的合法性等问题都亟待解决。回望1998年互联网刚刚兴起之时,也经历了一段混沌发展时期,站在新的转折点,历史总是惊人相似,在百花齐放奇斗艳的AI大模型竞争之中,同样机遇和泡沫并行。