大模型的效率腾飞,彩云科技做对了什么?

原创 脑极体 2024-11-15 15:30



对于绝大多数AI创业者来说,AGI的技术信仰是月亮,商业化能赚到钱的应用则是六便士,而一家中国公司,却将月亮和六便士都握在了手中。


彩云科技的CEO袁行远,一直将AGI作为自己的终生目标。大模型被认为是通往AGI之路,所以彩云科技决心为这条AGI之路扫清阻碍,通过优化Transformer架构,助力大模型效率提升,为此开发出DCFormer全新通用模型架构。


敢于啃最难啃的骨头,让彩云科技与许多只敢停留在应用层的AI公司,形成了鲜明对比。



这并不意味着彩云科技全是一群离群索居、不食人间烟火的极客。他们也打造了AI时代的爆款应用,如彩云小梦、彩云小译和彩云天气。其中2021 年上线的彩云小梦1.0,是全球领先的 AIRPG 平台,同时发布了海外版Dreamily,目前已经吸引了60%中国大陆用户、30%欧美用户、10%东南亚用户,在平台上进行AI写作。


可以看到,彩云科技的AI商业化表现也很出色,是国内为数不多能够实现盈利的AI公司。


只追求月亮会饿死,只追求商业化会活得庸俗。在AI的理想与现实之间,彩云科技究竟是如何找到平衡点的?



AGI通用人工智能,被认为是人工智能领域的圣杯。而大模型,是目前通往AGI的必由之路。2023年大模型技术火爆全球,但技术进化才刚刚开始。比如大模型的核心技术突破——Transformer架构,就有一系列问题有待解决。


想摘下AGI的圣杯,AI行业必须先跨越Transformer架构的瓶颈:


1.效率瓶颈。大模型在并行计算过程中需要频繁重写检查点(checkpoint),延长了训练周期。增强Transformer架构的计算效率,可以大幅缩减计算时间,提升大模型的开发效率。


2.能源瓶颈。大模型参数规模迈向超万亿,会消耗巨额电力资源,有新闻报道,一个十万亿或五十万亿参数的大模型就能用光一座小城市的所有电量。为了减少耗电量和能源负担,提升大模型的计算效率,缩短计算时间,已经刻不容缓。


3.普及瓶颈。一味追求scale-up的大模型技术,对算力、存储、传输、运维等各个资源的需求也直线上升,会带来高昂的落地成本和部署难度。AI的广泛应用和普及,才能推动各行各业智能化,所以大模型必须从追求“变大”到“变聪明”,底层Transformer架构的优化势在必行。



正如袁行远所说,“没有(计算)效率的提升,AI就是镜花水月”。


为了有一天人类能真正将AGI这枚月亮抱在怀里,彩云科技从一开始就瞄准了底层架构,主动担起了优化Transformer架构的技术挑战,也成为在这一领域率先取得显著成果的中国公司。



2024年5 月,彩云科技全新大模型论文《Improving Transformers with Dynamically Composable Multi-Head Attention》发布在arXiv平台,并顺利被AI顶会ICML2024收录,论文评分高达7分,远高于今年平均分。同时受邀在今年7月登台发表演讲,成为9473篇论文中唯二斩获Oral论文的中国企业,另一家是华为。



大家想必都很好奇,论文中发布的DCFormer架构到底有什么过人之处?


我们可以把大模型训练,看作是一个大型复杂任务,需要很多个打工人(注意力头),背着自己的参数集和数据在干活。


而Transformer的核心组件——多头注意力模块(MHA),将查找选择回路和变换回路给绑定在一块儿了,交给同一个注意力头。试想一下,当一个打工人既得关注查找,又得关注变换,专注性就会受到损害,而且完成的工作大概率也跟别人有重复,这就降低了整个组织的效率。


那更合理的办法是什么呢?当然就是多雇些人、专事专办呗。让不同的“注意力头”关注不同方面,一群专业的人灵活协作,干的活效率更高,质量也更好。


所以DCFormer框架,就是给注意力头“减负”,来提高大模型的效率。


彩云科技提出的可动态组合的多头注意力(DCMHA),解除了MHA注意力头的查找选择回路和变换回路的固定绑定,让它们可以根据输入动态组合。这就为DCFormer框架带来了几个变化:


1.灵活性提高。由于DCMHA允许根据输入动态组合不同的查找和变换回路,让应用了DCFormer的模型,能够更灵活地处理复杂任务。


2.表达能力提高。MHA的固定绑定导致模型无法充分捕捉输入数据的多个不同特性,表达能力也受到影响。DCMHA从根本上提升了模型的表达能力。



3.效率提高。查找和变换被固定绑定,会导致不同的注意力头学习到相似的信息,造成功能上的重复冗余,不仅降低了计算效率,还会浪费计算资源。通过可动态组合的多头注意力(DCMHA)解绑之后,DCFormer框架实现了对Transformer架构1.7—2倍的提升,也可以让模型成本进一步下降。


总结一下,DCFormer框架从底层改变了注意力头的组合方式。如果说打破Transformer计算瓶颈,加速AGI进程,是彩云科技的逐月之旅。那么DCFormer框架,就是彩云科技为梦想所打造的一座天梯,让大模型在上面实现了效率、性能、成本优化等多方面的飞跃。


沿着DCFormer的天梯望过去,一个大模型为核心的AI时代,好像离我们真的不远了。



避免这一轮大模型的AI浪潮走向泡沫,必须让技术致用,形成商业闭环。赚到六便士,是AI获得长期生命力的前提。


从技术到商业的转化,彩云科技同样敢为人先。目前,彩云科技的AI应用已经获得了在DCFormer架构的一系列助益,有望实现商业腾飞。


比如既有能力的大幅升级。作为国内首个分钟级天气预报,街道级定位精度的天气预报服务,彩云天气基于DCFormer带来的模型效率提升,有望在未来将分钟级的高准确率预测时长从2小时扩展到3—12小时,能力进一步提升。



再比如全新能力的拓展。彩云科技旗下AI RPG平台彩云小梦,采用了全新的DCFormer架构,V4、V5版本有望扩展到2000-5000字的创作,再通过故事工程优化,目标是一年内可以轻松创作出达到专业作家水平的5万字长度中篇故事,同时小梦角色扮演的故事体验,也能达到专业编剧的水平。凭借优异的性能,彩云小梦在小说续写、AI陪伴等领域,已经实现了用户使用时长断崖式的领先。



不难看到,DCFormer架构为彩云科技的AI产品化、AI商业化,奠定了腾飞的基础条件。也证明,唯有基于底层技术创新,AI产品才能避免同质化竞争,打造出极具说服力和差异化的产品体验,从而建立碾压式的市场优势。



大模型爆火以来,国外做底层创新、国内做应用改良,似乎成了惯例。


中国AI企业不敢向底层创新下大力气,更希望低头捡起六便士,并不是不愿意抬头追逐月亮,而是技术代际的现实差距、算力资源受限的实际情况、商业回报的约束和压力,都是切实存在的。


而提到那些敢于逐月的AI公司,我们第一时间想到的是国内科技巨头,很少人知道彩云科技是国内最早做LLM(大语言模型)的公司之一,而且敢于追逐AGI的梦想,向底层技术发起冲锋。


既能仰头逐月,也能低头搞好商业化,彩云科技可以作为一个国内AI公司找到技术和商业平衡点的成功样本。



彩云科技区别于主流AI公司的独特之处,在于其是个少见的“三有少年”:


有信仰。作为一个体量较小的科技公司,彩云科技利用效率更高的模型架构,在与世界顶级人工智能企业的对抗中取得优势。如果没有AGI的技术信仰,一个小公司是想不到、不敢做优化Transformer架构这件事的。


有技术产品化的能力。Transformer架构由谷歌率先提出,却被OpenAI摘了桃子,ChatGPT成为这一轮LLM里程碑,这得益于chatbot聊天机器人功能的产品化程度更高,更贴近大众。彩云科技的成功也在于此,并没有单纯地只发paper,而是尽快将DCFormer与产品集成,让技术尽快转化为产品落地。这种技术产品化的能力,可以让底层创新快速投向市场,形成良性循环。


有长坡厚雪的环境。创新,需要长期耐心地投入;产品化,需要深入行业和用户之中的经验和感觉。这就是巴菲特所说的“长坡厚雪”,要有足够强的盈利和长期增长的赛道。这是很多AI初创企业所缺乏,但彩云科技恰好具备的。十年间,彩云科技打造的数款足够成熟和商业化的AI产品,为技术创新营造了长坡厚雪的良好环境。


“三有少年”彩云科技,找到了理想与现实之间的平衡点,正沿着DCFormer架构的天梯,朝着AGI的月亮飞翔。这条彩云逐月之路,也让我们看到了AI产品化、商业化的清晰增长路径。



·

·

脑极体 从技术协同到产业革命,从智能密钥到已知尽头
评论
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 41浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 390浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 121浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 100浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 150浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 183浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 73浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 49浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 111浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 164浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦