怎么向大模型要生产力,讯飞星火的“三问三答”

原创 Alter聊科技 2024-03-29 20:10

讯飞星火的答案并不复杂,跑通大模型价值释放的产业链条,让大模型不再是美好却空洞的花瓶,而是实实在在的生产力。

撰文张贺飞
编辑沈菲菲


埃弗雷特·罗杰斯在《创新与扩散》中提出过一个著名观点:一种创新在刚起步时接受程度比较低,使用人数较少,扩散过程也就相对迟缓,当使用者比例达到临界值后,创新扩散过程就会快速地增加。


风头正盛的大模型浪潮,再次印证了创新扩散理论的适用性:三年前还只有少数几个科技大厂参与,价值被初步验证的2023年,即上演了“百模大战”的一幕,2024年大概率是大模型落地应用的元年,向千行万业加速扩散。


由此产生的一个问题是:怎么将大模型的能力延伸到产业一线,最适合中国产业结构的路径是什么?


半个多月前的华为中国合作伙伴大会2024上,科大讯飞副总裁刘江参与了“计算峰会”的讨论,围绕大模型落地应用的路线、场景和生态,分享了讯飞星火在过去一年时间里的探索和答案。


 01 

大模型的能力从何而来?


尽管不同统计口径下的数据有所差别,但可以肯定的是,目前国内的大模型数量已经有上百个,用“遍地都是”来形容大模型行业,并不算夸张。问题在于,为什么大模型的数量越来越多,产业应用尚未渡过拐点?


大模型的行业竞争,从来都不是拼数量的游戏,经过一段时间的跟风、躁动后,还是要回到能力上。




2024年1月30日,讯飞星火正式升级到V3.5版本,在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级,其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo的96%,多模态理解达到GPT-4V的91%。


同期发布的星火语音大模型,在中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI的Whisper V3,而在多语种语音合成方面,星火语音大模型的首批40个语种平均MOS分绝对提升了0.25,拟人度超过83%,均达到了国际领先水平。


讯飞星火认知大模型在“百模大战”中脱颖而出的背后,离不开昇腾AI和科大讯飞在算力底座上的联合突破。


时间回到2023年4月,讯飞星火V1.0发布前夕。有别于一些大模型厂商抢时间上线的做法,科大讯飞在同步思考一个长远问题:为了避免被卡脖子,怎么将大模型的能力架构在一个自主创新的体系上?


接下来近一年的时间里,昇腾AI和科大讯飞针对大模型训练进行了一系列技术攻关,包括大模型底层算子库开发和优化、大模型算法迁移、超大规模集群智能化运维软件开发等等。


双方联合开发和优化了50多个大模型算子,其中科大讯飞基于昇腾自主开发自定义的关键算子就超过10个,最终让大模型的训练性能提升了3倍以上,和国外同类产品不相上下。


6个月后的讯飞开发者节上,双方向外界公布了一个新消息:首个支撑万亿参数大模型训练的国产算力平台“飞星一号”正式启用,基于昇腾AI基础软硬件平台和大容量交换机构建参数面无损ROCE组网,配置高空间的全闪和混闪并行文件系统,可以支撑万亿参数大模型高速训练。


解决了大模型的算力底座后,联合创新的势能被进一步释放,先后训练出了讯飞星火V3.5、星火语音大模型、星火开源大模型以及12个行业大模型,为大模型的能力提升注入了源源不断的动力。


 02 

大模型的能力怎么输出?


大模型的能力不能停留在参数上,停留在评测报告中,想要解放生产力,前提是让大模型的能力落到一个个业务场景中。由此产生的关键问题是:大模型的能力怎么输出,怎么降低落地门槛?


经过一年多的摸索后,行业上下游逐渐形成了一种共识,即通过预训练产生通用大模型,再在通用大模型的基础上,使用特定的行业数据精调出行业大模型,然后基于通用大模型或行业大模型来开发应用。


讯飞星火遵循了大模型落地的行业共识。有所不同的是,讯飞星火还提供了一条条通往产业一线的路。


为了满足不同规模不同场景的快速部署需求,讯飞星火在“飞星一号”的基础上,进一步开放了底层算力构建和运维能力、大模型训练平台和工具链,以及数据清洗、数据训练、应用开发等全套工具,让企业可以构建自己的智算底座。


为了满足企业专有大模型的推理应用需求,科大讯飞和华为在2023年8月发布了“星火一体机”,提供底层算力、AI框架、训练算法、推理能力、应用成效等AI能力,让每家企业或机构都能获得“开箱即用”的大模型一体化解决方案。




为了加速企业大模型应用价值的落地,科大讯飞的答案是星火优化套件,包含星火通用大模型、行业大模型优化套件和场景应用优化套件,并未局限在模型和算力层面,而是尝试在配套服务和能力上打通大模型落地的“最后一公里”。


回到创新扩散理论的话题上,创新扩散的过程离不开千千万万的开发者,他们无疑是大模型走进千行万业的“蚂蚁雄兵”。特别是整个行业还处于“摸着石头过河”的阶段时,“独角戏”注定不是可行的方式。


所以,讯飞星火在帮助企业和机构降门槛的同时,不断向开发者抛出橄榄枝,不断拉近开发者和大模型的距离。


比如讯飞星火在昇思社区等平台上开源了13B大模型,并向开发者提供基础模型、精调模型、微调工具、人格定制工具、高质量多语种语料等等,通过给开发者提供全生命周期的服务,让他们把精力聚焦在想要解决的问题上,做最大的投入和努力,而非把时间花在不必要的事务中。


简单做个总结的话,讯飞星火的路线并不复杂:一方面降低大模型的门槛,涵盖训练、推理、部署等环节;另一方面为开发者赋能,让他们参与到大模型落地应用的浪潮中。初衷则是借助合理的分工,跑通大模型价值释放的产业链条,让大模型不再是美好却空洞的花瓶,而是实实在在的生产力。


 03 

大模型落地到哪些场景?


大模型的落地又不能一味求快。很多行业对大模型的态度仍是技术上的新鲜感,势必要有一个价值持续验证的过程,落地到哪些场景,带来什么样的价值,直接影响着外界对新生产力的认知。


就像瓦特在改良蒸汽机后,没有预想中那样迅速在全世界铺开,而是经历了近半个世纪的探索,直到在纺织领域“打败”水能,才让蒸汽机和产业革命挂钩。每一次工业革命的出现,与其说是技术课题,不如说是一个经济课题。


同样的问题也摆在大模型面前,成为新一轮工业革命“引擎”的前提,是产生肉眼可见的经济效益。


科大讯飞在2023年7月打造了一支名为“星火军团”的精锐队伍,被定义为探索大模型价值落地的战略业务组织。历经9个月的稳扎稳打,星火大认知模型带来的生产力变革正在被越来越多的行业认可。




在能源领域,国家能源集团与科大讯飞联手开启了能源行业数字化、智能化转型的新篇章。


在智慧城市领域,湖北省利川市依托讯飞星火认知大模型和昇腾算力,构建了自主创新人工智能公共算力平台,驱动利川数字产业、智慧文旅、康养产业、智慧农业等领域全面发展。


其中利川文旅大模型发布将在今年五一正式上线使用,将从旅游线路规划、旅客需求收集、客流高峰控制等方面,为景区的精细化管理提供科学高效的辅助决策,推动文化和旅游深度融合、一体化发展。


在科研领域,中科院文献情报中心与科大讯飞合作推出的星火科研助手,提供成果调研、论文研读和学术写作三大功能;三亚崖州湾科技城借助科研助手增强科研文献检索和分析能力,并通过科技文献大模型为科研人员提供建议指导,提高了研究效率和质量。


在银行领域,与某国有银行强强联合,实现讯飞星火在客服、展业、办公、研发等场景的赋能,并正在重点打造银行领域的代码能力应用标杆。


在教育领域,谦萃智能利用iFlyCode智能编程助手为教师提供了高效的备课支持,简化课程内容,使学生更易于理解和掌握。在团队协作的项目中,iFlyCode显著减少了所需的人力和时间资源。这些综合效果共同促进了教育资源的优化配置和学习效率的整体提升,得到了师生们的广泛认可。


诸如此类的案例还有很多。需要说明的是,以上只是讯飞星火示范的标志性应用场景,目的是帮助企业探索大模型在B端的商业化之路,让千行万业看见大模型的价值所在。


在讯飞开放平台上,生态开发者团队609.5万,其中大模型直接开发者的数量41万,他们才是点燃大模型落地应用的星星之火,不断将大模型的能力带入到实际工作中,不断拓宽大模型应用的边界。


 04 

写在最后


大模型的产业之路还很长,昇腾AI和讯飞星火的合作,无疑为外界提供了一种值得借鉴的范式:在算力等基础设施上打破大模型训练的瓶颈,为大模型的能力输出开辟出一条条可行的路,然后由开发者们创造无数个解决问题的应用。


有理由相信,沿着这样已经被证实的路径走下去,持续做好应用落地,形成数据飞轮,同时在大模型层面进行可持续迭代和进化,终将会渡过大模型产业应用的“拐点”,带来百倍、千倍的需求,营造出充满生机的大模型产业生态。



往期推荐


01

智能化时代的企业网络,需要“以体验为中心”的建网理念

02

开发者怎么拥抱智能化浪潮?昇腾AI给出了“通关指南”




主理人 | 张贺飞(Alter)


前媒体人、公关,现专职科技自媒体


钛媒体、36kr、创业邦、福布斯中国等专栏作者


转载、商务、开白以及读者交流,请联系个人微信「imhefei」

Alter聊科技 探究产业兴衰,专注商业解读。
评论
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 59浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 63浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 59浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 37浏览
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 175浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 166浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 91浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 57浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 53浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 171浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 61浏览
  • 在快速发展的能源领域,发电厂是发电的支柱,效率和安全性至关重要。在这种背景下,国产数字隔离器已成为现代化和优化发电厂运营的重要组成部分。本文探讨了这些设备在提高性能方面的重要性,同时展示了中国在生产可靠且具有成本效益的数字隔离器方面的进步。什么是数字隔离器?数字隔离器充当屏障,在电气上将系统的不同部分隔离开来,同时允许无缝数据传输。在发电厂中,它们保护敏感的控制电路免受高压尖峰的影响,确保准确的信号处理,并在恶劣条件下保持系统完整性。中国国产数字隔离器经历了重大创新,在许多方面达到甚至超过了全球
    克里雅半导体科技 2025-01-03 16:10 122浏览
  • 车身域是指负责管理和控制汽车车身相关功能的一个功能域,在汽车域控系统中起着至关重要的作用。它涵盖了车门、车窗、车灯、雨刮器等各种与车身相关的功能模块。与汽车电子电气架构升级相一致,车身域发展亦可以划分为三个阶段,功能集成愈加丰富:第一阶段为分布式架构:对应BCM车身控制模块,包含灯光、雨刮、门窗等传统车身控制功能。第二阶段为域集中架构:对应BDC/CEM域控制器,在BCM基础上集成网关、PEPS等。第三阶段为SOA理念下的中央集中架构:VIU/ZCU区域控制器,在BDC/CEM基础上集成VCU、
    北汇信息 2025-01-03 16:01 186浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 68浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦