科大讯飞:星火大模型快进入Next-level了

原创 松果财经 2024-07-05 17:49


自力更生,星火大模型成国产力量代言人

@松果财经原创

作者| 在辉


OpenAI一纸禁令,挑动了大模型行业的神经。但没有什么阻碍,可以抵挡技术向上的决心。在不少大模型厂商开出优惠价格,试图从OpenAI禁令中截流用户的同时,国产大模型的代表企业科大讯飞,拿出了直面技术挑战的勇气。


6月27日,科大讯飞在北京国家会议中心举行讯飞星火4.0发布会。在“懂你的AI助手”这个主题下,讯飞星火大模型不但在8个国际主流测试集中排名第一,实现了对GPT-4 Turbo的全面对标,还对商业化落地、生产力探索做出了更全面的阐释,前瞻了行业的“Next-level”。

         

 

这一次,星火大模型掀起了新的巨浪。

         

 

自力更生

星火大模型成国产力量代言人


在国内外总共覆盖中英文的12项主流测试集,讯飞星火大模型V4.0在其中8项全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。后面这三位,正是目前英文世界大模型的战力天花板选手。


换一个指标,去年,科大讯飞参与设计了国产通用认知智能大模型测评体系,包含由481个测试项组成的7个方面。而如今,星火大模型V4.0在其中的文本生成、语言理解、知识问答、逻辑推理、数学能力五个方面超越了GPT-4 Turbo,仅在代码能力和多模态能力上仍有一定差距。

         

 

不过从数据来看,文本生成(80.2%)、语言理解(82.3%)、知识问答(85.7%)、逻辑推理(82.2%)、数学能力(86.5%)、代码能力(81.2%)、多模态能力(78.4%)这组数据放在一起,星火大模型V4.0总体已然算是国产大模型的能力代表。

         

 

具体来看,GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0,重点都放在多维度信息组成的复杂指令、更考验逻辑任务能力的空间推理等高阶能力上。根据科大讯飞发布会现场的介绍,星火大模型V4.0不仅在长文本等通用能力上整体打平GPT-4 Turbo,而且更加擅长利用已有资料进行联系推理——比如解读几张有联系的图片的关系,为其补全内容情节,并减少“幻觉”的出现。    

         

 

有趣的地方在于,星火大模型V4.0其实在多模态能力方面,实现了对GPT4-Turbo的部分超越,比如科研、金融、医疗、司法和办公等专业领域的图文识别能力。这代表星火大模型V4.0的侧重点明显不同于普通的通用大模型。它更侧重于某些垂直领域的应用潜力。

         

 

对此,科大讯飞董事长刘庆峰在演讲中做了一些阐述:“大模型不仅可以写诗、作画,在改变工业、改变科研范式等方面已经实实在在发挥作用,包括我们和中国科学技术大学做的合成类的科学创新,比如说化学;还有与合肥综合性国家科学中心能源研究院合作,在推进大模型赋能核聚变整个过程中更快地预测、更好地应对各种各样的异常情况。”

         

 

应用,已经成为星火大模型V4.0的重头戏。只有真正用起来,能力才会有价值。

         

 

以讯飞星火APP为例,自2023年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次。现在,全新升级的讯飞星火APP,允许消费者用自己的知识库打造“更懂你的AI助手”。换句话说,专属于个体的智能体。


按照刘庆峰在演讲中透露的信息,讯飞星火APP使用的高峰期是工作日的工作时间段,意味着它真的变成了不少用户的刚需。这是对“AI只能用来玩玩”的刻板印象的有力回击,也是星火大模型价值的体现。    

         

 

但更让人激动的应用,其实还在蓄力。个人能从星火大模型中找到助手,企业乃至社会,将从中汲取更大的力量。这就是整个大模型产业的“Next-level”,它的亮点就在落地的最后一公里,以及那些暂时还是畅想的形式。

         

 

真正的Next-level

藏在最后一公里


几个简单的问题,可以让我们对星火大模型V4.0的未来进化更有数。

         

 

首先,智能体为什么值得期待?九合创投在近日召开的年会上发布了《不朽的计算:比特连接世界,词元生成未来》报告。其中提到,“模型是能够沉淀智慧的计算形态”。传统算法是数学结果,一次使用不具备普及性。但模型可以持续进化,适应多维度的使用需求。而封装为智能体之后的超级模型,已经是特定领域的智慧结晶。它具有不可估量的复用价值。



以星火企业智能体平台为例,科大讯飞已经首批创建了32个企业智能体,可以深入业务流程,满足企业的需求。而这个过程其实非常轻松,企业只需要提出需求就可以开始创建智能体,经过功能验证后,就可以真实上马,并可以和企业内部办公平台打通。    

         

 

从市场价值来看,讯飞星火大模型从去年发布到现在,已经和国家能源集团、中国石油、中国移动、交通银行、大众汽车、海尔集团、美的集团等行业领军企业建立合作,证明其使用价值得到一线认可。

         

 

其次,为什么是讯飞?因为企业智能的底层除了大模型技术,还有对企业业务的理解,对分门别类的场景的认知,这不是坐在办公室里就能拍脑袋想出来的。讯飞建立这些认知,花费了数十年的时间和遍布各行各业的具体尝试。所以,智能体是新物种,但在讯飞和星火大模型的共同支持下,它会很快和现有生态相融。

         

 

换句话说,讯飞的领先,是星火大模型的技术领先和自身To B和To G业务领先的复合结果。2024年6月,讯飞刚刚荣获国家科学技术进步奖一等奖,获奖项目名为“多语种智能语音关键技术及产业化”,技术和产业化的双剑合璧,成为一块勋章。上半场的技术较量,讯飞能和OpenAI掰手腕。下半场的应用较量,讯飞更懂中国市场。

         

 

最后,星火大模型V4.0背后的进化,对智能体概念的探索,远期价值恐怕会远超普通人的想象。目前,还只是这个概念的蓄力阶段。

         

 

一个很关键的问题是,从GPT-4 Turbo到星火大模型V4.0,我们越来越关注大模型的多模态能力、空间和逻辑推理能力、对复杂指令的理解和执行能力等等。这种需求引导下发展的大模型和智能体,注定用于和现实世界融合交互。    

         

 

现代机器人之父罗德尼·布鲁克斯(Rodney Brooks)在1991年发表的《没有表征的智能》论文中提出,传统智能基于复杂算法和内部数据模型是错误和片面的,真正的智能行为要从自主机器与环境的物理交互中产生。这个想法更加适合今天大模型和智能体的发展,或者说“具身智能”的概念——能理解和推理物理世界,并且产生互动。

         

 

“AI教母”李飞飞选择的创业方向就是与之类似的“空间智能”。她曾在TED的演讲上举过一个例子——一张猫伸出爪子将玻璃杯推向桌子边缘的图片。她说,人类大脑可以评估“这个玻璃杯的几何形状,它在三维空间中的位置,它与桌子、猫和所有其他东西的关系”,所有推理都基于这些认知。



无疑,星火大模型V4.0也好,GPT-4 Turbo也罢,都是在朝着这种意义上的智能发展。

         

 

刘庆峰曾提出星火大模型的四条商业化路径,其中一条就是基于“超脑2030计划”推动机器人走进千家万户,重头戏在于全栈机器人能力,而这又源于大模型的多模感知和多维表达。

         

 

    

对科大讯飞来说,好消息是它所掌握的应用经验,很有可能让星火大模型在向空间智能、具身智能的发展过程中步步领先。比如现在,星火个人智能体和企业智能体的落地,其实已经在调动现实要素对大模型和智能体进行完善。只不过,目前的应用停留在数字空间,还没有深入现实进行交互。

         

 

但我们相信,这一天会比想象的更早到来。毕竟,从去年的星火大模型1.0版本到如今的4.0版本,科大讯飞从无到有,创造出世界一流的大模型能力和应用,已然是一个奇迹。

         

 

而在当下这个世界中,地缘层面的割裂已经影响到大模型世界的完整性。当OpenAI发出断供宣言,有星火大模型这样的一线玩家能够顶上,不得不说是中国大模型产业的幸运。在这一年,中国人工智能领域的实力,正在这些领先者身上,闪耀着新的光芒。


本文来源:松果财经(公众号:songguocaijing1)—— 解读财经热点事件,以独特视角带你挖掘新经济时代的商业机会。


关注下面公众号

和我一起探索港股市场的所有秘密


松果财经 解读财经热点事件,以独特的视角带你挖掘新经济时代的商业机会。
评论 (0)
  • 真空容器的材料选择取决于其应用场景(如科研、工业、医疗)、真空等级(低真空、高真空、超高真空)以及环境条件(温度、压力、化学腐蚀等)。以下是常见材料及其优缺点分析:1. 不锈钢(如304、316L)优点:耐腐蚀性强:316L含钼,耐酸碱和高温氧化,适合高真空和腐蚀性环境。高强度:机械性能稳定,可承受高压差和外部冲击。低放气率:经电解抛光或镀镍处理后,表面放气率极低,适合超高真空系统(如粒子加速器、半导体镀膜设备)。易加工:可焊接、铸造,适合复杂结构设计。缺点:重量大:大型容器运输和安装成本高。磁
    锦正茂科技 2025-03-29 10:52 58浏览
  • 一、真空容器的定义与工作原理真空容器是一种能够创造并保持一定真空度的密闭容器。其工作原理通常涉及抽气系统,该系统能够逐渐抽出容器内部的气体分子,从而降低容器内的气压,形成真空环境。在这个过程中,容器的体积并不会因抽气而改变,但容器内的压力会随着气体的抽出而逐渐降低。二、真空容器并非恒压系统真空容器并非一个恒压系统。恒压系统指的是在外部环境变化时,系统内部压力能够保持相对稳定。然而,在真空容器中,随着气体的不断抽出,内部压力会持续降低,直至达到所需的真空度。因此,真空容器内部的压力是变化的,而非恒
    锦正茂科技 2025-03-29 10:23 158浏览
  •        随着智能驾驶向L3级及以上迈进,系统对实时性的要求已逼近极限。例如,自动紧急制动(AEB)需在50毫秒内完成感知、决策到执行的全链路响应,多传感器数据同步误差需小于10微秒。然而,传统基于Linux-RT的方案在混合任务处理中存在天然缺陷——其最大中断延迟高达200微秒,且多任务并发时易引发优先级反转问题。据《2024年智能汽车电子架构白皮书》统计,超60%的车企因实时性不足被迫推迟舱驾一体化项目落地。为旌电子给出的破局之道,是采用R5F(实
    中科领创 2025-03-29 11:55 272浏览
  • 本文介绍瑞芯微RK356X系列复用接口配置的方法,基于触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。复用接口介绍由下图可知,红圈内容当前引脚可配置为SPI0或者PWM0功能。由标准系统固件以及相关系统手册可得,当前接口默认配置为SPI0功能:console:/ # ls dev/spidev0.0dev/spidev0.0再由原理图可知当前GPIO为GPIO0_C3
    Industio_触觉智能 2025-03-28 18:14 175浏览
  • 3月27日,长虹中玖闪光超高剂量率电子射线放射治疗系统(e-Flash)临床试验项目在四川大学华西医院正式启动,标志着该项目正式进入临床试验阶段。这不仅是我国医学技术领域的一项重大突破,更是我国在高端医疗设备研发和应用方面的重要里程碑。e-Flash放射治疗系统适用于哪些病症,治疗周期为多久?会不会产生副作用?治疗费用高不高……随着超高剂量率电子射线放射治疗系统(e-Flash)正式进入临床试验阶段,社会各界对该项目的实施情况尤为关注。对此,中国工程院院士范国滨,以及四川大学华西医院、四川省肿瘤
    华尔街科技眼 2025-03-28 20:26 335浏览
  • 在智能语音交互设备开发中,系统响应速度直接影响用户体验。WT588F系列语音芯片凭借其灵活的架构设计,在响应效率方面表现出色。本文将深入解析该芯片从接收指令到音频输出的全过程,并揭示不同工作模式下的时间性能差异。一、核心处理流程与时序分解1.1 典型指令执行路径指令接收 → 协议解析 → 存储寻址 → 数据读取 → 数模转换 → 音频输出1.2 关键阶段时间分布(典型值)处理阶段PWM模式耗时DAC模式耗时外挂Flash模式耗时指令解析2-3ms2-3ms3-5ms存储寻址1ms1ms5-10m
    广州唯创电子 2025-03-31 09:26 167浏览
  • 本文介绍OpenHarmony5.0 DevEco Studio开发工具安装与配置,鸿蒙北向开发入门必备!鸿蒙北向开发主要侧重于应用层的开发,如APP开发、用户界面设计等,更多地关注用户体验、应用性能优化、上层业务逻辑的实现,需要开发者具备基本的编程知识、对操作系统原理的简单理解,以及一定的UI设计感。由触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,支持开源鸿蒙OpenHarmony3.2至5.0系统,适合鸿蒙开发入门学习。下载与安装开发工具点下面链接下载:
    Industio_触觉智能 2025-03-28 18:16 235浏览
  • Shinco音响拆解 一年一次的面包板社区的拆解活动拉开帷幕了。板友们开始大显身手了,拆解各种闲置的宝贝。把各自的设计原理和拆解的感悟一一向电子爱好者展示。产品使用了什么方案,用了什么芯片,能否有更优的方案等等。不仅让拆解的人员了解和深入探索在其中。还可以让网友们学习电子方面的相关知识。今天我也向各位拆解一个产品--- Shinco音响(如下图)。 当产品连接上电脑的耳机孔和USB孔时,它会发出“开机,音频输入模式”的语音播报,。告诉用户它已经进入音响外放模式。3.5mm耳机扣接收电脑音频信号。
    zhusx123 2025-03-30 15:42 95浏览
  • 真空容器内部并非wan全没有压强,而是压强极低,接近于零。真空状态下的压强与容器内外气体的分子数量、温度以及容器本身的性质有关。一、真空与压强的基本概念真空指的是一个空间内不存在物质或物质极少的状态,通常用于描述容器或系统中气体的稀薄程度。压强则是单位面积上所受正压力的大小,常用于描述气体、液体等流体对容器壁的作用力。二、真空状态下的压强特点在真空状态下,容器内部的气体分子数量极少,因此它们对容器壁的作用力也相应减小。这导致真空容器内部的压强远低于大气压强,甚至接近于零。然而,由于技术限制和物理
    锦正茂科技 2025-03-29 10:16 174浏览
  • 在智能家居领域,无线门铃正朝着高集成度、低功耗、强抗干扰的方向发展。 WTN6040F 和 WT588F02B 两款语音芯片,凭借其 内置EV1527编解码协议 和 免MCU设计 的独特优势,为无线门铃开发提供了革命性解决方案。本文将深入解析这两款芯片的技术特性、应用场景及落地价值。一、无线门铃市场痛点与芯片方案优势1.1 行业核心痛点系统复杂:传统方案需MCU+射频模块+语音芯片组合,BOM成本高功耗瓶颈:待机电流
    广州唯创电子 2025-03-31 09:06 140浏览
  • 文/杜杰编辑/cc孙聪颖‍3月11日,美国总统特朗普,将自费8万美元购买的特斯拉Model S,开进了白宫。特朗普此举,绝非偶然随性,而是有着鲜明的主观意图,处处彰显出一种刻意托举的姿态 。特朗普也毫不讳言,希望他的购买能推动特斯拉的发展。作为全球电动车鼻祖,特斯拉曾凭借创新理念与先进技术,开辟电动汽车新时代,引领行业发展潮流。然而当下,这家行业先驱正深陷困境,面临着前所未有的挑战。就连“钢铁侠”马斯克自己都在采访时表示“非常困难”,的确是需要美国总统伸手拉一把了。马斯克踏入白宫的那一刻,特斯拉
    华尔街科技眼 2025-03-28 20:44 215浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦