2025春节红包行情方向有了!国产大模型DeepSeek横空出世,锋芒比肩ChatGPT

美股研究社 2025-01-27 19:49

 “ 心中有准备,手中有方向。 


来源 | 美股研究社


历史总是惊人的相似。

2022年11月30日,由OpenAI研发ChatGPT一经推出便凭借出色的自然语言处理能力,迅速在社交媒体上走红。短短5天,注册用户数就超过100万,到2023年1月末,其月活用户已突破1亿,成为史上增长最快的消费者应用。

ChatGPT的出现如同一颗重磅炸弹,在全球范围内掀起了AI热潮,股市炒作行情更是此起彼伏。

这一现象级的爆火,引发了各路产业资本、金融资本的高度关注,由此全球范围内掀起了AI热潮,相关概念股的炒作行情更是以年度级别展开。

两年后的2025年1月20日晚间,中国“名不经传”的AI初创企业深度求索公司(DeepSeek)正式发布推理大模型DeepSeek-R1因其可比肩OpenAIo1的性能、极低的服务价格,以及代码和模型架构的完全开源,再次震惊业界。

据报道,深度求索旗下AI智能助手应用DeepSeek已在美区下载榜上超越ChatGPT,并登顶苹果AppStore免费应用榜。

对此现象,AI科技初创公司ScaleAI的创始人亚历山大·王(AlexandrWang)给予了极高评价,称过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。

从量化投资到AI新秀,

DeepSeek两年实现弯道超车


刷屏海外科技界的国产AI黑马DeepSeek,是国内知名量化资管巨头幻方量化创立的大模型公司。

‌DeepSeek团队的核心特点是“年轻高潜”,即大多数成员的年龄在35岁以下,工作时间虽然不长但具有较高的潜力和智能,团队成员大多来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校。‌

其中,‌DeepSeek创始人梁文锋毕业于浙江大学毕业,拥有信息与电子工程学系本科和硕士学位,且也是量化交易公司幻方量化的创始人之一。

基于梁文锋的专科出身,幻方量化的AI历程其实由来已久。2008年起,梁文锋便开始带领团队使用机器学习等技术探索全自动量化交易。

2015年,幻方量化正式成立,隔年便推出了第一个AI模型,并上线执行了第一份由深度学习生成的交易仓位,使用GPU进行计算,期间,幻方量化在量化投资过程中积累了大量数据处理和算法优化经验,同时拥有大量A100芯片,为AI模型训练提供了强大硬件支持。2017年,幻方量化宣称实现投资策略全面AI化,开始大规模布局AI算力,并搭建「萤火一号」「萤火二号」等高性能计算集群,为AI模型训练提供强大算力支持。

投资策略的AI化商业效果也十分喜人。截至2019年,幻方量化资金管理规模就突破百亿元,并在2021年突破千亿大关,跻身国内量化私募领域的“四大天王”之列。

在投资领域证明了AI化的奇效后,2023年,梁文锋宣布将正式进军通用人工智能领域,深度求索DeepSeek也由此创立,初心是要打造专注于做真正人类级别的人工智能。

成立不足一年时间,2024年5月,DeepSeek就发布混合专家语言模型DeepSeek-V2;截至年末,又推出了在知识问答、长文本处理、代码生成和数学能力等关键领域实力尤为突出的的大语言模型DeepSeek-V3。

以MMLU、GPQA等知识类任务为例,DeepSeek-V3表现接近国际顶尖模型Claude-3.5-Sonnet。在数学能力方面,更是在AIME2024和CNMO2024等测试中创造新纪录,超越所有已知的开源和闭源模型。同时,该模型生成速度较上代提升200%,达到60TPS,大为改善了用户体验。

根据独立评测网站ArtificialAnalysis的分析,DeepSeek-V3在多项关键指标上超越了其他开源模型,并在性能上与世界顶尖的闭源模型GPT-4o和Claude-3.5-Sonnet不分伯仲。

更重要的是,优异性能下,该模型训练成本极具颠覆性。据该团队发布的技术报告,包括预训练、上下文长度外推和后训练在内,DeepSeek-V3完整训练只需2.788MH800GPU小时,其DeepSeek-V3仅为557万美元,远低于训练成本高达7800万美元的GPT-4;且其API服务价格亲民,输入tokens每百万仅需0.5元(缓存命中)或2元(缓存未命中),输出tokens每百万仅需8元。

如此高的性价比,DeepSeek-V3当时甚至被硅谷同行誉为“来自东方的神秘力量”,也有将之称为“AI界拼多多”的。《金融时报》将其描述为“震惊国际科技界的黑马”,认为其性能已与资金雄厚的美国竞争对手模型相媲美。Maginative创始人ChrisMcKay更是指出,DeepSeek-V3的成功或将重新定义AI模型开发的既定方法。

这种神秘力量仍未停歇。2025年1月20日,DeepSeek再次发布了性能堪比可OpenAIo1、服务价格却极低,且实现代码和模型架构完全开源的推理大模型DeepSeek-R1,引发全球科技界震惊。至今DeepSeek-R1已经出现多次宕机。截至1月27日11点,据DeepSeek官网显示,DeepSeek网页/API再次不可用。

DeepSeek-R1:

用创新打破AI研发“烧钱”定式


具体来看,目前被认为是DeepSeek-R1能至比肩ChatGPT的两个核心点,其一是DeepSeek-R1独特的技术原理和创新的训练方法;其二则是超乎寻常的低训练成本

首先,兼顾优异性能的极致成本。据网络公开资料,在训练阶段,DeepSeek-R1大规模使用了强化学习技术。强化学习是一种通过智能体与环境进行交互,根据环境反馈的奖励信号来学习最优行为策略的机器学习方法。

通过这种方式,DeepSeek-R1在仅有极少标注数据的情况下,极大地提升了模型的推理能力。与传统的监督学习需要大量标注数据不同,强化学习使得模型能够在更广泛的场景中自主学习和优化,大大提高了模型的适应性和泛化能力。

DeepSeek-R1的推理过程包含大量反思和验证,思维链长度可达数万字。这意味着模型在处理问题时,不再是简单地给出答案,而是能够像人类一样进行深度思考,逐步分析问题,展示出完整的思考过程。例如,在解决数学问题时,它会详细地列出每一步的推理逻辑,而不是直接给出结果,这种特性使得用户能够更好地理解模型的决策依据,增强了模型的可解释性。

在架构方面,DeepSeek团队提出了一种崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时独创的DeepSeek Moesparse结构也把计算量降到极致,最终促成了成本的下降。这不仅使得DeepSeek-R1在运行效率上大幅提升,还降低了硬件成本,为模型的广泛应用提供了有力支持。

近年来,全球AI大模型产业飞速发展,但遵循常规的规模定律(计算规模越大、训练数据量越多,模型越智能),不少企业陷入了一场关于顶尖人才、先进算力和巨额投资的“军备竞赛”。’

众多知名科技企业纷纷大量囤积芯片以确保充足算力。根据Omdia最新报告,英伟达最大买家微软为备战AI科技,曾购买48.5万块英伟达旗舰产品Hopper芯片,为英伟达去年贡献了20%的收入;第二大客户Meta去年也购买了22.4万块GPU;此后是预计分别购买19.6万和16.9万颗Hopper芯片的亚马逊、谷歌。

科技巨头或许有能力支撑这些巨额投入,但绝大多数玩家对这个“无底洞”望而却步。而且,越来越多科学家开始质疑堆数据、堆算力这种“大力出奇迹”的做法,与此同时海外高端芯片的出口管制增添了供给的不确定性。作为初创企业,DeepSeek不得不另辟蹊径。

正如Maginative创始人此前评价DeepSeek-V3的成功或将重新定义AI模型开发的既定方法,DeepSeek-R1再次用事实证明这个观点并非偶然。《金融时报》指出,DeepSeek的成功颠覆了“AI研发必须依赖巨额投入”的传统认知;《经济学人》表示,中国AI技术在成本效益方面的快速突破,已经开始动摇美国的技术优势;《纽约时报》则认为,则认为,DeepSeek-V3在性能上与美国公司的高端聊天机器人相当,但成本大大降低,显示了中国公司在芯片出口管制情况下的创新能力。

相比之下,ChatGPT虽然在自然语言生成方面表现出色,但在推理能力的深度和成本控制上,DeepSeek-R1展现出了独特的优势。

其次,该模型代码和训练方法的完全开源也令一众围观者叹为观止。

英伟达GEARLab项目负责人JimFan评价DeepSeek-R1时表示:“这代表着非美国公司正在践行OpenAI最初的开放使命,通过公开原始算法和学习曲线等方式实现影响力,顺便还内涵了一波OpenAI。DeepSeek-R1不仅开源了一系列模型,还披露了所有训练秘密。它们可能是首个展示RL飞轮重大且持续增长的开源项目。

影响力既可以通过“ASI内部实现”或“草莓计划”等传说般的项目实现,也可以简单地通过公开原始算法和matplotlib学习曲线来达成。”

金沙江创投朱啸虎在朋友圈发文称“DeepSeek是技术理想主义者的胜利”。

押宝A股新年红包行情,

不可不知的DeepSeek概念投资指南


技术理想主义者“胜利”后,在农历2024年A股最后一个交易日中,DeepSeek方向成为一众投资者的押宝对象。

截至1月27日,AI智能体、AI语料等概念在市场中涨幅居前。在DeepSeek概念个股中,每日互动、卓创资讯、美格智能等股价强势涨停,涨幅达到20%,包括华金资本、浙江东方等在内,约有10余只概念个股涨停。

其中,每日互动,华金资本、浙江东方等被传与DeepSeek存在股权关联。

每日互动,作为全国除互联网通信运营商之外最大的智能终端行为数据拥有者,开发者服务SDK累计安装量突破830亿。2024年10月18日,每日互动在与投资者互动时表示接入DeepSeek通用大模型。据券商纪要幻方核心高管曾为公司联合创始人。公司智能营销SaaS产品“数盘”,有望结合Agent和自身SaaS行业数据积累,开发出垂直场景类大模型应用在商业营销和公共服务领域,将"人工智能+"赋能千行百业。

浙江东方,是一家国有上市金控平台,主要涵盖信托、期货、人身险、财富管理、基金管理、基金投资、融资租赁等业务,是浙江省唯一国有信托公司。网传浙江东方间接参股DeepSeek,不过,经工商查询股东列表也无相关公司。

华金资本,实控人为珠海市国资委,是珠海金控旗下唯一控股的上市平台持有华金证券1.45%的股权。目前管理基金数达70只,包括创业基金、早期基金,以及市场化FOF等,在对外投资方面,已投了104家公司,A、B轮以及股权投资是公司的主要投资阶段,先进制造等是华金资本投资最多的领域。网传华金资本通过华金领越基金参与DeepSeekPre-A轮融资(经工商查询股东列表无相关公司)。

其余,合伙伙伴中,幻方量化曾调研过卓创资讯,网传深潜(Deepseek)大模型与卓创资讯在金融语料库方面有合作(未证实)。2025年1月7日互动,公司尚未与深潜深度求索建立业务合作关系。

美格智能,2025年1月26日在官微发文,公司凭借其高算力AI模组矩阵与端侧大模型部署经验,结合AIMO智能体等,正加速开发DeepSeek-R1模型在端侧落地应用及端云结合整体方案,2025年公司将推出单颗模组算力达到100Tops的高阶AI硬件,远期规划AI模组算力超过200TopS。

今日之后,国内春节假期将如期而至,A股中DeepSeek概念的炒作行情也将进入短暂的蛰伏期,但市场对其的关注并不会就此消散,春节期间,相关讨论和资讯大概率会在金融论坛和社交媒体上持续传播。

春节假期结束后,DeepSeek概念究竟是在短暂的冷却后加速发酵,还是因春节期间海外市场的负面表现而意外“炸雷”,成为投资者的“烫手山芋”,一切都充满变数,其难以预判。而投资者能做得则是当机会来临时,心中有准备,手中有方向。

【如需和我们交流可后台回复“进群”加社群】


美股研究社 美股研究社,一个专注研究美股的平台,专业的美股投资人都在这.想了解美国股市行情、美股开户、美股资讯、美股公司;
评论
  • 前篇文章中『服务器散热效能不佳有解吗?』提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。本篇将为您延伸说明我们如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。AI服务器的散热架构三大重点:GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。
    百佳泰测试实验室 2025-01-24 16:58 100浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 224浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 368浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 204浏览
  • 不让汽车专美于前,近年来哈雷(Harley-Davidson)和本田(Honda)等大型重型机车大厂的旗下车款皆已陆续配备车载娱乐系统与语音助理,在路上也有越来越多的普通机车车主开始使用安全帽麦克风,在骑车时透过蓝牙连线执行语音搜寻地点导航、音乐播放控制或免持拨打接听电话等各种「机车语音助理」功能。客户背景与面临的挑战以本次分享的客户个案为例,该客户是一个跨国车用语音软件供货商,过往是与车厂合作开发前装车机为主,且有着多年的「汽车语音助理」产品经验。由于客户这次是首度跨足「机车语音助理」产品,因
    百佳泰测试实验室 2025-01-24 17:00 135浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 201浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 289浏览
  • 随着AI大模型训练和推理对计算能力的需求呈指数级增长,AI数据中心的网络带宽需求大幅提升,推动了高速光模块的发展。光模块作为数据中心和高性能计算系统中的关键器件,主要用于提供高速和大容量的数据传输服务。 光模块提升带宽的方法有两种:1)提高每个通道的比特速率,如直接提升波特率,或者保持波特率不变,使用复杂的调制解调方式(如PAM4);2)增加通道数,如提升并行光纤数量,或采用波分复用(CWDM、LWDM)。按照传输模式,光模块可分为并行和波分两种类型,其中并行方案主要应用在中短距传输场景中成本
    hycsystembella 2025-01-25 17:24 228浏览
  • 项目展示①正面、反面②左侧、右侧项目源码:https://mbb.eet-china.com/download/316656.html前言为什么想到要做这个小玩意呢,作为一个死宅,懒得看手机,但又想要抬头就能看见时间和天气信息,于是就做个这么个小东西,放在示波器上面正好(示波器外壳有个小槽,刚好可以卡住)功能主要有,获取国家气象局的天气信息,还有实时的温湿度,主控采用ESP32,所以后续还可以开放更多奇奇怪怪的功能,比如油价信息、股票信息之类的,反正能联网可操作性就大多了原理图、PCB、面板设计
    小恶魔owo 2025-01-25 22:09 299浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 1112浏览
  • 书接上回:【2022年终总结】阳光总在风雨后,启航2023-面包板社区  https://mbb.eet-china.com/blog/468701-438244.html 总结2019,松山湖有个欧洲小镇-面包板社区  https://mbb.eet-china.com/blog/468701-413397.html        2025年该是总结下2024年的喜怒哀乐,有个好的开始,才能更好的面对2025年即将
    liweicheng 2025-01-24 23:18 216浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦