DeepSeek 是国内一家极具雄心的AI公司,凭借其开源的大型语言模型(LLMs),尤其是旗舰产品 DeepSeek-R1,迅速崭露头角。DeepSeek 由梁文峰于 2023 年创立,由对冲基金 High-Flyer 全资资助,它已成为全球人工智能领域的变革力量,向 OpenAI 和谷歌等行业主导者发起挑战,同时为 21 世纪的人工智能发展赋予了全新的愿景。
DeepSeek 的起源可以追溯到 2016 年 2 月联合创立 High-Flyer 对冲基金的梁文峰。梁文峰在人工智能交易算法领域的经验,对塑造 DeepSeek 的发展愿景发挥了关键作用。在花费数年时间开发用于量化交易的人工智能技术后,High-Flyer 开始涉足人工智能研究领域,最终促成了 DeepSeek 在 2023 年 5 月的成立。与传统公司不同,DeepSeek 从创立之初就专注于人工智能研究,而非追求即刻商业化,这使得它从一开始就将成本效益和开源可及性放在重要位置。
DeepSeek 的人工智能模型借助大量硬件设备进行训练,其中包括英伟达 A100 GPU,数量估计在 1 万到 5 万个之间。这种强大的硬件配置对于开发 DeepSeek-R1 模型至关重要。DeepSeek-R1 能与 GPT-4 等顶尖人工智能模型相媲美,但其成本却只是这些模型的一小部分。尽管美国对向我国出口英伟达芯片实施了制裁,DeepSeek 还是成功利用这些芯片构建了一个高效且强大的人工智能模型,在地缘政治局势紧张的大背景下实现了技术突破。
DeepSeek 的突出特点之一便是其极为出色的成本效益。DeepSeek-R1 的开发成本仅仅是竞争模型的极小一部分,据估计,其开发成本仅为600万美元,而OpenAI构建GPT-4的成本则高达1亿美元。这种经济实惠的开发模式成为了DeepSeek的一大决定性特征,使得该公司能够以大众可承受的价格提供强大的人工智能功能。不仅如此,DeepSeek模型的运营成本也低得多,其消耗的计算能力仅约为同类大语言模型(LLMs)的十分之一,这进一步增强了它在成本效益方面的吸引力。
这种低成本的模式让DeepSeek在维持盈利的同时,还能够将节省下来的成本回馈给最终用户。通过以低于竞争对手的价格提供服务(许多竞争对手的人工智能模型都处于亏损状态),DeepSeek在全球人工智能行业中留下了深刻的印记,迫使竞争对手不得不重新审视并评估自身的业务战略。
DeepSeek与传统人工智能公司最根本的区别或许在于它的开源策略。像ChatGPT和Google Gemini这类专有模型,对底层代码的访问是受限的,而DeepSeek却将其生成式人工智能算法及训练细节进行开源。这种开放性使得世界各地的开发人员能够自由地对代码进行修改、补充和拓展,进而构建起一个充满活力的协作与创新生态系统。
DeepSeek通过免费提供代码,营造了一种持续改进、全球协作的文化氛围。来自不同地区、不同学科领域的开发人员都能够为其人工智能模型的发展和优化贡献力量。该公司的开源战略旨在实现人工智能访问的民主化,确保这项技术不被少数实力强大的企业所垄断,而是让任何有能力参与其中的人都能使用。
2025年1月,DeepSeek做出了一个大胆之举,发布了适用于iOS和Android系统的DeepSeek-R1人工智能聊天机器人应用程序。仅仅过了短短几周,DeepSeek-R1就超越了ChatGPT,一跃成为美国iOS应用商店中下载量最高的免费应用。这一快速增长的态势彰显了DeepSeek的竞争实力,众多行业分析师认为,其成功得益于实惠的价格和先进的技术。截至2025年1月27日,这款应用程序的出现致使英伟达的股价暴跌18%,可见DeepSeek的成功所带来的影响已开始在整个人工智能行业蔓延开来。
DeepSeek战胜OpenAI和谷歌等老牌人工智能巨头,这一事件被视作全球人工智能领域“太空竞赛”的开端,意味着我国公司正加速发力,挑战美国在这一关键领域的主导地位。DeepSeek采用免费使用的模式,这进一步增强了它的吸引力,因为它打破了通常限制用户访问其他人工智能系统高级功能的付费壁垒。
DeepSeek的崛起堪称我国谋求技术独立进程中的一个重要里程碑。DeepSeek开发出了能够与美国公司相媲美的尖端人工智能系统,并且在开发过程中不依赖西方技术,这为我国减少对外国科技公司的依赖,尤其是在人工智能和半导体领域的依赖,做出了积极贡献。这一举措与我国持续推动开发可在全球舞台上参与竞争的本土技术的目标高度契合,DeepSeek也因此被视为我国技术发展进程中的关键参与者。
此外,DeepSeek的开发团队全部由我国人组成,这与许多硅谷人工智能公司的团队构成有所不同,那些公司的团队成员往往来自不同国家。DeepSeek通过依靠国内人才进行研发工作,这是留住本土人才、遏制人才流失的关键一步。长期以来,顶尖研究人员常常离开本土前往美国或欧洲寻求发展机会,而DeepSeek的这种模式对改变这种局面有着重要意义。
DeepSeek的成功已然开始打破人工智能领域原有的竞争格局。2024年5月,DeepSeek-V2发布后,这家公司在我国人工智能市场掀起了一场价格战。字节跳动、腾讯、百度和阿里巴巴等竞争企业为了跟上DeepSeek激进的定价策略,被迫降低自家模型的价格。尽管DeepSeek的定价较低,但它依然能够实现盈利,而其竞争对手却在努力维持收支平衡。
DeepSeek在人工智能行业的影响力并不仅体现在定价方面,它还因其包容性的招聘做法而广受赞誉。该公司的招聘重点关注技术能力,而非过往工作经验。因此,DeepSeek从我国顶尖大学招募了许多年轻的人工智能研究人员,同时也吸纳了不少非技术背景的人才,这极大地拓宽了公司的业务能力范围。
DeepSeek这种极具战略性的招聘方式,还助力公司开发出了多样化的模型。这些模型在众多任务中都有出色的表现,甚至涵盖了一些在人工智能研究领域以往较少涉及的领域,比如诗歌创作以及针对高考相关内容的应用。DeepSeek对人才和知识多元化的重视,让其模型能够适应各种领域和应用场景,这也进一步使其在一众竞争对手中脱颖而出。
DeepSeek的崛起,标志着全球人工智能格局发生了巨大转变。这家公司的成功,彰显出我国在人工智能领域的影响力正日益增强,有力地挑战了美国科技巨头在该领域的主导地位,开创了全球人工智能竞争的崭新时代。随着DeepSeek持续创新、不断颠覆行业传统,全世界都在密切关注着这种开源且经济高效的人工智能发展模式将如何进一步演进。
DeepSeek凭借其创新的模型、亲民的价格以及对全球合作的坚定承诺,极有可能持续屹立于人工智能革命的前沿,在未来数年里,它很可能成为塑造技术发展未来走向的关键力量。