红杉资本:关于AI的一份访谈报告

作者 | Michelle Fradin & Lauren Reeder

来源 | Sequoiacap

导语:所有被访企业都认为AI的发展速度太快,难以跟上节奏。

ChatGPT通过大型语言模型(Large Language Models)引发了创新浪潮,越来越多的公司将自然语言交互的能力应用到他们的产品中。

语言模型API的采用正在形成一种新的技术风潮。为了更好地了解人们正在构建的应用和所使用的技术栈,我们与红杉网络中的33家公司进行了访谈,包括种子阶段的初创企业和大型上市企业。

我们在两个月前和上周进行了访谈,以捕捉到变化的速度。

由于许多创始人和开发者自己还在摸索他们的人工智能战略,我们希望分享我们的发现,即使这个领域正在快速发展。


红杉网络中的几乎每家公司都在将语言模型集成到他们的产品中


我们已经看到了许多神奇的自动完成功能,涵盖了从代码(Sourcegraph、Warp、Github)到数据科学(Hex)的各个领域。我们还看到了更好的聊天机器人,用于客户支持、员工支持和消费者娱乐等方面。

其他一些公司则通过以人工智能为核心来重新构想整个工作流程,如视觉艺术(Midjourney)、营销(Hubspot、Attentive、Drift、Jasper、Copy、Writer)、销售(Gong)、联系中心(Cresta)、法律(Ironclad、Harvey)、会计(Pilot)、生产力(Notion)、数据工程(dbt)、搜索(Glean、Neeva)、杂货购物(Instacart)、消费者支付(Klarna)和旅行规划(Airbnb)。这只是一小部分示例,这仅仅只是开始。


应用程序的新技术栈以语言模型API、检索和编排为中心,
但开源模型的使用也在增长


65%的公司已经将应用程序投入生产,相比两个月前的50%有所增加,其余的公司仍在进行实验。


94%的公司正在使用基础模型API。在我们的样本中,OpenAI的GPT是明显的首选,占比为91%,然而Anthropic的兴趣在过去的一个季度增长到了15%(有些公司使用多个模型)。


88%的公司认为检索机制,比如向量数据库,将仍然是他们技术栈的关键部分。为模型提供相关上下文以进行推理有助于提高结果的质量,减少“幻觉”(不准确性)并解决数据新鲜度问题。一些公司使用定制的向量数据库(Pinecone、Weaviate、Chroma、Qdrant、Milvus等),而其他公司使用pgvector或AWS的解决方案。


38%的公司对像LangChain这样的LLM编排和应用开发框架很感兴趣。有些公司在原型设计中使用它,而其他公司在生产中使用它。在过去几个月里,采用率有所增加。


不到10%的公司正在寻找监控LLM输出、成本或性能以及A/B测试提示的工具。我们认为随着更多大公司和受监管行业采用语言模型,这些领域的兴趣可能会增加。


少数公司正在研究补充性的生成技术,例如结合生成文本和语音。我们也相信这是一个令人兴奋的增长领域。


15%的公司从头开始或使用开源工具构建定制语言模型,通常是在使用LLM API。几个月前,定制模型训练的需求有所增加。这需要自己的计算、搭建模型库、托管、训练框架、实验跟踪等技术栈,其中包括一些备受喜爱的公司,如Hugging Face、Replicate、Foundry、Tecton、Weights & Biases、PyTorch、Scale等。


我们与每位从业者交谈时都说AI的发展速度太快,无法对最终技术栈有很高的信心,但他们一致认为LLM API将继续是一个关键支柱,其次是检索机制和LangChain类似的开发框架。开源和定制模型训练和调整似乎也在增长。其他领域的技术栈也很重要,但还处于早期阶段。




根据其独特的上下文定制语言模型


通用的语言模型很强大,但对于许多用例来说,并不具备差异化或足够的能力。很多公司希望能够在其数据上实现自然语言交互,例如开发者文档、产品库存、人力资源或IT规则等。在某些情况下,这些公司还希望根据用户的数据进行模型定制,比如个人笔记、设计布局、数据指标或代码库。


目前,有三种主要的定制语言模型的方法(有关更深入的技术解释,请参阅Andrej在Microsoft Build上的最新GPT现状演讲):


1)从头开始训练一个定制模型,这也是最困难的方法。


这是解决这个问题的经典和最困难的方式。通常需要高技能的机器学习科学家、大量相关数据、训练基础设施和计算资源。这也是为什么在历史上大部分自然语言处理创新发生在大型科技公司内部的主要原因之一。


BloombergGPT是一个很好的例子,它是一个在大型科技公司之外进行定制模型工作的努力,使用了Hugging Face和其他开源工具资源。随着开源工具的改进和更多公司对LLM进行创新,我们预计会看到更多定制模型和预训练模型的使用。


2)微调基础模型,难度适中。


这是通过使用专有数据或领域特定数据进行额外训练来更新预训练模型的权重。开源创新也使这种方法变得越来越可行,但它通常仍需要一个精通的团队。


一些从业者私下承认,微调比听起来要困难得多,并且可能会产生意想不到的后果,比如模型漂移和在没有预告的情况下“破坏”模型的其他技能。虽然这种方法更有可能变得更普遍,但目前对于大多数公司来说仍然不可行。但同样,这一切正在迅速改变中。


3)使用预训练模型并检索相关上下文,难度最低。


人们通常认为他们希望为自己进行微调的模型,实际上他们只是希望在合适的时候让模型对其信息进行推理。有许多方法可以在适当的时间为模型提供正确的信息:


向SQL数据库进行结构化查询、在产品目录中进行搜索、调用一些外部API或使用嵌入式检索。嵌入式检索的好处是可以使用自然语言轻松搜索非结构化数据。


从技术上讲,这是通过将数据转化为嵌入式向量、将其存储在向量数据库中,在查询发生时搜索这些嵌入式向量以获得最相关的上下文,并将其提供给模型来实现的。


这种方法有助于突破模型的有限上下文窗口,成本更低,解决了数据新鲜度的问题(例如,ChatGPT不了解20219月之后的世界),并且可以由单独的开发人员在没有正式机器学习训练的情况下完成。向量数据库在高规模情况下非常有用,它们使存储、搜索和更新嵌入式向量变得更加容易。


到目前为止,我们观察到较大的公司仍在使用他们的企业云协议内的工具,并使用他们云服务提供商的工具,而初创公司倾向于使用专门构建的向量数据库。


然而,这个领域变化非常快速。上下文窗口正在增长(刚刚发布的消息,OpenAI将扩展到16K,而Anthropic推出了10万个令牌的上下文窗口)。基础模型和云数据库可能会直接嵌入检索功能到其服务中。我们将密切关注这个市场的发展。



LLM API的技术栈与定制模型训练的技术栈可能感觉有些分离,
但随着时间的推移,它们会趋于融合


有时候我们会感觉存在两个技术栈:利用LLM API的技术栈(更多是闭源的,面向开发人员)与训练定制语言模型的技术栈(更多是开源的,历史上面向更复杂的机器学习团队)。一些人纳闷,LLM通过API的可用性是否意味着公司会减少自己的定制训练。到目前为止,我们看到的情况恰恰相反。


随着对AI的兴趣增加和开源开发的加速,许多公司对训练和微调自己的模型越来越感兴趣。我们认为LLM API和定制模型的技术栈将随着时间的推移越来越融合。例如,一家公司可能从开源中训练自己的语言模型,但通过向量数据库进行检索来解决数据新鲜度的问题。为定制模型技术栈构建工具的智能初创公司也在努力扩展其产品,使其与LLM API的革命更相关。



技术栈变得越来越适合开发人员使用


语言模型API将强大的现成模型交到了普通开发人员手中,而不仅仅是机器学习团队。现在,使用语言模型的人群已经显著扩大到所有开发人员,我们相信会看到更多面向开发人员的工具。


例如,LangChain通过抽象常见的问题,帮助开发人员构建LLM应用程序:将模型组合成更高级的系统,将多个模型调用链接在一起,将模型与工具和数据源连接起来,构建可以操作这些工具的代理,并通过简化切换语言模型,帮助避免供应商锁定。有些人在原型设计中使用LangChain,而其他人则继续在生产环境中使用它。



语言模型需要在输出质量、数据隐私和安全性方面变得更可信,
以实现全面采用


在将LLM完全应用于他们的应用程序之前,许多公司希望有更好的工具来处理数据隐私、隔离、安全性、版权以及监控模型输出。从金融科技到医疗保健的受监管行业的公司尤其关注这一点。报告称很难找到解决这个问题的软件解决方案(这是创业者的一个潜在领域)。


理想情况下,会有软件来警告(如果不是阻止)模型生成错误/幻觉、歧视性内容、危险内容或其他问题。


一些公司还担心与模型共享的数据被用于训练:例如,很少有人了解到ChatGPT Consumer数据默认用于训练,而ChatGPT Business和API数据则不用于训练。随着政策的明确和更多的监管措施的出台,语言模型将获得更多信任,并且我们可能会看到采用率的另一个重大变化。



语言模型应用将越来越多元化


很多公司已经找到了将多个生成模型结合起来产生巨大效果的有趣方法:结合文本和语音生成的聊天机器人可以实现全新的对话体验。文本和语音模型可以结合使用,帮助您快速修正视频录制中的错误,而无需重新录制整个视频。


模型本身也越来越多元化。我们可以想象未来丰富的消费者和企业AI应用将结合文本、语音/音频和图像/视频生成,以创建更具吸引力的用户体验并完成更复杂的任务。



目前仍处于早期阶段


人工智能正逐渐渗透到技术的方方面面。只有65%的受访公司目前处于生产阶段,而且其中许多应用相对简单。随着越来越多的公司推出LLM应用,新的障碍将出现,为创业者创造更多机会。


未来几年基础设施层将继续快速发展。如果我们看到的演示中只有一半进入生产阶段,我们将迎来一个令人兴奋的未来。看到从最早期的Arc投资到Zoom的创始人们都专注于同一件事情——用人工智能来让用户满意,这真是令人激动。



加入阿尔法工场投资者交流社群 | 添加微信:dlfxs2


阿尔法工场研究院 阿尔法工场旗下研究院.定期发布覆盖A股、美股、港股的上市公司研究报告.
评论
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 321浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 13浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 159浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 145浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 134浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 194浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 611浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 666浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 178浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 74浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 123浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦