关于GPT-4的产品化狂想

原创 脑极体 2023-03-25 18:14


如今打开互联网一看,会看到铺天盖地的“GPT-4好厉害”“太牛了”“科技革命到来了”“人类都要失业了”……


但这么伟大的变革到底是怎么到来呢?答案好像比较含糊。只有ChatGPT基础的问答、代写能力,以及微软已经开始做的搜索、办公是目前比较清楚的大语言模型落地方案。如果仅仅有这些东西,似乎也还达不到科技革命的效果。


为什么会这样?


答案在于,任何技术想要最终发挥效应,都要经历一个“技术-产品-经济效益”的三阶段发展。这其中,产品化是承上启下不可或缺的一步,很多优秀的技术就是因为无法产品化,最终只能停留在特殊或小众领域,也有很多变革并不需要明确的技术指向,仅仅是因为产品出色,就可以引发变革。就像iPhone集成了很多新技术,但本身是产品创新。


在如今这个节骨眼上,每个人都能感觉到GPT蕴藏的变革能量。但我们对他如何产品化还知之甚少,能看见的应用方案,主要还是以API的形式完成,更多属于极客和开发者。



那么,这轮AI热潮下,到底有可能产生哪些“杀手级”产品呢?我们以GPT-4的一些关键特性作为线索,来和大家分享几个大语言模型的产品可能性。


先别提颠覆世界,那太虚,也别仅仅盯着已有的技术能力,那又太实。只有中程的产品化阶段,才是绝大多数人在这轮AI爆发中的机会所在。


信息时代3.0,主线是“命令”


信息时代有两条颠扑不破的主线:信息获取与个人娱乐。搜索、信息流、门户网站、直播、短视频等,这些互联网产品样态都离不开信息获取效率的升级,以及个人娱乐体验的加强。GPT-4代表的大语言模型,可以在短时间内生成大量内容,甚至生成PPT、网站、视频,这些传统意义上AIGC难以做到的内容。


这个能力推演下去,最大的产品价值在于,大语言模型带来人与信息交互方式的彻底改变。


英伟达 GTC 2023 大会上,黄仁勋说:“生成式 AI 就是一种新型的计算机,我们可以用人类语言进行编程,任何人都可以命令计算机来解决问题。”


“命令”这个词非常关键。当GPT-4以及未来更多大语言模型成为产品基底,用户与信息产品、娱乐产品之间的互动方式,最大可能性就是命令。


在信息1.0时代,你的需求可以被查询到,这是搜索机制,代表产品就是搜索引擎。


信息2.0时代,你的需求可以被迎合,这是推荐机制,代表产品是信息流和短视频。


当AI能力进一步提升,你的需求可以被短时间内订制且满足,GPT-4乃至5、6、7带来的新机制,就是命令机制。


在这个阶段,信息不是已经成型,然后根据用户需求进行查找,而是信息本身不存在,当用户发出指令后再进行AIGC。比如说,我在搜索引擎时代,想要写一篇关于芯片的文章,就需要依靠关键词、关键信息去搜索、查询各种数据报告,需要用户有耐心和信息查找能力。而在信息流时代,AI推荐机制会根据我查找、浏览了芯片相关信息,自动推送相关内容,这些内容有的有益,有的没用,需要用户来辨别。



当“命令”成为主要的信息交互方式,我可以直接命令AI找到近期关于芯片的所有数据,并生成一份专属报告给我。如果不满意,我还可以命令它修改。


如果说,这种命令式信息收集,改变的生产、学习效率,以及信息获取方式。那么类似技术驱动的AI生成视频则可以极大改变娱乐模式。今天我们会觉得很多短视频的模式化、快餐化,简直像AI做的,未来这个担心或许就没有了,因为视频就是AI做的。


电影解说、明星八卦、劲歌热舞,AIGC未来将会随时订制大量视频内容,里面的电影信息是GPT抓取的,明星八卦是AI搜罗的,跳舞的男孩女孩形象都是AI生成的,不用再去寻找内容,不用再让AI推荐,也不需要大量短视频创作者、UP主费时费力制作剪辑,只需要一个命令,轻轻松松几个小时的娱乐时间就打发掉了。


如果说,信息时代1.0是人找信息,2.0是信息找人,那么AIGC带来的信息3.0时代,就是谁也不用找谁,AI自己可以生成。


这个产品化机会的核心是继搜索引擎、信息流之后,打造“命令引擎”这种新的产品形态。我猜“阿拉丁神灯”应该是个好名字。



游戏NPC正盯着你


GPT-4发布的那个晚上,我看到群里很多开发者都在讨论,而第一条蹦出来关于GPT-4应用的消息,是有人说可以把他放在游戏里当NPC。


让NPC使用大语言模型作为底座,来跟玩家进行内容丰富、高自由度的多轮对话,应该是一件很容易想到的事情,但这位朋友说的却不是这个意思。


GPT-4的一个关键创新特性,是让AI来识别图片,并且理解图片中的细节、内涵等,比如可以理解一张搞笑梗图中的幽默点到底在哪。


这种能力如果用到游戏里,将赋予游戏和游戏NPC一个前所未有的能力:看见玩家。


从电子游戏诞生之日起,玩家要做的就是去看到、听到一个虚拟世界,并沉浸其中。这个过程中,玩家要尽可能脱离自己周遭的现实,游戏感始终是单向的。虽然AR游戏、体感游戏的出现,一定程度上改变了这种情况,让玩家的体态、运动、力量以及游玩环境进入到游戏当中,但游戏本身对玩家是缺乏理解的。


如果让GPT-4成为游戏NPC,或者作为游戏本身机制的一部分,那或许我们距离游戏能够理解玩家,并做出对应反应已经不远了。你在观察游戏NPC的时候,他们可能也在观察着你,尝试理解你的表情、你的体态,解读你在游戏中的困惑、激动,或者卡关之后想摔手柄的暴怒。



如果这种机制被放置在一些游戏大师手中,最终作品一定是震撼人心的。事实上,AI生成关卡、环境,完成自动渲染等技术,已经极大改变了游戏开发,而GPT-4与游戏的深度融合,未来也是极大概率事件。


这种融合在两个领域最有可能性,一个是强调互动的AR、VR游戏,另一个是注重NPC自由互动的开放世界与多结局角色扮演游戏。


除了游戏之外,“看懂”这个能力还可以被用到数字人,甚至机器人身上。也可以带来相当有分量的产品机会。


“一嘴通办”


说了toC的,让我们再聊聊toB。今天很多人都知道一个词,叫做“一网通办”。就是说在政务系统中打通各个部门的信息系统界限,从而避免办事人要在不同部门之间来回奔波,产生办不完的手续、盖不完的章、跑不完的路。



在全球很多地方,一网通办都是城市服务、政务、金融、财税等领域的数字化核心发展方向,在中国的东部沿海地区和一线城市,“一网通办”也正在高速发展。


但是“一网通办”这种模式,其实依旧有痛点存在:


一是“通办”仅仅是数据打通了,但办理逻辑和办理方式依旧与之前无异,用户该不会的还是不会,该卡住的还是卡住,可能需要花费大量时间在反复询问、填写材料、咨询上。


另一个是“一网通办”的效率高度依赖操作人员能力。由于操作人员精力和专业能力有限,必然不了解各个业务领域,因此一旦出现复杂的情况,就会出现操作员虽然能处理,但不知道如何处理的问题,需要层层请示领导或者跨部门沟通,这样反而降低了效率。


大语言模型与这些领域的融合,必然能够解决一些问题。办事人可以直接咨询AI,了解复杂的部门、业务之间的内在逻辑、办事方法,从而尽量一次性完成办事需求;而操作人员也可以依靠AI来获取跨部门的操作方法、操作样例,从而能够完成较复杂情况的高效率处理。最关键的是,类似能力可以更多用AI替代人工。


这种依靠大语言模型知识抓取、逻辑分析能力的服务平台,可以把“一网通办”升级成“一嘴通办”,办事人说清楚诉求就全面搞定。当然这个名字纯属开玩笑,但城市服务的核心,一定要从“网”转变为“人”,这一点是毫无疑问的,也是大模型时代的toB产品核心机遇。


类似的能力,最具有落地需求的就是政务与金融方面,这两个领域涉及事项多、专业性强,并且与民众需求紧密相连,从更远一点考虑,可能也包括财税、法律、医疗。GPT代表的大语言模型,可以打破公众服务的边界,让AI连接起专业知识与用户需求。


集成了咨询、数据汇总、事项办理、文书认证等功能的新型AI服务平台,将是接下来toB市场AI技术的核心机遇。



超级无代码开发


移动互联网创业热潮的时候,经常有人开玩笑说,“我创意、机会、方法论都有了,距离拿到融资就差一个程序员”。


这当然是一个笑谈,但笑着笑着我们可能会发现,连那个程序员都不差了。


ChatGPT让人惊艳的一点,就在于代码的自动生成和修改。其实很多程序员朋友都说,类似AI模型的能力还主要是辅助工作,根本代替不了一个懂业务、懂产品逻辑与实现方式的程序员。



但复杂的开发可能做不了,简单的难道不行吗?GPT-4发布时演示的创新点之一,就是让模型根据需求自动生成一个网站,虽然生成结果比较粗糙,但已经实现了基本的开发需求。


在云计算与软件业,低代码开发,甚至无代码开发是近两年流行的热门概念。核心逻辑是利用代码库,将已有开发样例进行快速复写,但GPT-4的逻辑显然更加先进,他甚至不需要用户懂架构,而是直接根据需求生成开发程序。


这种能力,在短时间内生成复杂的软件应用或许不行,但对于很多没有编程与开发能力的人来说,通过AI来获取一个小程序、一个电商平台、一个简单的APP还是非常有意义的。


用一些模板搭配GPT-4,可以形成“超级无代码”的产品形式。用户只需要下达需求并支付费用,就可以获得属于自己的软件应用,整个开发过程中的人工成本趋近于0。


为人提供这种AI主导,模板+微调的软件开发,或许也将变成一个全新风口。其实想想,现在随手就能拉个群聊,这在早期的互联网聊天室时代简直难以想象,那么未来人手几个APP,一堆网站,一群数字人,可能也不是什么难事。


从预训练大模型崛起,再到今天的ChatGPT、GPT-4,最值得关注的是智能涌现效应驱动下,一些作为信息化常识的东西被改变了。换句话说,GPT-4是条件,而不是结果。


只有运用好这些新条件,得出新方法,创造新产品的人才能获得AI时代最好的结果。


有人会担心,这么大的变化之下,我的工作、生活会不会被颠覆?


其实吧,这种焦虑什么时候都有,但从没有真正变成灾难。


1999年,朴树有首歌叫做《New Day》,里面有句歌词是这么写的,“快来吧奔腾电脑,就让它们代替我来思考”。


20多年过去了,人类还在思考,奔腾电脑在哪里?


脑极体 从技术协同到产业革命,从智能密钥到已知尽头
评论
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 115浏览
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 43浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 98浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 66浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 80浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 52浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 152浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 82浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 105浏览
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 43浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 33浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 40浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦