2023年,以大模型为代表的生成式AI,应该是科技领域最火热的概念了。
在2023世界人工智能大会上,各大科技巨头以及AI创新型企业均在展示大模型能力,比如展示聊天、写诗、作画能力;编程、建模能力。
6月13日,日本东京都知事小池百合子也宣布,东京都所有的政府部门都将引入以ChatGPT为代表的生成式AI,该计划将于8月起全面施行。
7月27日,据日本经济新闻消息,微软已与日本政府签署了一项协议,并向后者提供 ChatGPT技术。ChatGPT技术将为日本数字机构提供文书分析及处理、准备会议记录、提供对议会质询的答复草案、分析政府统计相关数据等功能。
然而,人工智能技术已经发展多年,甚至数年前AlphaGo还打败了人类围棋大师。不过,这一风潮仅风靡一时,随后人工智能似乎突然沉寂下来。那么,为何以ChatGPT为代表的大模型就能把人工智能带火,甚至被认为是进入人工智能新的阶段?
相比AlphaGo,ChatGPT是更大的突破
实际上,如果我们把ChatGPT和AlphaGo类比一下,就能得到答案。人工智能就像人类的一样,需要一个漫长的成长过程。在这个过程中,人工智能需要不断的学习(AI训练),而ChatGPT在一定程度上可以说已经拥有接近成年人的通识水平,并且具有一定的逻辑推理和常识理解能力。
而AlphaGo只是一个人工智能围棋机器人,理论上可以在相对较短的时间内学会下围棋。ChatGPT所具有的知识和逻辑,则需要比学习下围棋更长的时间。这也是为什么AlphaGo会先出现,以及打败人类围棋冠军的重要原因。
从这个层面来看,ChatGPT模拟人类学习的意义更大,但并不意味着AlphaGo就没有意义。毕竟AlphaGo并不是一个普通的AI机器人,其之所以能击败围棋世界冠军柯洁而名声大噪,背后依靠的主要是强大算力。
不过,相对而言,围棋虽是比较复杂的棋类,但其仍然是有规则的,可以通过大量的数据学习,就能飞速提升棋艺。AlphaGo这种AI机器人更像是在规则之下,通过大量数据不停地强化和迭代的过程,而ChatGPT处理的是人类自然语言,相对更复杂。
也就是说,AlphaGo在围棋上的底层数据结构更简单直白。而ChatGPT对应的是人类自然语言数据,存在的形式更为复杂、多样和多变。这也就从另一个层面印证了ChatGPT是AI领域更大的突破。
生成式AI应用风口不仅在C端
不过,ChatGPT 和AlphaGo下围棋,谁会赢?虽然两者不是同一个时代的产物,但是如果不对ChatGPT作任何调校,就和AlphaGo下围棋,然后通过语言描述的方式告诉ChatGPT来响应下棋,那么结果必然是ChatGPT会输。
从这个角度,我们可以把AlphaGO理解成“杀手”,把ChatGPT理解成“学者”。而下围棋则是AlphaGo所擅长的领域。
因此,两者有相似之处,比如均是深度强化学习后的产物,但AlphaGo不是生成式,而ChatGPT是生成式。AlphaGo则可以理解为决策式AI。
从技术路径来看,决策式AI的主要工作是对已有数据“打标签”,对不同类别的数据做区别,最简单的例子如区分猫和狗、草莓和苹果等,干的主要是“判断是不是”和“区分是这个还是那个”的活儿。生成式AI不一样,它会在归纳分析已有数据后,再“创作”出新内容,如在看了很多狗的图片后,生成式AI会再创作出一只新的狗的图片,实现“举一反三”。
从成熟程度看,决策式AI的应用更为成熟,已在互联网、零售、金融、制造等行业展开应用,极大地提升了企业的工作效率。而生成式AI的“年岁更小”,2014年至今发展迅猛,堪称指数级的爆发,已在文本和图片生成等应用内落地。
从应用方向来看,决策式AI在人脸识别、推荐系统、风控系统、机器人、自动驾驶中都已经有成熟的应用,非常贴合日常生活。生成式AI则在内容创作、人机交互、产品设计等领域展现出巨大潜力。
7月7日,华为发布盘古大模型3.0,强调在细分场景的落地应用,主要解决商业环境中低成本大规模定制的问题,目前已经在100多个行业场景完成验证 图源:华为官网
当然,生成式AI除了TO C端的应用优势之外,其在产业应用上也具有很大发展潜力,比如AI结合大模型用于解决具体的科学、生产、生活问题,也是实实在在的新风口。未来,生成式AI可能会在C919的气动设计、气象预报、矿山管理、自动驾驶等方向得到广泛应用。
距离实现真正的AGI有多远?
2023年,被称为是通用人工智能(Artificial General Intelligence,AGI)的元年。而通用图像生成技术和通用NLP(chatGPT)的横空出世,使得通用AI有了更明确的方向。那么,距离实现真正的AGI,还需要跨越哪些门槛?
AGI是指一种能够像人类一样解决任意领域问题的智能系统。AGI具有人类的智慧、自主决策和学习能力,能够执行多种任务,包括语音识别、自然语言处理、视觉识别等等。与狭义人工智能不同,AGI不仅可以处理特定类型的任务,而且适用于任意各种问题和任务。AGI可以像人类一样从经验中学习,能够自我改进,并且具备对世界的理解和推理能力,能够解决人类面临的各种复杂问题。
《生成式人工智能》作者、美国俄亥俄州立大学人工智能专业博士、美国PayPal全球数据科学平台创始负责人丁磊认为,要真正实现AGI必须满足以下几大方面的条件:
一是跨模态感知。我们将平时接触到的每个信息来源域称为一个模态,这些来源可以是文字、声音、图像、味觉、触觉等等。人类天然具有跨模态感知能力,能够对来自多种感官的信息进行整合和理解。而当前绝大部分的人工智能系统只能单独运用其中的一项作为传感器来感知世界,对于不同模态,需要设计不同的专有模型。
二是多任务协作。比如,我们给机器人发一条指令,让它帮忙拿一杯茶,它就会进行指令的理解、任务的分解、路线规划、识别物体等一系列动作,现在像ChatGPT这种大模型还不具备多任务协作能力。因此,多任务协作是AGI最重要的研究方向之一,旨在让“通用性”体现为不仅能够同时完成多种任务,还能够快速适应与其训练情况不同的新任务。
三是自我学习和适应。人类具有学习和适应能力,能够通过不断的学习和经验积累来提高自己的能力。因此,研究如何让人工智能系统具有自我学习和适应能力也是实现 AGI 的必要步骤。其中主要包括增量学习、迁移学习和领域自适应三个方向。
四是情感理解。能够理解并表达情感是人类最重要的特征,它在交流协作中甚至常常影响事件的下一步走向。当前,不少生成式对话系统的工作尚且将关注点集中在提升生成语句的语言质量,忽略了对人类情感的理解。
五是超级计算能力。实现AGI需要庞大的计算资源和超级计算能力。为了提升这一能力,人们从不同角度出发,采取多种方法不断推进就像一辆汽车,人们不断升级油箱的容量、提高燃料的效率,以实现更远的行程。
因此,相对于AGI,我们可以把ChatGPT理解为是一个“儿童”,而AGI就是一个“成年人”。值得一提的是,特斯拉CEO马斯克最近表示,人工智能通用智能(AGI)将在2029年问世!