DeepMind的团队成功以强化学习让AI系统绘出人脸画像,这是一种创造力吗?机器也要来抢艺术家们的饭碗了?

在9月底于英国伦敦举行的深度学习高峰会(Deep Learning Summit)上,DeepMind (EETT编按:该公司现隶属于Google母公司Alphabet)的研究科学家Ali Eslami介绍了一个非常有趣的项目,名为“人工智能与创造力”(Artificial Intelligence and Creativity)。

Eslami在DeepMind的团队设置了一个AI代理(agent,一个会采取某种行动的神经网络),以绘制人脸作为挑战,在一台计算机安装绘图程序(Mypaint),让它能试验各种变量,例如选择笔刷、放置(placement)、线压(line pressure)以及颜色等。该AI代理被馈入未标记的人脸照片训练数据集,而结果是令人惊讶的逼真。

以未标记人脸照片训练的AI代理所绘制出的人脸。

(来源:DeepMind)

Eslami的团队是利用了强化学习(reinforcement learning)技术。今日大多数的AI系统是采用监督式学习(supervised learning),所馈入的数据是以某种方式标记过的,因此系统能将结果与标准答案进行比对;相反的,非监督式学习则是馈入未标记的训练数据,让系统尝试以自己的方式去辨别特征。

强化学习就是某种形式的非监督式学习,在训练过程中,有被称为鉴别器(discriminator)的第二个AI代理对结果提供回馈,好让负责创造的AI代理去学习。在产生影像的情境中,该鉴别器可能会比较产出的影像与训练数据,然后针对是否能辨别出差异提供回馈,这种回馈可能是一种分数,以量化辨别所产生影像与训练数据集之间差异的困难程度。

强化学习采用两个AI代理,其一负责创造影像,另一个则尝试分辨创造出的影像与实际数据之间像不像。

20191015-101.jpg

(来源:DeepMind)

在DeepMind教导其AI系统如何画图之前,他们已经教过该系统如何写字──去年该AI系统一开始接受的训练是各种英文字母的手写字与字体的影像(采用MNIST与Omniglot数据集),而且系统非常成功地重现了那些字母。

DeepMind团队还很惊讶地发现,若限制笔划数,所产出的结果就很像是人类在匆忙中写出的字迹,点与较小的特征会连在一起;该公司团队还将算法与拿着画笔的机器手臂联机,以产生手写书法。

一旦该AI系统能应付手写字,Eslami的团队就让系统升级以应用更大的网络,并采用更多CPU进行训练。当采用人脸照片做为训练数据集,AI系统绘制出的画像会变得越来越逼真,如下图所示的绘画过程各个阶段。

AI系统绘制人脸画像的过程。

20191015-102.jpg

(来源:DeepMind)

请注意,该AI系统并没有被提供目标影像,只是创造它认为看起来像人脸的画像,而且计算机并没有看过人类是如何绘图,只是藉由强化学习的尝试错误过程去探索关于绘画的一切。Eslami表示,这里实际上有两个复杂的任务,其一是以高精准度控制笔刷,其二是管理时间, 在过程中权衡其画像结果要看起来有多逼真。

接下来该团队所做的事情是自问:如果我们让任务变得更困难呢?于是他们将笔划的数量限制从1,000减少到20,而让他们惊讶的是,该AI代理仍然能产生虽然更抽象、但看得出是人脸的画像。

不同超参数(hyperparameters)下的不同AI代理所绘制的人脸“抽象画”样本。

20191015-103.jpg

(来源:DeepMind)

而Eslami表示,那些抽象画最让人震惊的是,该AI代理已经能清楚辨识构成人脸特征的重点──即眼睛、鼻子与嘴巴;他们原本认为AI系统只能透过模仿或是以监督式学习被教导这些抽象画,但强化学习确实也可能达成。

所以AI已经成功学会画图了..但这是一种创造力吗?或者只是随机结果?还有这能算是艺术吗?你可能会争辩,AI代理是利用创造力去尝试以不同的方法呈现人脸,如上面图片中的画像,即使它们看起来都像人脸,其中的差异性还是比相似性更多。

不过事实是,AI系统的意图并不在于将人脸抽象到绘画的最基本元素中,也不是要产生能唤起情感反应的画像,其目标是在于写实,是以画像看起来有多么逼真来评判其成功与否。

此外也会有人争议,AI系统绘制的画像是以高水平的技巧完成,所以这代表AI是有成就的艺术家了吗?当训练过程结束,该系统肯定能产出更好的画像,甚至学着从模糊的笔触开始,在最后添加更犀利的线条;可惜的是,今日对于何为艺术并没有严格的定义,也许这个问题的答案应该由观众们来决定。

编译:Judith Cheng   责编:Yvonne Geng

(参考原文: Can an AI Learn to Draw?,by Sally Ward-Foxton)

 

您可能感兴趣
2024 年,中国人工智能专业在校生约 4 万多人,而整个领域的人才缺口却高达 500 万……
从品牌战略的角度来看,华为本次选择古代神话中的人物作为商标,可能是为了借助这些神话角色的知名度和文化内涵,打造具有中国特色的品牌形象……
随着全球数字化转型市场蓬勃发展,云计算、人工智能、大数据、5G等技术的应用范围不断扩大,全球企业的数字化转型已经来到了持续发展阶段,这也促使了企业不断加大其在数字化转型的投入。其中 AI、机器视觉和 RFID 等先进技术在实现高效生产物流方面发挥着关键作用。
荣耀新任CEO李健首次公开亮相即宣布投入100亿美元布局AI终端生态,并推动Magic系列提供7年系统更新......
假设 GPU 租赁成本为 2 美元 / 小时,经计算,DeepSeek 每日总成本约为 87072 美元。若按照 DeepSeek R1 的定价计算所有 tokens 的收入,理论上一天的总收入可达……
“物理智能(Physical AI)”,黄仁勋在CES 2025上发表主题演讲时提出的新概念。他指出,即将全面到来的“Physical AI”时代,将是在1000万工厂、20万仓库、15亿汽车和卡车及海量人形机器人之上应用的下一波万亿规模市场驱动力。
TEL宣布自2025年3月1日起,现任TEL中国区地区总部——东电电子(上海)有限公司高级执行副总经理赤池昌二正式升任为集团副总裁,同时兼任东电电子(上海)有限公司总裁和东电光电半导体设备(昆山)有限公司总裁。
预计在2025年,以下七大关键趋势将塑造物联网的格局。
领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCON China 2025一展全看,速登记!
本次股东大会将采取线上和线下相结合的混合形式召开,股东们可选择现场出席或线上参会。
Mar. 5, 2025 产业洞察根据TrendForce集邦咨询最新研究,TSMC(台积电)近日宣布提高在美国的先进半导体制造投资,总金额达1650亿美元,若新增的三座厂区扩产进度顺利,预计最快20
2月17日,“南京江宁开发区”发文透露,阳光电源在南京新建的光伏储能项目已经全面开工建设,总投资达到10亿元。加入光储充交流群,请加微信:hangjiashuo888据报道,阳光电源南京研发中心项目是
国际电子商情讯,昨日(3月3日)晚间,TCL科技发布公告称,拟以115.62亿元收购深圳市华星光电半导体显示技术有限公司(以下简称深圳华星半导体)21.5311%股权。A股市场又一起百亿并购2025年
差分运算放大电路,对共模信号得到有效抑制,而只对差分信号进行放大,因而得到广泛的应用。差分电路的电路构型    上图是差分电路。    目标处理电压:是采集处理电压,比如在系统中像母线电压的采集处理,
从上表可知,2024年前三季度全球40强PCB企业总营收约416.7亿美元,同比增长7.6%。其中,营收排名第一位的是臻鼎科技(36.05亿美元),排名第2~5位的分别是欣兴电子(26.85亿美元)、
先问大家一个问题:你有多久没看电视了?对老局来说,最近这几年除了春晚和国庆阅兵,其他情况下,基本已经不会看电视了。当然了,连着PS5打游戏那是另外一回事。不过,虽然我们不怎么看电视了,但电视的市场却并
在储能行业蓬勃发展的浪潮中,安富利凭借卓越的技术实力与广泛的市场影响力,荣获2025“北极星杯”储能影响力BMS/EMS供应商奖。这一荣誉不仅是对安富利过往成就的高度认可,更是对其在储能领域持续创新与
在数字化飞速发展的当下,海量数据不断涌现。传统云计算模式下,数据传输到远程云端处理,产生延迟、带宽压力,难以满足实时性和隐私需求。为应对挑战,边缘计算应运而生,将部分计算任务下沉到网络边缘,降低延迟、
高通又放大招了!3月3日,也就是MWC世界移动通信大会的第一天,高通正式宣布,推出自家的最新5G调制解调器及射频解决方案——高通X85。高通X85对于高通X85的发布,行业早有关注。因为高通的手机So
文|金融街老李奇瑞终于正式向港交所递交上市申请了。其实,支持奇瑞汽车实现IPO,此前就已经被安徽省列在了汽车产业2025年重点工作的第38条,但正如奇瑞汽车一贯的低调作风,此次赴香港上市,奇瑞在资本市