广告

AlphaGo强到无悬念?柯洁第二战中主动投子认输

2017-05-25 16:20:39 36kr 阅读:
没有奇迹。用时三小时,在今天与 AlphaGo 的第二战中,柯洁中盘因为实地亏空太多,无力回天,在比赛进行到下午1点37分时主动投子认负,前两战均告失利,令众多围棋迷们扼腕叹息。
广告

但毫无疑问,这盘棋不论是在精彩程度还是技术水准上都代表了围棋这项运动的最高峰,非常精彩,甚至在比赛结束前 20 分钟都还有专业人士认为柯洁有获胜的可能性。所以,尽管在结果上没有变化,但柯洁和 AlphaGo 已经携手为我们展示了围棋这项运动的美,不负巅峰对决之称。
20170525-kejie-alphago-2
比赛结果

这也基本意味着,这场三番棋大战以柯洁的认输而告终,不过27号将是柯洁有机会翻盘的最后一战。

在这次比赛中,围棋国手古力、张璇(曾获得过中国冠军)、刘菁、周睿羊担当开局时段的解说员。古力认为,在特别难判断的盘面上,AlphaGo比我们要思考地更加准确,也就是说从一步看未来几十步的“本事”。

从开局来看,柯洁想把时间多用在对布局的策略方面,而且在前十手时打的一直非常不错,盘面很稳,而且被预测赢面很大。柯洁甚至预料到AlphaGo多步棋的下子位置。

而反观AlphaGo,古力认为其开局表现跟人类无异,每一步下的都很平常,甚至很多步都被他预测到。

但是我们需要清楚,在前天进行的第一场比赛时,柯洁的胜率其实也是非常高的,但越往后,AlphaGo的胜率就逐渐慢慢提高了。

比较有意思的是,从一开局柯洁二手点了三三后,AlphaGo又在左下角下了“三三”。这个位置很令人惊讶,因为一般都会下在左上角。而哈克比斯在赛后这样解释:

“对于AlphaGo来说,它根本分不清什么是左上角和右下角,在它眼里这些都一样。”

一开始比赛的赛时没有被拉开,对弈双方的时间差也一直维持在十几分钟左右。但随着战局的推进,柯洁扯头发的次数越来越多(头发越来越乱),面部的表情也越来越焦虑。

最终,让所有人都没有想到的是,开局2个多小时后,局面出现反转,柯洁变得力不从心,然后突然在下午1点37分主动投子认输,AlohaGo在中盘执黑子赢得胜利!随后进行了复盘。

在整个比赛过程中,古力曾着重分析了AlphaGo的厉害之处:

在判断大局的方面真的非常厉害,也就是在所谓的“虚着”(类似于声东击西,在围棋中很多时候都需要声东击西才能摆脱困境或者是翻盘)上更胜一筹。你看那些稀疏的地方我可能真的判断不好。

通俗来讲,就是在棋子比较密布的某一区块上面,我们谁能猜到AlphaGo的落子结果;但在盘面比较虚的地方,例如棋子稀疏的下方(如图),我们根本无法猜到。而AlphaGo就是在这种情况下,不知不觉地积累优势。
20170525-kejie-alphago-4
右上角是密集处。而在下方稀疏的地方,虚着的盘面很难判断

其实,早在AlphaGo与柯洁未开赛前,我们曾经提出一个脑洞大开的问题:AlphaGo会不会故意输给柯洁?

这个命题可以设定为存在两种情况:

• 根据柯洁的现场表现,譬如AlphaGo是否真的可以通过识别他的手速、手部动作、面部表情甚至情绪来决定是否输给柯洁。

• AlphaGo的运算能力已经强大到不仅单纯追求“赢”,而是控制胜率的差距。譬如以微弱的优势打败柯洁,或者以半目之差输给柯洁。

第一个猜测被DeepMind创始人Demis以一个玩笑否认了:

这个建议太好了,看来我们以后也应该为AlphaGo安装一些传感器与摄像头。你要知道,AlphaGo一定是会有弱点的。而柯洁据说也通过分析AlphaGo掌握了一些它的套路,两位选手是势均力敌的。

而第二个猜测,的确是DeepMind持续提升AlphaGo能力的一个方向,但从目前来说,AlphaGo还做不到。

在在昨天的人工智能闭门大会上,DeepMind首席科学家Davis Silver已经非常清晰地解释了这个新一代AlphaGo的过人之处:

第2代“深度强化学习系统”AlphaGo Fan(共4代)共有12层卷积神经网络,而第4代AlphaGo(也就是与柯洁比赛的这一代)通过进行“自我学习”(监督学习与强化学习)已经训练出了40层神经网络(由策略网络与神经网络组成)。

在整个学习过程中,系统要对棋局进行图像扫描,分成无数个小块依次进行处理,最终构成整个全局观。具体来说,它可以近乎准确地判断棋盘上现有的棋子能给周围区域带来多大的影响力。

这个“全局观”,就是AlphaGo与人类最不一样的地方,也是古力在解说时特意强调的AlphaGo具备的一个能力:

策略网络,就是让AlphaGo先自己跟自己比,下个几万场,目的就是要“走对子”,选择最好的一步走,判断哪个策略最有效。

而在这个步骤结束后,继而形成价值网络,用来负责估算胜率。“策略网络”能够对所有落子位置进行概率分布,然后再将这些估算出的信息投入到蒙特卡罗搜索树中,推算出胜率最高的一些算法。

换句话说,就是每走出一步,价值网络就是通过这样的函数来预测未来的输赢,而不是静态地去考虑这步棋。

两者一前一后,就形成了AlphaGo的杀手锏——“在最后结果为‘赢’的前提下,去选择每一步最可行的路径”

这也能解释为何AlphaGo在去年与李世石三番棋的第二局比赛中,狗的第37子被称为“牵一发而动全身”的一步棋。在赛后复盘后,人类棋手才发现这步棋完全决定了后面50步棋的下法。

照这样来看,层数越来越多的神经网络决定了AlphaGo学习的深度正在越来越大,这就相当于AlphaGo不管是在思考每一步策略,还是在判断胜率的精准度上都有了很大的提高。

如果要故意输给柯洁,不仅需要AlphaGo的自我学习能力,还需要获得柯洁这位棋手足够多的数据,因为获得固定的胜率需要他去“揣摩”柯洁的直觉。

从理论上来说,如果AlphaGo能通过自我学习来掌握柯洁足够多的数据,是有可能控制胜率的(几率会更高)。
20170525-kejie-alphago-3
现场

在赛后的发布会上,DeepMind联合创始人兼CEO哈克比斯先生给了柯洁的开局表现一个极高的评价。他认为柯洁与AlphaGo的前15手,甚至在前100手的对弈中几乎是势均力敌的:

在第一盘到达“官子”的时候,AlphaGo让自己获胜的概率达到最大化,因此它要放弃一些点,其主要目的就是赢得比赛。但在这一场中,特别是在前100手,两者的差距非常小。因此,前半段双方赢得比赛的机会都非常大。

而且,这是AlphaGo打了这么多比赛以来,我觉得最势均力敌的一场比赛,柯洁的前半段表现真的十分完美。我发的Twtter也是这个意思,非常敬佩柯洁先生,他真的非常了不起”

柯洁赛后的心情虽然看起来还不错,他认为自己的对决很棒,甚至一度以为自己接近了胜利,能战胜Alphago:

在中途时我以为自己离胜利很接近了,我难道快接近胜利了吗? 因此我才有了按心的动作。因为太紧张,后面又下了一些不好的棋。这一点我觉得有点遗憾。

但我认为自己发挥的挺好,我不认为我布局有什么差的地方。前半段很精彩,只是后半段有一个地方就突然松弛了下来。

我不喜欢安乐死,之后也会好好下,但这场真的很紧张。

柯洁也在最后幽默了一把,他觉得坐在对面的黄博士没什么人类感,就是一个AI机器人:

黄博士在我对面,就像一个AI一样。我想黄博士是看着AlphaGo从小长大的,因为他可能更了解AlphaGo。你们知道我比赛喜欢乱动,挠头发什么的。但黄博士却一动不动,甚至不喝水,不吃东西,真的像个机器人……我还是挺适应黄博士坐在对面的。

而DeepMind首席科学家David则又披露了更多关于新一代AlphaGo版本的技术细节:

“Master版本已经完全脱离了人类的训练,是完全靠自我对弈来实现训练的,它可以进行自我对弈,也弥补了去年与李世石对弈的第4局第67手时犯下的错误(弱点) 他会在不断不断的自我学习中寻找弱点,然后再自动修复这些弱点,因此你才看到了AlphaGo更加优秀的表现。”

对于我们来说,在阿尔法狗又再次猝不及防战胜柯洁后,最关注的还是AlphaGo什么时候能够还能被披露更多细节,哈克比斯透露,随后会有更多关于狗的算法、技术架构通过论文向公众发布。

“我在最后要再次对柯洁表达敬意。而关于alphago的更多技术点,你会在我们此后的论文上看到,现在请让我们为柯洁的这场比赛鼓掌。”

原文链接:http://36kr.com/p/5077223.html

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 2025年全球将启动18个新的晶圆厂项目建设,中国有5个 半导体行业正迎来一个新的建设高峰期,SEMI预测,2025年,全球范围内将有18个新的晶圆厂项目开始建设,其中15座为12英寸晶圆厂,3座为8英寸晶圆厂,大部分预计将于 2026 年至 2027 年开始运营......
  • 传Imagination停止RISC-V处理器核心开发,增强GPU和AI产品投资 尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
  • TCL正式发布“世界上第一款模块化人工智能伴侣机器人” 这款机器人头上的摄像头可以录制视频或使用人工智能识别物体,虽然该机器人的动作仅限于挥动细小的手臂和眨动动画眼睛,但它可以与一把小型电动椅子配对,自动在家中导航。
  • 美国AI出口管制草案被批评:过度监管将把芯片市场拱手让给中国 Ken Glueck认为,美国2800亿美元的芯片法案所取得的成就,将被出口管制框架夺走,“因为在一项IFR中,它成功地将美国公司的全球芯片市场缩小了80%,并将其交给了中国。”
  • 四大合作揭秘新兴AI芯片设计模型 IP供应商、芯片设计服务提供商和AI专家在以AI为中心的设计价值链中的地位正变得更加突出。本文给出了四个设计用例,强调了服务于AI应用的芯片设计模型的重新调整。
  • GeForce RTX 50系显卡发布:三倍于40系GPU的算力 NVIDIA刚才在CES上发布了GeForce RTX 50系显卡,据说这一代的5070就能达到上代4090的性能水平...
  • 为什么翻新机的价格在上涨? • 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
  • 2024三季度全球扫地机器人市场出货 从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
  •  摩尔斯微电子推出MM8108:全球体积 最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
  • 移远通信再扩短距离通信模组版图:Wi 其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了