此前,围棋世界冠军柯洁和中国象棋特级大师、北京队主教练张强均向21世纪经济报道记者表示,软件现已颠覆了棋类运动的部分理念和规律,终有一天人工智能的棋艺会天下无敌。
本报记者 陆宇 倪雨晴 北京、广州报道
3月15日,人机大战五盘结束,谷歌的AlphaGo以4:1战胜李世石。至此,人工智能已在围棋、国际象棋、中国象棋三项智力竞技体育中,实现了对人类顶尖高手的全面胜利。
在战胜李世石后,DEEPMIND研发工程师拉里亚·哈德塞尔开始把目光转向柯洁,他在社交软件脸书上表示:“柯洁,准备好了吗?”
而据21世纪经济报道记者得悉,在看到脸书上的非正式挑战后,柯洁的经纪人庄文回应称,还没有接到谷歌方面的正式邀请。“如果接到邀请,柯洁将会欣然应战,此前在解说李世石棋局时,柯洁就多次表明了态度。”
此前,围棋世界冠军柯洁和中国象棋特级大师、北京队主教练张强均向21世纪经济报道记者表示,软件现已颠覆了棋类运动的部分理念和规律,终有一天人工智能的棋艺会天下无敌。
张强预测:“计算机将加速棋类运动的灭亡,甚至降低人类的创造性和毅力。”然而,当下的计算机并非完美,从对弈棋局来看,目前系统仍存在计算错误、欠缺灵活性、规律总结能力较差等弱点。
人脑对垒电脑
李世石逐步揣摩AlphaGO“心思”的5场对战,也是大众了解人工智能的过程。在最后一盘厮杀中,尽管李世石采用了与前四局不同的招数,然而“神之一手”并没有出现,AlphaGO最终获胜,其技术实力和“棋感”有目共睹。
根据专家的公开分析,AlphaGO的成功来源于深度学习技术和蒙特卡洛树算法的结合。蒙特卡洛树搜索算法是特别适合棋类游戏的算法。而对于盘面组合数极大的围棋,还需要深度学习这一新技术,深度学习本质是指人工神经网络,包括决定落子的“策略网络”,评估局面胜算的“价值网络”。相比以往的穷举法,是飞跃性的进展。
深度学习则是谷歌引以为豪的技术创新。日本函馆未来大学教授、人工智能学会会长松原仁在接受21世纪经济报道记者采访时表示,AlphaGO在围棋领域超越人类,是人工智能很大的突破。围棋获胜虽然没有改变世界,但是这显示了在其他领域超越人类的可能性。他说道,“此次比赛中,谷歌开发的强大性能的电脑功不可没。”
在不少业内人士看来,AlphaGO是通过深度学习得来的“机器棋感”来和人类的抽象推理进行角力的。
浙江大学人工智能研究院院长吴飞教授告诉21世纪经济报道记者:“在第四盘比赛中,李世石把旗子摆到了中盘,引向中盘,复杂度比较高。阿尔法狗近身鏖战能力强,某个棋子在中空地带,可能出现棋子的步骤成千上万,计算就失误了,可能是算法里没有考虑这个情景。BUG是人没有教阿尔法狗这个特定的棋局,‘神来之笔’则是人的一种动物性。”
可以说,如今备受关注的棋局终结,外界对于人工智能虽然强大,但也并非没有弱点已达成共识。
就在第四盘战胜AlphaGo后,李世石曾在记者会上表示:“今天自己下出意外的招式时,AlphaGo出现了某种形式的漏洞(BUG),对于意外招式的应对能力较为欠缺。”
谷歌DeepMind首席执行官丹米斯-哈撒比斯(Demis Hassabis)也通过社交平台承认,李世石翻盘是因为击中了机器人的BUG,下出白78手后,AlphaGo自我感觉良好,在程序的“值网络”(用于评估电脑胜率)中,误以为胜率达到70%,但直到第87步才反应过来。
即使在AlphaGo获胜的前两局中,也并非完美。“前两盘机器在布局上有一些小问题,但由于李世石后面犯了错误,才把优势拱手相让了。”柯洁对本报表示。
围棋如此,在中国象棋和国际象棋人机大战中,计算机也没能达到步步精确。中国象棋人机大战早在2006年就举行过,但未受到高度关注。当年超级计算机天梭浪潮与中国五位特级大师对弈,最终以3胜5和2负取得胜利。
亲自上阵的张强取得1胜1和的战绩,他告诉21世纪经济报道:“计算机有软手、失误和计算不到位的情况,开局时我就略略占优。即使发展到现在,也会存在BUG,不会步步精准。”此外,1997年深蓝虽战胜国际象棋棋王卡斯帕罗夫,但也是仅以3.5比2.5获胜,其中也存在计算失误情况。
而在另一方面,AlphaGo等人工智能的缺陷还表现在欠缺灵活性和针对性。
哈撒比斯表示:“我们向它输入网络上的对弈棋谱,使其逐渐学会下围棋的通用范式,并未输入李九段的对弈棋谱,也没有进行针对性训练。”
截至目前,在“三棋”中尚无证据证明,计算机可以针对某一对手的特殊风格做出调整,以取得更优结果。而这在实际对弈中却极为常见,如对手善于平稳中取胜,则应将局面引入混乱搏杀,反之亦然。
究其原因,是因为针对性出招可以使机器缩短获胜时间并节省计算量,最重要的是有助于降低BUG的出现率,这显然会使机器变得更加聪明。“现实中备战,棋手一定会研究对手,力图走出让对手别扭的棋。”柯洁直言。
而最后一个值得商榷的是,计算机的规律总结能力能否超越人类。
“人工智能真是太了不起了,它每天都可以学习几万盘棋,这个数量是人类一生都无法企及的数量。”柯洁表示。然而,这一可怕的优势恰恰反映出机器总结规律的能力暂时弱于人类。张强指出:“与机器相比,人类在少量记忆、训练的情况下就能找到规律,从而达到很高的水平。但机器却需要输入远多于人类记忆极限的盘数才能具备相应水平。”
降低创造性致棋类消亡?
现如今,象棋人工智能软件主要包括天机、名手、旋风等。而早在AlphaGo登台亮相之前的数年,象棋选手就已普遍使用类似人工智能帮助提高棋艺。
张强告诉21世纪经济报道:“以前出一个高手需要5-10年培养期,现在只要三四年了。对棋类而言,人工智能或许弊大于利。由于很多神秘面纱陆续被计算机解密,这虽可以加速象棋的发展速度,但等到全部解密之后,象棋、围棋就成了五子棋、跳棋那样无趣了。”
在与机器进行棋类游戏的过程中,人们常常失去斗棋的乐趣,主要存在两方面原因。一方面,机器下棋都存在“固化”思维,面对同样的局势,机器总是在同一处落子。松原仁认为,AlphaGO也不例外,在多次的对战中很有可能试出机器弱点从而取胜,“在交手过程中棋手会继续学习,但是AlphaGO并不会。”
另一方面,尽管谷歌声称AlphaGO拥有“大局观”,但是对于“以退为进”、“乱中取胜”等人类的棋类技巧以及团队作战时的配合协调方面,目前AlphaGO尚未实现。对此松原仁指出,AlphaGO理解力上存在缺点,它会做出选择,但是不能表达出确切的逻辑关系和理由。
扼杀创造力之辩还体现在另一方面。目前,受到人工智能的影响,象棋的训练方法已发生了巨大改变。张强解释称:“曾经是由棋手创造性地开发出新的招法,现在变成电脑给出答案了。谁用电脑的时间长、方法得当,谁的水平就增长得快,这伤害了人类的创造性和意志品质。”
类似的情况其实在AlphaGo与李世石的第二盘中就有所体现出来。
据柯洁回忆称:“双方交锋第二盘的第37手,机器下出了人类从没有走过的招法,开始很惊讶,但后来仔细想想,这步棋是非常有道理的,甚至可以说是创造了一种布局变化。”
棋手们普遍显示出了对人工智能的抗拒心理。“我是不是生不逢时了?”柯洁感叹。而对于与AlphaGo的对战,柯洁也收回了此前百分百胜、六七成胜率的判断,“现在说胜率都是没有意义的。