腾讯科技 俞斯译 3月11日首尔报道
第37手
麦克·雷蒙不敢相信自己看到的画面。他的右手在空中足足停留了两秒,其间四次扭头看向电脑屏幕上的棋盘,才把一颗黑棋贴在了AlphaGo刚刚走的位置上。
作为一名职业9段的围棋高手,雷蒙已经习惯了把自己的情绪隐藏起来。他是这次人机大战的英文解说嘉宾,一本正经又慢条斯理的解说风格,有时会让人犯困。不过一秒前他脸上的困惑以及随后的嘴角上扬,都说明了赛场上发生了一件不同寻常的事,而这一切,刚好被扫过的特写镜头逮到。
因为现场转播信号的延迟,古力比雷蒙晚了一分多钟才看到这一手棋。他的反应与雷蒙如出一辙,只不过更加激烈,“AlphaGo怎么会下这里?” 整个腾讯的直播间也因这一步棋炸开了锅,国家围棋队总教练俞斌表示“反常规”,职业棋手唐奕觉得“是业余水准”,没有人觉得这是一步“对”的棋。
李世石抽完本场比赛的第一支烟,回到座位上。他也看到了对手的这一步棋,第一次露出了疑惑的神情。不过这种疑惑只持续了很短的时间,随后,他陷入了长时间的思考,脸色也变得越来越难看。“印象中我从没见过职业高手下这样的棋,李世石可能也没有,所以看得出,他要好好考虑一下。”雷蒙评论道。
这一幕发生在“人机大战”第二场比赛开始后50分钟,AphaGo所下的第37手。
根据比赛的规则,每名选手都有两个小时的常规时间,在此期间选手可以任意分配每一步棋的时间(10秒或者10分钟)一旦时间用完,就要进入“读秒”,每步棋考虑时间不能超过60秒。
李世石明白,第一场的失利很大程度上是因为自己下得太快,考虑不周全。在投子认输时,他还有近半小时的常规时间,比AphlaGo少用了25分钟。因此在第二场比赛中,他有意放慢了每一步棋的节奏,希望可以考虑得更周全。在这一步棋之前,他的总用时是25分2秒,比AlphaGo多用的5分钟帮他换回了盘面上的一点优势,于是他放松地起身,去抽了第一支烟。
AlphaGo无法感受到李世石心情的变化,所以这一步“怪棋”也不像只是简单地想把当前的局面搅乱,而是跟前面的36步一样,进行过分析后的决定。李世石明白这一点,也正是因为如此,他花了更多时间去思考这棋背后的“深意”。
“当你觉得它足够厉害时,即使它真的下了一招烂棋,你也会觉得它有别的什么意图,只是自己没有看出来。然后你会越来越怀疑自己。”在回顾0比5输给AlphaGo的心理变化时,樊麾这么告诉腾讯科技。
在赛后接受采访时,作为裁判的他对AlphaGo的这一步棋赞不绝口。在此之前,他曾经说过“AplhaGo缺点是他无法理解围棋之美”,但在这一刻, AlphaGo却用自己的一步棋让他体会到了其中的美和优雅。
麦克•雷蒙也感受到了这种“刺激”,他说经过这两天的观察,自己非常想和AlphaGo下一盘棋。“许多围棋高手都会有自己习惯的套路,尤其是在布局阶段。这样做确却更加稳健,但是下多了也少了许多变化的乐趣。”雷蒙说,“而这也是AlphaGo与众不同的地方。”
15分37秒,这是李世石在这一步棋上花掉的思考时间。从结果上看,这一步棋并没有对之后的棋局产生巨大的影响。但在下完这步棋后,他的用时已经比AlphaGo多了20分钟。有意思的是,李世石比AlphaGo先读秒的时间,也恰好是20分钟。
“今天AlphaGo的表现几乎是完美的,自始至终没有一步棋让我觉得它下得不合理。我无话可说。”李世石在第二场比赛后的新闻发布会上说。
谁是李世石?
第二场比赛多花了一个小时,但从比赛结束到召开发布会的进间,却缩短了十几分钟。
与第一场结束后的热烈讨论相比,现场的气氛更加压抑。李世石入场没有像昨天第一场失利后那么紧张和不安,但却多了些落寞。一位韩国媒体鼓起了掌,想给李世石打气,但单薄的掌声显得异常刺耳。
第一场之后,仍然有不少韩国媒体在为李世石的失利寻找理由,比如下得太快,失误太多,比如有些轻敌,不太认真。这些理由的背后传递的共同信息是,只要李世石认真下,仍然可以取胜。
而在24小时之后,当目睹了AlphaGo是如何从开始到结束掌控主局面,没有给李世石任何获得的机会,最终又逼迫李世石投子认输后,大家心里对于谁强谁弱,已经有了一个答案。而作为韩国媒体,需要用更多进间去接受这种现实。
在韩国,李世石并不是一个招媒体喜欢的棋手。
“目中无人”、“口无遮拦”、“不尊重对手和前辈”,你可以在任何一个韩国围棋记者口中得到这些形容李世石的话。在过去15年,这些标签就像他的成绩一样耀眼,即使他现在已经比过去收敛许多,这些轻狂之言也时常会被翻出,虽然大部分时间仅仅是作为谈资。
比如在2001年第5届LG杯决赛中输给前辈李昌镐之后,年仅18岁的李世石却说“在所有高手中,昌镐的水平是最差的”,同样在两年后的LG杯中,李世石再一次语出惊人,他说自己心目中世界冠军的候选中,没有包括马晓春。在对尊卑位份异常重视的韩国,李世石常常因此受到媒体诟病。
他还经常在大赛前做出乐观的预测,2005年1月第二届丰田杯,李世石与常昊冠亚军决赛前,他声称自己“有65%至70%的胜算”,尽管当时双方历史交手的成绩是1比4;2010年第12届农心杯前,李世石面对10位中日高手,声称要取得“十连胜”。
即便在这两年有所收敛,但是在接受Google AlphaGo的围棋挑战时,李世石仍然在第一时间表示,比赛将会是他以5:0取胜。
这一次,李世石不仅是代表韩国,而且是代表人类出战。这个巨大的噱头无疑刺激到了韩国媒体们的神经,只要他能赢,他说什么都行。
一时间,李世石以一种“民族英雄”的形象登上了报纸和电视的头版头条,所有的报道都在极力渲染这次比赛的重大意义,“从没有见过这么多媒体如此关心一个围棋选手和围棋比赛”,一位跑了15年围棋的韩国记者告诉腾讯科技。
这种关心的“保质期”并没有想象得那么久,比赛当天那种300多家媒体涌进四季酒店,为了提前进场占据一个有力位置不惜提前一个小时排队的盛况已经不再。来到现场的韩国媒体数量大概只有前一天的70%,中餐自助午餐的消耗速度也不像第一天那么快。
3月8日上午的赛前新闻发布会,当Google DeepMind公司CEO Demis Hassabis在台上讲解AlphaGo的算法原理时,一大群摄影师冲到了场地前方正中央,拍摄坐在前排的李世石,挡在了 Hassabis和其它台下的记者之间,甚至引起了部分国际记者的吐槽。
而在3月9日第一场的赛后发布会后,位于舞台右侧角落里的DeepMind团队被长枪短炮团团围住,闪光灯闪个不停。到了3月10日第二场比赛之后,你会看到这些穿着统一黑T恤的外国人时常会被韩国记者拦下,用不太流利的英语问着关于AlphaGo,关于Google的一些问题。
李世石不再是镜头的全部。越来越多的媒体想知道,这个两次战胜了李世石的AlphaGo,到底是个什么玩意?
一支叫AlphaGo的小分队
一群穿着统一黑色T恤的年轻人,突然聚集在了国际媒体直播间门口。他们在相互击掌、拥抱,脸上的笑容,就像是在圣诞节早晨得到了心仪礼物的孩子。
这是3月9日下午3点30分,就在几分钟之前,李世石出人意料地做出了投子认输的决定,这也就意味着AlphaGo第一次击败了职业9段围棋手。媒体们一齐拥向了十几米外的长廊两侧,这里是李世石从比赛现场走到发布会房间的必经之路。
其中一个年轻人为了躲开一个从身边匆忙跑过试图挤进长廊两侧的媒体,往后退了一步。他对身边的另一个戴眼镜的哥们儿耸了耸肩,露出了一副“看我们干的好事”的神情。这时候,英文解说嘉宾Chris Garlock从媒体直播间走了出来。“太棒了,实在是太棒了。恭喜你们。”Garlock对这种小伙子说。在说这句话时,他似乎还没有从刚刚的兴奋中缓过来,当李世石投子认输时,他一连喊了三个“wow”。
黑色T恤背上的AlphaGo字样暴露了这群人的身份,他们正是来自DeepMind公司,开发了AlphaGo的那群人。就在几分钟之前,他们创造了历史。
这是一支15人的小分队,为了这次比赛特地从伦敦飞到韩国,从2月底开始,就住在四季酒店,为比赛做着各项准备。
George Van Den Driessche 和 Julian Schrittweiser 是两位最主要的工程师,他们的主要任务,就是保证AlphaGo能在这里顺利运行。“他们许多与系统相关的检查,包括查看各个接口,准备备用方案。”DeepMind的创始人,CEO Demis Hassabis 告诉腾讯科技。
除了工程师,这个团队中还有人专门负责IT基础设施。尽管韩国是全球网速第一的国家,但团队仍然在酒店铺设了特别的网线,保证全球直播过程中的高速和稳定。
另一部分团队成员则与Google的团队一起,负责比赛的组织。不同颜色的号码牌代表不同的权限,每一个区域交接处都有至少两名安保人员站岗;直播间为国际媒体和DeepMind团队专门预留座位,所有发布会和采访时间的误差均不超过10分钟。
“我从来没有见过组织比赛这么细致的,所有的事情都要排练好多次。”樊麾告诉腾讯科技。作为这次比赛的裁判,他从比赛前5天就来到了首尔,帮助小分队一起准备。
第一场比赛的赛后发布会上,AlphaGo项目的主要负责人David Silver和公司CEO Demis Hassabis、李世石一起上台接受的采访。而在离他几米远的地方,小分队的成员们聊得正high。发布会一结束,这个角落就被媒体团团围住。他们终于成了主角。
这不是机器的胜利,而是一群人战胜了另一个人。而这群人正在制造“未来”。未来,正在发生。