智能

五个人拿了七个冠军，群殴 AlphaGo 没能赢

龚方毅 · 2017-05-26 18:19:36 · ♥ 95

明天是柯洁和 AlphaGo 的最后一场。

今天柯洁休息，AlphaGo 继续比赛。分别是上午的配对赛和下午的团体赛。

配对赛由“古力+ AlphaGo”对阵“连笑+ AlphaGo”的组合。双方各有 1 小时思考时间，同一方的人和机器共用。1 小时思考时间用完之后，轮流读秒 1 分钟。

赛前，古力表示需要以学生姿态，来努力理解 AlphaGo 的招法，看看能否配合好。

配对赛 8:30 开始，对阵场地从二楼对局室搬到此前举行柯洁新闻发布会的底楼大厅，裁判、人、计算机坐在舞台中央。

不同于柯洁的比赛，配对赛和团体赛受关注度少了很多。容纳 80 人的媒体室只坐了不到 20 人。大厅里的观战人数大约是柯洁比赛时的 30%。

DeepMind 派两位业余棋手代替 AlphaGo 落子。下棋时，队友之间禁止讨论（棋手确实也没法和 AlphaGo 讨论就是了）。落子顺序为古力（黑）- 连笑（白）- AlphaGo（黑）- AlphaGo（白）。

10:59，比赛进行了 2 小时 29 分后，古力举牌认输。

而半个多小时前，古力一度能赢下比赛。当时连笑已经用完思考时间开始读秒，白棋棋面落后，古力还有 17 分钟。中国围棋协会副主席华以刚说，“比赛就快结束了。”

“中盘的时候，古力的优势一度非常大。”刘菁八段说。

但随着 AlphaGo（黑）和古力各自下了错棋，局面整个翻转过来。研究室里的聂卫平、柯洁认为古力的黑棋危险了。舞台上的古力此时摇了摇头。

在古力举牌认输前，AlphaGo（黑）已经认输过，但被古力拒绝了。他想看看胜率低时 AlphaGo 的反应。

配对赛中，认输需要两位选手一起同意。

“当 AlphaGo 评估自己胜率低于 30% 时会认输。”王磊八段说。他是配对赛的解说嘉宾。

最后古力未能挽回先前留下的劣势，终于举起蓝色牌子认输。他的搭档向 AlphaGo 输入指令后确认同意。至此执白的连笑一方中盘获胜。

“我在想 AlphaGo 是不是下错了，一回头我还看电脑了，觉得他下错了，不知道它怎么想的。我和连笑都‘啊’了一声，”古力说，“应该给后面留更多时间，我往往在读秒中点错目。本来今天配对赛还想下到官子再看 AlphaGo 如何走……”古力赛后说。

连笑在新闻发布会上表示，AlphaGo 赢了李世乭后，他对 DeepMind 团队很佩服。MASTER 的出现让人意识到围棋的下法变化还有很多，“AlphaGo 对人类来说可能是领先几百年的高手，但也不是完全无敌的，还是会退缩的，很像人类。我想我们会跟它共同进步的。”

团体赛五人群殴 AlphaGo，还是输了

人类群殴 AlphaGo 的比赛结束了。在错综复杂的棋盘上，五个中国棋手合力，依然输给了 AlphaGo，用时四小时整。

团队赛的规则继续沿用中国围棋规则，执黑先行，计算胜负时黑棋帖子给白棋。每一方的思考时间由单人赛的 3 小时改为 2.5 小时。中国派出五名团体赛棋手是：

周睿羊：围棋九段，国际赛事最好成绩是 2012 年百灵杯冠军；
芈昱廷：围棋九段，国际赛事最好成绩是 2013 年梦百合杯冠军；
时越：围棋九段，国际赛事最好成绩是 2012 年 LG 杯冠军；
唐韦星：围棋九段，国际赛事最好成绩 2013 年三星杯冠军、2016 年应氏杯冠军；
陈耀烨：围棋九段，国际赛事最好成绩是 2012 年春兰杯冠军、2016 年百灵杯冠军；

执子的是周睿羊。他身后从左至右依次是时越、芈昱廷、唐韦星、陈耀烨。图/Google

本场比赛，AlphaGo 仍由黄仕杰博士充当“人肉臂”。柯洁在昨天第二场赛后新闻发布会上说黄博士是 Alphago 的核心人物，坐他对面下棋就跟对着机器人一样。

“大家看转播能看到，我蛮爱动的。黄博士不一样，很冷静。坐那里一动不动，不去厕所，也不喝水。我蛮佩服的，不知道怎么做到的。”柯洁笑着说。

周睿羊代表中国棋手坐在黄博士对面落子，另外四位队友坐周睿羊在身后研棋。每一步 AlphaGo 下完，周睿羊就侧身回头，跟其他人一起讨论。赛前柯洁想替中国队当人肉臂，但其他人商量了下，担心柯洁落子时会自作主张，所以没同意。

芈昱廷认为多人赛协作有优有劣，还是要看临场的发挥。古力觉得五个人组成团队，正常来说会有点优势，“但一个问题是团体赛时间是 2.5 小时，如果棋手们思想不统一，发生争执，时间会不太足。”

中国队一开始表现轻松，“周睿羊笑了，可能还对比赛进程挺满意。”古力说。不管是落子还是回头讨论，笑容总是挂在周睿羊脸上。

场上五位中国选手最年长也不过是 89 年生的陈耀烨，古力对他们有较高评价。“唐韦星很活跃，在大赛发挥尤其好。芈昱廷第一个世界冠军就是赢的我，当时我低级失误大，顿时没有信心，觉得和 90 后年轻棋手已有差距了。”

随着比赛进行，中国队多次陷入长考。“往往作出决定后再变招不太好，反而打乱了思路，还不如一条路走下去……感觉下方还是亏了一手棋，时间用的有点多。”古力评价道。

此时 AlphaGo 用了 20 分钟思考时间，中国队用了一个多小时。

“AlphaGo 基本上一手不到一分钟。”古力说。更多时候，中国对只有周睿羊一人挂着笑容，四位队友手托下巴、表情严肃。

“周睿羊好像是反对派。站在黑子的角度上思考，认为队友这一步、那一步都不行。”

“时间比较吃紧”是古力解说时最频繁提到的观点。下场休息的时候，古力认为团队赛局势不太乐观，比昨天柯洁的形势差一点。

棋局外，据新浪报道，柯洁站在 AlphaGo 的角度下了一子，其他人都觉得不太好，正在讨论的时候，AlphaGo 的棋子落在柯洁想到的位置上。屋子里没有了争论。

“根据 AlphaGo 的评估，前 50 手，或者说前 100 手，双方非常非常接近（very very close）。”这是昨天 DeepMind CEO 哈萨比斯对柯洁第二场比赛的评价。

12:30 开始的比赛进行到 15:14 时，中国队只剩下 25 分钟思考时间，对面的 AlphaGo 还剩 1 小时 52 分钟。“周睿羊要开始争分夺秒了。”古力说，“笑成这样，肯定不好办了。”镜头里的周睿羊单手托下巴，侧身前倾，笑着撑靠在棋台上。

柯洁和聂卫平此时认为中国队由于开局损失太大，胜率可能只有 30% 左右。

最后的收官阶段，中国队挽回些落后的局面。“刘老师，现在局面好像比我们刚下去的时候好不少啊。”接替古力解说的王磊对搭档刘菁说。

一部分的原因是 AlphaGo 落子一直以达到最高胜率为准。简单来说，在 99% 概率获胜、赢对手 5 目和 100% 概率获胜、赢对手 1 目间，AlphaGo 选择后者。

人类棋手借此可以缩小输赢差距，但无法改变输的结果。

“现在只是看 AlphaGo 想大胜还是小胜。”王磊说，“它特别喜欢赢你半目。”半目是围棋比赛中最小差距。柯洁第一场半目输给了 AlphaGo。

中国队用完 2.5 小时思考时间、进入读秒时，唐韦星接替周睿羊。王磊介绍是因为在之前的团体赛模拟中，中国队五人对战柯洁，也是在进入读秒、局势落后的时候，唐韦星出战，逆转了比赛。

但是没有奇迹发生。“棋到这里，就显得绝望了。他们五个人团队开局不应该是这种发挥。”刘菁说。

场上只有唐韦星还出于对战状态，他身后的队友开始聊天了。

“现在再下，意义不大了。”刘菁说。

16:29，中国队五人重新商量，下了一招好棋，引来 AlphaGo 回了一招人类不会走的棋，使得双方差距缩小到“半目至一目半”。AlphaGo 的这一手也让围棋业余高手黄仕杰博士摇头。

16:30，中国队中盘认输。

“AlphaGo 团队赛的机会，我非常激动。也非常感谢团队成员们非常信任我，让我主下。但是我今天的发挥可能并不让人满意。”周睿羊在赛后新闻发布会上说，“我们对执黑的准备可能不是太充分，AlphaGo 白棋的招法很多，它第四步就让我们很惊讶……可能如大家所预料那样，通盘没有太好的机会。”

人类群殴 AlphaGo 的比赛有什么意义？

之前的报道提到过这个问题。

意义很明确：如果人工智能算法能够打败单个人类，那么用人类的集体智慧和写作文对应人工智能是否能赢？人+机器这样的组合，能不能产生更好的结果？

聂卫平认为是的。他发微博说“昨天跟哈萨比斯聊得很开心，我们人类棋手与 AlphaGo 搭档，毫无疑问能击败单独的 AlphaGo，我们俩对这一点都非常确认。”

这类配对赛之前也有过。2005 年，Playchess.com 举行了一场“自由式”象棋大赛，参赛者可以任意和其他人或者电脑组队。通常情况下，象棋网站都会运用“反作弊”算法来防止参赛者用电脑程序作弊。

重赏之下，好几位特级大师都携多台电脑参加了比赛。一开始，结果不出预料。人和电脑组队，要远远胜过最强的电脑。

“九头蛇”（Hydra）和“深蓝”一样，是一台专业象棋超级电脑，而面对棋力较强的人类选手和一台较弱的笔记本电脑的组合，它却败下阵来。人类的战略引导加上电脑精确的战术计算。

最后的赢家并不是“人+高配置电脑”的组合，而是两位美国业余选手和三台电脑的组合。

他们的技巧是通过干预和“教导”，让电脑们更深入地搜索可能的局面。这一策略不仅胜过了特级大师们对象棋的精深理解，也胜过了其它参赛者的超强计算能力。

“棋力较弱的人类+机器+优化的步骤”比强力的电脑本身技高一筹，也优于“棋力较强的人类+机器+较差的步骤”。

“配对赛和中国队团战都很有趣、引人入胜。这也暗示了人和机器合作所能做到的事情。向所有参与者表示祝贺。”今天两场比赛结束后，哈萨比斯发了上面这条推文。

AlphaGo 主程序员 David Silver 亦对比赛和 7 位中国棋手提出褒赞，“今天的比赛无关输赢，而是探索围棋的诸多变化，以及我们如何从中学习……也许这给我们一些洞见，关于围棋的未来、人和机器如何通力合作。“

明天是柯洁和 AlphaGo 三番棋最后一场，柯洁继续执白。比赛仍将在 10:30 开始，DeepMind 在其 YouTube 频道提供中英双语直播。

题图/微博用户天了噜小组长

原文链接 (已下线): https://www.qdaily.com/articles/41285.html
Wayback 快照: http://web.archive.org/web/20181010210030/http://www.qdaily.com:80/articles/41285.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3xrpy0koxj30u08r37wk

五个人拿了七个冠军，群殴 AlphaGo 没能赢

团体赛五人群殴 AlphaGo，还是输了

人类群殴 AlphaGo 的比赛有什么意义？

五 个 人 拿 了 七 个 冠 军 ， 群 殴 AlphaGo 没 能 赢

五个人拿了七个冠军，群殴 AlphaGo 没能赢