智能

五个人拿了七个冠军,群殴 AlphaGo 没能赢

龚方毅 · ·

明天是柯洁和 AlphaGo 的最后一场。

今天柯洁休息,AlphaGo 继续比赛。分别是上午的配对赛和下午的团体赛。

配对赛由“古力+ AlphaGo”对阵“连笑+ AlphaGo”的组合。双方各有 1 小时思考时间,同一方的人和机器共用。1 小时思考时间用完之后,轮流读秒 1 分钟。

赛前,古力表示需要以学生姿态,来努力理解 AlphaGo 的招法,看看能否配合好。

比赛场地,乌镇互联网国际会展中心。图/好奇心日报

配对赛 8:30 开始,对阵场地从二楼对局室搬到此前举行柯洁新闻发布会的底楼大厅,裁判、人、计算机坐在舞台中央。

不同于柯洁的比赛,配对赛和团体赛受关注度少了很多。容纳 80 人的媒体室只坐了不到 20 人。大厅里的观战人数大约是柯洁比赛时的 30%。

DeepMind 派两位业余棋手代替 AlphaGo 落子。下棋时,队友之间禁止讨论(棋手确实也没法和 AlphaGo 讨论就是了)。落子顺序为古力(黑)- 连笑(白)- AlphaGo(黑)- AlphaGo(白)。

10:59,比赛进行了 2 小时 29 分后,古力举牌认输。

而半个多小时前,古力一度能赢下比赛。当时连笑已经用完思考时间开始读秒,白棋棋面落后,古力还有 17 分钟。中国围棋协会副主席华以刚说,“比赛就快结束了。”

“中盘的时候,古力的优势一度非常大。”刘菁八段说。

古力。图/Google

但随着 AlphaGo(黑) 和古力各自下了错棋,局面整个翻转过来。研究室里的聂卫平、柯洁认为古力的黑棋危险了。舞台上的古力此时摇了摇头。

在古力举牌认输前,AlphaGo(黑)已经认输过,但被古力拒绝了。他想看看胜率低时 AlphaGo 的反应。

配对赛中,认输需要两位选手一起同意。

“当 AlphaGo 评估自己胜率低于 30% 时会认输。”王磊八段说。他是配对赛的解说嘉宾。

最后古力未能挽回先前留下的劣势,终于举起蓝色牌子认输。他的搭档向 AlphaGo 输入指令后确认同意。至此执白的连笑一方中盘获胜。 ​​​​

“我在想 AlphaGo 是不是下错了,一回头我还看电脑了,觉得他下错了,不知道它怎么想的。我和连笑都‘啊’了一声,”古力说,“应该给后面留更多时间,我往往在读秒中点错目。本来今天配对赛还想下到官子再看 AlphaGo 如何走……”古力赛后说。

连笑在新闻发布会上表示,AlphaGo 赢了李世乭后,他对 DeepMind 团队很佩服。MASTER 的出现让人意识到围棋的下法变化还有很多,“AlphaGo 对人类来说可能是领先几百年的高手,但也不是完全无敌的,还是会退缩的,很像人类。我想我们会跟它共同进步的。”

团体赛五人群殴 AlphaGo,还是输了

人类群殴 AlphaGo 的比赛结束了。在错综复杂的棋盘上,五个中国棋手合力,依然输给了 AlphaGo,用时四小时整。

团队赛的规则继续沿用中国围棋规则,执黑先行,计算胜负时黑棋帖子给白棋。每一方的思考时间由单人赛的 3 小时改为 2.5 小时。中国派出五名团体赛棋手是:

  • 周睿羊:围棋九段,国际赛事最好成绩是 2012 年百灵杯冠军;
  • 芈昱廷:围棋九段,国际赛事最好成绩是 2013 年梦百合杯冠军;
  • 时越:围棋九段,国际赛事最好成绩是 2012 年 LG 杯冠军;
  • 唐韦星:围棋九段,国际赛事最好成绩 2013 年三星杯冠军、2016 年应氏杯冠军;
  • 陈耀烨:围棋九段,国际赛事最好成绩是 2012 年春兰杯冠军、2016 年百灵杯冠军;

执子的是周睿羊。他身后从左至右依次是时越、芈昱廷、唐韦星、陈耀烨。图/Google

本场比赛,AlphaGo 仍由黄仕杰博士充当“人肉臂”。柯洁在昨天第二场赛后新闻发布会上说黄博士是 Alphago 的核心人物,坐他对面下棋就跟对着机器人一样。

“大家看转播能看到,我蛮爱动的。黄博士不一样,很冷静。坐那里一动不动,不去厕所,也不喝水。我蛮佩服的,不知道怎么做到的。”柯洁笑着说。

黄仕杰博士。图/Google

周睿羊代表中国棋手坐在黄博士对面落子,另外四位队友坐周睿羊在身后研棋。每一步 AlphaGo 下完,周睿羊就侧身回头,跟其他人一起讨论。赛前柯洁想替中国队当人肉臂,但其他人商量了下,担心柯洁落子时会自作主张,所以没同意。 ​​​​

芈昱廷认为多人赛协作有优有劣,还是要看临场的发挥。古力觉得五个人组成团队,正常来说会有点优势,“但一个问题是团体赛时间是 2.5 小时,如果棋手们思想不统一,发生争执,时间会不太足。”

中国队一开始表现轻松,“周睿羊笑了,可能还对比赛进程挺满意。”古力说。不管是落子还是回头讨论,笑容总是挂在周睿羊脸上。

中国的九段们,下棋很开心啊。图/Google

场上五位中国选手最年长也不过是 89 年生的陈耀烨,古力对他们有较高评价。“唐韦星很活跃,在大赛发挥尤其好。芈昱廷第一个世界冠军就是赢的我,当时我低级失误大,顿时没有信心,觉得和 90 后年轻棋手已有差距了。”

随着比赛进行,中国队多次陷入长考。“往往作出决定后再变招不太好,反而打乱了思路,还不如一条路走下去……感觉下方还是亏了一手棋,时间用的有点多。”古力评价道。

此时 AlphaGo 用了 20 分钟思考时间,中国队用了一个多小时。

“AlphaGo 基本上一手不到一分钟。”古力说。更多时候,中国对只有周睿羊一人挂着笑容,四位队友手托下巴、表情严肃。

“周睿羊好像是反对派。站在黑子的角度上思考,认为队友这一步、那一步都不行。”

“时间比较吃紧”是古力解说时最频繁提到的观点。下场休息的时候,古力认为团队赛局势不太乐观,比昨天柯洁的形势差一点

棋局外, 据新浪报道,柯洁站在 AlphaGo 的角度下了一子,其他人都觉得不太好,正在讨论的时候,AlphaGo 的棋子落在柯洁想到的位置上。屋子里没有了争论。

在外观战的连笑和柯洁。图/Google

“根据 AlphaGo 的评估,前 50 手,或者说前 100 手,双方非常非常接近(very very close)。”这是昨天 DeepMind CEO 哈萨比斯对柯洁第二场比赛的评价。

12:30 开始的比赛进行到 15:14 时,中国队只剩下 25 分钟思考时间,对面的 AlphaGo 还剩 1 小时 52 分钟。“周睿羊要开始争分夺秒了。”古力说,“笑成这样,肯定不好办了。”镜头里的周睿羊单手托下巴,侧身前倾,笑着撑靠在棋台上。

柯洁和聂卫平此时认为中国队由于开局损失太大,胜率可能只有 30% 左右

最后的收官阶段,中国队挽回些落后的局面。“刘老师,现在局面好像比我们刚下去的时候好不少啊。”接替古力解说的王磊对搭档刘菁说。

一部分的原因是 AlphaGo 落子一直以达到最高胜率为准。简单来说,在 99% 概率获胜、赢对手 5 目和 100% 概率获胜、赢对手 1 目间,AlphaGo 选择后者。

人类棋手借此可以缩小输赢差距,但无法改变输的结果。

“现在只是看 AlphaGo 想大胜还是小胜。”王磊说,“它特别喜欢赢你半目。”半目是围棋比赛中最小差距。柯洁第一场半目输给了 AlphaGo。

唐韦星。图/Google

中国队用完 2.5 小时思考时间、进入读秒时,唐韦星接替周睿羊。王磊介绍是因为在之前的团体赛模拟中,中国队五人对战柯洁,也是在进入读秒、局势落后的时候,唐韦星出战,逆转了比赛。

但是没有奇迹发生。“棋到这里,就显得绝望了。他们五个人团队开局不应该是这种发挥。”刘菁说。

场上只有唐韦星还出于对战状态,他身后的队友开始聊天了。

“现在再下,意义不大了。”刘菁说。

16:29,中国队五人重新商量,下了一招好棋,引来 AlphaGo 回了一招人类不会走的棋,使得双方差距缩小到“半目至一目半”。AlphaGo 的这一手也让围棋业余高手黄仕杰博士摇头。

16:30,中国队中盘认输。

“AlphaGo 团队赛的机会,我非常激动。也非常感谢团队成员们非常信任我,让我主下。但是我今天的发挥可能并不让人满意。”周睿羊在赛后新闻发布会上说,“我们对执黑的准备可能不是太充分,AlphaGo 白棋的招法很多,它第四步就让我们很惊讶……可能如大家所预料那样,通盘没有太好的机会。”

人类群殴 AlphaGo 的比赛有什么意义?

之前的报道提到过这个问题。

意义很明确:如果人工智能算法能够打败单个人类,那么用人类的集体智慧和写作文对应人工智能是否能赢?人+机器这样的组合,能不能产生更好的结果?

聂卫平认为是的。他发微博说“昨天跟哈萨比斯聊得很开心,我们人类棋手与 AlphaGo 搭档,毫无疑问能击败单独的 AlphaGo,我们俩对这一点都非常确认。”

这类配对赛之前也有过。2005 年,Playchess.com 举行了一场“自由式”象棋大赛,参赛者可以任意和其他人或者电脑组队。通常情况下,象棋网站都会运用“反作弊”算法来防止参赛者用电脑程序作弊。

重赏之下,好几位特级大师都携多台电脑参加了比赛。一开始,结果不出预料。人和电脑组队,要远远胜过最强的电脑。

“九头蛇”(Hydra)和“深蓝”一样,是一台专业象棋超级电脑,而面对棋力较强的人类选手和一台较弱的笔记本电脑的组合,它却败下阵来。人类的战略引导加上电脑精确的战术计算。

最后的赢家并不是“人+高配置电脑”的组合,而是两位美国业余选手和三台电脑的组合。

他们的技巧是通过干预和“教导”,让电脑们更深入地搜索可能的局面。这一策略不仅胜过了特级大师们对象棋的精深理解,也胜过了其它参赛者的超强计算能力。

“棋力较弱的人类+机器+优化的步骤”比强力的电脑本身技高一筹,也优于“棋力较强的人类+机器+较差的步骤”。

“配对赛和中国队团战都很有趣、引人入胜。这也暗示了人和机器合作所能做到的事情。向所有参与者表示祝贺。”今天两场比赛结束后,哈萨比斯发了上面这条推文。

AlphaGo 主程序员 David Silver 亦对比赛和 7 位中国棋手提出褒赞,“今天的比赛无关输赢,而是探索围棋的诸多变化,以及我们如何从中学习……也许这给我们一些洞见,关于围棋的未来、人和机器如何通力合作。“

明天是柯洁和 AlphaGo 三番棋最后一场,柯洁继续执白。比赛仍将在 10:30 开始,DeepMind 在其 YouTube 频道提供中英双语直播。


题图/微博用户天了噜小组长


原文链接 (已下线): https://www.qdaily.com/articles/41285.html
Wayback 快照: http://web.archive.org/web/20181010210030/http://www.qdaily.com:80/articles/41285.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3xrpy0koxj30u08r37wk