5月23日,围棋峰会柯洁VS阿尔法围棋第一局战罢,赛后进行了发布会,阿尔法围棋团队回答了焦点问题。
问:你认为阿尔法围棋有什么缺陷吗?
答:我们想知道一个柯洁这样的顶尖棋手是否能找出AlphaGo身上一些我们所不知道的、甚至AlphaGo自己也不知道的弱点。当我们挑战李世石时,在第四局中,他用他的绝顶创造力发现了AlphaGo的一个弱点并赢得了比赛。能在AlphaGo的知识框架中看到这个裂隙对我们来说也很有意思。所以我们回去就试图改进它的架构和系统,让它从自我对弈中学到更多,并尝试解决这个知识框架裂隙的问题。我相信我们已经修复好了,当然可能还有更多新的它不了解的领域,我们也不了解。我们来到这里看是否能找出新的弱点。
问:首场比赛柯洁小负AlphaGo,有一种比较有脑洞的说法是AlphaGo已经不满足于仅仅获胜了,而是希望能具体地控制输赢的差距。请问AlphaGo真的达到这样的程度了吗?
答:AlphaGo总是将赢棋的可能性最大化而不是将赢的目数最大化。它每次面临决策的时候,总是会选择它自己认为更稳妥、风险更小的路线。在它的落子中我们能看到AlphaGo在判断赢得的目数有多稳妥和胜出的可能性时所做出的权衡。
问:是不是可以这么说,未来AlphaGo会探知人类的一些极限?
答:围棋是一个非常令人惊讶的有着无限可能性的事物。我把AlphaGo看作是一个供棋手和围棋界使用的工具,用它探索围棋的神秘和真理,去探寻更多可能。我希望棋手们都能享受过去的一年,包括去年的比赛和Master的网络对弈。我希望它对提高人类对围棋的理解有所贡献。
问:这次的AlphaGo是否完全不依赖人类大师的棋谱来自我学习?
答:在最初的版本中,AlphaGo从人类棋谱中学习,后来到现在它大部分的学习材料都来自于自我对弈的棋谱。AlphaGo的一大创新就是它更多地依靠自我学习。在这个版本中,AlphaGo实际上成了它自己的老师,和上一个版本相比大幅减少了对人类棋谱的依赖。我们这样做的目标之一就是使它变得更为通用,从而能被应用在围棋以外的领域。当然,为了真正地测试它的所学,我们必须让它和世界上最优秀的棋手对弈。(新体)