AlphaGo现在靠自学进步--平顶山新闻网,平顶山晚报,电子报平顶山晚报

5月23日，围棋峰会柯洁VS阿尔法围棋第一局战罢，赛后进行了发布会，阿尔法围棋团队回答了焦点问题。

问：你认为阿尔法围棋有什么缺陷吗？

答：我们想知道一个柯洁这样的顶尖棋手是否能找出AlphaGo身上一些我们所不知道的、甚至AlphaGo自己也不知道的弱点。当我们挑战李世石时，在第四局中，他用他的绝顶创造力发现了AlphaGo的一个弱点并赢得了比赛。能在AlphaGo的知识框架中看到这个裂隙对我们来说也很有意思。所以我们回去就试图改进它的架构和系统，让它从自我对弈中学到更多，并尝试解决这个知识框架裂隙的问题。我相信我们已经修复好了，当然可能还有更多新的它不了解的领域，我们也不了解。我们来到这里看是否能找出新的弱点。

问：首场比赛柯洁小负AlphaGo，有一种比较有脑洞的说法是AlphaGo已经不满足于仅仅获胜了，而是希望能具体地控制输赢的差距。请问AlphaGo真的达到这样的程度了吗？

答：AlphaGo总是将赢棋的可能性最大化而不是将赢的目数最大化。它每次面临决策的时候，总是会选择它自己认为更稳妥、风险更小的路线。在它的落子中我们能看到AlphaGo在判断赢得的目数有多稳妥和胜出的可能性时所做出的权衡。

问：是不是可以这么说，未来AlphaGo会探知人类的一些极限？

答：围棋是一个非常令人惊讶的有着无限可能性的事物。我把AlphaGo看作是一个供棋手和围棋界使用的工具，用它探索围棋的神秘和真理，去探寻更多可能。我希望棋手们都能享受过去的一年，包括去年的比赛和Master的网络对弈。我希望它对提高人类对围棋的理解有所贡献。

问：这次的AlphaGo是否完全不依赖人类大师的棋谱来自我学习？

答：在最初的版本中，AlphaGo从人类棋谱中学习，后来到现在它大部分的学习材料都来自于自我对弈的棋谱。AlphaGo的一大创新就是它更多地依靠自我学习。在这个版本中，AlphaGo实际上成了它自己的老师，和上一个版本相比大幅减少了对人类棋谱的依赖。我们这样做的目标之一就是使它变得更为通用，从而能被应用在围棋以外的领域。当然，为了真正地测试它的所学，我们必须让它和世界上最优秀的棋手对弈。（新体）