第A14版:体育新闻
3上一版  下一版4
 
上海上港2:1江苏苏宁
骑士力克凯尔特人拿到赛点
AlphaGo现在靠自学进步
版面导航     
平顶山新闻网    平顶山日报   平顶山晚报
新闻搜索:  
3上一篇 2017年5月25日 放大 缩小 默认        
阿尔法围棋团队:
AlphaGo现在靠自学进步

 

5月23日,围棋峰会柯洁VS阿尔法围棋第一局战罢,赛后进行了发布会,阿尔法围棋团队回答了焦点问题。

问:你认为阿尔法围棋有什么缺陷吗?

答:我们想知道一个柯洁这样的顶尖棋手是否能找出AlphaGo身上一些我们所不知道的、甚至AlphaGo自己也不知道的弱点。当我们挑战李世石时,在第四局中,他用他的绝顶创造力发现了AlphaGo的一个弱点并赢得了比赛。能在AlphaGo的知识框架中看到这个裂隙对我们来说也很有意思。所以我们回去就试图改进它的架构和系统,让它从自我对弈中学到更多,并尝试解决这个知识框架裂隙的问题。我相信我们已经修复好了,当然可能还有更多新的它不了解的领域,我们也不了解。我们来到这里看是否能找出新的弱点。

问:首场比赛柯洁小负AlphaGo,有一种比较有脑洞的说法是AlphaGo已经不满足于仅仅获胜了,而是希望能具体地控制输赢的差距。请问AlphaGo真的达到这样的程度了吗?

答:AlphaGo总是将赢棋的可能性最大化而不是将赢的目数最大化。它每次面临决策的时候,总是会选择它自己认为更稳妥、风险更小的路线。在它的落子中我们能看到AlphaGo在判断赢得的目数有多稳妥和胜出的可能性时所做出的权衡。

问:是不是可以这么说,未来AlphaGo会探知人类的一些极限?

答:围棋是一个非常令人惊讶的有着无限可能性的事物。我把AlphaGo看作是一个供棋手和围棋界使用的工具,用它探索围棋的神秘和真理,去探寻更多可能。我希望棋手们都能享受过去的一年,包括去年的比赛和Master的网络对弈。我希望它对提高人类对围棋的理解有所贡献。

问:这次的AlphaGo是否完全不依赖人类大师的棋谱来自我学习?

答:在最初的版本中,AlphaGo从人类棋谱中学习,后来到现在它大部分的学习材料都来自于自我对弈的棋谱。AlphaGo的一大创新就是它更多地依靠自我学习。在这个版本中,AlphaGo实际上成了它自己的老师,和上一个版本相比大幅减少了对人类棋谱的依赖。我们这样做的目标之一就是使它变得更为通用,从而能被应用在围棋以外的领域。当然,为了真正地测试它的所学,我们必须让它和世界上最优秀的棋手对弈。(新体)

 
3上一篇  
 
   
   
   


豫ICP备09014970号 豫平公网安41040002020010

地址:平顶山市建设路西段268号    邮政编码:467002    E-mail:wz@pdsxww.com
联系电话:0375-4973575 传真:0375-4973608
所有内容为平顶山日报社版权所有.未经许可,不得转载或镜像
 

关闭