标签：AlphaGo

28 天自制你的 AlphaGo（五）

2017-02-27shenzt@sina.com阅读(915)评论(0)

28 天自制你的 AlphaGo（五）：蒙特卡洛树搜索（MCTS）基础蒙特卡洛树搜索（MCTS）是所有现代围棋程序的核心组件。在此之上可以加入各种小技巧（如 UCT，RAVE/AMAF，Progressive Bias，Vi...

2017-02-27shenzt@sina.com阅读(1323)评论(0)

28天自制你的AlphaGo（三）：对策略网络的深入分析以及它的弱点所在本文作者：彭博 2017-02-21 11:58 导语：围棋中的人机对抗远没有结束。一、神经网络在围棋中的历史再次回顾 AlphaGo v13 的三大组件： MC...

2017-02-27shenzt@sina.com阅读(1273)评论(0)

28天自制你的AlphaGo（四）：结合强化学习与深度学习的Policy Gradient（左右互搏自我进化的基础）本文作者：彭博 2017-02-23 13:54 导语：强化学习在 AlphaGo 中究竟是怎么用的？本篇...

2017-02-20shenzt@sina.com阅读(1068)评论(0)

28 天自制你的 AlphaGo（二）：训练策略网络，真正与之对弈导语：这篇我们安装 TensorFlow，真正训练一下 AlphaGo v13 的 policy network，并且你还可以与它真正对弈。上次我们介绍了围棋基础和如何搭...

2017-02-20shenzt@sina.com阅读(1234)评论(0)

28 天自制你的 AlphaGo（一）一、围棋 AI 基础大家都知道 AlphaGo v13 的三大组件是： MCTS（蒙特卡洛树搜索） CNN （卷积神经网络，包括：策略网络 policy network、快速走子网络 playout...