28 天自制你的 AlphaGo(五)
28 天自制你的 AlphaGo(五):蒙特卡洛树搜索(MCTS)基础 蒙特卡洛树搜索(MCTS)是所有现代围棋程序的核心组件。在此之上可以加入各种小技巧(如 UCT,RAVE/AMAF,Progressive Bias,Vi...
28 天自制你的 AlphaGo(五):蒙特卡洛树搜索(MCTS)基础 蒙特卡洛树搜索(MCTS)是所有现代围棋程序的核心组件。在此之上可以加入各种小技巧(如 UCT,RAVE/AMAF,Progressive Bias,Vi...
28天自制你的AlphaGo(三):对策略网络的深入分析以及它的弱点所在 本文作者:彭博 2017-02-21 11:58 导语:围棋中的人机对抗远没有结束。 一、神经网络在围棋中的历史 再次回顾 AlphaGo v13 的三大组件: MC...
28天自制你的AlphaGo(四):结合强化学习与深度学习的Policy Gradient(左右互搏自我进化的基础) 本文作者:彭博 2017-02-23 13:54 导语:强化学习在 AlphaGo 中究竟是怎么用的? 本篇...
28 天自制你的 AlphaGo(二):训练策略网络,真正与之对弈 导语:这篇我们安装 TensorFlow,真正训练一下 AlphaGo v13 的 policy network,并且你还可以与它真正对弈。 上次我们介绍了围棋基础和如何搭...
28 天自制你的 AlphaGo(一) 一、围棋 AI 基础 大家都知道 AlphaGo v13 的三大组件是: MCTS(蒙特卡洛树搜索) CNN (卷积神经网络,包括:策略网络 policy network、快速走子网络 playout...