不挂科搜题免费

问题:

AlphaGo通过以下哪两个不同神经网络合作来改进下棋()

答案:

“策略网络”,它主要作用是观察棋盘布局企图找到最佳的下一步。“价值网络”预测每一个棋手赢棋的可能,在给定棋子位置情况下,通过整体局面判断来辅助落子选择器,预测游戏的赢家。