不挂科搜题免费

问题:

关于AlphaGo Zero,说法正确的是

答案:

它就是一张白纸。放弃参考任何人类棋谱,完全自我学习。其关键在于采用了新的 Reinforcement learning(强化学习),并给该算法带了新的发展。使用的不再是之前提到的两套神经网络系统,而是将它们融合成一个神经网络系统。