不挂科搜题免费

问题:

下面属于强化学习的是()

答案:

算法先少量给用户推荐各类文章,用户会选择其感兴趣的文章阅读,这就是对这类文章的一种奖励,算法会根据 奖励情况构建用户可能会喜欢的文章的“知识图”。