强化学习
强化学习
智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在...(more)
智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

主题别名

主题名称的其他表述方式。例如常见的拼写错误、大小写、替代名称和常见缩写。

该主题还被叫做:

添加主题别名

主题合并

合并本主题至意义相近的其他主题。本主题会被删除,相关内容会自动迁移至目标主题中, 同时添加主题别名。请将不常用的主题合并至常用主题。
    合并主题

    设置

    主题属性管理:

    主题删除

    删除该主题后所有相关内容都会被删除。删除主题

      子主题

      还没有关系主题
      主题结构组织
      X社区推广