强化学习
强化学习
智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在...(more)
智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

日志

强化学习

twt社区管理员添加了父主题
机器学习涉及技术
#00117545
2022-03-17

强化学习

twt社区管理员移除了父主题
机器学习技术
#00117543
2022-03-17

强化学习

twt社区管理员添加了父主题
机器学习技术
#00112835
2022-03-16

强化学习

twt社区管理员移除了父主题
机器学习
#00112833
2022-03-16

强化学习

彬彬设置了主题 IT技术属性
#00088917
2020-01-20

强化学习

时东南编辑了主题描述

智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

#00052371
2017-09-30

强化学习

时东南添加了别名
增强学习
#00052345
2017-09-29

时东南合并了主题
增强学习 合并至 强化学习
理由:相同意义
#00052343
2017-09-29

强化学习

时东南添加了父主题
机器学习
#00052257
2017-09-29

强化学习

sjk000创建了主题
强化学习 被创建
#00047867
2017-08-03
    X社区推广