强化学习吧 关注:315贴子:619
  • 1回复贴,共1

在读萌新求助

只看楼主收藏回复

lz最近正在学习深度强化学习方面的知识,然后现在有个疑问,我在解读代码的时候,发现,代码中这只的reward根本和模型没有关联,那是怎么给模型奖励和惩罚呢?我一直很困惑,希望有大佬解答#强化学习#


IP属地:北京来自iPhone客户端1楼2024-09-30 01:45回复
    我是在看一本书学习的,书名是“动手学强化学习”,然后有的困惑,大佬们求求了


    IP属地:北京来自iPhone客户端2楼2024-09-30 01:47
    回复