强化学习吧 关注:321贴子:629
  • 6回复贴,共1
求助

有没有c++深度强化学习的

只看楼主收藏回复

本人研究方向为车间调度,目前正在做深度强化学习,算法是近端策略优化,网络是Lstm长短期记忆网络,代码逻辑全部都是手动实现的,目前问题就是随着训练的增加,损失函数没有减小反而增大了,权重会向着负无穷大更新,怀疑是梯度爆炸,可能反向传播也没有写对。有没有懂这块的老哥解答一下,一个人学真的很困难,导师一点都不懂这块。给大佬跪了0.0


IP属地:安徽来自iPhone客户端1楼2024-05-04 21:58回复
    老哥我遇到问题和你一样


    IP属地:福建来自Android客户端2楼2024-06-21 21:45
    收起回复


      IP属地:福建来自Android客户端3楼2024-06-21 21:45
      回复
        加个QQ交流一下呗


        IP属地:河南来自Android客户端4楼2024-07-10 23:47
        回复
          351191047遇到的问题差不多


          IP属地:河南来自Android客户端5楼2024-07-10 23:47
          回复
            你把损失函数前面加一个-log
            损失函数写错了 重新设计一下


            IP属地:山西6楼2024-07-16 09:57
            回复