强化学习吧 关注:321贴子:629
  • 1回复贴,共1

动作空间可变的问题,应该如何去做

只看楼主收藏回复

请问各位大佬,通常强化学习模型的动作空间都是固定的,比如上下左右等动作。但是我现在要做一个复杂网络的路径决策场景,随机网络上的某一个点,要去另外几个指定的节点之一卸货。但是要考虑卸货点的收益,以及路径各方面因素。也就是说该模型的动作是路径的决策。但是这个动作空间会随着我随便点的位置变化而变化。这类动作空间可变的问题,各位大佬有没有什么论文可以提供参考的。


IP属地:广东来自iPhone客户端1楼2024-03-07 17:28回复
    mask屏蔽不需要的动作


    IP属地:浙江2楼2024-09-13 11:20
    回复