Source code for mushroom_rl.algorithms.value.dqn.double_dqn

import numpy as np

from mushroom_rl.algorithms.value.dqn import DQN


[docs]class DoubleDQN(DQN):
    """
    Double DQN algorithm.
    "Deep Reinforcement Learning with Double Q-Learning".
    Hasselt H. V. et al.. 2016.

    """
[docs]    def _next_q(self, next_state, absorbing):
        q = self.approximator.predict(next_state, **self._predict_params)
        max_a = np.argmax(q, axis=1)

        double_q = self.target_approximator.predict(next_state, max_a, **self._predict_params)
        if np.any(absorbing):
            double_q *= 1 - absorbing

        return double_q