메인 알고리즘 추천: Deep Q-Network (DQN)

비교 알고리즘 추천

🔹 (a) Q-Learning (Tabular)

🔹 (b) Policy Gradient (REINFORCE)

🔹 (c) MCTS (no learning)


+) 시간이 된다면…

🔹 (d) Actor-Critic