0
Qラーニング更新ルールがある場合、強化学習におけるニューラルネットワークの目的は何ですか?
Gridworldなどの強化学習(RL)タスク用にニューラルネットワーク(NN)をトレーニングする目的について混乱しています。RLタスク、つまりq-learningには、q-learning更新ルールがあります。これは、いくつかの状態とアクション...
neural-networks reinforcement-learning deep-learning training q-learning