DDPG by gymnasium 17日目

今回は、単純にノードを64から32に落としてみたらどうかと思います。

学習のステップ

  1. 100Steps x 1000Epsodes
  2. 200Steps x 1000Epsodes
  3. 300Steps x 1000Epsodes

非常にうまくいきました。文句なしです。

走りも安定しています。

 

これで、このDDPGシリーズはお終いにいたします。

続編はMalti Agent Deep Detarministic Policy Gradient:MADDPG の予定です。ありがとうございました。

 

 

The following two tabs change content below.

Keita N

最新記事 by Keita N (全て見る)