FC2ブログ

頭と尻尾はくれてやる!

パソコンおやじのiPhoneアプリ・サイト作成・運営日記


強化学習(DQN)で3枚板のロボットを歩かせる

3枚板ロボット
強化学習(DQN)が面白いので倒立振子の次にこんなのをやっている。↑
板を3枚ならべSceneKitのSCNPhysicsHingeJointで接続、両端の2枚にトルクをかけられるようにしてる。
従来通りTensorFlowで学習、SceneKitの物理エンジンを使ってる。

NNは全結合層をいくつか重ねたもので従来と同等レベル(今の所)。
入力は3枚の板の角度を過去4時刻分で12個。
出力は左右の板にプラスかマイナスのトルクをかける、ということで2x2の4個。

移動するほどいいよ、という報酬を与えて学習させてみたところ、、、



赤い線を右に行くように学習してるはずなのですが、、、
ぜんぜんダメです、ピクピクしてるだけですね!
はい、これから頑張ります。




<< shader modifiersでバグ回避  TopPage  強化学習(DQN)で倒立振子で入力を変更など >>

コメント


管理者にだけ表示を許可する
 

トラックバック

トラックバックURL
http://ringsbell.blog117.fc2.com/tb.php/1156-c9c64383




Copyright ©頭と尻尾はくれてやる!. Powered by FC2 Blog. Template by eriraha.

FC2Ad