疑似シミュレータで強化学習(事例・応用例)
こんにちは。
前回のPart 1では強化学習の概要についてお話をしました。今回は強化学習の事例を紹介したいと思います。
~関連ブログ~
「強化学習でボールを自由に動かす ~ネズミを追いかけるボール~ Part 3 実際の機材を使用した強化学習(事例・応用例)」
1 ボールの自動転がし
ここで紹介する事例は、 「ボールの自動転がし」です(図1)。
図1 工事用一輪車(手押し車)
図1のように、工事用の一輪車に平らな板を載せ、その板の上にボールを置きます。この一輪車を左右の手で上下させることにより、板の上のボールを自由自在に転がそうというものです。ボールを板の上でピタッと静止させたり、「8の字」の形にボールを転がしたいと考えています。
ここでは本物の一輪車は使いません。図2のような機材を用います。人の眼をカメラに、人の手をサーボモータに置き換えて、ステージの上のボールを自動的に、自在にコントロールすることを目標にしています。
図2 ボール転がし機
このような技術はシステム制御工学の「フィードバック制御」と呼ばれる中の一つのようですが、ここでは強化学習を用いてボールの...
More
Author: fujita
強化学習でボールを自由に動かす ~ネズミを追いかけるボール~ Part 1
強化学習の概要
こんにちは。
前回は「倒立振り子」を例に、強化学習を用いた自動操作について紹介しました。
今回は強化学習と自動操作について、もう少し深くお話しをしたいと思います。
しかしその前に、このPart 1では強化学習の概要を紹介します。
~関連ブログ~
「強化学習でボールを自由に動かす ~ネズミを追いかけるボール~ Part 2 疑似シミュレータで強化学習(事例・応用例)」
「強化学習でボールを自由に動かす ~ネズミを追いかけるボール~ Part 3 実際の機材を使用した強化学習(事例・応用例)」
Deep Learning(深層学習)を用いた強化学習としてはDQN が有名ですが、最近では次のように様々なアルゴリズムが提案されています。
DQN (Deep Q Learning)
DDQN (Double DQN)
DDPG (Deep Deterministic Policy Gradient)
NAF (Continuous DQN (CDQN ))
CEM (Cross-Entropy Method)
Dueling DQN (Dueling network DQN)
Deep SARSA
A3C (Asynchronous Advantage Actor-Criti...
More
ネズミを追いかける振り子と機械の自動操作(深層強化学習 Deep Reinforcement Learning)
こんにちは。
今回は、「機械の自動操作」について、少しお話をしたいと思います。
機械学習の一つの領域に「強化学習」がありますが、強化学習とディープラーニングを統合させた深層強化学習を用いた、「機械の自動操作」についてご紹介したいと思います。
自動操作で最近のホットな話題は、「車の自動運転」です。
Googleをはじめ、車の製造メーカー各社は、大量の機械学習技術者を採用し、「車の自動運転」を目指して競争しているようです。
複数のモータをスムーズに制御しなければならいない人間型ロボットについても同様で、機械学習を用いた制御方法が盛んに研究されているようです。
「強化学習」の基本につきましては、「強い三目並べをつくる」をテーマに、書籍「実装 ディープラーニング」(2016 オーム社)の第6章で紹介させていただきました。詳しくはこちらをご覧下さい。
初めに、強化学習と自動操作の基本ともいえる「倒立振り子」のご紹介です。
ここでは、この「倒立振り子」も簡単な制御機械の一つとして考えています。
~関連ブログ~
「強化学習でボールを自由に動かす ~ネズミを追いかけるボール~ Part 1 強化学習の概要」
1 倒立振り子
上の図のような振り子を考えます。
こ...
More
弊社代表が「建設施工と建設機械シンポジウム」で講演いたします
一般社団法人 日本建設機械施工協会主催の「建設施工と建設機械シンポジウム」
において、弊社代表、藤田一弥 が特別講演を行います。
○一般社団法人 日本建設機械施工協会
http://www.jcmanet.or.jp/jcmanet/
○「建設施工と建設機械シンポジウム」に関する情報
http://www.jcmanet.or.jp/jcmanet/category/sympo/
・講演日時 平成29年11月9日(木) 14:40 ~
・場所 機械振興会館(東京都港区芝公園3-5-8)
・講演テーマ 「建設施工におけるビッグデータ・AI の活用に向けて」
More