next up previous contents
Next: About this document Up: 研究成果の概要 Previous: 3次元講義室空間の動的状況把握による映像生成法の開発

視覚に基づくロボットの多種行動の獲得及び統合方式の開発

担当:浅田 稔(大阪大学)

本研究では,視覚を備えた移動ロボット群に統一の取れたチームプレイ動作を 行わせるためのロボット間の協調及び競合行動を視覚に基づいた強化学習によっ て獲得する手法を考案し,その有効性を実ロボットによる実験によって検証す ることを目的とする.特に,物理的身体性を持ったロボットに協調動作を行わ せるには,いわゆる「アイ・コンタクト」のようなメッセージ通信なし のコミュニケーションを実現することが重要であると考え,そのための視覚 機能や行動制御方式の研究を実施する.

具体的な問題設定としては,ロボットによるサッカー競技を取り上げ,ドリブ ル,シュートなどの個々のロボットの行動,パス,センタリングなどの複数ロ ボット間の協調行動,さらにはブロックなどの競争行動を視覚に基づいた学習 によって獲得するための方式の開発を目指す.この問題は,敵,味方に分かれ た多くのロボット群が存在するという環境の中で,他の個々のロボットの行動 理解及びチームとしての行動戦略パターンの理解などといった高度な視覚認識 の問題を含む.

昨年度は,研究プロジェクト初年度であり,主に理論的考察とシステムの設計 に時間を割いた.主な成果は,

  1. 強化学習を用いてロボットの行動を獲得す る際の基本問題点として,複数エージェント環境での同時学習による環境変動 問題,学習エージェントを単一に限ったとしても,他のエージェントの政策が 未知,及び学習エージェントの部分観測問題による情報の不完全・不確実問題 を指摘したこと
  2. 後者の問題を解決する手法として,強化学習を適用可能 とみなすための状態ベクトル推定手法を提案し,簡単なシミュレーション実験 を行ったこと
が挙げられる.

本年度は,提案手法を実ロボットに適用するために

  1. 状態推定ベクトルのコンピュータシミュレーションによる実験結果と実ロボッ トにおける推定ベクトルの比較
  2. 実環境での学習を加速するための学習スケジューリングの提案及び実験 を通じた考察
を行った.これらに加えて,分散協調視覚システムとして複数視覚移動ロボッ トを構築し,基礎実験を通じて,今後の課題などを探った(詳細は,本報告書 gifを参照).