担当:松山 隆司,和田 俊和(京都大学)
実世界を対象とした視覚システムでは,対象の検出や物体の形状計測に加え, 一連の画像系列から「どのような対象がいくつあり,それらがどのような動作 を行っているのか」といったシーン中で起きている事象を認識することが重要 になる.昨年度は,「選択的注視に基づく動作認識法」という映像データを基 にした新たな動作認識アルゴリズムを提案したが,それには以下のような問題 点があった.
今年度は,これらの問題を解決するために,以下の拡張を行った.
選択的注視に基づく動作認識システムは,注目領域内の画像の変化を検出する ための「イベント検出器」と,検出結果を入力とする「状態遷移モデル」から 構成される.状態遷移モデルの各状態は対象の動作段階に対応しており,対象 の動作の進行状況に応じて各状態が活性化され,注目領域が指定される.前年 度のシステムでは,どの状態が活性化されているのかだけを記録していたため, 異なった複数の対象が同じ動作段階にあるとそれらを区別することができなかっ た.
本年度開発したシステムでは,各対象ごとにトークンを設け,対象の動作が進 行するにつれて,トークンが状態遷移モデル中を伝搬するようにした.この拡 張によって,各対象ごとにその動作段階が区別できるようになり,対象の個数 を正しく認識することができるようになった.
選択的注視に基づく動作認識法において,視点の異なる複数映像の統合を行う には,映像,イベント,状態の3つのレベルで情報統合を行うことが可能であ る.本研究では,これら3つの情報統合機能を持ったシステムをそれぞれ開発 し,状態レベルでの情報統合が最も有効であり,より正確な動作認識が行える ことを実験によって示した.
実験では,人物の入室と退室の2つの動作クラスを対象とした動作認識を行っ た.その結果,図27に示すように,複数の人物が入室動作, 退室動作,それ以外の動作を同時に行うという非常に複雑な場合でも動作の種 類とその人数を正しく認識できることが確認でき,非常に安定,且つ,正確な 動作認識システムを構成することができた(詳細は,本報告書 を参照).
Figure 27: 認識対象画像の一例(原画像、変化領域)