一般に,複数視点から撮影された画像を解析し,統合された1つの結果を出す ような処理,たとえばステレオ画像から対象の3次元形状を推定するような処 理では,各視点で得られた画像は同一の時刻で撮影されたものであることを前 提としている.対象が静止している場合は,あまりこのことを気にせずに画像 を撮影しても構わないが,対象が動いている場合は,この前提が成立しないよ うな撮影を行うと,処理結果の精度に大きな影響を与えることになる.従って, 複数視点からの動画像を撮影する場合,最も重要な問題は,全ての動画像の各 フレームが同一のタイミングで取り込まれていること,言い換えれば,各フレー ムの同期がとれていることを保証することである.この問題を解決するには, 各カメラに同一の同期信号を外部から与え(外部同期),各カメラの撮影タイ ミングを同一にする必要がある.それに加えて,カメラからのデータをディジ タル化し入力する側でも,どのフレームが同一のタイミングで撮られたもので あるかを同定する必要がある.
従来の動画像処理研究では,データ量や記録スピードの問題から,画像を一旦 ビデオテープやビデオディスク装置に記録しておき,その後,各フレーム単位 で読み出してディジタル化する方式が用いられてきた.複数視点の場合は,各 カメラを外部同期で同一のフレームタイミングで動作させると共に,各ビデオ 記録装置に共通のタイムコードを記録し,フレーム単位で読み出す際に,この タイムコードでフレームの同定を行うようなシステムを構築する.しかし,こ のようなアナログ記録を基にした画像データは,画質や雑音の点で問題がある. 特に,カラー画像の場合は,ビデオ装置内部で何らかの情報の圧縮・変換を行っ ている場合が多く,注意が必要である.
最近では,ビデオ画像を非圧縮,実時間(30fps)で読み込むことが出来るよ うなPCやWS用の画像読み込みボードが入手可能になっており,前述の方式に比 べて画質の点で有利になると考えられる.しかし,この方式の場合は,ディジ タル化したデータの保存法が問題となる.すなわち,1秒間に30枚のディジタ ル画像(カラー画像で約32MB)が生成されるため,それを直接ディスク装置に 書き出すのが難しい.こ の問題に対処するにはメモリ空間を大きくすればよい.最近では,PC上のメモ リ空間も広がり,メモリ自体も安価になってきているので,1GB程度のメモリ を1台のPCに搭載するのはさほど難しいことではなくなってきている.1GBの メモリがあれば,30秒程度のビデオ映像の記録が可能であり,多くの動画像処 理研究には十分な長さと思われる.
以上の考察に基づき,本研究では,同期のとれた多視点動画像を獲得するシス テムとして,カメラからの入力を直接実時間でディジタル化し,メモリに格納 するという方式を採用し,システムの開発を行った.この方式を採る場合,最 も大きな問題は,ディジタル化された各動画像で同一タイミングとなるフレー ムを同定することである.ビデオテープ装置などのように,タイムコードを記 録することのできる画像取り込みボードは現状では存在しないので,それに替 わる方法が必要である.
この問題を解決する方式として最も簡単な方法は,RGB入力が可能な画像読み 込みボードの各チャンネルに,モノクロカメラの出力を入力するという方式で ある.この方式の場合は,完全に同じタイミングでディジタル化されてメモリ に書き出されるので,フレームの同定が不要である.しかしこの方法では,
そこで,本研究では,複数のPCにそれぞれ画像読み込みボードを搭載し,各カ メラからの出力をそれぞれの画像読み取りボードを介してPCのメモリ上に読み 込むシステムを構築した.問題となるフレームの同定は,全てのPCに同一のト リガ入力を与え,このトリガを受けると直ちに画像の取り込みが開始されるよ うな機構を実現し,メモリに読み込まれたフレームの順序で,同じ読み込みタ イミングのフレームを同定することにした.トリガが与えられて画像読み込み が開始されるまでの時間が各読み込みシステムでほぼ同じであれば,この方式 でフレームの同定が可能である.この方式の利点は,4台以上のカメラが利用 でき,カラー画像の入力も可能になるという点で,前述の方式より優れている.