2011/04/13更新

"Computational Photography" の伝道師 ~前編~

前述したように、人間のビジュアル・アビリティを無限に高めていくことが、MITへの移籍をきかっけにRaskar氏が設定した大きな自己目標だった。そして同時にこれは、Raskar氏が自らの研究室に命名した"Camera Culture"グループの大黒柱ともなっている。実際のところ、MITにおいてこれまでRaskar氏らが発表してきたデバイスは、どれも一般常識にのっとったカメラの概念とは大きくかけ離れたものばかりなのだが、これこそがRasker氏が目指す近未来のカメラへの第一歩にあたるのだ。Computational Light Transportに代表される新たなコンセプトの技術を導入して、これまで誰も考えつかなかったような技術的インパクトのあるカメラを生み出していくことが、Rasker氏が率いる"Camera Culture"グループのミッションだといえる。

しかし、Rasker氏が"Camera Culture"というフレーズに託しているのは、そのような技術的側面からのカメラ改革だけではない。人間が日々の生活を送っている社会とカメラとの関わり方にも、ある種の改革をもたらしたいという想いが託されているのだ。自分自身が社会を構成している1人の人間である以上、これも自己目標の達成と背中合わせで実現しなくてはならない重要な課題と考えているようだ。いってみれば"社会的インパクト"のあるカメラを作り出すということが、"Camera Culture"のもう1つの柱となっているのだ。そして、そのための具体的なプロジェクトが、SIGGRAPH2009で発表された"Bokode"およびSIGRAPH2010で発表された"NETRA"だといえる。

デバイス④

“Bokode”とは、Bokeh(日本語のボケからきている)のメカニズムを利用したバーコードの進化版といえる。バーコードは小さいほどよいのだが、コードを読みとる性能には限界があるので、ある程度の大きさをもたせておく必要があった。しかし、バーコードの代わりに“Bokode”を用いると、通常のカメラを用いて遠方からコードのスケールをより大きく写し出すことができるようになる。

“Bokode”の実体は、バーコードよりも遥かに小さい(直径2〜3ミリほどの)コードとレンズを1組にしたもので、レンズから焦点距離の長さだけ離れた後方に、コードとLEDが設置されている。このような構造にすると、レンズから出る平行光によってコードの情報が運び出されるため、フォーカスを無限遠に設定したカメラを用いれば情報を鮮明にとらえることができる。なおかつ、こうして捉えられたコードには“Bokode”の焦点距離と撮影カメラの焦点距離との比に相当するスケールがかかる。通常のカメラの焦点距離は“Bokode”の焦点距離よりも遥かに長いため、コードには非常に大きなスケールがかかることになる。

当初のデバイスでは、コードの前にはレンズの代わりにピンホールが設置されていた。撮影カメラをアウト・オブ・フォーカス(ピンボケ)の状態にして“Bokode”をとらえることによって、カメラを遠ざけるほどコードのスケールを大きくできるということが発想の原点となっていた。だが、このピンホールでは実用面から見て精度に限界があるため、レンズを用いる構造が導き出された。手法としてのアイディアもさることながら、なによりその発想のユニークさが2009年のSIGGRAPHでは大きな話題となり、Raskar氏の狙いどおり、“社会的インパクト”の大きなデバイスの誕生となった。

"Bokode"
"Bokode: Imperceptible Visual tags for Camera Based Interaction from a Distance"
(Ankit Mohan, Grace Woo, Shinsaku Hiuray, Quinn Smithwick, Ramesh Raskar, SIGGRAPH2009)
(C)ACM 2009
"Bokode"とは、図aのような非常に小さいコードパターンとレンズを1組にしたデバイスである。図bのように、通常のカメラを用いて、商品にとりつけられた"Bokode"を遠くからアウト・オブ・フォーカス(ピンボケ)の状態で撮影すると、コードの情報が大きく鮮明に写し出される。(図b中央は"Bokode"を近くからフォーカスした状態で撮影したもので、図b右端は"Bokode"を遠くからアウト・オブ・フォーカスの状態で撮影したものである)
当初のデバイスでは、図c左のようにコードの前にピンホールが設置されていた。撮影カメラのレンズをアウト・オブ・フォーカスの位置に設定して撮影すると、コードに大きなスケールがかかる。
図c右のようなレンズを用いた"Bokode"の構造の場合、コードからレンズを焦点距離の長さだけ離して設置すると、レンズからは平行光が出るため、撮影カメラのレンズをセンサから焦点距離の長さだけ離してフォーカスを無限遠に設定すれば、情報を鮮明にとらえることができる。この場合、コードには"Bokode"のレンズの焦点距離と、撮影カメラのレンズの焦点距離との比に等しいスケールがかかる。

デバイス⑤

Raskar氏らのチームは、SIGGRAPH2010ではポータブルな視力測定デバイスである“NETRA”を発表した。なにぶん、人間が快適な日常生活を送るために不可欠な“視力”という要素をテーマにしているだけに、このデバイスも大きな話題となった。“Bokode”と同様、“社会的インパクト”の大きなデバイスといえる。ただ、“Bokode”が商品の流通や宣伝という比較的豊かな社会におけるインパクトを意識したものであったのに対して、“NETRA”は眼鏡を作ることもままならない、決して豊かとはいえない社会におけるインパクトを優先したものであったともいえる。Raskar氏はインドからアメリカに渡り研究者として大きな成功をおさめたわけだが、その過程で自らの肌をとおして、インドとアメリカの生活環境や教育レベルの違いを痛感したようだ。今日では眼鏡のレンズそのものは決して高価なものとはいえないのだが、自分の目に合った眼鏡を作るための診断は、豊かではない国々の平均層の人々にとっては、まだ手の届かない存在であることも多い。そしてこのような環境が(文字を読むということが不可欠な)教育の妨げになっている場合もあるそうだ。Raskar氏がこのプロジェクにかけた想いの中には、あらゆる社会のすべての人々に、豊かな教育の恩恵にあずかるチャンスを平等に与えたいという願いも込められていたようだ。

またこのプロジェクトには、Raskar氏の教育者としての新たな一面も垣間見られる。“NETRA”は、“Shield Field”や“BiDi Screen”同様にライトフィールド・デバイスの1種だといえる。これまで見てきたように、Raskar氏はライトフィールドの考え方をこれまでの常識的な活用範囲を越えた領域に持ち込むことに非常に積極的で、“NETRA”はその究極の形ともいえるのだ。ただし、“Shield Field”や“BiDi Screen”がRaskar氏の専門分野の範疇に収まっていたのとは異なり、“NETRA”の開発には人間の目に関する生理学的な知識という、Raskar氏にとって全く専門外の要素をうまく導入する必要があった。そしてこれを可能にしたのが、2009年にRaskar氏の研究室の門を叩いたVitor Pamplonaという学生だった。Raskar氏の研究室に入ってくる学生のほとんどは、コンピュータ・ビジョンやComputational Photography分野のバックグラウンドをもっているのだが、Pamplona氏のバックグラウンドは全く違っていた。Pamplona氏はブラジルの大学で、一貫して目に関する生理学的な研究成果とCGを結びつける研究を行ってきた。Computational PhotographyというPamplona氏にとっては全く新しい領域に足を踏み入れることによって、これまでの研究成果をより実用的なものにしたいと願っていた。したがって“NETRA”の開発では、ライトフィールド・デバイスとしての大枠はRaskar氏が担当し、目に関する生理学的な知識が必要とされる部分はPamplona氏に任された。そしてこの作業を通して、Pamplona氏はComputational Photographyという分野に開眼していった。その一方で、Raskar氏は研究室を開設した後、どちらかというとチームリーダ的な存在としてプロジェクトを盛り上げてきたわけだが、ここにきて“教え導く”という教育者としての新たな境地に開眼したともいえそうだ。

“NETRA”の本体は、検眼用のパターンを並べた高解像度のLCDと、その前に焦点距離の長さだけ離して配置されたマイクロレンズの配列で構成されている。LCDを発してマイクロレンズを通過するレイの集合が、ライトフィールドを作り出す。ユーザは、このライトフィールドに対してインタラクティブにアクセスすることによって、仮想的にパターンが配置されているデプス(奥行き)を変えることができる。ユーザがフォーカスできるデプスの領域を調べることが、視力の測定に相当するのだ。

具体的にいうと、LCD上のパターンどうしが一致して見えるときには、ユーザはパターンが仮想的にもっているデプスにフォーカスしていることになる。マイクロレンズはLCDから焦点距離の長さだけ離して配置されているため、マイクロレンズからは平行光が出る。したがって、ユーザはまず無限遠にフォーカスしようとする。正常な眼の人は無限遠にフォーカスできるので、この状態でパターンどうしは一致して見える。これに対して、近視のユーザは無限遠にフォーカスできないので、このパターンどうしが離れて見える。そこで、デバイスのボタンをクリックして、パターンどうしを近づけていく。このようにしてパターンを動かすと、LCD上での実際のパターンどうしの距離も縮まっていく。パターンどうしが一致して見えるときのLCD上でのパターンどうしの距離によって、ユーザがどれだけ遠くにフォーカスできるか(=近視の度合い)が示されることになる。同様にして遠視・乱視・老眼の度合いも調べることができる。

眼が正常でない状態や、その度合いを検出するためには、一般的にはパターンがどのくらいボケて見えるかが尺度になっている場合が多いのだが、この“ボケ具合”をユーザが知覚する基準は非常に曖昧だ。“NETRA”では、この曖昧な基準を“パターンどうしが一致して見えるかどうか”という、ユーザがより明確に判断しやすい基準に置き換えているところが鍵となっている。デバイスそのものが非常に低コストで作成できる点も大きな魅力といえ、すでにインドでは“NETRA”の導入を開始した組織が数多く出てきているそうだ。

また、SIGGRAPH2011の論文セッションでは、“NETRA”のコンセプトを引き継いだ新たなデバイスも発表される予定だ。こちらは白内障の度合いの測定や、シミュレーションを目的にしたポータブルなデバイスで、Raskar氏がいうところのComputational Light Transportの考え方をより深く反映させたデバイスとなっているそうだ。

"NETRA"
"NETRA: Interactive Display for Estimating Refractive Errors and Focal Range"
(Vitor F. Pamplona, Ankit Mohan, Manuel M. Oliveira, Ramesh Raskar, SIGGRAPH2010)
(C)ACM 2010
デフォルト状態の"NETRA"を、正常な視力のユーザが見た場合、LCD上の2つのライン(図a)は一致している。図b左は、そのときのデバイスとユーザの目の関係を示しており、上のラインを点A、下のラインを点Bとすると、網膜上では点Aと点Bの像が一致している。
ユーザが近視の場合には、LCD上の2つのラインは離れて見える。図b右は、そのときのデバイスとユーザの目の関係を示している。網膜上では点Aと点Bの像が一致していないので、ユーザはボタンをクリックしてラインどうしが一致するまで近づけていく。(図b右の、点Aは点A'に、点Bは点B'に移動し、網膜上で点A'と点B'の像が一致する)ラインどうしが一致して見えたときの、LCD上でのラインどうしの距離(図b右の距離A'B')を用いて、ユーザがフォーカスできた地点のデプス(図b右の距離d)を知ることができる。
実際には図bのようなピンポールの配列の代わりに、図cのようなマイクロレンズの配列が用いられている。マイクロレンズは、LCDからレンズの焦点距離の長さだけ離して配置されているため、レンズからは平行光が出る(図c右)。このためデフォルト状態で、ユーザは無限遠にフォーカスしようとする。この状態からパターンどうしを近づけることによって、最も遠くにフォーカスできるデプス(近視の度合い)が明らかになる。


"人間のビジュアル・アビリティを無限に高める""社会的インパクトのあるカメラを作り出す"という2つ目標の実現を目指し、Raskar氏と"Camera Culture"グループ挑戦は今後も続いていくだろう。引き続き、彼らの活躍に注目していきたい。