歩容映像解析(1)

八木 康史
大阪大学産業科学研究所
教授
八木 康史

1 概要

 数十メートル離れた場所からだと,人の顔がよく見えず,近づいてくるまで誰だかわからなかったという経験をした人は多いと思う.その一方で,遠くにいる人でも,誰が近づいてきたか.全体の動きや風貌からわかったという経験をした人も多い.これは,体型や歩行パターンにも個人差があり,よく知っている人,日常的に接する人の場合,その個性から,遠方から近づく人の認識を可能にしているからである.
 歩容(または,歩様)は,動物が地面の上を移動する際の手足の動き,即ち,歩行のパターンを表す用語であり,生体運動学や制御工学の分野で古くから研究対象とされてきた.特に,四足歩行の動物の典型例として,馬の歩容が古くから研究されており,速さが増すにつれて,常足 (Walk)・早足 (Trot)・駆足 (Cantor/Gallop) と変化し,四足の着地のタイミングが変化する.一方で,二足歩行であるヒトの歩容は,基本的には左右の足を順に前に出して歩くことから,四足歩行の動物と比較するとその変化は限定的である.しかしながら,二足歩行であるヒトの歩容には,依然として多様な情報が含まれることが知られている.例えば,精神生理学の分野は,歩容から知人を認識する実験や人物の性別を識別する実験が行われている[1].また,点光源を人体の関節部に付けて表示するキネマティクス情報から,個人識別や感情の属性推定が可能であるということも報告されている[2][3]
 さて,歩容映像にはどんな情報が含まれているのだろうか.図1の示すように,歩き方には,腕の振り・歩幅の違い・姿勢の違い・動きの左右非対称性などに明確な違いが見られ,歩容映像解析とは,この歩き方の違いを特徴として捉えた映像解析技術である.

図1 歩き方の個性(左)と歩容特徴(右)
図1 歩き方の個性(左)と歩容特徴(右)

 歩容映像解析の研究には,歩行者検出及び追瀬,歩容タイプ分類,個人認証,年齢推定,性別分類,感情・意図理解,歩き方の美しさ推定,疾病診断,リハリビティーションなど多岐に渡る.例えば,歩行と病気の関係では,例えば,脳神経疾患者の場合,痙性歩行(つま先をひきずる歩行),小刻み歩行(前かがみ・小刻み・手をあまり振らない歩行)などの歩行障害が現れる.病気診断の補助手段として,歩容解析を行う試みが行われている.また,年齢推定,性別分類などの技術は,マーケティング情報の獲得,迷子発見など,遠隔からの顧客モニタリングとしての活用が期待される.このように歩容は,個体差に加えて,身体特徴,健康状態,精神状態,性別や年齢など,多様な情報を含む生体情報といえる.

図2 生体認証技術と観測距離の関係
図2 生体認証技術と観測距離の関係

 歩容認証は,個人性に着目した,個人を認証する技術である[4][5].歩容は,指紋・静脈・虹彩といったほかの生体情報とは異なり,対象者がカメラ(センサ)から遠く離れた場所でも個人認証が可能な唯一のモダリティとして注目を集めている(図2).例えば,図 3 に示すように,ある人物の歩行画像がカメラから遠く離れた場所で撮影されたとする.この例では,人物領域を拡大した画像から分かるように,歩容・体型などを含めた全身像としての情報は,ある程度,観察可能である.一方, 顔領域を拡大した画像から分かるように,顔認証に必要な解像度は不足している.特に,防犯カメラ映像を用いた犯罪捜査の場面を想定すると,低解像度の問題以外にも,対象者がサングラス・マスク・ヘルメット・目出し帽などで顔を隠している場合 や,後ろを向いていて顔が映っていないなど,顔認証の利用が 困難となる場合が考えられる.そのような場合でも歩容認証は 利用可能であることから,防犯カメラ映像を用いた歩容認証による科学捜査への応用が期待されている.本稿では,個人認証に焦点を当てて歩容映像解析技術を解説する.

図3 遠方からの個人認証
図3 遠方からの個人認証

2.歩容認証

 歩容認証は,個人毎で体型や動きが異なることに着目した個人認証技術で, 2017年改正個人情報保護法の個人情報の保護に関する法律施行令にて,個人識別符号として,DNA,指・掌紋,虹彩,顔,手・指の静脈,声紋とともに,歩容は定義されるなど,バイオメトリクスのモダリティの一つとして扱われている.では,どうやって,個人認証を行うのか,簡単にその概要を説明する.
 一般に歩行とは,右左の繰り返し動作と考えることができ,2歩を基準に映像列として扱うことが多い.得られた歩容映像列に対して,直接映像を扱う手法をアピアランスベースの表現と呼び,この20年歩容認証の主流のアプローチであった.一方,近年,人体動作を肘や膝といった関節点と体の部位の大きさをパラメータとするモデルベース表現(スケルトンモデル)が再注目され,多くの研究が行われている.モデルベースでは,対象人物の領域 に対して,人体モデルの当てはめを行い,歩幅や関節角の時系列といった歩容パラメータを特徴として抽出する.再注目されだしたのは,人体モデルの当てはめの精度向上よるところが大きい.
 アピアランスベースの場合, 入力映像やシルエット画像列に対して,時間または空間,もしくはその両方に対する解析(例えば,平均化処理や周波数解析)を行い,歩容特徴を抽出する.抽出した歩容特徴と,登録されている歩容特徴との照合により識別処理を行う(図4).一般的には, 歩容特徴の各要素を並べた特徴ベクトルを定義し, 入力・登録データの特徴ベクトル間の相違度(若しくは類似度)を算出する.相違度は,単純に特徴ベクトル間のノルムとして算出されることもあれば,機械学習手法を用いて,特徴ベクトルを識別により適した特徴空間や計量空間に変換してから算出されることもある.このようにして算出された相違度に基づき,本人認証や個人識別を行う.

図4 歩容認証の基本的な流れ
図4 歩容認証の基本的な流れ

 2006年,我々が提案した歩容特徴は,画素毎に時間軸方向に離散フーリエ変換を行うことで得られる振幅スペクトルを用いた[6].言葉だけではわかりにくいので図1の例をもとに解説する.図1は,被験者の歩容シルエットデータならびにそこから抽出された歩容特徴(周波数領域特徴)である.フーリエ変換における0次成分は,二歩分の映像列に対して,時間軸方向に輝度値の平均値を計算したものである.図中,真っ白な画素では,ずっとシルエットが写っていたことになり,一方で真っ黒の画素は,一度もシルエットが通過していない画素である.通常,胴体は動きが少ないことから,真っ白に現れ,人の空間的特徴である,体格の違いや歩くときの姿勢の違いが現れる.1次成分には,腕の振り方など左右での違いといった,非対称な動きが現れる.一方,2次成分には,腕や足の振り幅,肩や頭のリズミカルな上下動や左右への揺れ幅など,左右対称的な動きが現れる.すなわち,周波数領域特徴には,歩幅,手足の振り,姿勢など,無意識下で現れる周期的な動きが特徴として含まれている. 歩行の個性が特徴表現できれば,あとは,パターン認識の枠組みの中で,個人認証は可能である.図4に示すように,特徴の相違度の図において,赤や緑は相違度が一方にしかない特徴を表している.
 2012 年当時,被験者数約4000名の世界最大の歩容データベースを構築し,そのデータを用いて評価を実施した.登録データと同一向きを歩行する場合で,1対多照合の個人認証におけるRANK1照合率は94%,また,1対1照合の個人認証における本人拒否と他人受入のEqual Error Rateは1.15%という結果が得られた.当時の世界最高性能である.GPU等に代表される計算能力の向上は,ビッグデータを必要とする深層学習の活躍の場を与えたといって過言でない.歩容認証においても,深層学習を用いたアプローチがトップ性能を叩き出している.性能の向上だけでなく,正面向きと側面向きといった,向きの違い,服装の違いなど,多様な変動要因に対しても頑健な手法が現れてきた.最先端の歩容認証の性能は,例えば,モデルベースでは,EERで0.21%と高性能を叩き出している[7]



次回に続く-



参考文献

  1. Kozlowski, L.T. and Cutting, J.E., Recognizing the sex of a walker from a dynamic point-light display, Perception & Psychophysics 21(6), 575-580, 1977.
  2. Troje, N.F., Decomposing biological motion: A framework for analysis and synthesis of human gait patterns, J. of Vision 2, 371-387, 2002.
  3. Stevenage, S., Nixon, M., Vince, K., Visual analysis of Ggait as a cue to identity, Applied Cognitive Psychology 13, 513-526, 1999.
  4. Nixon, M.S., Tan, T.N., and Chellappa, R., Human identification based on gait, Springer-Verlag, 2005.
  5. Y. Makihara, D.S. Matovski, M.S. Nixon, J.N. Carter, and Y. Yagi, Gait recognition: databases, representations, and applications, John Wiley & Sons, Inc., pp.1-15, 2015.
  6. Y. Makihara, R. Sagawa, Y. Mukaigawa, T. Echigo, and Y. Yagi, Gait recognition using a view transformation model in the frequency domain, Proc. 9th Eur. Conf. Computer Vision, pp.151–163, 2006.
  7. X. Li, Y. Makihara, C. Xu, Y. Yagi, End-to-end model-based gait recognition using synchronized multi-view pose constraint, Proc. of the 1st Int. Workshop on Human-centric Trustworthy Computer Vision: From Research to Applications, pp. 4106-4115, 2021.


【著者紹介】
八木 康史(やぎ やすし)
大阪大学産業科学研究所 教授

■略歴
1985年大阪大学大学院基礎工学研究科修士課程了。工学博士。1985年三菱電機(株)応用機器研究所/産業システム研究所研究員。平成2年大阪大学助手、同講師、同助教授を経て、平成15年大阪大学産業科学研究所教授、平成24年 同研究所長、平成27年8月から令和元年8月まで大阪大学理事・副学長(研究、産学共創、図書館担当)を経て、令和元年8月より産業科学研究所教授、JST創発的研究支援事業プログラムオフィサー、AMED臨床研究等ICT基盤構築・人工知能実装研究事業プログラムオフィサー。平成30年からは、パーソナルデータの利活用により、身体の健康、心の健康、社会的健康(コミュニケーション)、環境の健康を基軸にして輝く人生(高いQOL)をデザインし、様々な技術革新と社会経済環境の変革を大学から発信することを目指す、ライフデザイン・イノベーション研究拠点本部長、データ取引市場MYPLRを運用する(一社)データビリティコンソーシアム代表理事。
 コンピュータビジョン、パターン認識、ロボットビジョンの研究の従事。Asian Federation of Computer Vision Societies (Vice President)。情報処理学会フェロー。知能ロボット、コンピュータビジョン分野で普及した、周囲360度を一度に撮影できる全方位カメラを1980年代に考案、特に移動ロボットのための視覚技術として展開、電子情報通信学会論文賞等を受賞。また、人の歩く姿から個人を識別する歩容認証技術に関して,世界初の歩容鑑定システムをリリース、その成果から、2014年、科学技術分野の文部科学大臣表彰 科学技術賞 研究部門「歩容映像解析とその科学捜査利用に関する研究」受賞。2016年春、刑事裁判にて鑑定結果の証拠力が日本の裁判所で認められる。