図面 (/)

技術 特徴量抽出装置及び特徴量抽出方法

出願人 パナソニックIPマネジメント株式会社
発明者 松本裕一ヘーン・チャー・ケーン
出願日 2011年7月29日 (8年6ヶ月経過) 出願番号 2011-167232
公開日 2013年2月7日 (7年0ヶ月経過) 公開番号 2013-030104
状態 特許登録済
技術分野 イメージ分析
主要キーワード 比較対 輝度値比 大小比較結果 バイナリパターン バイナリ化 除去レベル 特徴量抽出装置 画像判定装置
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2013年2月7日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

課題

人物や車、バイクといった一般物体を高精度に検出することができるとともに、特徴量抽出による処理量メモリ使用量を少なく抑えることができる特徴量抽出装置及び特徴量抽出方法を提供する。

解決手段

入力画像20から複数の変換画像21,22,23,…を生成し、各々の変換画像21,22,23,…から、その特性に応じて、より適した特徴量生成パターン301,302,303,…、311,312,313,…、321,322,…を抽出し、さらに各々の変換画像21,22,23,…を複数個に分割した各々の局所領域211,212,213,…,216、221,222,223,…,226、231,232,233,…,236内において、その特徴量生成パターン数の変換画像識別記号頻度分布50,51,52,…を算出し、それらを集約した識別記号頻度分布60を最終的な特徴量とする。

概要

背景

入力画像に対して画像変換を行い、得られた変換画像から特徴量の抽出を行い、SVM(Support Vector Machine)やBoosting等の統計的学習方法を用いて物体を検出する装置が案出されている。特徴量として、例えば特許文献1、非特許文献1及び2に記載されているものなどがある。非特許文献1に記載されている特徴量は、LBP(Local Binary Patterns)特徴量と呼ばれており、非特許文献2に記載されている特徴量は、非特許文献1に記載されたLBP特徴量を改良したものであり、Extended Set of Local Binary Patternsと呼ばれている。

概要

人物や車、バイクといった一般物体を高精度に検出することができるとともに、特徴量抽出による処理量メモリ使用量を少なく抑えることができる特徴量抽出装置及び特徴量抽出方法を提供する。入力画像20から複数の変換画像21,22,23,…を生成し、各々の変換画像21,22,23,…から、その特性に応じて、より適した特徴量生成パターン301,302,303,…、311,312,313,…、321,322,…を抽出し、さらに各々の変換画像21,22,23,…を複数個に分割した各々の局所領域211,212,213,…,216、221,222,223,…,226、231,232,233,…,236内において、その特徴量生成パターン数の変換画像識別記号頻度分布50,51,52,…を算出し、それらを集約した識別記号頻度分布60を最終的な特徴量とする。

目的

本発明は、係る事情に鑑みてなされたものであり、人物や車、バイクといった一般物体を高精度に検出することができるとともに、特徴量抽出による処理量やメモリ使用量を少なく抑えることができる特徴量抽出装置及び特徴量抽出方法を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

画像を入力する画像入力部と、前記入力した画像を前記入力した画像の特徴量を抽出するための少なくとも1つの変換画像に変換する変換画像生成部と、少なくとも1つの画素から構成されるユニットを配列したユニット配列内の、該ユニット同士の値の比較を行う複数のユニット位置比較対で構成される特徴量生成パターンを記憶する特徴量生成パターン保持部と、前記変換画像に対して前記特徴量生成パターンを参照することにより、前記比較対に対応するユニット同士の値の比較を行い、前記変換画像の特徴量を抽出する特徴量抽出部と、を備えたことを特徴とする特徴量抽出装置

請求項2

前記ユニットの値は、前記ユニットの画素の輝度値から得られることを特徴とする請求項1に記載の特徴量抽出装置。

請求項3

前記特徴量生成パターンを構成する前記複数の比較対は、比較対毎に所定の識別記号によって区別され、前記特徴量抽出部は、前記変換画像に対する前記特徴量生成パターンの参照位置を変えながら、前記参照を複数回行い、前記所定の識別記号の頻度分布により前記変換画像の特徴量を抽出することを特徴とする請求項1又は請求項2に記載の特徴量抽出装置。

請求項4

前記変換画像を複数の局所領域に分割し、前記局所領域毎に求めた前記頻度分布から前記変換画像の特徴量を求めることを特徴とする請求項3に記載の特徴量抽出装置。

請求項5

前記複数の変換画像をそれぞれ複数の局所領域に分割し、前記局所領域毎に求めた前記頻度分布を前記変換画像毎に集めた集約特徴量を求め、前記複数の変換画像毎の前記集約特徴量から入力画像の特徴量を求めることを特徴とする請求項3に記載の特徴量抽出装置。

請求項6

画像を判別するための判別対象の有する特徴量を保持する特徴量保持手段と、請求項1乃至請求項5のいずれか一項に記載の特徴量抽出装置と、を備え、前記入力画像に前記判別対象が含まれているか否かを判定することを特徴とする画像判定装置

請求項7

画像を入力する画像入力ステップと、前記入力した画像を前記入力した画像の特徴量を抽出するための少なくとも1つの変換画像に変換する変換画像生成ステップと、少なくとも1つの画素から構成されるユニットを配列したユニット配列内の、該ユニット同士の値の比較を行うユニット位置の複数の前記比較対で構成される特徴量生成パターンを記憶する特徴量生成パターン保持ステップと、前記変換画像に対して前記特徴量生成パターンを参照することにより、前記比較対に対応するユニット同士の値の比較を行い、前記変換画像の特徴量を抽出する特徴量抽出ステップと、を備えたことを特徴とする特徴量抽出方法

請求項8

画像を判別するための判別対象の有する特徴量を保持する特徴量保持ステップと、請求項7に記載の特徴量抽出方法を用いて、前記入力画像に前記判別対象が含まれているか否かを判定することを特徴とする画像判定方法

技術分野

0001

本発明は、入力画像から人物や車、バイクといった一般物体を検出するための特徴量を抽出する特徴量抽出装置及び特徴量抽出方法に関する。

背景技術

0002

入力画像に対して画像変換を行い、得られた変換画像から特徴量の抽出を行い、SVM(Support Vector Machine)やBoosting等の統計的学習方法を用いて物体を検出する装置が案出されている。特徴量として、例えば特許文献1、非特許文献1及び2に記載されているものなどがある。非特許文献1に記載されている特徴量は、LBP(Local Binary Patterns)特徴量と呼ばれており、非特許文献2に記載されている特徴量は、非特許文献1に記載されたLBP特徴量を改良したものであり、Extended Set of Local Binary Patternsと呼ばれている。

0003

特開2006−350645号公報

先行技術

0004

The Local Binary Pattern Approach to Texture Analysis-Extensions and Applications
Extended Set of Local Binary Patterns for Rapid Object Detection

発明が解決しようとする課題

0005

しかしながら、上述した非特許文献1,2及び特許文献1のそれぞれで開示された特徴量においては、以下に述べるような課題があった。
(1)非特許文献1に記載されている特徴量は、複数対の画素値同士の大小比較を行う局所的な特徴量であり、ノイズに弱く、大局的な情報が不足している。例えば、大小比較を行う複数対の画素値同士の中で、ノイズにより大小関係が異なる対がひとつでもあった場合、得られる特徴量は全く異なるものとなってしまう。
(2)特許文献1に記載されている特徴量は、複数の領域内の画素平均値同士の大小比較を行う大局的な特徴量であり、非特許文献1に記載されている特徴量の大局的情報不足を補う反面、大局的過ぎる傾向もある。
(3)非特許文献1、及び特許文献1それぞれに記載された特徴量に共通する課題として、これらの特徴量は、人物の顔の検出などにはある程度の検出精度が得られるものの、一般的に顔検出よりも検出難易度が高いとされている人物や車、バイクなどの一般物体の検出に対しては、十分な検出精度が得られないことが挙げられる。例えば、人物の顔の場合は、顔の特徴である目や、口などの顔のパーツ位置が顔の中のどのあたりにあるのか、人物に依存せずある程度決まっており、人物個体差によるパーツ位置の変動がほとんどない。このため、非特許文献1、及び特許文献1などの特徴量を用いて、顔のパーツ位置毎にその特徴を表現することで、安定した顔検出精度を得ることができる。一方、人物や車、バイクなどの一般物体は、物体の形状や姿勢などによって、その見え方は大きく異なることになり、人物の顔と比較し、個々の変動が大きいといえる。非特許文献1、及び特許文献1のような特徴量では、このような個々の変動を吸収することができず、検出精度が劣化してしまう。
(4)非特許文献2に記載されている特徴量は、複数対の画素値同士の大小比較を行うパターンの数を増加させ、さらに画素値同士の大小比較結果を、入力画像中局所領域毎頻度分布化することで、それぞれ検出精度の向上と、物体の形状や姿勢といった変動の吸収を図っている。しかしながら、単純に複数対の画素値同士の大小比較を行うパターンの数を増加させると、処理量メモリ使用量の増加につながる。

0006

本発明は、係る事情に鑑みてなされたものであり、人物や車、バイクといった一般物体を高精度に検出することができるとともに、特徴量抽出による処理量やメモリ使用量を少なく抑えることができる特徴量抽出装置及び特徴量抽出方法を提供することを目的とする。

課題を解決するための手段

0007

本発明の特徴量抽出装置は、画像を入力する画像入力部と、前記入力した画像を前記入力した画像の特徴量を抽出するための少なくとも1つの変換画像に変換する変換画像生成部と、少なくとも1つの画素から構成されるユニットを配列したユニット配列内の、該ユニット同士の値の比較を行う複数のユニット位置比較対で構成される特徴量生成パターンを記憶する特徴量生成パターン保持部と、前記変換画像に対して前記特徴量生成パターンを参照することにより、前記比較対に対応するユニット同士の値の比較を行い、前記変換画像の特徴量を抽出する特徴量抽出部と、を備えたことを特徴とする。

0008

上記構成によれば、複数の変換画像の各々の特性に応じて、より適した特徴量生成パターンを用いるので、人物、車、バイク等の一般物体を高精度で検出できる特徴量を得ることができる。

0009

上記構成において、前記ユニットの値は、前記ユニットの画素の輝度値から得られることを特徴とする。

0010

上記構成によれば、ユニットの値を、該ユニットの画素の輝度値、あるいは、該ユニットが含む複数の画素の輝度値の平均値から得ることにより、ノイズとなる成分を平滑化することができる。

0011

上記構成において、前記特徴量生成パターンを構成する前記複数の比較対は、比較対毎に所定の識別記号によって区別され、前記特徴量抽出部は、前記変換画像に対する前記特徴量生成パターンの参照位置を変えながら、前記参照を複数回行い、前記所定の識別記号の頻度分布により前記変換画像の特徴量を抽出することを特徴とする。

0012

上記構成によれば、人物、車、バイク等の一般物体を高精度で検出できる特徴量を得ることができる。

0013

上記構成において、前記変換画像を複数の局所領域に分割し、前記局所領域毎に求めた前記頻度分布から前記変換画像の特徴量を求めることを特徴とする。

0014

上記構成によれば、変換画像を複数の局所領域に分割し、局所領域毎に求めた前記頻度分布を作成することにより、人物、車、バイク等の一般物体の形状や姿勢といった変動の吸収を図ることができるため、人物、車、バイク等の一般物体を高精度で検出できる特徴量を得ることができる。

0015

上記構成において、前記複数の変換画像をそれぞれ複数の局所領域に分割し、前記局所領域毎に求めた前記頻度分布を前記変換画像毎に集めた集約特徴量を求め、前記複数の変換画像毎の前記集約特徴量から入力画像の特徴量を求めることを特徴とする。

0016

上記構成によれば、人物、車、バイク等の一般物体を高精度で検出できる特徴量を得ることができる。

0017

本発明の画像判定装置は、画像を判別するための判別対象の有する特徴量を保持する特徴量保持手段と、前記特徴量抽出装置と、を備え、前記入力画像に前記判別対象が含まれているか否かを判定することを特徴とする。

0018

上記構成によれば、人物、車、バイク等の一般物体を高精度で検出することができる。

0019

本発明の特徴量抽出方法は、画像を入力する画像入力ステップと、前記入力した画像を前記入力した画像の特徴量を抽出するための少なくとも1つの変換画像に変換する変換画像生成ステップと、少なくとも1つの画素から構成されるユニットを配列したユニット配列内の、該ユニット同士の値の比較を行うユニット位置の複数の前記比較対で構成される特徴量生成パターンを記憶する特徴量生成パターン保持ステップと、前記変換画像に対して前記特徴量生成パターンを参照することにより、前記比較対に対応するユニット同士の値の比較を行い、前記変換画像の特徴量を抽出する特徴量抽出ステップと、を備えたことを特徴とする。

0020

上記方法によれば、複数の変換画像の各々の特性に応じて、より適した特徴量生成パターンを用いるので、人物、車、バイク等の一般物体を高精度で検出できる特徴量を得ることができる。

0021

本発明の画像判定方法は、画像を判別するための判別対象の有する特徴量を保持する特徴量保持ステップと、前記特徴量生成方法を用いて、前記入力画像に前記判別対象が含まれているか否かを判定することを特徴とする。

0022

上記方法によれば、人物、車、バイク等の一般物体を高精度で検出することができる。

発明の効果

0023

本発明によれば、人物や車、バイクといった一般物体を高精度に検出することができるとともに、該検出処理における処理量やメモリ使用量を少なく抑えることができる。

図面の簡単な説明

0024

本発明の一実施の形態に係る特徴量抽出装置の概略構成を示すブロック図
図1の特徴量抽出装置の処理過程概要を模式的に示した図
図1の特徴量抽出装置において、変換画像を局所領域に分解する処理を模式的に示した図
図1の特徴量抽出装置において、局所領域中の各々の画素への識別記号ラベリングの一例を示す図
図1の特徴量抽出装置において、識別記号ラベリング値計算方法を示す図
図1の特徴量抽出装置において、1つの局所領域から、複数の異なる特徴量生成パターン毎に識別記号の頻度分布を得た場合の一例を模式的に示した図
図1の特徴量抽出装置において、入力画像を方向別グラディエント画像に変換した結果を模式的に示した図
図1の特徴量抽出装置において、入力画像を平均フィルタ画像に変換した結果を模式的に示した図
図1の特徴量抽出装置の応用例である変換画像間特徴量を説明するための図
図1の特徴量抽出装置を用いた画像判定装置の概略構成を示すブロック図

実施例

0025

以下、本発明を実施するための好適な実施の形態について、図面を参照して詳細に説明する。

0026

図1は、本発明の一実施の形態に係る特徴量抽出装置の概略構成を示すブロック図である。同図において、本実施の形態に係る特徴量抽出装置1は、画像入力部2、変換画像生成部3、特徴量生成パターン保持部4、特徴量抽出部5及び特徴量出力部6を備えている。画像入力部2は、画像を入力する。画像入力部2には、人物を撮影して得られた画像、車やバイクなどの一般物体を撮影して得られた画像が与えられる。変換画像生成部3は、画像入力部2が入力した画像から複数の変換画像を生成する。すなわち、変換画像生成部3は、画像入力部2が入力した画像を、該画像の特徴量を抽出するための少なくとも1つの変換画像に変換する。生成する変換画像としては、「グレースケール画像」、「ガウシアンフィルタ画像」、「方向別グラディエント画像」などである。

0027

特徴量生成パターン保持部4は、変換画像の特性に応じた特徴量生成パターンを保持する。詳細は後述するが、特徴量生成パターン保持部4は、少なくとも1つの画素から構成されるユニットを配列したユニット配列内の、該ユニット同士の値の比較を行う複数のユニット位置の比較対で構成される特徴量生成パターンを記憶する。例えば、グレースケール画像では、通常のLBPのように、ある基準画素と、その基準画素を中心とした周囲の近傍画素との輝度値の大小関係を記述するような特徴量生成パターンを記憶し、ガウシアンフィルタ画像では、変換画像を生成する過程の中で、既にノイズとなる高周波成分は取り除かれている場合が多いことから、局所的な特徴を捉える特徴量生成パターンを記憶すると良い。また、方向別グラディエント画像では、各方向別エッジを見る特徴量生成パターンのみを記憶する。

0028

特徴量抽出部5は、各変換画像に対して、指定された特徴量生成パターン毎に識別記号を抽出し、局所領域内でその識別記号数を頻度分布化する。識別記号を抽出する際には、特徴量生成パターン保持部4から、変換画像に対して特徴量生成パターンを参照することにより、比較対に対応するユニット同士の値の比較を行い、その比較結果から、変換画像の識別記号を抽出する。特徴量出力部6は、各変換画像から得られた識別記号の頻度分布を集約し、入力された画像の特徴量として出力する。

0029

図2は、本実施の形態に係る特徴量抽出装置1の処理過程の概要を模式的に示した図である。同図において、入力画像20がグレースケール画像21、ガウシアンフィルタ画像22、方向別グラディエント画像23等の画像に変換される。すなわち、入力画像20からグレースケール画像21、ガウシアンフィルタ画像22、方向別グラディエント画像23等の画像が生成される。これらの変換画像が生成された後、変換画像毎に、異なる特徴量生成パターン301,302,303,…、311,312,313,…、321,322,…が参照される。次いで、(1):変換画像毎に、該変換画像に対して局所領域211,212,213,…,216、221,222,223,…,226、231,232,233,…,236が設定される(すなわち、分割される)。次いで、(2):変換画像毎に、各局所領域において、ある1つの特徴量生成パターンを用いて、識別記号数が、局所領域内識別記号頻度分布401,402,…,406、411,412,…,416、421,422,…,426として表される。(3):(1)〜(2)の処理が特徴量生成パターンを変えながら、特徴量生成パターンの数だけ繰り返し実行される。

0030

例えば、グレースケール画像21では、グレースケール画像21に対して局所領域211,212,213,…,216が設定された後、各局所領域211,212,213,…,216において、ある1つの特徴量生成パターン301を用いて識別記号が各々の画素に対してラベリングされていき、その識別記号数が局所領域内識別記号頻度分布401,402,…,406、411,412,…,416、421,422,…,426として表され、その頻度分布が集約され、変換画像識別記号頻度分布50で表される。同様の処理が、残りの特徴量生成パターン302,303,…についても行われる。

0031

ガウシアンフィルタ画像22、方向別グラディエント画像23等の他の変換画像に対しても同様の処理が行われ、それらの変換画像における特徴量が変換画像識別記号頻度分布51,52,…で表される。そして、全ての変換画像における変換画像識別記号頻度分布51,52,…が集約されて、最終的な識別記号頻度分布60(特徴量)が求められる。この集約した特徴量を用いて人物、車、バイク等の物体の判定が行われる。

0032

次に、上記した各処理を詳細に説明する。
図3は、変換画像を局所領域に分解する処理を模式的に示した図である。図3の(a)は、変換画像の一例であるグレースケール画像21を示す図である。図3の(b)は、グレースケール画像21内を局所領域に分解した状態を示す図である。また、図3の(c)は、サイズを5×5画素とした局所領域26を示す図である。なお、変換画像のサイズ、その中に含まれる局所領域数、局所領域サイズ、局所領域の配置方法はこの例に限るものではない。また、局所領域は、図3の(b)に示すような規則正しい配置としなくても良いし、異なるサイズの局所領域同士をランダムな位置配置にしても良いし、そのような局所領域同士を重ね合わせても良い。以下、特徴量抽出の説明用として、5×5画素の局所領域に着目することとする。

0033

図4は、局所領域内の画素への識別記号ラベリングの一例を示す図である。図4では、3×3の特徴量生成パターンを例に挙げている。図4の(a)に示すような特徴量生成パターン361の場合、3対の輝度値比較を行うと、取り得るパターン数は“2”の3乗(3対あるので)で、“8”である。すなわち、“0〜7”の値(識別記号)で表現することができる。5×5画素の局所領域26内の各画素において、3×3の特徴量生成パターン361の参照位置(この例では、3×3の特徴量生成パターン361の中心位置のこと)を参照し、水平方向の3対の輝度値(例えば、画素361の輝度値と画素363の輝度値が一対目、画素364の輝度値と画素366の輝度値が二対目、画素367の輝度値と画素369の輝度値が三対目)の比較をそれぞれ行い、その結果から算出した識別記号“0〜7”の値を、特徴量生成パターンの参照位置に対応する局所領域内の画素にラベリングしていく。

0034

図4の(a)から分かるように、特徴量生成パターンは、少なくとも1つの画素から構成されるユニットを配列したユニット配列内の、該ユニット同士の比較を行う複数のユニット位置の比較対で構成されるものである。

0035

図4の(b)に示すように、局所領域26に対し、点線で囲んだ位置において特徴量生成パターン361を参照した場合、特徴量生成パターンの中心の値が“5”となる場合を例とする。この“5”の値は、特徴量生成パターン361の画素361の輝度値と画素363の輝度値と、画素364の輝度値と画素366の輝度値と、画素367の輝度値と画素369の輝度値の大小関係を比較することで、算出される。図5は、図4の場合の識別記号ラベリング値の計算方法を示す図である。同図に示すように、注目点の輝度値I(ref)と、その近傍にある輝度値I(n)の大小を比較し、“1”、“0”でバイナリ化する。特徴量生成パターン361の画素361の輝度値“22”と画素363の輝度値“8”の比較において、注目点の輝度値I(ref)“22”がその近傍の輝度値I(n)“8”以上の値であるので、“1”となる。次に、特徴量生成パターン361の画素364の輝度値“20”と画素366の輝度値“31”の比較において、注目点の輝度値I(ref)“20”がその近傍の輝度値I(n)“31”未満の値であるので、“0”となる。次に、特徴量生成パターン361の画素367の輝度値“17”と画素369の輝度値“15”の比較において、注目点の輝度値I(ref)“17”がその近傍の輝度値I(n)“15”以上の値であるので、“1”となる。したがって、バイナリパターンは、“101”で、この101は、1+4=5となり、識別記号ラベリング値は“5”となる。

0036

このようにして、局所領域26内で、特徴量生成パターン361を参照位置を変えながら参照させていくことで、特徴量生成パターン361における各々の識別記号ラベリング値の頻度が得られる。これらを頻度分布化すると、図4の(c)に示すようになる。図4に示す例では、識別記号ラベリング値“0”の頻度は“3”、識別記号ラベリング値“1”の頻度は“2”、識別記号ラベリング値“2”の頻度は“7”、識別記号ラベリング値“3”の頻度は“1”、識別記号ラベリング値“4”の頻度は“3”、識別記号ラベリング値“5”の頻度は“4”、識別記号ラベリング値“6”の頻度は“3”、識別記号ラベリング値“7”の頻度は“2”となる。

0037

特徴量生成パターン361以外の残りの特徴量生成パターン362,363,364,…についても同様に行う。
なお、特徴量生成パターンの作成方法は、上述した例に限るものではない。また、3×3、4×4、5×5、…等、サイズに制限はない。また、画素レベルの輝度値比較ではなく、2×2画素領域内平均輝度値と近傍の輝度値を比較する、あるいは、2×2画素領域内の平均輝度値と、近傍の2×2画素領域内の平均輝度値を比較する等、様々なバリエーションが考えられ、例えば、人物や車、バイク等の細部の特徴を捉えるためには3×3,4×4等の比較的局所的な特徴量生成パターンを用いれば良いし、大まかな形状を捉えるためには、5×5、7×7等の比較的大局的な特徴量生成パターンを用いれば良い。

0038

特徴量生成パターンに対し、4対の輝度値比較を行う場合、取り得るパターン数は2の4乗の“16”(0〜15の値)となり、3対の輝度値比較を行う場合と比較して2倍となる。

0039

1つの局所領域から、特徴量生成パターン毎に頻度分布が得られる。図6は、1つの局所領域から特徴量生成パターン毎に頻度分布を得た場合の一例を模式的に示した図である。図6の(イ)は、水平方向の3対の輝度値の比較により得られる識別記号ラベリング値の頻度分布、図6の(ロ)は、垂直方向の3対の画素値の比較により得られる識別記号ラベリング値の頻度分布、図6の(ハ)は、垂直、水平及び斜め方向の4対の画素値の比較により得られる識別記号ラベリング値の頻度分布を示している。また、1つの局所領域から得られる頻度分布を1つの頻度分布に集約し、この集約された頻度分布を“局所領域頻度分布”と呼ぶ。さらに、全ての局所領域頻度分布を1つの頻度分布に集約し、この頻度分布の度数値を最終的な“特徴量”とする。なお、これらの頻度分布の集約時には、単純に頻度分布同士を連結させるのではなく、Boosting等の統計的学習方法を用いることで、人物や車、バイクといった一般物体の検出精度に重要な意味合いを持つ局所領域を事前に記憶させておき、その局所領域に対応する頻度分布に対して重み付け等の処理を加えるようにしてもよい。

0040

以上説明した特徴量抽出処理を変換画像毎に行うが、変換画像毎に扱う特徴量生成パターンは異なる。例として、方向別グラディエント画像、平均フィルタ画像を挙げる。
(方向別グラディエント画像)
図7は、入力画像を方向別グラディエント画像に変換した結果を模式的に示した図である。同図に示すように、入力画像20(図7(a))を方向別グラディエント画像に変換すると、各変換画像27−1,27−2,27−3において得られる情報は意図的に限られてくる。すなわち、各変換画像27−1,27−2,27−3から有意な情報を抽出することが可能と事前に分かっている特徴量生成パターンのみを使用することで(あるいは、有意な情報が得られないような無駄な特徴量生成パターンを使用しないことで)、特徴量抽出処理による処理量の増加や、頻度分布保持のためのメモリ容量の増加、さらに、使用特徴量数の増加による判定用辞書部サイズの増加や、無駄な情報を使用して識別処理を行うことによる識別精度の劣化などを防ぐことができる。

0041

図7の(b)に示すように、垂直方向のエッジ成分27aに対しては、水平方向に比較する特徴量生成パターン361を使用し、図7の(c)に示すように、水平方向のエッジ成分27bに対しては、垂直方向に比較する特徴量生成パターン362を使用し、図7の(d)に示すように、斜め方向のエッジ成分27cに対しては、斜め方向に比較する特徴量生成パターン363を使用する。このように有意な情報が得られると事前に分かっている特徴量生成パターンのみを使用する。

0042

(平均フィルタ画像)
図8は、入力画像を平均フィルタ画像に変換した結果を模式的に示した図である。同図に示すように、入力画像20(図8(a))を、フィルタパラメータを変更しながら平均フィルタ画像に変換すると、図8の(b),(c)に示すように、高周波成分の除去レベルを制御した画像28−1,28−2を得ることができる。入力画像20に高周波成分が多く残っている場合、図8の(b)に示す画像28−1のように、ノイズが多く含まれている可能性が高いので、例えばノイズによって有意ではない情報を抽出してしまう可能性のある画素レベルの輝度値大小比較を行う特徴量生成パターンを使用せずに、ノイズに対してロバスト性があるような2×2画素領域内の平均輝度値を比較するようなパターン37を用いることで、ノイズ対策を施した有意な特徴量抽出を行うことができる。一方、図8の(c)に示すように、高周波成分が多く取り除かれたような画像28−2では、既にノイズ除去は終わっているので、2×2画素領域内の平均輝度値(“・”で示す)を比較するようなパターンを使用する必要はなく、3×3画素で画素レベルの比較を行う特徴量生成パターン363のみ用いる。

0043

このように、本実施の形態に係る特徴量抽出装置1によれば、1つの入力画像20から複数の変換画像21,22,23,…を生成し、各々の変換画像21,22,23,…から、その特性に応じて、より適した特徴量生成パターン301,302,303,…、311,312,313,…、321,322,…を抽出し、さらに各々の変換画像21,22,23,…を複数個に分割した各々の局所領域211,212,213,…,218、221,222,223,…,228、231,232,233,…,238内において、その特徴量生成パターン数の変換画像識別記号頻度分布50,51,52,…を算出し、それらを集約した識別記号頻度分布60を最終的な特徴量とするので、この特徴量を画像判定装置などの物体を検出する装置に用いることで、人物、車、バイクなどの一般物体を高精度で検出することが可能となる。

0044

また、各変換画像27−1,27−2,27−3から有意な情報を抽出することが可能な特徴量生成パターンのみを使用することで、特徴量抽出処理による処理量の増加や、頻度分布保持のためのメモリ容量の増加、さらには、使用特徴量数の増加による判定用辞書部サイズの増加や、無駄な情報を使用して識別処理を行うことによる識別精度の劣化などを防ぐことができる。

0045

なお、本実施の形態に係る特徴量抽出装置1の変換画像生成部3のバリエーションについて以下に述べる。
・変換画像生成部3のバリエーション
カラー画像(RGBチャネル各々、YCbCrチャネル各々)、グレースケール画像、方向別グラディエント画像、N×M平均フィルタ画像(N、Mは実数)、オプティカルフロー画像、Nフレーム間差分平均画像(Nは実数)、距離画像周波数画像DOG(Difference of Gaussian)画像等、一般的に考えられる画像変換手法を用いることができる。

0046

・変換画像間特徴量
従来のように単一の変換画像内でバイナリパターン特徴量を抽出するのではなく、1つ以上の複数間の変換画像に跨がるようなバイナリパターン特徴量を抽出する。例えば、図9の(a)に示すように、グレースケール画像21内の2点の輝度値を比較するのではなく、図9の(b)に示すように、グレースケール画像21内の1点の輝度値とガウシアンフィルタ画像22内の1点の輝度値を比較する。
・車、バイクなどの検出に適用
人物だけでなく、車やバイクなど、一般物体の検出も勿論可能である。人物や車、バイク等の検出対象によって、使用する変換画像や特徴量生成パターンを変えても良い。

0047

また、本実施の形態に係る特徴量抽出装置1のハード構成としては、通常のコンピュータを用いることもできる。すなわち、特徴量抽出装置1は、CPU、RAM等の揮発性メモリ、及びROM等の不揮発性メモリ、及びハードディスク又はSSD(Solid State Drive)等の大容量記憶装置等を備えたコンピュータによって構成できる。

0048

また、本実施の形態に係る特徴量抽出装置1における処理を記述したプログラムを、磁気ディスク光ディスク光磁気ディスク半導体メモリ等の記憶媒体に格納して配布したり、インターネット等の電気通信回線を利用して配布したりすることも可能である。

0049

また、本実施の形態に係る特徴量抽出装置1を用いて画像判定装置を実現することができる。図10は、特徴量抽出装置1を用いた画像判定装置70の概略構成を示すブロック図である。同図において、画像判定装置70は、特徴量抽出装置1と、判定用辞書部(特徴量保持手段)71と、判定部72とを備える。判定用辞書部71は、画像を判別するための判別対象の有する特徴量を保持する。判定部72は、入力された画像に判別対象が含まれているか否かを判定する。画像判定装置70は、特徴量抽出装置1を備えることから、人物、車、バイク等の一般物体を高精度で検出することができる。

0050

本発明は、人物のみならず、車やバイクなどの一般物体を高精度に検出することができるとともに、特徴量抽出による処理量やメモリ使用量を少なく抑えることができるといった効果を有し、画像情報から物体を検出する物体検出装置への適用が可能である。

0051

1特徴量抽出装置
2画像入力部
3変換画像生成部
4特徴量生成パターン保持部
5特徴量抽出部
6 特徴量出力部
20入力画像
21グレースケール画像
22ガウシアンフィルタ画像
23方向別グラディエント画像
211,212,213,…,216、221,222,223,…,226、231,232,233,…,236局所領域
26 局所領域
27−1,27−2,27−3 変換画像
27a垂直方向のエッジ成分
27b 水平方向のエッジ成分
27c 斜め方向のエッジ成分
28−1,28−2 画像
301,302,303,…、311,312,313,…、321,322,… 特徴量生成パターン
361,362,363,36n 特徴量生成パターン
401,402,…,408、411,412,…,418、421,422,…,428 局所領域内識別記号頻度分布
50,51,52 変換画像識別記号頻度分布
60 識別記号頻度分布
70画像判定装置
71判定用辞書部
72 判定部
361,363,364,366,367,369 画素

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社トヨタシステムズの「 動体検出装置」が 公開されました。( 2019/09/19)

    【課題】 カメラ視野が変化している場合であってもそのカメラによって撮影された画像上の動体が映る領域を特定することが可能であり且つその動体の画像上の移動に伴う動体周辺の領域が変化している場合であっても... 詳細

  • 新菱冷熱工業株式会社の「 計測機配置位置決定装置、計測機配置位置決定方法およびプログラム」が 公開されました。( 2019/09/19)

    【課題】計測機配置位置を決定する処理時間を短くし、また、広い範囲の計測が可能な、より少ない個数の計測機配置位置を決定する。【解決手段】計測機配置位置決定装置は、SfMにより生成された被計測物等のベース... 詳細

  • 株式会社マーケットヴィジョンの「 画像認識システム」が 公開されました。( 2019/09/19)

    【課題】 画像情報に写っている商品などの対象物の識別情報の特定を精度よく行うための画像認識システムを提供することを目的とする。【解決手段】 商品を陳列した陳列棚を複数の角度から撮影した画像情報... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ