図面 (/)

技術 定位推定の精度を改善するためのシステムおよび方法

出願人 マイクロソフトコーポレーション
発明者 イワンジェイ.タシェフ
出願日 2005年3月1日 (14年11ヶ月経過) 出願番号 2005-056137
公開日 2005年9月15日 (14年5ヶ月経過) 公開番号 2005-249789
状態 特許登録済
技術分野 方向探知 無線による位置決定 音波、超音波を用いた位置、速度等の測定
主要キーワード セクション幅 レーザ受信機 標準分布 通常用途 クラスタベース オーディオ入力デバイス 反響波 定位データ
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2005年9月15日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (4)

課題

ノイズ反射、または他の干渉を含むことがある環境でさえ、従来の定位システムから導出された定位推定の精度および信頼性を、初期定位データの後処理を行うためのシステムおよび方法を通じて改善する。

解決手段

このような位置推定システムは、マイクロフォンアレイ入力に基づく従来の音源定位SSL)システム、指向性アンテナアレイ入力に基づく電波源定位システムなどを含む。一般に、この後処理システムおよび方法は、統計的リアルタイムクラスタ化を初期定位推定に適用し、次いで多段階プロセスにおいてこのリアルタイムクラスタ化を使用して、初期定位推定に比べて精度および信頼性が改善された新しい定位推定を生成する。

概要

背景

規定の領域内でのオブジェクト定位および追跡は、多くのシステム重要な要素である。例えば、従来のオーディオ会議用途のいくつかは、マイクロフォンアレイを従来の音源定位SSL:sound source localization)処理(すなわち時間遅延推定ビームステアリングなど)とともに使用して、特定の個人発話音声または音を有効に分離し、望み通りに処理できるようにする。同様の技術では、例えばワイヤレスコンピュータネットワーク内の特定のサブスクライバによってどのノードが使用されるべきかを判定するなどの、いくつかの用途での電波源の位置を特定するための指向性アンテナアレイを使用している。さらに別の同様の技術が、レーダまたはレーザ受信機アレイを用いてオブジェクトを追跡するのに使用されている。一般に、このような技術は、当業者によく知られている。

例えば、従来のマイクロフォンアレイは、通常、何らかのあらかじめ決められたレイアウトでのマイクロフォン配置構成を含む。一般にこれらのマイクロフォンを使用して、様々な方向からの、空間内の様々な点から発信される音波捕捉する。次いでいくつかの従来の技術の1つを使用してSSLを実行する。一般に、こうしたSSL技術は、時間遅延推定(TDE:time delay estimates)に基づくもの、およびビームステアリングに基づくものを含む2つのカテゴリ分類される。音源への方向を見つけることは、空間フィルタリング、すなわちビームを音源に向け、他の方向から来る任意のノイズ抑圧することにおいて重要な役割を果たす。いくつかのケースでは、音源への方向が、話者の追跡、および記録された音声信号の後処理のために使用される。ビデオ会議システムの状況では、話者の追跡は、ビデオカメラを話をしている人物に動的に向けるのに使用されることが多い。

一般に、ほとんどの音源定位システムは、まずアレイの各マイクロフォンからの各信号を前処理することによってマイクロフォンアレイからの信号を処理する。この前処理は通常、信号をフレームパッケージし、ノイズ抑圧を行い、音源の位置を判定する目的で特定のフレームを処理するか、破棄するかを判定するために個々のフレームを分類する。

前処理が完了すると、実際の音源定位は通常、例えばTDEやビームステアリング技術を含む従来のSSL技術の使用を伴って、初期方向推定または音源がどこで特定されるかを示す確率分布関数(PDF)を提供する。この位置特定は、1次元定位(すなわち音源が平面で特定される角度)、2次元定位(すなわち3次元空間における音源の方向を表すベクトルを定義するための方向および高さの2つの角度)、および完全3次元定位(すなわち音源が特定される3次元空間の点の位置を特定する方向、高さおよび距離)の観点から定義することができる。一般に、どのSSL技術を使用しても、目的は一般に、反響に対するロバスト性、複数の音源を区別する能力、および潜在的に雑音のある環境での高い位置特定精度を提供することである。

音源の場所のインジケータが算出されると、多くの場合、後処理段階が実施される。一般に、この後処理は、いくつかの定位測定の結果を組み合わせて、精度を向上させたり、音源の動きを追ったり、または複数の音源を追跡したりする。SSL後処理に使用される様々な従来の技術は、単純な平均化、統計的処理カルマンフィルタリングパーティクルフィルタリング(particle filtering)などを含む。こうした技術は、通常用途に依存するが、一般に反響波および強い反射からの定位を取り除き、音源定位精度を改善することに向けられる。一般に、定位推定または測定の精度が向上するにつれて、オーディオ信号の任意のさらなる処理(例えば、正確な音源追跡など)が強化される。

無線信号レーダ波などを含む他の信号タイプに対する信号源またはオブジェクトの定位は、マイクロフォンアレイを介して捕捉された音波の場合について上述したものと同様の前処理および後処理技術を用いて達成されることが多い。一般に、このような定位技術は、異なる信号および受信機アレイタイプ(指向性アンテナアレイ、レーダまたはレーザ受信機アレイなど)に適応されたビームステアリング技術を含むことが多い。オーディオ信号と同様に、他の信号タイプの定位は、通常(音波、電波、レーダ波の反射などの)信号の伝播分析に基づく。

このようなすべての定位システムでは、信号またはアレイのタイプに関係なく、1つの主な目的は、たとえノイズおよび他の影響、例えば定位の精度および信頼性を低減する傾向にある回折干渉、反射などがある場合でも、迅速に正確な定位推定または測定を提供することである。

概要

ノイズ、反射、または他の干渉を含むことがある環境でさえ、従来の定位システムから導出された定位推定の精度および信頼性を、初期定位データの後処理を行うためのシステムおよび方法を通じて改善する。 このような位置推定システムは、マイクロフォンアレイ入力に基づく従来の音源定位(SSL)システム、指向性アンテナアレイ入力に基づく電波源定位システムなどを含む。一般に、この後処理システムおよび方法は、統計的リアルタイムクラスタ化を初期定位推定に適用し、次いで多段階プロセスにおいてこのリアルタイムクラスタ化を使用して、初期定位推定に比べて精度および信頼性が改善された新しい定位推定を生成する。

目的

それゆえ、定位推定の精度を改善するための定位データの迅速かつ信頼できる後処理を提供するシステムおよびプロセスが必要とされている。さらに、このようなシステムおよび方法は、既存の定位技術とともに動作可能であり、それに適応できるものとすべきである。

効果

実績

技術文献被引用数
2件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

初期定位推定の精度を自動的に改善するためのシステムであって、複数の定位推定を備えた初期の1組の定位データを生成することと、仕事量を所定の数の重なり合う領域に分割することと、各定位推定を任意の対応する重なり合う領域の1つまたは複数に割り当てて、前記重なり合う領域の1つまたは複数での定位推定の1つまたは複数のクラスタを形成することと、定位推定の各クラスタによって表されるオブジェクトの位置を推定することと、重なり合う領域におけるクラスタでの前記推定されたオブジェクトの位置を比較することによって前記オブジェクトのいずれかが重複オブジェクトであるかどうかを判定することと、各重複オブジェクトを削除することと、残りの推定された各オブジェクトの位置を提供して、1組の位置推定を作成することであって、前記1組の位置推定は、前記初期の1組の定位推定に比べて改善された1組の定位推定を表すこととを備えたことを特徴とするシステム。

請求項2

前記1組の位置推定での各位置推定の信頼度を算出することをさらに備えたことを特徴とする請求項1に記載のシステム。

請求項3

寿命が各定位推定に関連付けられ、期限切れの寿命を有する任意の定位推定が前記初期の1組の定位データから除外されることを特徴とする請求項1に記載のシステム。

請求項4

前記寿命は、推定されたオブジェクトの動きに応じて算出されることを特徴とする請求項3に記載のシステム。

請求項5

定位推定の各クラスタは、個別の寿命を有し、各クラスタの前記寿命は、推定されたオブジェクトの動きに応じて算出されることを特徴とする請求項3に記載のシステム。

請求項6

前記1組の位置推定を使用して、定位推定の各クラスタによって表されるオブジェクトの位置の任意の後続の推定を初期化することを特徴とする請求項1に記載のシステム。

請求項7

重なり合う領域の数は、ユーザ定義可能であることを特徴とする請求項1に記載のシステム。

請求項8

重なり合いの量は、ユーザ定義可能であることを特徴とする請求項1に記載のシステム。

請求項9

定位推定の各クラスタによって表されるオブジェクトの位置を推定するのに先立って、重みベース閾値を使用して、特定のクラスタが実際にオブジェクトを表すかどうかを判定することをさらに備えたことを特徴とする請求項1に記載のシステム。

請求項10

前記オブジェクトのいずれかが重複オブジェクトであるかどうかを判定する基準は、任意の2つ以上の潜在的オブジェクトの間の算出された距離によって決まることを特徴とする請求項1に記載のシステム。

請求項11

1組の新しい位置推定を1組の初期位置推定から自動的に生成するための方法であって、コンピューティングデバイスを使用して、前記1組の初期位置推定内の各初期位置推定を、受信アレイによってモニタされている仕事量をカバーする1つまたは複数の対応する重なり合う領域に割り当てることによって初期位置推定の1つまたは複数のクラスタを形成し、初期位置推定の各クラスタから新しい位置推定を算出し、各クラスタからの前記新しい位置推定を比較して、前記位置推定のいずれかが重複オブジェクトの位置を表すかどうかを判定し、対応する重複位置推定より算出された重みが小さい各新しい位置推定を破棄することによって、重複オブジェクトを表す新しい位置推定を削除し、残りの各新しい位置推定を提供して、1組の新しい位置推定を作成することを備えることを特徴とする方法。

請求項12

初期位置推定のクラスタを形成するのに先立って、所定の時間の量より古い推定を前記1組の初期位置推定から自動的に削除することを特徴とする請求項11に記載の方法。

請求項13

前記所定の時間の量は、時間にわたっての位置推定から生成された推定オブジェクトの動きの関数を推定することによって算出されることを特徴とする請求項12に記載の方法。

請求項14

前記1組の新しい位置推定を作成するのに使用される各新しい位置推定の信頼度を算出することをさらに備えることを特徴とする請求項11に記載の方法。

請求項15

重なり合う領域の数および重なり合いの量は、ユーザ定義可能であることを特徴とする請求項11に記載の方法。

請求項16

初期位置推定の各クラスタから新しい位置推定を算出することは、所定の閾値を超える算出された重みを有するクラスタについてのみ実行されることを特徴とする請求項11に記載の方法。

請求項17

受信アレイから導出された初期定位推定の信頼性および精度を自動的に改善するためのコンピュータ実行可能命令を有するコンピュータ可読媒体であって、前記コンピュータ実行可能命令は、受信アレイから受信された入力から1組の初期定位推定を生成することと、前記受信アレイによってカバーされる仕事量を1組の少なくとも部分的に重なり合うセクションに分割することと、各初期推定を前記重なり合うセクションの1つまたは複数に割り当てて、前記重なり合うセクションの1つまたは複数内の初期定位推定の1つまたは複数のクラスタを作成することと、前記初期定位推定のクラスタが潜在的オブジェクトを表す前記重なり合う領域のいずれかを特定することと、潜在的オブジェクトを表すクラスタを含む重なり合う各領域内の前記潜在的オブジェクトの位置を推定することと、推定された各位置を比較して、前記推定された位置のいずれかが重複する潜在的オブジェクトの位置を表すかどうかを判定することと、重複する潜在的オブジェクトを表す推定位置を削除することと、残りの各推定位置を、前記初期定位推定と比べて信頼性および精度が改善された新しい定位推定を表す1組の推定位置に提供することとを備えたことを特徴とするコンピュータ可読媒体。

請求項18

前記1組の推定位置に提供された各推定位置についての信頼度を算出することをさらに備えたことを特徴とする請求項17に記載のコンピュータ可読媒体。

請求項19

寿命は、各定位推定に関連付けられ、前記1組の初期定位推定を生成することは、現在の経過時間が前記関連付けられた寿命を超えるどの定位推定も除外することをさらに備えたことを特徴とする請求項17に記載のコンピュータ可読媒体。

請求項20

重なり合う領域の数および重なり合いの量は、ユーザ定義可能であることを特徴とする請求項17に記載のコンピュータ可読媒体。

請求項21

前記初期定位推定のクラスタが潜在的オブジェクトを表す前記重なり合う領域のいずれかを特定することは、各クラスタの重みを算出することと、前記重みを所定の重み閾値と比較することと、その重みが前記所定の重み閾値未満の任意のクラスタを除外することとをさらに備えたことを特徴とする請求項17に記載のコンピュータ可読媒体。

技術分野

0001

本発明は、規定の探索エリア内でのオブジェクト定位(localization)および追跡に関し、特に、初期定位測定または推定クラスタベースの統計的後処理(cluster−based statistical post−processing)を提供することによって、マイクロフォンアレイ指向性アンテナアレイレーダ受信機アレイなどの受信アレイの使用により生成された定位推定の精度を改善するためのシステムおよびプロセスに関する。

背景技術

0002

規定の領域内でのオブジェクトの定位および追跡は、多くのシステムの重要な要素である。例えば、従来のオーディオ会議用途のいくつかは、マイクロフォンアレイを従来の音源定位SSL:sound source localization)処理(すなわち時間遅延推定ビームステアリングなど)とともに使用して、特定の個人発話音声または音を有効に分離し、望み通りに処理できるようにする。同様の技術では、例えばワイヤレスコンピュータネットワーク内の特定のサブスクライバによってどのノードが使用されるべきかを判定するなどの、いくつかの用途での電波源の位置を特定するための指向性アンテナのアレイを使用している。さらに別の同様の技術が、レーダまたはレーザ受信機アレイを用いてオブジェクトを追跡するのに使用されている。一般に、このような技術は、当業者によく知られている。

0003

例えば、従来のマイクロフォンアレイは、通常、何らかのあらかじめ決められたレイアウトでのマイクロフォン配置構成を含む。一般にこれらのマイクロフォンを使用して、様々な方向からの、空間内の様々な点から発信される音波捕捉する。次いでいくつかの従来の技術の1つを使用してSSLを実行する。一般に、こうしたSSL技術は、時間遅延推定(TDE:time delay estimates)に基づくもの、およびビームステアリングに基づくものを含む2つのカテゴリ分類される。音源への方向を見つけることは、空間フィルタリング、すなわちビームを音源に向け、他の方向から来る任意のノイズ抑圧することにおいて重要な役割を果たす。いくつかのケースでは、音源への方向が、話者の追跡、および記録された音声信号の後処理のために使用される。ビデオ会議システムの状況では、話者の追跡は、ビデオカメラを話をしている人物に動的に向けるのに使用されることが多い。

0004

一般に、ほとんどの音源定位システムは、まずアレイの各マイクロフォンからの各信号を前処理することによってマイクロフォンアレイからの信号を処理する。この前処理は通常、信号をフレームパッケージし、ノイズ抑圧を行い、音源の位置を判定する目的で特定のフレームを処理するか、破棄するかを判定するために個々のフレームを分類する。

0005

前処理が完了すると、実際の音源定位は通常、例えばTDEやビームステアリング技術を含む従来のSSL技術の使用を伴って、初期の方向推定または音源がどこで特定されるかを示す確率分布関数(PDF)を提供する。この位置特定は、1次元定位(すなわち音源が平面で特定される角度)、2次元定位(すなわち3次元空間における音源の方向を表すベクトルを定義するための方向および高さの2つの角度)、および完全3次元定位(すなわち音源が特定される3次元空間の点の位置を特定する方向、高さおよび距離)の観点から定義することができる。一般に、どのSSL技術を使用しても、目的は一般に、反響に対するロバスト性、複数の音源を区別する能力、および潜在的に雑音のある環境での高い位置特定精度を提供することである。

0006

音源の場所のインジケータが算出されると、多くの場合、後処理段階が実施される。一般に、この後処理は、いくつかの定位測定の結果を組み合わせて、精度を向上させたり、音源の動きを追ったり、または複数の音源を追跡したりする。SSL後処理に使用される様々な従来の技術は、単純な平均化、統計的処理カルマンフィルタリングパーティクルフィルタリング(particle filtering)などを含む。こうした技術は、通常用途に依存するが、一般に反響波および強い反射からの定位を取り除き、音源定位精度を改善することに向けられる。一般に、定位推定または測定の精度が向上するにつれて、オーディオ信号の任意のさらなる処理(例えば、正確な音源追跡など)が強化される。

0007

無線信号レーダ波などを含む他の信号タイプに対する信号源またはオブジェクトの定位は、マイクロフォンアレイを介して捕捉された音波の場合について上述したものと同様の前処理および後処理技術を用いて達成されることが多い。一般に、このような定位技術は、異なる信号および受信機アレイタイプ(指向性アンテナアレイ、レーダまたはレーザ受信機アレイなど)に適応されたビームステアリング技術を含むことが多い。オーディオ信号と同様に、他の信号タイプの定位は、通常(音波、電波、レーダ波の反射などの)信号の伝播分析に基づく。

0008

このようなすべての定位システムでは、信号またはアレイのタイプに関係なく、1つの主な目的は、たとえノイズおよび他の影響、例えば定位の精度および信頼性を低減する傾向にある回折干渉、反射などがある場合でも、迅速に正確な定位推定または測定を提供することである。

発明が解決しようとする課題

0009

上述したように、一般に定位推定の後処理は、定位推定の精度を向上させるように設計される。

0010

それゆえ、定位推定の精度を改善するための定位データの迅速かつ信頼できる後処理を提供するシステムおよびプロセスが必要とされている。さらに、このようなシステムおよび方法は、既存の定位技術とともに動作可能であり、それに適応できるものとすべきである。

課題を解決するための手段

0011

本明細書に記載したシステムおよび方法は、従来の定位技術から導出された初期の定位推定の信頼性および精度を改善することによって1つまたは複数のオブジェクトまたは信号源を追跡し、またはその位置を特定するための既存の信号定位技術を強化するように動作する。以下の説明を通じて、「オブジェクト」という用語は、定位方法を介して追跡される、または位置が特定される実際のオブジェクト、または信号源(喋っている人物からの音など)のいずれかを参照するのに使用されることに留意されたい。後処理技術の使用を介して改善される従来の定位技術は、例えば、マイクロフォンアレイ入力に基づく従来の音源定位(SSL)システム、指向性アンテナアレイ入力に基づく従来の電波源定位システム、レーダまたはレーザ受信機アレイに基づく従来のターゲット定位および追跡システムなどを含む。このような定位技術は、当業者にはよく知られており、本明細書では詳しく説明しないことに留意されたい。

0012

一般に、ここに記載した後処理システムおよび方法は、統計的リアルタイムクラスタ化プロセスを初期の定位推定に適用し、次いでこのリアルタイムクラスタ化を使用して、初期の定位推定に比べて精度および信頼性が改善された新しい定位推定を生成する。上述したように、本明細書に記載した後処理技術は、信号源定位推定を提供する従来のシステムとの使用に適応できる。さらに、ここに記載したシステムおよび方法は、ノイズ、反射、反響、または他の干渉を含むことがある環境において初期のオブジェクト定位推定が集められた場合、改善された精度および信頼性を提供することも観測されている。

0013

特に、ここに記載したプロセスは、従来のいくつかの定位技術のいずれかを使用して初期オブジェクト定位推定または測定を集め、生成し、そうでなければ取得することによって開始する。一般に、従来の定位データは通常、時間の関数として1次元、2次元、または3次元(例えば方向、方向および角度、または方向、角度および距離)で提供される。本明細書に記載した後処理技術は、任意の次元数の定位データに一般化することができるが、説明上、次の説明では、定位データは3次元、すなわち規定の領域内の方向、高さおよび距離に加えて、方向、高さおよび距離の既知のまたは算出された標準偏差σφ、σθ、σρであると想定することにする。

0014

位置推定を単に提供することに加えて、従来の定位技術は、定位推定ごとに算出または推定された信頼性を説明するための重みまたは確からしさの尺度または推定を提供することが多い。さらに、通常、各定位推定の時刻も提供される。この時刻を、以下各定位推定の「タイムスタンプ」と呼ぶ。このすべての情報は、初期の定位推定の精度および信頼性を向上させるためのここに記載した後処理システムおよび方法に使用される。

0015

言い換えれば、本明細書に記載した後処理システムは、従来の定位推定の入力を取り、各定位推定は、1)位置データ、2)推定された位置の信頼性、および3)データタイムスタンプを備える。次いでこのデータを使用して、入力定位推定に比べて信頼性が改善された新しい定位推定が導出される。各初期定位推定のこの組の情報(すなわち位置、信頼性および時刻)を、この説明を通じて「初期定位推定」または単に「初期推定」と呼ぶことにする。

0016

位置または定位推定の信頼性は、特にオブジェクトの動きまたは受信アレイの動きが可能な場合、時間が経過するにつれて低減すると想定する。それゆえ、一実施形態では、初期定位推定が与えられると、ここに記載した後処理システムおよび方法は、まず、所定の時間より古いすべての定位測定を破棄することによって開始する。この所定の時間、または測定の「寿命」は、任意の特定の定位推定が有効であるとみなされることになる間の時間、それゆえ定位推定が後処理の演算に使用されることになる間の時間である。この「寿命」とは、単に、特定の定位推定が生成されてからの時間(すなわち特定の定位推定のタイムスタンプと現在の時刻との間の時間)の尺度である。

0017

一般に、寿命が長くなるにつれて、より多くの定位推定が後処理のために利用可能となる。通常、より長い寿命が与えられると、より多くの定位推定が利用可能になり、実際のオブジェクトと起こりうる反射との間の区別がより高い信頼性でできるようになり、それによってより高い定位推定精度を提供する。しかし、より長い初期定位推定寿命を使用することによって、オブジェクトが動き、そうでなければ受信アレイに対して位置が変わると、定位応答時間も長くなる。それゆえ定位推定寿命の最適な選択は、予想されるオブジェクトの動きに応じてなされる。例えば、静止した、またはゆっくり動きするオブジェクトを仮定すると、通常より長い寿命が適している。逆に、より短い寿命は、通常より速いオブジェクトの動きに適している。その結果、一実施形形態では、適応的な寿命が、算出されたオブジェクトの動きに基づいて算出され、寿命は、応答時間と時間の関数としての位置の有効性との間のトレードオフとして選ばれる。算出された動きは、時間の関数として位置推定を用いて単に算出される。

0018

本明細書でさらに詳しく説明するように、後処置は次に、1)空間的に広がった重なり合うセクションにおいて(所定の寿命内の)初期定位推定を「クラスタ化する」ことと、2)クラスタ内の「潜在的オブジェクト」を特定することと、3)クラスタ化に基づいて潜在的オブジェクトの位置および標準偏差を推定することと、4)重複している可能性の高いオブジェクトを削除することとを含む、多段階のプロセスを継続する。一実施形態では、後処理は、さらに(重複するオブジェクトを削除した後)オブジェクトごとの定位推定の信頼度を算出することによって継続する。その結果、本明細書に記載した後処理システムおよび方法の最終結果は、それぞれが位置、標準偏差、そして一実施形態ではオブジェクトの場所の信頼度が提示されたオブジェクトのリストとなる。

0019

上記の概要に照らして、ここに記載した後処理技術が従来の定位技術から導出された定位推定の精度を改善するための改善されたシステムおよびプロセスを提供することは明らかである。今述べた利点に加えて、このシステムおよび方法の他の利点は、以下の詳細な説明を添付の図面と併せ読むことによって明らかとなるであろう。

0020

本発明の特定の特徴、態様および利点は、以下の説明、添付の特許請求の範囲および添付の図面との関連でよりよく理解できるようになるであろう。

発明を実施するための最良の形態

0021

本発明の好ましい実施形態の以下の説明では、本明細書の一部を成し、本発明を実施することができる特定の実施形態を例として示す添付図面を参照している。本発明の範囲を逸脱することなく、他の実施形態を使用、または構造的な変更を加えることができることを理解されたい。

0022

(1.0 例示的な動作環境
図1は、本発明を実施することができる適切なコンピューティングシステム環境100の例を示している。コンピューティングシステム環境100は、適したコンピューティング環境の一例にすぎず、本発明の使用または機能の範囲に関していかなる限定を示唆するものではない。また、コンピューティング環境100を、例示的な動作環境100に示した構成要素のいずれか1つまたはその組合せに関するいかなる依存性または要件を有しているものとも解釈すべきではない。

0023

本発明は、他の多くの汎用または専用のコンピューティングシステム環境または構成で動作可能である。本発明との使用に適する可能性のある周知のコンピューティングシステム、環境および/または構成の例には、それだけには限定されないが、パーソナルコンピュータサーバコンピュータハンドヘルドラップトップもしくはモバイルコンピュータまたはセルラー電話およびPDAなどの通信デバイスマルチプロセッサシステムマイクロプロセッサベースのシステム、セットトップボックスプログラム可能な民生用電子機器ネットワークPC、ミニコンピュータメインフレームコンピュータ、上記の任意のシステムまたはデバイスを含む分散コンピューティング環境などがある。

0024

本発明は、マイクロフォンアレイ198、または指向性無線アンテナアレイ、レーダ受信機などのその他の受信アレイ(図示せず)の構成要素を含む、ハードウェアモジュールとの組合せでコンピュータによって実行されるプログラムモジュールなどのコンピュータ実行可能命令の一般的な文脈で説明することができる。一般に、プログラムモジュールは、特定のタスクを実行するか、または特定の抽象データ型実装するルーチンプログラム、オブジェクト、コンポーネントデータ構造などを含む。また、本発明は、通信ネットワークを通してリンクされるリモート処理デバイスによってタスクが実行される分散コンピューティング環境で実施することもできる。分散コンピューティング環境では、プログラムモジュールを、メモリ記憶デバイスを含むローカルおよびリモートコンピュータ記憶媒体に置くことができる。図1を参照すると、本発明を実施するための例示的なシステムは、コンピュータ110の形態の汎用コンピューティングデバイスを含んでいる。

0025

コンピュータ110の構成要素は、それだけには限定されないが、処理ユニット120、システムメモリ130、およびシステムメモリを含む様々なシステム構成要素を処理ユニット120に結合するシステムバス121を含むことができる。システムバス121は、メモリバスまたはメモリコントローラ周辺バス、および様々なバスアーキテクチャのいずれかを使用するローカルバスを含むいくつかのタイプのバス構造のいずれかとすることができる。例として、限定ではなく、このようなアーキテクチャには、ISA(Industry Standard Architecture)バス、MCA(Micro Channel Architecture)バス、EISA(Enhanced ISA)バス、VESA(Video Electronics StandardsAssociation)ローカルバス、およびメザニンバスとしても知られているPCI(Peripheral Component Interconnect)バスなどがある。

0026

コンピュータ110は、一般に様々なコンピュータ可読媒体を含む。コンピュータ可読媒体は、コンピュータ110によってアクセスすることができる任意の利用可能な媒体とすることができ、揮発性および不揮発性媒体リムーバブルおよび非リムーバブル媒体を含む。コンピュータ可読媒体には、例として、限定ではなく、コンピュータ記憶媒体および通信媒体を含むことができる。コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータなど、情報の格納のための任意の方法または技術で実施された揮発性および不揮発性のリムーバブルおよび非リムーバブルの媒体を含む。

0027

コンピュータ記憶媒体には、それだけには限定されないが、RAM、ROM、PROMEPROM、EEPROM、フラッシュメモリもしくは他のメモリ技術CD−ROMデジタル多用途ディスク(DVD)もしくは他の光ディスク記憶装置磁気カセット磁気テープ磁気ディスク記憶装置もしくは他の磁気記憶装置、または所望の情報の格納に使用することができ、コンピュータ110によってアクセスすることができる他の任意の媒体などが含まれる。通信媒体は通常、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータを搬送波や他のトランスポート機構などの変調されたデータ信号に具体化し、任意の情報配送媒体を含む。「変調されたデータ信号」という用語は、信号に情報を符号化するように1つまたは複数のその特性が設定または変更された信号を意味する。例として、限定ではなく、通信媒体には、有線ネットワーク、直接配線された接続などの有線媒体、および音響、RF、赤外線、その他の無線媒体などの無線媒体が含まれる。また、上記のいかなる組合せもコンピュータ可読媒体の範囲内に含まれるものとする。

0028

システムメモリ130は、読取り専用メモリ(ROM)131やランダムアクセスメモリ(RAM)132など、揮発性および/または不揮発性メモリの形態のコンピュータ記憶媒体を含む。例えば起動中など、コンピュータ110内の要素間で情報の転送を助ける基本ルーチンが入っている基本入出力システム(BIOS)133は、通常ROM131に格納されている。RAM132は通常、処理ユニット120によって直ぐにアクセス可能で、そして/または現在処理されているデータおよび/またはプログラムモジュールを収容する。図1は、オペレーティングシステム134、アプリケーションプログラム135、その他のプログラムモジュール136、およびプログラムデータ137を示している。

0029

コンピュータ110は、他のリムーバブル/非リムーバブル、揮発性/不揮発性コンピュータ記憶媒体を含むこともできる。一例にすぎないが、図1は、非リムーバブル不揮発性磁気媒体との間で読み取りまたは書き込みを行うハードディスクドライブ141、リムーバブル不揮発性磁気ディスク152との間で読み取りまたは書き込みを行う磁気ディスクドライブ151、およびCD−ROMや他の光媒体など、リムーバブル不揮発性光ディスク156との間で読み取りまたは書き込みを行う光ディスクドライブ155を示している。例示的な動作環境で使用することができる他のリムーバブル/非リムーバブル、揮発性/不揮発性コンピュータ記憶媒体には、それだけには限定されないが、磁気テープカセットフラッシュメモリカード、デジタル多用途ディスク、デジタルビデオテープ半導体RAM、半導体ROMなどが含まれる。ハードディスクドライブ141は通常、インターフェース140などの非リムーバブルメモリインターフェースを介してシステムバス121に接続され、磁気ディスクドライブ151および光ディスクドライブ155は通常、インターフェース150などのリムーバブルメモリインターフェースによってシステムバス121に接続される。

0030

上述し、図1に示したドライブおよび関連のコンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、およびコンピュータ110の他のデータのストレージを提供する。図1では、例えば、ハードディスクドライブ141がオペレーティングシステム144、アプリケーションプログラム145、その他のプログラムモジュール146、およびプログラムデータ147を格納するものとして示されている。これらのコンポーネントは、オペレーティングシステム134、アプリケーションプログラム135、その他のプログラムモジュール136、およびプログラムデータ137と同じものまたは異なるものとすることができることに留意されたい。オペレーティングシステム144、アプリケーションプログラム145、その他のプログラムモジュール146、およびプログラムデータ147は少なくともそれらが異なるコピーであることを示すために、ここでは異なる番号を付している。ユーザは、キーボード162、および一般にマウストラックボールまたはタッチパッドと呼ばれるポインティングデバイス161などの入力デバイスを介してコマンドおよび情報をコンピュータ110に入力することができる。

0031

他の入力デバイス(図示せず)は、ジョイスティックゲームパッド衛星アンテナスキャナ無線受信機、およびテレビまたはブロードキャストビデオ受信機などを含むことができる。さらに、入力デバイス(図示せず)は、指向性無線アンテナアレイ、レーダ受信機アレイなどの受信アレイまたは信号入力デバイスを含むことができる。これらおよびその他の入力デバイスは、多くの場合システムバス121に結合されている有線または無線ユーザ入力インターフェース160を介して処理ユニット120に接続されるが、例えばパラレルポート、ゲームポートユニバーサルシリアルバス(USB)、IEEE1394インターフェース、Bluethooth(商標ワイヤレスインターフェース、IEEE802.11ワイヤレスインターフェースなど他の従来のインターフェースおよびバス構造によって接続することもできる。さらに、コンピュータ110は、マイクロフォンまたはマイクロフォンアレイ198、ならびにラウドスピーカ197またはこの場合もパラレルシリアル、USB、IEEE1394、Bluetooth(商標)など従来の有線または無線インターフェースを含むオーディオインターフェース199を介して接続される他の音出力デバイスなど、音声またはオーディオ入力デバイスを含むこともできる。

0032

モニタ191または他のタイプの表示デバイスビデオインターフェース190などのインターフェースを介してシステムバス121に接続される。モニタに加えて、コンピュータは、出力周辺インターフェース195を介して接続することができるプリンタ196などの他の周辺出力デバイスを含むこともできる。

0033

コンピュータ110は、リモートコンピュータ180など1つまたは複数のリモートコンピュータへの論理接続を用いてネットワーク化された環境で動作することができる。リモートコンピュータ180は、パーソナルコンピュータ、サーバルータ、ネットワークPC、ピアデバイス、または他の共通のネットワークノードとすることができ、通常、コンピュータ110に関連して上述した多くまたはすべての要素を含むが、図1にはメモリ記憶デバイス181のみを示している。図1に示した論理接続は、ローカルエリアネットワーク(LAN)171およびワイドエリアネットワークWAN)173を含むが、他のネットワークを含むこともできる。このようなネットワーキング環境は、オフィス、企業規模のコンピュータネットワーク、イントラネット、およびインターネットで一般的である。

0034

LANネットワーキング環境で使用する場合、コンピュータ110は、ネットワークインターフェースまたはアダプタ170を介してLAN171に接続される。WANネットワーキング環境で使用する場合、コンピュータ110は通常、モデム172、またはインターネットなどWAN173を介して通信確立するためのその他の手段を含む。モデム172は、内蔵でも外付でもよく、ユーザ入力インターフェース160またはその他の適切なメカニズムを介してシステムバス121に接続することができる。ネットワーク化された環境では、コンピュータ110に関連して示したプログラムモジュール、またはその一部をリモートメモリ記憶デバイスに格納することができる。例として、限定ではなく、図1は、リモートアプリケーションプログラム185をメモリデバイス181上に存在するものとして示している。図示したネットワーク接続は例示的であり、コンピュータ間の通信リンクを確立するためのその他の手段を使用することができることが理解されよう。

0035

例示的な動作環境について説明してきたが、この説明の残りの部分は、1つまたは複数の受信アレイから導出されるオブジェクト定位推定の信頼性および精度を自動的に改善するためのシステムおよび方法の説明に充てることになる。

0036

(2.0イントロクション)
ここに記載したシステムおよび方法は、従来の定位技術から導出された初期の定位推定の信頼性および精度を改善することによって1つまたは複数のオブジェクトまたは信号源を追跡したり、またはその位置を特定したりするための既存の信号定位技術を強化するように動作する。以下の説明を通じて、「オブジェクト」という用語は、定位方法を介して追跡されるか、または位置が特定される実際のオブジェクト、または信号源(喋っている人物からの音、電波源、レーダ反射など)のいずれかを参照するのに使用することに留意されたい。後処理技術の使用を通して改善される定位技術は、例えば、マイクロフォンアレイ入力に基づく従来の音源定位(SSL)システム、指向性アンテナアレイ入力に基づく従来の電波源定位システム、レーダまたはレーザ受信機アレイに基づく従来の目標物定位および追跡システムなどを含む。このような定位技術は、当業者にはよく知られており、ここでは詳しく説明しないことに留意されたい。

0037

一般に、ここに記載した後処理システムおよび方法は、統計的リアルタイムクラスタ化プロセスを初期の定位推定に適用し、次いでこのリアルタイムクラスタ化を使用して、初期定位推定に比べて精度および信頼性が改善された新しい定位推定を生成する。上述したように、ここに記載した後処理技術は、信号源定位推定を提供する従来のシステムとの使用に適応できる。さらに、ここに記載したシステムおよび方法は、ノイズ、反射、反響、またはその他の干渉を含むことがある環境において初期のオブジェクト定位推定が集められた場合、改善した精度および信頼性を提供することも観測されている。

0038

(2.1 システムの概要)
ここに記載した定位推定の後処理のためのシステムおよび方法は、従来のいくつかの定位技術のいずれかを使用して初期のオブジェクト定位推定または測定を集め、生成し、そうでなければ取得することによって開始する。一般に、従来の定位データは通常、時間の関数として1次元、2次元、または3次元(例えば方向、方向および角度、または方向、角度および距離)で提供される。ここに記載した後処理技術は、任意の次元数の定位データに一般化することはできるが、説明上、次の説明では、定位データは3次元、すなわち規定の領域内の方向、高さおよび距離に加えて、方向、高さおよび距離の既知のまたは算出されたそれぞれの標準偏差σφ、σθ、σρであると想定する。

0039

位置推定を単に提供することに加えて、従来の定位技術は、定位推定ごとに算出または推定された信頼性を記述するための重みまたは信頼性の尺度または推定を提供することが多い。さらに、通常、各定位推定の時刻も提供される。この時刻を、以下、各定位推定の「タイムスタンプ」と呼ぶことにする。このすべての情報は、初期定位推定の精度および信頼性を向上させるためにここに記載した後処理システムおよび方法において使用される。

0040

言い換えれば、ここに記載した後処理システムは、従来の定位推定の入力を取得し、各定位推定は、1)位置データ、2)推定された位置の信頼性、および3)データタイムスタンプを備える。次いでこのデータを使用して、入力定位推定に比べて信頼性が改善された新しい定位推定が導出される。各初期定位推定のこの組の情報(すなわち位置、信頼性および時刻)を、この説明を通じて「初期定位推定」または単に「初期推定」と呼ぶ。

0041

位置または定位推定の信頼性は、特にオブジェクトの動きまたは受信アレイの動きが可能な場合、時間の経過につれて減少すると想定する。それゆえ、一実施形態では、初期定位推定が与えられると、ここに記載した後処理システムおよび方法は、まず所定の時間より古いすべての定位測定を破棄することによって開始する。この所定の時間または測定の「寿命」は、任意の特定の定位推定が有効であるとみなされることになる間の時間、それゆえ定位推定が後処理の演算に使用されることになる間の時間である。この「寿命」とは、単に、特定の定位推定が生成されてからの時間(すなわち特定の定位推定のタイムスタンプと現在の時刻との間の時間)の尺度である。

0042

一般に、寿命が長くなるにつれて、より多くの定位推定が後処理のために利用可能となる。通常、より長い寿命が与えられると、より多くの定位推定が利用可能となることにより、実際のオブジェクトと起こりうる反射との間の区別がより高い信頼性でできるようになり、それによってより高い精度の定位推定が提供される。しかし、より長い初期定位推定の寿命を使用することによって、オブジェクトが動き、そうでなければ受信アレイに対して位置が変わると、定位応答時間もより長くなる。それゆえ定位推定寿命の最適な選択は、予想されるオブジェクトの動きに応じてなされる。例えば、静止した、またはゆっくり動くオブジェクトを仮定すると、通常より長い寿命が適している。逆に、より短い寿命は、通常より速いオブジェクトの動きに適している。その結果、一実施形形態では、適応型の寿命は、算出されたオブジェクトの動きに基づいて算出され、寿命は、応答時間と時間の関数として位置の有効性との間のトレードオフとして選ばれる。算出された動きは、時間の関数として位置推定を使用して簡単に算出される。

0043

ここでさらに詳しく説明するように、後処置は次いで、1)空間的に広がった重なり合うセクションに(所定の寿命内の)初期定位推定を「クラスタ化する」ことと、2)クラスタ内の「潜在的なオブジェクト」を特定することと、3)クラスタ化に基づいて潜在的なオブジェクトの位置および標準偏差を推定することと、4)重複している可能性の高いオブジェクトを削除することとを含む、多段階のプロセスを継続する。一実施形態では、後処理は、さらに(重複するオブジェクトを削除した後)オブジェクトごとの定位推定の信頼度を算出することによって継続する。その結果、本明細書に記載した後処理システムおよび方法の最終結果は、それぞれが位置、標準偏差、および一実施形態ではオブジェクトの位置の信頼度が提示されるオブジェクトのリストとなる。

0044

(2.2システムアーキテクチャ
上記で概説したプロセスが、図2の概略システム図によって示されている。特に、図2のシステム図は、初期定位推定を後処理してこれらの定位推定の精度および信頼性を改善するためのシステムおよび方法を実施するためのプログラムモジュール間相互関係を示している。このシステムおよび方法を一般に、以下「ポストプロセッサ」と呼ぶ。図2破線で表したいずれのボックスおよびボックス間の相互接続は、ここに記載したポストプロセッサの代替の実施形態を表しており、これらの代替の実施形態の任意のものまたはすべては、後述するように、この文書を通じて説明する他の代替の実施形態との組合せで使用することができることに留意されたい。

0045

一般に、ポストプロセッサは、従来の受信機アレイ200および従来の初期定位推定モジュール210から導出された初期定位推定220を改善するように動作する。上述したように、受信機アレイ200は、マイクロフォンアレイ、指向性アンテナアレイ、レーダアレイ、レーザ受信機アレイなど、従来の任意の受信アレイである。さらに、受信機アレイ200は、受信機のアレイと同じように働く単一の受信機とすることもできる。例えば、回転レーダ受信機など単一の回転受信機は、回転軸周りの様々な方向から信号を取得する。このようにレーダ受信機は、回転するときに様々な方向から信号を受信することによってレーダアレイと同じように働く。しかし、このような受信機からの定位推定は、ここに記載した後処理と互換性はあるが、単一の受信機システムは(実際のアレイとは対照的に)、定位推定を提供するのに応答時間がより長くなる傾向があることに留意されたい。

0046

初期定位推定モジュール210は、受信機アレイ200から受信した信号または入力から定位推定を提供するための従来の定位または追跡システムである。例えばマイクロフォンアレイの場合、初期定位推定モジュール210は、従来の音源定位(SSL)システムである。説明上、以下の説明では、引き続き従来のマイクロフォンアレイを受信機アレイ200とし、SSLシステムを初期定位推定モジュール210として使用することにする。しかし、ここで提供したポストプロセッサの詳細な説明に照らして、ポストプロセッサは、従来のいくつかの定位システムの任意のものと動作可能であり、単に従来のマイクロフォンアレイ/SSLシステムによって提供される定位推定の精度および信頼性を改善するだけに限定されないことを理解されたい。

0047

初期定位推定220が初期定位推定モジュール210によって提供されると、ポストプロセッサは、初期定位推定220を空間的に広がった重なり合うセクションにリアルタイムでクラスタ化するためのクラスタ化モジュール250を使用する。空間的に広がった重なり合うセクションによるこのリアルタイムのクラスタ化プロセスについては、下記のセクション3.2.1で詳述する。上述したように、一実施形態では、その寿命がまだ切れていない推定のみがリアルタイムクラスタ化プロセスを介して処理される。その寿命が切れた定位推定は、ここに記載した後処理に関して単に破棄される。

0048

一実施形態では、寿命算出モジュール230は、算出されたオブジェクトの動きに基づいて最適化された定位推定寿命を自動的に算出する。例えば、初期定位推定220は、各定位推定が生成された時刻を示すタイムスタンプを含んでいるので、時間の関数として近似のオブジェクトの動きを算出することは簡単なことである。これらのオブジェクトの動きが与えられると、次いで寿命算出モジュール230は、オブジェクトごとに定位推定の適切な寿命を判定する。上述したように、こうした寿命は、特定のオブジェクトの動きに依存する。しかし寿命は、使用される受信機アレイ200および定位システムのタイプにも依存する。

0049

例えば、テストした実施形態では、マイクロフォンアレイのSSLとの組合せで、マイクロフォンアレイによってカバーされる仕事量(work volume)で話をしている人物の追跡に良好な結果を提供するのに約4秒程度の定位推定寿命が観測された。同様に、テストした別の実施形態では、ワイヤレスコンピュータネットワークにおける特定のノードを受信するのにアンテナアレイのどの指向性アレイを使用するかの特定について良好な結果を提供するのに、約2秒程度の寿命が観測された。それぞれの場合で、寿命算出モジュール230が次に、定位推定寿命を少しだけ上または下に自動調整して、算出されたオブジェクトの動きを考慮に入れる。目的は、定位推定が比較的信頼できないほど古くないことを確実にする寿命を提供することである。さらに、複数のオブジェクトの場合、各オブジェクトは、各特定のオブジェクトの動きに依存して異なる定位推定寿命を有することができる。

0050

別の実施形態では、特定のシステムの定位推定寿命の算出ではなく、寿命入力モジュール240を使用して、すべての初期定位推定220に使用する一定の寿命を提供する。この場合もまた、寿命の長さは、受信機アレイ200のタイプ、使用している定位システムのタイプ、および予想されるオブジェクトの動きに依存するべきである。

0051

クラスタ化モジュール250が定位推定のクラスタ化を完了すると、潜在的オブジェクト特定モジュール260は次いで、定位推定クラスタ統計的分析を通して空間的に広がった重なり合う各セクション内の潜在的オブジェクトを表す位置推定のクラスタを特定する。一般に、潜在的オブジェクトは、1つまたは複数のオブジェクトを含むセクションを特定するための閾値を使用することによって、これらの重なり合うセクションにおいて特定される。下記のセクション3.2.2で詳述するように、非ゼロ数の測定を含む任意のセクションの算出された平均重みが所定の閾値を超えると、そのセクション中に潜在的オブジェクトがあると仮定され、さらに処理するために選択される。

0052

潜在的オブジェクト定位モジュール265は次いで、各クラスタを備える定位推定から各潜在的オブジェクトの位置を算出する。この時点で、潜在的オブジェクトの位置は、初期定位推定220の改善(refinement)を表す。しかし、重なり合うセクションの使用の結果、特定の定位推定または測定が2つ以上の隣接するセクションに存在することがある。潜在的オブジェクトの位置の算出については、下記のセクション3.2.3でさらに詳しく説明する。

0053

それゆえ次のステップは、重複オブジェクト削除モジュール270を使用して、重なり合うセクションの使用により特定されたオブジェクトの重複を削除する。一般に、オブジェクト特定モジュールが定位推定のクラスタを分析した後、それぞれが位置、標準偏差、および重みで表される仮説的または潜在的なオブジェクトのリストがある。しかし、重なり合うセクションを使用するために、多くの場合、このリストには重複複製が存在し、そのため「潜在的オブジェクト」という用語を使用する。一般に、下記のセクション3.2.4で詳述するように、任意の2つの仮説的なオブジェクトの間の距離が閾値距離より小さい場合に重複が存在すると考えられる。重複が存在すると考えられる場合、重複オブジェクト削除モジュールは、単に重みが低い方の潜在的オブジェクトをリストから削除する。万一重みが等しい場合、単に潜在的オブジェクトの一方が無作為に削除される。任意の残りの潜在的オブジェクトが次いで新しい定位推定280として提供される。

0054

別の実施形態では、信頼度算出モジュール290が次いで新しい定位推定280のそれぞれの信頼度または尺度を算出する。この信頼度の算出については、下記のセクション3.2.5でさらに詳しく説明する。

0055

最後に、さらに別の実施形態では、新しい定位推定が新しい初期定位推定220の生成に使用するために初期定位推定モジュール210に戻される。定位推定の算出の初期化に既存の定位推定を使用することは、当業者にはよく知られており、ここでは詳述しない。

0056

(3.0 動作の概要)
上述したプログラムモジュールは、ここに記載したポストプロセッサの実施に用いられる。上記で概説したように、このポストプロセッサシステムおよび方法は、入力定位推定データの多段階の後処理を通して定位推定の精度および信頼性を自動的に改善する。以下のセクションでは、上記のプログラムモジュールを実施するための例示的な方法の動作について詳しく説明する。

0057

(3.1初期定位結果収集
上述したように、ここに記載したポストプロセッサは、多くの異なる定位技術に適用可能である。例えば、ここに記載した後処理システムおよび方法は、マイクロフォンアレイを使用したオーディオシステムでの音源定位(SSL)の結果を改善するよう動作する。同様に、本明細書に記載した後処理システムおよび方法は、例えばワイヤレスコンピュータネットワーク中のコンピュータのエンドポイントとともに使用するためのアンテナアレイの特定の指向性アンテナを選択するなど、無線信号の定位を改善するように動作する。他の例には、レーダおよびレーザ追跡システムが含まれる。このようなすべてのシステムを、以下まとめて「ソースローカライザ」と呼ぶ。

0058

どのタイプの定位システムが使用されているかにかかわりなく、3次元定位データの場合、各定位測定は、1)方向、高さ、および距離によって表されるオブジェクトの位置、2)ソースローカライザがどれだけこの測定を信用するかを示す重み、および3)各定位測定の時間を示すタイムスタンプを含むと想定する。

0059

上述したように、初期定位推定を生成するためにローカライザによって使用される実際のアルゴリズムは、上記の情報(すなわちオブジェクトの位置、重み、および時間)を提供する限り、あまり重要ではない。各測定が成功した後、初期定位推定は、ポストプロセッサ入力キューによって集められる。ポストプロセッサは次いで、所与の寿命Tより古いすべての測定を入力キューから削除する。上述したように、この寿命は、オブジェクトの動きに基づいて自動的に算出されるか、特定の定位システムにあらかじめ定義される。一般に、より長い寿命を使用することは、より多くの結果が処理のために利用可能となり、それによって実際のオブジェクトと反射との間のより信頼性の高い区別が容易になり、よりよい精度が提供されることを意味する。しかし、上述したように、寿命がより長いことによって、オブジェクトまたは信号源が動き、または位置を変えたとき、応答時間がより長くなるという結果になる。

0060

(3.2初期定位推定の後処理)
初期定位推定の後処置は、クラスタ化、潜在的オブジェクト(すなわち音源、電波源など)の検出、潜在的オブジェクトの位置の推定、重複オブジェクトの低減または削除、および信頼度の計算を含むいくつかの段階を伴う。これらの後処理段階について、次のセクションで説明する。

0061

(3.2.1初期定位推定のクラスタ化)
仕事量(すなわち受信アレイによってモニタまたは提供される空間または量)は、あらかじめ定義されるか、従来の技術を使用して簡単に判定することができると想定する。特に、以下のパラメータは、仕事量に関して既知であると想定する。
・最小および最大の方向角φminおよびφmax
・最小および最大の仰角θminおよびθmax
・最小および最大の距離ρminおよびρmax
これらのパラメータが与えられると、仕事量は、ある数のM個の重なり合う領域またはセクションに自動的に分割される。等しいサイズの領域を使用することは必須ではないが、計算の複雑さを低減する役割を果たすことに留意されたい。セクションのサイズは、初期推定量(estimator)の精度に依存し、通常、6σなど標準偏差の約4倍から6倍を上回らないようにすべきであることに留意されたい。

0062

あるいは、一実施形態では、重なり合う領域またはセクションの数、および重なり合う量は、ユーザ定義可能である。任意の数またはサイズの領域を使用することができる。しかし、小さいサイズの領域をより多く使用することは、計算のオーバーヘッドの増加を犠牲にして定位推定の精度を向上させる傾向がある。特に、領域のサイズは、クラスタ当たり1つのオブジェクトを想定して、個別のオブジェクトを検出するポストプロセッサの分解能である。しかし、最小のサイズは初期推定量の精度に依存し、この場合1つのオブジェクトからのほとんどすべての測定を同じクラスタに行かせることが望ましい。それゆえ、標準分布では、これは、標準偏差の約6倍(例えば6σ)の領域サイズによりオブジェクトの測定の約99%を捕捉することを意味する。しかし、特定の目的のために、クラスタまたは領域サイズを6σより大きくすることはできる。

0063

マイクロフォンアレイおよび音源定位推定を伴うテストした実施形態では、仕事量は、各次元(すなわち方向、高さ、および距離)においてそれぞれが標準偏差の6倍のサイズを有するM個の重なり合う領域に分割される。このサイズのエリアを選び、領域間の50%の重なり合いを可能にすることによって、式(1)に従って重なり合う領域の数が得られる。

0064

0065

このテストした実施形態では、式(1)の分母の6は、初期推定量の標準偏差の6倍の領域サイズの使用を表すことに留意されたい。上述したように、他の領域サイズを使用して所望の精度を提供することができる。しかし、6シグマの間隔(例えば平均の周りの±3シグマ)は測定の約99%を保持することに留意されたい。さらに、式(1)の数字「8」は、領域間の重なり合いの量の結果である。特に、この例では50%の重なり合いを使用したので、「8」の係数は、単に「2×2×2=8」(例えば3次元のそれぞれにおける50%の重なり合い)に起因する。上記の説明に照らして、重なり合いがより多いことは、クラスタがより多く、よって重複したオブジェクトがより多く、結果的に、計算のオーバーヘッドが増加することを意味することが明らかである。しかし、重なり合いがより少ないことは、クラスタ間の中央のオブジェクトを見逃す可能性があることを意味する。6シグマのセクション幅では、最適な重なり合いは約66%であることが観測された。これは、重なり合う領域は4シグマであり、最悪の場合、測定の約80%を保持することを意味する。テストした実施形態では、単純に計算オーバーヘッドを低減するために50%の重なり合いが使用された。

0066

領域の数がわかると、次いで仕事量がその領域の数に単純に分割される。次いで各初期定位推定は、各初期定位推定をカバーする仕事量の任意の領域に単純に割り当てられる。各初期推定は関連の寿命を有しているので、通常オブジェクトごとに複数の定位推定が利用可能となる。結果的に、定位推定を特定の領域に割り当てることによって、各領域内での定位推定クラスタの形成がもたらされる。重なり合う領域の使用のため、特定の測定を、重なり合いの量に応じて2つ以上の隣接するセクションに割り当てることができることに留意されたい。上述したように、より大きい重なり合いの領域を使用することによって、個別のオブジェクトの分解能はよりよくなるが、必要な計算が増加する。

0067

(3.2.2潜在的オブジェクトを含むセクションの特定)
上記のセクション3.2.1で説明したように仕事量が領域に分割され、定位推定のクラスタが形成されると、どの領域が潜在的オブジェクトを有しているかに関する判定が行われる。例えば、ある特定の領域には位置推定がない場合、その特定の領域内にはオブジェクトがないと想定され、その領域は、計算のオーバーヘッドを低減するためにさらなる処理から除外される。

0068

しかし、別の実施形態では、特定の領域が1つまたは複数の潜在的オブジェクトを含むかどうかの判定は、重みベースの閾値を用いて達成される。特に、テストした実施形態では、潜在的オブジェクトを含むこれらのセクションの特定は、まず、非ゼロ数の測定を含む(すなわち少なくとも1つの定位推定がその特定の領域に割り当てられた)すべてのセクションについて、重みベースの閾値を表す、平均重みWthを計算することによって達成された。この場合、Wthは、仕事量の各領域の測定(gauge)に使用される閾値重みを表す。閾値重みは初期定位推定の一部として提供された元の重みを用いて算出されることに留意されたい。例えば、このような重みを算出するための1つの方法は、次の通り式(2)によって提供される。

0069

0070

ここでWijは、i番目のセクション中のj番目の測定の元の重み、Niはi番目のセクション中の測定の数、Mはセクションの数、Lは非ゼロ数の推定を含むセクションの数、Kは定数である。

0071

Kの値は、セクションの数および誤った測定の数(すなわち実際のオブジェクトではなく反射およびノイズに起因するセクション中の測定)によって決まることに留意されたい。テストした実施形態では、できるだけ多くのセクション中の誤った測定を無視するようにK=2の値が使用された。特に、誤った測定を含むセクションは、通常、反射およびノイズの結果として約1つから2つの測定を含むことが観測された。K=2の値を使用することによって、ポストプロセッサは、非常に少ない数の測定を伴うセクションを無視することができ、それゆえこのような測定は潜在的オブジェクトとして考慮されない。Kの値はアプリケーション依存であり、ポストプロセッサの特定の実装形態では、時間の関数として初期推定量によってどれだけ多くの測定が提供されるかに応じて、3つ(または他の何らかの最低数)を下回る測定を含むセクションの処理を避けることが望ましいことがあることに留意されたい。

0072

次いで、各特定のセクションにおけるすべての測定の重みの和を表すセクションごとの合計セクション重みが、式(3)に示すようにセクションごとに算出される。

0073

0074

任意のセクション重みWiが閾値重みWthより大きい場合、そのセクションに潜在的オブジェクトがあると想定され、後述するように、さらなる処理のためにフラグが立てられる。

0075

(3.2.3位置推定の算出)
仕事量の領域のすべてにおける潜在的オブジェクトについて定位推定を算出することができるが、前のステップで閾値Wthを超える重みを有するものとしてフラグが立てられなかった領域には、実際には何のオブジェクト、または高い信頼性を有する何の定位推定もありそうにない。結果として、一実施形態では、位置推定は、閾値Wthを超える重みを有する領域内の潜在的オブジェクトについてのみ算出される。一般に、後処理のこの段階中に提供された位置推定は、2段階の統計的な処理手法を伴う。

0076

特に、各セクションについて、第1の段階は、そのセクションにおけるすべての測定の加重平均を算出する。一実施形態では、この統計的処理の速度は、式(4)に示すように、まず各位置pijを直交座標系に変換することによって速くなる。

0077

0078

次いで、次の通り式(5)および(6)によって示すように、加重平均および加重標準偏差が算出される。

0079

0080

0081

ここで、piはこのセクションにおけるオブジェクトの位置、およびσiはオブジェクトの定位推定の標準偏差である。

0082

重なり合うセクションの使用のため、および各セクションのサイズに依存して、同じオブジェクトに属する定位推定の一部が2つ以上の隣接するセクションに存在する可能性がある。さらに、このような各セクションに存在するノイズ測定も存在し得る。それゆえ、一実施形態では、これらの測定を削除し、全体的な位置の精度を改善するために、算出されたオブジェクトの位置piの特定の距離内の測定について、加重平均の第2のパスが実行される。

0083

0084

0085

0086

(3.2.4潜在的オブジェクトの低減)

0087

0088

0089

(3.2.5位置推定の信頼度の計算)

0090

特に、測定の数がある所与の数Ncritより小さいとき、信頼度は低下し、それによってより信用に値しない位置測定を示す。Ncritの値は、所望の反応時間、および初期推定量によってどれだけ多くの初期測定が提供されるかに依存することに留意されたい。例えば、SSLシステムのテストした実施形態では、所望の反応時間は0.5秒であり、初期推定量は毎秒約10個の測定を提供した。その結果、少なくとも5つの測定、すなわちNcrit=5が、1の信頼を得るのに必要であった。Ncritを増加することによって、誰かが特定の位置から話し始めた時から信頼度がゆっくり上昇する。しかし、約5から10個の測定を下回る平均および統計的処理は、通常、このテストした実施形態で使用されたSSLシステムのタイプではあまり信頼できない。

0091

同様に、標準偏差がより大きい位置測定も通常あまり信用するに値しない。最後に、特定の位置測定がより古いデータに基づくとき、こうした位置推定も通常あまり信用するに値しない。例えば、テストした実施形態では、最も最近の測定の経過時間(age)が測定の寿命に近づくにつれて、オブジェクトの信頼度は低下した(測定の寿命の説明についてはセクション2.1および2.2を参照)。

0092

それゆえ、一実施形態では、上記の要因のそれぞれを考慮することによって各測定について信頼度を算出した。3つの要因を考慮して位置測定の信頼度を生成するための1つのこのような方法は、次の通り式(9)および(10)によって提供される。

0093

0094

ここで、ciNは測定の数に基づく信頼度であり、ciφ、ciθ、およびciρは標準偏差に基づく信頼度であり、そしてciTは最新の測定のタイムスタンプTiLastに基づく信頼度であり、tは現在の時刻、そしてTLは測定の寿命である。式(9)に示す信頼度のサブレベルの値を0および1の間の範囲に限定またはクリップした後、最終的な信頼度が次いで次の通り式(10)によって示すように算出される。

0095

ci=ciNciφciθciρciT 式(10)
ここで、最終的な信頼度ciは、サブ信頼度のそれぞれをこの範囲に限定することによって0から1の間となる。

0096

次いで各測定についての算出された信頼度は、ポストプロセッサからの最終結果(セクション3.2.1から3.2.4に記載)とともに含められて、それぞれが位置、信頼度、および標準偏差で提示されるオブジェクトのリストを生成する。上述したように、このリストは、初期定位推定の改善を表し、初期定位推定に比べてより正確で信頼できる定位測定または推定を提供する。

0097

(4.0ポストプロセッサの動作の概要)
図2に関して上述し、セクション2および3に提供した詳細な説明に照らしたプロセスを、図3の概略動作フロー図によって示している。特に、図3は、ポストプロセッサの動作を示す例示的な動作フロー図を示している。図3に破線で表した任意のボックスおよびボックス間の相互接続は、ここに記載したポストプロセッサの代替の実施形態を表しており、これらの代替の実施形態の任意のものまたはすべては、後述するように、この文書を通じて説明する他の代替の実施形態との組合せで使用することができることに留意されたい。

0098

一般に、図3によって示すように、ポストプロセッサの動作は、受信アレイ200から位置測定を生成するための従来の定位技術を使用して生成された定位推定220の入力を受け付けることによって開始する(300)。上述したように、これらの従来の定位技術は、当業者にはよく知られており、例えばマイクロフォンアレイを使用して仕事量内の音源の位置を特定する従来のSSL技術などの技術を含む。

0099

仕事量は次いで、いくつかの重なり合う領域またはセグメントに分割される(310)。セクション3.2.1で上述したように、代替の実施形態では、重なり合う領域の数、および使用される重なり合いの量があらかじめ定義されているか、ユーザ定義可能であるか、または自動的に算出される。

0100

次に、各初期定位推定220は、こうした初期定位推定のそれぞれの位置に基づいて仕事量の対応する領域に単純に割り当てられる(320)。しかし、上述したように、オブジェクトごとに複数の定位推定が、通常、利用可能となる。結果として、領域の重なり合いの使用のため、特定の定位推定を2つ以上の領域に実際に割り当てることができる。これらの初期定位推定を様々な領域に割り当てることは(320)、1つまたは複数の領域内の定位推定のクラスタを形成するように働く。

0101

次いで各領域中のクラスタの統計的分析を使用して、領域のどれが潜在的オブジェクトを含んでいるかを判定する(330)。このステップのポイントは、潜在的オブジェクトを含んでいない領域の不必要な演算の実行を単に回避することである。それゆえ、このステップは必須ではないが、ポストプロセッサの計算のオーバーヘッドを低減する。

0102

潜在的オブジェクトを含んでいる領域が特定されると(330)、次いで各領域内の各潜在的オブジェクトを表すクラスタの統計的分析を再度使用して、各潜在的オブジェクトの位置が推定される(340)。次いでこうした推定位置を使用して、潜在的オブジェクトのいずれかが重複であるかどうかを判定する。例えば、領域が重なり合っており、特定の測定がそれゆえ2つ以上の領域に同時に存在するので、特定のオブジェクトを、複数の領域での潜在的オブジェクトとして特定することができる。この問題は、単に実際の位置と潜在的オブジェクトごとに算出された重みとを比較して、重みのより小さいオブジェクトを削除することによって対処される(350)。この場合、潜在的オブジェクトの間の算出距離は、2つのオブジェクトが実際には同じオブジェクトであることを示す。

0103

0104

最後に、一実施形態で、新しい定位推定280が、初期定位推定の生成(300)に使用される初期定位システムへの入力として提供される。例えば、当業者にはよく知られているように、現在のまたは前の位置情報は、マイクロフォンアレイや他のデバイスなどの受信機アレイ200から提供された新しい観測に基づいて定位推定を算出するときに、初期設定ファクタとして使用されることが多い。

0105

初期定位推定の精度および信頼性を自動的に改善するためのポストプロセッサの上記の説明を、例示および説明の目的で提示した。これは、網羅的なものではなく、または本発明を開示された正確な形態に限定するものではない。上記の教示に照らして多くの変更形態および変形形態が可能である。さらに、上記の代替の実施形態のいずれかまたはすべてを所望の任意の組合せで使用してポストプロセッサの追加的なハイブリッドの実施形態を形成することができることに留意されたい。本発明の範囲は、この詳細な説明によって限定されるのではなく、むしろ本明細書に添付した特許請求の範囲によって限定されることが意図されている。

図面の簡単な説明

0106

初期定位データを後処理して精度および信頼性が改善された新しい定位推定を生成するための例示的なシステムを構成する汎用コンピューティングデバイスを描いた概略システム図である。
初期定位データを後処理して精度および信頼性が改善された新しい定位推定を生成するためのポストプロセッサを実装するためのプログラムモジュール例を示す例示的なシステム図である。
図2のポストプロセッサの動作を示す例示的な動作フロー図である。

符号の説明

0107

120処理ユニット
121システムバス
130システムメモリ
131 ROM
132 RAM
133 BIOS
134オペレーティングシステム
135アプリケーションプログラム
136 他のプログラムモジュール
137プログラムデータ
140 非リムーバブル不揮発性メモリインターフェース
141ハードディスクドライブ
144 オペレーティングシステム
145 アプリケーションプログラム
146 他のプログラムモジュール
147 プログラムデータ
150 リムーバブル不揮発性メモリインターフェース
151磁気ディスクドライブ
152 リムーバブル不揮発性磁気ディスク
155光ディスクドライブ
156 リムーバブル不揮発性光ディスク
160ユーザ入力インターフェース
161マウス
162キーボード
170ネットワークインターフェース
171ローカルエリアネットワーク
172モデム
173ワイドエリアネットワーク
180リモートコンピュータ
181メモリ記憶デバイス
185リモートアプリケーションプログラム
190ビデオインターフェース
191モニタ
195 出力周辺インターフェース
196プリンタ
197スピーカ
198マイクロフォンアレイ
199オーディオインターフェース
200受信機アレイ
210初期定位推定モジュール
220 初期定位推定
230寿命算出モジュール
240寿命入力モジュール
250クラスタ化モジュール
260潜在的オブジェクト特定モジュール
265 潜在的オブジェクト定位モジュール
270重複オブジェクト削除モジュール
280 新しい定位推定
290信頼度算出モジュール

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ