図面 (/)

技術 ゲイン制御システムおよびゲイン制御方法

出願人 イマジネーションテクノロジーズリミテッド
発明者 センテルクマールマニアヌパマガンタサラガンジーナマニ
出願日 2015年10月21日 (6年3ヶ月経過) 出願番号 2015-207528
公開日 2016年5月23日 (5年8ヶ月経過) 公開番号 2016-092822
状態 特許登録済
技術分野 可聴帯域変換器の回路等 電話機の機能 有線伝送方式及び無線の等化,エコーの低減
主要キーワード ピーク係数 サンプルナンバー 信号構成要素 残存誤差 減少レート 短期平均 タブレット型パソコン 相関領域
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年5月23日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (7)

課題

音響用エコーキャンセルを行う際に近端側の信号の品質を改善することができる、新規な構造のゲイン制御ステムおよびゲイン制御方法を提供すること。

解決手段

遠端側の信号にゲインを適用するゲイン制御システムであって、ゲイン制御システムは、マイクの信号の中から遠端側の信号のエコーを検出する信号識別手段と、検出されたエコーの伝送路の特性を推定する伝送路推定手段と、を備え、信号識別手段はさらにマイクの信号の中から近端側の信号を検出し、ゲイン制御システムは、近端側の信号の検出に応答して、エコーの伝送路の推定された特性に応じた遠端側の信号に適用するゲインを調整するようになっている。

概要

背景

電話技術では、音響信号(例えば、音声信号を含む)が、近端側と遠端側の間を送信される。近端側で受信された遠端側の信号は、スピーカから出力される。近端側のマイクは、近端側の信号を捉えて遠端側へ送信されるために用いられている。「エコー」は、近端側で出力された遠端側の信号の少なくともいくつかが、遠端側に向かって送信される近端側の信号中に含まれている場合に発生する。この意味で、エコーは、遠端側の信号の反響であると考えられる。

図1に例示されたシナリオでは、遠端側のマイクで捉えられる信号と近端側のスピーカからの出力が記載されている。エコーは、近端側におけるスピーカとマイクの音響上の結合によるものである。すなわち、近端側のマイクは、近端側における話し手音声背景雑音に加えて、自身のスピーカからの信号も捉えているのである。その結果が、遠端側のスピーカにおけるエコーとなって現れる。エコーのキャンセルは、電話技術にとって重要な特徴である。特に、ハンズフリー機器電話会議においては、広範囲音響特性を有する環境に適合できるエコーのキャンセル機能が必要とされる。これらの例では、要因組合せがエコーに貢献しますます問題となる。まず、近端側のスピーカから出力される遠端側の信号の音量は一般的に十分に大きいことから、近端側のマイクによって捉えられた信号のかなりの部分を遠端側の信号が占めることになる。次に、これらの配置のうちスピーカとマイクの物理的な配置は、両者の間の十分な音響上の結合を発生させやすい。

音響用エコーキャンセラは一般的に、遠端側の音声信号から推定されたエコーを合成して作る装置である。推定されたエコーはその後、マイクの信号から差し引かれる。このやり方は、効果的にエコーをキャンセルするのに十分な精度を有する信号を生成するために適応信号処理を必要とする。適用フィルタはしばしば、周囲の音響インパルス応答モデル化するために用いられる。そして適用フィルタに続いて、エコーを残らず除去するために非線形処理装置(NLP)がしばしば用いられる。ところで、このような通信装置は、例えば国際公開第2010/065501号(特許文献1)等に記載されている。

エコーキャンセラの性能は、プラットフォーム、特に音声インターフェースインターフェース駆動回路,関連するハードウェアすなわちプリアンプポストアンプ(もしあれば)やマイクやスピーカの特性、に依存している。十分なエコーキャンセル機能を有する多方面にわたるさまざまなプラットフォームにおいて、全二重音声通信を達成するための挑戦が行われている。エコーのキャンセルは、特に、非常に非線形なプラットフォームにおいて挑戦が行われている。非常に非線形なプラットフォームにおいてエコーをキャンセルするために実行される信号処理リソースを多用してしまい、例えばダブルトークのような状態では、エコーに加えて近端側のスピーチのマイクの信号までもキャンセルする事態を引き起こしてしまい、その結果として例えばダブルトーク間に遠端側で受信される近端側の信号の品質はひどく劣化したものとなってしまう。

概要

音響用のエコーキャンセルを行う際に近端側の信号の品質を改善することができる、新規な構造のゲイン制御ステムおよびゲイン制御方法を提供すること。遠端側の信号にゲインを適用するゲイン制御システムであって、ゲイン制御システムは、マイクの信号の中から遠端側の信号のエコーを検出する信号識別手段と、検出されたエコーの伝送路の特性を推定する伝送路推定手段と、を備え、信号識別手段はさらにマイクの信号の中から近端側の信号を検出し、ゲイン制御システムは、近端側の信号の検出に応答して、エコーの伝送路の推定された特性に応じた遠端側の信号に適用するゲインを調整するようになっている。

目的

本発明は、上述の事情を背景に為されたものであって、その解決課題は、音響用のエコーキャンセルを行う際に近端側の信号の品質を改善することができる、新規な構造のゲイン制御システムおよびゲイン制御方法を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

マイクの信号の中から遠端側の信号のエコーを検出する信号識別手段と、検出された前記エコーの伝送路の特性を推定する伝送路推定手段と、を備え、前記信号識別手段はさらに前記マイクの信号の中から近端側の信号を検出し、前記近端側の信号の検出に応答して、前記エコーの前記伝送路の推定された前記特性に応じて前記遠端側の信号に適用されるゲインを調整することを含むゲイン制御ステム

請求項2

前記近端側の信号の検出に応答して、適用される前記ゲインが減らされている請求項1に記載のゲイン制御システム。

請求項3

前記近端側の信号の不在の検出に応答して、適用される前記ゲインが前記減らされたゲインから増やされている請求項2に記載のゲイン制御システム。

請求項4

前記ゲインが第1のレートで減少すると共に第2のレートで増加する一方、前記第1のレートが前記第2のレートよりも大きくされている請求項3に記載のゲイン制御システム。

請求項5

適用される前記ゲインが、既定の前記ゲインの値に向かって増やされている請求項3または4に記載のゲイン制御システム。

請求項6

前記伝送路推定手段が、前記信号間の類似の程度を決定するために、検出された前記エコーの信号を前記遠端側の信号と互いに関係づけている請求項1〜5の何れか1項に記載のゲイン制御システム。

請求項7

前記特性が類似の程度に応じて推定されている請求項6に記載のゲイン制御システム。

請求項8

前記特性が、前記エコーの前記伝送路の非線形性の程度を示すものである請求項1〜7の何れか1項に記載のゲイン制御システム。

請求項9

前記ゲインは、前記非線形性の程度に応じて、予め決められたパワーを有する前記遠端側の信号を出力するように減らされている請求項8に記載のゲイン制御システム。

請求項10

前記特性が、時間中の前記エコーの前記伝送路中におけるさまざまな遅延である請求項1〜9の何れか1項に記載のゲイン制御システム。

請求項11

前記エコーの存在が、前記エコーだけが存在する期間内に検出される請求項1〜10の何れか1項に記載のゲイン制御システム。

請求項12

前記近端側の信号が、ダブルトークの期間中に検出される請求項1〜11の何れか1項に記載のゲイン制御システム。

請求項13

スピーカによって出力される前記遠端側の信号の大きさを制御する請求項1〜12の何れか1項に記載のゲイン制御システム。

請求項14

マイクの信号の中から遠端側の信号のエコーを検出し、検出された前記エコーの伝送路の特性を推定し、前記マイクの信号の中から近端側の信号を検出し、前記近端側の信号の検出に応答して、前記エコーの前記伝送路の推定された前記特性に応じた前記遠端側の信号に適用されるゲインを調整することを含むゲイン制御方法

請求項15

前記近端側の信号の検出に応答して、適用される前記ゲインが減らされている請求項14に記載のゲイン制御方法。

請求項16

前記近端側の信号の不在の検出に応答して、適用される前記ゲインが前記減らされたゲインから増やされている請求項15に記載のゲイン制御方法。

請求項17

前記ゲインが第1のレートで減少すると共に第2のレートで増加する一方、前記第1のレートが前記第2のレートよりも大きくされている請求項16に記載のゲイン制御方法。

請求項18

適用される前記ゲインが、既定の前記ゲインの値に向かって増やされている請求項16または17に記載のゲイン制御方法。

請求項19

エコーの伝送路の特性を推定するステップが、前記信号間の類似の程度を決めるために、検出された前記エコーの信号を前記遠端側の信号と互いに関係づけている請求項14〜18の何れか1項に記載のゲイン制御方法。

請求項20

前記特性が類似の程度に応じて推定されている請求項19に記載のゲイン制御方法。

請求項21

前記特性が、前記エコーの前記伝送路の非線形性の程度を示すものである請求項14〜20の何れか1項に記載のゲイン制御方法。

請求項22

前記ゲインが、前記非線形性の程度に応じて、予め決められたパワーを有する前記遠端側の信号を出力するように減らされている請求項21に記載のゲイン制御方法。

請求項23

前記特性が、時間中の前記エコーの前記伝送路中におけるさまざまな遅延である請求項14〜22の何れか1項に記載のゲイン制御方法。

請求項24

前記エコーが、前記エコーだけが存在する期間内に検出される請求項14〜23の何れか1項に記載のゲイン制御方法。

請求項25

前記近端側の信号が、ダブルトークの期間中に検出される請求項14〜24の何れか1項に記載のゲイン制御方法。

請求項26

スピーカによって出力される前記遠端側の信号の大きさを制御するために、前記ゲインが前記遠端側の信号に適用される請求項14〜25の何れか1項に記載のゲイン制御方法。

請求項27

コンピュータにロードされることにより、請求項1〜13の何れか1項に記載のゲイン制御システムを生成するコンピュータ読み取り可能なプログラムコードプロダクト

請求項28

コンピュータにロードされることにより、請求項1〜13の何れか1項に記載のゲイン制御システムを生成するための符号化された非一時的コンピュータ読み取り可能なプログラムコードを格納したコンピュータ読み取り可能な記憶媒体

請求項29

請求項14〜26の何れか1項に記載のゲイン制御方法をコンピュータに実行させるコンピュータ読み取り可能なプログラムコードプロダクト。

請求項30

請求項14〜26の何れか1項に記載のゲイン制御方法をコンピュータに実行させるための符号化された非一時的コンピュータ読み取り可能なプログラムコードを格納したコンピュータ読み取り可能な記憶媒体。

技術分野

0001

本発明は、遠端側の信号に適用されるゲインを制御するためのシステムや方法に関するものである。

背景技術

0002

電話技術では、音響信号(例えば、音声信号を含む)が、近端側と遠端側の間を送信される。近端側で受信された遠端側の信号は、スピーカから出力される。近端側のマイクは、近端側の信号を捉えて遠端側へ送信されるために用いられている。「エコー」は、近端側で出力された遠端側の信号の少なくともいくつかが、遠端側に向かって送信される近端側の信号中に含まれている場合に発生する。この意味で、エコーは、遠端側の信号の反響であると考えられる。

0003

図1に例示されたシナリオでは、遠端側のマイクで捉えられる信号と近端側のスピーカからの出力が記載されている。エコーは、近端側におけるスピーカとマイクの音響上の結合によるものである。すなわち、近端側のマイクは、近端側における話し手音声背景雑音に加えて、自身のスピーカからの信号も捉えているのである。その結果が、遠端側のスピーカにおけるエコーとなって現れる。エコーのキャンセルは、電話技術にとって重要な特徴である。特に、ハンズフリー機器電話会議においては、広範囲音響特性を有する環境に適合できるエコーのキャンセル機能が必要とされる。これらの例では、要因組合せがエコーに貢献しますます問題となる。まず、近端側のスピーカから出力される遠端側の信号の音量は一般的に十分に大きいことから、近端側のマイクによって捉えられた信号のかなりの部分を遠端側の信号が占めることになる。次に、これらの配置のうちスピーカとマイクの物理的な配置は、両者の間の十分な音響上の結合を発生させやすい。

0004

音響用エコーキャンセラは一般的に、遠端側の音声信号から推定されたエコーを合成して作る装置である。推定されたエコーはその後、マイクの信号から差し引かれる。このやり方は、効果的にエコーをキャンセルするのに十分な精度を有する信号を生成するために適応信号処理を必要とする。適用フィルタはしばしば、周囲の音響インパルス応答モデル化するために用いられる。そして適用フィルタに続いて、エコーを残らず除去するために非線形処理装置(NLP)がしばしば用いられる。ところで、このような通信装置は、例えば国際公開第2010/065501号(特許文献1)等に記載されている。

0005

エコーキャンセラの性能は、プラットフォーム、特に音声インターフェースインターフェース駆動回路,関連するハードウェアすなわちプリアンプポストアンプ(もしあれば)やマイクやスピーカの特性、に依存している。十分なエコーキャンセル機能を有する多方面にわたるさまざまなプラットフォームにおいて、全二重音声通信を達成するための挑戦が行われている。エコーのキャンセルは、特に、非常に非線形なプラットフォームにおいて挑戦が行われている。非常に非線形なプラットフォームにおいてエコーをキャンセルするために実行される信号処理リソースを多用してしまい、例えばダブルトークのような状態では、エコーに加えて近端側のスピーチのマイクの信号までもキャンセルする事態を引き起こしてしまい、その結果として例えばダブルトーク間に遠端側で受信される近端側の信号の品質はひどく劣化したものとなってしまう。

先行技術

0006

国際公開第2010/065501号

発明が解決しようとする課題

0007

本発明は、上述の事情を背景に為されたものであって、その解決課題は、音響用のエコーキャンセルを行う際に近端側の信号の品質を改善することができる、新規な構造のゲイン制御システムおよびゲイン制御方法を提供することにある。

課題を解決するための手段

0008

本発明の第一の態様は、遠端側の信号にゲインを適用するゲイン制御システムに関し、前記ゲイン制御システムは、マイクの信号の中から前記遠端側の信号のエコーを検出する信号識別手段と、検出された前記エコーの伝送路の特性を推定する伝送路推定手段を備え、前記信号識別手段はさらに前記マイクの信号の中から近端側の信号を検出するように構成されており、前記近端側の信号の検出に応答して前記ゲイン制御システムは前記エコーの前記伝送路の推定された特性に応じて前記遠端側の信号に適用する前記ゲインを調整するようになっている。

0009

前記ゲイン制御システムが、前記近端側の信号の検出に応答して適用される前記ゲインを減らすようにされていてもよい。

0010

前記ゲイン制御システムが、前記近端側の信号の不在の検出に応答して、減少された前記ゲインを増やすようにされていてもよい。

0011

前記ゲインが、第1のレートで減少する一方、第2のレートで増加し、前記第1のレートが前記第2のレートよりも大きくされていてもよい。

0012

適用される前記ゲインが、既定の前記ゲインの値に向かって増加するようにされていてもよい。

0013

前記伝送路推定手段が、前記信号間の類似の程度を決定するために、検出された前記エコーの信号を前記遠端側の信号と互いに関係づけているようにされていてもよい。

0014

前記特性が、前記類似の程度に応じて推定されるものであってもよい。

0015

前記特性が、前記エコーの前記伝送路の非線形性の程度を示すものであってもよい。

0016

前記ゲインは、非線形性の程度に応じて、予め決められたパワーを有する前記遠端側の信号を出力するように減少されるようにされていてもよい。

0017

前記特性が、時間中の前記エコーの前記伝送路中におけるさまざまな遅延であってもよい。

0018

前記エコーの存在が、前記エコーだけが存在する期間内に検出されるようにしてもよい。

0019

前記近端側の信号が、ダブルトークの期間中に検出されるようにしてもよい。

0020

前記ゲイン制御システムが、スピーカによって出力される前記遠端側の信号の大きさを制御するようにされていてもよい。

0021

本発明の第二の態様は、遠端側の信号にゲインを適用する方法に関し、前記方法は、マイクの信号の中から前記遠端側の信号のエコーを検出する方法と、検出された前記エコーの伝送路の特性を推定する方法と、前記マイクの信号の中から近端側の信号を検出する方法を備え、前記近端側の信号の検出に応答して前記エコーの前記伝送路の推定された前記特性に応じた前記遠端側の信号に適用される前記ゲインを調整するようになっている。

0022

適用される前記ゲインが、前記近端側の信号の検出に応答して、減少されるようになっていてもよい。

0023

適用される前記ゲインが、前記近端側の信号の不在の検出に応答して、減少された前記ゲインから増やされるようになっていてもよい。

0024

前記ゲインが第1のレートで減少すると共に第2のレートで増加する一方、前記第1のレートが前記第2のレートよりも大きくされていてもよい。

0025

適用される前記ゲインが、既定の前記ゲインの値に向かって増加するようにされていてもよい。

0026

前記エコーの前記伝送路の前記特性を推定するステップが、前記信号間の類似の程度を決めるために、検出された前記エコーの信号を前記遠端側の信号と互いに関係づけるようにされていてもよい。

0027

前記特性が、前記類似の程度に応じて推定されるものであってもよい。

0028

前記特性が、前記エコーの前記伝送路の非線形性の程度を示すものであってもよい。

0029

前記ゲインが、前記非線形性の程度に応じて、予め決められたパワーを有する前記遠端側の信号を出力するように減少されるようになっていてもよい。

0030

前記特性が、時間中の前記エコーの前記伝送路中におけるさまざまな遅延であってもよい。

0031

前記エコーが、前記エコーだけが存在する期間内に検出されるようになっていてもよい。

0032

前記近端側の信号が、ダブルトークの期間中に検出されるようになっていてもよい。

0033

スピーカによって出力される前記遠端側の信号の大きさを制御するために、前記ゲインが前記遠端側の信号に適用されるようになっていてもよい。

0034

本発明の第三の態様は、コンピュータにロードされることにより上述のようなゲイン制御システムを生成するコンピュータ読み取り可能なプログラムコードプロダクトに関する。

0035

本発明の第四の態様は、コンピュータにロードされることにより上述のようなゲイン制御システムを生成するための符号化された非一時的コンピュータ読み取り可能なプログラムコードを格納したコンピュータ読み取り可能な記憶媒体に関する。

0036

本発明の第五の態様は、上述のような方法をコンピュータに実行させるためのコンピュータ読み取り可能なプログラムコードプロダクトに関する。

0037

本発明の第六の態様は、上述のような方法をコンピュータに実行させるための符号化された非一時的コンピュータ読み取り可能なプログラムコードを格納したコンピュータ読み取り可能な記憶媒体に関する。

図面の簡単な説明

0038

以下、本発明の実施形態について、図面を参照しつつ説明する。

0039

電話技術の近端側と遠端側を示す模式図。
音響用のエコーキャンセラとゲイン制御システムを備えた本発明に従う通信装置の構成を示すブロック図。
ゲイン制御システムの一例の構成を示すブロック図。
近端側の信号の品質を最適化するためにゲインを調整するプロセスの一例を示す図。
信号識別手段の一例の構成を示すブロック図。
ゲインの調整の一例を示す図。

実施例

0040

しばしばマイクの信号エネルギーの主成分は、遠端側の信号のエコーである。すなわち、近端側の重要な信号エネルギーは何もないのである。このことは、ここに「シングルトーク」があることを示している。またある時には、マイクの信号は、あらゆるエコーに依存しない重要な信号エネルギーを含んでいる。多くの場合、近端側における話しの結果であり、「近端側の信号」として表される。勿論、信号エネルギーは、話しでなく異なる原因によるものかもしれない。これは、特に、テレビ会議やハンズフリー機器の操作を行っている場合において表れる。それゆえ「近端側の信号」とは、エコーによらない近端側で生成されたあらゆる重要な信号エネルギーに当てはまる用語として使われている。時には、マイクの信号は、エコーの信号と近端側の信号を含んでいる。このことは、ここに「ダブルトーク」があることを示している。またマイクの信号は、いくつかの近端側の周囲の雑音を含んでいてもよい。

0041

図2には、スピーカ21とマイク22と音響用のエコーキャンセラ(AEC)23を備えた通信装置20の一例が示されている。図示しない別の配置において、スピーカ21とマイク22は、通信装置20外にあって、適当な入出力ポートを介して通信装置20に接続されるようになっていてもよい。好ましい通信装置20としては例えば、携帯電話スマートフォン固定電話ラップトップパソコンタブレット型パソコンテレビ会議装置などが含まれる。また通信装置20は、CPUや、メモリや、DSPとフィルタのような信号処理回路など(図2に示されていないものを含む)を備えていてもよい。

0042

AEC23は、マイク22から信号を受け取るように構成されている。また、AEC23は、遠端側の信号24を受け取るように構成されている。一般論として、AEC23は、推定されたエコーの信号を生成するために遠端側からの信号を処理するように構成されている。推定されたエコーは、(遠端側の信号を出力する)スピーカ21と(あらゆる近端側の信号に加えて遠端側の信号のエコーを受け取る)マイク22の間の実世界の音響の伝送路を効果的に合成する、適応フィルタ25によって生成される。このように、実世界のエコーは、マイクの信号の考えられる信号構成要素の1つに過ぎない。

0043

適応フィルタ25は切れ目なく、エコーの伝送路を連続的にモデル化すると共に遠端側の信号から推定されるエコーを生成する。推定されたエコーはその後、引き算ユニット26によってマイクの信号から差し引かれる。推定されたエコーが比較的正確だとすると、これにより遠端側に送信するのに実質上エコーのない信号を供給できる。エコーだけの領域では、マイクの信号にはなにも必要な音は無い、すなわちマイクの信号には遠端側からのエコーと雑音のような不要な音だけが含まれていると考えられる。エコーだけの領域では、差し引き演算後に残ったあらゆる信号は、合成されたエコーにおける誤差を表わすものと考え、音響上のエコーの伝送路のモデル最新のものにするように適応フィルタ25にフィードバックされる。

0044

図2に示されたAEC23はまた、エコー抑圧器27と非線形プロセッサ28とダブルトーク検出器29を備えている。

0045

ダブルトーク検出器29は、ダブルトークの存在を検出する。また、ダブルトーク検出器29は、近端側の信号のみで(すなわちあらゆる重要な遠端側の信号なしに)その存在を検出するものであってもよい。好ましくは、ダブルトーク検出器29は、近端側のスピーチが検出された際に中断された遠端側のスピーチに基づいて、適応フィルタ25が適用されるように構成されていることが望ましい、というのは近端側のスピーチが、マイクの信号中のエコーを推定するためのエコー推定プロセス中の誤差の原因となるからである。エコー抑圧器27と非線形プロセッサ28は、推定されたエコーがマイクの信号から差し引かれた後、あらゆる残りのエコーあるいは雑音を処理するように構成されている。残りのエコーが非常に強い場合がある。例えば、もしエコーの伝送路が近端側のスピーチの間に劇的に変化した場合には、適応フィルタ25による変化するエコーの伝送路の追跡は、強力な残存エコーをもたらすであろうことから、ダブルトーク検出器29によって抑制されるようになっていてもよい。エコー抑圧器27は、推定されたエコーに依存する残存エコーを減ずる。非線形プロセッサ28は、クリッピングによってあらゆる残存誤差を取り除く。

0046

非線形プロセッサ28は一般的に、推定されたエコーが差し引かれた後、マイクの信号に残る閾値以下のあらゆる信号エネルギーを取り除くように構成されている。それゆえ閾値は、遠端側に送信される前に、非線形プロセッサ28がマイクの信号からどの程度のエネルギーのものまで取り除けるかを決定する。もし閾値が低ければ、適応フィルタ25が完全にはエコーの伝送路をモデル化できずに残ったエコーを、非線形プロセッサ28が効果的に取り除く。しかし、もし閾値が高ければ、非線形プロセッサ28は効果的に近端側からのあらゆる信号をブロックする。このことは、閾値を制御することが、通信装置20の動作モードを効果的に制御することにつながることを意味している。閾値が低い時には、信号が両方向に向かって伝わることを許容することによって、通信装置20が全二重モードで動作する。閾値が高い時には、信号が一方向のみ(すなわち、遠端側から近端側)に向かって伝わることを許容することによって、通信装置20は効果的に半二重モードで動作する。したがって、ダブルトークの間、非線形プロセッサ28は、効率よくエコーと近端側の信号(すなわち、話し)をブロックする。このことは、遠端側で受信された近端側の信号の品質に問題を生じさせ、ダブルトークの開始と終了の際の閾値の変動が近端側の信号をとぎれとぎれにする。

0047

通信装置20は、遠端側の信号24とスピーカ21間の伝送路にゲイン制御システム200(詳細については図3参照)を備えている。ゲイン制御システム200は、スピーカ21に遠端側の信号を供給し、スピーカ21によって出力された遠端側の信号のパワーを制御できる(すなわち、それによって音量を制御できる)。図3に示されているように、ゲイン制御システム200は、信号識別手段201、伝送路推定手段202、ゲイン調整手段203とレベル制御手段204を含んで構成されており、それぞれの手段はハードウェアやソフトウェアやそれらの組合せで実施されていてもよい。

0048

遠端側の信号は、ゲイン制御システム200によって受信され、ゲイン制御システム200によって出力されスピーカに供給された遠端側の信号のパワーレベルを制御する、レベル制御手段204に供給される。ゲイン調整手段203は、レベル制御手段204に目標パワーベルを供給する。かかる目標パワーレベルは、レベル制御手段204によって出力される信号の望ましいパワーレベル(例えば平均RMSレベル)である。レベル制御手段204は、望ましい目標パワーレベルで遠端側の信号を出力するために、入力された遠端側の信号に対して適切なゲインを適用する。

0049

ゲイン調整手段203は、シングルトークの間、レベル制御手段204に既定の目標パワーレベルを供給するようにしてもよい。ゲイン調整手段203は、上述の問題を克服する手助けになるように近端側の信号(ダブルトークを含む)の受信中に目標パワーレベル(と遠端側の信号に適用されるゲイン)を動的に適合させることができる。ゲイン調整手段203は、信号識別手段201と伝送路推定手段202からの情報によりパワーレベルを適合させる。信号識別手段201により、エコーだけの期間(この期間に、重要な遠端側の信号が受信されるが、重要な近端側の信号は受信されない)と、近端側の信号の期間(この期間に、重要な近端側の信号が受信されるが、重要な遠端側の信号は受信されない)と、ダブルトークの期間(この期間に、重要な遠端側および近端側の信号が受信される)と、を識別する。伝送路推定手段202は、以下で詳述するように、エコーの伝送路の非線形性の度合いを推定する。手順についても以下で詳述するように、少なくとも一部分でエコーの伝送路の非線形性の度合いを元に目標パワーレベルを適合させるようになっている。

0050

図4は、目標パワーレベルを適合させると共に遠端側の機器で受信された近端側の信号の品質を最適化する、ゲイン制御システム200によって実行される手順の概要を示したフローチャートである。

0051

ステップ301では、遠端側とマイクの信号が信号識別手段201によって受信されている。ステップ302では、信号識別手段201は、いかなる重要な近端側の信号(話しのような)のないエコーのみのマイクの信号の1以上の期間を識別する。図5を参照して以下でより詳細に説明すると、エコーだけの期間は遠端側の信号の遅延版とマイクの信号を比較することによって識別され、違いが小さい(例えば閾値以下)時にはエコーだけの期間が識別される一方、違いが大きい(例えば閾値を超える)時には、マイクの信号は重要なエコーでない構成要素(例えば近端側のスピーチ)を含んでいることを示しており、それゆえ期間はエコーだけの期間として識別されない。ステップ303では、非線形性あるいは遅延といったバリエーションを有するエコーの伝送路の特性が、エコーだけの期間から決定される。ステップ304では、目標パワーレベルが、エコーの伝送路の特性を元にして決定される。目標パワーレベルは、近端側の動作期間の間(例えばダブルトークの期間の間)でレベル制御手段204による使用に適したレベルとされている。しかしながら、目標パワーレベルは、エコーだけの期間の間に(ステップ303において)非常に容易に決定されたエコーの伝送路の特性を元にして決められている。ステップ304で決められた目標パワーレベルは、エコーだけの期間にレベル制御手段204による使用に適したレベルとされた既定の目標パワーレベルと異なる(例えば小さい)ものであってもよい。ステップ305では、近端側の信号あるいはダブルトークが検出された際に、ゲイン調整手段203がレベル制御手段204にステップ304で決められた目標パワーレベルを供給する。ステップ306では、近端側の信号が終了した(そしてあらゆる期間中で近端側の信号がない)時には、ゲイン調整手段203がレベル制御手段204に既定の目標パワーレベルを供給する。

0052

近端側の信号が存在する時にこの手順を用いることで、遠端側の信号のパワーは、プラットフォームの非線形のようなエコーの伝送路の特性に依存したレベルまで減少する、それゆえ近端側の信号の品質は、とりわけダブルトークの期間中は、近端側の信号をブロックするエコーキャンセラの非線形プロセッサにより劣化しない。なお、各ステップについては、以下でさらに詳述する。例えば、近端側のユーザが話している時、近端側のスピーカから出力される遠端側のスピーチに適用されるゲインは、マイクの信号内のエコーが減少するように減少される。このことは、エコーキャンセルによる近端側の信号の劣化が少なくなるように、適用されるエコーキャンセルの量も少なくされている、ことを意味している。それゆえ、遠端側に送信される近端側の信号は、より高い品質とされている。

0053

図5は、信号識別手段201の一例を示したものである。信号識別手段201は、エコー遅延推定手段401と信号検出手段402を含んで構成されている。

0054

エコー遅延推定手段401は、エコーの伝送路の遅延を推定する。好ましくは、遅延の推定は、エコーだけの期間に実行されることが望ましい。大まかには、エコー遅延推定手段401は、遠端側の信号の過去の履歴をマイクの信号と比較してそれらの信号に合うサンプルを捜し出している。エコーの伝送路の遅延は、遠端側の信号の過去の履歴と適合したマイクの信号間の時間差に基づいている。

0055

遅延伝送路を推定する1つの具体的なやり方について説明する。エコー遅延推定手段401は、例えば64点FFTを用いて、マイクの信号と遠端側の信号の各フレーム周波数ドメインに変換する。短期平均長期平均が、全ての周波数ビンに対して計算される。短期平均と長期平均から、バイナリスペクトルは、マイクと遠端側の信号の全ての周波数ビンに対して推定される。もし短期平均が予め定められた閾値でそれぞれの周波数ビンの長期平均を超えるならば、その周波数ビンのバイナリスペクトルの表示は、1または0とされる。

0056

遠端側のバイナリスペクトルの履歴は、例えば図示しないメモリに保持される。かかる履歴は、例えば、直近の50フレームの遠端側のバイナリスペクトルでもよい。マイクの信号(例えば、直近のシングルトーク)のバイナリスペクトルが、遠端側の信号の各履歴のバイナリスペクトルと比較されて、最も合うスペクトルを捜し出す。最も合うスペクトルを捜し出すため、マイクのバイナリスペクトルに対する各周波数ビンのAND演算が、遠端側の各バイナリスペクトルに対応する周波数ビンと共に実行される。その結果として生じる各バイナリスペクトルの合計が決められ、合計後に最高値を生じる遠端側のバイナリスペクトルが最も合ったものとみなされる。遅延はその後、フレーム数フレームサイズを元に推定される。

0057

通常、推定された遅延の値は、通話中略一定であり、複数の通話に跨ってわずかに変動するだけである。それゆえ、推定された遅延は、通話の開始時にのみに最初に実行されるだけである。もしプラットフォームに変化があった場合、例えば携帯電話のユーザがハンズフリーモード切り替えた際には、遅延は再び推定される。また、推定された遅延は、定期的に実行され得る。もし遅延が通話中に頻繁に変化するようであれば、伝送路推定手段202によって実行される非線形性の推定にかかわりなく、プラットフォームは非常に非線形であるとみなされる。この場合、エコー遅延推定手段401は、ゲイン調整手段203に、ダブルトークのような、近端側の信号期間中に目標パワーレベルを適切なレベルにセットさせることができる。

0058

信号検出手段402は、エコーだけの期間と近端側の信号だけの期間とダブルトークの期間を検出する。信号検出手段402は、適応フィルタ403(例えば50の係数の短いフィルタ長を有する短い適応フィルタであってもよい)と、収束性検出手段404を含んで構成されていてもよい。エコー遅延推定手段401によって決定された遅延の推定値に基づいて遅延が補償された遠端側の信号と、マイクの信号が、切れ目なく係数を適用する適応フィルタ403に送られる。遅延補償された遠端側の信号とマイクの信号の各フレームを処理した後、適応フィルタの収束性は、誤差信号:e(n)とマイクの信号:d(n)間の角度の余弦を用いて推定される。なお、nは、信号のサンプルナンバーを表している。誤差信号:e(n)は、適応フィルタ403によって出力されるものであり、マイクの信号と推定された遠端側の信号間の差を表わすものである。残りのエコーとエコーは修正されず、それゆえそれらの間の角度の余弦は殆ど0となるのである。しかし、マイクの信号と誤差信号間の角度の余弦は、ダブルトーク中、エコーに対する近端側の信号の比率に依存して0から遠く離れる。

0059

l(エル番目のフレームにおけるマイクの信号:d(n)に関する誤差信号:e(n)の射影は数1のようになる。

0060

0061

もしPem(l)<TH2ならば、マイクの信号の現フレームがエコーだけを含んでいることを表し、他の状態では近端側の信号および/あるいは周囲の背景雑音を含んでいる。TH2は、実験的に推定された閾値である。さらに公知の音声区間検出法が、近端側のスピーチと背景雑音間を識別するために用いられ得る。エコーだけを含むことを示すマイクの信号のフレームが識別され、伝送路推定手段202に送られる。

0062

伝送路推定手段202は、エコーの伝送路の非線形性の度合いを推定する。エコーの伝送路は、遠端側の信号がスピーカに供給されてからマイクに受信されるまでに取る伝送路であると考えられる。それゆえ、エコーの伝送路は、近端側のプラットフォームの線形性に依存する。非線形性の度合いを推定する1つの方法は、信号同士がどの程度類似しているかを決定するために、遅延が補償された遠端側の信号とエコーのみのフレームのマイクの信号を互いに関係づけるやり方である。もしエコーと遠端側の信号間の相関性が高ければ、エコーの伝送路は高い線形性を有する。一方、もしかかる相関性が低ければ、エコーの伝送路がかなりの非線形性を有していることになる。相互関係は、線形なプラットフォームに対してははっきりとしたピークを、そしてかなり非線形なプラットフォームに対してランダム分布をもたらす。

0063

相関類似性は、近端側のスピーチを含まないマイクの信号のフレーム(すなわちエコーだけのフレーム)において推定される。エコーと遠端側の信号がどの程度類似しているかを決定する際に生じる複雑さを低減するために、遠端側とマイクの信号は、それらの相関性を推定する前に2毎に間引かれてもよい。

0064

相関類似性が、ピークの相関領域の近傍における多くの相関係数(例えば7つの相関係数)の蓄積されたエネルギーとかかる係数の全エネルギー間の比率であってもよい。相関類似性が、以下のように推定されてもよい。

0065

a)相互相関係数Xcorr(l,i)(ここでl(エル)はl番目のフレームを表し、iはフレームlの相関係数ベクトルXcorrの添え字を表す)が、近端側と遅延補償された遠端側のフレーム間において決定される。

0066

b)全エネルギーT(l)、すなわち各相互相関係数Xcorr(l,i)の二乗の和が決定される。

0067

c)ピークエネルギーD(l)、すなわちピーク係数およびその隣接した係数の二乗の和が決定される。例えば、係数の数が7だとすると、ピークの前後の各3つの係数とピークの係数がD(l)を決定するのに使われる。

0068

d)相関類似度は、D(l)をT(l)で割ることによって決定される。

0069

遅延補償においてあらゆる許容誤差に対して補償するために、しかもより高精度に補償するために、相関性の測定が、遠端側とマイクの信号のフレームの蓄積された履歴のうち多数のフレームでさらに行われてもよい。

0070

決定された相関類似性は、表1に示された例示の予め定められた範囲の1つに量子化されていてもよい。他の適切な範囲を用いてもよい。

0071

0072

プラットフォームの決定された非線形性が、近端側の信号の存在下における非線形性に応じてレベル制御手段204に対して目標レベルを適合させるゲイン調整手段203に与えられていてもよい。例えば、ゲイン調整手段203は、非線形性に応じて適合される目標レベルを決定するためにルックアップテーブルを用いてもよい。表2に、ルックアップテーブルの一例を示す。他の適切な値を用いてもよい。

0073

0074

それゆえ、この例では、エコーの伝送路の非線形性が増加するに伴い、近端側の信号期間とダブルトークの期間においてレベル制御手段204によって使用される目標パワーレベルは減少する。それは、近端側の信号の存在下では、エコーキャンセルはエコーに十分に適合されず、とりわけエコーの伝送路がより非線形な場合にはエコーキャンセルは不十分にしか働かない。それゆえ、かなり非線形なエコーの伝送路において、レベル制御手段204によって遠端側の信号に適用されるゲインは、マイクの信号中の予測できないエコーの量を減少するように低くされている。それに反して、より線形なエコーの伝送路に対しては、レベル制御手段204によって適用されるゲインはより高くなってもよい。

0075

相関類似性よりも実測が非線形性の度合いを決定するために用いられてもよい。例えば、上述のようなエコーの伝送路の遅延の変動が用いられて、変動の異なる度合いに応じて適切な目標レベルが決定されていてもよい。例えば、もし変動が小さければ、既定の目標レベルが使われてもよい。一方、もし変動が大きい場合は、−30dbの目標レベルが使われてもよい。

0076

遠端側とマイクの信号は、信号識別手段201と伝送路推定手段202に対して提供される前にダウンサンプリングされていてもよい。このことは、適切な目標レベルを決定するために必要とされる処理量を減らす手助けとなり得る。例えば、信号が、処理前に4kHzかそれ以下の周波数サンプリングされていてもよい。

0077

図6は、ゲイン調整手段203によってレベル制御手段204に提供される目標レベル501が、どのようにしてマイクの信号502に応じて適合されるのかを説明するための図である。マイクが全く信号を検出しない期間503とエコーだけの期間504において、目標レベル501は、既定の目標レベル505のままである。目標レベル501が既定値の時には、目標レベル501は、既定の目標レベル505よりも僅かに低い値とされている(図6参照)。近端側の信号509が時間507で検出された時(この場合、ダブルトーク(DT)506期間中)(例えば、信号検出手段402によって)、目標レベルは、(上述のように)非線形性の度合いに応じて決定され、適合された目標レベル508に向かって減少される。図6に示されているように、目標レベルは、既定値から適合された値に向かって漸次減少するようにされていてもよい。目標レベルの減少レートは、既定値と適合された値の間の差に依存していてもよい。一般的に、既定値と適合された値の間の差が大きくなるほど、速いレートが必要とされる。ひとたび目標レベルが適合された値になってしまうと、ダブルトークが終了するか近端側の信号509が終了するまでその状態が維持される。期間510として図示されているように、ダブルトークが終了して近端側の信号509だけがある時には、目標レベルは適合された値に維持される。近端側の信号の終了時(破線511で記載されている)には、目標レベルは、適合された値から既定値に向かって増加される。適合された値から既定値への目標レベルの増加のレートは、目標レベルが減少する際のレートと同じでもよいし異なっていてもよい。好ましくは、図6に示されているように、増加のレートが減少のレートよりも遅いことが望ましい。例えば、減少のレートがおよそ40dB/秒であり、増加のレートがおよそ16dB/秒である。かかる手助けにより、近端側のスピーカにおける遠端側の信号量を徐々に増加させると共に、増加のレートが速い場合にユーザに対して音量の心地よくない急な増加が生じることが避けられるようになっている。あるいは、目標レベルは、徐々によりも速やかに既定値に/から適合され得る。

0078

上述のように、非線形のプラットフォームは、エコーキャンセラに対して、遠端側で受信された近端側の信号の品質に次々に劣化をもたらすような問題を引き起こし得る。レベル制御手段204に対してより低い目標パワーレベルを提供することにより、受信された遠端側の信号に適用されるゲインは、かなり非線形なプラットフォームに対して近端側の信号期間(ダブルトークの期間を含む)の間、減少させられる。このことは、スピーカによって出力される遠端側の信号量を減少に導く。それゆえ、非線形なエコーの信号は非常に弱められて、マイクに拾われるエコーのエネルギーはほとんどないか全くなくなることから、エコーキャンセラのNLPは閾値を低レベルに維持することができ、(上述のように)近端側の信号を劣化させる高レベルになることを避けることができる。したがって、ゲイン制御システム200は、エコーキャンセラとは独立して、エコーキャンセラの働きを有利に成し遂げることができる。

0079

図2,3,5に示されている構造(そしてこの中に含まれている全ての手段や装置のブロックダイヤグラム)は、手段や装置内のいくつかの機能ブロックに相当するように意図されたものである。これは単なる例示に過ぎない。図2,3,5は、チップ上の異なるハードウェアのパーツ間あるいはソフトウェアの異なるプログラムや手順や機能間の厳密な区分を明らかにすることを意図するものではない。ここに記載されたいくつかあるいは全てのアルゴリズムは、全部あるいは一部がハードウェアによって実行されてもよい。多くの実装品のうち、少なくともゲイン制御システムの部分が、ソフトウェアによる制御の元で動作するプロセッサ(例えば、通信装置のCPUやDSP)によって実行されていてもよい。全てのこのようなソフトウェアは、好ましくは、メモリ(RAMやキャッシュハードディスクなど)あるいは他の記憶手段(USBスティックやCDやディスクなど)のような非一時的コンピュータ読み取り可能な記録媒体に記憶されていることが望ましい。そして、かかるコンピュータ読み取り可能な記録媒体に記憶されている、ソフトウェアを構成する符号化された非一時的コンピュータ読み取り可能なプログラムコードによって、ゲイン制御システムなどが生成されるようになっていてもよい。

0080

出願人は、開示されたあらゆる問題を解決できるかどうかにかかわりなく、また特許請求の範囲を制限することなく、個々の独立した特徴や複数の特徴の組合せを、当業者の技術的常識に基づき明細書全体の記載から、それらの特徴や組み合わせを実施できる程度に開示している。そのことは、本発明の態様がそれらの特徴あるいは組み合わせから成っていることを示している。前述の記述を考慮して、当業者が発明の範囲内で様々な変更を加えてもよいことは明らかである。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ