図面 (/)

技術 エコーキャンセラ及びエコーキャンセリング方法

出願人 ソニー株式会社
発明者 福井隆郎
出願日 2002年3月25日 (18年8ヶ月経過) 出願番号 2002-083632
公開日 2003年10月3日 (17年2ヶ月経過) 公開番号 2003-284184
状態 特許登録済
技術分野 可聴帯域変換器用回路 音声の分析・合成 ステレオ方式 可聴帯域変換器の回路等 電話機の回路等 有線伝送方式及び無線の等化,エコーの低減 電話機の機能
主要キーワード 低周波帯域成分 後適応 時系列ベクトル 開閉音 ジャングル 残留ノイズ モノラル方式 サイド成分
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2003年10月3日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (12)

課題

解決手段

所定のサンプリング周波数のステレオ音声信号のうち、M−S(ミッドサイド)方式のミッド成分の音声信号を第1, 第2の帯域分割手段4,6で帯域分割し、低周波帯域のミッド成分の音声信号を、第1, 第2の周波数変換手段8, 10でサンプリング周波数を下げ後適応フィルタ13で処理し、適応フィルタ13から出力した誤差信号を第3の周波数変換手段20, 21でもとのサンプリング周波数に上げる。

概要

背景

互いに離れた地点にいる人同士が、ネットワーク経由で双方向に音声等によってコミュニケーションを行えるようにしたシステムが普及しつつある。そうした双方向コミュニケーションシステムの例としては、テレビ会議システムが挙げられる。

図1は、既存のテレビ会議システムで用いられる音声送受信用機器を示す。地点Aに、モノラル方式マイクロホン101,スピーカ102,ADコンバータ103, DAコンバータ104,エコーキャンセラ105,音声コーデック106及びネットワークインタフェース107が設けられる。

地点Aとは離れた地点Bにも、同じくマイクロホン101,スピーカ102,ADコンバータ103, DAコンバータ104,エコーキャンセラ105,音声コーデック106及びネットワークインタフェース107が設けられる。

ADコンバータ103のサンプリング周波数は、16kHzという比較的低い周波数日常会話音声信号の必要帯域である8kHzの2倍)になっている。

地点Aのネットワークインタフェース107と地点Bのネットワークインタフェース107とは、電話回線等を用いたネットワーク108で結ばれている。

地点Aにおいて、会議出席者の話し声は、マイクロホン101に入力し、ADコンバータ103によりサンプリング周波数16kHzでデジタル変換された後、エコーキャンセラ105を経て音声コーデック106で符号化(圧縮)され、ネットワークインタフェース107から通信ネットワーク108経由で地点Bのネットワークインタフェース107に送られる。そして、地点Bにおいて、音声コーデック106で復号伸長)され、エコーキャンセラ105を経てDAコンバータ104でアナログ変換されて、スピーカ102から出力する。

地点Bにおいても、会議出席者の話し声は、マイクロホン101に入力し、ADコンバータ103によりサンプリング周波数16kHzでデジタル変換された後、エコーキャンセラ105を経て音声コーデック106で符号化され、ネットワークインタフェース107から通信ネットワーク108経由で地点Aのネットワークインタフェース107に送られる。そして、地点Aにおいて、音声コーデック106で復号され、エコーキャンセラ105を経てDAコンバータ104でアナログ変換されて、スピーカ102から出力する。

図2は、こうしたテレビ会議システムにおける従来のエコーキャンセラ105の構成を示す。エコーキャンセラ105は、適応フィルタで構成されており、デジタルフィルタ111と、加減算器112と、コントローラ113とを含んでいる。

エコーは、相手方の地点から送られた音声が、自分の地点において、スピーカ102から出力した後、室内の空間や部屋の壁等を含む未知の系(エコー経路)114を経由してマイクロホン101に飛び込んで相手方の地点に戻されてしまう現象である。

デジタルフィルタ111は、このエコー経路114の伝達関数Hk(z)を推定する。そして、相手方の地点から自分の地点に送られるサンプリング周波数16kHzの音声信号x(k)をリファレンス信号とし、この伝達関数Hk(z)とこのリファレンス信号x(k)の時系列ベクトル[ x(k), x(k−1),…x(k−N−1)] とを畳み込むことにより、目標信号であるマイクロホン101からの入力音声信号レプリカy’(k)を作成する。

加減算器112は、マイクロホン101からADコンバータ103を経てエコーキャンセラ105に入力したサンプリング周波数16kHzの音声信号(目標信号)y(k)からこのレプリカy’(k)を差し引くことにより、エコーをキャンセルする。

コントローラ113は、加減算器112から出力する誤差信号e(k)(目標信号y(k)からレプリカy’(k)を差し引いた残りの信号)の大きさに応じて、学習同定法,アフィン射影法または最小二乗法といった数学的手法でデジタルフィルタ111のタップ係数更新することにより、伝達関数Hk(z)の推定精度を高める。

デジタルフィルタ111のタップ数は、サンプリング周波数16kHzのモノラル音声信号に対する最大エコーパス長(スピーカから出力した後最大何ミリ秒遅れてマイクロホンに飛び込んだ音声をエコーとしてキャンセルできるかを表すもの)に対応した数になっている。

エコーキャンセラ105は、実際のハードウェアとしては、適応フィルタとして動作させるためのソフトウェアインストールしたDSP(デジタルシグナルプロセッサ)と、RAMとを用いて構成されている。

エコーキャンセラ105のようにサンプリング周波数16kHzのモノラル音声信号に対する最大エコーパス長に対応したタップ数の適応フィルタとしては、具体的には、DSP, RAMをそれぞれ2個, 6個用いたものが存在している。

概要

サンプリング周波数の高いステレオ音声信号送受信する双方向コミュニケーションシステムにおいて、一定以上の長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルする。

所定のサンプリング周波数のステレオ音声信号のうち、M−S(ミッドサイド)方式のミッド成分の音声信号を第1, 第2の帯域分割手段4,6で帯域分割し、低周波帯域のミッド成分の音声信号を、第1, 第2の周波数変換手段8, 10でサンプリング周波数を下げ後適応フィルタ13で処理し、適応フィルタ13から出力した誤差信号を第3の周波数変換手段20, 21でもとのサンプリング周波数に上げる。

目的

本発明は、上述の点に鑑み、サンプリング周波数の高いステレオ音声信号を送受信する双方向コミュニケーションシステムにおいて、一定以上の長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルすることのできるエコーキャンセラ及びエコーキャンセリング方法を提供することを課題としてなされたものである。

効果

実績

技術文献被引用数
2件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

スピーカに送られる所定のサンプリング周波数ステレオ音声信号のうち、M−S(ミッドサイド)方式のミッド成分の音声信号を、低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割する第1の帯域分割手段と、前記第1の帯域分割手段で帯域分割された低周波帯域のミッド成分の音声信号のサンプリング周波数を所定レート下げる第1の周波数変換手段と、マイクロホンから入力する前記所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のミッド成分の音声信号を、前記低周波帯域の音声信号と前記高周波帯域の音声信号とに帯域分割する第2の帯域分割手段と、前記第2の帯域分割手段で帯域分割された低周波帯域のミッド成分の音声信号のサンプリング周波数を前記所定レートで下げる第2の周波数変換手段と、前記第1の周波数変換手段から出力した低周波帯域のミッド成分の音声信号がリファレンス信号として供給されるとともに、前記第2の周波数変換手段から出力した低周波帯域のミッド成分の音声信号が目標信号として供給され、前記リファレンス信号から前記目標信号のレプリカを作成し、前記目標信号から前記レプリカを差し引いた誤差信号を出力する適応フィルタと、前記適応フィルタから出力した前記誤差信号のサンプリング周波数を前記所定のサンプリング周波数に上げる第3の周波数変換手段とを備えたことを特徴とするエコーキャンセラ

請求項2

請求項1に記載のエコーキャンセラにおいて、前記スピーカに送られる所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のサイド成分の音声信号を、低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割する第3の帯域分割手段と、前記第3の帯域分割手段で帯域分割された低周波帯域のサイド成分の音声信号のサンプリング周波数を所定レートで下げる第4の周波数変換手段と、前記マイクロホンから入力する前記所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のサイド成分の音声信号を、前記低周波帯域の音声信号と前記高周波帯域の音声信号とに帯域分割する第4の帯域分割手段と、前記第4の帯域分割手段で帯域分割された低周波帯域のサイド成分の音声信号のサンプリング周波数を前記所定レートで下げる第5の周波数変換手段と、前記第4の周波数変換手段から出力した低周波帯域のサイド成分の音声信号がリファレンス信号として供給されるとともに、前記第5の周波数変換手段から出力した低周波帯域のサイド成分の音声信号が目標信号として供給され、前記リファレンス信号から前記目標信号のレプリカを作成し、前記目標信号から前記レプリカを差し引いた誤差信号を出力する第2の適応フィルタと、前記第2の適応フィルタから出力した前記誤差信号のサンプリング周波数を前記所定のサンプリング周波数に上げる第6の周波数変換手段と、前記第6の周波数変換手段から出力した前記誤差信号と、前記第3の周波数変換手段から出力した前記誤差信号とを加算する加算手段とをさらに備えたことを特徴とするエコーキャンセラ。

請求項3

請求項1に記載のエコーキャンセラにおいて、前記第1の帯域分割手段で帯域分割された高周波帯域のミッド成分の音声信号がリファレンス信号として供給されるとともに、前記第2の帯域分割手段で帯域分割された高周波帯域のミッド成分の音声信号が目標信号として供給され、前記リファレンス信号から前記目標信号のレプリカを作成し、前記目標信号から前記レプリカを差し引いた誤差信号を出力する第3の適応フィルタと、前記第3の適応フィルタから出力した前記誤差信号と、前記第3の周波数変換手段から出力した前記誤差信号とを加算する加算手段とをさらに備えたことを特徴とするエコーキャンセラ。

請求項4

請求項1に記載のエコーキャンセラにおいて、前記スピーカに送られる左右2チャンネルのステレオ音声信号を、M−S方式のステレオ音声信号に変換する第1のステレオ方式変換手段と、前記マイクロホンから入力する左右2チャンネルのステレオ音声信号を、M−S方式のステレオ音声信号に変換する第2のステレオ方式変換手段とをさらに備え、前記第1のステレオ方式変換手段から出力したミッド成分の音声信号が前記第1の帯域分割手段で帯域分割され、前記第2のステレオ方式変換手段から出力したミッド成分の音声信号が前記第2の帯域分割手段で帯域分割されることを特徴とするエコーキャンセラ。

請求項5

請求項1に記載のエコーキャンセラにおいて、前記適応フィルタは、前記リファレンス信号, 前記目標信号, 前記誤差信号の時間平均エネルギーをそれぞれ算出する手段と、前記時間平均エネルギーの大きさに応じてタップ係数更新を制御する手段とを含むことを特徴とするエコーキャンセラ。

請求項6

請求項1に記載のエコーキャンセラにおいて、前記適応フィルタから出力した所定の閾値以下の前記誤差信号を減衰させる減衰手段をさらに備え、前記減衰手段の出力信号のサンプリング周波数が前記第3の周波数変換手段で上げられることを特徴とするエコーキャンセラ。

請求項7

スピーカに送られる所定のサンプリング周波数のステレオ音声信号のうち、M−S(ミッド−サイド)方式のミッド成分の音声信号を、低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割する第1ステップと、前記第1ステップで帯域分割した低周波帯域のミッド成分の音声信号を、サンプリング周波数を所定レートで下げて、適応フィルタにリファレンス信号として供給する第2ステップと、マイクロホンから入力する前記所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のミッド成分の音声信号を、前記低周波帯域の音声信号と前記高周波帯域の音声信号とに帯域分割する第3ステップと、前記第3ステップで帯域分割した低周波帯域のミッド成分の音声信号を、サンプリング周波数を前記所定レートで下げて、前記適応フィルタに目標信号として供給する第4ステップと、前記適応フィルタにおいて、前記リファレンス信号から前記目標信号のレプリカを作成し、前記目標信号から前記レプリカを差し引いた誤差信号を出力する第5ステップと、前記適応フィルタから出力した前記誤差信号のサンプリング周波数を前記所定のサンプリング周波数に上げる第6ステップとを有することを特徴とするエコーキャンセリング方法。

請求項8

請求項7に記載のエコーキャンセリング方法において、前記スピーカに送られる所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のサイド成分の音声信号を、低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割するステップと、前記帯域分割した低周波帯域のサイド成分の音声信号を、サンプリング周波数を所定レートで下げて、前記適応フィルタとは別の適応フィルタにリファレンス信号として供給するステップと、前記マイクロホンから入力する前記所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のサイド成分の音声信号を、前記低周波帯域の音声信号と前記高周波帯域の音声信号とに帯域分割するステップと、前記帯域分割した低周波帯域のサイド成分の音声信号を、サンプリング周波数を前記所定レートで下げて、前記別の適応フィルタに目標信号として供給するステップと、前記別の適応フィルタにおいて、前記リファレンス信号から前記目標信号のレプリカを作成し、前記目標信号から前記レプリカを差し引いた誤差信号を出力するステップと、前記別の適応フィルタから出力した前記誤差信号と、前記第6ステップでサンプリング周波数を上げた前記誤差信号とを加算するステップとをさらに有することを特徴とするエコーキャンセリング方法。

請求項9

請求項7に記載のエコーキャンセリング方法において、前記第1ステップで帯域分割した高周波帯域のミッド成分の音声信号を、前記適応フィルタとは別の適応フィルタにリファレンス信号として供給するとともに、前記第3ステップで帯域分割した高周波帯域のミッド成分の音声信号を、前記別の適応フィルタに目標信号として供給するステップと、前記別の適応フィルタにおいて、前記リファレンス信号から前記目標信号のレプリカを作成し、前記目標信号から前記レプリカを差し引いた誤差信号を出力するステップと、前記別の適応フィルタから出力した前記誤差信号と、前記第6ステップでサンプリング周波数を上げた前記誤差信号とを加算するステップとをさらに備えたことを特徴とするエコーキャンセリング方法。

技術分野

0001

本発明は、音声信号用エコーキャンセラ及びエコーキャンセリング方法に関し、特に、サンプリング周波数の高いステレオ音声信号を処理するのに適したものに関する。

背景技術

0002

互いに離れた地点にいる人同士が、ネットワーク経由で双方向に音声等によってコミュニケーションを行えるようにしたシステムが普及しつつある。そうした双方向コミュニケーションシステムの例としては、テレビ会議システムが挙げられる。

0003

図1は、既存のテレビ会議システムで用いられる音声送受信用機器を示す。地点Aに、モノラル方式マイクロホン101,スピーカ102,ADコンバータ103, DAコンバータ104,エコーキャンセラ105,音声コーデック106及びネットワークインタフェース107が設けられる。

0004

地点Aとは離れた地点Bにも、同じくマイクロホン101,スピーカ102,ADコンバータ103, DAコンバータ104,エコーキャンセラ105,音声コーデック106及びネットワークインタフェース107が設けられる。

0005

ADコンバータ103のサンプリング周波数は、16kHzという比較的低い周波数日常会話音声信号の必要帯域である8kHzの2倍)になっている。

0006

地点Aのネットワークインタフェース107と地点Bのネットワークインタフェース107とは、電話回線等を用いたネットワーク108で結ばれている。

0007

地点Aにおいて、会議出席者の話し声は、マイクロホン101に入力し、ADコンバータ103によりサンプリング周波数16kHzでデジタル変換された後、エコーキャンセラ105を経て音声コーデック106で符号化(圧縮)され、ネットワークインタフェース107から通信ネットワーク108経由で地点Bのネットワークインタフェース107に送られる。そして、地点Bにおいて、音声コーデック106で復号伸長)され、エコーキャンセラ105を経てDAコンバータ104でアナログ変換されて、スピーカ102から出力する。

0008

地点Bにおいても、会議出席者の話し声は、マイクロホン101に入力し、ADコンバータ103によりサンプリング周波数16kHzでデジタル変換された後、エコーキャンセラ105を経て音声コーデック106で符号化され、ネットワークインタフェース107から通信ネットワーク108経由で地点Aのネットワークインタフェース107に送られる。そして、地点Aにおいて、音声コーデック106で復号され、エコーキャンセラ105を経てDAコンバータ104でアナログ変換されて、スピーカ102から出力する。

0009

図2は、こうしたテレビ会議システムにおける従来のエコーキャンセラ105の構成を示す。エコーキャンセラ105は、適応フィルタで構成されており、デジタルフィルタ111と、加減算器112と、コントローラ113とを含んでいる。

0010

エコーは、相手方の地点から送られた音声が、自分の地点において、スピーカ102から出力した後、室内の空間や部屋の壁等を含む未知の系(エコー経路)114を経由してマイクロホン101に飛び込んで相手方の地点に戻されてしまう現象である。

0011

デジタルフィルタ111は、このエコー経路114の伝達関数Hk(z)を推定する。そして、相手方の地点から自分の地点に送られるサンプリング周波数16kHzの音声信号x(k)をリファレンス信号とし、この伝達関数Hk(z)とこのリファレンス信号x(k)の時系列ベクトル[ x(k), x(k−1),…x(k−N−1)] とを畳み込むことにより、目標信号であるマイクロホン101からの入力音声信号レプリカy’(k)を作成する。

0012

加減算器112は、マイクロホン101からADコンバータ103を経てエコーキャンセラ105に入力したサンプリング周波数16kHzの音声信号(目標信号)y(k)からこのレプリカy’(k)を差し引くことにより、エコーをキャンセルする。

0013

コントローラ113は、加減算器112から出力する誤差信号e(k)(目標信号y(k)からレプリカy’(k)を差し引いた残りの信号)の大きさに応じて、学習同定法,アフィン射影法または最小二乗法といった数学的手法でデジタルフィルタ111のタップ係数更新することにより、伝達関数Hk(z)の推定精度を高める。

0014

デジタルフィルタ111のタップ数は、サンプリング周波数16kHzのモノラル音声信号に対する最大エコーパス長(スピーカから出力した後最大何ミリ秒遅れてマイクロホンに飛び込んだ音声をエコーとしてキャンセルできるかを表すもの)に対応した数になっている。

0015

エコーキャンセラ105は、実際のハードウェアとしては、適応フィルタとして動作させるためのソフトウェアインストールしたDSP(デジタルシグナルプロセッサ)と、RAMとを用いて構成されている。

0016

エコーキャンセラ105のようにサンプリング周波数16kHzのモノラル音声信号に対する最大エコーパス長に対応したタップ数の適応フィルタとしては、具体的には、DSP, RAMをそれぞれ2個, 6個用いたものが存在している。

発明が解決しようとする課題

0017

ところで、従来のテレビ会議システムは、図1に示したように音声信号のサンプリング周波数が低く且つモノラル音声信号を送受信するものであるが、今後は、テレビ会議システムでも、音質を向上させるために音声信号のサンプリング周波数を高めたり、臨場感を得るためにステレオ音声信号を送受信したりするようになることが考えられる。

0018

さらに、今後は、エンターテイメント系の新しい形態の双方向コミュニケーションシステムとして、例えば、コンサート会場家庭とをネットワークで結び、楽器演奏音ボーカリスト歌声をコンサート会場から家庭に送り、家庭からも拍手や声援の音声をコンサート会場に送るという双方向コミュニケーションシステムが登場する可能性がある。

0019

あるいはまた、複数の地点をネットワークで結び、それらの地点にいる人々が1つのグループとして同じバーチャル空間(例えば探検すべきジャングル等)を体験し、各地点から残りの全ての地点に音声を送ることにより、そのバーチャル空間内で各人が意思疎通をとれるようにした双方向コミュニケーションシステムが登場する可能性もある。

0020

こうした新しい形態の双方向コミュニケーションシステムでは、音声信号の必要帯域をハイファイ用の音響信号の必要帯域と同じ20kHzと考えると、音声信号のサンプリング周波数をその2倍の40kHz以上にする必要があり、且つ、臨場感を得るために、ステレオ音声信号を送受信することが必要になる。

0021

しかし、このようにサンプリング周波数の高いステレオ音声信号を送受信する双方向コミュニケーションシステムにおいて、図2に示したような構成のエコーキャンセラ105を用いようとすると、エコーキャンセラの大型化及び高コスト化を招いてしまうという不都合が生じる。

0022

その理由は2つある。すなわち、第1の理由として、図2のエコーキャンセラ105のような適応フィルタを用いるエコーキャンセラでは、一般にデジタルフィルタとしてFIRフィルタを用いて系の同定を行うため、この最大エコーパス長は、図3に示すように、[タップ数(デジタルフィルタのタップ数を上限として、個々のサンプル信号について実際に乗算を行うことのできるタップ数)] ×[ 1/FS] (FSは音声信号のサンプリング周波数)になる。

0023

そして、適応フィルタとして用いるDSPやRAMの処理速度には限界があるので、エコーキャンセラ105がリアルタイム処理を行う場合、サンプリング周波数FSが高くなると、[ 個々のサンプル信号について実際に乗算を行うことのできるタップ数] はそれに比例して減少する。

0024

また、サンプリング周波数FSが高くなると、[ 1/FS] もそれに比例して小さくなる。

0025

したがって、同じ処理能力の(同じ仕様のDSPやRAMを同じ数だけ用いた)適応フィルタでは、サンプリング周波数FSが高くなると、最大エコーパス長はその2乗に比例して短くなる(例えばサンプリング周波数FSが16kHzから3倍の48kHzになった場合には、最大エコーパス長は9分の1の短さになる)。

0026

しかし、最大エコーパス長が短くなると、スピーカから出力した後僅かの時間遅れてマイクロホンに飛び込んだ音声しかエコーとしてキャンセルできなくなるので、少し広い部屋になるとエコーをキャンセルできなくなってしまう。そのため、製品としてのエコーキャンセラでは、最大エコーパス長が或る一定の長さ(対応する部屋のエコーパス長、例えば300ミリ秒)以上でなければならない。

0027

このようにサンプリング周波数FSが高くなった場合にも一定の長さ以上の最大エコーパス長を確保するためには、エコーキャンセラ105の処理能力を高めなければならない。例えばサンプリング周波数FSが16kHzから3倍の48kHzになった場合にも同じ長さの最大エコーパス長を確保しようとすると、エコーキャンセラ105の処理能力を9倍に高める(同じ仕様のDSPやRAMを用いる場合にはDSPやRAMの個数を9倍にする)ことが必要になる。

0028

次に、第2の理由として、図2のエコーキャンセラ105でステレオ音声信号を処理する場合には、図4に示すように、左チャンネル用スピーカ122Lから出力した音声Lが左右2チャンネル方式のステレオマイクロホン内の左チャンネル用マイクロホンカプセル121Lに飛び込む現象, 左チャンネル用スピーカ122Lから出力した音声Lがこのステレオマイクロホン内の右チャンネル用マイクロホンカプセル121Rに飛び込む現象,右チャンネル用スピーカ122Rから出力した音声Rがこの左チャンネル用マイクロホンカプセル121Lに飛び込む現象, 右チャンネル用スピーカ122Rから出力した音声Rがこの右チャンネル用マイクロホンカプセル121Rに飛び込む現象の合計4つの現象をそれぞれエコーとして扱うことが必要になる。

0029

したがって、1個のスピーカから出力した音声が1個のモノラルマイクホンに飛び込む現象だけをエコーとして扱う場合に対して、エコーキャンセラ105の処理能力を4倍に高める(同じ仕様のDSPやRAMを用いる場合にはDSPやRAMの数を4倍にする)ことが必要になる。

0030

さらに、左チャンネル用マイクロホンカプセル121Lに飛び込んだ音声のうち左チャンネル用スピーカ122Lからの音声Lと右チャンネル用スピーカ122Rからの音声Rとを判別する処理や、右チャンネル用マイクロホンカプセル121Rに飛び込んだ音声のうち左チャンネル用スピーカ122Lからの音声Lと右チャンネル用スピーカ122Rからの音声Rとを判別する処理も必要になる。

0031

この判別を行うための技術は、例えば特開平10−190848号公報に開示されているが、エコーキャンセラ105にさらに多くの回路を追加することが必要とされている。

0032

この2つの理由から、例えばエコーキャンセラ105でサンプリング周波数48kHzのステレオ音声信号を処理する場合には、サンプリング周波数16kHzのモノラル音声信号を処理する場合に対して、エコーキャンセラ105の処理能力を9×4=36倍以上に高める(同じ仕様のDSPやRAMを用いる場合にはDSPやRAMの個数を36倍以上にする)ことが必要になる。

0033

具体的には、サンプリング周波数16kHzのモノラル音声信号を処理するエコーキャンセラ105としては前述のようにDSP, RAMをそれぞれ2個, 6個設けたものが存在しているので、サンプリング周波数48kHzのステレオ音声信号を処理する場合には、同じ仕様のDSP, RAMをそれぞれ2×36=72個, 6×36=216個以上という多数個用いることが必要になる。したがって、エコーキャンセラの非常な大型化及び高コスト化を招いてしまう。

0034

本発明は、上述の点に鑑み、サンプリング周波数の高いステレオ音声信号を送受信する双方向コミュニケーションシステムにおいて、一定以上の長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルすることのできるエコーキャンセラ及びエコーキャンセリング方法を提供することを課題としてなされたものである。

課題を解決するための手段

0035

本発明では、適応フィルタをエコーキャンセラに用いるに際し、音声やエコーの次のような2つの特徴に着目した。

0036

第1の特徴として、音声は、周波帯域が高くなるにつれて、伝播における減衰係数が大きくなるとともに、部屋の壁等での反射の際の吸収係数も大きくなる。そのため、スピーカから出力した後ある程度の時間(例えば100ミリ秒)以上遅れてマイクロホンに飛び込む音声は、低周波帯域成分が大部分である。

0037

この第1の特徴からは、例えば300ミリ秒というような長い最大エコーパス長は、全ての周波数帯域の音声について確保する必要はなく、少なくとも低周波帯域の音声について確保すればよいことになる。

0038

第2の特徴として、左右2チャンネルのスピーカから出力してステレオマイクロホンに飛び込む音声は、それらのスピーカとステレオマイクロホンとの間のエコー経路の距離が長くなるにつれて、左チャンネルの音声と右チャンネルの音声との差が少なくなる。そのため、それらのスピーカから出力した後部屋の壁等で反射してステレオマイクロホンに飛び込む音声は、ステレオ音声よりもむしろモノラル音声に近くなる。マイクロホンのステレオ方式でいえば、このようなモノラル音声に近い音声は、M−S(ミッドサイド)方式におけるマイク正面方向の成分であるミッド成分の音声に相当する。

0039

この第2の特徴からは、ステレオ音声信号を送受信する双方向コミュニケーションシステムでも、エコーキャンセラでの処理は、左右2チャンネル方式における各チャンネルの音声信号について行う必要はなく、M−S方式におけるミッド成分の音声信号を中心に行えばよいことになる。

0040

そこで、本発明に係るエコーキャンセラは、スピーカに送られる所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のミッド成分の音声信号を、低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割する第1の帯域分割手段と、この第1の帯域分割手段で帯域分割された低周波帯域のミッド成分の音声信号のサンプリング周波数を所定レート下げる第1の周波数変換手段と、マイクロホンから入力するこの所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のミッド成分の音声信号を、この低周波帯域の音声信号とこの高周波帯域の音声信号とに帯域分割する第2の帯域分割手段と、この第2の帯域分割手段で帯域分割された低周波帯域のミッド成分の音声信号のサンプリング周波数をこの所定レートで下げる第2の周波数変換手段と、この第1の周波数変換手段から出力した低周波帯域のミッド成分の音声信号がリファレンス信号として供給されるとともに、この第2の周波数変換手段から出力した低周波帯域のミッド成分の音声信号が目標信号として供給され、このリファレンス信号からこの目標信号のレプリカを作成し、この目標信号からこのレプリカを差し引いた誤差信号を出力する適応フィルタと、この適応フィルタから出力した誤差信号のサンプリング周波数をこの所定のサンプリング周波数に上げる第3の周波数変換手段とを備えるようにした。

0041

このエコーキャンセラでは、スピーカに送られる所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のミッド成分の音声信号が、第1の帯域分割手段で低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割される。そして、この低周波帯域のミッド成分の音声信号が、第1の周波数変換手段でサンプリング周波数を下げられた後、適応フィルタにリファレンス信号として入力する。

0042

また、マイクロホンから入力するこの所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のミッド成分の音声信号が、第2の帯域分割手段で第1の帯域分割手段と同じく低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割される。そして、この低周波帯域のミッド成分の音声信号が、第2の周波数変換手段で第1の周波数変換手段と同じレートでサンプリング周波数を下げられた後、適応フィルタに目標信号として入力する。

0043

適応フィルタでは、図2のエコーキャンセラ105について説明したのと同様にして、このリファレンス信号からこの目標信号のレプリカが作成され、この目標信号からこのレプリカを差し引いた誤差信号が出力される。

0044

その際、一定の最大エコーパス長を確保するために必要なこの適応フィルタの処理能力は、前述の第1の理由から、サンプリング周波数の低下の度合いの2乗に比例して低くなっている。

0045

また、低周波帯域のミッド成分の音声信号だけを処理するので、前述の第2の理由として述べたようにこの適応フィルタの処理能力を4倍に高める必要はない。

0046

この適応フィルタから出力した誤差信号は、第3の周波数変換手段でサンプリング周波数をエコーキャンセラへの入力音声信号と同じサンプリング周波数に上げられた後、このエコーキャンセラから出力する。

0047

このエコーキャンセラによれば、ステレオ音声信号を処理するにもかかわらず、またこのステレオ音声信号のサンプリング周波数が高くても、それほど処理能力の高くない適応フィルタを用いたまま、一定以上の(例えば300ミリ秒というような)長い最大エコーパス長を確保できるようになる。

0048

したがって、サンプリング周波数の高いステレオ音声信号を送受信する双方向コミュニケーションシステムにおいて、一定以上の長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルすることができるようになる。

0049

なお、このエコーキャンセラにおいて、一例として、スピーカに送られるこの所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のサイド成分の音声信号を、低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割する第3の帯域分割手段と、この第3の帯域分割手段で帯域分割された低周波帯域のサイド成分の音声信号のサンプリング周波数を所定レートで下げる第4の周波数変換手段と、マイクロホンから入力するこの所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のサイド成分の音声信号を、この低周波帯域の音声信号とこの高周波帯域の音声信号とに帯域分割する第4の帯域分割手段と、この第4の帯域分割手段で帯域分割された低周波帯域のサイド成分の音声信号のサンプリング周波数をこの所定レートで下げる第5の周波数変換手段と、この第4の周波数変換手段から出力した低周波帯域のサイド成分の音声信号がリファレンス信号として供給されるとともに、この第5の周波数変換手段から出力した低周波帯域のサイド成分の音声信号が目標信号として供給され、このリファレンス信号からこの目標信号のレプリカを作成し、この目標信号からこのレプリカを差し引いた誤差信号を出力する第2の適応フィルタと、この第2の適応フィルタから出力した誤差信号のサンプリング周波数をこの所定のサンプリング周波数に上げる第6の周波数変換手段と、この第6の周波数変換手段から出力した誤差信号と第3の周波数変換手段から出力した誤差信号とを加算する加算手段とをさらに備えることが好適である。

0050

あるいはまた、第1の帯域分割手段で帯域分割された高周波帯域のミッド成分の音声信号がリファレンス信号として供給されるとともに、第2の帯域分割手段で帯域分割された高周波帯域のミッド成分の音声信号が目標信号として供給され、このリファレンス信号からこの目標信号のレプリカを作成し、この目標信号からこのレプリカを差し引いた誤差信号を出力する第3の適応フィルタと、この第3の適応フィルタから出力した誤差信号と第3の周波数変換手段から出力した誤差信号とを加算する加算手段とをさらに備えることも好適である。

0051

このように、低周波帯域のミッド成分の音声信号以外の、低周波帯域のサイド成分の音声信号,高周波帯域のミッド成分の音声信号を処理する第2, 第3の適応フィルタをいわば補助的に設けることにより、そうした音声信号についてもエコーがキャンセルされるので、一層よくエコーをキャンセルすることができるようになる。

0052

そして、こうした低周波帯域のサイド成分の音声や高周波帯域のミッド成分の音声について確保すべき最大エコーパス長は、前述した音声やエコーの特徴から、低周波帯域のミッド成分の音声について確保すべき最大エコーパス長よりも短くてよい。

0053

したがって、これらの補助的な適応フィルタの処理能力も低くて済むので、やはり小型且つ低コストにエコーをキャンセルすることができる。

0054

また、このエコーキャンセラにおいて、一例として、スピーカに送られる左右2チャンネルのステレオ音声信号を、M−S方式のステレオ音声信号に変換する第1のステレオ方式変換手段と、マイクロホンから入力する左右2チャンネルのステレオ音声信号を、M−S方式のステレオ音声信号に変換する第2のステレオ方式変換手段とをさらに備え、この第1のステレオ方式変換手段から出力したミッド成分の音声信号が第1の帯域分割手段で帯域分割され、この第2のステレオ方式変換手段から出力したミッド成分の音声信号が第2の帯域分割手段で帯域分割されるようにすることが好適である。

0055

それにより、M−S方式ではなく通常の方式(左右2チャンネル方式)のステレオマイクロホンを設けた双方向コミュニケーションシステムでも、小型且つ低コストにエコーをキャンセルすることができるようになる。

0056

また、このエコーキャンセラにおいて、一例として、適応フィルタに、リファレンス信号,目標信号,誤差信号の時間平均エネルギーをそれぞれ算出する手段と、この時間平均エネルギーの大きさに応じてタップ係数の更新を制御する手段とを含めることが好適である。

0057

このように、リファレンス信号,目標信号,誤差信号のそれぞれの時間平均エネルギーの大きさに応じてタップ係数の更新を制御することにより、エコー経路の変化(例えばステレオマイクロホンを向ける方向の変化)や瞬間的なノイズ音(例えばドア開閉音)の発生にも適確に対応してエコーをキャンセルすることができるようになる。

0058

また、このエコーキャンセラにおいて、一例として、適応フィルタから出力した所定の閾値以下の誤差信号を減衰させる減衰手段をさらに備え、この減衰手段の出力信号のサンプリング周波数を第3の周波数変換手段で上げることが好適である。

0059

それにより、適応フィルタではキャンセルしきれない微小ベルの誤差信号が減衰するので、一層よくエコーをキャンセルすることができるようになる。

0060

次に、本発明に係るエコーキャンセリング方法は、スピーカに送られる所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のミッド成分の音声信号を、低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割する第1ステップと、この第1ステップで帯域分割した低周波帯域のミッド成分の音声信号を、サンプリング周波数を所定レートで下げて、適応フィルタにリファレンス信号として供給する第2ステップと、マイクロホンから入力するこの所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のミッド成分の音声信号を、この低周波帯域の音声信号とこの高周波帯域の音声信号とに帯域分割する第3ステップと、この第3ステップで帯域分割した低周波帯域のミッド成分の音声信号を、サンプリング周波数をこの所定レートで下げて、この適応フィルタに目標信号として供給する第4ステップと、この適応フィルタにおいて、このリファレンス信号からこの目標信号のレプリカを作成し、この目標信号からこのレプリカを差し引いた誤差信号を出力する第5ステップと、この適応フィルタから出力した誤差信号のサンプリング周波数をこの所定のサンプリング周波数に上げる第6ステップとを有するようにした。

0061

このエコーキャンセリング方法によれば、前述の本発明に係るエコーキャンセラと全く同様にして、音声信号のサンプリング周波数が高く且つステレオ音声信号を送受信する双方向コミュニケーションシステムにおいて、一定以上の長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルすることができるようになる。

0062

なお、このエコーキャンセリング方法においても、一例として、スピーカに送られるこの所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のサイド成分の音声信号を、低周波帯域の音声信号と高周波帯域の音声信号とに帯域分割するステップと、帯域分割したこの低周波帯域のサイド成分の音声信号を、サンプリング周波数を所定レートで下げて、別の適応フィルタにリファレンス信号として供給するステップと、マイクロホンから入力するこの所定のサンプリング周波数のステレオ音声信号のうち、M−S方式のサイド成分の音声信号を、この低周波帯域の音声信号とこの高周波帯域の音声信号とに帯域分割するステップと、帯域分割したこの低周波帯域のサイド成分の音声信号を、サンプリング周波数をこの所定レートで下げて、この別の適応フィルタに目標信号として供給するステップと、この別の適応フィルタにおいて、このリファレンス信号からこの目標信号のレプリカを作成し、この目標信号からこのレプリカを差し引いた誤差信号を出力するステップと、この別の適応フィルタから出力した誤差信号と第6ステップでサンプリング周波数を上げた誤差信号とを加算するステップとをさらに有することが好適である。

0063

あるいはまた、第1ステップで帯域分割した高周波帯域のミッド成分の音声信号を別の適応フィルタにリファレンス信号として供給するとともに、第3ステップで帯域分割した高周波帯域のミッド成分の音声信号をこの別の適応フィルタに目標信号として供給するステップと、この別の適応フィルタにおいて、このリファレンス信号からこの目標信号のレプリカを作成し、この目標信号からこのレプリカを差し引いた誤差信号を出力するステップと、この別の適応フィルタから出力した誤差信号と第6ステップでサンプリング周波数を上げた誤差信号とを加算するステップとをさらに有することも好適である。

0064

それにより、前述の本発明に係るエコーキャンセラと全く同様にして、低周波帯域のサイド成分の音声信号や高周波帯域のミッド成分の音声信号についてもエコーがキャンセルされるので一層よくエコーをキャンセルできるとともに、これらの別の適応フィルタ(補助的な適応フィルタ)の処理能力は低くて済むのでやはり小型且つ低コストにエコーをキャンセルすることができるようになる。

発明を実施するための最良の形態

0065

以下、本発明を、サンプリング周波数48kHzのステレオ音声信号を送受信する双方向コミュニケーションシステムに適用した例について、図面を用いて説明する。

0066

図5は、本発明を適用した双方向コミュニケーションシステムで使用される音声送受信用の機器を示しており、図1,図4と共通する機器には同一の符号を付している。

0067

地点Aに、左右2チャンネル方式のステレオマイクロホン121,スピーカ122L, 122R,ADコンバータ51, DAコンバータ52,エコーキャンセラ1,音声コーデック106及びネットワークインタフェース107が設けられている。

0068

地点Aとは離れた地点Bにも、同じくステレオマイクロホン121,スピーカ122L, 122R,ADコンバータ51, DAコンバータ52,エコーキャンセラ1,音声コーデック106及びネットワークインタフェース107が設けられている。

0069

ADコンバータ51のサンプリング周波数は、48kHz(ハイファイ用の音響信号の必要帯域である20kHzの2倍以上)になっている。

0070

地点Aのネットワークインタフェース107と地点Bのネットワークインタフェース107とは、電話回線等を用いたネットワーク108で結ばれている。

0071

地点Aにおいて、ステレオマイクロホン121に音声が入力すると、ステレオマイクロホン121からの左右2チャンネルの音声信号が、ADコンバータ51によりサンプリング周波数48kHzでデジタル変換された後、エコーキャンセラ1を経て音声コーデック106で符号化(圧縮)され、ネットワークインタフェース107から通信ネットワーク108経由で地点Bのネットワークインタフェース107に送られる。そして、地点Bにおいて、音声コーデック106で復号(伸長)され、エコーキャンセラ1を経てDAコンバータ52でアナログ変換されて、スピーカ122L, 122Rから出力する。

0072

地点Bにおいても、ステレオマイクロホン121に音声が入力すると、ステレオマイクロホン121からの左右2チャンネルの音声信号が、ADコンバータ51によりサンプリング周波数48kHzでデジタル変換された後、エコーキャンセラ1を経て音声コーデック106で符号化され、ネットワークインタフェース107から通信ネットワーク108経由で地点Aのネットワークインタフェース107に送られる。そして、地点Aにおいて、音声コーデック106で復号され、エコーキャンセラ1を経てDAコンバータ52でアナログ変換されて、スピーカ122L, 122Rから出力する。

0073

図6は、エコーキャンセラ1の構成を示す。エコーキャンセラ1は、MSコンバータ2, 3と、帯域分割フィルタ4〜7と、デシメータ8〜11と、エコーキャンセルブロック12〜15と、エキスパンダゲート回路16〜19と、インターポレータ20, 21と、加算器22, 23と、LRコンバータ24とで構成されている。

0074

相手方の地点から自分の地点に送られて音声コーデック106(図5)からエコーキャンセラ1に入力するサンプリング周波数48kHzの左右2チャンネルの音声信号xL, xRが、MSコンバータ2に供給されるとともに、そのままエコーキャンセラ1から出力してDAコンバータ52(図5)に送られる。

0075

また、自分の地点のステレオマイクロホン121(図5)からADコンバータ51(図5)を経てエコーキャンセラ1に入力したサンプリング周波数48kHzの左右2チャンネルの音声信号yL, yRが、MSコンバータ3に供給される。

0076

MSコンバータ2, 3は、それぞれ次の式(1) , (2) の演算を行うことにより、左右2チャンネルの音声信号L, R(ここでは音声信号xL, yL, xR, yR)を、M−S(ミッド−サイド)ステレオ方式のミッド成分,サイド成分の音声信号M, Sに変換する回路である。
M=(L+R)/2 …(1)
S=(L−R)/2α (但し0<α<1) …(2)

0077

MSコンバータ2で変換された音声信号xM, xSは、それぞれ帯域分割フィルタ4, 5に供給される。また、MSコンバータ3で変換された音声信号yM,ySは、それぞれ帯域分割フィルタ6, 7に供給される。

0078

帯域分割フィルタ4〜7は、それぞれ音声信号を3kHz未満の低周波帯域の音声信号と3kHz以上の高周波帯域の音声信号とに分割する。

0079

図7は、帯域分割フィルタ4〜7の構成を示す。帯域分割フィルタ4〜7では、直線位相型のFIRフィルタでLPFローパスフィルタ)31を構成し、このLPF31によって入力音声信号から低周波帯域の音声信号を得ている。

0080

また、入力音声信号を遅延回路32でLPF31での処理時間分だけ遅延させ、加減算器33で遅延回路32の出力信号からLPF31の出力信号を差し引くことにより、高周波帯域の音声信号を得ている。

0081

帯域分割フィルタ4〜7を、IIRフィルタで構成したLPFやHPFハイパスフィルタ)を用いて帯域分割を行う構成ではなく図7のような構成にしたのは、帯域分割した低周波帯域の音声信号と高周波帯域の音声信号とを後述のように加算器22, 23で再び合成してもとの音声信号を再現することを考慮して、忠実にもとの音声信号を再現できるようにするためである。

0082

図6に示すように、帯域分割フィルタ4で帯域分割された高周波帯域のミッド成分の音声信号xMHは、エコーキャンセルブロック12, 14にそれぞれリファレンス信号x(k)として送られる。

0083

帯域分割フィルタ4で帯域分割された低周波帯域のミッド成分の音声信号xMLは、デシメータ8に送られる。

0084

帯域分割フィルタ5で帯域分割された高周波帯域のサイド成分の音声信号xSHは、エコーキャンセルブロック12, 14にそれぞれリファレンス信号x(k)として送られる。

0085

帯域分割フィルタ5で帯域分割された低周波帯域のサイド成分の音声信号xSLは、デシメータ9に送られる。

0086

帯域分割フィルタ6で帯域分割された高周波帯域のミッド成分の音声信号yMHは、エコーキャンセルブロック12に目標信号y(k)として送られる。

0087

帯域分割フィルタ6で帯域分割された低周波帯域のミッド成分の音声信号yMLは、デシメータ10に送られる。

0088

帯域分割フィルタ7で帯域分割された高周波帯域のサイド成分の音声信号ySHは、エコーキャンセルブロック14に目標信号y(k)として送られる。

0089

帯域分割フィルタ7で帯域分割された低周波帯域のサイド成分の音声信号ySLは、デシメータ11に送られる。

0090

デシメータ8〜11は、それぞれデジタル信号のサンプリング周波数を1/8のレートで下げる回路である。

0091

デシメータ8でサンプリング周波数を48kHzの1/8の6kHz(低周波帯域と高周波帯域との境界である3kHzの2倍)に下げられた低周波帯域のミッド成分の音声信号xMLは、エコーキャンセルブロック13, 15にそれぞれリファレンス信号x(k)として送られる。

0092

デシメータ9でサンプリング周波数を6kHzに下げられた低周波帯域のサイド成分の音声信号xSLは、エコーキャンセルブロック13, 15にそれぞれリファレンス信号x(k)として送られる。

0093

デシメータ10でサンプリング周波数を6kHzに下げられた低周波帯域のミッド成分の音声信号yMLは、エコーキャンセルブロック13に目標信号y(k)として送られる。

0094

デシメータ11でサンプリング周波数を6kHzに下げられた低周波帯域のサイド成分の音声信号ySLは、エコーキャンセルブロック15に目標信号y(k)として送られる。

0095

図8は、エコーキャンセルブロック12〜15の構成を示す。エコーキャンセルブロック12〜15は、図2のエコーキャンセラ105と同様に、適応フィルタで構成されており、デジタルフィルタ41と、加減算器42と、コントローラ43とを含んでいる。

0096

デジタルフィルタ41は、図2のデジタルフィルタ111について述べたのと同様にして、エコー経路の伝達関数Hk(z)を推定し、伝達関数Hk(z)とリファレンス信号x(k)の時系列ベクトル[ x(k), x(k−1), …x(k−N−1)] とを畳み込むことにより、目標信号y(k)のレプリカy’(k)を作成する。

0097

その際、ミッド成分の音声信号をリファレンス信号x(k)としてレプリカy’(k)を作成する割合を、サイド成分の音声信号をリファレンス信号x(k)としてレプリカy’(k)を作成する割合よりも大きくする。

0098

具体的には、エコーキャンセルブロック13では、例えば低周波帯域のミッド成分の音声信号xMLをリファレンス信号x(k)とするレプリカy’(k)の作成と、低周波帯域のサイド成分の音声信号xSLをリファレンス信号x(k)とするレプリカy’(k)の作成とを10対1程度の割合で行う。

0099

加減算器42は、目標信号y(k)からレプリカy’(k)を差し引くことにより、エコーをキャンセルする。

0100

コントローラ43は、加減算器42から出力する誤差信号e(k)(目標信号y(k)からレプリカy’(k)を差し引いた残りの信号)の大きさに応じて、以下に述べるように、ESアフィン射影法を基礎としつつ、リファレンス信号x(k), 目標信号y(k)及び誤差信号e(k)のエネルギーを監視する手法で、デジタルフィルタ41のタップ係数を更新する。

0101

一般的なアフィン射影法では、デジタルフィルタ41のタップ係数Bk(z)は、次の式(3) のようにして更新される。

0102

0103

ESアフィン射影法では、このアフィン射影法においてエコーの音響的性質の係数a(z)をさらに考慮することにより、タップ係数Bk(z)が次の式(4)のようにして更新される。

0104

0105

この係数a(z)は、一般的にzが大きくなるにつれて指数関数的に小さくなる。すなわち、遅延量の大きい信号ほどタップ係数Bk(z)の更新量が小さくなる。

0106

コントローラ43による更新アルゴリズムでは、このESアフィン射影法を基礎としつつ、リファレンス信号x(k),目標信号y(k)及び誤差信号e(k)のエネルギーを監視することによって可変設定される係数である係数b(k)(0≦b(k)≦1)が導入される。

0107

そして、この係数b(k)を用いて、デジタルフィルタ41のタップ係数Bk(z)が次の式(5) のようにして更新される。

0108

0109

図9は、コントローラ43が各サンプリング周期毎に実行する係数b(k)の設定処理を示す。

0110

この処理では、最初に、リファレンス信号x(k),目標信号y(k),誤差信号e(k)の時間平均エネルギーXe(k), Ye(k), Ee(k)をそれぞれ算出する(ステップS1)。

0111

なお、ここでは、タップ数とサンプリング周期との積を平均時間として、指数関数的な(現在の時点の信号をその後の時点の信号よりも大きく重み付けした)時間平均エネルギーを算出する。

0112

しかし、この時間平均エネルギーの算出方法としては、これ以外に、タップ数とサンプリング周期との積以外を平均時間とする方法や、均等な(重み付けをしない)時間平均エネルギーを算出する方法も挙げられる。

0113

これらのうちのどの算出方法をとるかは、本発明を適用する個々の双方向コミュニケーションシステム毎に、そのシステム全体(音声信号の周波数帯域, 音声信号のサンプリング周期,マイクロホンやスピーカの特性等)を考慮して決めればよい。

0114

ステップS1に続き、リファレンス信号x(k)の時間平均エネルギーXe(k)が、閾値Xth(但しXthは−20dBから−6dBの間の値)よりも大きいか否かを判断する(ステップS2)。

0115

相手方の地点から自分の地点に送られる音声信号(図5では音声信号xL, xR)のレベルが低い場合には、スピーカ122L, 122Rから出力してステレオマイクロホン121に飛び込む音量が小さくなるので、ステレオマイクロホン121への入力音声は、スピーカ122L, 122Rから飛び込む音声以外の音声の割合が支配的となる。

0116

そうした状態でデジタルフィルタ41のタップ係数Bk(z)を更新すると、デジタルフィルタ41が正常な値に収束しなくなってしまう。

0117

そこで、ステップS2では、Xe(k)>Xthであるか否かを判断することにより、スピーカ122L, 122Rからステレオマイクロホン121に飛び込む音量がある程度以上の大きさになるか否かを判断する。

0118

ここではXthを−20dBから−6dBの間の値にしているが、このXthの値も前述の時間平均エネルギーの算出方法と同様にシステム全体を考慮して決めればよい。

0119

ステップS2でノーであれば、当該サンプリング周期でのb(k)の値を0に設定するとともに、コントローラ43の内部カウンタカウント値CCを0にセットする(ステップS7)。そして処理を終了する。

0120

このようにb(k)の値を0に決定することにより、前述の式(5) から、当該サンプリング周期ではタップ係数Bk(z)が更新されなくなる。

0121

他方、ステップS2でイエスであれば、続いて、リファレンス信号x(k)の時間平均エネルギーXe(k)と所定の係数k1との積が,目標信号y(k)の時間平均エネルギーYe(k)よりも大きいか否かを判断する(ステップS3)。

0122

スピーカ122L, 122Rからステレオマイクロホン121に飛び込む音量がある程度以上の大きさであっても、自分の地点で発生したそれ以上の音量が同時にステレオマイクロホン121に入力している(例えば、自分の地点で人がステレオマイクロホン121に向かって話していたり、自分の地点で大きな雑音が発生していたりする)ことがある。

0123

そうしたダブルトークの状態でデジタルフィルタ41のタップ係数Bk(z)を更新すると、やはりデジタルフィルタ41が正常な値に収束しなくなってしまう。

0124

そこで、ステップS3では、k1・Xe(k)>Ye(k)であるか否かを判断することにより、スピーカ122L, 122Rからステレオマイクロホン121に飛び込む音量が、自分の地点で発生してステレオマイクロホン121に入力している音量よりも大きいか否かを判断する。

0125

k1は、スピーカ122L, 122Rから出力した音声がステレオマイクロホン121に飛び込むまでに減衰する量に対応する係数であり、ここでは−10dBから−3dBの間の値にしている(このk1の値もシステム全体を考慮して決めればよい)。

0126

ステップS3でノーであれば、ステップS7に進む。これにより、前述の式(5) から、当該サンプリング周期ではタップ係数Bk(z)が更新されなくなる。

0127

他方、ステップS3でイエスであれば、続いて、誤差信号e(k)の時間平均エネルギーEe(k)が、所定の閾値Ethよりも大きいか否かを判断する(ステップS4)。

0128

Ee(k)の値が一定以下である場合には、デジタルフィルタ41が最適化(ロック)されているとみなしてよい。ステップS4では、Ee(k)>Ethであるか否かを判断することにより、デジタルフィルタ41がロックされているか否かを判断する。

0129

ステップS4でノーであれば(デジタルフィルタ41がロックされていれば)、当該サンプリング周期でのb(k)の値をk3(但しk3は0.3から0.7の間の値)に設定する(ステップS10)。そして処理を終了する。

0130

デジタルフィルタ41がロックされているときには、一般的に、タップ係数の更新量を小さくしたほうが誤差信号e(k)が小さくなる。

0131

そこで、ステップS10では、b(k)の値を小さくしている。これにより、前述の式(5) から、当該サンプリング周期ではタップ係数Bk(z)の更新量が小さくなる。

0132

ここではk3を0.3から0.7の間の値にしているが、このk3の値もシステム全体を考慮して決めればよい。

0133

他方、ステップS4でイエスであれば、内部カウンタのカウント値CCが閾値CCth(但しCCthは256から512の間の値)未満であることを条件として、このカウント値CCを1だけインクリメントする(ステップS5)。

0134

続いて、内部カウンタのカウント値CCがこの閾値CCthに達したか否かを判断する(ステップS6)。

0135

誤差信号e(k)の時間平均エネルギーEe(k)が一定の値よりも大きい場合(デジタルフィルタ41がロックされていない場合)、その原因としては、エコー経路が変化した(例えばステレオマイクロホン121の向きが変化した)ことと、瞬間的なノイズ音(例えばドアの開閉音)が発生したこととの2通りが考えられる。

0136

しかし、このうちのいずれの原因によるものであるかは、一定以上の期間(サンプリング周期よりもかなり長い期間)に亘ってEe(k)の値を監視しなければ区別がつかない。

0137

そこで、ステップS5, S6では、内部カウンタを用いて、デジタルフィルタ41がロックされていない状態が一定以上の期間に亘って続いているか否かを判断する。

0138

ステップS6でノーであれば、当該サンプリング周期でのb(k)の値を0に設定する(ステップS9)。そして処理を終了する。

0139

これにより、デジタルフィルタ41がロックされていない状態が一定以上の期間に亘って続くまでは、前述の式(5) から、タップ係数Bk(z)の更新が停止される。

0140

他方、ステップS6でイエスであれば、当該サンプリング周期でのb(k)の値をk2・b(k−1)+(1−k2)(但しk2は0.1から0.001の間の値)に設定する(ステップS8)。そして処理を終了する。

0141

すなわち、デジタルフィルタ41がロックされていない状態が一定以上の期間に亘って続くと、エコー経路が変化したと判断し、デジタルフィルタ41がロックされるまで、k2を時定数として各サンプリング周期でのb(k)の値を指数関数的に1に近づける。

0142

これにより、前述の式(5) から、デジタルフィルタ41がロックされるまで、各サンプリング周期でのタップ係数Bk(z)の更新量が徐々に大きくなる。

0143

このようにして、エコー経路が変化した場合には、最初は緩やかにタップ係数Bk(z)が更新されるが、それでもデジタルフィルタ41がロックされない場合には、速やかにデジタルフィルタ41をロックさせるために、タップ係数Bk(z)の更新量が大きくされる。

0144

ここではCCth, k2をそれぞれ256から512の間の値, 0.1から0.001の間の値にしているが、これらの値もシステム全体を考慮して決めればよい。

0145

エコーキャンセルブロック12では、デジタルフィルタ41のタップ数は、サンプリング周波数48kHzのモノラル音声信号に対する最大エコーパス長を約数十ミリ秒にする数になっている。

0146

エコーキャンセルブロック13では、デジタルフィルタ41のタップ数は、サンプリング周波数6kHzのモノラル音声信号に対する最大エコーパス長を約300ミリ秒にする数になっている。

0147

エコーキャンセルブロック14では、デジタルフィルタ41のタップ数は、サンプリング周波数48kHzのモノラル音声信号に対する最大エコーパス長を約数十ミリ秒にする数になっている。

0148

エコーキャンセルブロック15では、デジタルフィルタ41のタップ数は、サンプリング周波数6kHzのモノラル音声信号に対する最大エコーパス長を約50ミリ秒にする数になっている。

0149

エコーキャンセルブロック12〜15は、実際のハードウェアとしては、適応フィルタとして動作させるためのソフトウェアをインストールしたDSPと、RAMとを用いて構成されている。

0150

図6に示すように、エコーキャンセルブロック12の出力信号(加減算器42から出力した高周波帯域のミッド成分についてのサンプリング周波数48kHzの誤差信号e(k))は、エキスパンダ/ゲート回路16に送られる。

0151

エコーキャンセルブロック13の出力信号(加減算器42から出力した低周波帯域のミッド成分についてのサンプリング周波数6kHzの誤差信号e(k))は、エキスパンダ/ゲート回路17に送られる。

0152

エコーキャンセルブロック14の出力信号(加減算器42から出力した高周波帯域のサイド成分についてのサンプリング周波数48kHzの誤差信号e(k))は、エキスパンダ/ゲート回路18に送られる。

0153

エコーキャンセルブロック15の出力信号(加減算器42から出力した低周波帯域のサイド成分についてのサンプリング周波数6kHzの誤差信号e(k))は、エキスパンダ/ゲート回路19に送られる。

0154

エキスパンダ/ゲート回路16〜19は、業務用の音響機器等において残留ノイズを減少させてダイナミックレンジを上げるために用いられている回路であり、図10に示すように、閾値th以下の入力信号を減衰させて出力する非直線入出力特性を有している。同図において、Dはゲインリダクション量である。

0155

エキスパンダ/ゲート回路16〜19は、瞬時にゲインを変更するのではなく、次の式(6) のように、時定数を持たせて徐々にゲインを変更する(G(t)はゲイン、Aは設定値、kは時定数である)。すなわち、前出の図9のステップS8での係数b(k)と同じく、設定値に対して指数関数的にゲインを変更する。G(t)=A×k+G(t−1)×(1−k) …(6)

0156

ここでは、ゲインを下げる場合(エキスパンダ/ゲート回路をオンにする場合)の設定値は約100ミリ秒、ゲインを上げる場合(信号レベルが閾値thを超えたのでリニアな入出力特性に戻す場合)の設定値は約5ミリ秒にしており、ゲインリダクション量は6dBから12dBの間の値にしているが、これらもシステム全体を考慮して決めればよい。

0157

なお、帯域分割フィルタ4で帯域分割された高周波帯域のミッド成分の音声信号xMHと、帯域分割フィルタ5で帯域分割された高周波帯域のサイド成分の音声信号xSHとは、エキスパンダ/ゲート回路16, 18にもそれぞれ制御信号として与えられる。

0158

また、デシメータ8でサンプリング周波数を6kHzに下げられた低周波帯域のミッド成分の音声信号xMLと、デシメータ9でサンプリング周波数を6kHzに下げられた低周波帯域のサイド成分の音声信号xSLとは、エキスパンダ/ゲート回路17, 19にもそれぞれ制御信号として与えられる。

0159

エキスパンダ/ゲート回路16〜19では、これらの制御信号に基づき、例えば、相手方の地点から自分の地点に音声信号が送られている場合(エコーが発生しない場合)には入力信号をそのまま出力し、他方相手方の地点から自分の地点に音声信号が送られている場合(エコーが発生する場合)には入力信号を図9の入出力特性で減衰させて出力するという切り替え動作を行う。

0160

図6に示すように、エキスパンダ/ゲート回路16の出力信号(高周波帯域のミッド成分についてのサンプリング周波数48kHzの誤差信号)は、加算器22に送られる。

0161

エキスパンダ/ゲート回路17の出力信号(低周波帯域のミッド成分についてのサンプリング周波数6kHzの誤差信号)は、インターポレータ20に送られる。

0162

エキスパンダ/ゲート回路18の出力信号(高周波帯域のサイド成分についてのサンプリング周波数48kHzの誤差信号)は、加算器23に送られる。

0163

エキスパンダ/ゲート回路19の出力信号(低周波帯域のサイド成分についてのサンプリング周波数6kHzの誤差信号)は、インターポレータ21に送られる。

0164

インターポレータ20, 21は、それぞれデジタル信号のサンプリング周波数を8倍のレートで上げる回路である。

0165

インターポレータ20でサンプリング周波数を6kHzの8倍の48kHzに上げられた低周波帯域のミッド成分についての誤差信号は、加算器22に送られて、高周波帯域のミッド成分についての誤差信号と加算される。

0166

インターポレータ21でサンプリング周波数を48kHzに上げられた低周波帯域のサイド成分についての誤差信号は、加算器23に送られて、高周波帯域のサイド成分についての誤差信号と加算される。

0167

加算器22の出力信号(ミッド成分についての誤差信号)と、加算器23の出力信号(サイド成分についての誤差信号)とは、LSコンバータ24に送られる。

0168

LSコンバータ24は、次の式(7) , (8) の演算を行うことにより、M−Sステレオ方式のミッド成分,サイド成分の音声信号M, S(ここでは誤差信号)を、左右2チャンネルステレオ方式の左チャンネル,右チャンネルの音声信号L,Rに変換する回路である。
L=M+αS (但し0<α<1) …(7)
R=M−αS …(8)

0169

LSコンバータ24で変換された左チャンネル,右チャンネルについての誤差信号eL, eRは、エコーキャンセラ1から出力して音声コーデック106(図5)に送られる。

0170

次に、このエコーキャンセラ1でエコーがキャンセルされる様子について説明する。

0171

相手方の地点から自分の地点に送られ、音声コーデック106からエコーキャンセラ1に入力するサンプリング周波数48kHzの左右2チャンネルの音声信号xL, xRが、MSコンバータ2でM−Sステレオ方式のミッド成分,サイド成分の音声信号xM, xSに変換される。

0172

このうち、ミッド成分の音声信号xMは、帯域分割フィルタ4で3kHz未満の低周波帯域の音声信号xMLと3kHz以上の高周波帯域の音声信号xMHとに帯域分割される。そして、この低周波帯域のミッド成分の音声信号xMLが、デシメータ8でサンプリング周波数を6kHzに下げられた後、エコーキャンセルブロック13にリファレンス信号x(k)として入力する。

0173

また、自分の地点のステレオマイクロホン121から入力するサンプリング周波数48kHzの左右2チャンネルの音声信号yL, yRが、MSコンバータ3でM−Sステレオ方式のミッド成分,サイド成分の音声信号yM, ySに変換される。

0174

このうち、ミッド成分の音声信号yMは、帯域分割フィルタ6で3kHz未満の低周波帯域の音声信号yMLと3kHz以上の高周波帯域の音声信号yMHとに帯域分割される。そして、この低周波帯域のミッド成分の音声信号yMLが、デシメータ10でサンプリング周波数を6kHzに下げられた後、エコーキャンセルブロック13に目標信号y(k)として入力する。

0175

エコーキャンセルブロック13では、このリファレンス信号x(k)からこの目標信号y(k)のレプリカy’(k)が作成され、目標信号y(k)からこのレプリカy’(k)を差し引くことにより、低周波帯域のミッド成分の音声信号について、約300ミリ秒の最大エコーパス長でエコーがキャンセルされる。

0176

ここで、音声やエコーには次のような2つの特徴がある。まず、第1の特徴として、音声は、周波帯域が高くなるにつれて、伝播における減衰係数が大きくなるとともに、部屋の壁等での反射の際の吸収係数も大きくなる。そのため、スピーカ122L, 122Rから出力した後ある程度の時間(例えば100ミリ秒)以上遅れてステレオマイクロホン121に飛び込む音声は、低周波帯域成分が大部分である。

0177

この第1の特徴からは、例えば300ミリ秒というような長い最大エコーパス長は、全ての周波数帯域の音声について確保する必要はなく、少なくとも低周波帯域の音声について確保すればよいことになる。

0178

また、第2の特徴として、スピーカ122L, 122Rから出力してステレオマイクロホン121に飛び込む音声は、スピーカ122L, 122Rとステレオマイクロホン121との間のエコー経路の距離が長くなるにつれて、左チャンネルの音声と右チャンネルの音声との差が少なくなる。そのため、スピーカ122L, 122Rから出力した後部屋の壁等で反射してステレオマイクロホン121に飛び込む音声は、ステレオ音声よりもむしろモノラル音声に近くなる。マイクロホンのステレオ方式でいえば、このようなモノラル音声に近い音声は、図11に示すように、M−S(ミッド−サイド)方式におけるマイク正面方向の成分であるミッド成分の音声に相当する。

0179

この第2の特徴からは、ステレオ音声信号を送受信する双方向コミュニケーションシステムでも、エコーキャンセラでの処理は、左右2チャンネル方式における各チャンネルの音声信号について行う必要はなく、M−S方式におけるミッド成分の音声信号を中心に行えばよいことになる。

0180

エコーキャンセラ1では、音声やエコーのこうした特徴に着目して、低周波帯域のミッド成分の音声信号については、エコーキャンセルブロック13によって約300ミリ秒の最大エコーパス長でエコーがキャンセルされるようにしている。

0181

その際、前述のようにコントローラ43がリファレンス信号x(k),目標信号y(k),誤差信号e(k)のそれぞれの時間平均エネルギーXe(k), Ye(k), Ee(k)の大きさに応じてタップ係数Bk(z)の更新を制御することにより、エコー経路の変化や瞬間的なノイズ音の発生にも適確に対応してエコーをキャンセルすることができるようになっている。

0182

また、前述のように低周波帯域のサイド成分の音声信号xSLをリファレンス信号x(k)とするレプリカy’(k)の作成をも1/10程度の割合で行うことにより、ミッド成分のエコーだけをキャンセルした際に残ってしまうサイド成分のエコーも或る程度キャンセルされるようになっている。

0183

また、前述のようにエコーキャンセルブロック13から出力した閾値th以下の誤差信号がエキスパンダ/ゲート回路17で減衰されるので、適応フィルタではキャンセルしきれない微小レベルの誤差信号が減衰することにより、一層よくエコーをキャンセルできるようになっている。

0184

さらに、低周波帯域のミッド成分の音声信号以外の、高周波帯域のミッド成分の音声信号, 低周波帯域のサイド成分の音声信号, 高周波帯域のサイド成分の音声信号についても、いわば補助的に設けたエコーキャンセルブロック12, 14, 15によってそれぞれ約数十ミリ秒, 数十ミリ秒, 50ミリ秒の最大エコーパス長でエコーがキャンセルされた後、それぞれエキスパンダ/ゲート回路16,18, 19によって微小レベルの誤差信号が減衰するので、その点からも一層よくエコーをキャンセルできるようになっている。

0185

そして、エキスパンダ/ゲート回路17から出力した低周波帯域のミッド成分についての誤差信号が、インターポレータ20でサンプリング周波数を48kHzに上げられ、加算器22に送られて、高周波帯域のミッド成分についての誤差信号と加算され、LSコンバータ24でサイド成分についての誤差信号とともに左チャンネル,右チャンネルについての誤差信号に変換されて、エコーキャンセラ1から出力する。

0186

このようにして、このエコーキャンセラ1では、サンプリング周波数48kHzのステレオ音声信号を送受信する双方向コミュニケーションシステム(マイクロホンとしては左右2チャンネル方式のステレオマイクロホン121を設けた双方向コミュニケーションシステム)において、低周波帯域のミッド成分の音声信号を中心として、約300ミリ秒の最大エコーパス長でエコーがキャンセルされる。

0187

次に、このエコーキャンセラ1のハードウェアの規模コストを、サンプリング周波数48kHzのステレオ音声信号を送受信する双方向コミュニケーションシステムにおいて前出の図2のようなエコーキャンセラ105を用いる場合と比較して説明する。

0188

[発明が解決しようとする課題]欄で第1の理由として述べたように、一定の最大エコーパス長を確保するために必要な適応フィルタの処理能力は、サンプリング周波数が低くなると、その2乗に比例した低さで済む。

0189

エコーキャンセルブロック13とエコーキャンセラ105とを比較すると、最大エコーパス長はともに約300ミリ秒であるが、エコーキャンセルブロック13ではサンプリング周波数が6kHzであるのに対しエコーキャンセラ105ではサンプリング周波数が16kHzなので、エコーキャンセルブロック13のほうがサンプリング周波数が6/16の低さになっている。

0190

また、エコーキャンセルブロック13は低周波帯域のミッド成分の音声信号だけを処理するので、[発明が解決しようとする課題]欄で第2の理由として述べたようにエコーキャンセルブロック13の処理能力を4倍に高める必要はない。

0191

したがって、エコーキャンセルブロック13は、エコーキャンセラ105と比較して36/256という低い処理能力で済むので、少数のDSP及びRAMを用いて小型且つ低コストに構成される。

0192

また、エコーキャンセルブロック15は、最大エコーパス長がエコーキャンセルブロック13の1/6の約50ミリ秒なので、エコーキャンセルブロック13よりもさらに処理能力が低くて済み、したがってエコーキャンセルブロック13よりもさらに小型且つ低コストに構成される。

0193

また、エコーキャンセルブロック12, 14は、サンプリング周波数は48kHzなのでエコーキャンセラ105の3倍の高さになっている。したがって、仮にエコーキャンセラ105と同じ長さの最大エコーパス長を確保する場合には、エコーキャンセルブロック12, 14の処理能力はエコーキャンセラ105よりも9倍高くなければならない。

0194

しかし、エコーキャンセルブロック12, 14の最大エコーパス長は、それぞれ数十ミリ秒というようにエコーキャンセラ105の1/10〜数分の1程度である。したがって、エコーキャンセルブロック12, 14も、エコーキャンセラ105と同等またはそれよりも低い処理能力で済むので、やはり少数のDSP及びRAMを用いて小型且つ低コストに構成される。

0195

これに対し、サンプリング周波数48kHzのステレオ音声信号を送受信する双方向コミュニケーションシステムにおいてエコーキャンセラ105を用いる場合には、[発明が解決しようとする課題]欄で第2の理由として述べたように、エコーキャンセラ105の処理能力を36倍以上に高める(同じ仕様のDSPやRAMを用いる場合にはDSPやRAMの個数を36倍以上にする)ことが必要になるので、非常な大型化及び高コスト化を招いてしまう。

0196

したがって、このエコーキャンセラ1は、エコーキャンセルブロック12〜15以外の部分を含めても、サンプリング周波数48kHzのステレオ音声信号を送受信する双方向コミュニケーションシステムにおいてエコーキャンセラ105を用いる場合と比較して、はるかに小型且つ低コストに構成される。

0197

以上のように、このエコーキャンセラ1によれば、サンプリング周波数48kHzのステレオ音声信号を送受信する双方向コミュニケーションシステムにおいて、約300ミリ秒という長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルすることができるようになっている。

0198

したがって、例えばこの双方向コミュニケーションシステムをテレビ会議システムとして構築した場合(テレビ会議システムにおいて、音質を向上させるために音声信号のサンプリング周波数を高めるとともに臨場感を得るためにステレオ音声信号を送受信するようにした場合)に、長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルすることができる。

0199

あるいはまた、この双方向コミュニケーションシステムを[発明が解決しようとする課題]欄で述べたようなエンターテイメント系の新しい形態の双方向コミュニケーションシステムとして構築した場合にも、長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルすることができる。

0200

なお、以上の例ではエコーキャンセラ1内にMSコンバータ2, 3を設けているが、M−S方式のステレオマイクロホンを設けた双方向コミュニケーションシステムにエコーキャンセラ1を用いる場合には、MSコンバータ2, 3を省略してよい。

0201

また、以上の例では音声信号を3kHz未満の低周波帯域と3kHz以上の高周波帯域とに分割しているが、3kHz以外の周波数を境界として低周波帯域と高周波帯域とに分割してもよい。

0202

あるいはまた、音声信号を3以上の帯域(例えば、12kHz以上の帯域, 6kHz以上12kHz未満の帯域, 3kHz以上6kHz未満の帯域, 3kHz未満の帯域の合計4つの帯域)に分割し、周波数の低い帯域ほどサンプリング周波数を大きく下げるとともに最大エコーパス長を長くしてエコーをキャンセルするようにしてもい。

0203

そのようにすることにより、一層きめ細かにエコーをキャンセルすることができるようになる。

0204

また、以上の例では双方向コミュニケーションシステムに本発明を適用しているが、例えばコンサート会場等においてハウリングをキャンセルするためにも本発明を適用してよい。

0205

また、本発明は、以上の例に限らず、本発明の要旨を逸脱することなく、その他様々の構成をとりうることはもちろんである。

発明の効果

0206

以上のように、本発明によれば、サンプリング周波数の高いステレオ音声信号を送受信する双方向コミュニケーションシステムにおいて、一定以上の長い最大エコーパス長を確保しつつ、小型且つ低コストにエコーをキャンセルすることができるという効果が得られる。

0207

また、低周波帯域のサイド成分の音声信号や高周波帯域のミッド成分の音声信号についても補助的な適応フィルタでエコーをキャンセルすることにより、一層よくエコーをキャンセルすることができるとともに、やはり小型且つ低コストにエコーをキャンセルすることができるという効果が得られる。

0208

また、左右2チャンネル方式のステレオ音声信号をM−S方式のステレオ音声信号に変換することにより、通常の方式(左右2チャンネル方式)のステレオマイクロホンを設けた双方向コミュニケーションシステムでも、小型且つ低コストにエコーをキャンセルすることができるという効果が得られる。

0209

また、リファレンス信号,目標信号,誤差信号のそれぞれの時間平均エネルギーの大きさに応じてタップ係数の更新を制御することにより、エコー経路の変化や瞬間的なノイズ音の発生にも適確に対応してエコーをキャンセルすることができるという効果が得られる。

0210

また、適応フィルタから出力した所定の閾値以下の誤差信号を減衰させることにより、一層よくエコーをキャンセルすることができるという効果が得られる。

図面の簡単な説明

0211

図1既存のテレビ会議システムで用いられる音声送受信用の機器を示す図である。
図2従来のエコーキャンセラの構成を示す図である。
図3適応フィルタを用いるエコーキャンセラの最大エコーパス長を示す図である。
図4従来のエコーキャンセラでステレオ音声信号を処理する場合にエコーとして扱う必要のある現象を示す図である。
図5本発明を適用した双方向コミュニケーションシステムで使用される音声送受信用の機器を示す図である。
図6図5のエコーキャンセラの構成を示す図である。
図7図6の帯域分割フィルタの構成を示す図である。
図8図6のエコーキャンセルブロックの構成を示す図である。
図9図6のエコーキャンセルブロック内のコントローラが実行する処理を示すフローチャートである。
図10図6のエキスパンダ/ゲート回路の入出力特性を示す図である。
図11ステレオマイクロホンのM−S方式を示す図である。

--

0212

1エコーキャンセラ、 2, 3 MSコンバータ、 4〜7帯域分割フィルタ、 8〜11デシメータ、 12〜15エコーキャンセルブロック、16〜19エキスパンダ/ゲート回路、 20, 21インターポレータ、22, 23加算器、 24 LRコンバータ、 41デジタルフィルタ、42加減算器、 43コントローラ、 51ADコンバータ、 52 DAコンバータ、 105音声コーデック、 107ネットワークインタフェース、 108ネットワーク、 121ステレオマイクロホン、 122L, 122R スピーカ

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社セガゲームスの「 音声処理装置」が 公開されました。( 2020/10/08)

    【課題】ゲーム機そのものの機能に過度に依存することなく、超過プレイを効果的に検出する。【解決手段】音声処理装置は、外部音声を検出する音声検出部と、外部音声に、コンピュータゲームのゲーム音が含まれるか否... 詳細

  • 沖電気工業株式会社の「 収音装置、収音プログラム及び収音方法」が 公開されました。( 2020/10/08)

    【課題】 エリア収音処理の際に音質劣化を抑制する収音装置、収音プログラム及び収音方法を提供する。【解決手段】 本発明は、収音装置に関する。そして、本発明の収音装置は、複数のマイクアレイのビームフォ... 詳細

  • PioneerDJ株式会社の「 楽曲解析装置および楽曲解析プログラム」が 公開されました。( 2020/10/08)

    【課題・解決手段】楽曲解析装置(1)は、楽曲データ(SD)の拍位置を検出、または外部機器で検出した拍位置を取得する拍位置取得部(21)と、楽曲データ(SD)を、一定の拍間隔で分割した均等拍位置を算出す... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ