図面 (/)

技術 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム

出願人 富士通株式会社
発明者 松本智佳子
出願日 2015年6月26日 (5年5ヶ月経過) 出願番号 2015-129112
公開日 2017年1月19日 (3年10ヶ月経過) 公開番号 2017-015774
状態 特許登録済
技術分野 音声の分析・合成 可聴帯域変換器の回路等
主要キーワード 検討範囲 更新フィルタ 空間方位 傾斜区間 無声状態 抑圧対象 抑圧信号 外部通信装置
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年1月19日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

雑音が大きく信号対ノイズ比が小さい音声信号が入力された場合でも雑音抑圧後の音声を聞き取りやすくする。

解決手段

雑音抑圧装置は、定常雑音推定部と、位相差算出部と、抑圧範囲設定部と、を備える。定常雑音推定部は、複数のマイクで収音した収音信号を時間領域から周波数領域に変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデル推定する。位相差算出部は、複数の入力信号の位相差を算出する。抑圧範囲設定部は、入力信号及び定常雑音モデルを用いて算出した入力信号の信号対ノイズ比に基づいて、入力信号を抑圧する位相差の範囲を設定する。

概要

背景

携帯電話テレビ会議システム放送ステム等においてマイクロホン等(以下、単に「マイク」ともいう)で収音した音声信号に含まれる雑音抑圧するための種々の技術が知られている。音声信号に含まれる雑音としては、例えば、マイクの近傍を通過する車両のエンジン音や、工場に設置されたファンモータ等の動作音定常雑音)がある。

雑音を抑圧する技術の一つとして最も良く知られているのは、複数のマイクを含むマイクアレイを用いて収音した複数の音声信号により抑圧する技術である。この種の雑音抑圧技術の一つとして、マイクロホンアレイによって音声空間方位情報を直接獲得し、方位情報を用いて適応フィルタ更新フィルタリングをより正確に制御するマイクロホンアレイノイズ低減制御方法が知られている(例えば、特許文献1を参照)。

また、マイクアレイを用いた雑音抑圧技術として、その他に、マイクアレイで収音した複数の音声信号の位相差に基づいて雑音を抑圧する技術が知られている(例えば、特許文献2を参照)。

また、関連する雑音抑圧技術の一つとして、フーリエ変換により得た周波数領域の音声データに対しカルマンフィルタを用いたフィルタ処理を行うことにより雑音を抑圧する技術が知られている(例えば、特許文献3を参照)
更に、関連する別の雑音抑圧技術として、時間‐周波数変換により得た振幅スペクトル変動方向に応じて振幅スペクトルの変動幅を制限し、これに基づいて雑音を推定して雑音抑圧を行う技術が知られている(例えば、特許文献4を参照)。

概要

雑音が大きく信号対ノイズ比が小さい音声信号が入力された場合でも雑音抑圧後の音声を聞き取りやすくする。雑音抑圧装置は、定常雑音推定部と、位相差算出部と、抑圧範囲設定部と、を備える。定常雑音推定部は、複数のマイクで収音した収音信号を時間領域から周波数領域に変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデルを推定する。位相差算出部は、複数の入力信号の位相差を算出する。抑圧範囲設定部は、入力信号及び定常雑音モデルを用いて算出した入力信号の信号対ノイズ比に基づいて、入力信号を抑圧する位相差の範囲を設定する。

目的

本発明は、雑音が大きく信号対ノイズ比が小さい音声信号が入力された場合でも雑音抑圧後の音声を聞き取りやすくすることを目的とする

効果

実績

技術文献被引用数
0件
牽制数
1件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

複数のマイクで収音した収音信号を時間領域から周波数領域に変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデル推定する定常雑音推定部と、前記複数の入力信号の位相差を算出する位相差算出部と、前記入力信号及び前記定常雑音モデルを用いて算出した前記入力信号の信号対ノイズ比に基づいて前記入力信号を抑圧する位相差の範囲を設定する抑圧範囲設定部と、を備える、ことを特徴とする雑音抑圧装置

請求項2

前記抑圧範囲設定部は、前記信号対ノイズ比が所定の閾値よりも小さい場合の前記入力信号を抑圧する位相差の範囲を、前記信号対ノイズ比が所定の閾値以上である場合の前記位相差の範囲よりも狭く設定する、ことを特徴とする請求項1に記載の雑音抑圧装置。

請求項3

前記入力信号の信号対ノイズ比が所定の閾値よりも小さく、かつ前記入力信号が音声を含む有声状態であるか否かを判定する判定部、を更に備え、前記抑圧範囲設定部は、前記入力信号の信号対ノイズ比が所定の閾値よりも小さくかつ前記入力信号が有声状態である場合に、前記入力信号を抑圧する位相差の範囲を、前記信号対ノイズ比が所定の閾値以上である場合の前記位相差の範囲よりも狭く設定する、ことを特徴とする請求項1に記載の雑音抑圧装置。

請求項4

前記判定部は、前記入力信号における全周波数帯域における信号対ノイズ比から第1の平均値を算出する第1の平均値算出部と、前記入力信号のうち所定の周波数よりも低く、かつ振幅が前記定常雑音モデルよりも大きい周波数帯域についての信号対ノイズ比から第2の平均値を算出する第2の平均値算出部と、を有し、前記第1の平均値が第1の閾値よりも小さく、かつ前記第2の平均値が第2の閾値よりも大きい場合に前記入力信号の信号対ノイズ比が所定の閾値よりも小さくかつ前記入力信号が有声状態であると判定する、ことを特徴とする請求項3に記載の雑音抑圧装置。

請求項5

前記抑圧範囲設定部は、前記入力信号を抑圧する位相差の範囲を設定する第1の設定部と、前記入力信号を抑圧する信号対ノイズ比の範囲を設定する第2の設定部と、を備える、ことを特徴とする請求項1に記載の雑音抑圧装置。

請求項6

前記雑音抑圧装置は、前記入力信号を抑圧する位相差の範囲、及び前記入力信号を抑圧する信号対ノイズ比の範囲のいずれかを選択して前記入力信号の各周波数帯域の信号成分に適用する抑圧係数を決定する抑圧係数決定部、を更に備える、ことを特徴とする請求項5に記載の雑音抑圧装置。

請求項7

前記抑圧範囲設定部は、前記入力信号のうち信号対ノイズ比が前記第2の設定部で設定した信号対ノイズ比の範囲外である周波数帯域の信号成分に対し、前記第1の設定部で設定した位相差の範囲に基づく抑圧を行うか否かを検討する範囲を設定する検討範囲設定部、を更に備える、ことを特徴とする請求項5に記載の雑音抑圧装置。

請求項8

コンピュータが、複数のマイクで収音した時間領域の収音信号をそれぞれ周波数領域の入力信号に変換し、変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデルを推定し、前記複数の入力信号の位相差を算出するとともに、前記入力信号及び前記定常雑音モデルを用いて前記入力信号の信号対ノイズ比を算出し、算出した前記信号対ノイズ比に基づいて前記入力信号を抑圧する位相差の範囲を設定する、処理を実行することを特徴とする雑音抑圧方法

請求項9

複数のマイクで収音した時間領域の収音信号をそれぞれ周波数領域に入力信号に変換し、変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデルを推定し、前記複数の入力信号の位相差を算出するとともに、前記入力信号及び前記定常雑音モデルを用いて前記入力信号の信号対ノイズ比を算出し、算出した前記信号対ノイズ比に基づいて前記入力信号を抑圧する位相差の範囲を設定する、処理をコンピュータに実行させるための雑音抑圧プログラム

技術分野

0001

本発明は、雑音抑圧装置雑音抑圧方法、及び雑音抑圧プログラムに関する。

背景技術

0002

携帯電話テレビ会議システム放送ステム等においてマイクロホン等(以下、単に「マイク」ともいう)で収音した音声信号に含まれる雑音抑圧するための種々の技術が知られている。音声信号に含まれる雑音としては、例えば、マイクの近傍を通過する車両のエンジン音や、工場に設置されたファンモータ等の動作音定常雑音)がある。

0003

雑音を抑圧する技術の一つとして最も良く知られているのは、複数のマイクを含むマイクアレイを用いて収音した複数の音声信号により抑圧する技術である。この種の雑音抑圧技術の一つとして、マイクロホンアレイによって音声空間方位情報を直接獲得し、方位情報を用いて適応フィルタ更新フィルタリングをより正確に制御するマイクロホンアレイノイズ低減制御方法が知られている(例えば、特許文献1を参照)。

0004

また、マイクアレイを用いた雑音抑圧技術として、その他に、マイクアレイで収音した複数の音声信号の位相差に基づいて雑音を抑圧する技術が知られている(例えば、特許文献2を参照)。

0005

また、関連する雑音抑圧技術の一つとして、フーリエ変換により得た周波数領域の音声データに対しカルマンフィルタを用いたフィルタ処理を行うことにより雑音を抑圧する技術が知られている(例えば、特許文献3を参照)
更に、関連する別の雑音抑圧技術として、時間‐周波数変換により得た振幅スペクトル変動方向に応じて振幅スペクトルの変動幅を制限し、これに基づいて雑音を推定して雑音抑圧を行う技術が知られている(例えば、特許文献4を参照)。

先行技術

0006

特表2013−511750号公報
特開2011−186384号公報
特開2013−120358号公報
特開2008−309955号公報

発明が解決しようとする課題

0007

しかしながら、前述の雑音抑圧技術では、音声信号に含まれる雑音が大きく信号対ノイズ比(Signal Noise Ratio、以下「SNR」ともいう)が小さい場合に、音声が抑圧されてしまい、音声を聞き取りづらくなることがある。

0008

一つの側面において、本発明は、雑音が大きく信号対ノイズ比が小さい音声信号が入力された場合でも雑音抑圧後の音声を聞き取りやすくすることを目的とする。

課題を解決するための手段

0009

1つの態様の雑音抑圧装置は、定常雑音推定部と、位相差算出部と、抑圧範囲設定部と、を備える。前記定常雑音推定部は、複数のマイクで収音した収音信号を時間領域から周波数領域に変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデルを推定する。前記位相差算出部は、複数の入力信号の位相差を算出する。前記抑圧範囲設定部は、入力信号及び定常雑音モデルを用いて算出した入力信号の信号対ノイズ比に基づいて、入力信号を抑圧する位相差の範囲を設定する。

発明の効果

0010

上述の態様によれば、雑音が大きく信号対ノイズ比が小さい音声信号が入力された場合でも雑音抑圧後の音声を聞き取りやすくすることができる。

図面の簡単な説明

0011

雑音抑圧処理の参考例を説明する波形図である。
入力信号に含まれる雑音が大きい場合の周波数スペクトルの例を示す図である。
SNRと位相差との関係を説明する図である。
第1の実施形態に係る雑音抑圧装置の機能的構成を示すブロック図である。
SNRと抑圧する位相差範囲との関係を示す図である。
第1の抑圧位相差範囲テーブルの例を示す図である。
第2の抑圧位相差範囲テーブルの例を示す図である。
雑音抑圧処理の内容を示すフローチャートである。
第1の実施形態に係る抑圧範囲設定処理の内容を示すフローチャートである。
第1の実施形態に係る抑圧係数決定処理の内容を示すフローチャートである。
第1の実施形態に係る雑音抑圧処理と参考例との処理結果を比較する波形図である。
第2の実施形態に係る雑音抑圧装置における状態判定部の構成を示すブロック図である。
低SNR有声状態の波形の特徴を示す波形図である。
第2の実施形態に係る抑圧範囲設定処理の内容を示すフローチャートである。
第3の実施形態に係る雑音抑圧装置における抑圧範囲設定部及び抑圧係数決定部の構成を示すブロック図である。
定常雑音についての抑圧を行う際に抑圧するSNR範囲の設定例を示す図である。
第3の実施形態に係る抑圧範囲設定処理の内容を示すフローチャートである。
第3の実施形態に係る抑圧係数決定処理の内容を示すフローチャートである。
定常雑音についての抑圧を行う際に抑圧するSNR範囲の別の設定例を示す図である。
第4の実施形態に係る雑音抑圧装置における抑圧範囲設定部の構成を示すブロック図である。
位相差による抑圧を検討する範囲の設定例を示す図である。
第4の実施形態に係る抑圧範囲設定処理の内容を示すフローチャートである。
第4の実施形態に係る抑圧係数決定処理の内容を示すフローチャートである。
コンピュータハードウェア構成図である。

実施例

0012

[参考例]
図1Aは、雑音抑圧処理の参考例を説明する波形図である。図1Bは、入力信号に含まれる雑音が大きい場合の周波数スペクトルの例を示す図である。図1Cは、SNRと位相差との関係を説明する図である。

0013

図1Aの(a)には、マイクアレイで収音した複数の収音信号のうちの1つの収音信号(入力信号)の波形を示している。この図1Aの(a)に示した波形における時刻T1以降の区間ΔT1は、音声に比べて雑音が大きくなっており、音声が雑音に埋もれている。ここで、入力信号における音声は、話者が発した声等、収音の主目的となる有意な音を意味する。また、雑音は、マイクの近くを通過する車両のエンジン音、工場に設置されたファンやモータ等の動作音等、収音信号において不要な成分となる音を意味する。

0014

図1Aの(a)に示したような入力信号に対し複数の収音信号の位相差に基づいて雑音抑圧処理を行うと、例えば、図1Aの(b)に示したような波形の信号が得られる。この図1Aの(b)に示した波形の信号では、雑音が大きい区間ΔT1において音声が雑音として誤って抑圧されている。そのため、図1Aの(b)に示した波形の信号を再生すると、聞き取りづらい音声になってしまう。このように音声が誤って抑圧される事態は、例えば、雑音が大きくSNRが低く、入力信号が定常雑音を下回る周波数帯域がある場合に生じやすい。

0015

図1Aの(a)に示した入力信号における雑音が大きい区間ΔT1に含まれる区間ΔT2について周波数スペクトルを求めると、例えば、図1B点線で示したような分布になる。また、区間ΔT2における定常雑音を図1Bに重ねて示すと、太い実線で示したような分布になる。

0016

図1Bに示した例では、例えば、入力信号における500Hz前後の成分の振幅、すなわち人の声の平均的な周波数帯域の振幅が定常雑音を下回っている。そのため、区間ΔT2の入力信号に対する雑音抑圧処理では、音声が雑音として抑圧されてしまい、音声が聞き取りづらくなる。

0017

また、2つのマイクから等距離にある位置から発声した場合、SNRが高くなる環境下では、図1Cの(a)に示したように、各周波数bin(周波数帯域)の位相差が0から大きくずれることはなく、ほぼ全ての成分の位相差が±1の範囲内に収まる。これに対し、SNRが低くなる環境下では、図1Cの(b)に示したように、特に周波数が高い帯域において雑音の影響による位相差の乱れが大きくなる。このため、従来の雑音抑圧方法では、例えば、図1Cに示したように、位相差0を中心とする位相差範囲Nを設定し、位相差範囲Nから外れた周波数帯域の信号成分を抑圧することで雑音を抑圧している。

0018

ところが、SNRにより各周波数binの位相差が変わるにも関わらず、抑圧しない位相差範囲Nが固定されている場合、図1Cの(b)に示したようなSNRが低くなる環境下では、多くの信号成分が抑圧されることとなる。そのため、位相差の乱れの大きい周波数帯域の音声が雑音として抑圧されてしまい、音声が聞き取りづらくなることがある。すなわち、位相差に基づいて雑音抑圧処理を行うと、車両が近くを通過する場合や、工場のファンやモータ等の定常的な雑音が大きく、収音信号(入力信号)のSNRが小さいときに、音声が抑圧されてしまい、音声が聞き取りづらくなることがある。

0019

[第1の実施形態]
図2は、第1の実施形態に係る雑音抑圧装置の機能的構成を示すブロック図である。

0020

図2に示すように、本実施形態の雑音抑圧装置1は、信号受付部101と、変換部102と、定常雑音推定部103と、位相差算出部104と、状態判定部105と、抑圧範囲設定部106と、抑圧係数決定部107と、を備える。また、雑音抑圧装置1は、抑圧信号生成部108と、逆変換部109と、記憶部110と、を更に備える。

0021

信号受付部101は、第1のマイク2Aで収音した第1の収音信号、及び第2のマイク2Bで収音した第2の収音信号の入力を受け付ける。

0022

変換部102は、第1の収音信号及び第2の収音信号を時間領域の信号から周波数領域の信号に変換する。以下、変換部102で周波数領域に変換された第1の収音信号及び第2の収音信号を、それぞれ、第1の音声信号及び第2の音声信号という。

0023

定常雑音推定部103は、第1の音声信号及び第2の音声信号についての定常雑音モデルを推定する。

0024

位相差算出部104は、第1の音声信号及び第2の音声信号に基づいて各周波数帯域の位相差を算出する。

0025

状態判定部105は、第1の音声信号及び定常雑音モデルに基づいて、第1の音声信号の状態を判定する。本実施形態における状態判定部105は、第1の音声信号が低SNR状態であるか否かを判定する。状態判定部105は、第1の音声信号及び定常雑音モデルに基づいてSNRを算出し、算出したSNRが所定の閾値以下の場合に低SNRであると判定する。

0026

抑圧範囲設定部106は、状態判定部105の判定結果(低SNRであるか否か)に応じて、各周波数帯域に対し抑圧する位相差範囲を設定する。本実施形態では、抑圧する位相差範囲が異なる2つの抑圧位相差範囲テーブルを予め用意しておき、SNRに応じてどちらの抑圧範囲テーブルを用いるかを決定する。

0027

抑圧係数決定部107は、位相差算出部104で算出した位相差と、抑圧範囲設定部106で設定した抑圧範囲(抑圧する位相差範囲)とに基づいて、第1の音声信号の各周波数帯域に適用する抑圧係数を決定する。

0028

抑圧信号生成部108は、第1の音声信号の各周波数帯域に対し抑圧係数決定部107で決定した抑圧係数を乗じて抑圧信号を生成する。

0029

逆変換部109は、第1の音声信号から生成した抑圧信号を周波数領域の信号から時間領域の信号に変換して出力音声信号を生成する。

0030

記憶部110は、第1の抑圧位相差範囲テーブル及び第2の抑圧位相差範囲テーブル等を記憶する。

0031

図3は、SNRと抑圧する位相差範囲との関係を示す図である。図4Aは、第1の抑圧位相差範囲テーブルの例を示す図である。図4Bは、第2の抑圧位相差範囲テーブルの例を示す図である。

0032

本実施形態の雑音抑圧装置1では、例えば、第1の音声信号及び第2の音声信号を所定の周波数帯域毎(例えば、31.25Hz毎)に分割し、各周波数帯域の位相差に基づいて、雑音を抑圧するための抑圧係数βを決定する。

0033

抑圧係数βは、位相差が所定の範囲内である場合には「1」とし、範囲外である場合には1より小さい所定の値とする。また、抑圧係数βを1とする位相差の範囲は、周波数帯域が大きくなるにつれて広くなるようにする。更に、本実施形態では、上記のように、SNRに応じて抑圧する位相差の範囲を変更する。

0034

SNRが所定の閾値以上である場合(高SNRの場合)、例えば、図3の(a)に示すように、位相差が範囲N1であるときには抑圧係数βを1とし、位相差が範囲SA11,SA12であるときには抑圧係数βを1より小さい所定の値とする。すなわち、SNRが所定の閾値以上である場合、周波数帯域fの信号成分については、位相差dP(f)がdP1(f)≦dP(f)<dP2(f)、又はdP3(f)<dP(f)≦dP4(f)の場合に抑圧する。

0035

一方、SNRが所定の閾値よりも小さい場合(低SNRの場合)、例えば、図3の(b)に示すように、抑圧係数βを1にする位相差範囲N2を、高SNRの場合の位相差範囲N1よりも広くする。このとき、抑圧係数βを1より小さい所定の値とする位相差範囲SA21,SA22は、高SNRの場合の抑圧する位相差範囲SA11,SA12よりも狭くなる。すなわち、低SNRの場合、周波数帯域fの信号成分については、位相差dP(f)がdP1(f)≦dP(f)<dP5(f)、又はdP6(f)<dP(f)≦dP4(f)の場合に抑圧する(ただし、dP5(f)<dP2(f)、dP3(f)<dP6(f))。

0036

本実施形態では、高SNRである場合及び低SNRである場合のそれぞれについて、抑圧する位相差dP(f)の範囲を周波数帯域f毎に求め、図4A及び図4Bに示すような抑圧位相差範囲テーブルを作成しておく。なお、図4Aに示したテーブルは、図3の(a)に示した抑圧する位相差範囲に基づいて作成される第1の抑圧位相差範囲テーブルの一例である。また、図4Bに示したテーブルは、図3の(b)に示した抑圧する位相差範囲に基づいて作成される第2の抑圧位相差範囲テーブルの一例である。

0037

低SNRのときの抑圧する位相差範囲SA21,SA22は、例えば、高SNRのときの抑圧する位相差範囲SA11,SA12の1/2、又は1/3程度の値に設定する。

0038

図5は、雑音抑圧処理の内容を示すフローチャートである。
第1のマイク2A及び第2のマイク2Bによる収音を開始すると、本実施形態の雑音抑圧装置1は、図5に示したような処理を行う。

0039

雑音抑圧装置1は、まず、第1の収音信号及び第2の収音信号の受付を開始する(ステップS1)。ステップS1は、信号受付部101が行う。信号受付部101は、第1のマイク2A及び第2のマイク2Bから入力される収音信号を変換部102に渡す。なお、信号受付部101は、第1のマイク2A及び第2のマイク2Bによる収音が終了するまでステップS1の処理を続ける。

0040

次に、変換部102が、1フレーム分の収音信号を時間領域から周波数領域に変換する(ステップS2)。変換部102は、例えば、高速フーリエ変換FFT)により時間領域の信号である収音信号を、周波数領域の信号である音声信号(周波数スペクトル)に変換する。変換部102は、各フレームを周波数領域に変換すると、変換後の第1の音声信号及び第2の音声信号を定常雑音推定部103及び位相差算出部104に渡す。更に、変換部102は、例えば、変換後の第1の音声信号を抑圧信号生成部108に渡す。

0041

次に、定常雑音推定部103が、受け取った第1の音声信号及び第2の音声信号に基づいて、定常雑音モデルを推定する(ステップS3)。定常雑音推定部103は、既知推定方法のいずれかにより定常雑音モデルを推定する。更に、定常雑音推定部103は、第1の音声信号及び推定した定常雑音モデルを状態判定部105に渡す。

0042

また、位相差算出部104は、第1の音声信号及び第2の音声信号を受け取ると、周波数帯域毎に第1の音声信号と第2の音声信号との位相差を算出する(ステップS4)。位相差算出部104は、既知の算出方法のいずれかにより位相差を算出する。更に、位相差算出部104は、算出した位相差を抑圧係数決定部107に渡す。

0043

また、状態判定部105は、第1の音声信号及び推定した定常雑音モデルを受け取ると、抑圧範囲設定部106と協働して抑圧範囲設定処理を行う(ステップS5)。状態判定部105は、第1の音声信号及び推定した定常雑音モデルに基づいて低SNR状態であるか否かを判定し、判定結果を抑圧範囲設定部106に通知する。抑圧範囲設定部106は、通知された判定結果に基づいて、第1の抑圧位相差範囲テーブル及び第2の抑圧位相差範囲テーブルのいずれを用いるかを設定する。抑圧範囲設定部106は、設定した第1の抑圧位相差範囲テーブル又は第2の抑圧位相差範囲テーブルを記憶部110から読み出して抑圧係数決定部107に渡す。

0044

次に、抑圧係数決定部107が、第1の音声信号の各周波数帯域fに適用する抑圧係数β(f)を決定する抑圧係数決定処理を行う(ステップS6)。抑圧係数決定部107は、抑圧範囲設定部106が設定した第1の抑圧位相差範囲テーブル又は第2の抑圧位相差範囲テーブルに基づいて、位相差算出部104が算出した各周波数帯域fの位相差に応じた抑圧係数β(f)を決定する。更に、抑圧係数決定部107は、決定した各周波数帯域fの抑圧係数β(f)を、抑圧信号生成部108に渡す。

0045

抑圧信号生成部108は、各周波数帯域fについての抑圧係数β(f)を受け取ると、変換部102から受け取った第1の音声信号の各周波数帯域fの信号成分に抑圧係数β(f)を適用した抑圧信号を生成する(ステップS7)。抑圧信号生成部108は、各周波数帯域fの振幅に抑圧係数β(f)を乗じて抑圧信号を生成する。更に、抑圧信号生成部108は、生成した抑圧信号を逆変換部109に渡す。

0046

逆変換部109は、受け取った抑圧信号を周波数領域から時間領域に変換する(ステップS8)。逆変換部109は、例えば、逆高速フーリエ変換IFFT)により、周波数領域の信号である抑圧信号を時間領域の信号である出力音声信号に変換する。更に、逆変換部109は、変換後の出力音声信号を所定の出力先(例えば、スピーカメモリ通話相手端末等)に出力する(ステップS9)。

0047

また、雑音抑圧装置1は、出力音声信号を出力した後、未処理のフレームがあるか否かをチェックする(ステップS10)。未処理のフレームがある場合(ステップS10;Yes)、雑音抑圧装置1は、第1のマイク2A及び第2のマイク2Bによる収音が終了し未処理のフレームがなくなるまで、入力された収音信号の各フレームに対しステップS2〜S9の処理を順次行う。そして、未処理のフレームがなくなると(ステップS10;No)、雑音抑圧装置1は、雑音抑圧処理を終了する。

0048

図6は、第1の実施形態に係る抑圧範囲設定処理の内容を示すフローチャートである。
状態判定部105が抑圧範囲設定部106と協働して行う抑圧範囲設定処理では、図6に示すように、まず、全帯域SNR平均値M1を算出する(ステップS511)。ステップS511は、状態判定部105が行う。状態判定部105は、第1の音声信号及び定常雑音モデルを用い、下記式(1)により全帯域SNR平均値M1を算出する。

0049

0050

次に、状態判定部105は、算出した全帯域SNR平均値M1と閾値TH1とを比較し、M1<TH1であるかをチェックする(ステップS512)。

0051

音声信号に含まれる音が定常雑音のみの場合、全帯域SNR平均値は1.0に近い値になる。そして、音声信号に人の話し声等の有意な音声が含まれる場合の全帯域SNR平均値は、定常雑音のみの場合の全帯域SNR平均値よりも大きくなる。更に、音声信号に含まれる定常雑音の割合が小さくなるにつれて全帯域SNR平均値は大きくなる。そのため、音声信号が低SNRであるか否かの判定に用いる閾値TH1は、例えば2.0程度の値に設定する。

0052

全帯域SNR平均値M1が閾値TH1以上の場合(ステップS512;No)、状態判定部105は、第1の音声信号が高SNRである(低SNRではない)と判定し、判定結果を抑圧範囲決定部106に通知する。この場合、抑圧範囲決定部106は、通知された判定結果に基づいて、抑圧する位相差の範囲を第1の位相差範囲に決定する(ステップS513)。なお、第1の位相差範囲は、第1の抑圧位相差範囲テーブルで定義される抑圧する位相差範囲である。

0053

一方、全帯域SNR平均値M1が閾値TH1よりも小さい場合(ステップS512;Yes)、状態判定部105は、第1の音声信号が低SNRであると判定し、判定結果を抑圧範囲決定部106に通知する。この場合、抑圧範囲決定部106は、通知された判定結果に基づいて、抑圧する位相差の範囲を第2の位相差範囲に設定する(ステップS514)。なお、第2の位相差範囲は、第2の抑圧位相差範囲テーブルで定義される抑圧する位相差範囲である。

0054

また、抑圧範囲設定部106は、ステップS513又はS514において抑圧する位相差範囲を設定すると、設定した位相差範囲と対応する抑圧位相差範囲テーブルを記憶部110から読み出して抑圧係数決定部107に渡す。これにより、1フレームに対する抑圧範囲設定処理が終了する(リターン)。

0055

図7は、第1の実施形態に係る抑圧係数決定処理の内容を示すフローチャートである。
抑圧係数決定部107が行う抑圧係数決定処理では、図7に示すように、まず、周波数帯域fの位相差dP(f)と抑圧する位相差範囲とを照合し(ステップS611)、位相差dP(f)が抑圧する範囲内であるか否かをチェックする(ステップS612)。

0056

位相差dP(f)が抑圧する範囲内である場合(ステップS612;Yes)、抑圧係数決定部107は、位相差dP(f)に応じた抑圧係数β(f)を算出する(ステップS613)。位相差dP(f)に応じた抑圧係数β(f)は、既知の方法で算出する。例えば、抑圧する位相差範囲内である場合の抑圧係数β(f)は、位相差によらず1よりも小さい固定値(例えば、0.5等)にする。また、例えば、抑圧する位相差範囲内である場合の抑圧係数β(f)は、位相差dP(f)の絶対値と負の比例関係になるようにしてもよい。

0057

一方、位相差dP(f)が抑圧する範囲内ではない場合(ステップS612;No)、抑圧係数決定部107は、位相差dP(f)によらず抑圧係数β(f)を「1」にする(ステップS614)。

0058

その後、抑圧係数決定部107は、全ての周波数帯域fについて抑圧係数β(f)を決定する処理をしたか否かをチェックする(ステップS615)。未処理の周波数帯域fがある場合(ステップS615;No)、抑圧係数決定部107は、未処理の周波数帯域fについてステップS611〜S614の処理を繰り返す。そして、全ての周波数帯域fについて処理を行った場合(ステップS615;Yes)、抑圧係数決定部107は、決定した各周波数帯域fの抑圧係数β(f)を抑圧信号生成部108に渡して、1フレーム分の抑圧係数算出処理を終了する(リターン)。

0059

このように、本実施形態に係る雑音抑圧処理では、入力された音声信号のSNRに応じて抑圧する位相差範囲を変更する。具体的には、SNRが低いときには、SNRが高いときよりも抑圧しない位相差範囲を広げ、抑圧する位相差範囲を狭くする。このように入力された音声信号を抑圧しない位相差範囲を広げることにより、SNRの低い区間における有意な音声の抑圧量が低減する。そのため、本実施形態に係る雑音抑圧装置1で抑圧した出力音声信号は、SNRが低い区間における音声が聞き取りやすくなる。

0060

図8は、第1の実施形態に係る雑音抑圧処理と参考例との処理結果を比較する波形図である。

0061

なお、図8の(a)は比較に使用した入力信号における雑音の波形図であり、図8の(b)は(a)の雑音を含む入力信号の波形図である。また、図8の(b)の波形図における白色の矢印は、それぞれ、付近に意味のある音声があることを示している。更に、図8に例示した波形図において、時刻T0〜T1はSNRの高い区間、時刻T1〜T2はSNRの低い区間である。

0062

図8の(b)に示したような波形の入力信号に対し位相差に基づく雑音抑圧処理を行った場合、例えば、図8の(c)に示したような結果が得られる。この図8の(c)に示した抑圧結果では、定常雑音の抑圧量が8.3dBとなり、音声の抑圧量が7.8dBとなった。一方、図8の(b)に示したような波形の入力信号に対し本実施形態で説明した方法により雑音を抑圧した場合、例えば、図8の(d)に示したような結果が得られる。この図8の(d)に示した抑圧結果では、定常雑音の抑圧量が8.2dBとなり、音声の抑圧量が2.2dBとなった。

0063

更に、図8の(b)〜(d)のSNRの低い区間における区間ΔT3を見ると、(c)の波形図では音声が雑音に埋もれているのに対し、(d)の波形図では音声と雑音とが明瞭に区別できる。このように、本実施形態に係る雑音抑圧処理によれば、雑音の抑圧量の低減を防ぎつつ、音声の抑圧量を低減することができる。

0064

以上説明したように、本実施形態に係る雑音抑圧処理では、雑音が多くSNRが低い場合に、抑圧しない位相差範囲を広げて抑圧する位相差範囲を狭くすることにより、音声の抑圧量を低減する。そのため、本実施形態によれば、SNRが低い場合の音声の抑圧量を低減することができ、出力音声における音声が聞き取りやすくなる。

0065

なお、低SNR時の抑圧する位相差範囲S21,S22は、上記のように第2の抑圧位相差範囲テーブルとして記憶部110に記憶させる代わりに、所定の関数を用いて算出するようにしてもよい。また、図3に示した低SNR時の抑圧する位相差範囲S21,S22は、上記のような固定値に限らず、可変値であってもよい。例えば、低SNR時の抑圧する位相差範囲S21は、低SNRであると判定した場合に都度SA21=(SA11/全帯域SNR平均値)を算出して設定してもよい。

0066

また、図3に示した高SNR時の抑圧する位相差範囲S11,S12、及び低SNR時の抑圧する位相差範囲S21,S22は、位相差範囲の一例である。例えば、抑圧する位相差範囲は、図3に示したような位相差0を対称軸とした線対称に限らず、非対称でもよい。

0067

[第2の実施形態]
第2の実施形態では、抑圧対象の音声信号が低SNRかつ有声状態(以下「低SNR有声状態」ともいう)であるか否かに応じて抑圧する位相差範囲を設定する。

0068

図9は、第2の実施形態に係る雑音抑圧装置における状態判定部の構成を示すブロック図である。

0069

本実施形態に係る雑音抑圧装置の機能的構成は、状態判定部105及び抑圧範囲設定部106を除き、第1の実施形態に係る雑音抑圧装置1と同じである。本実施形態に係る雑音抑圧装置1の状態判定部105は、図9に示すように、全帯域SNR平均値算出部105Aと、低域SNR平均値算出部105Bと、低SNR有声状態判定部105Cと、を備える。

0070

全帯域SNR平均値算出部105Aは、第1の実施形態で説明した全帯域SNR平均値M1を算出する。

0071

低域SNR平均値算出部105Bは、予め定めた周波数よりも低い周波数帯域のうち定常雑音モデルよりも振幅の大きい周波数帯域のみによるSNRの平均値(低域SNR平均値)M2を算出する。

0072

低SNR有声状態判定部105Cは、全帯域SNR平均値M1及び低域SNR平均値M2に基づいて、抑圧対象の音声信号が低SNR有声状態であるか否かを判定する。低SNR有声状態判定部は、全帯域SNR平均値M1が第1の閾値TH1よりも小さく、かつ低域SNR平均値M2が第2の閾値TH2よりも大きい場合、低SNR有声状態であると判定する。低SNR有声状態判定部105Cは、判定結果を抑圧範囲設定部106に渡す。

0073

抑圧範囲設定部106は、判定結果(低SNR有声状態であるか否か)に応じて、各周波数帯域について抑圧する位相差範囲を設定する。本実施形態では、第1の実施形態と同様に抑圧する位相差範囲の異なる2つの抑圧位相差範囲テーブルを予め用意しておき、低SNR有声状態であるか否かに基づいてどちらの抑圧位相差範囲テーブルを用いるかを決定する。

0074

低SNR有声状態であるか否かは、上記のように、全帯域SNR平均値M1及び低域のSNR平均値M2に基づいて判定する。全帯域SNR平均値M1は低SNRであるか否かの判定に用いられ、低域SNR平均値M2は有声状態であるか否かの判定に用いられる。低域SNR平均値M2は、例えば、500Hz以下の周波数帯域のうち定常雑音モデルよりも振幅の大きい周波数帯域のみによりSNRの平均値を算出する。そのため、低域SNR平均値M2は全帯域SNR平均値M1よりも大きくなる。例えば、低SNR有声状態である区間における全帯域SNR平均値M1と低域SNR平均値M2との関係は、図10に示したような関係になる。図10は、低SNR有声状態の波形の特徴を示す波形図である。

0075

本実施形態の雑音抑圧装置1は、第1の実施形態と同様、第1のマイク2A及び第2のマイク2Bによる収音を開始すると、図5に示したような雑音抑圧処理を行う。この雑音抑圧処理において、状態判定部105及び抑圧範囲設定部106が協働して行う抑圧範囲設定処理(ステップS5)を除く他の処理は、第1の実施形態で説明した通りである。

0076

図11は、第2の実施形態に係る抑圧範囲設定処理の内容を示すフローチャートである。

0077

本実施形態に係る雑音抑圧処理における抑圧範囲設定処理では、図11に示すように、まず、全帯域SNR平均値M1を算出する(ステップS521)。ステップS521は、状態判定部105の全帯域SNR平均値算出部105Aが行う。全帯域SNR平均値算出部105Aは、式(1)により全帯域SNR平均値M1を算出し、算出した全帯域SNR平均値M1を低SNR有声状態判定部105Cに渡す。

0078

また、状態判定部105は、低域SNR平均値M2を算出する(ステップS522)。ステップS522は、低域SNR平均値算出部105Bが行う。低域SNR平均値算出部105Bは、低域(例えば500Hz以下)かつ定常雑音モデルよりも振幅の大きい周波数帯域のみによる低域SNR平均値M2を算出し、算出した低域SNR平均値M2を低SNR有声状態判定部105Cに渡す。

0079

低SNR有声状態判定部105Cは、全帯域SNR平均値M1及び低域SNR平均値M2を受け取ると、M1<TH1、かつM2>TH2であるか否かをチェックする(ステップS523)。全帯域SNR平均値M1と比較する第1の閾値TH1は、上述のように、例えば、2.0程度の値とする。また、低域SNR平均値M2は全帯域SNR平均値M1よりも大きな値になるので、低域SNR平均値M2と比較する第2の閾値TH2は、例えば、3.0程度の値とする。

0080

M1≧TH1の場合、音声信号は低SNRではない。また、M2≦TH2の場合、音声信号は有声状態ではない。よって、M1≧TH1及びM2≦TH2のいずれか或いは両方を満たす場合(ステップS523;No)、低SNR有声状態判定部105Cは、音声信号が低SNR有声状態ではないと判定し、判定結果を抑圧範囲設定部106に通知する。この場合、抑圧範囲設定部106は、通知された判定結果に基づいて、抑圧する位相差の範囲を第1の位相差範囲に設定する(ステップS524)。

0081

一方、M1<TH1、かつM2>TH2の場合(ステップS523;Yes)、低SNR有声状態判定部105Cは、音声信号が低SNR有声状態であると判定し、判定結果を抑圧範囲設定部106に通知する。この場合、抑圧範囲設定部106は、通知された判定結果に基づいて、抑圧する位相差の範囲を第2の位相差範囲に設定する(ステップS525)。

0082

また、抑圧範囲設定部106は、ステップS524又はS525において抑圧する位相差範囲を設定すると、設定した位相差範囲と対応する抑圧位相差範囲テーブルを記憶部110から読み出して抑圧係数決定部107に渡す。これにより、1フレームに対する抑圧範囲設定処理が終了する(リターン)。

0083

このように、第2の実施形態においては、抑圧対象の音声信号が低SNRであり、かつ有声状態である場合にのみ、抑圧しない位相差範囲(抑圧係数βを1とする範囲)を広くして抑圧する位相差範囲を狭くする。すなわち、抑圧対象の音声信号が低SNRであっても無声状態であれば、抑圧係数決定部107は、高SNRのときと同じ第1の抑圧位相差範囲テーブルに基づいて抑圧係数βを決定する。そのため、低SNRかつ無声状態のときには、雑音の抑圧量を多くすることができ、大きな雑音による不快感等を軽減できる。

0084

一方、抑圧対象の音声信号が低SNRであり、かつ有声状態であれば、抑圧係数決定部107は、抑圧しない位相差範囲を広くした第2の抑圧位相差範囲テーブルに基づいて抑圧係数βを決定する。そのため、低SNR、かつ有声状態のときには、音声の抑圧量を低減でき、低SNR区間における音声が聞き取りやすくなる。

0085

[第3の実施形態]
第3の実施形態では、第1の音声信号と第2の音声信号との位相差に基づいて抑圧係数βを算出するとともに、定常雑音についての抑圧係数αを算出し、抑圧係数β,αに基づいて周波数帯域fの成分に適用する抑圧係数γを決定する。

0086

図12は、第3の実施形態に係る雑音抑圧装置における抑圧範囲設定部及び抑圧係数決定部の構成を示すブロック図である。

0087

本実施形態に係る雑音抑圧装置の機能的構成は、抑圧範囲設定部106及び抑圧係数決定部107を除き、第2の実施形態に係る雑音抑圧装置1と同じである。すなわち、図12に示した雑音抑圧装置1における状態判定部105は、抑圧対象の音声信号が低SNR有声状態であるか否かを判定する。

0088

抑圧範囲設定部106は、抑圧位相差範囲設定部106Aと、抑圧SNR範囲設定部106Bと、を有する。

0089

抑圧位相差範囲設定部106Aは、状態判定部105の判定結果に基づいて、位相差による抑圧を行う場合の抑圧する位相差範囲を設定する。低SNR有声状態ではないという判定結果の場合、抑圧位相差範囲設定部106Aは、第1の抑圧位相差範囲テーブルの位相差範囲を、抑圧する位相差範囲に設定する。低SNR有声状態であるという判定結果の場合、抑圧位相差範囲設定部106Aは、第2の抑圧位相差範囲テーブルの位相差範囲を、抑圧する位相差範囲に設定する。

0090

抑圧SNR範囲設定部106Bは、状態判定部105の判定結果に基づいて、定常雑音についての抑圧を行う場合の抑圧するSNR範囲を設定する。低SNR有声状態ではないという判定結果の場合、抑圧SNR範囲設定部106Bは、第1の抑圧SNR範囲テーブルのSNR範囲を、抑圧するSNR範囲に設定する。低SNR有声状態であるという判定結果の場合、抑圧SNR範囲設定部106Bは、第2の抑圧SNR範囲テーブルのSNR範囲を、抑圧するSNR範囲に設定する。なお、第1及び第2の抑圧SNR範囲テーブルは、それぞれ、SNRと抑圧係数αとの対応関係を表すテーブルである。第2の抑圧SNR範囲テーブルは、第1の抑圧SNR範囲テーブルと比べて、抑圧しないSNR範囲(抑圧係数αを「1」とするSNR範囲)を広くすることで抑圧するSNR範囲を狭くしている。第1及び第2の抑圧SNR範囲テーブルは、記憶部110に格納しておく。

0091

抑圧係数決定部107は、第1の抑圧係数算出部107Aと、第2の抑圧係数算出部107Bと、抑圧係数確定部107Cと、を備える。

0092

第1の抑圧係数算出部107Aは、抑圧位相差範囲設定部106Aが設定した第1又は第2の抑圧位相差範囲テーブルに基づいて、各周波数帯域fの位相差dP(f)に応じた抑圧係数β(f)を算出する。

0093

第2の抑圧係数算出部107Bは、抑圧SNR範囲設定部106Bが設定した第1又は第2の抑圧SNR範囲テーブルに基づいて、各周波数帯域fのSNR(f)に応じた抑圧係数α(f)を算出する。

0094

抑圧係数確定部107Cは、第1の抑圧係数算出部107Aで算出した抑圧係数β(f)及び第2の抑圧係数算出部107Bで算出した抑圧係数α(f)に基づいて、周波数帯域fの信号成分(振幅)に適用する抑圧係数γ(f)を確定する。適用する抑圧係数γ(f)は、例えば、抑圧係数α(f)及びβ(f)の積にする。また、抑圧係数γ(f)は、例えば、抑圧係数α(f)及びβ(f)のうち値の小さいほうの係数にする。

0095

図13は、定常雑音についての抑圧を行う際に抑圧するSNR範囲の設定例を示す図である。

0096

定常雑音についての抑圧を行う際の抑圧係数αは、例えば、図13に実線で示した折れ線のように、SNRが第1の値R1以下の場合の抑圧係数αを最小値Aとし、第2の値R2(>R1)以上の場合の抑圧係数αを「1」としている。また、SNRが第1の値R1から第2の値R2までの区間における抑圧係数αは、SNRの値に比例して抑圧係数αが変化する。

0097

図13に実線で示した折れ線に基づいて抑圧係数αを決定する場合、SNR(f)が第2の値R2よりも小さい周波数帯域fに対する抑圧係数α(f)は、1より小さい値になる。そのため、音声に比べて定常雑音が大きく低SNRである場合、定常雑音とともに音声が抑圧され、音声が聞き取りづらくなることがある。よって、本実施形態では、図13に実線で示した折れ線を高SNR時の抑圧係数αの決定に用い、図13に点線で示した折れ線を低SNR時の抑圧係数αの決定に用いる。点線で示した折れ線は、実線で示した折れ線をSNRの負の方向に平行移動させたものである。点線で示した折れ線に従って抑圧係数αを決定する場合、SNRが第3の値R3(<R1)以下の場合の抑圧係数αが最小値Aとなり、第4の値R4(R1<R4<R2)以上の場合の抑圧係数αが「1」となる。すなわち、低SNR有声状態のときに抑圧するSNRの範囲を実線の折れ線から点線の折れ線に変更することにより、抑圧しないSNR範囲が広くなる分、抑圧するSNR範囲が狭くなる。よって、状態判定部105において低SNR有声状態と判定され場合に、図13の点線で示した折れ線に従って各周波数帯域fについての抑圧係数αを決定することで、音声の抑圧量が低減され、出力音声における音声が聞き取りやすくなる。

0098

図13に示した高SNR時の抑圧係数αの決定に用いる実線の折れ線(関数)は、SNRと抑圧係数αとの対応関係をテーブル化し、第1の抑圧SNR範囲テーブルとして記憶部110に記憶させておく。同様に、図13に示した低SNR時の抑圧係数αの決定に用いる点線の折れ線(関数)は、SNRと抑圧係数αとの対応関係をテーブル化し、第2の抑圧SNR範囲テーブルとして記憶部110に記憶させておく。

0099

本実施形態の雑音抑圧装置1は、第1の実施形態と同様、第1のマイク2A及び第2のマイク2Bによる収音を開始すると、図5に示したような雑音抑圧処理を行う。この雑音抑圧処理において、状態判定部105及び抑圧範囲設定部106が協働して行う抑圧範囲設定処理(ステップS5)、及び抑圧係数決定部107が行う抑圧係数決定処理(ステップS6)を除く他の処理は、第1の実施形態で説明した通りである。

0100

図14は、第3の実施形態に係る抑圧範囲設定処理の内容を示すフローチャートである。

0101

本実施形態に係る雑音抑圧処理における抑圧範囲設定処理では、図14に示すように、まず、全帯域SNR平均値M1を算出する(ステップS531)。ステップS531は、状態判定部105の全帯域SNR平均値算出部105Aが行う。全帯域SNR平均値算出部105Aは、式(1)により全帯域SNR平均値M1を算出し、算出した全帯域SNR平均値M1を低SNR有声状態判定部105Cに渡す。

0102

また、状態判定部105では、低域SNR平均値M2を算出する(ステップS532)。ステップS532は、低域SNR平均値算出部105Bが行う。低域SNR平均値算出部105Bは、低域(例えば500Hz以下)かつ定常雑音モデルよりも振幅の大きい周波数帯域のみによるSNRの平均値(低域SNR平均値M2)を算出し、算出した低域SNR平均値M2を低SNR有声状態判定部105Cに渡す。

0103

低SNR有声状態判定部105Cは、全帯域SNR平均値M1及び低域SNR平均値M2を受け取ると、M1<TH1、かつM2>TH2であるか否かをチェックする(ステップS533)。第1の閾値TH1及び第2の閾値TH2は、それぞれ、上述のように、2.0程度の値及び3.0程度の値とする。

0104

M1≧TH1及びM2≦TH2のいずれか或いは両方を満たす場合(ステップS533;No)、低SNR有声状態判定部105Cは、音声信号が低SNR有声状態ではないと判定する。この場合、状態判定部105(低SNR有声状態判定部105C)は、抑圧範囲設定部106の抑圧位相差範囲設定部106A及び抑圧SNR範囲設定部106Bに低SNR有声状態ではないことを通知する。通知を受けた抑圧範囲設定部106は、抑圧する位相差範囲及びSNR範囲を第1の範囲に設定する(ステップS534)。なお、第1の範囲は、第1の抑圧位相差範囲テーブルで定義される抑圧する位相差範囲及び第1の抑圧SNR範囲テーブルで定義される抑圧するSNR範囲である。すなわち、ステップS534では、抑圧位相差範囲設定部106Aが抑圧する位相差範囲を第1の抑圧位相差範囲テーブルの位相差範囲に決定し、抑圧SNR範囲設定部106Bが抑圧するSNR範囲を第1の抑圧SNR範囲テーブルのSNR範囲に決定する。

0105

一方、M1<TH1、かつM2>TH2の場合(ステップS533;Yes)、低SNR有声状態判定部105Cは、音声信号が低SNR有声状態であると判定する。この場合、状態判定部105(低SNR有声状態判定部105C)は、抑圧範囲設定部106の抑圧位相差範囲設定部106A及び抑圧SNR範囲設定部106Bに低SNR有声状態であることを通知する。そして、通知を受けた抑圧範囲設定部106は、抑圧する位相差範囲及びSNR範囲を第2の範囲に設定する(ステップS535)。なお、第2の範囲は、第2の抑圧位相差範囲テーブルで定義される抑圧する位相差範囲及び第2の抑圧SNR範囲テーブルで定義される抑圧するSNR範囲である。すなわち、ステップS535では、抑圧位相差範囲設定部106Aが抑圧する位相差範囲を第2の抑圧位相差範囲テーブルの位相差範囲に決定し、抑圧SNR範囲設定部106Bが抑圧するSNR範囲を第2の抑圧SNR範囲テーブルのSNR範囲に決定する。

0106

また、抑圧位相差範囲設定部106Aは、ステップS534又はS535において抑圧する位相差範囲を設定すると、設定した位相差範囲と対応する抑圧位相差範囲テーブルを記憶部110から読み出して第1の抑圧係数算出部107Aに渡す。同様に、抑圧SNR範囲設定部106Bは、ステップS534又はS535において抑圧するSNR範囲を設定すると、設定したSNR範囲と対応する抑圧SNR範囲テーブルを記憶部110から読み出して第2の抑圧係数算出部107Bに渡す。これにより、1フレームに対する抑圧範囲設定処理が終了する(リターン)。

0107

図15は、第3の実施形態に係る抑圧係数決定処理の内容を示すフローチャートである。

0108

本実施形態に係る雑音抑圧処理における抑圧係数決定処理では、図15に示すように、まず、周波数帯域fを選択する(ステップS631)。ステップS631は、第1の抑圧係数算出部107Aと第2の抑圧係数算出部107Bとが行う。第1の抑圧係数算出部107Aと第2の抑圧係数算出部107Bとは、同じ周波数帯域fを選択する。

0109

次に、第1の抑圧係数算出部107Aが位相差に基づく抑圧係数βを算出する処理を行い(ステップS632)、第2の抑圧係数算出部107BがSNRに基づく抑圧係数αを算出する処理を行う(ステップS633)。第1の抑圧係数算出部107Aは、ステップS632の処理として、例えば、図7に示したステップS611〜S615の処理を行う。第2の抑圧係数算出部107Bは、ステップS633の処理として、例えば、図7に示したステップS611〜S615の処理における位相差をSNRに置き換えた処理を行う。第1の抑圧係数算出部107A及び第2の抑圧係数算出部107Bは、それぞれ、算出した抑圧係数β(f)及びα(f)を抑圧係数確定部107Cに渡す。

0110

抑圧係数確定部107Cは、抑圧係数β(f)及びα(f)を受け取ると、受け取った抑圧係数β(f)及びα(f)に基づいて、周波数帯域fの成分に適用する抑圧係数γ(f)を決定する(ステップS634)。ステップS634において、抑圧係数確定部107Cは、例えば、γ(f)=α(f)×β(f)を周波数帯域fの信号成分に適用する抑圧係数に決定する。

0111

その後、抑圧係数決定部107は、全ての周波数帯域fについて抑圧係数γ(f)を決定する処理をしたか否かをチェックする(ステップS635)。未処理の周波数帯域fがある場合(ステップS635;No)、抑圧係数決定部107は、未処理の周波数帯域fについてステップS631〜S634の処理を繰り返す。そして、全ての周波数帯域fについて処理を行った場合(ステップS635;Yes)、抑圧係数決定部107は、確定した各周波数帯域fの抑圧係数γ(f)を抑圧信号生成部108に渡して抑圧係数算出処理を終了する(リターン)。

0112

抑圧信号生成部108は、抑圧係数γ(f)を受け取ると、第1の音声信号における各周波数帯域fの信号成分に抑圧係数γ(f)を適用して抑圧信号を生成する。

0113

このように、第3の実施形態においては、位相差に基づく抑圧係数β(f)及び定常雑音についての抑圧係数α(f)に基づいて周波数帯域fの成分に適用する抑圧係数γ(f)を確定(決定)する。また、低SNR有声状態の場合、抑圧範囲設定部106は、抑圧しない位相差範囲を広くして抑圧係数β(f)を算出するとともに、抑圧しないSNR範囲を広くして抑圧係数α(f)を算出する。そのため、定常雑音のある環境下においても、低SNR、かつ有声状態のときには音声の抑圧量を低減でき、低SNR区間における音声が聞き取りやすくなる。

0114

なお、抑圧係数α(f)の算出に用いる第2の抑圧SNR範囲テーブルは、第1の抑圧SNR範囲テーブルと対応するグラフを平行移動させたグラフに限らず、抑圧係数α(f)が最小値となるSNR範囲を狭くするグラフに基づいて作成してもよい。

0115

図16は、定常雑音についての抑圧を行う際に抑圧するSNR範囲の別の設定例を示す図である。

0116

図16に実線で示した折れ線は、図13に示した実線の折れ線と同様、低SNR有声状態ではないときの抑圧係数α(f)の算出に用いる関数を表している。一方、図16に示した点線の折れ線は、低SNR有声状態であるときの抑圧係数α(f)の算出に用いる関数を表している。図16に示した点線の折れ線(関数)は、抑圧係数αを最小値AとするSNRの上限値R3が、実線の折れ線における上限値R1よりも小さい。一方、図16に示した点線の折れ線(関数)と実線の折れ線とは、いずれも、抑圧係数αを「1」とするSNRの下限値がR2になっている。すなわち、図16に示した例においては、抑圧係数αが最小値AになるSNRと抑圧係数αが最大になるSNRとの間に、SNRに応じて抑圧係数αが変化する傾斜区間を有する。そして、抑圧SNR範囲設定部106Bは、入力信号が低SNR有声状態である場合に、抑圧係数αが最小になるSNR範囲が所定の閾値以上である場合の範囲よりも狭くなるよう前記傾斜区間の傾きを変更する。

0117

第2の抑圧SNR範囲テーブルを図16に示した点線の折れ線(関数)に対応させた場合、第2の抑圧SNR範囲テーブルと第1の抑圧SNR範囲テーブルとでは、抑圧しないSNR範囲が同じである。しかしながら、第2の抑圧SNR範囲テーブルは、第1の抑圧SNR範囲テーブルと比べて、抑圧係数α(f)が最小値Aになる範囲が狭くなっている。すなわち、SNRが値R3〜R2の間においては、第2の抑圧SNR範囲テーブルに基づいて抑圧したほうが、第1の抑圧SNR範囲テーブルに基づいて抑圧した場合に比べて抑圧量が少ない。よって、図16に示したような例においても、低SNR、かつ有声状態のときには音声の抑圧量を低減でき、低SNR区間における音声が聞き取りやすくなる。

0118

更に、本実施形態に係る第2の抑圧SNR範囲テーブルは、図13及び図16に示した点線の折れ線(関数)に限らず、例えば、図13におけるR1−R3の値と、R2−R4の値とが異なる関数に基づいて作成してもよい。

0119

[第4の実施形態]
第4の実施形態では、第1の音声信号と第2の音声信号との位相差に基づいて抑圧係数βを算出するとともに、定常雑音についての抑圧係数αを算出し、抑圧係数β,αに基づいて周波数帯域fの成分に適用する抑圧係数γを決定する。また、第4の実施形態では、定常雑音についての抑圧係数αを算出する際に、位相差による抑圧を検討するSNR範囲を設定する。

0120

図17は、第4の実施形態に係る雑音抑圧装置における抑圧範囲設定部の構成を示すブロック図である。

0121

本実施形態に係る雑音抑圧装置の機能的構成は、抑圧範囲設定部106及び抑圧係数決定部107を除き、第2の実施形態に係る雑音抑圧装置1と同じである。すなわち、図17に示した雑音抑圧装置1における状態判定部105は、低SNR有声状態であるか否かを判定する。

0122

抑圧範囲設定部106は、抑圧位相差範囲設定部106Aと、抑圧SNR範囲設定部106Bと、検討範囲設定部106Cと、を有する。

0123

抑圧位相差範囲設定部106Aは、状態判定部105の判定結果に基づいて、位相差による抑圧を行う場合の抑圧する位相差範囲を設定する。低SNR有声状態ではないという判定結果の場合、抑圧位相差範囲設定部106Aは、第1の抑圧位相差範囲テーブルの位相差範囲を、抑圧する位相差範囲に設定する。低SNR有声状態であるという判定結果の場合、抑圧位相差範囲設定部106Aは、第2の抑圧位相差範囲テーブルの位相差範囲を、抑圧する位相差範囲に設定する。

0124

抑圧SNR範囲設定部106Bは、状態判定部105の判定結果に基づいて、定常雑音についての抑圧を行う場合の抑圧するSNR範囲を設定する。低SNR有声状態ではないという判定結果の場合、抑圧SNR範囲設定部106Bは、第1の抑圧SNR範囲テーブルのSNR範囲を、抑圧するSNR範囲に設定する。低SNR有声状態であるという判定結果の場合、抑圧SNR範囲設定部106Bは、第2の抑圧SNR範囲テーブルのSNR範囲を、抑圧するSNR範囲に設定する。

0125

検討範囲設定部106Cは、抑圧SNR範囲設定部106Bで設定した抑圧SNR範囲内に、位相差による抑圧を検討する範囲を設定する。

0126

抑圧係数決定部107は、抑圧範囲設定部106により設定した抑圧SNR範囲、位相差による抑圧を検討する範囲、及び抑圧位相差範囲に基づいて、各周波数帯域fの成分に適用する抑圧係数を決定する。

0127

図18は、位相差による抑圧を検討する範囲の設定例を示す図である。
本実施形態においても、定常雑音についての抑圧SNR範囲は、例えば、図18に実線で示した折れ線に対応した第1の抑圧SNR範囲と、点線で示した折れ線に対応した第2の抑圧SNR範囲との2通りを用意する。

0128

また、本実施形態では、第1の抑圧SNR範囲及び第2の抑圧SNR範囲のそれぞれに対し、位相差による抑圧を検討する範囲を設定する。例えば、図18に示した例では、各抑圧SNR範囲において抑圧係数αが最小値AにならないSNR範囲NA1,NA2を、それぞれ位相差による抑圧を検討する範囲としている。位相差による抑圧を検討する範囲NA1,NA2は、第1の抑圧位相差範囲又は第2の抑圧位相差範囲に基づいた抑圧係数β(f)の算出を検討する範囲である。抑圧対象である音声信号が低SNR有声状態ではない場合、図18に示した例では、SNR(f)が値R1よりも大きい周波数帯域fの信号成分については、抑圧係数α(f)と位相差による抑圧係数β(f)とを算出する。そして、SNR(f)が値R1よりも小さい周波数帯域fの信号成分については、抑圧係数α(f)のみを算出し、抑圧係数β(f)を算出しない。また、図18に示した例では、抑圧対象である音声信号が低SNR有声状態である場合、SNR(f)が値R3よりも大きい周波数帯域fの信号成分については、抑圧係数α(f)と位相差による抑圧係数β(f)とを算出する。そして、SNR(f)が値R3よりも小さい周波数帯域fの信号成分については、抑圧係数α(f)のみを算出し、抑圧係数β(f)を算出しない。

0129

本実施形態の雑音抑圧装置1は、第1の実施形態と同様、第1のマイク2A及び第2のマイク2Bによる収音を開始すると、図5に示したような雑音抑圧処理を行う。この雑音抑圧処理において、状態判定部105及び抑圧範囲設定部106が協働して行う抑圧範囲設定処理(ステップS5)、及び抑圧係数決定部107が行う抑圧係数決定処理(ステップS6)を除く他の処理は、第1の実施形態で説明した通りである。

0130

図19は、第4の実施形態に係る抑圧範囲設定処理の内容を示すフローチャートである。

0131

本実施形態に係る雑音抑圧処理における抑圧範囲設定処理では、図19に示すように、まず、全帯域SNR平均値M1を算出する(ステップS541)。ステップS541は、状態判定部105の全帯域SNR平均値算出部105Aが行う。全帯域SNR平均値算出部105Aは、式(1)により全帯域SNR平均値M1を算出し、算出した全帯域SNR平均値M1を低SNR有声状態判定部105Cに渡す。

0132

また、状態判定部105では、低域SNR平均値M2を算出する(ステップS542)。ステップS542は、低域SNR平均値算出部105Bが行う。低域SNR平均値算出部105Bは、低域(例えば500Hz以下)かつ定常雑音モデルよりも振幅の大きい周波数帯域のみによるSNRの平均値(低域SNR平均値M2)を算出し、算出した低域SNR平均値M2を低SNR有声状態判定部105Cに渡す。

0133

低SNR有声状態判定部105Cは、全帯域SNR平均値M1及び低域SNR平均値M2を受け取ると、M1<TH1、かつM2>TH2であるか否かをチェックする(ステップS543)。第1の閾値TH1及び第2の閾値TH2は、それぞれ、上述のように、2.0程度の値及び3.0程度の値とする。

0134

M1≧TH1及びM2≦TH2のいずれか或いは両方を満たす場合(ステップS543;No)、低SNR有声状態判定部105Cは、音声信号が低SNR有声状態ではないと判定する。この場合、状態判定部105(低SNR有声状態判定部105C)は、抑圧範囲設定部106の抑圧位相差範囲設定部106A及び抑圧SNR範囲設定部106Bに低SNR有声状態ではないことを通知する。通知を受けた抑圧範囲設定部106は、抑圧する位相差範囲及びSNR範囲を第1の範囲に設定する(ステップS544)。ステップS544では、抑圧位相差範囲設定部106Aが抑圧する位相差範囲を第1の抑圧位相差範囲テーブルの位相差範囲に設定し、抑圧SNR範囲設定部106Bが抑圧するSNR範囲を第1の抑圧SNR範囲テーブルのSNR範囲に設定する。

0135

一方、M1<TH1、かつM2>TH2の場合(ステップS543;Yes)、低SNR有声状態判定部105Cは、音声信号が低SNR有声状態であると判定する。この場合、状態判定部105(低SNR有声状態判定部105C)は、抑圧範囲設定部106の抑圧位相差範囲設定部106A及び抑圧SNR範囲設定部106Bに低SNR有声状態であることを通知する。通知を受けた抑圧範囲設定部106は、抑圧する位相差範囲及びSNR範囲を第2の範囲に設定する(ステップS545)。ステップS545の処理では、抑圧位相差範囲設定部106Aが抑圧する位相差範囲を第2の抑圧位相差範囲テーブルの位相差範囲に設定し、抑圧SNR範囲設定部106Bが抑圧するSNR範囲を第2の抑圧SNR範囲テーブルのSNR範囲に設定する。

0136

また、抑圧位相差範囲設定部106Aは、ステップS544又はS545において抑圧する位相差範囲を設定すると、設定した位相差範囲と対応する抑圧位相差範囲テーブルを記憶部110から読み出して抑圧係数決定部107に渡す。同様に、抑圧SNR範囲設定部106Bは、ステップS544又はS545において抑圧するSNR範囲を設定すると、設定したSNR範囲と対応する抑圧SNR範囲テーブルを記憶部110から読み出して抑圧係数決定部107に渡す。更に、抑圧SNR範囲設定部106Bは、ステップS544又はS545で抑圧するSNR範囲を決定すると、決定したSNR範囲を検討範囲設定部に通知する。検討範囲設定部106Cは、抑圧するSNR範囲の通知を受けると、通知されたSNR範囲に基づいて、位相差による抑圧を検討するSNR範囲を設定する(ステップS546)。検討範囲設定部106Cは、設定した位相差による抑圧を検討するSNR範囲を、抑圧係数決定部107に通知する。これにより、1つのフレームに対する抑圧範囲設定処理が終了する(リターン)。

0137

図20は、第4の実施形態に係る抑圧係数決定処理の内容を示すフローチャートである。

0138

本実施形態に係る雑音抑圧処理における抑圧係数決定処理では、抑圧係数決定部107は、図20に示すように、まず、周波数帯域fを選択する(ステップS641)。

0139

次に、抑圧係数決定部107は、SNR(f)に応じた抑圧係数α(f)を算出する(ステップS642)。

0140

また、抑圧係数決定部107は、ステップS642の処理と並行して、SNR(f)が位相差による抑圧を検討する範囲内であるか否かをチェックする(ステップS643)。SNR(f)が位相差による抑圧を検討する範囲内ではない場合(ステップS643;No)、抑圧係数決定部107は、位相差に基づく抑圧係数β(f)を1にする(ステップS644)。

0141

一方、SNR(f)が位相差による抑圧を検討する範囲内の場合(ステップS643;Yes)、抑圧係数決定部107は、次に、周波数帯域fの位相差dP(f)を、抑圧する位相差範囲と照合する(ステップS645)。

0142

次に、抑圧係数決定部107は、位相差dP(f)が位相差による抑圧を行う範囲内であるか否かをチェックする(ステップS646)。抑圧係数決定部107は、抑圧位相差範囲設定部106Aにより設定された第1の抑圧位相差範囲又は第2の抑圧位相差範囲を参照し、位相差dP(f)が抑圧をする範囲であるか否かを判定する。

0143

位相差dP(f)が抑圧をする範囲内の場合(ステップS646;Yes)、抑圧係数決定部107は、位相差dP(f)に応じた抑圧係数β(f)を算出する(ステップS647)。一方、位相差dP(f)が抑圧する範囲外の場合(ステップS645;No)、抑圧係数決定部107は、抑圧係数β(f)を1に決定する(ステップS644)。

0144

その後、抑圧係数決定部107は、ステップS642で算出した抑圧係数α(f)、ステップS644又はS647で算出した抑圧係数β(f)に基づいて、周波数帯域fの成分に適用する抑圧係数γ(f)を決定する(ステップS648)。ステップS648において、抑圧係数決定部107は、例えば、γ(f)=α(f)×β(f)を周波数帯域fの信号成分に適用する抑圧係数に決定する。

0145

ステップS648により周波数帯域fの成分に適用する抑圧係数γ(f)を決定すると、抑圧係数決定部107は、次に、全ての周波数帯域fについて処理を行ったか否かをチェックする(ステップS649)。処理を行っていない周波数帯域がある場合(ステップS649;No)、抑圧係数決定部107は、処理を行っていない周波数帯域fについてステップS641以降の処理を行う。全ての周波数帯域について処理を行った場合(ステップS649;Yes)、抑圧係数決定部107は、各周波数帯域fに適用する抑圧係数γ(f)を抑圧信号生成部108に渡して、1フレームに対する抑圧係数決定処理を終了する(リターン)。

0146

本実施形態においては、定常雑音についての抑圧SNR範囲を設定する際に、所定のSNRよりも大きいSNR範囲を位相差による抑圧を検討するSNR範囲とする。すなわち、SNRが大きく定常雑音が小さい場合には、SNRによる抑圧に加え、位相差による抑圧も検討する。よって、定常雑音が小さいものの音声信号に非定常雑音が含まれている場合に、位相差による抑圧で非定常雑音を抑圧することができる。

0147

なお、本実施形態において抑圧係数α(f),β(f)から周波数帯域fの成分に適用する抑圧係数γ(f)を決定する場合、γ(f)=α(f)×β(f)とする代わりに、例えば、α(f)とβ(f)のうち小さいほうを抑圧係数γ(f)としてもよい。

0148

上記の第1〜第4の実施形態に係る雑音抑圧装置1は、コンピュータと、コンピュータに上記の雑音抑圧処理を実行させるプログラムとにより実現可能である。以下、コンピュータとプログラムにより実現される雑音抑圧装置1について、図21を参照しながら説明する。

0149

図21は、コンピュータのハードウェア構成図である。
図21に示すように、雑音抑圧装置1として動作させるコンピュータ5は、プロセッサ501と、主記憶装置502と、補助記憶装置503と、入力装置504と、表示装置505と、を備える。また、コンピュータ5は、入出力I/F装置506と、記憶媒体駆動装置507と、通信装置508と、を備える。コンピュータ5におけるこれらの要素501〜508は、バス510により相互に接続されており、要素間でのデータの受け渡しが可能になっている。

0150

プロセッサ501は、Central Processing Unit(CPU)やMicro Processing Unit(MPU)等の演算処理装置である。プロセッサ501は、オペレーティングシステムを含む各種のプログラムを実行することによりコンピュータ5の全体の動作を制御する。

0151

主記憶装置502は、Read Only Memory(ROM)及びRandom Access Memory(RAM)を含む。ROMには、例えばコンピュータ5の起動時にプロセッサ501が読み出す所定の基本制御プログラム等が予め記録されている。また、RAMは、プロセッサ501が各種のプログラムを実行する際に、必要に応じて作業用記憶領域として使用する。雑音抑圧装置1においては、例えば抑圧位相差範囲テーブル、抑圧SNR範囲テーブル、抑圧信号等の一時的な記憶に主記憶装置502のRAMを使用することができる。

0152

補助記憶装置503は、Hard Disk Drive(HDD)やSolid State Drive(SSD)等、主記憶装置502に比べて容量が大きい記憶装置である。補助記憶装置503には、プロセッサ501によって実行される各種のプログラムや各種のデータ等を記憶させる。補助記憶装置503に記憶させるプログラムとしては、例えば、上記の雑音抑圧処理を含む音声入出力処理のプログラム等が挙げられる。

0153

入力装置504は、例えばキーボード装置マウス装置であり、コンピュータ5のオペレータにより操作されると、その操作内容対応付けられている入力情報をプロセッサ501に送信する。

0154

表示装置505は、例えば液晶ディスプレイ等の表示装置である。液晶ディスプレイは、プロセッサ501等から送信される表示データに従って各種のテキスト、画像等を表示する。

0155

入出力I/F装置506は、マイクアレイ2やスピーカ3等、各種の外部装置をコンピュータ5に接続して使用可能にするためのインタフェース装置である。

0156

記憶媒体駆動装置507は、図示しない可搬型記憶媒体に記録されているプログラムやデータの読み出し、補助記憶装置503に記憶されたデータ等の可搬型記憶媒体への書き込みを行う。可搬型記憶媒体としては、例えば、USB規格コネクタが備えられているフラッシュメモリ利用可能である。また、可搬型記憶媒体としては、Compact Disk(CD)、Digital Versatile Disc(DVD)、Blu-ray Disc(Blu-rayは登録商標)等の光ディスクも利用可能である。

0157

通信装置508は、例えば、コンピュータ5とインターネット等の通信ネットワークとを通信可能に接続し、通信ネットワークを介した外部通信装置等との通信を行う装置である。また、通信装置508は、例えば、携帯電話回線等の電話網を介した通話や通信を行う装置でもよい。

0158

このコンピュータ5は、プロセッサ501が補助記憶装置503等から上述した雑音抑圧処理を含むプログラムを読み出して実行することでマイクアレイ2から入力された収音信号の雑音を抑圧する。また、雑音を抑圧した出力音声信号は、例えば、スピーカ3から出力することができる。また、コンピュータ5が携帯電話端末スマートフォン等の通話可能なものである場合、出力音声信号は通信装置508を介して通話相手の端末に送信することもできる。

0159

また、コンピュータ5は、例えば、カーナビゲーションシステム等であってもよい。この場合、上記の雑音抑圧処理を実行するプログラムは、例えば、音声認識プログラムと組み合わせることができる。

0160

以上記載した各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
複数のマイクで収音した収音信号を時間領域から周波数領域に変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデルを推定する定常雑音推定部と、
前記複数の入力信号の位相差を算出する位相差算出部と、
記入力信号及び前記定常雑音モデルを用いて算出した前記入力信号の信号対ノイズ比に基づいて前記入力信号を抑圧する位相差の範囲を設定する抑圧範囲設定部と、を備える、
ことを特徴とする雑音抑圧装置。
(付記2)
前記抑圧範囲設定部は、前記信号対ノイズ比が所定の閾値よりも小さい場合の前記入力信号を抑圧する位相差の範囲を、前記信号対ノイズ比が所定の閾値以上である場合の前記位相差の範囲よりも狭く設定する、
ことを特徴とする付記1に記載の雑音抑圧装置。
(付記3)
前記入力信号の信号対ノイズ比が所定の閾値よりも小さく、かつ前記入力信号が音声を含む有声状態であるか否かを判定する判定部、を更に備え、
前記抑圧範囲設定部は、前記入力信号の信号対ノイズ比が所定の閾値よりも小さくかつ前記入力信号が有声状態である場合に、前記入力信号を抑圧する位相差の範囲を、前記信号対ノイズ比が所定の閾値以上である場合の前記位相差の範囲よりも狭く設定する、
ことを特徴とする付記1に記載の雑音抑圧装置。
(付記4)
前記判定部は、
前記入力信号における全周波数帯域における信号対ノイズ比から第1の平均値を算出する第1の平均値算出部と、
前記入力信号のうち所定の周波数よりも低く、かつ振幅が前記定常雑音モデルよりも大きい周波数帯域についての信号対ノイズ比から第2の平均値を算出する第2の平均値算出部と、を有し、
前記第1の平均値が第1の閾値よりも小さく、かつ前記第2の平均値が第2の閾値よりも大きい場合に前記入力信号の信号対ノイズ比が所定の閾値よりも小さくかつ前記入力信号が有声状態であると判定する、
ことを特徴とする付記3に記載の雑音抑圧装置。
(付記5)
前記抑圧範囲設定部は、
前記入力信号を抑圧する位相差の範囲を設定する第1の設定部と、
前記入力信号を抑圧する信号対ノイズ比の範囲を設定する第2の設定部と、を備える、
ことを特徴とする付記1に記載の雑音抑圧装置。
(付記6)
前記雑音抑圧装置は、
前記入力信号を抑圧する位相差の範囲、及び前記入力信号を抑圧する信号対ノイズ比の範囲のいずれかを選択して前記入力信号の各周波数帯域の信号成分に適用する抑圧係数を決定する抑圧係数決定部、を更に備える、
ことを特徴とする付記5に記載の雑音抑圧装置。
(付記7)
前記雑音抑圧装置は、
前記入力信号を抑圧する位相差の範囲に基づいて前記入力信号の各周波数帯域の信号成分に応じた第1の抑圧係数を算出する第1の抑圧係数算出部と、
前記入力信号を抑圧する信号対ノイズ比の範囲に基づいて前記入力信号の各周波数帯域の信号成分に応じた第2の抑圧係数を算出する第2の抑圧係数算出部と、
前記第1の抑圧係数及び前記第2の抑圧係数に基づいて前記入力信号の各周波数帯域の信号成分に適用する抑圧係数を確定する抑圧係数確定部と、を更に備える
ことを特徴とする付記5に記載の雑音抑圧装置。
(付記8)
前記抑圧範囲設定部は、
前記入力信号のうち信号対ノイズ比が前記第2の設定部で設定した信号対ノイズ比の範囲外である周波数帯域の信号成分に対し、前記第1の設定部で設定した位相差の範囲に基づく抑圧を行うか否かを検討する範囲を設定する検討範囲設定部、を更に備える、
ことを特徴とする付記5に記載の雑音抑圧装置。
(付記9)
前記第2の設定部は、前記入力信号の信号対ノイズ比が所定の閾値よりも小さくかつ前記入力信号が有声状態である場合に、前記入力信号を抑圧する信号対ノイズ比の範囲を、前記入力信号の信号対ノイズ比が所定の閾値以上である場合の範囲よりも狭くなるよう平行移動させる、
ことを特徴とする付記5に記載の雑音抑圧装置。
(付記10)
前記第2の設定部は、前記入力信号の信号対ノイズ比が所定の閾値よりも小さくかつ前記入力信号が有声状態である場合に、抑圧係数の最小値と対応する信号対ノイズ比の最大値を小さくする、
ことを特徴とする付記5に記載の雑音抑圧装置。
(付記11)
コンピュータが、
複数のマイクで収音した時間領域の収音信号をそれぞれ周波数領域の入力信号に変換し、
変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデルを推定し、
前記複数の入力信号の位相差を算出するとともに、前記入力信号及び前記定常雑音モデルを用いて前記入力信号の信号対ノイズ比を算出し、算出した前記信号対ノイズ比に基づいて前記入力信号を抑圧する位相差の範囲を設定する、
処理を実行することを特徴とする雑音抑圧方法。
(付記12)
複数のマイクで収音した時間領域の収音信号をそれぞれ周波数領域に入力信号に変換し、
変換した複数の入力信号のうち抑圧対象の入力信号についての定常雑音モデルを推定し、
前記複数の入力信号の位相差を算出するとともに、前記入力信号及び前記定常雑音モデルを用いて前記入力信号の信号対ノイズ比を算出し、算出した前記信号対ノイズ比に基づいて前記入力信号を抑圧する位相差の範囲を設定する、
処理をコンピュータに実行させるための雑音抑圧プログラム。

0161

1雑音抑圧装置
101 信号受付部
102 変換部
103定常雑音推定部
104位相差算出部
105状態判定部
105A 全帯域SNR平均値算出部
105B 低域SNR平均値算出部
105C 低SNR有声状態判定部
106抑圧範囲設定部
106A抑圧位相差範囲設定部
106B 抑圧SNR範囲設定部
106C検討範囲設定部
107抑圧係数決定部
107A 第1の抑圧係数算出部
107B 第2の抑圧係数算出部
107C 抑圧係数確定部
108抑圧信号生成部
109逆変換部
110 記憶部
2マイクアレイ
2A,2Bマイク
3スピーカ
5コンピュータ
501プロセッサ
502主記憶装置
503補助記憶装置
504入力装置
505表示装置
506入出力I/F装置
507記憶媒体駆動装置
508通信装置
510 バス

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • ソニー株式会社の「 情報処理装置および電子機器」が 公開されました。( 2020/09/24)

    【課題・解決手段】本技術は、どのユーザに対して応答するべきかを正しく判断することができるようにする情報処理装置および電子機器に関する。発話者特定部は、ユーザが存在する環境の画像と音声に基づいて、所定の... 詳細

  • 中興通訊股ふん有限公司の「 音声再生方法および端末、記憶媒体」が 公開されました。( 2020/09/24)

    【課題・解決手段】音声再生の過程においてターゲットスピーカーモジュールを識別し、前記ターゲットスピーカーモジュールを用いて音声を再生することを含む、音声再生方法である。端末である。本開示は受話器または... 詳細

  • グーグルエルエルシーの「 オーディオベースのコンピュータプログラム出力の修正」が 公開されました。( 2020/09/24)

    【課題・解決手段】音声または非テキスト入力アクティブ化環境においてコンピュータプログラム出力を修正することが提供される。システムは、デバイスのマイクロフォンによって検出されるオーディオ信号を受信するこ... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ