図面 (/)

技術 音信号処理装置及び音信号処理プログラム

出願人 沖電気工業株式会社
発明者 青柳弘美
出願日 2015年2月12日 (5年1ヶ月経過) 出願番号 2015-025521
公開日 2016年8月18日 (3年7ヶ月経過) 公開番号 2016-148774
状態 特許登録済
技術分野 音声の分析・合成
主要キーワード 信号分岐回路 変更度合 音処理プログラム 雑音抑圧回路 発音音声 変更パラメータ 音声強調処理 音信号処理装置
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年8月18日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (5)

課題

目的音成分雑音成分とが混在する入力音信号における目的音聴取し易くできる音信号処理装置を提供する。

解決手段

入力音信号を2分岐し、第1及び第2の分岐音信号のそれぞれに、雑音成分や目的音成分の除去回路若しくは強調回路が該当する第1及び第2のS/N比変更回路によってS/N比変更処理を施す。ここで、第1及び第2のS/N比変更回路のS/N比変更度合を異なるようにさせる。これにより、形成された第1及び第2の出力音信号を仮に人間が聴取した場合に、目的音成分の定位位置と雑音成分の定位位置とが異なると認識でき、目的音成分だけを意識して聴くことができる。

概要

背景

携帯電話システムに代表される音声通話システムでは、入力された音声信号に対して、周囲の雑音の成分が重畳されている場合が少なくなく、通話音質劣化を引き起こしていた。このような課題を解決するため、従来、入力音声信号に含まれている雑音成分を抑圧する方法が種々提案されている。例えば、非特許文献1には、ウィナーフィルタ法によって雑音成分を抑圧する方法が記載されている。ウィナーフィルタ法は、入力音声信号における雑音成分を推定し、これを周波数領域で入力音声信号から減じることにより雑音成分を抑圧する方法である。

概要

目的音成分と雑音成分とが混在する入力音信号における目的音聴取し易くできる音信号処理装置を提供する。 入力音信号を2分岐し、第1及び第2の分岐音信号のそれぞれに、雑音成分や目的音成分の除去回路若しくは強調回路が該当する第1及び第2のS/N比変更回路によってS/N比変更処理を施す。ここで、第1及び第2のS/N比変更回路のS/N比変更度合を異なるようにさせる。これにより、形成された第1及び第2の出力音信号を仮に人間が聴取した場合に、目的音成分の定位位置と雑音成分の定位位置とが異なると認識でき、目的音成分だけを意識して聴くことができる。

目的

電子情報通信学会知識ベース、1群5編5章5−1






しかしながら、入力音声信号の信号対雑音比(S/N比)が劣悪な場合に、ウィナーフィルタ法を適用すると、雑音成分を抑圧した結果、目的とする

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

目的音成分雑音成分とが混在する入力音信号2分岐して第1及び第2の分岐音信号を生成する分岐処理部と、上記第1及び第2の分岐信号に対して、S/N比を変更して、第1及び第2のS/N比変更音信号を生成するS/N比変更処理部とを有することを特徴とする音信号処理装置

請求項2

上記S/N比変更処理部は、上記第1の分岐音信号に含まれている雑音成分を、第1の抑圧量パラメータが規定する抑圧量だけ抑圧することにより、上記第1の分岐音信号におけるS/N比を変更し、上記第2の分岐音信号に含まれている雑音成分を、上記第1の抑圧量パラメータとは異なる第2の抑圧量パラメータが規定する抑圧量だけ抑圧することにより、上記第2の分岐音信号におけるS/N比を変更することを特徴とする請求項1に記載の音信号処理装置。

請求項3

上記第1及び第2のS/N比変更音信号を同期させて出力する同期化部をさらに有することを特徴とする請求項2に記載の音信号処理装置。

請求項4

上記同期化部は、上記第1のS/N比変更音信号と上記第2のS/N比変更音信号との時刻差を検出する時刻差検出部と、検出された時刻差に基づいて、上記第1のS/N比変更音信号及び上記第2のS/N比変更音信号の少なくとも一方を遅延させる遅延部とを有することを特徴とする請求項3に記載の音信号処理装置。

請求項5

上記S/N比変更処理部により生成された上記第1及び上記第2のS/N比変更音信号に対して音源分離を施し、目的音成分を有する音信号を得て出力する音源分離部をさらに有することを特徴とする請求項1〜4のいずれかに記載の音信号処理装置。

請求項6

目的音成分と雑音成分とが混在する入力音信号を2分岐して第1及び第2の分岐音信号を生成する分岐処理部と、上記第1の分岐信号に対して、S/N比を変更して、第1のS/N比変更音信号を生成するS/N比変更処理部とを有することを特徴とする音信号処理装置。

請求項7

上記第1のS/N比変更音信号と上記第2の分岐音信号とを同期させて出力する同期化部をさらに有することを特徴とする請求項6に記載の音信号処理装置。

請求項8

上記同期化部は、上記第1のS/N比変更信号と上記第2の分岐音信号との時刻差を検出する時刻差検出部と、検出された時刻差に基づいて、上記第2の分岐音信号を遅延させる遅延部とを有することを特徴とする請求項7に記載の音信号処理装置。

請求項9

上記S/N比変更部により生成される上記第1のS/N比変更信号と、上記第2の分岐信号に対して音源分離を施し、目的音成分を有する音信号を得て出力する音源分離部をさらに有することを特徴とする請求項6〜8のいずれかに記載の音信号処理装置。

請求項10

コンピュータを、目的音成分と雑音成分とが混在する入力音信号を2分岐して第1及び第2の分岐音信号を生成する分岐処理手段と、上記第1及び第2の分岐信号に対して、S/N比を変更して、第1及び第2のS/N比変更音信号を生成するS/N比変更処理手段として機能させる、ことを特徴とする音信号処理プログラム

請求項11

コンピュータを、目的音成分と雑音成分とが混在する入力音信号を2分岐して第1及び第2の分岐音信号を生成する分岐処理手段と、上記第1の分岐信号に対して、S/N比を変更して、第1のS/N比変更音信号を生成するS/N比変更処理手段として機能させる、ことを特徴とする音信号処理プログラム。

技術分野

0001

本発明は音信号処理装置及び音信号処理プログラムに関し、例えば、音声信号音響信号等の音信号に含まれている雑音成分を抑圧する場合に適用し得るものである。

背景技術

0002

携帯電話システムに代表される音声通話システムでは、入力された音声信号に対して、周囲の雑音の成分が重畳されている場合が少なくなく、通話音質劣化を引き起こしていた。このような課題を解決するため、従来、入力音声信号に含まれている雑音成分を抑圧する方法が種々提案されている。例えば、非特許文献1には、ウィナーフィルタ法によって雑音成分を抑圧する方法が記載されている。ウィナーフィルタ法は、入力音声信号における雑音成分を推定し、これを周波数領域で入力音声信号から減じることにより雑音成分を抑圧する方法である。

先行技術

0003

電子情報通信学会知識ベース、1群5編5章5−1

発明が解決しようとする課題

0004

しかしながら、入力音声信号の信号対雑音比(S/N比)が劣悪な場合に、ウィナーフィルタ法を適用すると、雑音成分を抑圧した結果、目的とする音声(以下、目的音と呼ぶ)の成分も劣化するという課題があった。この不都合を回避すべく、目的音成分の劣化を抑えると、雑音成分を十分に抑圧できないという課題があった。すなわち、入力音声信号のS/N比が劣悪な場合には、雑音成分の抑圧処理を実行しても、通話音質の劣化を改善できないという課題があった。

0005

雑音抑圧方法としては、ウィナーフィルタ法以外にも、スペクトル減算法やボイススイッチなど種々の方法があるが、入力音声信号のS/N比が劣悪な場合には同様な課題が生じていた。

0006

ところで、ヘッドセットなどの右耳用のスピーカ部と左耳用のスピーカ部とに分かれている発音装置音声出力装置として適用する場合には、Rチャンネル用の音声信号とLチャンネル用の音声信号とが必要となるが、従来、雑音抑圧処理を行ったモノラル音声信号ステレオ音声信号に変換するのが一般的であり、上述した課題が同様に生じていた。

0007

本発明は、以上の点に鑑みなされたものであり、入力音信号における目的音を聴取し易くできる音信号処理装置及び音信号処理プログラムを提供しようとしたものである。

課題を解決するための手段

0008

第1の本発明の音信号処理装置は、(1)目的音成分と雑音成分とが混在する入力音信号を2分岐して第1及び第2の分岐音信号を生成する分岐処理部と、(2)上記第1及び第2の分岐信号に対して、S/N比を変更して、第1及び第2のS/N比変更音信号を生成するS/N比変更処理部とを有することを特徴とする。

0009

第2の本発明の音信号処理装置は、(1)目的音成分と雑音成分とが混在する入力音信号を2分岐して第1及び第2の分岐音信号を生成する分岐処理部と、(2)上記第1の分岐信号に対して、S/N比を変更して、第1のS/N比変更音信号を生成するS/N比変更処理部とを有することを特徴とする。

0010

第3の本発明の音信号処理プログラムは、コンピュータを、(1)目的音成分と雑音成分とが混在する入力音信号を2分岐して第1及び第2の分岐音信号を生成する分岐処理手段と、(2)上記第1及び第2の分岐信号に対して、S/N比を変更して、第1及び第2のS/N比変更音信号を生成するS/N比変更処理手段として機能させることを特徴とする。

0011

第4の本発明の音信号処理プログラムは、コンピュータを、(1)目的音成分と雑音成分とが混在する入力音信号を2分岐して第1及び第2の分岐音信号を生成する分岐処理手段と、(2)上記第1の分岐信号に対して、S/N比を変更して、第1のS/N比変更音信号を生成するS/N比変更処理手段として機能させることを特徴とする。

発明の効果

0012

本発明によれば、入力音信号における目的音を聴取し易くできる音信号処理装置、音信号処理プログラム及び音信号処理方法を実現できる。

図面の簡単な説明

0013

第1の実施形態に係る雑音抑圧装置の構成を示すブロック図である。
第1の実施形態に係る雑音抑圧装置の入出力信号信号波形を示す説明図である。
第2の実施形態に係る雑音抑圧装置の構成を示すブロック図である。
第3の実施形態に係る雑音抑圧装置の構成を示すブロック図である。

実施例

0014

(A)第1の実施形態
以下、本発明による音信号処理装置及び音信号処理プログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態の音信号処理装置及び音信号処理プログラムは、入力音声信号に含まれている雑音成分を抑圧する雑音抑圧装置及び雑音抑圧プログラムである。

0015

(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る雑音抑圧装置の構成を示すブロック図である。

0016

第1の実施形態の雑音抑圧装置は、図1で示す構成部分ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア音処理プログラム)とCPU(Central Processing Unit)とで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。

0017

図1において、第1の実施形態の雑音抑圧装置100は、Lチャンネル用雑音抑圧回路101、Rチャンネル用雑音抑圧回路102、時刻差検出回路103、Lチャンネル用時刻補正回路104及びRチャンネル用時刻補正回路105を有する。

0018

図1では省略しているが、見方を変えれば、ヘッドセットなどのステレオ音声信号の出力装置も、第1の実施形態の雑音抑圧装置100の構成要素となっているということができる(このことについては動作説明の項で明らかにする)。但し、第1の実施形態の雑音抑圧装置100は、音声信号の送話側の装置に設けられていても良く、音声信号の受話側の装置に設けられていても良い。

0019

第1の実施形態の雑音抑圧装置100に入力された音声信号(入力音声信号)Sは2分岐され、分岐された入力音声信号SL、SRがそれぞれ、ステレオ音声信号の一方として対応するLチャンネル用雑音抑圧回路101又はRチャンネル用雑音抑圧回路102に与えられる。図1では、信号線の分岐(信号分岐回路一種)で入力音声信号Sを2分岐するように記載しているが、入力音声信号Sを2分岐する、従来から存在する種々の技術により実現された信号分岐回路を適用するようにしても良い。

0020

Lチャンネル用雑音抑圧回路101及びRチャンネル用雑音抑圧回路102は、S/N比変更回路として設けられた雑音抑圧回路である。

0021

Lチャンネル用雑音抑圧回路101は、自己へのLチャンネルの入力音声信号SLに含まれている雑音成分を抑圧し、雑音抑圧後のLチャンネル音声信号SSLを出力するものである。Lチャンネル用雑音抑圧回路101としては、ウィナーフィルタ法、スペクトル減算法、ボイススイッチなど既存の雑音抑圧方法を適用した公知の雑音抑圧回路を適用することができる。但し、Lチャンネル用雑音抑圧回路101は、外部から与えられる抑圧量パラメータ言い換えると、S/N比変更パラメータPLに従って、雑音成分を抑圧するものであることを要する。例えば、ウィナーフィルタ法やスペクトル減算法などでは、周波数領域で雑音成分の値を得て、得た雑音成分に対してパラメータで指定された抑圧量を、周波数領域の入力音声信号から周波数成分毎に減算することで雑音成分を抑圧する方法であり、雑音成分の抑圧量を抑圧量パラメータPLに従って変えることができるものである。

0022

Rチャンネル用雑音抑圧回路102は、自己へのRチャンネルの入力音声信号SRに含まれている雑音成分を抑圧し、抑圧後のLチャンネル音声信号SSRを出力するものである。Rチャンネル用雑音抑圧回路102も、外部から与えられる抑圧量パラメータPRに従って、雑音成分を抑圧するものであることを要する。

0023

Rチャンネル用雑音抑圧回路102が適用している雑音抑圧方法や内部構成は、Lチャンネル用雑音抑圧回路101が適用している雑音抑圧方法や内部構成と同一であっても良く、また、異なっていても良い。例えば、Lチャンネル用雑音抑圧回路101及びRチャンネル用雑音抑圧回路102が共にウィナーフィルタ法に従ったものであっても良く、また、Lチャンネル用雑音抑圧回路101がウィナーフィルタ法に従い、Rチャンネル用雑音抑圧回路102がスペクトル減算法に従うものであっても良い。

0024

第1の実施形態の場合、S/N比変更パラメータとしての、Lチャンネル用雑音抑圧回路101への抑圧量パラメータPLと、Rチャンネル用雑音抑圧回路102への抑圧量パラメータPRとが異なっている。このような抑圧量パラメータPL及びPRを異なるものにすることにより、Lチャンネル用雑音抑圧回路101からの雑音抑圧後のLチャンネル音声信号SSLにおける目的音成分と、Rチャンネル用雑音抑圧回路102からの雑音抑圧後のRチャンネル音声信号SSRにおける目的音成分とが同様なレベルでありながら、Lチャンネル用雑音抑圧回路101からの雑音抑圧後のLチャンネル音声信号SSLにおける雑音成分のレベルと、Rチャンネル用雑音抑圧回路102からの雑音抑圧後のRチャンネル音声信号SSRにおける雑音成分のレベルとが異なるようになされている。例えば、抑圧量パラメータPLの方が抑圧量パラメータPRより抑圧量を少なくするものに選定されている場合、雑音抑圧後のLチャンネル音声信号SSLにおける雑音成分のレベルの方が、雑音抑圧後のRチャンネル音声信号SSRにおける雑音成分のレベルより大きくなる。

0025

Lチャンネル用雑音抑圧回路101及びRチャンネル用雑音抑圧回路102はそれぞれ、自己からの出力信号SSL、SSRとして時間領域の信号を出力するものであっても良く、また、周波数領域の信号を出力するものであっても良い。

0026

時刻差検出回路103、Lチャンネル用時刻補正回路104及びRチャンネル用時刻補正回路105は、Lチャンネル用雑音抑圧回路101及びRチャンネル用雑音抑圧回路102における処理遅延が異なる場合を考慮して設けられたものである。

0027

仮に、Lチャンネル用雑音抑圧回路101及びRチャンネル用雑音抑圧回路102における処理遅延が同じ場合、言い換えると、雑音抑圧後のLチャンネル音声信号SSLと雑音抑圧後のRチャンネル音声信号SSRとが同期している場合には、時刻差検出回路103、Lチャンネル用時刻補正回路104及びRチャンネル用時刻補正回路105を省略することができる。

0028

時刻差検出回路103は、例えば、雑音抑圧後のLチャンネル音声信号SSLと雑音抑圧後のRチャンネル音声信号SSRとの相互相関を計算することにより、雑音抑圧後のLチャンネル音声信号SSLと雑音抑圧後のRチャンネル音声信号SSRとの時刻差Dを計算する。例えば、信号SSL及びSSRが周波数領域の信号である場合には、FFT高速フーリエ変換)に供する所定期間(例えば20ms)のサンプルであるフレーム時刻の単位とすれば良く、信号SSL及びSSRが時間領域の信号である場合には、サンプリング周期若しくはフレームを時刻の単位とすれば良い。

0029

時刻差検出回路103は、雑音抑圧後のLチャンネル音声信号SSLと雑音抑圧後のRチャンネル音声信号SSRとの時刻差Dを解消するための補正遅延量DL及びDRを形成し、それぞれを対応する時刻補正回路104、105へ与える。Lチャンネル音声信号SSLの時刻がRチャンネル音声信号SSRの時刻より時刻差D分だけ遅れている場合には、時刻差検出回路103は、Lチャンネル用時刻補正回路104に与える補正遅延量DLを0とし、Rチャンネル用時刻補正回路105に与える補正遅延量DRをDとする。逆に、Rチャンネル音声信号SSRの時刻がLチャンネル音声信号SSLの時刻より時刻差D分だけ遅れている場合には、時刻差検出回路103は、Rチャンネル用時刻補正回路105に与える補正遅延量DRを0とし、Lチャンネル用時刻補正回路104に与える補正遅延量DLをDとする。

0030

なお、Lチャンネル用雑音抑圧回路101及びRチャンネル用雑音抑圧回路102における処理遅延が異なる場合であっても、Lチャンネル用雑音抑圧回路101及びRチャンネル用雑音抑圧回路102の構成などにより、時間差Dが予め特定できる場合には、時刻差検出回路103と、一方の時刻補正回路104又は105を省略することができる。

0031

Lチャンネル用時刻補正回路104は、雑音抑圧後のLチャンネル音声信号SSLを補正遅延量DLだけ遅延させて、当該雑音抑圧装置100からのLチャンネル出力音声信号OUTLとして送出する。同様に、Rチャンネル用時刻補正回路105は、雑音抑圧後のRチャンネル音声信号SSRを補正遅延量DRだけ遅延させて、当該雑音抑圧装置100からのRチャンネル出力音声信号OUTRとして送出する。

0032

図1では省略しているが、出力音声信号OUTL及びOUTRが周波数領域の信号である場合には、ステレオ音声信号の出力装置に至るまでに、IFFT(逆高速フーリエ変換)回路を設けることを要する。

0033

(A−2)第1の実施形態の動作
次に、上述した詳細構成を有する第1の実施形態に係る雑音抑圧装置100の動作を説明する。

0034

第1の実施形態の雑音抑圧装置100において、入力音声信号Sは2分岐され、分岐で得られたLチャンネルの入力音声信号SLはLチャンネル用雑音抑圧回路101に与えられ、分岐で得られたRチャンネルの入力音声信号SRはRチャンネル用雑音抑圧回路101に与えられる。

0035

Lチャンネル用雑音抑圧回路101において、Lチャンネルの入力音声信号SLに含まれている雑音成分が、抑圧量パラメータPLが指示する分だけ抑圧されると共に、Rチャンネル用雑音抑圧回路102において、Rチャンネルの入力音声信号SRに含まれている雑音成分が、抑圧量パラメータPRが指示する分だけ抑圧される。

0036

雑音抑圧後のLチャンネル音声信号SSLと雑音抑圧後のRチャンネル音声信号SSRとの時刻差Dが時刻差検出回路103で検出され、時刻差Dを解消するための補正遅延量DL及びDRが形成されて、それぞれ対応するLチャンネル用時刻補正回路104、Rチャンネル用時刻補正回路105に与えられる。

0037

雑音抑圧後のLチャンネル音声信号SSLは、Lチャンネル用時刻補正回路104によって補正遅延量DLだけ遅延されて、当該雑音抑圧装置100からのLチャンネル出力音声信号OUTLとして送出され、同様に、雑音抑圧後のRチャンネル音声信号SSRは、Rチャンネル用時刻補正回路105によって補正遅延量DRだけ遅延されて、当該雑音抑圧装置100からのRチャンネル出力音声信号OUTRとして送出される。

0038

図2は、雑音抑圧装置100への入力音声信号Sと、雑音抑圧装置100からの出力音声信号(Lチャンネル出力音声信号及びRチャンネル出力音声信号)OUTL及びOUTRの信号波形例を示す説明図である。図2において、「V」は目的音成分と雑音成分とが重畳されている区間を表し、「N」は雑音成分だけを含む区間を表している。図2は、抑圧量パラメータPLの方が抑圧量パラメータPRより抑圧量を少なくするものに選定されている場合の信号波形を示している。

0039

抑圧量パラメータPLの方が抑圧量を少なくするものに選定されているため、Lチャンネル出力音声信号OUTLにおける目的音成分と、Rチャンネル出力音声信号OUTRにおける目的音成分とが同様なレベルであるが、Lチャンネル出力音声信号OUTLにおける雑音成分のレベルは、Rチャンネル出力音声信号OUTRにおける雑音成分のレベルより大きい。

0040

ここで、Lチャンネル出力音声信号OUTL及びRチャンネル出力音声信号OUTR(周波数領域の信号である場合には時間領域の信号への変換を要する)でなるステレオ音声信号の出力装置として、人間が発音音声を両で聴くヘッドセットを想定する(なお、出力装置はヘッドセットには限定されない)。発音音声における目的音成分は、左右共にほぼ同じ音圧であるため、頭内の中央に定位して聴こえる。発音音声における雑音成分は、上述したように抑圧量が異なるため、左右の音圧が異なり、頭内の中央から左右のどちらかにずれた位置に定位して聴こえる。図2の例の場合、左耳への雑音成分の音圧の方が右耳への雑音成分の音圧より大きいので、雑音は頭内の中央から左にずれた位置に定位して聴こえる。

0041

すなわち、目的音と雑音の定位位置音源位置)を異なるものとすることができ、脳内で知覚する際には、目的音と雑音の分離が容易になる。人間は、複数の音源から目的音を意識して聴き分けることができ、人間の聴覚上の特質をも考慮すると、入力音声信号のS/N比が悪くても雑音抑圧効果を高めことができる。

0042

(A−3)第1の実施形態の効果
以上のように、第1の実施形態の雑音抑圧装置によれば、入力音声信号のS/N比が悪くても大きな雑音抑圧効果を奏することができる。すなわち、第1の実施形態の雑音抑圧装置によれば、目的音を聴取し易くできる。

0043

(B)第2の実施形態
次に、本発明による音信号処理装置及び音信号処理プログラムの第2の実施形態を、図面を参照しながら説明する。第2の実施形態の音信号処理装置及び音信号処理プログラムも、入力音声信号に含まれている雑音成分を抑圧する雑音抑圧装置及び雑音抑圧プログラムである。

0044

図3は、第2の実施形態に係る雑音抑圧装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。

0045

第2の実施形態の雑音抑圧装置200は、図3及び図1の比較から明らかなように、第1の実施形態の雑音抑圧装置100から、Lチャンネル用雑音抑圧回路101及びRチャンネル用時刻補正回路105を省略したものである。

0046

Lチャンネル用雑音抑圧回路101を省略することは、第1の実施形態のLチャンネル用雑音抑圧回路101に与える抑圧量パラメータPLが抑圧しないことを指示し、分岐Lチャンネル音声信号SLをそのまま透過させて抑圧後のLチャンネル音声信号SSLにしたのと等価である。

0047

第2の実施形態ではLチャンネル用雑音抑圧回路101を省略しているので、抑圧後のRチャンネル音声信号SSRだけに処理遅延が生じており(分岐Lチャネル音声信号SLを抑圧後のLチャンネル音声信号SSLとみなした場合において、抑圧後のLチャンネル音声信号SSLに処理遅延は存在しない)、そのため、処理遅延が生じていないLチャンネルの処理系にのみ時刻補正回路(Lチャンネル用時刻補正回路)104を設けている。

0048

第2の実施形態の雑音抑圧装置200におけるその他の点は、第1の実施形態と同様である。

0049

第2の実施形態の雑音抑圧装置200の場合、Lチャンネル出力音声信号OUTLとして入力音声信号Sをそのまま適用しているが、第1の実施形態について図2を用いて説明したように、Lチャンネル出力音声信号OUTLにおける目的音成分と、Rチャンネル出力音声信号OUTRにおける目的音成分とを同様なレベルにできると共に、Lチャンネル出力音声信号OUTLにおける雑音成分のレベルをRチャンネル出力音声信号OUTRにおける雑音成分のレベルより大きくできる。その結果、これらステレオ音声信号を聴取したときに、目的音と雑音の定位位置(音源位置)を異なるものとすることができて、人間が意識することにより目的音を容易に分離することができる。

0050

第2の実施形態の雑音抑圧装置によっても、入力音声信号のS/N比が悪くても大きな雑音抑圧効果を奏することができ、目的音を聴取し易くできる。

0051

(C)第3の実施形態
次に、本発明による音信号処理装置及びプログラムの第3の実施形態を、図面を参照しながら説明する。第3の実施形態の音信号処理装置も、入力音声信号に含まれている雑音成分を抑圧する雑音抑圧装置である。

0052

図4は、第3の実施形態に係る雑音抑圧装置の構成を示すブロック図である。

0053

図4において、第3の実施形態の雑音抑圧装置300は、雑音抑圧装置本体301と音源分離回路302とを有する。

0054

雑音抑圧装置本体301は、第1の実施形態や第2の実施形態(これらの変形実施形態であっても良い)の雑音抑圧装置100又は200が該当するものである。第3の実施形態の場合、雑音抑圧装置本体301からのLチャンネル出力音声信号OUTL及びRチャンネル出力音声信号OUTRは、音源分離回路302に与えられる。

0055

音源分離回路302は、Lチャンネル出力音声信号OUTL及びRチャンネル出力音声信号OUTRを、恰も2つのマイクロホン捕捉した音声信号として、音源分離処理を行って目的音成分の音源と雑音成分の音源とを分離し、分離した目的音成分だけを含む出力音声信号OUTを得て出力するものである。

0056

音源分離回路302は、複数の入力音声信号から音源分離を行う既存の音源分離回路を適用することができ、そのため、詳細構成の説明は省略する。音源分離回路302として、例えば、特開2014−215461号公報又は特開2014−157261号公報に記載の音源分離回路などを適用しても良い。

0057

第3の実施形態の雑音抑圧装置によっても、入力音声信号のS/N比が悪くても大きな雑音抑圧効果を奏することができる。しかも、第3の実施形態の雑音抑圧装置によれば、雑音成分が抑圧されたモノラル信号の出力音声信号を得ることができ、目的音を聴取し易くできる。

0058

(D)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。

0059

上記各実施形態では、抑圧量パラメータPL、PRの値が固定値である場合を示したが、抑圧量パラメータPL及びPRの少なくとも一方が動的に変化するものであっても良い。例えば、入力音声信号Sにおける雑音成分が多い場合には、抑圧量パラメータPL及びPRが指示する抑圧量の差を大きくし、目的音成分の定位位置と、雑音成分の定位位置とのずれを大きくするようにして人間が目的音成分を容易に認識できるようにしても良い。例えば、目的音区間雑音区間とを公知の方法で分離し、雑音区間のパワーを公知の方法で算出し、雑音区間のパワーを範囲の境界値と比較することにより、雑音成分のパワーが属する範囲を検出し、検出した範囲に対応付けられた抑圧量パラメータPL及びPRを記憶テーブルから読み出すようにして、抑圧量パラメータPL及びPRを動的に変化させるようにしても良い。

0060

上記各実施形態では、S/N比変更回路として、雑音成分を抑圧する雑音抑圧回路(101、102)を適用した場合を示したが、S/N比変更回路として、音声成分(目的音成分)を強調する音声強調回路を適用するようにしても良い。この場合、発音音声における目的音成分は、頭内の中央以外に定位するが、雑音成分の定位位置と異なるため、上述した各実施形態と同様な効果を奏することができる。

0061

また、Lチャンネル入力音声信号SL及びRチャンネル入力音声信号SRの一方に対して雑音抑圧処理を施し、Lチャンネル入力音声信号SL及びRチャンネル入力音声信号SRの他方に対して音声強調処理を施すようにしても良い。

0062

さらに、上記で説明したS/N比変更回路は、雑音成分を抑圧し、又は、目的音成分を強調してS/N比を大きくするように変更するものであったが、S/N比を小さくするようなS/N比変更回路を適用することもできる。この場合のS/N比変更回路として、音声成分を抑圧する回路や、雑音成分を強調する回路を挙げることができる。S/N比を小さくするS/N比変更回路を適用した場合も、変更度合をLチャンネルとRチャンネルとで異なるようにさせることにより、発音音声における目的音成分と雑音成分の定位位置を異なるものにでき、人間が意識することにより目的音を分離することができる。

0063

上記各実施形態においては、目的音が音声である場合を示したが、目的音が音響(例えば、機械が発した音)の場合にも本発明を適用することができる。

0064

100、200、300…雑音抑圧装置、101…Lチャンネル用雑音抑圧回路、102…Rチャンネル用雑音抑圧回路、103…時刻差検出回路、104…Lチャンネル用時刻補正回路、105…Rチャンネル用時刻補正回路、301…雑音抑圧装置本体、302…音源分離回路。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ