図面 (/)

技術 音声符号化装置及び音声復号化装置

出願人 パナソニック株式会社日本電信電話株式会社
発明者 米崎正吉田幸司佐々木茂明間野一則片岡章俊
出願日 2001年7月13日 (19年4ヶ月経過) 出願番号 2001-214428
公開日 2003年1月31日 (17年9ヶ月経過) 公開番号 2003-029790
状態 未査定
技術分野 音声の分析・合成
主要キーワード 推定スペクトル 有音検出 適応ベクトル 相関成分 重み付け和 音源生成 更新判定 雑音スペクトル
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2003年1月31日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (8)

課題

有音検出の判定結果を符号化装置から復号化装置に送信する必要のなく符号化及び復号化を行うこと。

解決手段

切替え部101は、有音検出装置104の判定結果に従って入力音声音声符号化部102または音声符号化部103に出力する。音声符号化部102は、入力信号を符号化してスペクトル情報パワー情報音源情報多重化部105に出力する。音声符号化部103は、入力信号を符号化してスペクトル情報、パワー情報、及び音源情報を多重化部105に出力する。有音検出装置104は、音声符号化部102または音声符号化部103から出力される符号化された入力信号の情報に基づいて入力信号が有音か否かを判定する。そして、有音検出装置104は、判定結果を切替え部101に出力する。

概要

背景

音声通信では、音声信号に含まれる雑音信号抑圧が重要である。この雑音信号の抑圧を行うには、音声信号と雑音信号を区別する必要がある。一般には、通信装置に音声信号と雑音信号の区別を行う有音検出装置を備えて雑音信号の抑圧を行う。

以下、従来の有音検出装置について説明する。図7は、従来の有音検出装置の構成を示すブロック図である。図7の有音検出装置10は、周波数分析部11と、特徴パラメータ抽出部12と、有音検出部13と、パワー推定部14と、SN比算出部15と、有音検出部16とから主に構成される。

周波数分析部11は、入力信号帯域分割フィルタに通して周波数帯域毎の信号にろ波する。特徴パラメータ抽出部12は、入力信号または周波数分析部11において、ろ波された入力信号を分析して一つ、または複数の特徴パラメータを抽出し、有音検出部13に出力する。有音検出部13は、特徴パラメータから有音フレームを検出してパワー推定部14に出力する。

パワー推定部14は、検出された有音のフレームと周波数帯域毎にろ波された信号から帯域毎背景雑音パワー推定する。SN比算出部15は、推定された背景雑音のパワーと周波数帯域毎にろ波された信号から帯域毎のSN(Signalto Noise)比を算出する。有音検出部16は、帯域毎に算出されたSN比から有音のフレームか否かを判定する。

このように、従来の有音検出装置は、入力された音声信号から有音検出に必要なパラメータを抽出して有音検出の判定を行っている。

概要

有音検出の判定結果を符号化装置から復号化装置に送信する必要のなく符号化及び復号化を行うこと。

切替え部101は、有音検出装置104の判定結果に従って入力音声音声符号化部102または音声符号化部103に出力する。音声符号化部102は、入力信号を符号化してスペクトル情報パワー情報音源情報多重化部105に出力する。音声符号化部103は、入力信号を符号化してスペクトル情報、パワー情報、及び音源情報を多重化部105に出力する。有音検出装置104は、音声符号化部102または音声符号化部103から出力される符号化された入力信号の情報に基づいて入力信号が有音か否かを判定する。そして、有音検出装置104は、判定結果を切替え部101に出力する。

目的

本発明はかかる点に鑑みてなされたものであり、有音検出における処理量を低減する有音検出装置、有音検出の判定結果を音声符号化装置から音声復号化装置に送信する必要のない符号化及び復号化を行うことができる音声符号化装置及び音声復号化装置を提供することを目的とする。

効果

実績

技術文献被引用数
1件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

音声信号を符号化する符号化手段と、符号化された音声信号の有音無音を検出する有音検出手段と、を具備し、前記符号化手段は、再帰的に前記判定の結果に基づいて符号化方式を決定して音声信号を符号化することを特徴とする音声符号化装置

請求項2

符号化手段は、有音検出手段の判定結果が音声成分を含む場合と、前記判定結果が音声成分を含まない場合とで異なる符号化方式を選択することを特徴とする請求項1記載の音声符号化装置。

請求項3

有音検出手段は、符号化された音声信号の音源情報に基づいて判断することを特徴とする請求項1または請求項2に記載の音声符号化装置。

請求項4

符号化された音声信号を復号する複数の復号化手段と、符号化された音声信号の有音、無音を検出する有音検出手段と、前記判定の結果に基づいて復号化された音声信号を選択して出力する切替え手段と、を具備することを特徴とする音声復号化装置

請求項5

各復号化手段は、相異なる復号化方式で復号化することを特徴とする請求項4記載の音声復号化装置。

請求項6

有音検出手段は、符号化された音声信号の音源情報に基づいて判断することを特徴とする請求項4または請求項5に記載の音声復号化装置。

請求項7

符号化側において、音声信号を符号化し、符号化した音声信号に音声成分が含まれるか否か判定し、再帰的に前記判定の結果に基づいて符号化方式を決定して音声信号を符号化し、復号化側において、前記符号化された音声信号に音声成分が含まれるか否か判定し、前記判定の結果に基づいて復号化方式を決定して符号化された音声信号を復号化する符復号方法

技術分野

0001

本発明は、音声符号化装置及び音声復号化装置に関し、特にCELP(Code-Excited Linear Prediction)型音声符号化装置及び音声復号化装置に関する。

背景技術

0002

音声通信では、音声信号に含まれる雑音信号抑圧が重要である。この雑音信号の抑圧を行うには、音声信号と雑音信号を区別する必要がある。一般には、通信装置に音声信号と雑音信号の区別を行う有音検出装置を備えて雑音信号の抑圧を行う。

0003

以下、従来の有音検出装置について説明する。図7は、従来の有音検出装置の構成を示すブロック図である。図7の有音検出装置10は、周波数分析部11と、特徴パラメータ抽出部12と、有音検出部13と、パワー推定部14と、SN比算出部15と、有音検出部16とから主に構成される。

0004

周波数分析部11は、入力信号帯域分割フィルタに通して周波数帯域毎の信号にろ波する。特徴パラメータ抽出部12は、入力信号または周波数分析部11において、ろ波された入力信号を分析して一つ、または複数の特徴パラメータを抽出し、有音検出部13に出力する。有音検出部13は、特徴パラメータから有音フレームを検出してパワー推定部14に出力する。

0005

パワー推定部14は、検出された有音のフレームと周波数帯域毎にろ波された信号から帯域毎背景雑音パワー推定する。SN比算出部15は、推定された背景雑音のパワーと周波数帯域毎にろ波された信号から帯域毎のSN(Signalto Noise)比を算出する。有音検出部16は、帯域毎に算出されたSN比から有音のフレームか否かを判定する。

0006

このように、従来の有音検出装置は、入力された音声信号から有音検出に必要なパラメータを抽出して有音検出の判定を行っている。

発明が解決しようとする課題

0007

しかしながら、従来の有音検出装置においては、入力信号を分析しパラメータ抽出するため大きな処理量を必要とする。また、音声信号が有音か無音かで異なる符号化方式を用いて符号化する場合、音声符号化装置から音声復号化装置に検出結果を送信する必要があるという問題がある。

0008

本発明はかかる点に鑑みてなされたものであり、有音検出における処理量を低減する有音検出装置、有音検出の判定結果を音声符号化装置から音声復号化装置に送信する必要のない符号化及び復号化を行うことができる音声符号化装置及び音声復号化装置を提供することを目的とする。

課題を解決するための手段

0009

本発明の音声符号化装置は、音声信号を符号化する符号化手段と、符号化された音声信号の有音、無音を検出する有音検出手段と、を具備し、前記符号化手段は、再帰的に前記判定の結果に基づいて符号化方式を決定して音声信号を符号化する構成をとる。

0010

この構成によれば、符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行い、判定結果に基づいて符号化方式を選択することにより、有音検出の判定結果を音声符号化装置から音声復号化装置に送信する必要なく符号化を行うことができる。

0011

本発明の音声符号化装置は、符号化手段は、有音検出手段の判定結果が音声成分を含む場合と、前記判定結果が音声成分を含まない場合とで異なる符号化方式を選択する構成をとる。

0012

この構成によれば、音声信号に適切な符号化を行うことができる。

0013

本発明の音声符号化装置は、有音検出手段は、符号化された音声信号の音源情報に基づいて判断する構成をとる。

0014

この構成によれば、符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行うことにより、入力信号を分析しパラメータ抽出する必要がないので、有音検出における処理量を低減することができる。

0015

本発明の音声復号化装置は、符号化された音声信号を復号する複数の復号化手段と、符号化された音声信号の有音、無音を検出する有音検出手段と、前記判定の結果に基づいて復号化された音声信号を選択して出力する切替え手段と、を具備する構成をとる。

0016

この構成によれば、符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行い、判定結果に基づいて復号化方式を選択することにより、有音検出の判定結果を音声符号化装置から音声復号化装置に送信する必要なく復号化を行うことができる。

0017

本発明の音声復号化装置は、各復号化手段は、相異なる復号化方式で復号化する構成をとる。

0018

この構成によれば、音声信号に適切な復号化を行うことができる。

0019

本発明の音声復号化装置は、有音検出手段は、符号化された音声信号の音源情報に基づいて判断する構成をとる。

0020

この構成によれば、符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行うことにより、入力信号を分析しパラメータ抽出する必要がないので、有音検出における処理量を低減することができる。

0021

本発明の符復号方法は、符号化側において、音声信号を符号化し、符号化した音声信号に音声成分が含まれるか否か判定し、再帰的に前記判定の結果に基づいて符号化方式を決定して音声信号を符号化し、復号化側において、前記符号化された音声信号に音声成分が含まれるか否か判定し、前記判定の結果に基づいて復号化方式を決定して符号化された音声信号を復号化するようにした。

0022

この方法によれば、符号化側と復号化側で個々に符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行い、判定結果に基づいて符号化方式及び復号化方式を選択することにより、有音検出の判定結果を音声符号化装置から音声復号化装置に送信する必要なく符号化及び復号化を行うことができる。

発明を実施するための最良の形態

0023

本発明の骨子は、符号化側と復号化側とで符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行い、判定結果に基づいて符号化方式及び復号化方式を選択することである。

0024

(実施の形態1)本実施の形態の音声符号化装置は、有音検出装置の判定結果に基づく符号化方法で符号化された音声信号を送信する。

0025

そして、本実施の形態の音声復号化装置は、符号化された音声信号を受信し、音声符号化装置と同じ有音検出装置を用いて有音検出の判定を行い、判定結果に基づいて復号化方法を決定する。

0026

決定された復号化方法は、音声符号化装置で選択された符号化方式に対応するものとなるので、有音復号化装置は、符号化された信号を適切に復号することができる。

0027

なお、有音とは、信号が音声成分を含むことを示し、無音とは、信号が音声成分を含まず雑音成分のみであることを示す。

0028

以下、音声信号をフレーム単位で処理する例を用いて説明する。図1は、本発明の実施の形態1に係る音声符号化装置の構成を示すブロック図である。図1の音声符号化装置100は、切替え部101と、音声符号化部102と、音声符号化部103と、有音検出装置104と、多重化部105と、送信部106とから主に構成される。

0029

また、音声符号化部102は、符号化部121と、量子化部122とから主に構成され、音声符号化部103は、符号化部131と、量子化部132とから主に構成される。符号化部121及び符号化部131は、入力信号を符号化し、量子化部122及び量子化部132は、符号化された入力信号を量子化する。

0030

図1において、切替え部101は、有音検出装置104の判定結果に従って入力音声を音声符号化部102または音声符号化部103に出力する。例えば、有音検出装置104の判定結果から先に符号化したフレームに有音が検出される場合、切替え部101は、入力信号を音声符号化部102に出力する。そして、有音検出装置104の判定結果から先に符号化したフレームに有音が検出されない場合、切替え部101は、入力信号を音声符号化部103に出力する。

0031

音声符号化部102は、入力信号を符号化してスペクトル情報パワー情報音源情報を多重化部105に出力する。音声符号化部103は、入力信号を符号化してスペクトル情報、パワー情報、及び音源情報を多重化部105に出力する。

0032

ここで、音声符号化部102と音声符号化部103は、異なる符号化方式を用いて入力信号を符号化する。例えば、音声符号化部102は、有音の入力信号に適した符号化を行い、音声符号化部103は有音ではない入力信号に適した符号化を行う。

0033

有音検出装置104は、音声符号化部102または音声符号化部103から出力される符号化された入力信号の情報、例えば、スペクトル情報、パワー情報、及び音源情報に基づいて入力信号が有音か否かを判定する。そして、有音検出装置104は、判定結果を切替え部101に出力する。

0034

多重化部105は、音声符号化部102または音声符号化部103から出力される符号化された入力信号の情報、例えば、スペクトル情報、パワー情報、及び音源情報を多重化して送信部106に出力する。送信部106は、多重化部105から出力された入力信号の情報を変調周波数変換等を行い、音声復号化装置200に送信する。

0035

次に、本実施の形態の音声復号化装置について説明する。図2は、本実施の形態に係る音声復号化装置の構成を示すブロック図である。図2の音声復号化装置200は、受信部201と、分離部202と、音声復号化部203と、音声復号化部204と、有音検出装置205と、切替え部206とから主に構成される。

0036

また、音声復号化部203は、逆量子化部231と、復号化部232とから主に構成され、音声復号化部204は、逆量子化部241と、復号化部242とから主に構成される。逆量子化部231及び逆量子化部241は、受信信号を逆量子化し、復号化部232及び復号化部242は、逆量子化された受信信号を復号する。

0037

図2において、受信部201は、音声符号化装置100から送信された信号を受信し、周波数変換、復調等を行い、受信信号を分離部202に出力する。

0038

分離部202は、受信信号をスペクトル情報、パワー情報、及び音源情報にそれぞれ分離して音声復号化部203、音声復号化部204、及び有音検出装置205に出力する。

0039

音声復号化部203は、スペクトル情報、パワー情報、及び音源情報から音声信号を復号して切替え部206に出力する。例えば、音声復号化部203は、有音の信号に適した符号化方式で処理された信号を復号化する。本実施の形態の場合、図1の音声符号化部102が用いる符号化方式で符号化された信号を復号化する。

0040

音声復号化部204は、スペクトル情報、パワー情報、及び音源情報から音声信号を復号して切替え部206に出力する。例えば、音声復号化部203は、有音ではない信号に適した符号化方式で処理信号を復号化する。本実施の形態の場合、図1の音声符号化部103が用いる符号化方式で符号化された信号を復号化する。

0041

有音検出装置205は、分離部202から出力されたスペクトル情報、パワー情報、及び音源情報から受信信号が有音か否か判定し、判定した結果を切替え部206に出力する。

0042

切替え部206は、音声復号化部203または音声復号化部204において復号された音声信号を有音検出装置205の判定結果に基づいて選択して出力する。具体的には、切替え部206は、先に受信した信号が有音であると判定した場合、音声復号化部203において復号された音声信号を出力する。また、先に受信した信号が有音であると判定した場合、音声復号化部203において復号された音声信号を出力する。

0043

次に、音声符号化装置100と音声復号化装置200の信号処理について説明する。図3は、本実施の形態の音声符号化装置と音声復号化装置のやり取りの一例を示すシーケンス図である。

0044

音声符号化装置100は、音声信号のスペクトル情報、パワー情報、及び音源情報から有音検出の判定を行い、次に送信する音声信号の符号化方式選択に判定の結果を用いる。そして、音声復号化装置200も、受信した音声信号のスペクトル情報、パワー情報、及び音源情報から有音検出の判定を行い、次に受信する音声信号の復号化方式選択に判定の結果を用いる。

0045

以下、送信する音声信号に有音が検出された場合に用いる符号化方式をA、有音が検出されなかった場合に用いる符号化方式をBとして説明する。また、最初に送信する音声信号の符号化方式をAとする。

0046

最初に、時刻T301では、送信する音声信号S302の符号化方式を予め決定しておいた方式で符号化して送信する。ここでは、音声符号化装置100は、時刻T301において音声信号S302をA方式で符号化して音声復号化装置200に送信する。そして、音声信号S302をA方式で符号化した結果得られるスペクトル情報、パワー情報、及び音源情報から有音検出の判定を行い、次に受信する音声信号の符号化方式選択に判定の結果を用いる。時刻T301での、符号化した音声信号S302を有音検出の判定結果を無音とする。

0047

音声復号化装置200は、音声信号S302を受信し、A方式で復号する。また、音声復号化装置200は、受信した音声信号に含まれるスペクトル情報、パワー情報、及び音源情報から有音検出の判定を行い、次に受信する音声信号の復号化方式選択に判定の結果を用いる。

0048

受信した音声信号に含まれるスペクトル情報、パワー情報、及び音源情報は、音声符号化装置100において量子化されているので、連続した値と異なり伝送中に誤る率が少ない。また、誤りが発生した場合でも誤り訂正を行うことにより正しい値に補正することもできる。

0049

時刻T311において、音声符号化装置100は、時刻T301での判定結果に従って符号化方式を選択し、送信する音声信号S312を符号化して送信する。ここでは、時刻T301での判定結果が無音なので音声信号S312をB方式で符号化して送信する。

0050

時刻T313において、音声復号化装置200は、時刻T303での判定結果に従い、音声信号S312をB方式で復号する。

0051

以降同様に、音声符号化装置100は、過去に符号化した音声信号の有音検出の判定結果に基づいて符号化方式を選択し、符号化した音声信号を送信する。そして、音声復号化装置200は、過去に受信した音声信号の有音検出の判定結果に基づいて復号化方式を選択し、音声信号を復号する。

0052

符号化された音声信号は、スペクトル情報、パワー情報、及び音源情報等の量子化したパラメータとして送信されるので、送信側と受信側でこれらの量子化したパラメータを用いて有音検出の判定を行う場合、送信側と受信側で同じ判定結果が得られる。

0053

このように、本実施の形態の音声符号化装置によれば、符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行い、判定結果に基づいて符号化方式を選択することにより、有音検出の判定結果を音声符号化装置から音声復号化装置に送信する必要なく符号化を行うことができる。

0054

また、本実施の形態の音声復号化装置によれば、符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行い、判定結果に基づいて復号化方式を選択することにより、有音検出の判定結果を音声符号化装置から音声復号化装置に送信する必要なく復号化を行うことができる。

0055

(実施の形態2)本発明の実施の形態2では、図1の音声符号化装置100がそなえる有音検出装置104及び図2の音声復号化装置200が備える有音検出装置205について説明する。図4は、本発明の実施の形態2に係る有音検出装置の構成を示すブロック図である。図4の有音検出装置104、205は、入力信号をフレーム単位で有音または無音であるか判定する。

0056

ここで、有音とは入力信号に音声が含まれている状態を示し、無音とは、入力信号に音声が含まれてない状態を示す。この有音検出装置104、205は、入力したフレームのスペクトル情報と、パワー情報と、音源情報とから有音であるか無音であるかを判定する。

0057

図4において、有音検出装置104、205は、音源比率算出部401と、有音検出部402と、推定スペクトル更新部403と、スペクトル情報距離算出部404と、有音検出部405と、パワー推定部406と、SN比算出部407と、有音検出部408と、更新判定部409とから主に構成される。

0058

音源比率算出部401は、音源情報から音源生成における音声信号と符号帳登録された信号波形相関成分寄与率を算出して有音検出部402に出力する。例えば、CELP(Code-Excited Linear Prediction)型音声合成モデルでは、相関成分を表す適応ベクトル相関のない信号を生成する雑音ベクトルとの重み付け和で音源情報を生成する。そして、寄与率は、以下に示す式(1)より算出される。
ID=000003HE=015 WI=096 LX=0570 LY=1500
ここで、ratioは、寄与率を示し、energyACは、適応ベクトルエネルギー、energySCは、雑音ベクトルエネルギーを示す。

0059

有音検出部402は、音源比率算出部401において算出された相関成分の寄与率より有音と判定されたフレームを推定スペクトル更新部403、パワー推定部406、及び更新判定部409に出力する。具体的には、有音検出部402は、相関成分の寄与率が所定の閾値以上であるフレームを有音と判定する。

0060

推定スペクトル更新部403は、雑音スペクトルの情報を記憶し、後述する更新判定部409の判定結果に従って、雑音スペクトルの情報を更新する。そして、推定スペクトル更新部403は、雑音スペクトルの情報をスペクトル情報距離算出部404に出力する。

0061

スペクトル情報距離算出部404は、有音判定を行う現フレームのスペクトル情報と、推定スペクトル更新部403に記憶された推定雑音スペクトルの情報からスペクトル間距離を算出して有音検出部405に出力する。

0062

具体的には、スペクトル情報距離算出部404は、スペクトル情報として線スペクトル対(LSP:Line Spectrum Pair)を用い、以下に示す式(2)よりスペクトル間距離を算出する。
ID=000004HE=015 WI=093 LX=0585 LY=2250
ここで、distは、スペクトル間距離、LSPcurrentは、現フレームの線スペクトル対、そしてLSPnoiseは、雑音スペクトルの線スペクトル対を示す。また、Pは、LSPパラメータ次数を示す。

0063

有音検出部405は、有音検出を行うフレームのスペクトルと、推定雑音スペクトル情報とのスペクトル間距離から有音と判定したフレーをパワー推定部406に出力する。具体的には、有音検出部405は、スペクトル間距離distが所定の閾値以上であるフレームを有音と判定する。

0064

パワー推定部406は、音源情報による有音検出結果と、スペクトル情報による有音検出結果とに基づいて雑音成分のパワーを推定する。そして、パワー推定部406は、雑音成分のパワーの推定結果をSN比算出部407に出力する。

0065

SN比算出部407は、雑音パワーの推定結果と、現フレームのパワーからSN比を算出して、有音検出部408に出力する。具体的には、SN比算出部407は、現フレームのパワーをパワー推定部406において推定された雑音パワーで除算してSN比を算出する。

0066

有音検出部408は、SN比算出部407において算出されたSN比から現フレームが有音か無音かを判定する。具体的には、有音検出部408は、SN比が所定の閾値以上である場合、現フレームが有音のフレームであると判定する。そして、有音検出部408は、判定結果を更新判定部409に出力する。

0067

更新判定部409は、音源情報による有音検出結果と、SN比による有音検出結果とから雑音スペクトル情報を更新するか否かを判定し、判定結果を推定スペクトル更新部403に出力する。

0068

次に、雑音成分のパワーの算出について説明する。図5は、本実施の形態の有音検出装置の動作の一例を示すフロー図である。図5では、有音検出の結果に適応して雑音成分のパワーを推定する例について説明する。

0069

テップ(以下「ST」と言う)501では、有音検出部402が、音源情報に基づいてフレームに有音が検出されるか否か判定する。有音が検出されない場合、ST502に進み、スペクトル情報に基づく有音検出の判定処理を行う。また、有音が検出される場合、ST503に進む。

0070

ST502では、有音検出部405が、スペクトル情報に基づいてフレームに有音が検出されるか否か判定する。有音が検出されない場合、ST504に進み、雑音パワーの変動測定処理を行う。また、有音が検出される場合、ST503に進む。

0071

ST503では、パワー推定部406が、現フレームを用いて雑音パワーを推定せず、雑音パワーの情報を更新せずに、過去に推定した雑音パワーの情報を保持する。

0072

ST504では、パワー推定部406が、現フレームのパワーと雑音スペクトルのパワーの差が所定の閾値より大きいか判定する。現フレームのパワーと雑音スペクトルのパワーの差が所定の閾値より大きい場合、ST505では、パワー推定部406が、以下に示す式(3)を用いて雑音パワーの情報を更新する。
ID=000005HE=010 WI=091 LX=0595 LY=1350
ここで、式(3)は、右辺計算結果左辺代入することを示す。左辺のgainnoiseは、更新した結果の雑音パワーを示し、右辺のgainnoiseは、過去に推定した雑音パワーを示す。また、右辺のgaincurrentは、現フレームのパワーを示す。

0073

ST506では、パワー推定部406が、以下に示す式(4)を用いて雑音パワーの情報を更新する。
ID=000006HE=010 WI=093 LX=0585 LY=1650
このように、パワー推定部406は、有音検出の判定結果と、雑音スペクトルの変動に適応した係数で雑音パワーに重み付けして加算し、雑音スペクトルのパワー情報を更新する。

0074

次に、雑音スペクトルの情報更新について説明する。図6は、本実施の形態の有音検出装置の動作の一例を示すフロー図である。図6では、有音検出の結果に適応して雑音スペクトルの情報を更新する例について説明する。

0075

ST601では、有音検出部408が、SN比に基づいてフレームに有音が検出されるか否か判定する。有音が検出される場合、ST602に進み、音源情報に基づく有音検出の判定処理を行う。また、有音が検出されない場合、ST605に進む。

0076

ST602では、有音検出部402が、音源情報に基づいてフレームに有音が検出されるか否か判定する。有音が検出される場合、ST603に進む。また、有音が検出されない場合、ST604に進む。

0077

ST603では、更新判定部409が、SN比に基づく判定結果と音源情報に基づく判定結果から、現フレームを用いて雑音スペクトルを更新せず、過去の雑音スペクトルの情報を保持することを推定スペクトル更新部403に指示する。

0078

ST604では、更新判定部409が、SN比に基づく判定結果と音源情報に基づく判定結果から、以下に示す式(5)を用いてスペクトルの更新を行う。
ID=000007HE=010 WI=091 LX=0595 LY=2450
ここで、式(3)は、右辺の計算結果を左辺に代入することを示す。左辺のLSPnoiseは、更新した結果の雑音成分の線スペクトル対を示し、右辺のLSPnoiseは、過去に推定した雑音成分の線スペクトル対を示す。また、右辺のLSPcurrentは、現フレームの線スペクトル対を示す。

0079

ST605では、更新判定部409が、SN比に基づく判定結果と音源情報に基づく判定結果から、以下に示す式(6)を用いてスペクトルの更新を行う。
ID=000008HE=010 WI=090 LX=0600 LY=0300
以上、更新判定部409は、有音検出の判定結果に適応した係数で雑音スペクトルに現スペクトルを重み付けして加算し、雑音スペクトルの情報を更新する。

0080

このように、本実施の形態の有音検出装置によれば、符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行うことにより、入力信号を分析しパラメータ抽出する必要がないので、有音検出における処理量を低減することができる。

0081

なお、本発明では、有音と無音の判定結果でデータの音声符号化を切替えているが、音声符号化切替えを行うデータの範囲は限定されず、データの一部について音声符号化方式を切替えても良い。また、本発明は上記実施の形態に限定されず、種々変更して実施することが可能である。

発明の効果

0082

以上説明したように、本発明の音声符号化装置及び音声復号化装置によれば、符号化側と復号化側で個々に符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行い、判定結果に基づいて符号化方式及び復号化方式を選択することにより、有音検出の判定結果を音声符号化装置から音声復号化装置に送信する必要なく符号化及び復号化を行うことができる。また、本発明の有音検出装置によれば、符号化した結果得られる量子化されたパラメータを用いて有音検出の判定を行うことにより、入力信号を分析しパラメータ抽出する必要がないので、有音検出における処理量を低減することができる。

図面の簡単な説明

0083

図1本発明の実施の形態1に係る音声符号化装置の構成を示すブロック図
図2上記実施の形態に係る音声復号化装置の構成を示すブロック図
図3上記実施の形態の音声符号化装置と音声復号化装置のやり取りの一例を示すシーケンス図
図4本発明の実施の形態2に係る有音検出装置の構成を示すブロック図
図5上記実施の形態に係る有音検出装置の動作の一例を示すフロー図
図6上記実施の形態に係る有音検出装置の動作の一例を示すフロー図
図7従来の有音検出装置の構成を示すブロック図

--

0084

101、206切替え部
102、103音声符号化部
104、205有音検出装置
105多重化部
121、131 符号化部
122、132量子化部
202 分離部
203、204音声復号化部
231、241逆量子化部
232、242復号化部
401音源比率算出部
402、405、408 有音検出部
403推定スペクトル更新部
404スペクトル情報距離算出部
406パワー推定部
407SN比算出部
409更新判定部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ