図面 (/)

技術 量子化装置、逆量子化装置及び量子化逆量子化装置

出願人 三菱電機株式会社
発明者 古田訓
出願日 1997年12月25日 (22年10ヶ月経過) 出願番号 1997-356518
公開日 1998年11月24日 (21年11ヶ月経過) 公開番号 1998-313250
状態 未査定
技術分野 圧縮、伸長・符号変換及びデコーダ
主要キーワード 総セグメント数 ピッチ計算 パワーコード 極大極小 余剰情報 パラメータ変化量 周辺フレーム 選択個数
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1998年11月24日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (14)

課題

入力信号変動特性、即ち、入力信号の過渡部や定常部の特徴に応じた情報量を最適配分して量子化すると共に、トータル伝送情報量が制限された蓄積用途の音声符号化に最適な量子化、逆量子化、量子化逆量子化を実現する。

解決手段

入力信号の様々な性質に対応した複数の量子化手段およびコードブックの中から、区間内の極値呼応する入力信号には優先して量子化歪が小さくなる量子化手段およびコードブックを選択するとともに、極値以外の部分の量子化手段およびコードブックを決定し、選択された量子化手段およびコードブックを用いて入力信号を量子化し、区間長と、極値の位置と個数と、選択された量子化手段およびコードブックを指定する選択コードとを出力する。

概要

背景

従来、音声信号画像信号を非常に低いビットレートで効率の良い符号化を行うために、様々な量子化逆量子化方法が提案されており、その一技術として入力信号定常部過渡部などの変動特徴に応じて伝送レートを変化させる可変レート方式がある。ここで述べる定常部とは、例えば入力信号が音声信号の場合、母音部分などのように入力信号が時間に対して緩やかに変化する部分で音声の自然性(静的特徴)をつかさどるものであり、また、過渡部とは同様に子音から母音へ移行するような入力信号の時間に対する変化が激しい部分を指している。以下、定常部及び過渡部とは上記の意味を指し示すものとする。

特開平1−233499号公報には、音声信号をマルチパルス符号化復号化する際に、音声信号の定常部と過渡部に応じて入力音声セグメンテーションを行い、可変長セグメント単位で量子化することによりビットレートを変化させて、品質劣化させずにビットレートを低減させた量子化逆量子化装置について開示されている。

図12に、この音声符号化復号化装置で用いられている音韻情報の量子化部分の構成を示す。図中1は入力端子、2はセグメンテーション尺度計算部、3はセグメンテーション部、4はLPC(Linear Predictive Coding)分析部、5はLPC係数マトリクスベクトル量子化部、6はピッチ計算部、7は判定部、8はマトリクス/ベクトル選択部、9はマトリクスコードブック、10はベクトルコードブック、11はセグメンテーションされた音声信号、12はセグメンテーション情報、13はLPC係数、14はピッチ周期T、15は判別情報、16はLPC係数符号、17はセグメンテーション尺度、18は重み付け部、19はマトリクス/ベクトル復号部、20はインパルス応答計算部、21は自己相関関数計算部、22は相互相関関数計算部、23はピッチ復号部、24は音源パルス計算部、25は量子化部である。

以下、この従来の音声信号符号化復号化装置の音韻情報量子化部分について説明する。入力端子1より離散的な音声信号を入力し、セグメンテーション尺度計算部2は、後述する動的尺度を用いてセグメンテーション尺度17を計算する。セグメンテーション部3は、セグメンテーション尺度17を入力して音声信号をセグメンテーションし、セグメンテーション区間の長さを表すセグメンテーション情報12と、セグメンテーションされた音声信号11を出力する。上記セグメンテーションには、後述する動的尺度の極大値付近を除き、動的尺度がある程度連続的に予め定められた閾値より小さくなる箇所で行う。LPC分析部4は、セグメンテーションされた区間全体又は一部分の音声信号の分析を行いLPC係数13を算出し、LPC係数マトリクス/ベクトル量子化部5へ出力する。

上記セグメンテーションにおける尺度としてケプストラム動的尺度を用いている。これは「音声の動的尺度に含まれる個人性情報」(嵯峨山茂樹、板倉文忠著、日本音響学会講演論文集、3−2−7、昭和54年6月(以下、文献1と呼ぶ))で説明されており、音声の定常部や過渡部を効率良く抽出する指標として、音声ラベリングやセグメンテーションなどによく用いられている。

ピッチ計算部6は、セグメンテーションされた音声信号11に対して、自己相関法よりピッチ周期T 14、ピッチゲインPg を計算する。判別部はピッチゲインPg の値を用いて上記セグメンテーション区間の音声信号が定常部か否かを判別し、判別情報15を出力する。

マトリクス/ベクトル量子化部5は、LPC係数13のベクトル量子化又はマトリクス量子化を行う。このマトリクス/ベクトル量子化部5は、入力音声の特徴に応じた複数種類コードブックを持っており、上記セグメンテーションされた音声信号区間が定常部である場合には時間・周波数方向相関が強いので、これを利用して、上記セグメントにおける伝送情報量を削減するためにマトリクスコードブック9を使用しマトリクス量子化を行う。その他の区間では、判別情報15を用いて入力音声の状態に適したコードブックをベクトルコードブック10から選択してベクトル量子化を行い、LPC係数符号16を出力する。

次に、この音声符合復号化装置音源情報量子化部分について説明する。重み付け部18は、セグメンテーションされた音声信号11に、マトリクス/ベクトル復号部19で復号化されたLPC係数を用いて音声信号に重み付けを施す。インパルス応答計算部20は、復号化されたLPC係数を用いてインパルス応答を計算する。自己相関関数計算部21は、インパルス応答の自己相関係数を計算し、音源パルス計算部24へ出力する。相互相関関数計算部22は、重み付けられた信号とインパルス応答との相互相関関数を計算して音源パルス計算部24へ出力する。ピッチ復号部23は、ピッチ周期T 14を復号して音源パルス計算部24へ出力する。

音源パルス計算部24は、セグメンテーションされた区間が母音定常部の場合は、上記区間をピッチ周期毎のサブフレームに分割して中央付近のサブフレーム区間について音源パルス列を計算する。母音定常部でない場合には、上記区間全体に対して音源パルス列を計算する。音源パルス量子化部25は音源パルス列の振幅・位置を所定のビット数で量子化する。

また、特開昭64−53642号公報には、音声の復号化における優先度の高い順に符号化データを並べ替え、上記優先度の高い順に伝送ビットレートに応じたデータ量だけ符号化データを送出する可変レート音声符号化復号化装置が開示されている。

図13には、この可変レート音声符号化装置の構成を示す。図中200はディジタル音声信号、201は符号化ユニット、202はデータ列S2 、203はデータスチーラ、204はデータ列S3 、205は符号化音声信号、206はデータフィラー、207はデータ列S4 、208は復号化ユニット、209は復号音声信号である。

以下、この従来の可変レート音声符号化復号化装置について説明する。離散時間でサンプリングされた音声信号がディジタル音声信号200として符号化ユニット201に入力され、例えば20〔ms〕の所定期間内に入力されるNサンプル分の上記音声信号200から入力音声の特徴を抽出し、複数のパラメータからなる符号化データに変換する。続いて符号化ユニット201は、上記符号化データを構成するパラメータ又は各パラメータを構成するビットを、音質に与える影響の高い順に並べ替える。この並べ替えルールデータ要素下位部分を削除しても音質劣化が少ないようにするものである。並び替えた後、データ要素C1 ,……,CM からなる長さMのデータ列S2 202を出力し、伝送データ制御用のビットスチーラ203に入力する。ビットスチーラ203は、ビットレート制御信号で指示された伝送レートに従い、データ列S2 202から長さM′を超える部分は削除した後、先頭から長さM′のデータ列S3 204を伝送路に送出する。

一方、伝送路を介して受信された符号化音声信号205は、ビットフィラー206に入力され、送信時にビットレート制御信号によって削除されたデータ列S3 204の下位ビット部分に■0■を充填した形のデータ列S4 207に変換された後、復号化ユニット208に入力される。復号化ユニット208はデータ列S4 207から音声信号の各パラメータを抽出し、これらのパラメータに基づいて音声を復号化し、復号音声信号209を得る。

そのほかの効率の良い量子化方法を実現する一手法として、「音声のスペクトル補間符号化のための基準フレーム性質」(橋本渡、赤木正人著、日本音響学会講演論文集、3−6−18、平成8年9月(以下、文献2と呼ぶ))に開示されたものがある。文献2は、音声のスペクトル補間符号化における品質を保つための必要最小限度の基準フレームの選択方法とその個数について説明しており、文献2にて提唱されている動的尺度を導入し、品質を保つためには上記動的尺度の極値部分を基準フレームにすればよいと述べている。

概要

入力信号の変動特性、即ち、入力信号の過渡部や定常部の特徴に応じた情報量を最適配分して量子化すると共に、トータル伝送情報量が制限された蓄積用途の音声符号化に最適な量子化、逆量子化、量子化逆量子化を実現する。

入力信号の様々な性質に対応した複数の量子化手段およびコードブックの中から、区間内の極値に呼応する入力信号には優先して量子化歪が小さくなる量子化手段およびコードブックを選択するとともに、極値以外の部分の量子化手段およびコードブックを決定し、選択された量子化手段およびコードブックを用いて入力信号を量子化し、区間長と、極値の位置と個数と、選択された量子化手段およびコードブックを指定する選択コードとを出力する。

目的

本発明は以上の課題を解決するためになされたもので、入力信号の変動特性、即ち、入力信号の過渡部や定常部の特徴に応じた情報量を最適配分して量子化することの可能な高能率量子化装置又は逆量子化装置又は量子化逆量子化装置を提供することである。また、本発明の目的は、トータル伝送情報量が制限された蓄積用途の音声符号化に最適な量子化装置又は逆量子化装置又は量子化逆量子化装置を提供することである。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

入力信号系列の全区間又は一部区間伝送可能なトータル伝送情報量が定められており、前記入力信号系列の全区間又は一部区間より抽出した入力信号特徴パラメータの時間及び周波数変動量系列を算出し、前記区間内における特徴パラメータ変動量系列の極値を抽出して前記極値の位置及び個数を出力し、前記トータル伝送情報量と、前記区間長と、前記極値及び前記極値以外の部分の入力信号を量子化するのに必要な情報量とを案して、入力信号の様々な性質に対応した複数の量子化手段及びコードブックの中から、前記区間内の極値に呼応する入力信号には優先して量子化歪が小さくなる量子化手段及びコードブックを選択すると共に、前記極値以外の部分の前記量子化手段及びコードブックを決定し、前記選択された量子化手段及びコードブックを用いて前記入力信号を量子化し、前記区間長と、前記極値の位置及び個数と、前記選択された量子化手段及びコードブックを指定する選択コードとを出力することを特徴とする量子化装置

請求項2

復号信号区間長と、復号信号の特徴パラメータ変動量極値の位置及び個数と、前記選択コードで指定された逆量子化手段及びコードブックとを用いて復号信号の逆量子化を行い、復号信号を出力することを特徴とする逆量子化装置

請求項3

入力信号系列の全区間又は一部区間で伝送可能なトータル伝送情報量が定められており、符号化側では、前記入力信号系列の全区間又は一部区間より抽出した入力信号の特徴パラメータの時間及び周波数変動量系列を算出し、前記区間内における特徴パラメータ変動量系列の極値を抽出して前記極値の位置及び個数を出力し、前記トータル伝送情報量と、前記区間長と、前記極値及び前記極値以外の部分の入力信号を量子化するのに必要な情報量とを勘案して、入力信号の様々な性質に対応した複数の量子化手段及びコードブックの中から、前記区間内の極値に呼応する入力信号には優先して量子化歪が小さくなる量子化手段及びコードブックを選択すると共に、前記極値以外の部分の前記量子化手段及びコードブックを決定し、前記選択された量子化手段及びコードブックを用いて前記入力信号を量子化し、前記区間長と、前記極値の位置及び個数と、前記選択された量子化手段及びコードブックを指定する選択コードとを送出し復号化側では、前記送出された区間長と、極値の位置及び個数と、前記選択コードで指定された逆量子化手段及びコードブックとを用いて前記量子化された入力信号の逆量子化を行い、復号信号を出力することを特徴とする量子化逆量子化装置。

請求項4

各々極値に呼応する前記入力信号の量子化手段及びコードブック、極値以外の部分の量子化手段及びコードブックを決定した後、トータル伝送情報量を勘案してまだ余裕がある場合、極値近傍を極値と見なして量子化手段及びコードブックを再決定することを特徴とする請求項1に記載の量子化装置又は請求項3に記載の量子化逆量子化装置。

請求項5

各々極値に呼応する前記入力信号の量子化手段及びコードブック、極値以外の部分の量子化手段及びコードブックの選択案を数種類設定し、前記複数の選択案に各々従って前記入力信号を量子化し、最も量子化歪が小さくなるものを選択することを特徴とする請求頁1に記載の量子化装置又は請求頁3に記載の量子化逆量子化装置。

請求項6

入力信号系列の全区間又は一部区間で伝送可能なトータル伝送情報量が定められており、前記入力信号系列の全区間又は一部区間より抽出した入力信号の特徴パラメータの時間及び周波数変動量系列を算出し、前記区間内における特徴パラメータ変動量系列の極値を抽出し、前記変動量の極値を極大値極小値に分離し、前記トータル伝送情報量と、前記区間長と、前記極値及び前記極値以外の部分の入力信号を量子化するのに必要な情報量とを勘案して、極大値はその地点での前記特徴パラメータ変動量が大きい順、極小値はその地点での前記特徴パラメータ変動量の小さい順に極大値、極小値を選択し、前記選択した極大値及び極小値の位置及び個数を出力し、入力信号の様々な性質に対応した複数の量子化手段及びコードブックの中から、前記区間内の極大値及び極小値に呼応する入力信号には、極大値及び極小値が選択された順序に従って優先して量子化歪が小さくなる量子化手段及びコードブックを選択すると共に、前記極値以外の部分の前記量子化手段及びコードブックを決定し、前記選択された量子化手段及びコードブックを用いて前記入力信号を量子化し、前記区間長と、前記極大値及び極小値の位置及び個数と、前記選択された量子化手段及びコードブックを指定する選択コードとを出力することを特徴とする量子化装置。

請求項7

復号区間長と、復号信号の特徴パラメータ変動量極大値及び同極小値に対応する位置及び個数と、選択コードに指定された逆量子化手段及びコードブックとを用いて復号信号の逆量子化を行い、復号信号を出力することを特徴とする逆量子化装置。

請求項8

入力信号系列の全区間又は一部区間で伝送可能なトータル伝送情報量が定められており、符号化側では、前記入力信号系列の全区間又は一部区間より抽出した入力信号の特徴パラメータの時間及び周波数変動量系列を算出し、前記区間内における特徴パラメータ変動量系列の極値を抽出し、前記変動量の極値を極大値と極小値に分離し、前記トータル伝送情報量と、前記区間長と、前記極値及び前記極値以外の部分の入力信号を量子化するのに必要な情報量とを勘案して、極大値はその地点での前記特徴パラメータ変動量が大きい順、極小値はその地点での前記特徴パラメータ変動量の小さい順に極大値、極小値を選択し、前記選択した極大値及び極小値の位置及び個数を出力し、入力信号の様々な性質に対応した複数の量子化手段及びコードブックの中から、前記区間内の極大値及び極小値に呼応する入力信号には、極大値及び極小値が選択された順序に従って優先して量子化歪が小さくなる量子化手段及びコードブックを選択すると共に、前記極値以外の部分の前記量子化手段及びコードブックを決定し、前記選択された量子化手段及びコードブックを用いて前記入力信号を量子化し、前記区間長と、前記極大値及び極小値の位置及び個数と、前記選択された量子化手段及びコードブックを指定する選択コードとを送出し、復号化側では、前記送出された区間長、極大値及び極小値の位置及び個数と、選択コードに指定された逆量子化手段及びコードブックとを用いて前記量子化された入力信号の逆量子化を行い、復号信号を出力することを特徴とする量子化逆量子化装置。

請求項9

並び替えた極大値順列及び極小値順列の上位より極大値、極小値を選択し、各々極値に呼応する前記入力信号の量子化手段及びコードブック、極値以外の部分の量子化手段及びコードブックを決定した後、トータル伝送情報量を勘案してまだ余裕がある場合、極大値近傍を極大値と見なして量子化手段及びコードブックを再決定することを特徴とする請求項6に記載の量子化装置又は請求項8に記載の量子化逆量子化装置。

請求項10

極大値及び極小値の選択個数と、前記選択対象となった極大値及び極小値に呼応する前記入力信号の量子化手段及びコードブックと、極値以外の部分の量子化手段及びコードブックの選択案を数種類設定し、前記複数の選択案に各々に従って前記入力信号を量子化し、最も量子化歪が小さくなるものを選択することを特徴とする請求項6に記載の量子化装置又は請求項8に記載の量子化逆量子化装置。

請求項11

極大及び極小部分の候補がトータル伝送情報量に比較して過剰な場合、極小値の候補のうち低優先度の候補を削除し、当該削除分を極大値の候補とすることを特徴とする請求項6に記載の量子化装置又は請求項8に記載の量子化逆量子化装置。

請求項12

極大値に呼応する入力信号は、時間方向に細かく分析できるように入力信号分析手段を切り替え再分析を行い、前記入力信号分析手段にて求めた特徴パラメータの量子化歪が小さくなるように量子化に要する情報量を決定することを特徴とする請求項6に記載の量子化装置又は請求項8に記載の量子化逆量子化装置。

請求項13

極小値に呼応する入力信号は、周波数方向に精密に分析できるように入力信号分析手段を切り替えて再分析を行い、前記入力信号分析手段にて求めた特徴パラメータの量子化歪が小さくなるように量子化に要する情報量を決定することを特徴とする請求項6に記載の量子化装置又は請求項8に記載の量子化逆量子化装置。

請求項14

極大値に呼応する入力信号は、時間方向に細かく分析できるように入力信号分析手段を切り替えて再分析を行い、前記入力信号分析手段にて求めた特徴パラメータの量子化歪が小さくなるように量子化に要する情報量を決定した上で量子化を行い、極値以外の部分に呼応する入力信号については、極大値、極小値の各々に呼応する量子化後の入力信号で補間又は置換することを特徴とする請求項6に記載の量子化装置又は請求項8に記載の量子化逆量子化装置。

請求項15

極小値に呼応する入力信号は、周波数方向に精密に分析できるように入力信号分析手段を切り替えて再分析を行い、前記入力信号分析手段にて求めた特徴パラメータの量子化歪が小さくなるように量子化に要する情報量を決定した上で量子化を行い、極値以外の部分に呼応する入力信号については、極大値、極小値の各々に呼応する量子化後の入力信号で補間又は置換することを特徴とする請求項6に記載の量子化装置又は請求項8に記載の量子化逆量子化装置。

請求項16

入力音声フレーム単位スペクトル包絡情報音源情報に分離して量子化する量子化装置において、前記入力音声信号系列の全フレーム又は一部の複数フレームで伝送可能なトータル伝送情報量が定められており、前記入力音声信号系列の全フレーム又は一部の複数フレームより抽出した入力音声の特徴パラメータの時間及び周波数変動量系列を算出し、前記フレームにおける特徴パラメータ変動量系列の極値を抽出して極値をとるフレームの位置及び個数を出力し、前記トータル伝送情報量と、前記フレーム数と、前記極値及び前記極値以外の部分の入力音声信号を量子化するのに必要な情報量とを勘案して、入力音声信号の様々な性質に対応した複数の音源コードブックの中から、前記フレーム内の極値に呼応するフレームには優先して復号時の歪が小さくなる音源コードブックを選択すると共に、前記極値以外のフレームの音源コードブックを決定し、前記選択された音源コードブックを用いて前記入力音声信号の音源情報を量子化し、前記フレーム数と、前記極値をとるフレームの位置及び個数と、前記選択された前記音源コードブックを指定する音源コードブック選択コードとを出力することを特徴とする量子化装置。

請求項17

フレーム単位で量子化された音声信号を逆量子化して出力音声を生成する逆量子化装置において、復号音声信号フレーム数と、復号音声信号の特徴パラメータ変動量の極値をとるフレーム位置及び個数と、音源コードブック選択コードで指定された音源コードブックとを用いて復号音声の逆量子化を行い、復号音声を出力することを特徴とする逆量子化装置。

請求項18

入力音声をフレーム単位でスペクトル包絡情報と音源情報に分離して量子化し、前記量子化された入力音声を逆量子化して出力音声を生成する量子化逆量子化装置において、入力音声信号系列の全フレーム又は一部の複数フレームで伝送可能なトータル伝送情報量が定められており、符号化側では、前記入力信号系列の全フレーム又は一部の複数フレームより抽出した入力音声の特徴パラメータの時間及び周波数変動量系列を算出し、前記フレーム内における特徴パラメータ変動量系列の極値を抽出して極値をとるフレーム位置及び個数を出力し、前記トータル伝送情報量と、前記フレーム数と、前記極値及び前記極値以外の部分の入力音声信号を量子化するのに必要な情報量とを勘案して、入力音声信号の様々な性質に対応した複数の音源コードブックの中から、前記フレーム内の極値に呼応するフレームには優先して復号時の歪が小さくなる音源コードブックを選択すると共に、前記極値以外のフレームの音源コードブックを決定し、前記選択された音源コードブックを用いて前記入力音声信号の音源情報を量子化し、前記フレーム数と、前記極値をとるフレーム位置及び個数と、前記選択された音源コードブックを指定する音源コードブック選択コードとを送出し、復号化側では、前記送出されたフレーム数と、極値をとるフレーム位置及び個数と、前記音源コードブック選択コードで指定された音源コードブックとを用いて入力音声信号の逆量子化を行い、復号音声を出力することを特徴とする量子化逆量子化装置。

請求項19

各々極値に呼応するフレームの音源コードブック、極値以外のフレームの音源コードブックを決定した後、トータル伝送情報量を勘案してまだ余裕がある場合、極値近傍を極値と見なして音源コードブックを再決定することを特徴とする請求項16に記載の量子化装置又は請求項18に記載の量子化逆量子化装置。

請求項20

各々極値に呼応するフレームの音源コードブックと、極値以外のフレームの音源コードブックの選択案を数種類設定し、前記複数の選択案に各々従って音源情報を量子化し、復号時の歪が最も小さくなる音源コードブックを選択することを特徴とする請求項16に記載の量子化装置又は請求項18に記載の量子化逆量子化装置。

請求項21

入力音声をフレーム単位でスペクトル包絡情報と音源情報に分離して量子化する量子化装置において、入力音声信号系列の全フレーム又は一部の複数フレームで伝送可能なトータル伝送情報量が定められており、前記入力音声信号系列の全フレーム又は一部フレームより抽出した入力音声の特徴パラメータの時間及び周波数変動量系列を算出し、前記フレーム内における変動量系列の極値を抽出し、前記変動量の極値を極大値と極小値に分離し、前記トータル伝送情報量と、前記フレーム数と、前記極値及び前記極値以外の部分の入力音声信号を量子化するのに必要な情報量とを勘案して、極大値はその地点での前記特徴パラメータ変動量が大きい順、極小値はその地点での前記特徴パラメータ変動量の小さい順に極大値、極小値を選択し、前記選択した極大値及び極小値の各々フレーム位置及び個数を出力し、入力音声信号の様々な性質に対応した複数の音源コードブックの中から、前記フレーム内の極大値及び極小値に呼応するフレームには極大値及び極小値が選択された順序に従って優先して復号時の歪が小さくなる音源コードブックを選択すると共に、前記極値以外のフレームの音源コードブックを決定し、前記選択された音源コードブックを用いて前記入力音声信号の音源情報を量子化し、前記フレーム数と、前記極大値及び極小値をとるフレーム位置及び個数と、前記選択された音源コードブックを指定する音源コードブック選択コードと、前記入力音声信号の入力音声信号コードとを出力することを特徴とする量子化装置。

請求項22

フレーム単位で量子化された音声信号を逆量子化して出力音声を生成する逆量子化装置において、復号フレーム数と、復号音声信号の特徴パラメータ変動量極大値及び同極小値に対応するフレーム位置及びフレームの個数と、音源コードブックを指定する音源コードブック選択コードとを入力し、前記極大値及び極小値の位置及び個数と、前記音源コードブック選択コードに指定された音源コードブックとを用いて復号音声信号の逆量子化を行い、復号音声信号を出力することを特徴とする逆量子化装置。

請求項23

入力音声をフレーム単位でスペクトル包絡情報と音源情報に分離して量子化し、前記量子化された入力音声信号を逆量子化して出力音声を生成する量子化逆量子化装置において、入力音声信号系列の全フレーム又は一部フレームで伝送可能なトータル伝送情報量が定められており、符号化側では、前記入力音声信号系列の全フレーム又は一部フレームより抽出した入力音声の特徴パラメータの時間及び周波数変動量系列を算出し、前記フレーム内における特徴パラメータ変動量系列の極値を抽出し、前記変動量の極値を極大値と極小値に分離し、前記トータル伝送情報量と、前記フレーム数と、前記極値と前記極値以外の部分の入力音声信号を量子化するのに必要な情報量とを勘案して、極大値はその地点での前記特徴パラメータ変動量が大きい順、極小値はその地点での前記特徴パラメータ変動量の小さい順に極大値、極小値を選択し、前記選択した極大値及び極小値をとるフレーム位置及び個数を出力し、入力音声信号の様々な性質に対応した複数の音源コードブックの中から、前記フレーム内の極大値及び極小値に呼応するフレームには極大値及び極小値が選択された順序に従って優先して復号時の歪が小さくなる音源コードブックを選択すると共に、前記極値以外のフレームの音源コードブックを決定し、前記選択された音源コードブックを用いて前記入力音声信号の音源情報を量子化し、前記フレーム数と、前記極大値及び極小値をとるフレーム位置及び個数と、前記選択された音源コードブックを指定する音源コードブック選択コードとを送出し、復号化側では、前記送出されたフレーム数と、極大値及び極小値の位置及び個数と、前記音源コードブック選択コードで指定された音源コードブックとを用いて入力音声信号の逆量子化を行い、復号信号を出力することを特徴とする量子化逆量子化装置。

請求項24

並び替えた極大値順列及び極小値順列の上位より極大値、極小値を選択し、各々極値に呼応するフレームの音源コードブック、極値以外のフレームの音源コードブックを決定した後、トータル伝送情報量を勘案してまだ余裕がある場合、極大値近傍を極大値と見なして音源コードブックを再決定することを特徴とする請求項21に記載の量子化装置又は請求項23に記載の量子化逆量子化装置。

請求項25

極大値及び極小値の選択個数と、前記選択対象となった極大値及び極小値に呼応するフレームの音源コードブックと、極値以外のフレームの音源コードブックの選択案を数種類設定し、前記複数の選択案に各々従って音源情報を量子化し、復号時の歪が最も小さくなる音源コードブックを選択することを特徴とする請求項21に記載の量子化装置又は請求項23に記載の量子化逆量子化装置。

請求項26

極大及び極小部分の候補がトータル伝送情報量に比較して過剰な場合、極小値の候補のうち低優先度の候補を削除し、当該削除分を極大値の候補とすることを特徴とする請求項21に記載の量子化装置又は請求項23に記載の量子化逆量子化装置。

請求項27

極大値に呼応するフレームは、時間方向に細かく分析できるように入力音声分析手段を切り替えて再分析を行い、復号時の歪が小さくなるように音源情報の量子化に要する情報量を決定することを特徴とする請求項21に記載の量子化装置又は請求項23に記載の量子化逆量子化装置。

請求項28

極小値に呼応するフレームは、極小値近傍フレームと併せて超フレーム化して分析できるように入力音声分析手段を切り替えて再分析を行い、復号時の歪が小さくなるように音源情報の量子化に要する情報量を決定することを特徴とする請求項21に記載の量子化装置又は請求項23に記載の量子化逆量子化装置。

請求項29

極大値に呼応するフレームは、時間方向に細かく分析できるように入力音声分析手段を切り替えて再分析を行い、復号時の歪が小さくなるように音源情報の量子化に要する情報量を決定した上で量子化を行い、極値以外の部分に呼応するフレームについては、極大値、極小値の各々に呼応するフレームの音源信号で補間又は置換することを特徴とする請求項21に記載の量子化装置又は請求項23に記載の量子化逆量子化装置。

請求項30

極小値に呼応するフレームは、極小値近傍のフレームと併せて超フレーム化して分析できるように入力音声分析手段を切り替えて再分析を行い、復号時の歪が小さくなるように音源情報の量子化に要する情報量を決定した上で量子化を行い、極値以外の部分に呼応するフレームについては、極大値、極小値の各々に呼応するフレームの音源信号で補間又は置換することを特徴とする請求項21に記載の量子化装置又は請求項23に記載の量子化逆量子化装置。

技術分野

0001

本発明は、音声信号画像信号などの蓄積伝送などに用いられ、入力信号性質に基づいて、極めて低いビットレートで入力信号を高品質量子化又は逆量子化又は量子化逆量子化するものに関する。

背景技術

0002

従来、音声信号や画像信号を非常に低いビットレートで効率の良い符号化を行うために、様々な量子化逆量子化方法が提案されており、その一技術として入力信号の定常部過渡部などの変動特徴に応じて伝送レートを変化させる可変レート方式がある。ここで述べる定常部とは、例えば入力信号が音声信号の場合、母音部分などのように入力信号が時間に対して緩やかに変化する部分で音声の自然性(静的特徴)をつかさどるものであり、また、過渡部とは同様に子音から母音へ移行するような入力信号の時間に対する変化が激しい部分を指している。以下、定常部及び過渡部とは上記の意味を指し示すものとする。

0003

特開平1−233499号公報には、音声信号をマルチパルス符号化復号化する際に、音声信号の定常部と過渡部に応じて入力音声セグメンテーションを行い、可変長セグメント単位で量子化することによりビットレートを変化させて、品質を劣化させずにビットレートを低減させた量子化逆量子化装置について開示されている。

0004

図12に、この音声符号化復号化装置で用いられている音韻情報の量子化部分の構成を示す。図中1は入力端子、2はセグメンテーション尺度計算部、3はセグメンテーション部、4はLPC(Linear Predictive Coding)分析部、5はLPC係数マトリクスベクトル量子化部、6はピッチ計算部、7は判定部、8はマトリクス/ベクトル選択部、9はマトリクスコードブック、10はベクトルコードブック、11はセグメンテーションされた音声信号、12はセグメンテーション情報、13はLPC係数、14はピッチ周期T、15は判別情報、16はLPC係数符号、17はセグメンテーション尺度、18は重み付け部、19はマトリクス/ベクトル復号部、20はインパルス応答計算部、21は自己相関関数計算部、22は相互相関関数計算部、23はピッチ復号部、24は音源パルス計算部、25は量子化部である。

0005

以下、この従来の音声信号符号化復号化装置の音韻情報量子化部分について説明する。入力端子1より離散的な音声信号を入力し、セグメンテーション尺度計算部2は、後述する動的尺度を用いてセグメンテーション尺度17を計算する。セグメンテーション部3は、セグメンテーション尺度17を入力して音声信号をセグメンテーションし、セグメンテーション区間の長さを表すセグメンテーション情報12と、セグメンテーションされた音声信号11を出力する。上記セグメンテーションには、後述する動的尺度の極大値付近を除き、動的尺度がある程度連続的に予め定められた閾値より小さくなる箇所で行う。LPC分析部4は、セグメンテーションされた区間全体又は一部分の音声信号の分析を行いLPC係数13を算出し、LPC係数マトリクス/ベクトル量子化部5へ出力する。

0006

上記セグメンテーションにおける尺度としてケプストラム動的尺度を用いている。これは「音声の動的尺度に含まれる個人性情報」(嵯峨山茂樹、板倉文忠著、日本音響学会講演論文集、3−2−7、昭和54年6月(以下、文献1と呼ぶ))で説明されており、音声の定常部や過渡部を効率良く抽出する指標として、音声ラベリングやセグメンテーションなどによく用いられている。

0007

ピッチ計算部6は、セグメンテーションされた音声信号11に対して、自己相関法よりピッチ周期T 14、ピッチゲインPg を計算する。判別部はピッチゲインPg の値を用いて上記セグメンテーション区間の音声信号が定常部か否かを判別し、判別情報15を出力する。

0008

マトリクス/ベクトル量子化部5は、LPC係数13のベクトル量子化又はマトリクス量子化を行う。このマトリクス/ベクトル量子化部5は、入力音声の特徴に応じた複数種類コードブックを持っており、上記セグメンテーションされた音声信号区間が定常部である場合には時間・周波数方向相関が強いので、これを利用して、上記セグメントにおける伝送情報量を削減するためにマトリクスコードブック9を使用しマトリクス量子化を行う。その他の区間では、判別情報15を用いて入力音声の状態に適したコードブックをベクトルコードブック10から選択してベクトル量子化を行い、LPC係数符号16を出力する。

0009

次に、この音声符合復号化装置音源情報量子化部分について説明する。重み付け部18は、セグメンテーションされた音声信号11に、マトリクス/ベクトル復号部19で復号化されたLPC係数を用いて音声信号に重み付けを施す。インパルス応答計算部20は、復号化されたLPC係数を用いてインパルス応答を計算する。自己相関関数計算部21は、インパルス応答の自己相関係数を計算し、音源パルス計算部24へ出力する。相互相関関数計算部22は、重み付けられた信号とインパルス応答との相互相関関数を計算して音源パルス計算部24へ出力する。ピッチ復号部23は、ピッチ周期T 14を復号して音源パルス計算部24へ出力する。

0010

音源パルス計算部24は、セグメンテーションされた区間が母音定常部の場合は、上記区間をピッチ周期毎のサブフレームに分割して中央付近のサブフレーム区間について音源パルス列を計算する。母音定常部でない場合には、上記区間全体に対して音源パルス列を計算する。音源パルス量子化部25は音源パルス列の振幅・位置を所定のビット数で量子化する。

0011

また、特開昭64−53642号公報には、音声の復号化における優先度の高い順に符号化データを並べ替え、上記優先度の高い順に伝送ビットレートに応じたデータ量だけ符号化データを送出する可変レート音声符号化復号化装置が開示されている。

0012

図13には、この可変レート音声符号化装置の構成を示す。図中200はディジタル音声信号、201は符号化ユニット、202はデータ列S2 、203はデータスチーラ、204はデータ列S3 、205は符号化音声信号、206はデータフィラー、207はデータ列S4 、208は復号化ユニット、209は復号音声信号である。

0013

以下、この従来の可変レート音声符号化復号化装置について説明する。離散時間でサンプリングされた音声信号がディジタル音声信号200として符号化ユニット201に入力され、例えば20〔ms〕の所定期間内に入力されるNサンプル分の上記音声信号200から入力音声の特徴を抽出し、複数のパラメータからなる符号化データに変換する。続いて符号化ユニット201は、上記符号化データを構成するパラメータ又は各パラメータを構成するビットを、音質に与える影響の高い順に並べ替える。この並べ替えルールデータ要素下位部分を削除しても音質劣化が少ないようにするものである。並び替えた後、データ要素C1 ,……,CM からなる長さMのデータ列S2 202を出力し、伝送データ制御用のビットスチーラ203に入力する。ビットスチーラ203は、ビットレート制御信号で指示された伝送レートに従い、データ列S2 202から長さM′を超える部分は削除した後、先頭から長さM′のデータ列S3 204を伝送路に送出する。

0014

一方、伝送路を介して受信された符号化音声信号205は、ビットフィラー206に入力され、送信時にビットレート制御信号によって削除されたデータ列S3 204の下位ビット部分に■0■を充填した形のデータ列S4 207に変換された後、復号化ユニット208に入力される。復号化ユニット208はデータ列S4 207から音声信号の各パラメータを抽出し、これらのパラメータに基づいて音声を復号化し、復号音声信号209を得る。

0015

そのほかの効率の良い量子化方法を実現する一手法として、「音声のスペクトル補間符号化のための基準フレームの性質」(橋本渡、赤木正人著、日本音響学会講演論文集、3−6−18、平成8年9月(以下、文献2と呼ぶ))に開示されたものがある。文献2は、音声のスペクトル補間符号化における品質を保つための必要最小限度の基準フレームの選択方法とその個数について説明しており、文献2にて提唱されている動的尺度を導入し、品質を保つためには上記動的尺度の極値部分を基準フレームにすればよいと述べている。

発明が解決しようとする課題

0016

ところが上述した量子化逆量子化方法には、以下に述べる問題点がある。すなわちまず、図12の量子化逆量子化方法では、入力信号の変動情報に適した量子化を行うことは可能であるが、符号化後におけるトータル伝送情報量の上限の保証が無く、トータル伝送情報量に制限がある場合では、復号信号品質劣化を伴わずにビットレートを下げることができない上に、復号信号の品質の保証もできない問題点があった。さらにこの量子化逆量子化方法では、伝送情報量を削減するために入力信号の定常部の情報量をセグメント内で一律に削減しているために、定常部の特徴を最も端的に表現している入力信号の変化量極小部分の情報量まで削減してしまうので、ビットレートを低下させると復号信号の自然性が劣化する問題点があった。

0017

また上述した図13の量子化逆量子化方法では、伝送レートに応じて入力信号の重要度の高い順にデータを送出し低優先度のデータは単純に切り捨てているだけであり、符号化後におけるトータル伝送情報量の上限の保証が無く、トータル伝送情報量に制限がある場合では、復号信号の品質劣化を伴わずにビットレートを下げることができないうえに、復号信号の品質の保証もできない問題点があった。さらにこの量子化逆量子化方法では、伝送情報量を削減するために入力信号の情報量を過渡部や定常部共に一律に削減しているだけなので、過渡部や定常部の特徴を最も端的に表現している入力信号の情報量まで削減してしまい、ビットレートを低下させると復号信号の品質が劣化する問題点があった。

0018

さらに文献2に開示されている方法では、入力信号の過渡部又は定常部の特徴を最も端的に表している入力信号の特徴パラメータの変動量の極値を、代表フレームに選択して量子化することについては述べているが、各々の極値を順位づけて、それらにどれだけの情報量を与えて量子化するかについては述べておらず、符号化後のトータル伝送情報量の上限の保証がないという問題点があった。

0019

本発明は以上の課題を解決するためになされたもので、入力信号の変動特性、即ち、入力信号の過渡部や定常部の特徴に応じた情報量を最適配分して量子化することの可能な高能率量子化装置又は逆量子化装置又は量子化逆量子化装置を提供することである。また、本発明の目的は、トータル伝送情報量が制限された蓄積用途の音声符号化に最適な量子化装置又は逆量子化装置又は量子化逆量子化装置を提供することである。

課題を解決するための手段

0020

かかる課題を解決するため、この発明に係る量子化装置においては、入力信号系列の全区間又は一部区間で伝送可能なトータル伝送情報量が定められており、入力信号系列の全区間又は一部区間より抽出した入力信号の特徴パラメータの時間及び周波数変動量系列を算出し、区間内における特徴パラメータ変動量系列の極値を抽出して極値の位置及び個数を出力し、トータル伝送情報量と、区間長と、極値及び極値以外の部分の入力信号を量子化するのに必要な情報量とを案して、入力信号の様々な性質に対応した複数の量子化手段及びコードブックの中から、区間内の極値に呼応する入力信号には優先して量子化歪が小さくなる量子化手段及びコードブックを選択すると共に、極値以外の部分の量子化手段及びコードブックを決定し、選択された量子化手段及びコードブックを用いて入力信号を量子化し、区間長と、極値の位置及び個数と、選択された量子化手段及びコードブックを指定する選択コードとを出力するものである。

0021

また次の発明に係る逆量子化装置においては、復号信号区間長と、復号信号の特徴パラメータ変動量極値の位置及び個数と、選択コードで指定された逆量子化手段及びコードブックとを用いて復号信号の逆量子化を行い、復号信号を出力するものである。

0022

また次の発明に係る量子化逆量子化装置においては、入力信号系列の全区間又は一部区間で伝送可能なトータル伝送情報量が定められており、符号化側では、入力信号系列の全区間又は一部区間より抽出した入力信号の特徴パラメータの時間及び周波数変動量系列を算出し、区間内における特徴パラメータ変動量系列の極値を抽出して極値の位置及び個数を出力し、トータル伝送情報量と、区間長と、極値及び極値以外の部分の入力信号を量子化するのに必要な情報量とを勘案して、入力信号の様々な性質に対応した複数の量子化手段及びコードブックの中から、区間内の極値に呼応する入力信号には優先して量子化歪が小さくなる量子化手段及びコードブックを選択すると共に、極値以外の部分の量子化手段及びコードブックを決定し、選択された量子化手段及びコードブックを用いて入力信号を量子化し、区間長と、極値の位置及び個数と、選択された量子化手段及びコードブックを指定する選択コードとを送出し、復号化側では、送出された区間長と、極値の位置及び個数と、選択コードで指定された逆量子化手段及びコードブックとを用いて量子化された入力信号の逆量子化を行い、復号信号を出力するものである。

0023

さらに次の発明に係る量子化装置又は量子化逆量子化装置においては、各々極値に呼応する入力信号の量子化手段及びコードブック、極値以外の部分の量子化手段及びコードブックを決定した後、トータル伝送情報量を勘案してまだ余裕がある場合、極値近傍を極値と見なして量子化手段及びコードブックを再決定するものである。

0024

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、各々極値に呼応する入力信号の量子化手段及びコードブック、極値以外の部分の量子化手段及びコードブックの選択案を数種類設定し、複数の選択案に各々従って入力信号を量子化し、最も量子化歪が小さくなるものを選択するものである。

0025

また次の発明に係る量子化装置においては、入力信号系列の全区間又は一部区間で伝送可能なトータル伝送情報量が定められており、入力信号系列の全区間又は一部区間より抽出した入力信号の特徴パラメータの時間及び周波数変動量系列を算出し、区間内における特徴パラメータ変動量系列の極値を抽出し、変動量の極値を極大値と極小値に分離し、トータル伝送情報量と、区間長と、極値及び極値以外の部分の入力信号を量子化するのに必要な情報量とを勘案して、極大値はその地点での特徴パラメータ変動量が大きい順、極小値はその地点での特徴パラメータ変動量の小さい順に極大値、極小値を選択し、選択した極大値及び極小値の位置及び個数を出力し、入力信号の様々な性質に対応した複数の量子化手段及びコードブックの中から、区間内の極大値及び極小値に呼応する入力信号には、極大値及び極小値が選択された順序に従って優先して量子化歪が小さくなる量子化手段及びコードブックを選択すると共に、極値以外の部分の量子化手段及びコードブックを決定し、選択された量子化手段及びコードブックを用いて入力信号を量子化し、区間長と、極大値及び極小値の位置及び個数と、選択された量子化手段及びコードブックを指定する選択コードとを出力するものである。

0026

また次の発明に係る逆量子化装置においては、復号区間長と、復号信号の特徴パラメータ変動量極大値及び同極小値に対応する位置及び個数と、選択コードに指定された逆量子化手段及びコードブックとを用いて復号信号の逆量子化を行い、復号信号を出力するものである。

0027

また次の発明に係る量子化逆量子化装置においては、入力信号系列の全区間又は一部区間で伝送可能なトータル伝送情報量が定められており、符号化側では、入力信号系列の全区間又は一部区間より抽出した入力信号の特徴パラメータの時間及び周波数変動量系列を算出し、区間内における特徴パラメータ変動量系列の極値を抽出し、変動量の極値を極大値と極小値に分離し、トータル伝送情報量と、区間長と、極値及び極値以外の部分の入力信号を量子化するのに必要な情報量とを勘案して、極大値はその地点での特徴パラメータ変動量が大きい順、極小値はその地点での特徴パラメータ変動量の小さい順に極大値、極小値を選択し、選択した極大値及び極小値の位置及び個数を出力し、入力信号の様々な性質に対応した複数の量子化手段及びコードブックの中から、区間内の極大値及び極小値に呼応する入力信号には、極大値及び極小値が選択された順序に従って優先して量子化歪が小さくなる量子化手段及びコードブックを選択すると共に、極値以外の部分の量子化手段及びコードブックを決定し、選択された量子化手段及びコードブックを用いて入力信号を量子化し、区間長と、極大値及び極小値の位置及び個数と、選択された量子化手段及びコードブックを指定する選択コードとを送出し、復号化側では、送出された区間長、極大値及び極小値の位置及び個数と、選択コードに指定された逆量子化手段及びコードブックとを用いて量子化された入力信号の逆量子化を行い、復号信号を出力するものである。

0028

さらに次の発明に係る量子化装置又は量子化逆量子化装置においては、並び替えた極大値順列及び極小値順列の上位より極大値、極小値を選択し、各々極値に呼応する入力信号の量子化手段及びコードブック、極値以外の部分の量子化手段及びコードブックを決定した後、トータル伝送情報量を勘案してまだ余裕がある場合、極大値近傍を極大値と見なして量子化手段及びコードブックを再決定するものである。

0029

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極大値及び極小値の選択個数と、選択対象となった極大値及び極小値に呼応する入力信号の量子化手段及びコードブックと、極値以外の部分の量子化手段及びコードブックの選択案を数種類設定し、複数の選択案に各々に従って入力信号を量子化し、最も量子化歪が小さくなるものを選択するものである。

0030

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極大及び極小部分の候補がトータル伝送情報量に比較して過剰な場合、極小値の候補のうち低優先度の候補を削除し、その削除分を極大値の候補とするものである。

0031

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極大値に呼応する入力信号は、時間方向に細かく分析できるように入力信号分析手段を切り替えて再分析を行い、入力信号分析手段にて求めた特徴パラメータの量子化歪が小さくなるように量子化に要する情報量を決定するものである。

0032

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極小値に呼応する入力信号は、周波数方向に精密に分析できるように入力信号分析手段を切り替えて再分析を行い、入力信号分析手段にて求めた特徴パラメータの量子化歪が小さくなるように量子化に要する情報量を決定するものである。

0033

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極大値に呼応する入力信号は、時間方向に細かく分析できるように入力信号分析手段を切り替えて再分析を行い、入力信号分析手段にて求めた特徴パラメータの量子化歪が小さくなるように量子化に要する情報量を決定した上で量子化を行い、極値以外の部分に呼応する入力信号については、極大値、極小値の各々に呼応する量子化後の入力信号で補間又は置換するものである。

0034

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極小値に呼応する入力信号は、周波数方向に精密に分析できるように入力信号分析手段を切り替えて再分析を行い、入力信号分析手段にて求めた特徴パラメータの量子化歪が小さくなるように量子化に要する情報量を決定した上で量子化を行い、極値以外の部分に呼応する入力信号については、極大値、極小値の各々に呼応する量子化後の入力信号で補間又は置換するものである。

0035

また次の発明に係る量子化装置においては、入力音声をフレーム単位スペクトル包絡情報と音源情報に分離して量子化するものであって、入力音声信号系列の全フレーム又は一部の複数フレームで伝送可能なトータル伝送情報量が定められており、入力音声信号系列の全フレーム又は一部の複数フレームより抽出した入力音声の特徴パラメータの時間及び周波数変動量系列を算出し、フレームにおける特徴パラメータ変動量系列の極値を抽出して極値をとるフレームの位置及び個数を出力し、トータル伝送情報量と、フレーム数と、極値及び極値以外の部分の入力音声信号を量子化するのに必要な情報量とを勘案して、入力音声信号の様々な性質に対応した複数の音源コードブックの中から、フレーム内の極値に呼応するフレームには優先して復号時の歪が小さくなる音源コードブックを選択すると共に、極値以外のフレームの音源コードブックを決定し、選択された音源コードブックを用いて入力音声信号の音源情報を量子化し、フレーム数と、極値をとるフレームの位置及び個数と、選択された音源コードブックを指定する音源コードブック選択コードとを出力するものである。

0036

また次の発明に係る逆量子化装置においては、フレーム単位で量子化された音声信号を逆量子化して出力音声を生成するものであって、復号音声信号フレーム数と、復号音声信号の特徴パラメータ変動量の極値をとるフレーム位置及び個数と、音源コードブック選択コードで指定された音源コードブックとを用いて復号音声の逆量子化を行い、復号音声を出力するものである。

0037

また次の発明に係る量子化逆量子化装置においては、入力音声をフレーム単位でスペクトル包絡情報と音源情報に分離して量子化し、量子化された入力音声を逆量子化して出力音声を生成するものであって、入力音声信号系列の全フレーム又は一部の複数フレームで伝送可能なトータル伝送情報量が定められており、符号化側では、入力信号系列の全フレーム又は一部の複数フレームより抽出した入力音声の特徴パラメータの時間及び周波数変動量系列を算出し、フレーム内における特徴パラメータ変動量系列の極値を抽出して極値をとるフレーム位置及び個数を出力し、トータル伝送情報量と、フレーム数と、極値及び極値以外の部分の入力音声信号を量子化するのに必要な情報量とを勘案して、入力音声信号の様々な性質に対応した複数の音源コードブックの中から、フレーム内の極値に呼応するフレームには優先して復号時の歪が小さくなる音源コードブックを選択すると共に、極値以外のフレームの音源コードブックを決定し、選択された音源コードブックを用いて入力音声信号の音源情報を量子化し、フレーム数と、極値をとるフレーム位置及び個数と、選択された音源コードブックを指定する音源コードブック選択コードとを送出し、復号化側では、送出されたフレーム数と、極値をとるフレーム位置及び個数と、音源コードブック選択コードで指定された音源コードブックとを用いて入力音声信号の逆量子化を行い、復号音声を出力するものである。

0038

さらに次の発明に係る量子化装置又は量子化逆量子化装置においては、各々極値に呼応するフレームの音源コードブック、極値以外のフレームの音源コードブックを決定した後、トータル伝送情報量を勘案してまだ余裕がある場合、極値近傍を極値と見なして音源コードブックを再決定するものである。

0039

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、各々極値に呼応するフレームの音源コードブックと、極値以外のフレームの音源コードブックの選択案を数種類設定し、複数の選択案に各々従って音源情報を量子化し、復号時の歪が最も小さくなる音源コードブックを選択するものである。

0040

また次の発明に係る量子化装置においては、入力音声をフレーム単位でスペクトル包絡情報と音源情報に分離して量子化するものであって、入力音声信号系列の全フレーム又は一部の複数フレームで伝送可能なトータル伝送情報量が定められており、入力音声信号系列の全フレーム又は一部フレームより抽出した入力音声の特徴パラメータの時間及び周波数変動量系列を算出し、フレーム内における変動量系列の極値を抽出し、変動量の極値を極大値と極小値に分離し、トータル伝送情報量と、フレーム数と、極値及び極値以外の部分の入力音声信号を量子化するのに必要な情報量とを勘案して、極大値はその地点での特徴パラメータ変動量が大きい順、極小値はその地点での特徴パラメータ変動量の小さい順に極大値、極小値を選択し、選択した極大値及び極小値の各々フレーム位置及び個数を出力し、入力音声信号の様々な性質に対応した複数の音源コードブックの中から、フレーム内の極大値及び極小値に呼応するフレームには極大値及び極小値が選択された順序に従って優先して復号時の歪が小さくなる音源コードブックを選択すると共に、極値以外のフレームの音源コードブックを決定し、選択された音源コードブックを用いて入力音声信号の音源情報を量子化し、フレーム数と、極大値及び極小値をとるフレーム位置及び個数と、選択された音源コードブックを指定する音源コードブック選択コードと、入力音声信号の入力音声信号コードとを出力するものである。

0041

また次の発明に係る逆量子化装置においては、フレーム単位で量子化された音声信号を逆量子化して出力音声を生成するものであって、復号フレーム数と、復号音声信号の特徴パラメータ変動量極大値及び同極小値に対応するフレーム位置及びフレームの個数と、音源コードブックを指定する音源コードブック選択コードとを入力し、極大値及び極小値の位置及び個数と、音源コードブック選択コードに指定された音源コードブックとを用いて復号音声信号の逆量子化を行い、復号音声信号を出力するものである。

0042

また次の発明に係る量子化逆量子化装置においては、入力音声をフレーム単位でスペクトル包絡情報と音源情報に分離して量子化し、量子化された入力音声信号を逆量子化して出力音声を生成するものであって、入力音声信号系列の全フレーム又は一部フレームで伝送可能なトータル伝送情報量が定められており、符号化側では、入力音声信号系列の全フレーム又は一部フレームより抽出した入力音声の特徴パラメータの時間及び周波数変動量系列を算出し、フレーム内における特徴パラメータ変動量系列の極値を抽出し、変動量の極値を極大値と極小値に分離し、トータル伝送情報量と、フレーム数と、極値と極値以外の部分の入力音声信号を量子化するのに必要な情報量とを勘案して、極大値はその地点での特徴パラメータ変動量が大きい順、極小値はその地点での特徴パラメータ変動量の小さい順に極大値、極小値を選択し、選択した極大値及び極小値をとるフレーム位置及び個数を出力し、入力音声信号の様々な性質に対応した複数の音源コードブックの中から、フレーム内の極大値及び極小値に呼応するフレームには極大値及び極小値が選択された順序に従って優先して復号時の歪が小さくなる音源コードブックを選択すると共に、極値以外のフレームの音源コードブックを決定し、選択された音源コードブックを用いて入力音声信号の音源情報を量子化し、フレーム数と、極大値及び極小値をとるフレーム位置及び個数と、選択された音源コードブックを指定する音源コードブック選択コードとを送出し、復号化側では、送出されたフレーム数と、極大値及び極小値の位置及び個数と、音源コードブック選択コードで指定された音源コードブックとを用いて入力音声信号の逆量子化を行い、復号信号を出力するものである。

0043

さらに次の発明に係る量子化装置又は量子化逆量子化装置においては、並び替えた極大値順列及び極小値順列の上位より極大値、極小値を選択し、各々極値に呼応するフレームの音源コードブック、極値以外のフレームの音源コードブックを決定した後、トータル伝送情報量を勘案してまだ余裕がある場合、極大値近傍を極大値と見なして音源コードブックを再決定するものである。

0044

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極大値及び極小値の選択個数と、選択対象となった極大値及び極小値に呼応するフレームの音源コードブックと、極値以外のフレームの音源コードブックの選択案を数種類設定し、複数の選択案に各々従って音源情報を量子化し、復号時の歪が最も小さくなる音源コードブックを選択するものである。

0045

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極大及び極小部分の候補がトータル伝送情報量に比較して過剰な場合、極小値の候補のうち低優先度の候補を削除し、その削除分を極大値の候補とするものである。

0046

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極大値に呼応するフレームは、時間方向に細かく分析できるように入力音声分析手段を切り替えて再分析を行い、復号時の歪が小さくなるように音源情報の量子化に要する情報量を決定するものである。

0047

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極小値に呼応するフレームは、極小値近傍フレームと併せて超フレーム化して分析できるように入力音声分析手段を切り替えて再分析を行い、復号時の歪が小さくなるように音源情報の量子化に要する情報量を決定するものである。

0048

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極大値に呼応するフレームは、時間方向に細かく分析できるように入力音声分析手段を切り替えて再分析を行い、復号時の歪が小さくなるように音源情報の量子化に要する情報量を決定した上で量子化を行い、極値以外の部分に呼応するフレームについては、極大値、極小値の各々に呼応するフレームの音源信号で補間又は置換するものである。

0049

さらにまた次の発明に係る量子化装置又は量子化逆量子化装置においては、極小値に呼応するフレームは、極小値近傍のフレームと併せて超フレーム化して分析できるように入力音声分析手段を切り替えて再分析を行い、復号時の歪が小さくなるように音源情報の量子化に要する情報量を決定した上で量子化を行い。極値以外の部分に呼応するフレームについては、極大値、極小値の各々に呼応するフレームの音源信号で補間又は置換するものである。

発明を実施するための最良の形態

0050

下図面を参照しながら、この発明の実施の形態について説明する。

0051

実施の形態1.図1は本発明による量子化装置の実施の形態1の構成を示す。図中30は入力信号系列、31はセグメント数及びセグメント長信号、32は有声無声無音フラグ、33はフレームエネルギ信号、34はピッチ周期信号、35はセグメンテーション手段、36はセグメンテーションされた入力信号、37はパワー分析手段、38はピッチ分析手段、39は入力信号分析手段、40は入力信号特徴パラメータ分析手段、41はLSPパラメータ、42はメモリA、43はケプストラムパラメータ、44はメモリB、45はパワー量子化手段、46はピッチ量子化手段、47はパワーコード、48はパワーコードデータ量、49はピッチコード、50はピッチコードデータ量、51は特徴パラメータ変動量算出手段、52は特徴パラメータ変動量系列、53は特徴パラメータ変動量極値抽出手段、54は極値の個数、55は極値に呼応する入力信号のフレーム番号、56は量子化データ量決定手段、57は前述したトータル伝送情報量を示す総データ量信号、58はコードブック選択コード、59はコードブックA、60は量子化手段、61はLSPコード、62はマルチプレクサ、63は伝送コードである。

0052

以下、この実施の形態1の量子化装置の動作を説明する。例えば8〔kHz〕で標本化されたディジタル音声信号が入力信号系列30として入力される。セグメンテーション手段35は、入力信号系列30を例えば20〔ms〕周期程度のフレーム長区切り、以下に述べるピッチ分析手段38及びパワー分析手段37と連動し、ピッチ周期信号34、フレームエネルギ信号33からセグメント毎の有声/無声/無音判別を行い、上記入力信号系列30を有声/無声/無音セグメントに分類して分割すると共に、入力信号系列30における総セグメント数及び各々セグメンテーションされた入力信号のセグメント長(上記20〔ms〕をフレーム単位とするフレーム数N)31及び有声/無声/無音フラグ32を出力する。また、セグメント長に制限があったりする場合には有声セグメントをさらに分割する。

0053

ピッチ分析手段38は、例えば自己相関法などの公知の方法により、20〔ms〕周期程度のフレーム長に区切ってフレーム毎のピッチ周期を算出しピッチ周期信号34を出力する。パワー分析手段37は、ピッチ分析手段38と同一のフレーム周期に区切ってフレーム毎のフレームエネルギを算出しフレームエネルギ信号33を出力する。また、セグメント毎の総データ量57は、予め有声/無声/無音別に策定されてあり、例えば、無声区間有声区間に比べて情報量が少なくて済むので割り当て情報量は少なく設定され、また、無音区間では音韻情報の量子化に要する情報量はとされ、有声/無声/無音フラグ32とセグメント数及びセグメント長信号31に基づいてセグメンテーション手段35にて算出し出力する。

0054

パワー量子化手段45は、パワー分析手段37が出力するフレームエネルギ信号33をスカラ量子化し、対応するパワーコード47をマルチプレクサ62に送出すると共に、各々のセグメント長と量子化ビット数からパワーコードデータ量Mpow 48を計算し、量子化データ量決定手段56に出力する。ピッチ量子化手段46では、ピッチ分析手段38で得られた各々のセグメントにおけるフレーム毎のピッチ周期信号34をスカラ量子化し、ピッチコード49をマルチプレクサ62に送出すると共に、各々のセグメント長と量子化ビット数からピッチコードデータ量Mpit 50を計算し、量子化データ量決定手段56に出力する。

0055

入力信号分析手段39は、セグメンテーションされた入力信号36を、例えばセグメンテーション手段35と同じ20〔ms〕程度のフレーム長に区切って線形予測分析を行い、音声のスペクトルパラメータである線形予測パラメータの一つの、例えばm次の線スペクトル対(LSP)に変換し、得られたm次元ベクトルのLSPパラメータ41を時系列順にメモリA 42に蓄積する。入力信号特徴パラメータ分析手段40は、入力信号分析手段39におけるLSPパラメータ41の分析周期よりも短いフレーム周期、例えば5〔ms〕毎のフレーム周期でセグメンテーションされた入力信号36の線形予測分析を行い、公知の方法を用いてm次のケプストラムパラメータ43に変換し、時系列順にメモリB 44に蓄積する。

0056

特徴パラメータ変動量算出手段51は、メモリB 44よりケプストラムパラメータ43を現フレーム及び現フレームの前後数フレーム分を含めて読み出し、例えば文献1で用いられている動的尺度を用いて、現フレームの特徴パラメータ変動量を算出し、フレーム毎の特徴パラメータ変動量系列52を出力する。上記動的尺度を用いることにより、音声の過渡部や定常部を効率良く抽出することが可能である。

0057

図4は入力信号とケプストラム動的尺度の極大値及び極小値の位置関係を示す。特徴パラメータ変動量極値抽出手段53は、図示のように、特徴パラメータ変動量系列52からある定められた閾値を越える極大値(図中の動的尺度上の白丸)、又は別に定められた閾値を下回る極小値(図中の動的尺度上の黒丸)を抽出すると共に、上記極値と呼応する入力信号分析手段が出力するフレーム(以下、極値部分又はそれぞれ極大部分、極小部分と呼ぶことにする)の位置を示すフレーム番号55と、各セグメント内で得られた極大値及び極小値の個数54、即ち極大値フレーム数Np 、極小値フレーム数Nb を出力する。なお、上記閾値に満たない極値部分は、極値以外として扱われる。ここで抽出される極値に呼応するフレームは、入力音声信号の過渡部又は定常部の特徴を最も端的に表現するものである。

0058

量子化データ量決定手段56は、上記セグメント内において、ピッチ周期信号34の符号化に要したピッチコードデータ量Mpit 50、フレームエネルギの符号化に要したフレームエネルギデータ量Mpow 48、セグメント内の総データ量の上限Mall 57を受け、極値以外のLSPパラメータの量子化に要するデータ量を決定すると共に、極値部分のLSPパラメータ量子化に要するデータ量を決定する。ここで、セグメント内のフレーム数をN、極値部分以外でのフレームの量子化に使用するコードブックのサイズをKn とすると、極値部分に割り当てられる総データ量は次式のMminmaxとなる。

0059

0060

また、極大値部分コードブックサイズをKp 、極小値のコードブックサイズをKb とし、またKn はKp 及びKb よりも小さい、例えばKn =8ビットに設定すると、Kp 、Kb は次式を満たすようにコードブックA 42の中から選択される。

0061

0062

上記決定したコードブックサイズを選択コード58として、極値部分のフレーム番号54と共に量子化手段60及びマルチプレクサ62に出力する。

0063

量子化手段60では、選択コード58及び有声/無声/無音フラグ32に従い、LSPパラメータ41をメモリA 42より順次読み出し、上記選択コード58に応じてデータサイズが割り当てられたコードブック59を用いて、ベクトル量子化を行う。

0064

また無声部区間は、LSPパラメータの情報量を大幅に削減しても品質は大きく劣化しないので、5ビット程度のコードブックを用いてビットレートを削減することもできる。無音部はLSPパラメータは量子化せず伝送しない。上記LSPパラメータ41を量子化した後、LSPコード61、使用したコードブックサイズにを意味する選択コード58及び極値部分のフレーム番号55をマルチプレクサ62へ出力する。マルチプレクサ62は、セグメント数及びセグメント長信号31、選択コード58、フレーム番号55、LSPコード61、パワーコード47、ピッチコード49を多重化し、伝送コード63として出力する。

0065

上述のようにこの実施の形態1によれば、定められたトータル伝送情報量の制限内で入力信号の量子化に要する情報量を最適配分し、入力信号特徴パラメータ変動量の極値に呼応する入力信号を優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に量子化し得る量子化装置を実現できる。さらに、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化を行える量子化装置を実現できる。

0066

なおこの実施の形態においては、セグメンテーション手段を用いて入力信号系列のセグメンテーションを行い、セグメント毎のトータル伝送情報量において量子化を行ったが、例えば複数のセグメントでトータル伝送情報量が定められている場合には、上記複数のセグメントにおいて情報量配分を一括して決定したり、さらに入力信号系列全体でトータル伝送情報量が定められている場合においても、上記入力信号系列全体を一括して情報量配分を行うようにしても、上述の実施の形態1と同様の効果を実現できる。

0067

また、特徴パラメータ変動量算出手段としてケプストラムの動的尺度を用いているが、音声信号の特性を良く表す他の指標として、例えばLPC予測残差パワーの差分量(Δ残差パワー)、フレームエネルギ変化量、ピッチゲイン変化量などを単独又は合わせて用いても、上述の実施の形態1と同様の効果を実現できる。

0068

また、説明を簡単にするために量子化手段を通常のベクトル量子化一つのみとして、コードブックサイズのみで量子化優先度を制御しているが、上記分類レベルに応じて、その他の公知のベクトル量子化方法である多段ベクトル量子化、スプリットベクトル量子化、適応差分量子化など、複数の量子化手段を用意し、またそれぞれに複数のコードブックを用意して、例えば、極大値部分では適応差分ベクトル量子化、極小値部分では多段ベクトル量子化を用いるなど、それら複数の中から最も入力信号の特性に適した量子化手段及びコードブックを使い分けるようにしても、上述の実施の形態1と同様の効果を実現できる。

0069

また、説明を簡単にするためにLSPパラメータの量子化にのみ本発明を適用しているが、もちろん他のパラメータのピッチ、パワーやその他の音源情報に関連するパラメータに関して適用しても、上述の実施の形態1と同様の効果を実現できる。また図4中の閾値は、上記極値部分のデータ量Mminmaxに達するまで、上記閾値を上下させて極値の個数を変化させることも可能であるし、閾値を複数レベルに細かく分けて、レベル毎にコードブックサイズを変更することも可能であり、このようにしても上述の実施の形態1と同様の効果を実現できる。

0070

実施の形態2.図1との対応部分に同一符号を付した図2は本発明による逆量子化装置の実施の形態2の構成を示す。図中70はデマルチプレクサ、71はピッチ復号手段、72はパワー復号手段、73は逆量子化手段、74はコードブックB、75は復号ピッチ信号、76は復号フレームエネルギ信号、77は復号LSPパラメータである。

0071

以下、この実施の形態2の逆量子化装置の動作を説明する。伝送コード63を受信し、デマルチプレクサ70でセグメント数及び各セグメント長信号31、有声/無声/無音フラグ32、コードブック選択コード58、極値部分を指定するフレーム番号55、LSPコード61、ピッチコード49、パワーコード47が伝送コード63より分離される。ピッチ復号手段71は、セグメント数及びセグメント長31、ピッチコード49を入力しフレーム毎のピッチを復号して復号ピッチ周期信号75を出力する。パワー復号手段72ではセグメント数及びセグメント長31、パワーコード47を入力してフレームエネルギを復号し、復号フレームエネルギ信号76を出力する。

0072

逆量子化手段73は、上記選択コード58、有声/無声/無音フラグ32、フレーム番号55を入力し、上記選択コード58により指定されたコードブックをコードブックB 74より選択し、選択したコードブックを用いてLSPコード61を逆量子化し復号LSPパラメータ77を出力する。

0073

このような構成によれば、定められたトータル伝送情報量の制限内で入力信号の量子化に要する情報量を最適配分し、入力信号特徴パラメータ変動量の極値に呼応する入力信号を優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に逆量子化し得る逆量子化装置を実現できる。さらに、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な逆量子化を行える逆量子化装置を実現できる。

0074

実施の形態3.上述の実施の形態2では、図2に示した逆量子化装置内のコードブックB 74により逆量子化を行っているが、この実施の形態3では、図1に示した量子化装置の同一のコードブックA 42を用いて逆量子化を行う。

0075

このようにすれば、定められたトータル伝送情報量の制限内で入力信号の量子化に要する情報量を最適配分し、入力信号特徴パラメータ変動量の極値に呼応する入力信号を優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に量子化逆量子化し得る量子化逆量子化装置を実現できる。

0076

さらに、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化逆量子化を行える量子化逆量子化装置を実現できる。

0077

実施の形態4.図1との対応部分に同一符号を付した図3は本発明による量子化装置の実施の形態4の構成を示す。図1と比較して新たな構成として、80は特徴パラメータ変動量極大・極小値抽出手段、81は極大値配列メモリCa 、82は極小値配列メモリCb、83は極大部分のフレーム番号、84は極小部分のフレーム番号、85は量子化データ量決定手段、86は選定された極値部分のフレーム番号である。

0078

特徴パラメータ変動量極大・極小値抽出手段80は、特徴パラメータ変動量算出手段51が出力する特徴パラメータ変動量極値系列52から変動量の極大値と極小値を分類し、極大部分の極大部分のフレーム番号83は極大値配列メモリCa 81に、極小部分のフレーム番号84は極小値配列メモリCb82にそれぞれ格納し、上記2つの配列の内容を量子化データ量決定手段85に出力する。

0079

量子化データ量決定手段85は、極大値配列メモリCa 81からは値が大きなものから順に、また極小値配列メモリCb82からは値が小さなものから順に読み出し、該当するフレームに順位に応じたコードブックサイズを割り当てる。図5は、セグメント内で極大値を最大3個まで選択し(図中の丸印)、1位にはKp =12ビット、2位にはKp =11ビット、3位にはKp =10ビット、また極小値を最大2個まで選択し(図中の四角印)、1、2位にはKb =10ビット割り当てるとして順位付けした一例である。また情報量が余ったならば、上述した実施の形態1で示したデータ量Mminmaxに達するまで、Kp 又はKb のビット量を多くしてもよい。

0080

このようにして決定されたコードブックサイズを指定する選択コード58及び上述によって選定された極値部分のフレーム番号86を出力する。量子化手段60では、上述の選択コード58と選定されたフレーム番号86に従って、選定されたフレームにおけるLSPパラメータのベクトル量子化を行い、LSPコード61、選択コード58及びフレーム番号86をマルチプレクサ62に出力する。

0081

上述のようにこのような構成によれば、特徴パラメータ変動量の極値に呼応する入力音声信号、すなわち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化を行うことが可能であるばかりでなく、入力信号特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力信号の量子化歪をより小さくするように量子化できるので、さらに高品質な量子化を行える量子化装置を実現できる。

0082

実施の形態5.上述の実施の形態2の別の形態としてこの実施の形態5では、受信した極値部分を指定するフレーム番号のうち、極大部分と極小部分別々に値の大きさ順に優先度をつけて逆量子化する。

0083

このようにすれば、特徴パラメータ変動量の極値に呼応する入力音声信号、すなわち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な逆量子化を行うことが可能であるばかりでなく、入力信号特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力信号の量子化歪をより小さくするように量子化できるので、さらに高品質な逆量子化を行える逆量子化装置を実現できる。

0084

実施の形態6.この実施の形態6は、上述した実施の形態4の量子化装置と、上述した実施の形態5の逆量子化装置を組み合わせ、かつ両者で同一のコードブックを用いることにより、実施の形態3と同様な構成をとるものである。

0085

このようにすれば、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化逆量子化を行うことが可能であるばかりでなく、入力信号特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力信号の量子化歪をより小さくするように量子化できるので、さらに高品質な量子化逆量子化を行える量子化逆量子化装置を実現できる。

0086

実施の形態7.この実施の形態7は、上述した実施の形態1、3、4又は6の別の実施の形態として、まず一様に通常の量子化を行った後、余剰情報量で優先度の高い部分から順に量子化誤差を量子化するものである。

0087

このようにすれば、入力信号の重要な部分である極値を補強するように量子化することができるので、さらに高品質な量子化又は量子化逆量子化を行える量子化装置又は量子化逆量子化装置を実現できる。

0088

実施の形態8.この実施の形態8は、上述の実施の形態1、3、4又は6に加えて、極値に情報量を割り振る計画をする際に余剰情報量がある場合、通常の極値の他に例えば子音から母音にわたるような、音声過渡部の重要度の高い部分に相当する変動量パラメータの極値に呼応するフレームの近傍フレームを極値とみなし、量子化優先度及び情報量を再決定するものである。図6は、極大値の前後1フレームを極大値と見なして選択した一例であり、図6中の動的尺度上の三角印が極値近傍部分である。

0089

このようにすれば、例えば音声信号の子音から母音にかけての過渡部など、入力音声信号にとって特に重要なフレーム及びその周辺フレームに集中的に情報量を集めて量子化することができるのでさらに明瞭性が向上し、高品質な量子化又は量子化逆量子化を行える量子化装置又は量子化逆量子化装置を実現できる。

0090

実施の形態9.この実施の形態9は、上述した実施の形態1、3、4又は6に加えて、数種類の仮の優先度及び情報量を設定し量子化を行った後、総合的に最も量子化歪が小さなものを選択する、いわゆるディレイディシジョンを行うものである。

0091

このようにすれば、例えば蓄積符号化など符号化遅延が許される量子化において、最も量子化歪を小さくする量子化方法及びデータ量が選択できるので、さらに高品質な量子化又は量子化逆量子化を行える量子化装置又は量子化逆量子化装置を実現できる。

0092

実施の形態10.この実施の形態10は、上述の実施の形態4又は6に加えて、図7に示すように、極大部分に呼応するフレームをより小さいフレーム(サブフレーム)に分割した後、それぞれのサブフレームについて入力信号の再分析を行い、その結果を量子化するものである。

0093

このようにすれば、上述の実施の形態4又は6で述べた効果に加え、入力信号特徴パラメータ変動量の極大部分に呼応するフレームをサブフレーム化して細かく分析し量子化することができるので、過渡部の特徴を最も端的に表現する部分の時間変化形状の量子化歪をさらに小さくでき、さらに明瞭性が向上した量子化又は量子化逆量子化を行える量子化装置又は量子化逆量子化装置を実現できる。

0094

実施の形態11.この実施の形態11は、上述の実施の形態4又は6に加えて、図8に示すように、特徴パラメータ極小部分を代表として、その近傍の複数のフレームを極小部分のフレームで表現し、近傍のフレームの余った情報量の全部ないし一部を極小部分に集めて極小部分フレームを精密に量子化するものである。

0095

このようにすれば、上述の実施の形態4又は6で述べた効果に加え、入力信号の定常部の中でその特徴を最も端的に表現する極小部を代表フレームとし、なおかつ極小部に情報量を集中させているので、定常部の自然性がさらに向上すると共に、トータル伝送情報量を削減し得る量子化装置又は量子化逆量子化装置を実現できる。

0096

実施の形態12.この実施の形態12は、上述の実施の形態10と実施の形態11を合わせて用い、極小部分近傍フレーム情報量の一部分を極大部分に回すものである。

0097

このようにすれば、上述した実施の形態4又は6で述べた効果に加え、入力信号の定常部の中でその特徴を最も端的に表現する極小部を代表フレームとし、なおかつ情報量を集中させているので、定常部の自然性が向上することに加えて、さらに極小部分近傍でビット削減した分の情報量を過渡部の中の極大部分のフレームに回しているので、さらに明瞭度を向上し得る量子化装置又は量子化逆量子化装置を実現できる。

0098

実施の形態13.この実施の形態13は、上述の実施の形態10の別の形態として、入力信号特徴パラメータ変動量の極大及び極小部分を代表フレームとし、その他のフレームについては量子化を行わずに、極大極小部分に呼応するフレームで補間又は置換するものである。

0099

このようにすれば、上述の実施の形態4又は6で述べた効果に加え、さらに極大部フレームを時間方向に細かく量子化した上で極値以外のフレームを極値で補間又は置換しているので、トータル伝送情報量が制限されていても高品質を保ったまま量子化できると共に、品質劣化が最小限でトータル伝送情報量を削減し得る量子化装置又は量子化逆量子化装置を実現できる。

0100

実施の形態14.この実施の形態14は、上述の実施の形態11の別の形態として、入力信号特徴パラメータ変動量の極大及び極小部分を代表フレームとし、その他のフレームについては、量子化を行わずに、極大極小部分に呼応するフレームで補間又は置換するものである。

0101

このようにすれば、上述の実施の形態4又は6で述べた効果に加え、さらに極小部フレームに情報量を集中させて量子化できるので、トータル伝送情報量が制限されていても高品質を保ったまま量子化できると共に、特に入力信号の自然性品質劣化が最小限でトータル伝送情報量を削減し得る量子化装置又は量子化逆量子化装置を実現できる。

0102

実施の形態15.この実施の形態15は、上述の実施の形態13又は14に加えて、極値以外のフレームにおいて、補間した後で量子化前の上記同フレームとの差分を量子化するものである。

0103

このような構成においても、上述の実施の形態13又は14と同様の効果を得られる量子化装置又は量子化逆量子化装置を実現できる。

0104

実施の形態16.この実施の形態16は、上述した実施の形態4又は6において、極大及び極小部分の候補がトータル伝送情報量に比較して過剰な場合、例えば入力信号が音声信号の場合には音韻知覚に関しては定常部よりも過渡部の方が重要であると言われているので、極小値の候補のうち低優先度の候補を削除し、その削除分を極大値の候補とするように量子化優先順位修正を加えることも可能である。例えば、優先度未決定の極大値がP個残っている場合、極小値の候補よりP個以下の範囲で差引き、差し引いた分の情報量の範囲で極大部分フレームに情報量を最適配分することも可能である。

0105

このようにすれば、極小部分の下位の候補から、重要度の高い極大部分に候補を優先するように修正を加えているので、極値に割り当てる情報量が少なくなっても、入力信号の特に重要な特徴部分が保存されるので、品質劣化が最小限なままで量子化又は量子化逆量子化を行える量子化装置又は量子化逆量子化装置を実現できる。

0106

実施の形態17.図9は本発明の量子化装置による実施の形態17の構成である。90は入力音声分析手段、91は音韻量子化手段、92は量子化されたLPCパラメータ、93はLPCコード、94は音源コードブック選択手段、96は適応コードブック(ACB)、97は雑音コードブック(RCB)、98は雑音コードブック切り替えスイッチ、100は合成フィルタ、102は聴覚重み付け手段、103は検索手段、104はACBコード、105はRCBコード、106は音源ゲインである。この量子化装置は符号励振線形予測符号化(CELP)に類するものであり、この方法の基本構成については「Code-Excited Linear Prediction coding(CELP):High-quality speechat 8kbps」( M.R.Shroeder and B.S.atal著、ICASSP■85、pp.937-940、1985 (以下、文献3と呼ぶ))に詳しく記してあるので、この符号化方法原理についての説明は略する。

0107

次にこの動作を説明する。例えばサンプリング周波数8〔kHz〕、フレーム長20〔ms〕のディジタル音声信号が入力音声信号として入力端子1より入力される。入力音声信号はセグメンテーション手段35で例えば有声/無声/無音別にまとめた複数フレームにセグメンテーションされ、それらセグメント毎に入力音声分析手段90及び入力信号特徴パラメータ分析手段40に入力される。またセグメント長31はマルチプレクサに出力される。入力音声分析手段90は、セグメンテーションされた音声信号36をフレーム毎に例えば線形予測分析を行って線形予測パラメータ(LPC)を計算し、音韻量子化手段91へ出力する。音韻量子化手段91は、公知の方法を用いて入力音声分析手段90で得られたLPCの量子化を行い、得られたLPCコード93をマルチプレクサ62に出力する。

0108

入力信号特徴パラメータ分析手段40は、上記実施の形態1と同様に、入力音声信号のフレーム周期より短い周期でセグメンテーションされた音声信号36の分析を行ってケプストラムパラメータ43を求め、特徴パラメータ変動量分析手段51に出力する。特徴パラメータ変動量算出手段51は、例えば上記実施の形態1で用いた動的尺度を用いて、上記入力音声特徴パラメータであるケプストラムパラメータ43の変動を分析して入力音声の特徴パラメータ変動量系列52を求める。上記動的尺度を用いることにより、音声の過渡部や定常部区間を効率的に抽出することが出来る。特徴パラメータ変動量極値抽出手段53は、上記求められた特徴パラメータ変動量の極値を求め、極値をとるフレーム位置55とその個数54を音源コードブック選択手段94に出力する。

0109

音源コードブック選択手段94は、セグメント長31とトータル伝送情報量を勘案して、極値の種類(極大又は極小)及びその個数から、個々のフレームに割り当てる音源コードブックの種類を選択する。図9の例では、例えば雑音コードブック(RCB1 〜RCBn )97はコードブックサイズが異なるものを複数個用意し、例えば、前記実施の形態1と同様にビット数に応じてコードブックサイズを変化させる。例えば、極大値をとるフレームは音韻過渡部などの音声の変化が最も激しい部分といえるので、音韻過渡部フレームはコードブックサイズ(ビット数)を多くして、それ以外のフレームはコードブックサイズを小さくする操作を行う。フレーム毎の音源コードブックを選択した後、音源コードブックの種類を表す音源コードブック選択コード95を、音源コードブック切り替えスイッチ98及びマルチプレクサ63に出力する。

0110

続いて、音源コードブック選択手段94で選択された雑音コードブック97が出力する雑音音源信号と適応コードブック96が出力する適応音源信号は、適宜ゲインを制御された後加算され音源信号99として合成フィルタ100に入力される。合成フィルタ100は音源信号99と量子化されたLPCパラメータ92から復号音声101を生成する。復号音声101はフレーム毎に入力音声と差分がとられた後、聴覚重み付け手段102で聴覚重み付けが行われた後検索手段103に入力され、歪み最小化基準で適応コードブックのラグコード則ちACBコード104と、雑音コードブックコード則ちRCBコード105と、音源ゲイン106を決定し、それぞれをマルチプレクサ62に出力する。マルチプレクサ62は上記各パラメータを多重化して伝送路へ伝送コード63として送出する。

0111

このような構成によれば、定められたトータル伝送情報量の制限内で入力音声の音源信号の量子化に要する情報量を最適配分し、入力音声信号特徴パラメータ変動量の極値に呼応する入力音声信号フレームを優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に量子化し得る量子化装置を実現できる。

0112

また、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームの音源信号に効率的に情報量を割り当てることができるので、復号音声信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化し得る量子化装置を実現できる。

0113

なお、この実施の形態においては、セグメンテーション手段を用いて入力音声信号のセグメンテーションを行い、セグメント毎のトータル伝送情報量において量子化を行ったが、例えば、複数のセグメントでトータル伝送情報量が定められている場合には、上記複数のセグメントにおいて情報量配分を一括して決定したり、さらに入力音声信号全体でトータル伝送情報量が定められている場合においても、上記入力音声信号全体を一括して情報量配分を行うことももちろん可能である。

0114

また、特徴パラメータ変動量算出手段としてケプストラムの動的尺度を用いているが、音声信号の特性を良く表す他の指標として、例えば、LPC予測残差パワーの差分量(Δ残差パワー)やラグゲイン変化量などを単独又は合わせて用いてもよい。さらに、説明を簡単にするために雑音コードブックの選択方法にのみ本発明を適用しているが、他の音源コードブックとして例えば適応コードブックのラグコード表現ビット数に適用しても良い。さらにまた、情報量割り当てのビット数の増減方法として、音源コードブックのサイズを変更しているが、音源信号のゲインの量子化ビット数を変化させても良い。

0115

実施の形態18.図10は本発明の実施の形態18の逆量子化装置の構成を示し、110は音韻復号手段、111は出力端子である。このような構成で、まず伝送路より伝送コード63を受信しデマルチプレクサ70でセグメント長31を復号する。それを用いて残りのLPCコード93、音源ゲイン95、ACBコード104、RCBコード105、音源コードブック選択コード95を復号又は分離する。音韻復号手段110はセグメント長31に基づいてLPCコード93から量子化されたLPCパラメータ92を復号化し出力する。続いて、音源コードブック選択コード95及びRCBコード105が指示する雑音音源と、ACBコード104が指示ずる適応音源をそれぞれの音源ゲインを乗算した後加算して音源信号99を生成し、復号されたLPCパラメータ92と上記音源信号99を用いて合成フィルタ100で復号音声101を生成し出力端子111より出力する。

0116

このような構成によれば、定められたトータル伝送情報量の制限内で入力音声の音源信号の量子化に要する情報量を最適配分し、入力音声特徴パラメータ変動量の極値に呼応する入力音声信号フレームを優先して量子化しているので、トータル伝送情報量が制限されていても、高品質を保ったまま効率的に逆量子化し得る逆量子化装置を実現できる。

0117

また、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームの音源信号に効率的に情報量を割り当てることができるので、復号音声の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても、高品質に逆量子化し得る逆量子化装置を実現できる。

0118

実施の形態19.上記実施の形態18では、図10に示した逆量子化装置内の雑音コードブックを用いて逆量子化を行っているが、図9に示した量子化装置と同一の雑音コードブックを用いて逆量子化しても良い。

0119

このようにすれば、定められたトータル伝送情報量の制限内で入力音声の音源信号の量子化に要する情報量を最適配分し、入力音声信号特徴パラメータ変動量の極値に呼応する入力音声信号フレームを優先して量子化しているので、トータル伝送情報量が制限されていても、高品質を保ったまま効率的に量子化逆量子化し得る量子化逆量子化装置を実現できる。

0120

また、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームの音源信号に効率的に情報量を割り当てることができるので、復号音声の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても、高品質に量子化逆量子化し得る量子化逆量子化装置を実現できる。

0121

実施の形態20.図11は本発明の量子化装置による実施の形態20の構成を示し、この構成の新たな部分について動作を説明する。特徴パラメータ変動量極大・極小値抽出手段80は、特徴パラメータ変動量極値系列54を極大値と極小値に分類し、極大部分の極大部分のフレーム番号83と、極小部分のフレーム番号84を音源コードブック選択手段94に出力する。音源コードブック選択手段94は、セグメント長及びトータル伝送情報量を勘案しながら、極大値からは値が大きなものから順に、また、極小値からは値が小さなものから順にフレームを選択し、該当するフレームに順位に応じたコードブックサイズを割り当てる。以上、決定されたコードブックを指定する音源コードブック選択コード95及び上記選定された極値部分のフレーム番号をマルチプレクサ62へ出力する。

0122

このような構成によれば、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームに効率的に情報量を割り当てることができる。従って復号音声の明瞭性及び自然性を向上し得、さらにトータル伝送情報量が制限されていても高品質に量子化し得るばかりでなく、入力音声特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力音声の音源信号の歪をより小さくできる。かくして復号音声の歪をより小さくし、更に高品質に量子化し得る量子化装置を実現できる。

0123

実施の形態21.上記実施の形態20の別の形態として、受信した極値部分を指定するフレーム番号のうち、極大部分と極小部分別々に値の大きさ順に優先度をつけて逆量子化しても良い。

0124

このようにすれば、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームに効率的に情報量を割り当てることができる。これにより、復号音声の明瞭性及び自然性を向上でき、トータル伝送情報量が制限されていても、高品質に逆量子化し得る。さらにこれに加えて、入力音声特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力音声の音源信号の歪をより小さくできる。かくして復号音声の歪をより小さくし、更に高品質に逆量子化し得る逆量子化装置を実現できる。

0125

実施の形態22.上記実施の形態20にて説明した量子化装置と、上記実施の形態21にて説明した逆量子化装置を組み合わせ、かつ両者で同一のコードブックを用いることにより、上記実施の形態19と同様な構成をとることも可能である。

0126

このようにすれば、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができる。これにより、復号音声の明瞭性及び自然性を向上でき、トータル伝送情報量が制限されていても、高品質に量子化逆量子化し得る。さらにこれに加えて、入力音声特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力音声の音源信号の量子化歪をより小さくできる。かくして復号音声の歪をより小さくし、更に高品質に量子化逆量子化し得る量子化逆量子化装置を実現できる。

0127

実施の形態23.上記実施の形態17、19、20又は22に加えて、極値に情報量を割りふる計画をする際に余剰情報量がある場合、上記実施の形態8と同様に、通常の極値の他に、例えば子音から母音にわたるような、音声過渡部の重要度の高い部分に相当する変動量パラメータの極値に呼応するフレームの近傍フレームを極値とみなし、量子化優先度及び情報量を再決定しても良い。

0128

このようにすれば、例えば音声信号の子音から母音にかけての過渡部など、入力音声信号にとって特に重要なフレーム及びその周辺フレームに集中的に情報量を集めて量子化でき、更に復号音声の明瞭性が向上し、高品質に量子化又は量子化逆量子化し得る量子化装置又は量子化逆量子化装置を実現できる。

0129

実施の形態24.上記実施の形態17、19、20又は22に加えて、数種類の仮の優先度及び情報量を設定し量子化を行った後、総合的に最も量子化歪が小さなものを選択する、いわゆるディレイドディシジョンを行っても良い。

0130

このような構成によれば、例えば蓄積符号化など符号化遅延が許される量子化において、トータル伝送情報量の制限下で、最も歪を小さくする音源コードブック及びコードブックサイズが選択できるので、更に高品質に量子化又は量子化逆量子化し得る量子化装置又は量子化逆量子化装置を実現できる。

0131

実施の形態25.上記実施の形態20又は実施の形態22に加えて、図7に示すように、極大部分に呼応するフレームは、より小さいフレーム(サブフレーム)に分割した後、それぞれのサブフレームについて入力音声信号の再分析を行い、その結果から得られるサブフレームの音源信号を量子化しても良い。

0132

このような構成によれば、上記実施の形態20又は実施の形態22で述べた効果に加え、入力音声特徴パラメータ変動量の極大部分に呼応するフレームをサブフレーム化して細かく分析し量子化することができるので、過渡部の特徴を最も端的に表現するフレームの時間変化形状の量子化歪を更に小さくできる新たな効果があり、更に明瞭性が向上した量子化又は量子化逆量子化し得る量子化装置又は量子化逆量子化装置を実現できる。

0133

実施の形態26.上記実施の形態20又は実施の形態22に加えて、図8に示すように、特徴パラメータ極小部分を代表として、その近傍の複数のフレームを超フレーム化した上でその超フレームを極小部分のフレームで表現し、近傍のフレームの余った情報量の全部ないし一部を極小部分に集め、極小部フレームの音源信号を精密に量子化することも可能である。

0134

このような構成によれば、上記実施の形態20又は実施の形態22で述べた効果に加え、入力信号の定常部の中でその特徴を最も端的に表現する極小部を代表フレームとし、なおかつ極小部に情報量を集中させているので、定常部の自然性が更に向上すると共に、トータル伝送情報量を削減し得る量子化装置又は量子化逆量子化装置を実現できる。

0135

実施の形態27.上記実施の形態25と、実施の形態26を合わせて用い、極小部分近傍フレーム情報量の一部を極大部分に回すことも可能である。

0136

このような構成によれば、上記実施の形態20又は実施の形態22で述べた効果に加え、入力音声の定常部の中でその特徴を最も端的に表現する極小部を代表フレームとし、なおかつ情報量を集中させているので、定常部の自然性が向上することに加えて、更に極小部分近傍でビット削減した分の情報量を過渡部の中の極大部分のフレームに回しているので、更に明瞭度を向上できる新たな効果がある量子化装置又は量子化逆量子化装置を実現できる。

0137

実施の形態28.上記実施の形態25の別の形態として、入力音声特徴パラメータ変化量の極大及び極小部分を代表フレームとし、その他のフレームについては量子化を行わずに、上記極大極小部分に呼応するフレームの音源信号で補間又は置換しても良い。

0138

このような構成によれば、上記実施の形態20又は実施の形態22で述べた効果に加え、さらに極大部フレームの音源信号を時間方向に細かく量子化した上で極値以外のフレームを極値フレームで補間又は置換しているので、トータル伝送情報量が制限されていても高品質を保ったまま量子化できると共に、品質劣化が最小限でトータル伝送情報量を削減できる新たな効果がある量子化装置又は量子化逆量子化装置を実現できる。

0139

実施の形態29.上記実施の形態26の別の形態として、入力音声特徴パラメータ変化量の極大及び極小部分を代表フレームとし、その他のフレームについては、量子化を行わずに、上記極大極小部分に呼応するフレームの音源信号で補間又は置換しても良い。

0140

このような構成によれば、上記実施の形態20又は実施の形態22で述べた効果に加え、さらに極小部フレームの音源信号に情報量を集中させて量子化できるので、トータル伝送情報量が制限されていても高品質を保ったまま量子化できると共に、特に入力音声の自然性品質劣化が最小限でトータル伝送情報量を削減できる新たな効果がある量子化装置又は量子化逆量子化装置を実現できる。

0141

実施の形態30.上記の実施の形態28又は29に加えて、極値以外のフレームにおいて、補間した後で量子化前の上記同フレームとの差分を量子化しても良い。

0142

このような構成においても、上記実施の形態28又は29と同様の効果が得られる量子化装置又は量子化逆量子化装置を実現できる。

0143

実施の形態31.上記実施の形態20又は実施の形態22において、極大及び極小部分の候補がトータル伝送情報量に比較して過剰な場合、上記実施の形態16と同様に、極小値の候補のうち低優先度の候補を削除し、その削除分を極大値の候補とするように量子化優先順位の修正を加えても良い。

0144

このようにすれば、極小部フレームの下位の候補から、重要度の高い極大部フレームに候補を優先するように修正を加えているので、極値フレームに割り当てる情報量が少なくなっても、入力音声の特に重要な特徴部分が保存されるので、品質劣化が最小限なままで量子化又は量子化逆量子化し得る量子化装置又は量子化逆量子化装置を実現できる。

0145

実施の形態32.上述の実施の形態1〜31における量子化手段を、適応差分PCMなどの波形を直接量子化ないし符号化する方法に置き換えても、上述の実施の形態1〜31と同様の効果を実現できる量子化装置、逆量子化装置又は量子化逆量子化装置を実現できる。

発明の効果

0146

上述のようにこの発明によれば、定められたトータル伝送情報量の制限内で入力信号の量子化に要する情報量を最適配分し、入力信号特徴パラメータ変動量の極値に呼応する入力信号を優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に量子化し得る量子化装置を実現できる。さらに、特徴パラメータ変動量の極値に呼応する入力信号、即ち入力信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質に量子化し得る量子化装置を実現できる。

0147

また次の発明によれば、定められたトータル伝送情報量の制限内で入力信号の量子化に要する情報量を最適配分し、入力信号特徴パラメータ変動量の極値に呼応する入力信号を優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に逆量子化し得る逆量子化装置を実現できる。さらに、特徴パラメータ変動量の極値に呼応する入力信号、即ち入力信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質に逆量子化し得る逆量子化装置を実現できる。

0148

また次の発明によれば、定められたトータル伝送情報量の制限内で入力信号の量子化に要する情報量を最適配分し、入力信号特徴パラメータ変動量の極値に呼応する入力信号を優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に量子化し逆量子化し得る量子化逆量子化装置を実現できる。さらに、特徴パラメータ変動量の極値に呼応する入力信号、即ち入力信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質に量子化し逆量子化し得る量子化逆量子化装置を実現できる。

0149

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、入力信号にとって特に重要な部分及びその近傍に集中的に情報量を集めて量子化することができるのでさらに明瞭性が向上し、高品質な量子化又は量子化逆量子化を行うことができる。

0150

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、符号化遅延が許される量子化において、最も量子化歪を小さくする量子化方法及びデータ量が選択できるので、さらに高品質な量子化又は量子化逆量子化を行うことができる。

0151

また次の発明によれば、特徴パラメータ変動量の極値に呼応する入力信号、即ち入力信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化を行うことが可能であるばかりでなく、入力信号特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力信号の量子化歪をより小さくするように量子化できるので、さらに高品質に量子化し得る量子化装置を実現できる。

0152

また次の発明によれば、特徴パラメータ変動量の極値に呼応する入力信号、即ち入力信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な逆量子化を行うことが可能であるばかりでなく、入力信号特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力信号の量子化歪をより小さくするように量子化できるので、さらに高品質に逆量子化し得る逆量子化装置を実現できる。

0153

また次の発明によれば、特徴パラメータ変動量の極値に呼応する入力信号、即ち入力信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化逆量子化を行うことが可能であるばかりでなく、入力信号特徴パラメータ変化量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力信号の量子化歪をより小さくするように量子化できるので、さらに高品質に量子化し逆量子化し得る量子化逆量子化装置を実現できる。

0154

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、入力信号にとって特に重要な部分及びその近傍に集中的に情報量を集めて量子化することができるのでさらに明瞭性が向上し、高品質な量子化又は量子化逆量子化を行うことができる。

0155

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、符号化遅延が許される量子化において、最も量子化歪を小さくする量子化方法及びデータ量が選択できるので、さらに高品質な量子化又は量子化逆量子化を行うことができる。

0156

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、極小部分の下位の候補から、重要度の高い極大部分に候補を優先するように修正を加えているので、極値に割り当てる情報量が少なくなっても、入力信号の特に重要な特徴部分が保存されるので、品質劣化が最小限なままで量子化又は量子化逆量子化を行うことができる。

0157

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、入力信号特徴パラメータ変動量の極大部分に呼応する入力信号を時間方向に細かく分析し量子化することができるので、過渡部の特徴を最も端的に表現する部分の時間変化形状の量子化歪をさらに小さくでき、さらに明瞭性が向上した量子化又は量子化逆量子化を行うことができる。

0158

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、入力信号の定常部の中でその特徴を最も端的に表現する極小部を代表とし、なおかつ情報量を集中させているので、定常部の自然性がさらに向上すると共に、トータル伝送情報量を削減できる。

0159

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、さらに極大部を時間方向に細かく量子化した上で極値以外部分を極値部分で補間または置換しているので、トータル伝送情報量が制限されていても高品質を保ったまま量子化できると共に、品質劣化が最小限でトータル伝送情報量を削減できる。

0160

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、さらに極小部に情報量を集中させて量子化できるので、トータル伝送情報量が制限されていても高品質を保ったまま量子化できると共に、特に入力信号の自然性品質劣化が最小限でトータル伝送情報量を削減できる。

0161

また次の発明によれば、定められたトータル伝送情報量の制限内で入力音声の音源信号の量子化に要する情報量を最適配分し、入力音声信号特徴パラメータ変動量の極値に呼応する入力音声信号フレームを優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に量子化し得る量子化装置を実現できる。さらに、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームの音源信号に効率的に情報量を割り当てることができるので、復号音声信号の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質に量子化し得る量子化装置を実現できる。

0162

また次の発明によれば、定められたトータル伝送情報量の制限内で入力音声の音源信号の量子化に要する情報量を最適配分し、入力音声特徴パラメータ変動量の極値に呼応する入力音声信号フレームを優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に逆量子化し得る逆量子化装置を実現できる。さらに、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームの音源信号に効率的に情報量を割り当てることができるので、復号音声の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質に逆量子化し得る逆量子化装置を実現できる。

0163

また次の発明によれば、定められたトータル伝送情報量の制限内で入力音声の音源信号の量子化に要する情報量を最適配分し、入力音声信号特徴パラメータ変動量の極値に呼応する入力音声信号フレームを優先して量子化しているので、トータル伝送情報量が制限されていても高品質を保ったまま効率的に量子化し逆量子化し得る量子化逆量子化装置を実現できる。さらに、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームの音源信号に効率的に情報量を割り当てることができるので、復号音声の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質に量子化し逆量子化し得る量子化逆量子化装置を実現できる。

0164

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、例えば音声信号の子音から母音にかけての過渡部など、入力音声信号にとって特に重要なフレーム及びその周辺フレームに集中的に情報量を集めて量子化することができるので、更に復号音声の明瞭性が向上し、高品質な量子化又は量子化逆量子化を行うことができる。

0165

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、例えば、蓄積符号化など符号化遅延が許される量子化において、トータル伝送情報量の制限下で、最も歪を小さくする音源コードブック及びコードブックサイズが選択できるので、更に高品質な量子化又は量子化逆量子化を行うことができる。

0166

また次の発明によれば、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームに効率的に情報量を割り当てることができるので、復号音声の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化を行うことが可能であるばかりでなく、入力音声特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力音声の音源信号の歪をより小さくできるので復号音声の歪をより小さくなり、更に高品質に量子化し得る量子化装置を実現できる。

0167

また次の発明によれば、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現しているフレームに効率的に情報量を割り当てることができるので、復号音声の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な逆量子化を行うことが可能であるばかりでなく、入力音声特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力音声の音源信号の歪をより小さくできるので復号音声の歪がより小さくなり、更に高品質に逆量子化し得る逆量子化装置を実現できる。

0168

また次の発明によれば、特徴パラメータ変動量の極値に呼応する入力音声信号、即ち入力音声信号の過渡部及び定常部の中でもそれらの特徴を最も端的に表現している部分に効率的に情報量を割り当てることができるので、復号音声の明瞭性及び自然性を向上できる効果があり、トータル伝送情報量が制限されていても高品質な量子化逆量子化を行うことが可能であるばかりでなく、入力音声特徴パラメータ変動量の極値のうち、極大値の大きなものから順に、また極小値については値が小さなものから順に、それぞれ選択された順に情報量を優先的に配分して量子化しているので、セグメント内において明瞭性に大きく影響する過渡部の変動が大きな順、また、自然性に大きく影響する定常部の変動が小さい順に、それぞれ呼応する入力音声の音源信号の量子化歪をより小さくするので復号音声の歪がより小さくなり、更に高品質に量子化し逆量子化し得る量子化逆量子化装置を実現することができる。

0169

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、例えば音声信号の子音から母音にかけての過渡部など、入力音声信号にとって特に重要なフレーム及びその周辺フレームに集中的に情報量を集めて量子化することができるので、更に復号音声の明瞭性が向上し、高品質な量子化又は量子化逆量子化を行うことができる。

0170

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、例えば、蓄積符号化など符号化遅延が許される量子化において、トータル伝送情報量の制限下で、最も歪を小さくする音源コードブック及びコードブックサイズが選択できるので、更に高品質な量子化又は量子化逆量子化を行うことができる。

0171

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、極小部フレームの下位の候補から、重要度の高い極大部フレームに候補を優先するように修正を加えているので、極値フレームに割り当てる情報量が少なくなっても、入力音声の特に重要な特徴部分が保存されるので、品質劣化が最小限なままで量子化又は量子化逆量子化を行うことができる。

0172

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、さらに、入力音声特徴パラメータ変動量の極大部分に呼応するフレームをサブフレーム化して細かく分析し量子化することができるので、過渡部の特徴を最も端的に表現するフレームの時間変化形状の量子化歪を更に小さくできる新たな効果があり、更に明瞭性が向上した量子化又は量子化逆量子化を行うことができる。

0173

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、さらに、入力信号の定常部の中でその特徴を最も端的に表現する極小部を代表フレームとし、なおかつ極小部に情報量を集中させているので、定常部の自然性が更に向上すると共に、トータル伝送情報量を削減できる新たな効果がある。

0174

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、さらに極大部フレームの音源信号を時間方向に細かく量子化した上で極値以外のフレームを極値フレームで補間又は置換しているので、トータル伝送情報量が制限されていても高品質を保ったまま量子化できると共に、品質劣化が最小限でトータル伝送情報量を削減できる新たな効果がある。

0175

さらに次の発明によれば、上述の量子化装置又は逆量子化装置に加えて、さらに極小部フレームの音源信号に情報量を集中させて量子化できるので、トータル伝送情報量が制限されていても高品質を保ったまま量子化できると共に、特に入力音声の自然性品質劣化が最小限でトータル伝送情報量を削減できる新たな効果がある。

図面の簡単な説明

0176

図1この発明による量子化装置の実施の形態1の構成を示すブロック図である。
図2この発明による逆量子化装置の実施の形態2の構成を示すブロック図である。
図3この発明による量子化装置の実施の形態4の構成を示すブロック図である。
図4ケプストラム動的尺度とその極値の関係の説明に供する信号波形図である。
図5ケプストラム動的尺度とその極大値及び極小値の関係の説明に供する信号波形図である。
図6ケプストラム動的尺度とその極大値及び極小値の関係の説明に供する信号波形図である。
図7ケプストラム動的尺度の極大値と入力信号フレームとの関係の説明に供する信号波形図である。
図8ケプストラム動的尺度の極小値と入力信号フレームとの関係の説明に供する信号波形図である。
図9この発明の実施の形態17の構成を示すブロック図である。
図10この発明の実施の形態18の構成を示すブロック図である。
図11この発明の実施の形態20の構成を示すブロック図である。
図12従来の音声符号化復号化装置(音韻情報量子化部分)の構成を示すブロック図である。
図13従来の可変レート音声符号化復号化装置の構成を示すブロック図である。

--

0177

1入力端子
2セグメンテーション尺度計算部
3 セグメンテーション部
4LPC分析部
5LPC係数マトリクス/ベクトル量子化部
6ピッチ計算部
7 判定部
8 マトリクス/ベクトル選択部
9マトリクスコードブック
10ベクトルコードブック
11 セグメンテーションされた音声信号
12セグメンテーション情報
13 LPC係数
14ピッチ周期T
15判別情報
16 LPC係数符号
17 セグメンテーション尺度
18重み付け部
19 マトリクス/ベクトル復号部
20インパルス応答計算部
21自己相関関数計算部
22相互相関関数計算部
23ピッチ復号部
24音源パルス計算部
25量子化部
200ディジタル音声信号
201符号化ユニット
202データ列S2
203 データスチーラ
204 データ列S3
205符号化音声信号
206 データフィラー
207 データ列S4
208復号化ユニット
209復号音声信号
30入力信号系列
31セグメント数及びセグメント長信号
32有声/無声/無音フラグ
33フレームエネルギ信号
34ピッチ周期信号
35 セグメンテーション手段
36 セグメンテーションされた入力信号
37パワー分析手段
38ピッチ分析手段
39 入力信号分析手段
40 入力信号特徴パラメータ分析手段
41LSPパラメータ
42メモリA
43ケプストラムパラメータ
44 メモリB
45パワー量子化手段
46ピッチ量子化手段
47パワーコード
48 パワーコードデータ量
49 ピッチコード
50 ピッチコードデータ量
51 特徴パラメータ変動量算出手段
52 特徴パラメータ変動量系列
53 特徴パラメータ変動量極値抽出手段
54 極値の個数
55 極値に呼応する入力信号のフレーム番号
56量子化データ量決定手段
57総データ量信号
58コードブック選択コード
59 コードブックA
60 量子化手段
61 LSPコード
62マルチプレクサ
63伝送コード
70デマルチプレクサ
71 ピッチ復号手段
72 パワー復号手段
73逆量子化手段
74 コードブックB
75 復号ピッチ信号
76復号フレームエネルギ信号
77 復号LSPパラメータ
80 特徴パラメータ変動量極大・極小値抽出手段
81極大値配列メモリCa
82 極小値配列メモリCb
83 極大部分のフレーム番号
84極小部分のフレーム番号
85 量子化データ量決定手段
86選定された極値部分のフレーム番号
90入力音声分析手段
91音韻量子化手段
92 量子化されたLPCパラメータ
93 LPCコード
94音源コードブック選択手段
95 音源コードブック選択コード
96適応コードブック(ACB)
97雑音コードブック(RCB)
98 雑音コードブック切り替えスイッチ
99音源信号
100合成フィルタ
101復号音声
102聴覚重み付け手段
103検索手段
104 ACBコード
105 RCBコード
106 音源ゲイン
110 音韻復号手段
111 出力端子

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社東芝の「 AD変換回路」が 公開されました。( 2020/09/24)

    【課題】一つの実施形態は、信号に含まれる誤差を低減できるAD変換回路を提供することを目的とする。【解決手段】一つの実施形態によれば、AD変換回路の第1のΔΣ変換回路において、第1の量子化器は、1.5ビ... 詳細

  • 株式会社デンソーの「 データ圧縮方法、データ圧縮装置」が 公開されました。( 2020/09/24)

    【課題】データを可逆的且つ効率よく圧縮することができるデータ圧縮方法、データ圧縮装置を提供する。【解決手段】実施形態のデータ圧縮方法は、文字および数字の少なくとも一方を含むデータを圧縮するものであって... 詳細

  • 菊水電子工業株式会社の「 プログラム生成システム、そのコンピュータプログラム及び記録媒体」が 公開されました。( 2020/09/24)

    【課題】旧システムの通信モニター記録などに基づいて、旧システムのロジックを新システムでも再現するためのプログラム生成システム、およびそのプログラムを提供する【解決手段】システムのプロセッサが推論エンジ... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ