図面 (/)

技術 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体

出願人 シャープ株式会社
発明者 海木延佳
出願日 1998年1月5日 (22年10ヶ月経過) 出願番号 1998-000517
公開日 1999年7月21日 (21年4ヶ月経過) 公開番号 1999-194799
状態 特許登録済
技術分野 音声の分析・合成 圧縮、伸長・符号変換及びデコーダ
主要キーワード 時間波形データ 遷移帯域 分析周期 遮断域 削減器 周波数重み付け bit精度 エイリアス成分
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1999年7月21日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

課題

次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる楽音符号化装置および楽音符号化装置およびプログラム記憶媒体を提供する。

解決手段

符号化部231の周波数帯域分割部212は、楽音波形データを複数の周波数帯域に分割する。上記符号化部231の時間−周波数変換部214は、周波数帯域分割部212により分割された周波数帯域毎波形データを各周波数領域のパラメータに変換する。上記符号化部231の符号化重み付け部214は、周波数帯域分割部212の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化するための周波数帯域合成部222の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、時間−周波数変換部214により変換された各周波数領域のパラメータに重みを付ける。

概要

背景

従来より、楽音符合化する楽音符号化装置およびその符号化された符号化データを復号化して楽音を再生する楽音復号化装置では、聴覚的に符号化再生後の再現性が高く、処理量が少なく、かつ、圧縮率の高い方式が望まれている。

このため、楽音の圧縮にあたっては、楽音波形データを時間領域から周波数領域に変換し、周波数領域において用いられていない周波数帯域の成分を伝送しないと同時に、人間の聴覚モデル(主に同時マスキングや最少可聴限のモデル等)に基づいて、各周波数帯域における伝送ビット幅を制限することにより高圧縮率を実現している。このような時間領域から周波数領域への変換の1つの手法としてサブバンドコーディング(以下、SBCという)による方式がある。このサブバンドコーディング方式は、信号をバンドパスフィルタに通して希望とする周波数帯域のみを通過させることによって、周波数帯域に分割するものである。この場合、演算量・データ量を減少させるためにダウンサンプリングを行うが、フィルタサイドロープによる影響のためエイリアシングが生じる。そのエイリアシングの影響を最小限にするには、演算量が多くなる次数の高いフィルタを構成する必要がある。この問題を解決するため、QMF(Quadrature Mirror Filter)フィルタバンクを構成して、楽音の合成時にこのエイリアシングの影響を除去する工程が多く採用されている。

さらに、時間領域から周波数領域に変換する一般的な手法としてMDCT(Modify Discrete Cosine Transform)のようなトランスフォームコーディング(以下、TFCという)による工程がある。このTFCとSBCとを組み合わせて、各周波数帯域で信号の定常性を調べ、定常的な場合は分析窓を長くして周波数分解能を上げる一方、非定常な場合は分析窓を短くすることによって時間分解能を上げることによって、より圧縮率が高く再現性のよい楽音符号化を実現している。

これらSBCとTFCとを組み合わせた楽音圧縮手法の代表的なものとしては、MD(mini disc)に使われているATRAC(adaptive transform acoustic coding)方式や、MPEG(Moving Picture Experts Group)1,2のLayer3がよく知られている。

上記MPEGのLayer3(JIS(日本工業規格)−X4323およびISO/IEC11172−3参照)では、SBCにQMFフィルタバンクを用い、その後、TFCにMDCT分析を用いて楽音波形データの符号化と復号化を行っている。このMPEGのLayer3では、折り返し歪み削減器の構成を用いることによって、QMFフィルタバンクの悪影響を防ぐことが可能となっている。

図8は従来の楽音波形データを圧縮して符号化する楽音符号化装置101と、その楽音符号化装置101により符号化された符号化データを復号化する楽音復号化装置102の構成を示す概略ブロック図である。

図8において、上記楽音符号化装置101は、楽音入力部110と、周波数帯域分割部(帯域フィルタ)112と、時間−周波数変換部114と、量子化部116と、聴覚モデル算出部118と、符号化列生成部117および符号化データ出力部119で構成されている。また、上記楽音復号化装置102は、符号化データ入力部129と、符号化列復号部127と、逆量子化部126と、周波数−時間変換部124と、周波数帯域合成部(帯域フィルタ)122および楽音出力部120で構成されている。

以下、上記楽音符号化装置101と楽音復号化装置102の動作を説明する。

まず、最初に楽音符号化装置101では、入力された楽音波形データを分析フレーム単位に切り出して、切り出された楽音波形データを周波数帯域分割部(帯域フィルタ)112および聴覚モデル算出部118に出力する。

次に、上記周波数帯域分割部(帯域フィルタ)112は、楽音入力部110から出力された楽音波形データをバンドパス(ハイパスローパスを含む)フィルタを通して希望とする周波数帯域のみを通過させることによって、特定の周波数帯域のみを含む時間波形データにいくつか分割して、ダウンサンプリングを行ってサンプリング変換した後、分割されサンプリング変換された時間波形データを時間−周波数変換部114に出力する。

次に、上記時間−周波数変換部114は、いくつかに分割された特定の周波数帯域のみを含む時間波形データを、MDCT等の手法により周波数帯域毎に周波数領域のパラメータに変換して、変換されたパラメータを量子化部116に出力する。

また、上記聴覚モデル算出部118は、楽音入力部110から出力された楽音波形データをFFT等を用いて周波数分析を行い、同時マスキング・最小可聴限等の聴覚モデルに基づいて、量子化のための各周波数帯域における量子化ビットの精度を決定して、決定された量子化ビットの精度を表す信号を量子化部116に出力する。

次に、上記量子化部116は、聴覚モデル算出部118によって算出された量子化のための各周波数帯域における量子化ビットの精度に基づいて、時間−周波数変換部114によって変換された各周波数領域の特徴を表すパラメータの精度を打ち切り、各周波数領域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データを符号化列生成部117に出力する。

そして、上記符号化列生成部117では、量子化部116によって生成された各周波数領域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データを伝送(または蓄積)するために圧縮率が高くなるように符号化列に変換する。そうして、上記符号化列生成部117変換された符号化列を受けた符号化データ出力部119によって、符号化データが出力されて、伝送路に伝送(または記憶媒体に蓄積)される。

次に、上記楽音復号化装置102について説明する。伝送(または蓄積)された符号化データが符号化データ入力部129に入力され、符号化データ入力部129から入力された符号化データが符号化列復号部127に出力される。上記符号化列復号部127では、楽音符号化装置101の符号化列生成部117によって符号化データが圧縮されて伝送(または蓄積)された符号化列を、各周波数領域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データに復号化して、復号化された量子化符号化データを逆量子化部126に出力する。

次に、上記逆量子化部126では、符号化列復号部127で分離された量子化符号化データを逆量子化して、各周波数領域のパラメータに変換すると共に、周波数−時間変換部124の演算精度に戻した後、各周波数領域のパラメータを周波数−時間変換部124に出力する。

次に、上記周波数−時間変換部124では、逆量子化部126からの逆量子化された各周波数領域のパラメータをIMDCT等を用いて周波数成分を時間成分である時間波形データに変換して、変換された時間波形データを周波数帯域合成部(帯域フィルタ)122に出力する。

次に、上記周波数帯域合成部(帯域フィルタ)122では、いくつかに分割された特定の周波数帯域のみを含む周波数成分から変換された時間成分である時間波形データをアップサンプリングして、サンプリング変換した後、バンドパス(ハイパス、ローパスを含む)フィルタを通して希望とする周波数帯域のみを通過させた後、いくつかの特定の周波数帯域のみを含む時間波形データを合成することによって、楽音波形データに復号化することができる。

そして、上記楽音出力部120では、周波数帯域合成部(帯域フィルタ)122からの復号化された楽音波形データを分析フレーム単位に合成して出力する。

概要

次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる楽音符号化装置および楽音符号化装置およびプログラム記憶媒体を提供する。

符号化部231の周波数帯域分割部212は、楽音波形データを複数の周波数帯域に分割する。上記符号化部231の時間−周波数変換部214は、周波数帯域分割部212により分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する。上記符号化部231の符号化重み付け部214は、周波数帯域分割部212の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化するための周波数帯域合成部222の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、時間−周波数変換部214により変換された各周波数領域のパラメータに重みを付ける。

目的

そこで、この発明の目的は、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体を提供することにある。

効果

実績

技術文献被引用数
1件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符合化する符号化部を備えた楽音符号化装置において、上記符号化部は、上記楽音波形データを複数の周波数帯域に分割する周波数帯域分割フィルタバンクと、上記周波数帯域分割用フィルタバンクにより分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する時間−周波数変換部と、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記時間−周波数変換部により変換された上記各周波数領域のパラメータに重み付けする符号化重み付け部とを備えたことを特徴とする楽音符号化装置。

請求項2

楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを圧縮して符合化する符号化部を備えた楽音符号化装置において、上記符号化部は、上記楽音波形データを複数の周波数帯域に分割する周波数帯域分割用フィルタバンクと、上記周波数帯域分割用フィルタバンクにより分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する時間−周波数変換部と、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記周波数帯域分割用フィルタバンクに入力される楽音波形データと、上記周波数帯域分割用フィルタバンクで分割されて上記時間−周波数変換部に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする符号化重み付け部とを備えたことを特徴とする楽音符号化装置。

請求項3

符号化側で楽音波形データを周波数帯域分割用フィルタバンクを用いて目的とする周波数帯域毎に分割して、その分割された波形データが符合化された符号化データを復号化して楽音を再生する復号化部を備えた楽音復号化装置において、上記復号化部は、上記楽音波形データの各周波数領域のパラメータを周波数帯域毎の波形データに変換する周波数−時間変換部と、上記周波数−時間変換部により変換された上記周波数帯域毎の波形データを合成する周波数帯域合成用フィルタバンクと、上記楽音波形データを符号化する符号化側の上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、上記周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記周波数−時間変換部に入力される上記各周波数領域のパラメータに重み付けする復号化重み付け部とを備えたことを特徴とする楽音復号化装置。

請求項4

請求項1または2に記載の楽音符号化装置と請求項3に記載の楽音復号化装置とを備えて、上記楽音符号化装置により楽音を符号化すると共に、上記楽音符号化装置により符号化された符号化データを上記楽音復号化装置により復号化して楽音を再生することを特徴とする楽音符号化復号化装置

請求項5

楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符号化するためのプログラムを記録しているプログラム記憶媒体であって、上記楽音波形データを複数の周波数帯域に分割する周波数帯域分割用フィルタバンク処理工程と、上記周波数帯域分割用フィルタバンク処理工程により分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する時間−周波数変換工程と、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記時間−周波数変換工程により変換された上記各周波数領域のパラメータに重み付けする符号化重み付け工程とを有するプログラムを記録していることを特徴とするプログラム記憶媒体。

請求項6

楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符号化するためのプログラムを記録しているプログラム記憶媒体であって、上記楽音波形データを複数の周波数帯域に分割する周波数帯域分割用フィルタバンク処理工程と、上記周波数帯域分割用フィルタバンク処理工程により分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する時間−周波数変換工程と、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記周波数帯域分割用フィルタバンク処理工程で分割される前の楽音波形データと、上記周波数帯域分割用フィルタバンク処理工程により分割された後かつ上記時間−周波数変換工程で変換される前の上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする符号化重み付け工程とを有するプログラムを記録していることを特徴とするプログラム記憶媒体。

請求項7

符号化側で楽音波形データを周波数帯域分割用フィルタバンク処理工程によって目的とする周波数帯域毎に分割して、その分割された波形データが符合化された符号化データを復号化して楽音を再生するためのプログラムを記録しているプログラム記憶媒体であって、上記楽音波形データの各周波数領域のパラメータを周波数帯域毎の波形データに変換する周波数−時間変換工程と、上記周波数−時間変換工程により変換された上記周波数帯域毎の波形データを合成する周波数帯域合成用フィルタバンク処理工程と、上記楽音波形データを符号化する符号化側の上記周波数帯域分割用フィルタバンク工程の各周波数領域における歪みを平坦にする特性と、上記周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み付け係数に基づいて、上記周波数−時間変換工程により変換される前の上記各周波数領域のパラメータに重み付けする復号化重み付け工程とを有するプログラムを記録していることを特徴とするプログラム記憶媒体。

技術分野

0001

この発明は、任意の入力楽音分析,圧縮して符号化する楽音符号化装置およびその符号化されたデータを復号化して楽音を合成する楽音復号化装置および任意の入力楽音を分析,圧縮して符号化してその符号化されたデータを復号化して楽音を合成する楽音符号化復号化装置およびプログラム記憶媒体に関する。

背景技術

0002

従来より、楽音を符合化する楽音符号化装置およびその符号化された符号化データを復号化して楽音を再生する楽音復号化装置では、聴覚的に符号化再生後の再現性が高く、処理量が少なく、かつ、圧縮率の高い方式が望まれている。

0003

このため、楽音の圧縮にあたっては、楽音波形データを時間領域から周波数領域に変換し、周波数領域において用いられていない周波数帯域の成分を伝送しないと同時に、人間の聴覚モデル(主に同時マスキングや最少可聴限のモデル等)に基づいて、各周波数帯域における伝送ビット幅を制限することにより高圧縮率を実現している。このような時間領域から周波数領域への変換の1つの手法としてサブバンドコーディング(以下、SBCという)による方式がある。このサブバンドコーディング方式は、信号をバンドパスフィルタに通して希望とする周波数帯域のみを通過させることによって、周波数帯域に分割するものである。この場合、演算量・データ量を減少させるためにダウンサンプリングを行うが、フィルタサイドロープによる影響のためエイリアシングが生じる。そのエイリアシングの影響を最小限にするには、演算量が多くなる次数の高いフィルタを構成する必要がある。この問題を解決するため、QMF(Quadrature Mirror Filter)フィルタバンクを構成して、楽音の合成時にこのエイリアシングの影響を除去する工程が多く採用されている。

0004

さらに、時間領域から周波数領域に変換する一般的な手法としてMDCT(Modify Discrete Cosine Transform)のようなトランスフォームコーディング(以下、TFCという)による工程がある。このTFCとSBCとを組み合わせて、各周波数帯域で信号の定常性を調べ、定常的な場合は分析窓を長くして周波数分解能を上げる一方、非定常な場合は分析窓を短くすることによって時間分解能を上げることによって、より圧縮率が高く再現性のよい楽音符号化を実現している。

0005

これらSBCとTFCとを組み合わせた楽音圧縮手法の代表的なものとしては、MD(mini disc)に使われているATRAC(adaptive transform acoustic coding)方式や、MPEG(Moving Picture Experts Group)1,2のLayer3がよく知られている。

0006

上記MPEGのLayer3(JIS(日本工業規格)−X4323およびISO/IEC11172−3参照)では、SBCにQMFフィルタバンクを用い、その後、TFCにMDCT分析を用いて楽音波形データの符号化と復号化を行っている。このMPEGのLayer3では、折り返し歪み削減器の構成を用いることによって、QMFフィルタバンクの悪影響を防ぐことが可能となっている。

0007

図8は従来の楽音波形データを圧縮して符号化する楽音符号化装置101と、その楽音符号化装置101により符号化された符号化データを復号化する楽音復号化装置102の構成を示す概略ブロック図である。

0008

図8において、上記楽音符号化装置101は、楽音入力部110と、周波数帯域分割部(帯域フィルタ)112と、時間−周波数変換部114と、量子化部116と、聴覚モデル算出部118と、符号化列生成部117および符号化データ出力部119で構成されている。また、上記楽音復号化装置102は、符号化データ入力部129と、符号化列復号部127と、逆量子化部126と、周波数−時間変換部124と、周波数帯域合成部(帯域フィルタ)122および楽音出力部120で構成されている。

0009

以下、上記楽音符号化装置101と楽音復号化装置102の動作を説明する。

0010

まず、最初に楽音符号化装置101では、入力された楽音波形データを分析フレーム単位に切り出して、切り出された楽音波形データを周波数帯域分割部(帯域フィルタ)112および聴覚モデル算出部118に出力する。

0011

次に、上記周波数帯域分割部(帯域フィルタ)112は、楽音入力部110から出力された楽音波形データをバンドパス(ハイパスローパスを含む)フィルタを通して希望とする周波数帯域のみを通過させることによって、特定の周波数帯域のみを含む時間波形データにいくつか分割して、ダウンサンプリングを行ってサンプリング変換した後、分割されサンプリング変換された時間波形データを時間−周波数変換部114に出力する。

0012

次に、上記時間−周波数変換部114は、いくつかに分割された特定の周波数帯域のみを含む時間波形データを、MDCT等の手法により周波数帯域毎に周波数領域のパラメータに変換して、変換されたパラメータを量子化部116に出力する。

0013

また、上記聴覚モデル算出部118は、楽音入力部110から出力された楽音波形データをFFT等を用いて周波数分析を行い、同時マスキング・最小可聴限等の聴覚モデルに基づいて、量子化のための各周波数帯域における量子化ビットの精度を決定して、決定された量子化ビットの精度を表す信号を量子化部116に出力する。

0014

次に、上記量子化部116は、聴覚モデル算出部118によって算出された量子化のための各周波数帯域における量子化ビットの精度に基づいて、時間−周波数変換部114によって変換された各周波数領域の特徴を表すパラメータの精度を打ち切り、各周波数領域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データを符号化列生成部117に出力する。

0015

そして、上記符号化列生成部117では、量子化部116によって生成された各周波数領域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データを伝送(または蓄積)するために圧縮率が高くなるように符号化列に変換する。そうして、上記符号化列生成部117変換された符号化列を受けた符号化データ出力部119によって、符号化データが出力されて、伝送路に伝送(または記憶媒体に蓄積)される。

0016

次に、上記楽音復号化装置102について説明する。伝送(または蓄積)された符号化データが符号化データ入力部129に入力され、符号化データ入力部129から入力された符号化データが符号化列復号部127に出力される。上記符号化列復号部127では、楽音符号化装置101の符号化列生成部117によって符号化データが圧縮されて伝送(または蓄積)された符号化列を、各周波数領域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データに復号化して、復号化された量子化符号化データを逆量子化部126に出力する。

0017

次に、上記逆量子化部126では、符号化列復号部127で分離された量子化符号化データを逆量子化して、各周波数領域のパラメータに変換すると共に、周波数−時間変換部124の演算精度に戻した後、各周波数領域のパラメータを周波数−時間変換部124に出力する。

0018

次に、上記周波数−時間変換部124では、逆量子化部126からの逆量子化された各周波数領域のパラメータをIMDCT等を用いて周波数成分を時間成分である時間波形データに変換して、変換された時間波形データを周波数帯域合成部(帯域フィルタ)122に出力する。

0019

次に、上記周波数帯域合成部(帯域フィルタ)122では、いくつかに分割された特定の周波数帯域のみを含む周波数成分から変換された時間成分である時間波形データをアップサンプリングして、サンプリング変換した後、バンドパス(ハイパス、ローパスを含む)フィルタを通して希望とする周波数帯域のみを通過させた後、いくつかの特定の周波数帯域のみを含む時間波形データを合成することによって、楽音波形データに復号化することができる。

0020

そして、上記楽音出力部120では、周波数帯域合成部(帯域フィルタ)122からの復号化された楽音波形データを分析フレーム単位に合成して出力する。

発明が解決しようとする課題

0021

上記楽音符号化装置101と楽音復号化装置102では、SBC等バンドパス(ハイパス、ローパスを含む)フィルタを通して希望とする周波数帯域のみを通過させることによって、周波数帯域に分割する場合、フィルタの設計によりその通過域,遮断域および過渡域の周波数特性が変わってくる。理想的には、通過域の特性をなるべく平坦にし、エイリアス成分がなるべく少なくなるように過渡域の領域をなるべく小さくすると共に、遮断域の遮断特性を大きくする必要がある。しかしながら、理想的な特性を有するフィルタを設計しようとすると、フィルタの次数が極めて大きくなり、信号も遅延するため、コスト等も考慮に入れて実用上問題のない限界を見極め、なるべく少ない次数に設計されたフィルタを利用している。

0022

そこで、この発明の目的は、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体を提供することにある。

課題を解決するための手段

0023

上記目的を達成するため、請求項1の楽音符号化装置は、楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符合化する符号化部を備えた楽音符号化装置において、上記符号化部は、上記楽音波形データを複数の周波数帯域に分割する周波数帯域分割用フィルタバンクと、上記周波数帯域分割用フィルタバンクにより分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する時間−周波数変換部と、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記時間−周波数変換部により変換された上記各周波数領域のパラメータに重み付けする符号化重み付け部とを備えたことを特徴としている。

0024

上記請求項1の楽音符号化装置によれば、上記符号化部の周波数帯域分割用フィルタバンクは、上記楽音波形データを複数の周波数帯域に分割し、その周波数帯域分割用フィルタバンクにより分割された周波数帯域毎の波形データを符号化部の時間−周波数変換部により各周波数領域のパラメータに変換する。そして、上記符号化重み付け部によって、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上記時間−周波数変換部により変換された上記各周波数領域のパラメータに重み付けする。そうして、符号化側の周波数特性が平坦になるように補正する。または、上記符号化重み付け部によって、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上記時間−周波数変換部により変換された上記各周波数領域のパラメータに重み付けする。そうして、復号化側の周波数特性が平坦になるように補正する。または、上記符号化重み付け部によって、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性とを有する重み係数に基づいて、上記時間−周波数変換部により変換された上記各周波数領域のパラメータに重み付けする。そうして、符号化側と復号化側の両方の周波数特性が平坦になるように補正する。この場合、符号化側と復号化側の両方の周波数特性を合成した特性を符号化側で補正すればよいので、構成を簡単にすることが可能である。

0025

したがって、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる。

0026

また、規格仕様として、例えば楽音波形の16bit精度の楽音を扱うことを想定して設計された楽音符号化方式の場合、周波数帯域分割用フィルタバンクの通過域の周波数特性は16bit精度として十分な設計を行っているが、16bit以上の例えば20bit、24bitといった楽音波形の精度を扱おうとすると、フィルタの通過域の精度が不充分な場合が一般的である。一般的に復号化側の規格は定められているが符号化側の規格は定められておらず、任意の方式を取ることが可能な場合が多いため、符号化側において復号化側のフィルタ精度の影響を考慮に入れることにより、規格をなんら変更せずに、規格想定時以上の楽音波形の精度を実現することが可能となる。

0027

また、請求項2の楽音符号化装置は、楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを圧縮して符合化する符号化部を備えた楽音符号化装置において、上記符号化部は、上記楽音波形データを複数の周波数帯域に分割する周波数帯域分割用フィルタバンクと、上記周波数帯域分割用フィルタバンクにより分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する時間−周波数変換部と、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記周波数帯域分割用フィルタバンクに入力される楽音波形データと、上記周波数帯域分割用フィルタバンクで分割されて上記時間−周波数変換部に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする符号化重み付け部とを備えたことを特徴としている。

0028

上記請求項2の楽音符号化装置によれば、上記符号化部の周波数帯域分割用フィルタバンクは、上記楽音波形データを複数の周波数帯域に分割し、その周波数帯域分割用フィルタバンクにより分割された周波数帯域毎の波形データを符号化部の時間−周波数変換部により各周波数領域のパラメータに変換する。このとき、上記符号化重み付け部によって、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上周波数帯域分割用フィルタバンクに入力される楽音波形データと上記周波数帯域分割用フィルタバンクで分割されて上記時間−周波数変換部に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする。そうして、符号化側の周波数特性が平坦になるように補正する。または、上記符号化重み付け部によって、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、周波数帯域分割用フィルタバンクに入力される楽音波形データと上記周波数帯域分割用フィルタバンクで分割されて上記時間−周波数変換部に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする。そうして、復号化側の周波数特性が平坦になるように補正する。または、上記符号化重み付け部によって、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性とを有する重み係数に基づいて、周波数帯域分割用フィルタバンクに入力される楽音波形データと上記周波数帯域分割用フィルタバンクで分割されて上記時間−周波数変換部に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする。そうして、符号化側と復号化側の両方の周波数特性が平坦になるように補正する。この場合、符号化側と復号化側の両方の周波数特性を合成した特性を符号化側で補正すればよいので、構成を簡単にすることが可能である。

0029

したがって、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる。

0030

また、規格・仕様として、例えば楽音波形の16bit精度の楽音を扱うことを想定して設計された楽音符号化方式の場合、周波数帯域分割用フィルタバンクの通過域の周波数特性は16bit精度として十分な設計を行っているが、16bit以上の例えば20bit、24bitといった楽音波形の精度を扱おうとすると、フィルタの通過域の精度が不充分な場合が一般的である。一般的に復号化側の規格は定められているが符号化部の規格は定められておらず、任意の方式を取ることが可能な場合が多いため、符号化側において復号化側のフィルタ精度の影響を考慮に入れることにより、規格をなんら変更せずに、規格想定時以上の楽音波形の精度を実現することが可能となる。

0031

また、請求項3の楽音復号化装置は、符号化側で楽音波形データを周波数帯域分割用フィルタバンクを用いて目的とする周波数帯域毎に分割して、その分割された波形データが符合化された符号化データを復号化して楽音を再生する復号化部を備えた楽音復号化装置において、上記復号化部は、上記楽音波形データの各周波数領域のパラメータを周波数帯域毎の波形データに変換する周波数−時間変換部と、上記周波数−時間変換部により変換された上記周波数帯域毎の波形データを合成する周波数帯域合成用フィルタバンクと、上記楽音波形データを符号化する符号化側の上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、上記周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記周波数−時間変換部に入力される上記各周波数領域のパラメータに重み付けする復号化重み付け部とを備えたことを特徴としている。

0032

上記請求項3の楽音復号化装置によれば、上記復号化部の周波数−時間変換部は、上記楽音波形データの各周波数領域のパラメータを周波数帯域毎の波形データに変換し、上記周波数−時間変換部により変換された上記周波数帯域毎の波形データを復号化部の周波数帯域合成用フィルタバンクにより合成する。このとき、上記復号化部の復号化重み付け部によって、上記楽音波形データを符号化する符号化側の周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上記周波数−時間変換部に入力される上記各周波数領域のパラメータに重み付けする。そうして、符号化側の周波数特性が平坦になるように補正する。または、上記復号化部の復号化重み付け部によって、上記周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上記周波数−時間変換部に入力される上記各周波数領域のパラメータに重み付けする。そうして、復号化側の周波数特性が平坦になるように補正する。または、上記復号化部の復号化重み付け部によって、上記楽音波形データを符号化する符号化側の周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、上記周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性とを有する重み係数に基づいて、上記周波数−時間変換部に入力される上記各周波数領域のパラメータに重み付けする。そうして、符号化側と復号化側の両方の周波数特性が平坦になるように補正する。この場合、符号化側と復号化側の両方の周波数特性を合成した特性を復号化側で補正すればよいので、構成を簡単にすることが可能である。

0033

したがって、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる。

0034

また、請求項4の楽音符号化復号化装置は、請求項1または2の楽音符号化装置と請求項3の楽音復号化装置とを備えて、上記楽音符号化装置により楽音を符号化すると共に、上記楽音符号化装置により符号化された符号化データを上記楽音復号化装置により復号化して楽音を再生することを特徴としている。

0035

上記請求項4の楽音符号化復号化装置によれば、符号化側と復号化側の両方の周波数特性が平坦になるように補正する。この場合、符号化側と復号化側の両方の周波数特性を合成した特性を補正すればよいので、構成を簡単にすることが可能である。したがって、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる楽音符号化復号化装置を実現できる。

0036

また、請求項5のプログラム記憶媒体は、楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符号化するためのプログラムを記録しているプログラム記憶媒体であって、上記楽音波形データを複数の周波数帯域に分割する周波数帯域分割用フィルタバンク処理工程と、上記周波数帯域分割用フィルタバンク処理工程により分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する時間−周波数変換工程と、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記時間−周波数変換工程により変換された上記各周波数領域のパラメータに重み付けする符号化重み付け工程とを有するプログラムを記録していることを特徴としている。

0037

上記請求項5のプログラム記憶媒体によれば、上記符号化部の周波数帯域分割用フィルタバンク処理工程により上記楽音波形データを複数の周波数帯域に分割し、その周波数帯域分割用フィルタバンク処理工程により分割された周波数帯域毎の波形データを時間−周波数変換工程により各周波数領域のパラメータに変換する。そして、上記符号化重み付け工程によって、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上記時間−周波数変換工程により変換された上記各周波数領域のパラメータに重み付けする。そうして、符号化側の周波数特性が平坦になるように補正する。または、上記符号化重み付け工程によって、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上記時間−周波数変換工程により変換された上記各周波数領域のパラメータに重み付けする。そうして、復号化側の周波数特性が平坦になるように補正する。または、上記符号化重み付け工程によって、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性とを有する重み係数に基づいて、上記時間−周波数変換工程により変換された上記各周波数領域のパラメータに重み付けする。そうして、符号化側と復号化側の両方の周波数特性が平坦になるように補正する。この場合、符号化側と復号化側の両方の周波数特性を合成した特性を符号化側で補正すればよいので、構成を簡単にすることが可能である。

0038

したがって、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる。

0039

また、規格・仕様として、例えば楽音波形の16bit精度の楽音を扱うことを想定して設計された楽音符号化方式の場合、SBCの通過域の周波数特性は16bit精度として十分な設計を行っているが、16bit以上の例えば20bit、24bitといった楽音波形の精度を扱おうとすると、フィルタの通過域の精度が不充分な場合が一般的である。一般的に復号化側の規格は定められているが符号化側の規格は定められておらず、任意の方式を取ることが可能な場合が多いため、符号化側において復号化側のフィルタ精度の影響を考慮に入れることにより、規格をなんら変更せずに、規格想定時以上の楽音波形の精度を実現することが可能となる。

0040

また、請求項6のプログラム記憶媒体は、楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符号化するためのプログラムを記録しているプログラム記憶媒体であって、上記楽音波形データを複数の周波数帯域に分割する周波数帯域分割用フィルタバンク処理工程と、上記周波数帯域分割用フィルタバンク処理工程により分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換する時間−周波数変換工程と、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記周波数帯域分割用フィルタバンク処理工程で分割される前の楽音波形データと、上記周波数帯域分割用フィルタバンク処理工程により分割された後かつ上記時間−周波数変換工程で変換される前の上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする符号化重み付け工程とを有するプログラムを記録していることを特徴としている。

0041

上記請求項6のプログラム記憶媒体によれば、上記周波数帯域分割用フィルタバンク処理工程により上記楽音波形データを複数の周波数帯域に分割し、その周波数帯域分割用フィルタバンク処理工程により分割された周波数帯域毎の波形データを符号化部の時間−周波数変換工程により各周波数領域のパラメータに変換する。このとき、上記符号化重み付け工程によって、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上周波数帯域分割用フィルタバンク処理工程に入力される楽音波形データと、上記周波数帯域分割用フィルタバンク処理工程で分割されて上記時間−周波数変換工程に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする。そうして、符号化側の周波数特性が平坦になるように補正する。または、上記符号化重み付け工程によって、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、周波数帯域分割用フィルタバンク処理工程に入力される楽音波形データと、上記周波数帯域分割用フィルタバンク処理工程で分割されて上記時間−周波数変換工程に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする。そうして、復号化側の周波数特性が平坦になるように補正する。または、上記符号化重み付け工程によって、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性とを有する重み係数に基づいて、周波数帯域分割用フィルタバンク処理工程に入力される楽音波形データと、上記周波数帯域分割用フィルタバンク処理工程で分割されて上記時間−周波数変換工程に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けする。そうして、符号化側と復号化側の両方の周波数特性が平坦になるように補正する。この場合、符号化側と復号化側の両方の周波数特性を合成した特性を符号化側で補正すればよいので、構成を簡単にすることが可能である。

0042

したがって、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる。

0043

また、規格・仕様として、例えば楽音波形の16bit精度の楽音を扱うことを想定して設計された楽音符号化方式の場合、SBCの通過域の周波数特性は16bit精度として十分な設計を行っているが、16bit以上の例えば20bit、24bitといった楽音波形の精度を扱おうとすると、フィルタの通過域の精度が不充分な場合が一般的である。一般的に復号化側の規格は定められているが符号化部の規格は定められておらず、任意の方式を取ることが可能な場合が多いため、符号化側において復号化側のフィルタ精度の影響を考慮に入れることにより、規格をなんら変更せずに、規格想定時以上の楽音波形の精度を実現することが可能となる。

0044

また、請求項7のプログラム記憶媒体は、符号化側で楽音波形データを周波数帯域分割用フィルタバンク処理工程によって目的とする周波数帯域毎に分割して、その分割された波形データが符合化された符号化データを復号化して楽音を再生するためのプログラムを記録しているプログラム記憶媒体であって、上記楽音波形データの各周波数領域のパラメータを周波数帯域毎の波形データに変換する周波数−時間変換工程と、上記周波数−時間変換工程により変換された上記周波数帯域毎の波形データを合成する周波数帯域合成用フィルタバンク処理工程と、上記楽音波形データを符号化する符号化側の上記周波数帯域分割用フィルタバンク工程の各周波数領域における歪みを平坦にする特性と、上記周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み付け係数に基づいて、上記周波数−時間変換工程により変換される前の上記各周波数領域のパラメータに重み付けする復号化重み付け工程とを有するプログラムを記録していることを特徴としている。

0045

上記請求項7のプログラム記憶媒体によれば、上記周波数−時間変換工程は、上記楽音波形データの各周波数領域のパラメータを周波数帯域毎の波形データに変換し、上記周波数−時間変換工程により変換された上記周波数帯域毎の波形データを周波数帯域合成用フィルタバンク処理工程により合成する。このとき、上記復号化重み付け工程によって、上記楽音波形データを符号化する符号化側の周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上記周波数−時間変換工程に入力される上記各周波数領域のパラメータに重み付けする。そうして、符号化側の周波数特性が平坦になるように補正する。または、上記復号化重み付け工程によって、上記周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性を有する重み係数に基づいて、上記周波数−時間変換工程に入力される上記各周波数領域のパラメータに重み付けする。そうして、復号化側の周波数特性が平坦になるように補正する。または、上記復号化重み付け工程によって、上記楽音波形データを符号化する符号化側の周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、上記周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性とを有する重み係数に基づいて、上記周波数−時間変換工程に入力される上記各周波数領域のパラメータに重み付けする。そうして、符号化側と復号化側の両方の周波数特性が平坦になるように補正する。この場合、符号化側と復号化側の両方の周波数特性を合成した特性を復号化側で補正すればよいので、構成を簡単にすることが可能である。

0046

したがって、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上できる。

発明を実施するための最良の形態

0047

以下、この発明の楽音符号化装置および楽音復号化装置およびプログラム記憶媒体を図示の実施の形態により詳細に説明する。

0048

(第1実施形態)図1はこの発明の第1実施形態の楽音符号化装置および楽音復号化装置の構成を示す概略ブロック図である。

0049

図1に示すように、楽音符号化装置201は、楽音入力部210と、周波数帯域分割用フィルタバンクとしての周波数帯域分割部(帯域フィルタ)212と、時間−周波数変換部214と、符号化重み付け部215と、量子化部216と、聴覚モデル算出部218と、符号化列生成部217と、符号化データ出力部219および符号化制御部230で構成されている。また、楽音復号化装置202は、符号化データ入力部229と、符号化列復号部227と、逆量子化部226と、復号化重み付け部225と、周波数−時間変換部224と、周波数帯域合成用フィルタバンクとしての周波数帯域合成部(帯域フィルタ)222と、楽音出力部220および符号化制御部240で構成されている。

0050

以下、上記楽音符号化装置201と楽音復号化装置202の動作を説明する。

0051

まず、最初に楽音符号化装置201の楽音入力部210では、入力された楽音波形データを分析フレーム単位に切り出して、切り出された楽音波形データを周波数帯域分割部(帯域フィルタ)212および聴覚モデル算出部218に出力する。

0052

次に、上記周波数帯域分割部(帯域フィルタ)212は、楽音入力部210から出力された楽音波形データをバンドパス(ハイパス、ローパスを含む)フィルタを通して希望とする周波数帯域のみを通過させることによって、特定の周波数帯域のみを含む時間波形データにいくつか分割して、ダウンサンプリングを行ってサンプリング変換した後、分割されサンプリング変換された時間波形データを時間−周波数変換部214に出力する。

0053

次に、上記時間−周波数変換部214は、いくつかに分割された特定の周波数帯域のみを含む時間波形データを、MDCT等の手法を用いて各々周波数帯域毎に周波数領域のパラメータに変換して、変換されたパラメータを符号化重み付け部215に出力する。

0054

次に、上記符号化重み付け部215は、時間−周波数変換部214からの各周波数帯域毎の周波数領域のパラメータに重み付けを行って、重み付けされたパラメータを量子化部216に出力する。このとき、上記符号化重み付け部215では、次の(1),(2)の少なくとも一方を行う。

0055

(1)楽音符号化装置201の周波数帯域分割部212の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数を各周波数領域のパラメータに乗算する。

0056

(2)楽音復号化装置202の周波数帯域合成部222の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数を各周波数領域のパラメータに乗算する。上記符号化重み付け部215の処理は、次の式1によって表される。

0057

Fi=Wi・Fi ……………………… (式1)
ただし Fi:周波数領域のパラメータ
Wi:重み係数
i: 周波数
次に、上記量子化部216は、聴覚モデル算出部218によって算出された量子化のための各周波数帯域における量子化ビットの精度に基づいて、符号化重み付け部215によって重み付けされた各周波数領域のパラメータの精度を打ち切り、各周波数帯域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データを符号化列生成部217に出力する。

0058

ここで上記周波数帯域分割部(帯域フィルタ)212にQMFフィルタバンクを用いと共に、時間−周波数変換部214にMDCTを用いた場合の具体例を示す。

0059

図3は、”J.D.Johnston : a Filter Family Designed for Use in Quadrature Mirror Filter Banks,Proc.of 1980 ICSSSP”に記載された48タップ正規化遷移帯域0.0625の特性(通過帯域リップル:0.02dB)のQMFフィルタバンクを示している。このQMFフィルタバンクは1回のみ適用し、ダウンサンプリングを行って、2つの周波数帯域に分割する。このときのダウンサンプリングも含めた全帯域のQMFフィルタバンクの周波数特性を図4に示しており、符号化重み付け部215により打ち消すべき周波数特性である。そして、上記QMFフィルタバンクを施した後、分析区間(例えば256ポイント)の時間波形に対して、時間−周波数変換部214で分析区間の周波数特性を示すMDCT係数を算出する。このMDCT係数は、図4に示すQMFフィルタバンクの周波数特性の影響を除くため、図4の周波数特性を打ち消す(式1)を実行する符号化重み付け部215を付加している。この場合の上記(式1)におけるWiの重み係数の一例を表1に示している。

0060

係数0 1.000109
係数1 1.000103
係数2 1.000086
係数3 1.000059
係数4 1.000024
係数5 0.99999
係数6 0.99994
係数7 0.99991
係数8 0.99987
係数9 0.99985
係数10 0.99984
係数11 0.99983
係数12 0.99984
係数13 0.99986
係数14 0.99989
係数15 0.99992
係数16 0.99995
係数17 0.99999
係数18 1.000021
係数19 1.000045
係数20 1.00006



係数240 0.99992
係数241 0.99989
係数242 0.99986
係数243 0.99984
係数245 0.99983
係数246 0.99984
係数247 0.99985
係数248 0.99987
係数249 0.99991
係数250 0.99994
係数251 0.99999
係数252 1.000024
係数253 1.000059
係数254 1.000086
係数255 1.000103
この表1は、256ポイントで1フレームの分析を行う場合の係数0〜255(一部を示す)を示している。

0061

なお、上記周波数帯域分割部(帯域フィルタ)212と、時間−周波数変換部214と、符号化重み付け部215と、量子化部216と、符号化列生成部217および聴覚モデル算出部218で構成された符号化部231(図1中上側の点線で囲んだ部分)は、符号化制御部230により楽音符号化処理を行うことも可能である。この場合、上記符号化制御部230を計算機で構成し、楽音符号化処理をプログラムにより実行する。図1中上側の点線で囲んだ符号化部231のハードウェアの代わりに、後述する図5フローチャートに示す各工程により実現することができる。

0062

図5は上記符号化制御部230の楽音符号化処理の動作を説明するフローチャートである。以下、図5のフローチャートに従って楽音符号化処理の各工程を説明する。

0063

まず、楽音符号化処理が開始されると、楽音入力処理工程S1で楽音を入力して、分析フレーム単位に楽音波形を切り出した後、周波数帯域分割(帯域フィルタ)工程S2に進む。

0064

そして、周波数帯域分割(帯域フィルタ)工程S2で、入力された楽音波形をバンドパス(ハイパス、ローパスを含む)フィルタを通して希望とする周波数帯域のみを通過させることによって、特定の周波数帯域のみを含む時間波形データにいくつか分割した後、分割された時間波形データをダウンサンプリングを行って、サンプリング周波数変換を行う。

0065

次に、時間−周波数変換工程S3に進み、いくつかに分割された特定の周波数帯域のみを含む時間波形データを、MDCT等の手法を用いて各々周波数帯域毎に周波数領域のパラメータに変換する。

0066

また、聴覚モデル算出工程S4では、分析フレーム単位に切り出された楽音波形をFFT等を用いて周波数分析を行い、同時マスキング・最小可聴限等の聴覚モデルに基づいて、量子化のための各周波数帯域における量子化ビットの精度を決定する。

0067

次に、周波数重み付け工程S5で、各周波数帯域毎の周波数領域のパラメータに重みを付けて、量子化工程S6に進む。この周波数重み付け工程S5では、次の(3),(4)の少なくとも一方を行う。

0068

(3)周波数帯域分割工程S2の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数を各周波数領域のパラメータに乗算する。

0069

(4)復号化工程の周波数帯域合成工程の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数を各周波数領域のパラメータに乗算する。この周波数重み付け工程S5の処理は、上記(式1)によって表される。

0070

次に、量子化工程S6に進み、聴覚モデル算出工程S4によって算出された量子化のための各周波数帯域における量子化ビットの精度に基づいて、周波数重み付け工程S5によって重み付けされた周波数領域のパラメータの精度を打ち切り、各周波数帯域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データを得た後、符号化列生成工程S7に進む。

0071

そして、符号化列生成工程S7では、量子化工程S6によって得られた各周波数領域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データを、伝送(または蓄積)するために圧縮率が高くなるように符号化列に変換する。そして、符号化データ出力工程S8に進み、上記符号化列より符号化データを作成する。

0072

なお、これらの処理手順は、図1の計算機で構成された符号化制御部230の楽音符号化処理プログラムを記憶しているプログラム記憶媒体として提供してもよい。

0073

また、図1の楽音復号化装置202では、逆量子化部226は、符号化列復号部227で分離された量子化符号化データを、逆量子化して各周波数領域のパラメータに変換すると共に、周波数−時間変換部224の演算精度に戻した後、各周波数領域のパラメータを復号化重み付け部225に出力する。

0074

次に、復号化重み付け部225は、逆量子化部226から入力された各周波数帯域毎の周波数領域のパラメータに重みを付けて、重み付けされた各パラメータを周波数−時間変換部(帯域フィルタ)224に出力する。

0075

この復号化重み付け部225では、次の(5),(6)の少なくとも一方を行う。

0076

(5)周波数帯域合成部222の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数を各周波数領域のパラメータに乗算する。

0077

(6) 符号化部の周波数帯域分割部212の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数を各周波数領域のパラメータに乗算する。上記復号化重み付け部225の処理は、上記(式1)と同じ処理によって行う。

0078

次に、上記周波数−時間変換部224では、復号化重み付け部225からの重み付けされた各周波数領域のパラメータを、IMDCT等を用いて周波数成分を時間成分である時間波形データに変換して、変換された時間波形データを周波数帯域合成部(帯域フィルタ)222に出力する。

0079

また、上記楽音符号化装置201の周波数帯域分割部212の帯域フィルタの周波数領域における歪みと、楽音復号化装置202の周波数帯域合成部222の帯域フィルタの周波数領域における歪みとを平坦にするように、符号化重み付け部215および復号化重み付け部225の2つを用いて、予め設定された重み係数を楽音符号化装置201と楽音復号化装置202の各々の周波数領域のパラメータに乗算してもよい。

0080

ここで、上記周波数帯域合成部(帯域フィルタ)222と、周波数−時間変換部224と、復号化重み付け部225と、逆量子化部226および符号化列復号部227の復号化部241(図1中下側の点線で囲んだ部分)は、復号化制御部240により楽音復号化処理を行うことも可能である。この場合、復号化制御部240を計算機で構成し、楽音復号化処理をプログラムにより実行する。図1中下側の点線で囲んだ復号化部241のハードウェアの代わりに、後述する図6のフローチャートに示す各工程により実現することができる。

0081

図6は上記楽音復号化装置201の楽音復号化処理の動作を示すフローチャートである。以下、図6に従って楽音復号化処理の各工程について説明する。

0082

まず、楽音復号化処理が開始されると、符号化列入力工程S11で楽音を圧縮した符号化列を入力する。

0083

次に、符号化列復号工程S12に進み、入力された符号化列を分析周期毎に周波数領域のパラメータの大きさ,量子化精度および量子化データ等の量子化符号化データに復号化する。

0084

次に、逆量子化工程S13に進み、符号化列復号工程Sl2で分離された量子化符号化データを、逆量子化して各周波数領域のパラメータに変換すると共に、周波数−時間変換工程S15と同じ演算精度に戻した後、周波数重み付け工程S14に進む。

0085

そして、上記周波数重み付け工程S14では、次の(7),(8)の少なくとも一方を行う。

0086

(7)周波数帯域合成工程S16の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数を各周波数領域のパラメータに乗算する。

0087

(8) 符号化部の周波数帯域分割工程の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数を各周波数領域のパラメータに乗算する。上記周波数重み付け工程S14の処理は、上記(式1)と同じ処理によって行う。

0088

次に、周波数−時間変換工程(帯域フィルタ)S15に進み、重み付けされた各周波数領域のパラメータを、IMDCT等を用いて周波数成分を時間成分である時間波形データに変換した後、周波数帯域合成工程(帯域フィルタ)S16に進む。

0089

そして、周波数帯域合成工程(帯域フィルタ)S16では、いくつかに分割された特定の周波数帯域のみを含む周波数成分から時間成分に変換された時間波形データを、アップサンプリングを行ってサンプリング変換した後、バンドパス(ハイパス、ローパスを含む)フィルタを通して希望とする周波数帯域のみを通過させた後、いくつかの特定の周波数帯域のみを含む時間波形データを合成することにより楽音波形データに復号化することができる。

0090

そして、楽音出力工程S17に進み、復号化された楽音波形データを分析フレーム単位に合成して出力する。

0091

なお、これらの処理手順は、図1の計算機で構成された復号化制御部240の楽音復号化処理プログラムを記憶しているプログラム記憶媒体として提供してもよい。

0092

上記構成の楽音符号化装置201と楽音復号化装置202において、楽音波形データを符号化する周波数帯域分割部212と、符号化データを楽音波形データ復号化する周波数帯域合成部122とに用いられる帯域フィルタの周波数特性を補正する構成要素(符号化重み付け部215,復号重み付け部225)を設けることによって、従来の符号化・復号化手法に比べ、高音質で低処理量の符号化され復号化された楽音を生成する。このように、フィルタのみの特性を考慮するのではなく、システム全体でその周波数特性を考慮することによって、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上することができる。また、符号化側と復号化側の双方に同一特性のフィルタを導入することが多いが、両方の周波数特性を合成した特性を符号化側または復号化側で補正すればよく、構成を簡単にすることができる。また、符号化側と復号化側の両方に補正手段(重み付け部)を備えた場合、双方が異なった特性をもっていてもよい。

0093

さらに規格・仕様として、例えば楽音波形の16bit精度の楽音を扱うことを想定して設計された楽音符号化方式の場合、周波数帯域分割用フィルタバンクの通過域の周波数特性は16bit精度として十分な設計を行っているが、16bit以上の例えば20bit、24bitといった楽音波形の精度を扱おうとすると、フィルタの通過域の精度が不充分な場合が一般的である。一般的に復号化側の規格は定められているが符号化側の規格は定められておらず、任意の方式を取ることが可能な場合が多いため、符号化側において復号化側のフィルタ精度の影響を考慮に入れることによって、規格を変更することなく、規格想定時以上の楽音波形の精度を実現することが可能となる。この場合は、TFCにより周波数特性の補正を行わず、さらに周波数特性を補正するためのフィルタを付加しても同様の効果を得ることできる。

0094

(第2実施形態)図2はこの発明の第2実施形態の楽音符号化装置の構成を示す概略ブロック図である。

0095

図2に示すように、楽音符号化装置301は、図8に示す楽音符号化装置101に対して、前置重み付け部311と後置重み付け部313が付加された構成をしている。

0096

以下、上述の追加された構成要素を中心に動作を説明する。

0097

上記前置重み付け部311および後置重み付け部313は、時間領域の波形を入力とし、周波数領域における重みを付けた時間領域の波形を出力する周波数重み付けフィルタが構成要素となっている。この場合、周波数帯域分割用フィルタバンクとしての周波数帯域分割部(帯域フィルタ)312に前置、または後置、または両方に配置しても、入力は時間領域のデータであり、時間波形を入力とする周波数重み付けフィルタによる構成が可能である。

0098

ここでは、上記前置重み付け部311と後置重み付け部313および周波数帯域分割部312からなる周波数重み付けフィルタを用いて、復号化側の周波数帯域合成部の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数に基づいて、周波数帯域分割部312に入力される楽音波形データと周波数帯域分割部312により分割された時間波形データとを重み付けする。

0099

ここで周波数重み付けフィルタは、(式2)によって表される。

0100

ここで、上記前置重み付け部311と、周波数帯域分割部(帯域フィルタ)312と、後置重み付け部313と、時間−周波数変換部314と、量子化部316と、符号化列生成部317および聴覚モデル算出部318の符号化部331(図2の点線で囲んだ部分)は、符号化制御部330により楽音符号化処理を行うことも可能である。この場合、符号化制御部330を計算機で構成し、楽音符号化処理プログラムにより実行する。図2の点線で囲んだ符号化部331のハードウェアの代わりに、後述する図7のフローチャートに示す各工程により実現することができる。

0101

図7は上記楽音符号化装置301の楽音符号化処理の動作を示すフローチャートである。以下、図7のフローチャートに従って楽音符号化処理の各工程について説明する。なお、図7の楽音符号化処理は、図5に示す楽音符号化処理に対して、前置周波数重み付け工程S22、後置周波数重み付け工程S24が付加され、周波数重み付け工程S5が削除されている。追加された2つの工程(S22,S24)は、削除された工程S5と同等の効果を果たすように構成されている。

0102

図7において、前置周波数重み付け工程S22および後置周波数重み付け工程S24は、時間領域の波形を入力とし、周波数領域における重みを付けた時間領域の波形を出力する周波数重み付けフィルタが構成要素となっている。この場合、周波数帯域分割工程(帯域フィルタ)S23の処理に先立ち、または後で、または前後の両方で処理しても、入力は時間領域のデータであり、時間波形を入力とする周波数重み付けフィルタによる構成が可能である。

0103

ここでは、前置周波数重み付け工程S22と後置周波数重み付け工程S24の少なくとも一方で、復号化処理の周波数帯域合成部の帯域フィルタの周波数領域における歪みを平坦にするように、予め設定された重み係数に基づいて、周波数帯域分割工程S23に入力される楽音波形データと周波数帯域分割工程S23により分割された時間波形データとを重み付けする。

0104

この前置周波数重み付け工程S22および後置周波数重み付け工程S24の周波数重み付けフィルタは、前述の(式2)によって表される。

0105

また、上記前置周波数重み付け工程S22および後置周波数重み付け工程S24の少なくとも一方で、周波数帯域分割工程S23の帯域フィルタの周波数領域における歪みと、復号化側の周波数帯域合成部の帯域フィルタの周波数領域における歪みとを両方同時に平坦にするように、予め設定された重み係数に基づいて、周波数帯域分割工程S23に入力される楽音波形データと周波数帯域分割工程S23により分割された時間波形データとを重み付けしてもよい。

0106

また、これらの処理手順は、図2の計算機で構成された符号化制御部330の楽音符号化処理プログラムを記憶しているプログラム記憶媒体として提供してもよい。

0107

このように、楽音波形データを符号化する周波数帯域分割部312と楽音波形を復号化する復号化側の周波数帯域合成部に用いられる帯域フィルタの周波数特性を補正する構成要素(前置重み付け部311,後置重み付け部313)を設けることによって、従来の符号化・復号化手法に比べ、高音質で低処理量の符号化され復号化された楽音を生成することができる。

0108

上記第1実施形態の符号化重み付け部215と復号化重み付け部225と、第2実施形態の前置重み付け部311と後置重み付け部313のうちのいずれか1つか、またはその組み合わせと、周波数帯域分割部212と周波数帯域合成部222の帯域フィルタの組み合わせによって、周波数領域における歪みを平坦にすることができる場合、周波数帯域分割部212または周波数帯域合成部222の帯域フィルタの周波数特性は、平坦にする必要はない。

0109

上記第1,第2実施形態では、楽音符号化装置201,301と楽音復号化装置202について説明したが、楽音符号化装置と楽音復号化装置とを一体にした楽音符号化復号化装置にこの発明を適用してもよい。

発明の効果

0110

上より明らかなように、請求項1の発明の楽音符号化装置は、楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符合化する符号化部を備えた楽音符号化装置において、上記符号化部の周波数帯域分割用フィルタバンクにより、上記楽音波形データを複数の周波数帯域に分割し、上記符号化部の時間−周波数変換部により、上記周波数帯域分割用フィルタバンクにより分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換し、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記符号化部の符号化重み付け部によって、上記時間−周波数変換部により変換された各周波数領域のパラメータに重み付けするものである。

0111

したがって、請求項1の発明の楽音符号化装置によれば、SBC等のフィルタ特性の通過域の周波数特性の平坦性をあまり気にしなくてもよいため、フィルタの次数を少なくすることが可能になり、フィルタの構成要素を簡略化することができ、従来に比べ低コストに同等の性能を有するものが作成可能になると共に、同一の構成要素を持つ場合、より高品質でかつ圧縮率を高くすることが可能な楽音符号化装置を提供することができる。

0112

また、規格・仕様上の精度が望めない場合でも、この楽音符号化装置の構成要素に復号化側のフィルタの周波数特性の補正する重み付け部(補正器)を付加することによって、復号化側に何ら変更を加えることなく、より自然性の高い精度の高い楽音を復号化することができる。

0113

また、請求項2の発明の楽音符号化装置は、楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを圧縮して符合化する符号化部を備えた楽音符号化装置において、上記符号化部の周波数帯域分割用フィルタバンクにより、楽音波形データを複数の周波数帯域に分割し、上記符号化部の時間−周波数変換部により、周波数帯域分割用フィルタバンクにより分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換し、そのとき、上記周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記符号化部の符号化重み付け部によって、周波数帯域分割用フィルタバンクに入力される楽音波形データと、上記周波数帯域分割用フィルタバンクで分割されて上記時間−周波数変換部に入力される上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けするものである。

0114

したがって、請求項2の発明の楽音符号化装置によれば、SBC等のフィルタ特性の通過域の周波数特性の平坦性をあまり気にしなくてもよいため、フィルタの次数を少なくすることが可能になり、フィルタの構成要素を簡略化することができ、従来に比べ低コストに同等の性能を有するものが作成可能になると共に、同一の構成要素を持つ場合、より高品質でかつ圧縮率を高くすることが可能な楽音符号化装置を提供することができる。

0115

また、規格・仕様上の精度が望めない場合でも、この楽音符号化装置の構成要素に復号化側のフィルタの周波数特性の補正する重み付け部(補正器)を付加することによって、復号化側に何ら変更を加えることなく、より自然性の高い精度の高い楽音を復号化することができる。

0116

また、請求項3の発明の楽音復号化装置は、符号化側で楽音波形データを周波数帯域分割用フィルタバンクを用いて目的とする周波数帯域毎に分割して、その分割された波形データが符合化された符号化データを復号化して楽音を再生する復号化部を備えた楽音復号化装置において、上記復号化部の周波数−時間変換部により、上記楽音波形データの各周波数領域のパラメータを周波数帯域毎の波形データに変換し、上記復号化部の周波数帯域合成用フィルタバンクにより、周波数−時間変換部により変換された上記周波数帯域毎の波形データを合成し、そのとき、上記楽音波形データを符号化する符号化側の周波数帯域分割用フィルタバンクの各周波数領域における歪みを平坦にする特性と、上記周波数帯域合成用フィルタバンクの各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、上記復号化部の復号化重み付け部によって、周波数−時間変換部に入力される上記各周波数領域のパラメータに重み付けするものである。

0117

したがって、請求項3の発明の楽音復号化装置によれば、SBC等のフィルタ特性の通過域の周波数特性の平坦性をあまり気にしなくてもよいため、フィルタの次数を少なくすることが可能になり、フィルタの構成要素を簡略化することができ、従来に比べ低コストに同等の性能を有するものが作成可能になると共に、同一の構成要素を持つ場合、より高品質でかつ圧縮率を高くすることが可能な楽音符号化装置を提供することができる。

0118

また、請求項4の発明の楽音符号化復号化装置は、請求項1または2の楽音符号化装置と請求項3の楽音復号化装置とを備えて、上記楽音符号化装置により楽音を符号化すると共に、上記楽音符号化装置により符号化された符号化データを上記楽音復号化装置により復号化して楽音を再生するものである。

0119

したがって、請求項4の発明の楽音符号化復号化装置によれば、符号化側と復号化側の両方の周波数特性が平坦になるように補正する。この場合、符号化側と復号化側の両方の周波数特性を合成した特性を補正すればよいので、構成を簡単にすることができ、次数の少ないフィルタを用いて、楽音波形の精度を低コストで向上することができる。

0120

また、請求項5の発明のプログラム記憶媒体は、楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符号化するためのプログラムを記録しているプログラム記憶媒体であって、周波数帯域分割用フィルタバンク処理工程により、楽音波形データを複数の周波数帯域に分割し、時間−周波数変換工程により、上記周波数帯域分割用フィルタバンク処理工程により分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換し、そして、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、符号化重み付け工程によって、上記時間−周波数変換工程により変換された上記各周波数領域のパラメータに重み付けするプログラムを記録しているものである。

0121

したがって、請求項5の発明のプログラム記憶媒体によれば、SBC等のフィルタ特性の通過域の周波数特性の平坦性をあまり気にしなくてもよいため、フィルタの次数を少なくすることが可能になり、フィルタバンク処理工程を簡略化することができ、従来に比べ低コストに同等の性能を有するものが作成可能になると共に、同一の構成要素を持つ場合、より高品質でかつ圧縮率を高くすることができる。

0122

また、規格・仕様上の精度が望めない場合でも、符号化側フィルタバンク処理工程に復号化側のフィルタの周波数特性の補正する符号化重み付け工程を付加することによって、復号化側に何ら変更を加えることなく、より自然性の高い精度の高い楽音を復号化することができる。

0123

また、請求項6の発明のプログラム記憶媒体は、楽音波形データを目的とする周波数帯域毎に分割して、その分割された波形データを符号化するためのプログラムを記録しているプログラム記憶媒体であって、周波数帯域分割用フィルタバンク処理工程により、楽音波形データを複数の周波数帯域に分割し、時間−周波数変換工程により、上記周波数帯域分割用フィルタバンク処理工程により分割された周波数帯域毎の波形データを各周波数領域のパラメータに変換し、そのとき、上記周波数帯域分割用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性と、符号化された符号化データを復号化する復号化側の周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み係数に基づいて、符号化重み付け工程によって、上記周波数帯域分割用フィルタバンク処理工程で分割される前の楽音波形データと、上記周波数帯域分割用フィルタバンク処理工程により分割された後かつ時間−周波数変換工程で変換される前の上記周波数帯域毎の波形データのうちの少なくとも一方に重み付けするプログラムを記録しているものである。

0124

したがって、請求項6の発明のプログラム記憶媒体によれば、SBC等のフィルタ特性の通過域の周波数特性の平坦性をあまり気にしなくてもよいため、フィルタの次数を少なくすることが可能になり、フィルタバンク処理工程を簡略化することができ、従来に比べ低コストに同等の性能を有するものが作成可能になると共に、同一の構成要素を持つ場合、より高品質でかつ圧縮率を高くすることができる。

0125

また、規格・仕様上の精度が望めない場合でも、符号化側フィルタバンク処理工程に復号化側のフィルタの周波数特性の補正する符号化重み付け工程を付加することによって、復号化側に何ら変更を加えることなく、より自然性の高い精度の高い楽音を復号化することができる。

0126

また、請求項7の発明のプログラム記憶媒体は、符号化側で楽音波形データを周波数帯域分割用フィルタバンクを用いて目的とする周波数帯域毎に分割して、その分割された波形データが符合化された符号化データを復号化して楽音を再生するためのプログラムを記録しているプログラム記憶媒体であって、周波数−時間変換工程により、楽音波形データの各周波数領域のパラメータを周波数帯域毎の波形データに変換し、周波数帯域合成用フィルタバンク処理工程により、上記周波数−時間変換工程により変換された上記周波数帯域毎の波形データを合成し、そのとき、上記楽音波形データを符号化する符号化側の周波数帯域分割用フィルタバンク工程の各周波数領域における歪みを平坦にする特性と、上記周波数帯域合成用フィルタバンク処理工程の各周波数領域における歪みを平坦にする特性のうちの少なくとも一方の特性を有する重み付け係数に基づいて、復号化重み付け工程によって、上記周波数−時間変換工程により変換される前の上記各周波数領域のパラメータに重み付けするプログラムを記録しているものである。

0127

したがって、請求項7の発明のプログラム記憶媒体によれば、SBC等のフィルタ特性の通過域の周波数特性の平坦性をあまり気にしなくてもよいため、フィルタの次数を少なくすることが可能になり、フィルタバンク処理工程を簡略化することができ、従来に比べ低コストに同等の性能を有するものが作成可能になると共に、同一の構成要素を持つ場合、より高品質でかつ圧縮率を高くすることができる。

図面の簡単な説明

0128

図1図1はこの発明の第1実施形態の楽音符号化装置と楽音復号化装置の構成を示す概略ブロック図である。
図2図2はこの発明の第2実施形態の楽音符号化装置の構成を示す概略ブロック図である。
図3図3はQMFフィルタバンクの周波数特性の一例を示す図である。
図4図4は符号化重み付け部が打ち消すべき周波数特性の一例を示す図である。
図5図5図1に示す上記楽音符号化装置の符号化部の楽音符号化処理の手順を説明するためのフローチャートである。
図6図6図1に示す上記楽音復号化装置の復号化部の楽音復号化処理の手順を説明するためのフローチャートである。
図7図7図2に示す第2実施形態の楽音符号化装置の符号化部の楽音符号化処理の手順を説明するためのフローチャートである。
図8図8は従来の楽音符号化復号化装置の構成を示すブロック図である。

--

0129

201…楽音符号化装置、
202…楽音復号化装置、
210…楽音入力部、
212…周波数帯域分割部(帯域フィルタ)、
214…時間−周波数変換部、
215…符号化重み付け部、
216…量子化部、
217…符号化列生成部、
219…符号化データ出力部、
220…楽音出力部、
222…周波数帯域合成部(帯域フィルタ)、
224…周波数−時間変換部、
225…復号化重み付け部、
226…逆量子化部、
227…符号化列復号部、
229…符号化データ入力部、
230…符号化制御部、
231…符号化部、
240…復号化制御部、
241…復号化部。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • ソニー株式会社の「 情報処理装置および電子機器」が 公開されました。( 2020/09/24)

    【課題・解決手段】本技術は、どのユーザに対して応答するべきかを正しく判断することができるようにする情報処理装置および電子機器に関する。発話者特定部は、ユーザが存在する環境の画像と音声に基づいて、所定の... 詳細

  • グーグルエルエルシーの「 オーディオベースのコンピュータプログラム出力の修正」が 公開されました。( 2020/09/24)

    【課題・解決手段】音声または非テキスト入力アクティブ化環境においてコンピュータプログラム出力を修正することが提供される。システムは、デバイスのマイクロフォンによって検出されるオーディオ信号を受信するこ... 詳細

  • グーグルエルエルシーの「 ホットワード認識音声合成」が 公開されました。( 2020/09/24)

    【課題・解決手段】方法(400)は、合成音声(160)に変換するためのテキスト入力データ(302)を受信することと、ユーザデバイス(110)に割り当てられているホットワード(130)の存在を検出するよ... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ