図面 (/)

技術 コンテンツ符号化装置、コンテンツ符号化方法、コンテンツ符号化プログラム、及びコンテンツ符号化プログラムが記録された記録媒体、並びにコンテンツ復号装置、コンテンツ復号方法、コンテンツ復号プログラム、及びコンテンツ復号プログラムが記録された記録媒体

出願人 ソニー株式会社
発明者 羽田直也筒井京弥赤桐健三
出願日 2001年12月7日 (20年2ヶ月経過) 出願番号 2001-374376
公開日 2003年6月27日 (18年7ヶ月経過) 公開番号 2003-177791
状態 未査定
技術分野 デジタル記録再生の信号処理 音声の分析・合成 他に分類されない音響(残響,カラオケ等) 圧縮、伸長・符号変換及びデコーダ
主要キーワード ビット圧縮処理 記憶パターン 二次コピー トーン位置 デシベル値 分割比率 回転駆動動作 クラスタ接続
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2003年6月27日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

符号化されたオリジナルデータ試聴データ追加データとに分離する際に、追加データのサイズを削減する。

解決手段

コンテンツ符号化装置は、オーディオ信号D1をスペクトル信号に変換する変換部51と、スペクトル信号D2から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たすトーン成分信号を分離し、分離されたトーン成分信号を周波数成分毎正規化し、正規化された正規化トーン成分信号を周波数成分毎に量子化する信号成分符号化部52と、量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号D3から、符号列D4を生成する符号列生成部53とを備える。コンテンツ符号化装置は、符号列生成部53によって生成された符号列D4から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する。

概要

背景

近年、いわゆるインターネットに代表される通信ネットワーク技術の普及及び進歩、並びに情報圧縮技術の向上、さらには、情報記録媒体高集積化又は高密度化に伴い、通信ネットワークを介して音声データや画像データ等のマルチメディアデータを含む種々のディジタルコンテンツ視聴者に配信して販売するサービスが多数ビジネス化されて実施されている。

このようなサービスとしては、例えば、いわゆるコンパクトディスク(Compact Disc;CD)やミニディスク(Mini Disc)等の音楽パッケージメディアを販売している店舗等に設置されている多数の音楽データを蓄積したキオスク端末を用いるものがある。このサービスにおいては、まず、顧客が持参したミニディスク等の記録媒体をキオスク端末に装着させ、このキオスク端末における所定の表示画面に表示されたメニュー画面を介して顧客に所望の音楽データのタイトルを選択させた後、要求された料金を投入させる。そして、このサービスにおいては、これに応じて、キオスク端末が顧客によってタイトルが選択された音楽データを記録媒体に記録する。これにより、このサービスは、顧客の嗜好に応じたディジタルコンテンツを効率的に流通させるのに寄与することができる。

ところで、このようなディジタルコンテンツは、複製や改竄が極めて容易とされる著作物であり、ディジタルコンテンツについての違法な複製(コピー)による著作権侵害が問題となっている。そこで、この問題に対処するため、ディジタルコンテンツの著作権保護に関する種々の技術が提案されている。

著作権保護がされたディジタルコンテンツを柔軟に利用することを可能とする技術としては、例えば、特開2000−48079号公報に記載されている技術のように、視聴者が購入した有料コンテンツを、視聴者自身が所有する再生装置友人知人といった第三者が所有する再生装置に対して、著作権を保護しつつディジタルコンテンツをコピーすることにより、著作権保護がされたディジタルコンテンツを効率的に流通させるものが提案されている。この技術は、個々の再生装置に対してID(Identification)を付し、ディジタルコンテンツをコピーする再生装置の間で金銭データの送受信を行うことにより、ディジタルコンテンツを転売するものであり、特に、私的コピーの範疇に含まれる再生装置に対しては同一のIDを付すことにより、私的コピーと転売コピーとの区別を行うことができるものである。

また、著作権を保護しつつディジタルコンテンツを流通させる他の技術としては、例えば、音響等の信号を暗号化して放送したり記録媒体に記録し、鍵データを購入した顧客に対してのみ、その視聴許可するというソフトウェア流通方法が知られている。ここで、暗号化の方法としては、例えば、PCM(Pulse Code Modulation)の音響信号ビット列に対して鍵信号として乱数系列初期値を与え、発生した"0/1"からなる乱数系列とPCMの音響信号のビット列との排他的論理和をとったビット列を送信したり記録媒体に記録する方法が用いられる。この流通方法を使用することにより、鍵信号を入手した顧客のみが音響信号を正確に再生することができ、鍵信号を入手していない第三者は再生しても雑音しか得られないようにすることができる。なお、暗号化方法としては、より複雑な方法を用いることも可能である。

一方、音響信号を圧縮して放送したり記録媒体に記録する技術が広く普及しており、記録媒体としては、符号化されたオーディオ又は音声等の信号を記録可能な光磁気ディスク等が用いられる。オーディオ又は音声等の信号に対する高能率符号化の手法としては、種々のものが提案されている。これらの手法としては、例えば、時間軸上のオーディオ信号等をブロック化せずに、複数の周波数帯域に分割して符号化を施す非ブロック化周波数帯域分割方式である帯域分割符号化(サブ・バンドコーディング(SubBand Coding);SBC)や、時間軸上の信号を周波数軸上の信号に変換、すなわち、スペクトル変換して複数の周波数帯域に分割し、各帯域毎に符号化を施すブロック化周波数帯域分割方式である変換符号化(Transform Coding)等が挙げられる。また、符号化の手法としては、これらの帯域分割符号化と変換符号化とを組み合わせた高能率符号化の手法も考えられている。この手法は、例えば、帯域分割符号化によって帯域分割を行った後、各帯域毎の信号を周波数軸上の信号にスペクトル変換し、このスペクトル変換された各帯域毎に符号化を施すものである。

ここで、帯域分割に用いるフィルタとしては、R. E. Crochiereによる"Digital coding of speech in subbands, Bell Syst. Tech. J, Vol. 55, No. 8, 1976"に記載されているいわゆるQMF(Quadrature Mirror Filter)フィルタがある。また、"Polyphase Quadrature filters-A new subband coding technique,ICASSP 83, BOSTON"には、等バンド幅のフィルタ分割手法が記載されている。

また、スペクトル変換としては、例えば、入力オーディオ信号所定単位時間(フレーム)でブロック化し、当該ブロック毎に離散フーリエ変換(Discrete Fourier Transform;以下、DFTという。)、離散コサイン変換(Discrete Cosine Transform;以下、DCTという。)、又はモディファイド離散コサイン変換(Modified Discrete Cosine Transform;以下、MDCTという。)等を行うことにより、時間軸を周波数軸に変換するものがある。なお、MDCTについては、J. P. Princen, A. B. Bradley(Univ. of Surrey Royal Melbourne Inst.of Tech.)らによる"Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation,ICASSP 1987"に記載されている。

波形信号スペクトルに変換する手法としてDFTやDCTを用いた場合には、M個のサンプルからなる時間ブロックで変換を行うとM個の独立な実数データが得られる。ここで、DFTやDCTにおいては、時間ブロック間の接続歪みを軽減するために、通常、両隣のブロックとそれぞれM1個のサンプルずつオーバーラップさせることから、平均して、(M−M1)個のサンプルに対して、M個の実数データを量子化して符号化することになる。

これに対して、波形信号をスペクトルに変換する手法としてMDCTを用いた場合には、両隣の時間とM個ずつオーバーラップさせた2M個のサンプルから、独立なM個の実数データが得られる。そのため、MDCTにおいては、平均して、M個のサンプルに対して、M個の実数データを量子化して符号化することになる。復号装置では、このようにしてMDCTが施されて得られた符号から、各ブロックにおいて逆変換を施して得られた波形要素を互いに干渉させながら加え合わせることにより、波形信号を再構成することができる。

一般に、スペクトル変換においては、変換のための時間ブロックを長くすることにより、スペクトルの周波数分解能が高まり、特定のスペクトル成分にエネルギが集中する。したがって、波形信号をスペクトルに変換する手法としては、両隣のブロックと半分ずつオーバーラップさせて長いブロック長で変換を行い、しかも得られたスペクトル信号個数が元の時間サンプルの個数に対して増加しないMDCTを用いることにより、DFTやDCTを用いた場合よりも効率のよい符号化を行うことが可能となる。また、スペクトル変換においては、隣接するブロック同士に十分長いオーバーラップを持たせることにより、波形信号のブロック間歪みを軽減することもできる。

このように、符号化においては、フィルタやスペクトル変換によって帯域毎に分割された信号を量子化することにより、量子化雑音が発生する帯域を制御することができ、マスキング効果等の性質を利用して聴覚的により高能率な符号化を行うことができる。また、符号化においては、量子化を行う前に、各帯域毎に、例えばその帯域における信号成分の絶対値の最大値正規化を行うようにすれば、さらに高能率な符号化を行うことができる。

周波数帯域分割された各周波数成分を量子化する周波数分割幅としては、例えば人間の聴覚特性を考慮した帯域分割が行われる。すなわち、量子化においては、一般に臨海帯域(クリティカルバンド)と称される高域ほど帯域幅が広くなるような帯域幅で、オーディオ信号を例えば25バンド程度の複数の帯域に分割することがある。また、このときの各帯域毎のデータを符号化する際には、各帯域毎に所定のビット配分による符号化又は各帯域毎に適応的なビット割当てビットアロケーション)による符号化が行われる。例えば、上述したMDCT処理を施して得られた係数データをビットアロケーションによって符号化する際には、各ブロック毎のMDCT処理によって得られる各帯域毎の係数データに対して、適応的な割当ビット数で符号化が行われることになる。

ここで、ビット割当て手法としては、R. Zelinski, P. Nollらによる"Adaptive Transform Coding of Speech Signals,IEEE Transactions of Acoustics, Speech, and Signal Processing, Vol. ASSP-25, No. 4, August, 1977"及びM. A.Kransner(Massachusetts Institute of Technology)による"The critical band coder--digital encoding of the perceptual requirements of the auditory system,ICASSP 1980"に記載されているものがある。

前者の文献に記載されている手法は、各帯域毎の信号の大きさに基づいてビット割当てを行うものである。この手法においては、量子化雑音スペクトルが平坦となり、雑音エネルギが最小となるものの、聴感覚的にはマスキング効果が利用されていないことから、実際の雑音感は最適ではない。一方、後者の文献に記載されている手法は、聴覚マスキングを利用することにより、各帯域毎に必要な信号対雑音比を得て固定的なビット割当てを行うものである。しかしながら、この手法においては、正弦波入力で特性を測定する場合であっても、ビット割当てが固定的であることから、特性値がそれほど良好な値とならない。

そこで、これらの問題を解決するために、ビット割当てに使用できる全ビットを、各小ブロック毎に予め定められた固定ビット割当てパターン分と、各ブロックの信号の大きさに依存したビット配分を行う分とに分割使用し、その分割比率入力信号に関係する信号に依存させ、信号のスペクトルが滑らかなほど固定ビット割当てパターン分への分割比率を大きくする高能率符号化手法が提案されている。

この手法は、正弦波入力のように、特定のスペクトルにエネルギが集中する場合には、そのスペクトルを含むブロックに多くのビットを割り当てることにより、全体の信号対雑音特性を著しく改善することができる。一般に、急峻なスペクトル成分を有する信号に対して人間の聴覚は極めて敏感であることから、このような手法を用いることによって信号対雑音特性を改善することは、単に測定上の数値を向上させるのみならず、聴感上、音質を改善するのに有効である。

ビット割当ての手法としては、この他にも多数提案されており、さらに聴覚に関するモデルが精緻化され、符号化装置能力が向上すれば、聴覚的にみてより高能率な符号化が可能となる。これらの手法においては、計算によって求められた信号対雑音特性をなるべく忠実に実現するような実数のビット割当て基準値を求め、それを近似する整数値を割当てビット数とすることが一般的である。

また、本件出願人が先に出願している特願平7−500482号においては、スペクトル信号から聴感上特に重要なトーン性の信号成分、すなわち、特定の周波数周辺にエネルギが集中している信号成分を分離して、他のスペクトル成分とは別に符号化する手法が提案されている。この手法は、オーディオ信号等を聴感上の劣化を殆ど生じさせずに高い圧縮率での効率的な符号化を可能としている。

実際の符号列を構成するにあたっては、まず、正規化及び量子化が行われる帯域毎に正規化係数情報及び量子化精度情報を所定のビット数で符号化し、続いて、正規化及び量子化が施されたスペクトル信号を符号化すればよい。

また、いわゆるMPEG(Moving Picture Expert Group)規格の"ISO/IEC11172-3:1993(E), 1993"においては、帯域によって量子化精度情報を表すビット数が異なるように設定された高能率符号化方式が記載されており、高域になるにしたがって、量子化精度情報を表すビット数が小さくなるように規格化されている。

さらに、量子化精度情報を直接符号化する代わりに、復号装置において、例えば、正規化係数情報から量子化精度情報を決定する手法も知られているが、この手法においては、規格を設定した時点で正規化係数情報と量子化精度情報との関係が決定してしまうことから、将来的にさらに高度な聴覚モデルに基づいた量子化精度の制御を導入することができなくなる。また、この手法においては、実現する圧縮率に幅がある場合には、圧縮率毎に正規化係数情報と量子化精度情報との関係を定める必要が生じる。

さらにまた、符号化の手法としては、量子化されたスペクトル信号を、例えば、D. A. Huffmanによる"A Method for Construction of Minimum Redundancy Codes, Proc. I. R. E. , 40, pp. 1098, 1952"に記載されている可変長符号を用いて符号化することにより、より効率的に符号化するものも知られている。

また、上述したように符号化が施された信号をPCM信号の場合と同様に暗号化して配布することも可能である。この場合、鍵信号を入手していない第三者は、元の信号を再生することはできない。また、符号化されたビット列を暗号化するのではなく、PCM信号をランダム信号に変換した後、圧縮のための符号化を行う手法もある。この場合にも、鍵信号を入手していない第三者は、雑音しか再生することができない。

しかしながら、これらのスクランブル方法においては、鍵信号を入手していない場合、又は通常の再生装置によって再生した場合には、再生をさせると雑音になってしまい、そのソフトウェアの内容を把握せしめることはできない。そのため、これらのスクランブル方法は、例えば、比較的低音質で音楽を記録した記録媒体を配布し、それを試聴した者が嗜好に応じて選択した音楽に対してのみ、鍵データを購入して高音質で再生できるようにする、又はそのソフトウェアを試聴してから高音質で記録された記録媒体を新たに購入できるようにする、といった用途に利用することができなかった。

また、従来においては、高能率符号化を施した信号を暗号化する場合に、通常の再生装置にとって意味のある符号列を与えつつ、その圧縮効率を低減しないようにすることは困難であった。すなわち、従来においては、上述したように、高能率符号化を施して得られた符号列に対してスクランブルをかけた場合には、その符号列を再生しても雑音のみが発生するばかりではなく、スクランブルによって得られた符号列が元の高能率符号化の規格に適合していない場合には、再生装置が全く動作しないといった事態も生じていた。また逆に、従来においては、PCM信号に対してスクランブルをかけた後、高能率符号化を施した場合には、例えば聴覚の性質を利用して情報量を削減しているものとすると、その高能率符号化を解除した時点で、必ずしもPCM信号に対してスクランブルを施して得られた信号が再現できるわけではないことから、スクランブルを正確に解除することは困難なものとなってしまう。そのため、従来においては、圧縮の手法としては効率が低減しても、スクランブルを正確に解除できる手法を選択する必要があった。

これに対して、本件出願人が先に出願している特開平10−135944号公報には、例えば音楽信号をスペクトル信号に変換して符号化したもののうち、高域側のみを暗号化した結果が狭帯域の信号であれば、鍵データがなくとも試聴することが可能となるオーディオ符号化方式が開示されている。すなわち、この方式は、例えば、高域側を暗号化するとともに、高域側のビット割当て情報等をダミーデータに置換し、高域側の真のビット割当て情報を通常の復号装置が無視する領域に記録するものである。この方式においては、例えば、試聴の結果、嗜好に応じた音楽のみを高音質で視聴することが可能となる。

さらに、同公報には、万一暗号が解読された場合の危険性に備え、記録媒体に記録する一部の情報をダミーデータとし、比較的低品質で再生できるようにしておき、高品質再生が必要となった場合に、そのダミーデータを真のデータに記録しなおすことにより、暗号が解読される危険性を回避するとともに、低品質及び高品質のいずれのフォーマットで記録された記録媒体であっても、通常の再生装置によって視聴可能にする手法が提案されている。すなわち、この手法においては、コンテンツオリジナルデータの推測が困難となるように改変した試聴データと、この試聴データに追加することによってオリジナルデータを再現可能とする追加データとに分離し、試聴データを配布する一方で追加データを著作権管理しながら販売することにより、コンテンツの効率的な流通を可能としている。

概要

符号化されたオリジナルデータを試聴データと追加データとに分離する際に、追加データのサイズを削減する。

コンテンツ符号化装置は、オーディオ信号D1をスペクトル信号に変換する変換部51と、スペクトル信号D2から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たすトーン成分信号を分離し、分離されたトーン成分信号を周波数成分毎に正規化し、正規化された正規化トーン成分信号を周波数成分毎に量子化する信号成分符号化部52と、量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号D3から、符号列D4を生成する符号列生成部53とを備える。コンテンツ符号化装置は、符号列生成部53によって生成された符号列D4から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する。

目的

本発明は、このような実情に鑑みてなされたものであり、コンテンツの符号化処理において生成するトーン成分の個数を制御することにより、符号化されたオリジナルデータを試聴データと追加データとに分離する際に、追加データのサイズを小さくし、試聴データの安全性を高く維持しつつコンテンツを効率的に流通させることができるコンテンツ符号化装置、コンテンツ符号化方法、コンテンツ符号化プログラム、及びコンテンツ符号化プログラムが記録された記録媒体、並びにコンテンツ復号装置、コンテンツ復号方法コンテンツ復号プログラム、及びコンテンツ復号プログラムが記録された記録媒体を提供することを目的とする。

効果

実績

技術文献被引用数
1件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

任意のディジタルコンテンツに対して高能率符号化を施すコンテンツ符号化装置であって、上記ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換手段と、上記変換手段によって変換された上記スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離手段と、上記信号成分分離手段によって分離された上記特定信号成分を周波数成分毎正規化する正規化手段と、上記正規化手段によって正規化された正規化特定信号成分を上記特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化手段と、上記量子化手段によって量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成手段と、上記符号列生成手段によって生成された上記符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離手段とを備えることを特徴とするコンテンツ符号化装置。

請求項2

上記第1の周波数範囲情報は、上記特定信号成分を分離すべき上限周波数を示すものであり、上記第2の周波数範囲情報は、上記上限周波数以上の周波数であって上記正規化係数情報を分離すべき下限周波数を示すものであることを特徴とする請求項1記載のコンテンツ符号化装置。

請求項3

上記第1の条件を満たす上記特定成分信号は、周波数幅が第1の既定値以下の信号成分であり且つ当該信号成分の周囲のスペクトル信号とのレベル差が第2の既定値以上である信号成分であることを特徴とする請求項1記載のコンテンツ符号化装置。

請求項4

上記第2の条件を満たす正規化係数情報は、上記ディジタルコンテンツの既定時間枠内に相当する符号列についての正規化係数情報であることを特徴とする請求項1記載のコンテンツ符号化装置。

請求項5

上記変換手段は、上記時間軸上の信号を複数の帯域に分割する帯域分割フィルタ手段と、上記帯域分割フィルタ手段によって帯域分割された複数系統の時間軸上の信号のそれぞれに対して所定の順スペクトル変換を施す順スペクトル変換手段とを有することを特徴とする請求項1記載のコンテンツ符号化装置。

請求項6

上記時間軸上の信号は、オーディオ信号であることを特徴とする請求項1記載のコンテンツ符号化装置。

請求項7

上記第1の条件は、上記特定信号成分として、上記スペクトル信号のうち、特定の周波数周辺エネルギが集中しているトーン性の信号成分を特定するためのものであることを特徴とする請求項6記載のコンテンツ符号化装置。

請求項8

上記第2の条件は、オリジナルの上記時間軸上の信号よりも狭帯域試聴帯域を決定するためのものであることを特徴とする請求項6記載のコンテンツ符号化装置。

請求項9

任意のディジタルコンテンツに対して高能率符号化を施すコンテンツ符号化方法であって、上記ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換工程と、上記変換工程にて変換された上記スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離工程と、上記信号成分分離工程にて分離された上記特定信号成分を周波数成分毎に正規化する正規化工程と、上記正規化工程にて正規化された正規化特定信号成分を上記特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化工程と、上記量子化工程にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成工程と、上記符号列生成工程にて生成された上記符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離工程とを備えることを特徴とするコンテンツ符号化方法。

請求項10

上記第1の周波数範囲情報は、上記特定信号成分を分離すべき上限周波数を示すものであり、上記第2の周波数範囲情報は、上記上限周波数以上の周波数であって上記正規化係数情報を分離すべき下限周波数を示すものであることを特徴とする請求項9記載のコンテンツ符号化方法。

請求項11

上記第1の条件を満たす上記特定成分信号は、周波数幅が第1の既定値以下の信号成分であり且つ当該信号成分の周囲のスペクトル信号とのレベル差が第2の既定値以上である信号成分であることを特徴とする請求項9記載のコンテンツ符号化方法。

請求項12

上記第2の条件を満たす正規化係数情報は、上記ディジタルコンテンツの既定時間枠内に相当する符号列についての正規化係数情報であることを特徴とする請求項9記載のコンテンツ符号化方法。

請求項13

上記変換工程は、上記時間軸上の信号を所定の帯域分割フィルタ手段によって複数の帯域に分割する帯域分割工程と、上記帯域分割工程にて帯域分割された複数系統の時間軸上の信号のそれぞれに対して所定の順スペクトル変換を施す順スペクトル変換工程とを有することを特徴とする請求項9記載のコンテンツ符号化方法。

請求項14

上記時間軸上の信号は、オーディオ信号であることを特徴とする請求項9記載のコンテンツ符号化方法。

請求項15

上記第1の条件は、上記特定信号成分として、上記スペクトル信号のうち、特定の周波数周辺にエネルギが集中しているトーン性の信号成分を特定するためのものであることを特徴とする請求項14記載のコンテンツ符号化方法。

請求項16

上記第2の条件は、オリジナルの上記時間軸上の信号よりも狭帯域の試聴帯域を決定するためのものであることを特徴とする請求項14記載のコンテンツ符号化方法。

請求項17

任意のディジタルコンテンツに対して高能率符号化を施すコンピュータ実行可能なコンテンツ符号化プログラムであって、上記ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、上記変換処理にて変換された上記スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、上記信号成分分離処理にて分離された上記特定信号成分を周波数成分毎に正規化する正規化処理と、上記正規化処理にて正規化された正規化特定信号成分を上記特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、上記量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、上記符号列生成処理にて生成された上記符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを備えることを特徴とするコンテンツ符号化プログラム。

請求項18

任意のディジタルコンテンツに対して高能率符号化を施すコンピュータ実行可能なコンテンツ符号化プログラムが記録された記録媒体であって、上記コンテンツ符号化プログラムは、上記ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、上記変換処理にて変換された上記スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、上記信号成分分離処理にて分離された上記特定信号成分を周波数成分毎に正規化する正規化処理と、上記正規化処理にて正規化された正規化特定信号成分を上記特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、上記量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、上記符号列生成処理にて生成された上記符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを備えることを特徴とするコンテンツ符号化プログラムが記録された記録媒体。

請求項19

ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換手段と、上記変換手段によって変換された上記スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離手段と、上記信号成分分離手段によって分離された上記特定信号成分を周波数成分毎に正規化する正規化手段と、上記正規化手段によって正規化された正規化特定信号成分を上記特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化手段と、上記量子化手段によって量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成手段と、上記符号列生成手段によって生成された上記符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離手段とを備えるコンテンツ符号化装置によって高能率符号化が施された符号列を復号するコンテンツ復号装置であって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解手段と、上記符号列分解手段によって分解されて抽出された上記符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え手段とを備えることを特徴とするコンテンツ復号装置。

請求項20

上記第1の周波数範囲情報は、上記特定信号成分を分離すべき上限周波数を示すものであり、上記第2の周波数範囲情報は、上記上限周波数以上の周波数であって上記正規化係数情報を分離すべき下限周波数を示すものであることを特徴とする請求項19記載のコンテンツ復号装置。

請求項21

上記第1の条件を満たす上記特定成分信号は、周波数幅が第1の既定値以下の信号成分であり且つ当該信号成分の周囲のスペクトル信号とのレベル差が第2の既定値以上である信号成分であることを特徴とする請求項19記載のコンテンツ復号装置。

請求項22

上記第2の条件を満たす正規化係数情報は、上記ディジタルコンテンツの既定時間枠内に相当する符号列についての正規化係数情報であることを特徴とする請求項19記載のコンテンツ復号装置。

請求項23

上記符号列書き換え手段によって生成された上記オリジナルの符号化信号からスペクトル信号を復元する信号成分復号手段と、上記信号成分復号手段によって復元された上記スペクトル信号から時間軸上の信号を生成する逆変換手段とを備えることを特徴とする請求項19記載のコンテンツ復号装置。

請求項24

上記信号成分復号手段は、上記オリジナルの符号化信号のうち上記特定信号成分に対応する符号化信号に対して上記量子化手段に対応した逆量子化を施す逆量子化手段と、上記逆量子化手段によって逆量子化されて得られた正規化特定信号成分に対して上記正規化手段に対応した逆正規化を施す逆正規化手段と、上記逆正規化手段によって逆正規化されて得られた特定信号成分を合成するスペクトル信号合成手段とを有することを特徴とする請求項23記載のコンテンツ復号装置。

請求項25

上記変換手段は、上記時間軸上の信号を複数の帯域に分割する帯域分割フィルタ手段と、上記帯域分割フィルタ手段によって帯域分割された複数系統の時間軸上の信号のそれぞれに対して所定の順スペクトル変換を施す順スペクトル変換手段とを有するものであることを特徴とする請求項23記載のコンテンツ復号装置。

請求項26

上記逆変換手段は、各帯域毎のスペクトル信号のそれぞれに対して逆スペクトル変換を施す逆スペクトル変換手段と、上記逆スペクトル変換手段によって時間軸上の信号に変換された複数系統の信号を帯域合成する帯域合成フィルタ手段とを有することを特徴とする請求項25記載のコンテンツ復号装置。

請求項27

上記符号列書き換え手段によって生成された上記オリジナルの符号化信号を所定の記録媒体に対して記録する記録手段を備えることを特徴とする請求項19記載のコンテンツ復号装置。

請求項28

上記時間軸上の信号は、オーディオ信号であることを特徴とする請求項19記載のコンテンツ復号装置。

請求項29

上記第1の条件は、上記特定信号成分として、上記スペクトル信号のうち、特定の周波数周辺にエネルギが集中しているトーン性の信号成分を特定するためのものであることを特徴とする請求項28記載のコンテンツ復号装置。

請求項30

上記第2の条件は、オリジナルの上記時間軸上の信号よりも狭帯域の試聴帯域を決定するためのものであることを特徴とする請求項28記載のコンテンツ復号装置。

請求項31

ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換工程と、上記変換工程にて変換された上記スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離工程と、上記信号成分分離工程にて分離された上記特定信号成分を周波数成分毎に正規化する正規化工程と、上記正規化工程にて正規化された正規化特定信号成分を上記特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化工程と、上記量子化工程にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成工程と、上記符号列生成工程にて生成された上記符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離工程とを備えるコンテンツ符号化方法によって高能率符号化が施された符号列を復号するコンテンツ復号方法であって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解工程と、上記符号列分解工程にて分解されて抽出された上記符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え工程とを備えることを特徴とするコンテンツ復号方法。

請求項32

上記第1の周波数範囲情報は、上記特定信号成分を分離すべき上限周波数を示すものであり、上記第2の周波数範囲情報は、上記上限周波数以上の周波数であって上記正規化係数情報を分離すべき下限周波数を示すものであることを特徴とする請求項31記載のコンテンツ復号方法。

請求項33

上記第1の条件を満たす上記特定成分信号は、周波数幅が第1の既定値以下の信号成分であり且つ当該信号成分の周囲のスペクトル信号とのレベル差が第2の既定値以上である信号成分であることを特徴とする請求項31記載のコンテンツ復号方法。

請求項34

上記第2の条件を満たす正規化係数情報は、上記ディジタルコンテンツの既定時間枠内に相当する符号列についての正規化係数情報であることを特徴とする請求項31記載のコンテンツ復号方法。

請求項35

上記符号列書き換え工程にて生成された上記オリジナルの符号化信号からスペクトル信号を復元する信号成分復号工程と、上記信号成分復号工程にて復元された上記スペクトル信号から時間軸上の信号を生成する逆変換工程とを備えることを特徴とする請求項31記載のコンテンツ復号方法。

請求項36

上記信号成分復号工程は、上記オリジナルの符号化信号のうち上記特定信号成分に対応する符号化信号に対して上記量子化工程に対応した逆量子化を施す逆量子化工程と、上記逆量子化工程にて逆量子化されて得られた正規化特定信号成分に対して上記正規化工程に対応した逆正規化を施す逆正規化工程と、上記逆正規化工程にて逆正規化されて得られた特定信号成分を合成するスペクトル信号合成工程とを有することを特徴とする請求項35記載のコンテンツ復号方法。

請求項37

上記変換工程は、上記時間軸上の信号を所定の帯域分割フィルタ手段によって複数の帯域に分割する帯域分割工程と、上記帯域分割工程にて帯域分割された複数系統の時間軸上の信号のそれぞれに対して所定の順スペクトル変換を施す順スペクトル変換工程とを有するものであることを特徴とする請求項35記載のコンテンツ復号方法。

請求項38

上記逆変換工程は、各帯域毎のスペクトル信号のそれぞれに対して逆スペクトル変換を施す逆スペクトル変換工程と、上記逆スペクトル変換工程にて時間軸上の信号に変換された複数系統の信号を所定の帯域合成フィルタ手段によって帯域合成する帯域合成工程とを有することを特徴とする請求項37記載のコンテンツ復号方法。

請求項39

上記符号列書き換え工程にて生成された上記オリジナルの符号化信号を所定の記録媒体に対して記録する記録工程を備えることを特徴とする請求項31記載のコンテンツ復号方法。

請求項40

上記時間軸上の信号は、オーディオ信号であることを特徴とする請求項31記載のコンテンツ復号方法。

請求項41

上記第1の条件は、上記特定信号成分として、上記スペクトル信号のうち、特定の周波数周辺にエネルギが集中しているトーン性の信号成分を特定するためのものであることを特徴とする請求項40記載のコンテンツ復号方法。

請求項42

上記第2の条件は、オリジナルの上記時間軸上の信号よりも狭帯域の試聴帯域を決定するためのものであることを特徴とする請求項40記載のコンテンツ復号方法。

請求項43

ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、上記変換処理にて変換された上記スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、上記信号成分分離処理にて分離された上記特定信号成分を周波数成分毎に正規化する正規化処理と、上記正規化処理にて正規化された正規化特定信号成分を上記特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、上記量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、上記符号列生成処理にて生成された上記符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを経て高能率符号化が施された符号列を復号するコンピュータ実行可能なコンテンツ復号プログラムであって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解処理と、上記符号列分解処理にて分解されて抽出された上記符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え処理とを備えることを特徴とするコンテンツ復号プログラム。

請求項44

ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、上記変換処理にて変換された上記スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、上記信号成分分離処理にて分離された上記特定信号成分を周波数成分毎に正規化する正規化処理と、上記正規化処理にて正規化された正規化特定信号成分を上記特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、上記量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、上記符号列生成処理にて生成された上記符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを経て高能率符号化が施された符号列を復号するコンピュータ実行可能なコンテンツ復号プログラムが記録された記録媒体であって、上記コンテンツ復号プログラムは、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解処理と、上記符号列分解処理にて分解されて抽出された上記符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え処理とを備えることを特徴とするコンテンツ復号プログラムが記録された記録媒体。

技術分野

0001

本発明は、任意のディジタルコンテンツに対して高能率符号化を施すコンテンツ符号化装置コンテンツ符号化方法、コンテンツ符号化プログラム、及びコンテンツ符号化プログラムが記録された記録媒体、並びに高能率符号化が施された符号列復号するコンテンツ復号装置コンテンツ復号方法コンテンツ復号プログラム、及びコンテンツ復号プログラムが記録された記録媒体に関する。

背景技術

0002

近年、いわゆるインターネットに代表される通信ネットワーク技術の普及及び進歩、並びに情報圧縮技術の向上、さらには、情報記録媒体高集積化又は高密度化に伴い、通信ネットワークを介して音声データや画像データ等のマルチメディアデータを含む種々のディジタルコンテンツを視聴者に配信して販売するサービスが多数ビジネス化されて実施されている。

0003

このようなサービスとしては、例えば、いわゆるコンパクトディスク(Compact Disc;CD)やミニディスク(Mini Disc)等の音楽パッケージメディアを販売している店舗等に設置されている多数の音楽データを蓄積したキオスク端末を用いるものがある。このサービスにおいては、まず、顧客が持参したミニディスク等の記録媒体をキオスク端末に装着させ、このキオスク端末における所定の表示画面に表示されたメニュー画面を介して顧客に所望の音楽データのタイトルを選択させた後、要求された料金を投入させる。そして、このサービスにおいては、これに応じて、キオスク端末が顧客によってタイトルが選択された音楽データを記録媒体に記録する。これにより、このサービスは、顧客の嗜好に応じたディジタルコンテンツを効率的に流通させるのに寄与することができる。

0004

ところで、このようなディジタルコンテンツは、複製や改竄が極めて容易とされる著作物であり、ディジタルコンテンツについての違法な複製(コピー)による著作権侵害が問題となっている。そこで、この問題に対処するため、ディジタルコンテンツの著作権保護に関する種々の技術が提案されている。

0005

著作権保護がされたディジタルコンテンツを柔軟に利用することを可能とする技術としては、例えば、特開2000−48079号公報に記載されている技術のように、視聴者が購入した有料コンテンツを、視聴者自身が所有する再生装置友人知人といった第三者が所有する再生装置に対して、著作権を保護しつつディジタルコンテンツをコピーすることにより、著作権保護がされたディジタルコンテンツを効率的に流通させるものが提案されている。この技術は、個々の再生装置に対してID(Identification)を付し、ディジタルコンテンツをコピーする再生装置の間で金銭データの送受信を行うことにより、ディジタルコンテンツを転売するものであり、特に、私的コピーの範疇に含まれる再生装置に対しては同一のIDを付すことにより、私的コピーと転売コピーとの区別を行うことができるものである。

0006

また、著作権を保護しつつディジタルコンテンツを流通させる他の技術としては、例えば、音響等の信号を暗号化して放送したり記録媒体に記録し、鍵データを購入した顧客に対してのみ、その視聴許可するというソフトウェア流通方法が知られている。ここで、暗号化の方法としては、例えば、PCM(Pulse Code Modulation)の音響信号ビット列に対して鍵信号として乱数系列初期値を与え、発生した"0/1"からなる乱数系列とPCMの音響信号のビット列との排他的論理和をとったビット列を送信したり記録媒体に記録する方法が用いられる。この流通方法を使用することにより、鍵信号を入手した顧客のみが音響信号を正確に再生することができ、鍵信号を入手していない第三者は再生しても雑音しか得られないようにすることができる。なお、暗号化方法としては、より複雑な方法を用いることも可能である。

0007

一方、音響信号を圧縮して放送したり記録媒体に記録する技術が広く普及しており、記録媒体としては、符号化されたオーディオ又は音声等の信号を記録可能な光磁気ディスク等が用いられる。オーディオ又は音声等の信号に対する高能率符号化の手法としては、種々のものが提案されている。これらの手法としては、例えば、時間軸上のオーディオ信号等をブロック化せずに、複数の周波数帯域に分割して符号化を施す非ブロック化周波数帯域分割方式である帯域分割符号化(サブ・バンドコーディング(SubBand Coding);SBC)や、時間軸上の信号を周波数軸上の信号に変換、すなわち、スペクトル変換して複数の周波数帯域に分割し、各帯域毎に符号化を施すブロック化周波数帯域分割方式である変換符号化(Transform Coding)等が挙げられる。また、符号化の手法としては、これらの帯域分割符号化と変換符号化とを組み合わせた高能率符号化の手法も考えられている。この手法は、例えば、帯域分割符号化によって帯域分割を行った後、各帯域毎の信号を周波数軸上の信号にスペクトル変換し、このスペクトル変換された各帯域毎に符号化を施すものである。

0008

ここで、帯域分割に用いるフィルタとしては、R. E. Crochiereによる"Digital coding of speech in subbands, Bell Syst. Tech. J, Vol. 55, No. 8, 1976"に記載されているいわゆるQMF(Quadrature Mirror Filter)フィルタがある。また、"Polyphase Quadrature filters-A new subband coding technique,ICASSP 83, BOSTON"には、等バンド幅のフィルタ分割手法が記載されている。

0009

また、スペクトル変換としては、例えば、入力オーディオ信号所定単位時間(フレーム)でブロック化し、当該ブロック毎に離散フーリエ変換(Discrete Fourier Transform;以下、DFTという。)、離散コサイン変換(Discrete Cosine Transform;以下、DCTという。)、又はモディファイド離散コサイン変換(Modified Discrete Cosine Transform;以下、MDCTという。)等を行うことにより、時間軸を周波数軸に変換するものがある。なお、MDCTについては、J. P. Princen, A. B. Bradley(Univ. of Surrey Royal Melbourne Inst.of Tech.)らによる"Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation,ICASSP 1987"に記載されている。

0010

波形信号スペクトルに変換する手法としてDFTやDCTを用いた場合には、M個のサンプルからなる時間ブロックで変換を行うとM個の独立な実数データが得られる。ここで、DFTやDCTにおいては、時間ブロック間の接続歪みを軽減するために、通常、両隣のブロックとそれぞれM1個のサンプルずつオーバーラップさせることから、平均して、(M−M1)個のサンプルに対して、M個の実数データを量子化して符号化することになる。

0011

これに対して、波形信号をスペクトルに変換する手法としてMDCTを用いた場合には、両隣の時間とM個ずつオーバーラップさせた2M個のサンプルから、独立なM個の実数データが得られる。そのため、MDCTにおいては、平均して、M個のサンプルに対して、M個の実数データを量子化して符号化することになる。復号装置では、このようにしてMDCTが施されて得られた符号から、各ブロックにおいて逆変換を施して得られた波形要素を互いに干渉させながら加え合わせることにより、波形信号を再構成することができる。

0012

一般に、スペクトル変換においては、変換のための時間ブロックを長くすることにより、スペクトルの周波数分解能が高まり、特定のスペクトル成分にエネルギが集中する。したがって、波形信号をスペクトルに変換する手法としては、両隣のブロックと半分ずつオーバーラップさせて長いブロック長で変換を行い、しかも得られたスペクトル信号個数が元の時間サンプルの個数に対して増加しないMDCTを用いることにより、DFTやDCTを用いた場合よりも効率のよい符号化を行うことが可能となる。また、スペクトル変換においては、隣接するブロック同士に十分長いオーバーラップを持たせることにより、波形信号のブロック間歪みを軽減することもできる。

0013

このように、符号化においては、フィルタやスペクトル変換によって帯域毎に分割された信号を量子化することにより、量子化雑音が発生する帯域を制御することができ、マスキング効果等の性質を利用して聴覚的により高能率な符号化を行うことができる。また、符号化においては、量子化を行う前に、各帯域毎に、例えばその帯域における信号成分の絶対値の最大値正規化を行うようにすれば、さらに高能率な符号化を行うことができる。

0014

周波数帯域分割された各周波数成分を量子化する周波数分割幅としては、例えば人間の聴覚特性を考慮した帯域分割が行われる。すなわち、量子化においては、一般に臨海帯域(クリティカルバンド)と称される高域ほど帯域幅が広くなるような帯域幅で、オーディオ信号を例えば25バンド程度の複数の帯域に分割することがある。また、このときの各帯域毎のデータを符号化する際には、各帯域毎に所定のビット配分による符号化又は各帯域毎に適応的なビット割当てビットアロケーション)による符号化が行われる。例えば、上述したMDCT処理を施して得られた係数データをビットアロケーションによって符号化する際には、各ブロック毎のMDCT処理によって得られる各帯域毎の係数データに対して、適応的な割当ビット数で符号化が行われることになる。

0015

ここで、ビット割当て手法としては、R. Zelinski, P. Nollらによる"Adaptive Transform Coding of Speech Signals,IEEE Transactions of Acoustics, Speech, and Signal Processing, Vol. ASSP-25, No. 4, August, 1977"及びM. A.Kransner(Massachusetts Institute of Technology)による"The critical band coder--digital encoding of the perceptual requirements of the auditory system,ICASSP 1980"に記載されているものがある。

0016

前者の文献に記載されている手法は、各帯域毎の信号の大きさに基づいてビット割当てを行うものである。この手法においては、量子化雑音スペクトルが平坦となり、雑音エネルギが最小となるものの、聴感覚的にはマスキング効果が利用されていないことから、実際の雑音感は最適ではない。一方、後者の文献に記載されている手法は、聴覚マスキングを利用することにより、各帯域毎に必要な信号対雑音比を得て固定的なビット割当てを行うものである。しかしながら、この手法においては、正弦波入力で特性を測定する場合であっても、ビット割当てが固定的であることから、特性値がそれほど良好な値とならない。

0017

そこで、これらの問題を解決するために、ビット割当てに使用できる全ビットを、各小ブロック毎に予め定められた固定ビット割当てパターン分と、各ブロックの信号の大きさに依存したビット配分を行う分とに分割使用し、その分割比率入力信号に関係する信号に依存させ、信号のスペクトルが滑らかなほど固定ビット割当てパターン分への分割比率を大きくする高能率符号化手法が提案されている。

0018

この手法は、正弦波入力のように、特定のスペクトルにエネルギが集中する場合には、そのスペクトルを含むブロックに多くのビットを割り当てることにより、全体の信号対雑音特性を著しく改善することができる。一般に、急峻なスペクトル成分を有する信号に対して人間の聴覚は極めて敏感であることから、このような手法を用いることによって信号対雑音特性を改善することは、単に測定上の数値を向上させるのみならず、聴感上、音質を改善するのに有効である。

0019

ビット割当ての手法としては、この他にも多数提案されており、さらに聴覚に関するモデルが精緻化され、符号化装置能力が向上すれば、聴覚的にみてより高能率な符号化が可能となる。これらの手法においては、計算によって求められた信号対雑音特性をなるべく忠実に実現するような実数のビット割当て基準値を求め、それを近似する整数値を割当てビット数とすることが一般的である。

0020

また、本件出願人が先に出願している特願平7−500482号においては、スペクトル信号から聴感上特に重要なトーン性の信号成分、すなわち、特定の周波数周辺にエネルギが集中している信号成分を分離して、他のスペクトル成分とは別に符号化する手法が提案されている。この手法は、オーディオ信号等を聴感上の劣化を殆ど生じさせずに高い圧縮率での効率的な符号化を可能としている。

0021

実際の符号列を構成するにあたっては、まず、正規化及び量子化が行われる帯域毎に正規化係数情報及び量子化精度情報を所定のビット数で符号化し、続いて、正規化及び量子化が施されたスペクトル信号を符号化すればよい。

0022

また、いわゆるMPEG(Moving Picture Expert Group)規格の"ISO/IEC11172-3:1993(E), 1993"においては、帯域によって量子化精度情報を表すビット数が異なるように設定された高能率符号化方式が記載されており、高域になるにしたがって、量子化精度情報を表すビット数が小さくなるように規格化されている。

0023

さらに、量子化精度情報を直接符号化する代わりに、復号装置において、例えば、正規化係数情報から量子化精度情報を決定する手法も知られているが、この手法においては、規格を設定した時点で正規化係数情報と量子化精度情報との関係が決定してしまうことから、将来的にさらに高度な聴覚モデルに基づいた量子化精度の制御を導入することができなくなる。また、この手法においては、実現する圧縮率に幅がある場合には、圧縮率毎に正規化係数情報と量子化精度情報との関係を定める必要が生じる。

0024

さらにまた、符号化の手法としては、量子化されたスペクトル信号を、例えば、D. A. Huffmanによる"A Method for Construction of Minimum Redundancy Codes, Proc. I. R. E. , 40, pp. 1098, 1952"に記載されている可変長符号を用いて符号化することにより、より効率的に符号化するものも知られている。

0025

また、上述したように符号化が施された信号をPCM信号の場合と同様に暗号化して配布することも可能である。この場合、鍵信号を入手していない第三者は、元の信号を再生することはできない。また、符号化されたビット列を暗号化するのではなく、PCM信号をランダム信号に変換した後、圧縮のための符号化を行う手法もある。この場合にも、鍵信号を入手していない第三者は、雑音しか再生することができない。

0026

しかしながら、これらのスクランブル方法においては、鍵信号を入手していない場合、又は通常の再生装置によって再生した場合には、再生をさせると雑音になってしまい、そのソフトウェアの内容を把握せしめることはできない。そのため、これらのスクランブル方法は、例えば、比較的低音質で音楽を記録した記録媒体を配布し、それを試聴した者が嗜好に応じて選択した音楽に対してのみ、鍵データを購入して高音質で再生できるようにする、又はそのソフトウェアを試聴してから高音質で記録された記録媒体を新たに購入できるようにする、といった用途に利用することができなかった。

0027

また、従来においては、高能率符号化を施した信号を暗号化する場合に、通常の再生装置にとって意味のある符号列を与えつつ、その圧縮効率を低減しないようにすることは困難であった。すなわち、従来においては、上述したように、高能率符号化を施して得られた符号列に対してスクランブルをかけた場合には、その符号列を再生しても雑音のみが発生するばかりではなく、スクランブルによって得られた符号列が元の高能率符号化の規格に適合していない場合には、再生装置が全く動作しないといった事態も生じていた。また逆に、従来においては、PCM信号に対してスクランブルをかけた後、高能率符号化を施した場合には、例えば聴覚の性質を利用して情報量を削減しているものとすると、その高能率符号化を解除した時点で、必ずしもPCM信号に対してスクランブルを施して得られた信号が再現できるわけではないことから、スクランブルを正確に解除することは困難なものとなってしまう。そのため、従来においては、圧縮の手法としては効率が低減しても、スクランブルを正確に解除できる手法を選択する必要があった。

0028

これに対して、本件出願人が先に出願している特開平10−135944号公報には、例えば音楽信号をスペクトル信号に変換して符号化したもののうち、高域側のみを暗号化した結果が狭帯域の信号であれば、鍵データがなくとも試聴することが可能となるオーディオ符号化方式が開示されている。すなわち、この方式は、例えば、高域側を暗号化するとともに、高域側のビット割当て情報等をダミーデータに置換し、高域側の真のビット割当て情報を通常の復号装置が無視する領域に記録するものである。この方式においては、例えば、試聴の結果、嗜好に応じた音楽のみを高音質で視聴することが可能となる。

0029

さらに、同公報には、万一暗号が解読された場合の危険性に備え、記録媒体に記録する一部の情報をダミーデータとし、比較的低品質で再生できるようにしておき、高品質再生が必要となった場合に、そのダミーデータを真のデータに記録しなおすことにより、暗号が解読される危険性を回避するとともに、低品質及び高品質のいずれのフォーマットで記録された記録媒体であっても、通常の再生装置によって視聴可能にする手法が提案されている。すなわち、この手法においては、コンテンツのオリジナルデータの推測が困難となるように改変した試聴データと、この試聴データに追加することによってオリジナルデータを再現可能とする追加データとに分離し、試聴データを配布する一方で追加データを著作権管理しながら販売することにより、コンテンツの効率的な流通を可能としている。

発明が解決しようとする課題

0030

ところで、同公報に記載された方式を採用する場合には、コンテンツ提供者は、二次コピーに対する制限を設けない代わりに、コンテンツの品質を制限した試聴データを配布し、ユーザは、所有している試聴データの高品質化希望する場合には、試聴データに追加してオリジナルデータを復元するための追加データを購入するようにする。その際、試聴データについては、試聴する者が時間に余裕があるとき等に通信ネットワークを介してダウンロードしたり、記録媒体に記録して配布されたものを入手すればよいことから、そのサイズはある程度の大きさを有するものであっても構わないが、追加データについては、通信ネットワーク等を介して瞬時に入手できることが望ましく、そのためには、追加データのサイズを小さくしておく必要がある。

0031

しかしながら、追加データは、主にトーン成分及び非トーン成分の正規化係数情報から構成されるものであり、さらに、これらの正規化係数情報の位置情報記述される必要があるものである。そのため、追加データのサイズは、トーン成分の個数に依存して変化することになる。すなわち、コンテンツを作成する際の符号化処理において、スペクトル信号から特にレベルが高いものをトーン成分として分離して符号化することから、トーン成分の多いコンテンツについての追加データは、そのサイズが大きくなる傾向にある一方、トーン成分の少ないコンテンツについての追加データは、そのサイズが小さくなる傾向にある。

0032

本発明は、このような実情に鑑みてなされたものであり、コンテンツの符号化処理において生成するトーン成分の個数を制御することにより、符号化されたオリジナルデータを試聴データと追加データとに分離する際に、追加データのサイズを小さくし、試聴データの安全性を高く維持しつつコンテンツを効率的に流通させることができるコンテンツ符号化装置、コンテンツ符号化方法、コンテンツ符号化プログラム、及びコンテンツ符号化プログラムが記録された記録媒体、並びにコンテンツ復号装置、コンテンツ復号方法、コンテンツ復号プログラム、及びコンテンツ復号プログラムが記録された記録媒体を提供することを目的とする。

課題を解決するための手段

0033

上述した目的を達成する本発明にかかるコンテンツ符号化装置は、任意のディジタルコンテンツに対して高能率符号化を施すコンテンツ符号化装置であって、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換手段と、この変換手段によって変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離手段と、この信号成分分離手段によって分離された特定信号成分を周波数成分毎に正規化する正規化手段と、この正規化手段によって正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化手段と、この量子化手段によって量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成手段と、この符号列生成手段によって生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離手段とを備えることを特徴としている。

0034

このような本発明にかかるコンテンツ符号化装置は、スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を信号成分分離手段によって分離し、符号列生成手段によって生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を正規化係数情報分離手段によって分離する。

0035

また、上述した目的を達成する本発明にかかるコンテンツ符号化方法は、任意のディジタルコンテンツに対して高能率符号化を施すコンテンツ符号化方法であって、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換工程と、この変換工程にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離工程と、この信号成分分離工程にて分離された特定信号成分を周波数成分毎に正規化する正規化工程と、この正規化工程にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化工程と、この量子化工程にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成工程と、この符号列生成工程にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離工程とを備えることを特徴としている。

0036

このような本発明にかかるコンテンツ符号化方法は、スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離し、生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する。

0037

さらに、上述した目的を達成する本発明にかかるコンテンツ符号化プログラムは、任意のディジタルコンテンツに対して高能率符号化を施すコンピュータ実行可能なコンテンツ符号化プログラムであって、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、この変換処理にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、この信号成分分離処理にて分離された特定信号成分を周波数成分毎に正規化する正規化処理と、この正規化処理にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、この量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、この符号列生成処理にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを備えることを特徴としている。

0038

このような本発明にかかるコンテンツ符号化プログラムは、スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離し、生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する。

0039

さらにまた、上述した目的を達成する本発明にかかるコンテンツ符号化プログラムが記録された記録媒体は、任意のディジタルコンテンツに対して高能率符号化を施すコンピュータ実行可能なコンテンツ符号化プログラムが記録された記録媒体であって、コンテンツ符号化プログラムは、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、この変換処理にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、この信号成分分離処理にて分離された特定信号成分を周波数成分毎に正規化する正規化処理と、この正規化処理にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、この量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、この符号列生成処理にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを備えることを特徴としている。

0040

このような本発明にかかるコンテンツ符号化プログラムが記録された記録媒体は、スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離し、生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離するコンテンツ符号化プログラムを提供する。

0041

また、上述した目的を達成する本発明にかかるコンテンツ復号装置は、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換手段と、この変換手段によって変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離手段と、この信号成分分離手段によって分離された特定信号成分を周波数成分毎に正規化する正規化手段と、この正規化手段によって正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化手段と、この量子化手段によって量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成手段と、この符号列生成手段によって生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離手段とを備えるコンテンツ符号化装置によって高能率符号化が施された符号列を復号するコンテンツ復号装置であって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解手段と、この符号列分解手段によって分解されて抽出された符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換えオリジナルの符号化信号を生成する符号列書き換え手段とを備えることを特徴としている。

0042

このような本発明にかかるコンテンツ復号装置は、一部がダミーデータに置換された符号列を符号列分解手段によって分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出し、得られた符号化信号のうちのダミーの正規化係数情報を符号列書き換え手段によって真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する。

0043

さらに、上述した目的を達成する本発明にかかるコンテンツ復号方法は、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換工程と、この変換工程にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離工程と、この信号成分分離工程にて分離された特定信号成分を周波数成分毎に正規化する正規化工程と、この正規化工程にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化工程と、この量子化工程にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成工程と、この符号列生成工程にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離工程とを備えるコンテンツ符号化方法によって高能率符号化が施された符号列を復号するコンテンツ復号方法であって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解工程と、この符号列分解工程にて分解されて抽出された符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え工程とを備えることを特徴としている。

0044

このような本発明にかかるコンテンツ復号方法は、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出し、得られた符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する。

0045

さらにまた、上述した目的を達成する本発明にかかるコンテンツ復号プログラムは、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、この変換処理にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、この信号成分分離処理にて分離された特定信号成分を周波数成分毎に正規化する正規化処理と、この正規化処理にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、この量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、この符号列生成処理にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを経て高能率符号化が施された符号列を復号するコンピュータ実行可能なコンテンツ復号プログラムであって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解処理と、この符号列分解処理にて分解されて抽出された符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え処理とを備えることを特徴としている。

0046

このような本発明にかかるコンテンツ復号プログラムは、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出し、得られた符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する。

0047

また、上述した目的を達成する本発明にかかるコンテンツ復号プログラムが記録された記録媒体は、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、この変換処理にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、この信号成分分離処理にて分離された特定信号成分を周波数成分毎に正規化する正規化処理と、この正規化処理にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、この量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、この符号列生成処理にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを経て高能率符号化が施された符号列を復号するコンピュータ実行可能なコンテンツ復号プログラムが記録された記録媒体であって、コンテンツ復号プログラムは、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解処理と、この符号列分解処理にて分解されて抽出された符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え処理とを備えることを特徴としている。

0048

このような本発明にかかるコンテンツ復号プログラムが記録された記録媒体は、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出し、得られた符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成するコンテンツ復号プログラムを提供する。

発明を実施するための最良の形態

0049

以下、本発明を適用した具体的な実施の形態について図面を参照しながら詳細に説明する。

0050

この実施の形態は、ディジタルコンテンツたるオーディオPCM(Pulse CodeModulation)信号等の入力ディジタル信号に対して、いわゆる帯域分割符号化(サブ・バンド・コーディング(SubBand Coding);SBC)、いわゆる適応変換符号化(Adaptive Transform Coding;ATC)、及び適応ビット割当ての各技術を用いて高能率符号化を施すコンテンツ符号化装置、並びにこのコンテンツ符号化装置によって高能率符号化が施された符号列を復号するコンテンツ復号装置である。コンテンツ符号化装置は、コンテンツのオリジナルデータの推測が困難となるように改変した試聴データと、この試聴データに追加することによってオリジナルデータを再現可能とする追加データとに分離し、試聴データを配布する一方で追加データを著作権管理しながら販売することにより、コンテンツの効率的な流通を可能とするものである。特に、コンテンツ符号化装置は、符号化されたオリジナルデータを試聴データと追加データとに分離する際に、追加データのサイズを小さくすることができるものである。

0051

まず、ここでは、コンテンツ符号化装置及びコンテンツ復号装置の説明に先だって、これらのコンテンツ符号化装置及びコンテンツ復号装置を適用して好適なデータ記録再生装置について説明する。このデータ記録再生装置は、コンテンツたるオーディオ信号を圧縮符号化して記録媒体に記録するとともに、この記録媒体に記録された圧縮データを復号して再生するデータ記録再生装置である。

0052

データ記録再生装置は、図1に示すように、記録媒体として用いられる光磁気ディスク1を回転駆動するスピンドルモータ11と、光磁気ディスク1に対してレーザ光照射する光学ヘッド12と、記録データに応じた変調磁界を光磁気ディスク1に対して印加する磁気ヘッド13と、光学ヘッド12の出力からのフォーカスエラー信号トラッキングエラー信号の抽出や再生信号2値化を行うRF(Radio Frequency)回路14と、スピンドルモータ11の回転駆動動作制御や光学ヘッド12のフォーカス制御及びトラッキング制御や光学ヘッド12及び磁気ヘッド13の移動制御を行うサーボ制御回路15と、記録系及び再生系の制御や光磁気ディスク1における記録トラック上の記録位置及び再生位置の管理等を行うシステムコントローラ16と、ユーザによる操作を受け付け入力操作部17と、再生時間を表示する表示部18と、アナログオーディオ入力信号Ainを入力する入力端子19と、ディジタルのオーディオ入力信号Dinを入力する入力端子20と、この入力端子20から入力されたオーディオ入力信号Dinを後述するATCエンコーダ24に供給するインターフェース回路21と、所定の周波数成分以下の信号を通過するローパスフィルタ(Low Pass Filter;LPF)22,32と、アナログデータをディジタルデータに変換するA/D(Analog to Digital)変換器23と、適応変換符号化処理を行うATCエンコーダ24と、データを一時的に記憶するメモリ25,29と、メモリ25から読み出したデータに対してエラー訂正のための符号化処理やいわゆるEFM(Eight to Fourteen Modulation)符号化処理等を施すエンコーダ26と、磁気ヘッド13を駆動する磁気ヘッド駆動回路27と、エンコーダ26に対応するエラー訂正のための復号処理やEFM復号処理等を施すデコーダ28と、ATCエンコーダ24に対応する復号処理を行うATCデコーダ30と、ディジタルデータをアナログデータに変換するD/A(Digital to Analog)変換器31と、アナログのオーディオ出力信号Aoutを出力する出力端子33とを備える。

0053

スピンドルモータ11は、サーボ制御回路15の制御のもとに、光磁気ディスク1を回転駆動する。

0054

光学ヘッド12は、例えば、レーザダイオード等のレーザ光源コリメータレンズ対物レンズ偏光ビームスプリッタ、及びシリンドリカルレンズ等の光学部品、並びに所定パターン受光部を有するフォトディテクタ等から構成されている。この光学ヘッド12は、光磁気ディスク1を介して磁気ヘッド13と対向する位置に設けられている。光学ヘッド12は、光磁気ディスク1に対するデータの記録時には、サーボ制御回路15によって光学系のフォーカス制御やトラッキング制御が行われるとともに、同じくサーボ制御回路15によって光磁気ディスク1における目的トラック位置に移動され、この目的トラックに対してレーザ光を照射する。光学ヘッド12は、目的トラックに照射したレーザ光の反射光を検出し、例えば、いわゆる非点収差法によってフォーカスエラーを検出し、いわゆるプッシュプル法によってトラッキングエラーを検出する。一方、光学ヘッド12は、光磁気ディスク1に記録されているデータの再生時には、フォーカスエラーやトラッキングエラーを検出すると同時に、レーザ光を照射することによって目的トラックから反射される反射光の偏光角、すなわち、カー回転角の違いを検出し、再生信号を生成する。光学ヘッド12は、生成した再生信号をRF回路14に供給する。

0055

磁気ヘッド13は、サーボ制御回路15によって光磁気ディスク1における目的トラック位置に移動され、磁気ヘッド駆動回路27から供給される駆動信号に基づいて、記録データに応じた変調磁界を光磁気ディスク1に対して印加する。

0056

RF回路14は、光学ヘッド12の出力からフォーカスエラー信号やトラッキングエラー信号を抽出してサーボ制御回路15に供給するとともに、再生信号を2値化してデコーダ28に供給する。

0057

サーボ制御回路15は、例えば、フォーカスサーボ制御回路、トラッキングサーボ制御回路、スピンドルモータサーボ制御回路、及びスレッドサーボ制御回路等から構成される。フォーカスサーボ制御回路は、フォーカスエラー信号がゼロとなるように、光学ヘッド12の光学系のフォーカス制御を行う。また、トラッキングサーボ制御回路は、トラッキングエラー信号がゼロとなるように、光学ヘッド12の光学系のトラッキング制御を行う。さらに、スピンドルモータサーボ制御回路は、光磁気ディスク1を、例えば一定線速度といったように、所定の回転速度で回転駆動するように、スピンドルモータ11を制御する。さらにまた、スレッドサーボ制御回路は、システムコントローラ16によって指定される光磁気ディスク1における目的トラック位置に光学ヘッド12及び磁気ヘッド13を移動させる。このような各種制御動作を行うサーボ制御回路15は、当該サーボ制御回路15によって制御される各部の動作状態を示す情報をシステムコントローラ16に供給する。

0058

システムコントローラ16には、入力操作部17や表示部18が接続されている。このシステムコントローラ16は、入力操作部17による操作入力情報によって記録系及び再生系の制御を行う。また、システムコントローラ16は、光磁気ディスク1における記録トラック上に記録されているいわゆるヘッダタイムやいわゆるサブコードにおけるQデータ等から再生されるセクタ単位アドレス情報に基づいて、光学ヘッド12及び磁気ヘッド13がトレースしている記録トラック上の記録位置や再生位置を管理する。さらに、システムコントローラ16は、光磁気ディスク1に対して記録する記録データの圧縮率と記録トラック上の再生位置情報とに基づいて、表示部18に再生時間を表示させる制御を行う。

0059

具体的には、システムコントローラ16は、光磁気ディスク1における記録トラックからヘッダタイムやサブコードにおけるQデータ等から再生されるセクタ単位のアドレス情報、すなわち、絶対時間情報に対して、圧縮率の逆数、例えば"1/4"倍に圧縮する際には"4"を乗算することにより、実際の時間情報を求め、これを再生時間として表示部18に表示させる。なお、システムコントローラ16は、光磁気ディスク1に対するデータの記録時においても、例えば光磁気ディスク1における記録トラックに予め絶対時間情報が記録されている、すなわち、プリフォーマットされている場合には、このプリフォーマットされた絶対時間情報を読み取って圧縮率の逆数を乗算することにより、現在位置を実際の記録時間として表示部18に表示させることも可能である。

0060

また、システムコントローラ16は、メモリ25に対する後述するメモリ制御を行うとともに、このメモリ制御によってメモリ25からバースト的に読み出される記録データを光磁気ディスク1における記録トラックに対して連続的に記録するように、記録位置の制御を行う。この記録位置の制御は、システムコントローラ16によってメモリ25からバースト的に読み出される記録データの記録位置を管理して、光磁気ディスク1における記録トラック上の記録位置を指定する制御信号をサーボ制御回路15に供給することによって行われる。

0061

さらに、システムコントローラ16は、後述するように、再生データをメモリ29に対して所定の転送速度で書き込むとともに、メモリ29から再生データを所定の転送速度で連続的に読み出すようなメモリ制御を行う。また、システムコントローラ16は、メモリ29に対するメモリ制御を行うとともに、このメモリ制御によってメモリ29に対してバースト的に書き込まれる再生データを光磁気ディスク1における記録トラックから連続的に再生するように、再生位置の制御を行う。この再生位置の制御は、システムコントローラ16によってメモリ29から連続的に読み出される再生データの再生位置を管理して、光磁気ディスク1における記録トラック上の再生位置を指定する制御信号をサーボ制御回路15に供給することによって行われる。

0062

ローパスフィルタ22は、入力端子19を介して入力されたアナログのオーディオ入力信号Ainのうち、所定の周波数成分以下の信号を通過する。このローパスフィルタ22によって通過されたアナログのオーディオ信号は、A/D変換器23に供給される。

0063

A/D変換器23は、ローパスフィルタ22から供給されたオーディオ信号を量子化し、ディジタルのオーディオPCM信号に変換する。このA/D変換器23によって変換されて得られたオーディオPCM信号は、ATCエンコーダ24に供給される。

0064

ATCエンコーダ24は、A/D変換器23によって量子化された所定の転送速度のディジタルのオーディオPCM信号や、入力端子20を介して入力されてインターフェース回路21を介して供給されたディジタルのオーディオ入力信号Dinに対して、適応変換符号化処理を施す。すなわち、ATCエンコーダ24は、A/D変換器23によって量子化された所定の転送速度のディジタルのオーディオPCM信号やオーディオ入力信号Dinに対して、所定の圧縮率に応じたビット圧縮処理を施す。このATCエンコーダ24によって適応変換符号化処理が施された圧縮データは、所定の転送速度でメモリ25に書き込まれる。

0065

メモリ25は、例えばRAM(Random Access Memory)から構成され、データの書き込み及び読み出しがシステムコントローラ16によって制御され、ATCエンコーダ24から所定の転送速度で供給された圧縮データを一時的に記憶し、必要に応じて光磁気ディスク1に対して記録するためのバッファメモリとして用いられるものである。すなわち、ATCエンコーダ24から供給される圧縮データは、例えば圧縮率が"1/8"の場合には、その転送速度が、標準的なディジタルオーディオ・コンパクトディスク(Compact Disc;CD)のフォーマットとしてのいわゆるCD−DA(Compact Disc-Digital Audio)フォーマットの転送速度である75セクタ/秒を"1/8"倍にした9.375セクタ/秒に低減されており、メモリ25には、この圧縮データが連続的に書き込まれる。

0066

ここで、圧縮データは、8セクタにつき1セクタの記録を行えば足りるが、このような8セクタおきの記録は事実上不可能に近いことから、データ記録再生装置は、後述するように、セクタ連続の記録を行う。すなわち、この記録は、休止期間を介して、例えば32セクタ+数セクタといった所定の複数セクタからなるクラスタ記録単位として、CD−DAフォーマットと同じ転送速度でバースト的に行われる。したがって、メモリ25においては、ビット圧縮レートに応じた9.375(=75/8)セクタ/秒の低い転送速度で、圧縮率が"1/8"の圧縮データが連続的に書き込まれ、記録データとして75セクタ/秒の転送速度でバースト的に読み出される。この読み出されて光磁気ディスク1に対して記録される記録データについて、記録休止期間を含む全体的な転送速度は、9.375セクタ/秒の低い速度となるものの、バースト的に行われる記録動作の時間内での瞬時的な転送速度は、標準的な75セクタ/秒となる。したがって、データ記録再生装置においては、光磁気ディスク1の回転速度がCD−DAフォーマットと同じ一定線速度のときには、このCD−DAフォーマットと同じ記録密度及び記憶パターンでの記録が行われることになる。

0067

このようなメモリ25から瞬時的には75セクタ/秒の転送速度でバースト的に読み出された記録データは、エンコーダ26に供給される。ここで、メモリ25からエンコーダ26に供給されるデータ列において、1回の記録で連続記録される単位は、例えば32セクタといった複数セクタからなるクラスタ及びこのクラスタの前後位置に設けられたクラスタ接続用の数セクタとしている。このクラスタ接続用セクタは、エンコーダ26でのインターリーブ長よりも長く設定されるものであり、データ記録再生装置においては、インターリーブされても他のクラスタのデータに影響を与えないようにしている。

0068

エンコーダ26は、メモリ25からバースト的に読み出される記録データに対して、パリティ付加及びインターリーブ処理といったエラー訂正のための符号化処理やEFM符号化処理等を施す。このエンコーダ26によって符号化処理が施された記録データは、磁気ヘッド駆動回路27に供給される。

0069

磁気ヘッド駆動回路27には、磁気ヘッド13が接続されている。この磁気ヘッド駆動回路27は、記録データに応じた変調磁界を光磁気ディスク1に対して印加するように磁気ヘッド13を駆動する。

0070

さて、このような記録系によって光磁気ディスク1における記録トラック上に連続的に記録された記録データは、以下に示す再生系によって再生される。なお、この再生系は、光磁気ディスク1のみならず、コンパクトディスクと同じ再生専用光ディスクに記録されたデータの読み出しも行うことができるものである。

0071

デコーダ28は、上述したエンコーダ26に対応して設けられるものである。デコーダ28は、RF回路14によって2値化されて供給された再生信号に対して、エラー訂正のための復号処理やEFM復号処理等を施し、上述した圧縮率が"1/8"の圧縮データを、正規の転送速度よりも速い75セクタ/秒の転送速度で再生する。このデコーダ28によって再生される再生データは、メモリ29に書き込まれる。

0072

メモリ29は、上述したメモリ25と同様に、例えばRAMから構成され、データの書き込み及び読み出しがシステムコントローラ16によって制御される。メモリ29には、デコーダ28から75セクタ/秒の転送速度で供給された再生データが、同じく75セクタ/秒の転送速度でバースト的に書き込まれる。また、メモリ29からは、75セクタ/秒の転送速度でバースト的に書き込まれた再生データが、圧縮率が"1/8"に対応する9.375セクタ/秒の転送速度で連続的に読み出される。このメモリ29から9.375セクタ/秒の転送速度で連続的に読み出された再生データは、ATCデコーダ30に供給される。

0073

ATCデコーダ30は、上述したATCエンコーダ24に対応して設けられるものである。ATCエンコーダ24から供給される圧縮データデコーダ30は、例えば再生データを"8"倍にビット伸張することによって16ビットからなるディジタルのオーディオ信号を再生する。このATCデコーダ30によって再生されて得られたオーディオ信号は、D/A変換器31に供給される。

0074

D/A変換器31は、ATCデコーダ30から供給されたディジタルのオーディオ信号をアナログのオーディオ信号に変換する。このD/A変換器31によって変換されて得られたオーディオ信号は、ローパスフィルタ32に供給される。

0075

ローパスフィルタ32は、D/A変換器31から供給されたオーディオ信号からRF信号成分やその他のノイズ成分等を遮断するために、所定の周波数成分以下の信号を通過する。このローパスフィルタ32によって通過されたアナログのオーディオ信号は、オーディオ出力信号Aoutとして出力端子33から外部へと出力される。

0076

このようなデータ記録再生装置は、光磁気ディスク1に対するデータの記録時には、例えばヘッド駆動回路27によって磁気ヘッド13を駆動して記録データに応じた変調磁界を光磁気ディスク1に対して印加するとともに、光学ヘッド12によって光磁気ディスク1の目的トラックにレーザ光を照射することにより、いわゆる磁界変調方式による熱磁気記録を行い、光磁気ディスク1の記録トラックに沿ってデータを記録する。また、データ記録再生装置は、光磁気ディスク1に記録されているデータの再生時には、光磁気ディスク1の記録トラックを光学ヘッド12によってレーザ光でトレースして磁気光学的に再生を行う。

0077

さて、以下では、このようなデータ記録再生装置に適用して好適なコンテンツ符号化装置及びコンテンツ復号装置について説明する。

0078

まず、符号化されたオリジナルデータを試聴データと追加データとに分離する際に、追加データのサイズを削減する、という本発明の内容の説明をより明確化すべく、符号化されたオリジナルデータを試聴データと追加データとに分離するコンテンツ符号化装置及びコンテンツ復号装置について説明する。本発明は、このコンテンツ符号化装置及びコンテンツ復号装置を改良することによって実現されるものである。

0079

まず、コンテンツ符号化装置について説明する。

0080

図2に示すコンテンツ符号化装置50は、上述したように、オーディオPCM信号に対して、帯域分割符号化、適応変換符号化、及び適応ビット割当ての各技術を用いて高能率符号化を施すものである。このコンテンツ符号化装置50は、入力された時間軸上の波形信号であるオーディオ信号D1を周波数軸上の信号であるスペクトル信号D2に変換する変換部51と、この変換部51によって変換されたスペクトル信号D2を周波数成分毎に符号化する信号成分符号化部52と、この信号成分符号化部52によって符号化された符号化信号D3から符号列D4を生成する符号列生成部53とを備える。

0081

変換部51は、例えば図3に示すように、オーディオ信号D1を複数の帯域に分割する帯域分割フィルタ61と、この帯域分割フィルタ61によって帯域分割された複数系統の時間軸上の信号D51,D52のそれぞれに対して所定の順スペクトル変換を施す順スペクトル変換部621,622とを有する。

0082

このような変換部51は、オーディオ信号D1を入力すると、このオーディオ信号D1を帯域分割フィルタ61によって例えば2つの帯域に分割する。このとき、帯域分割フィルタ61によって帯域分割された2系統の信号D51,D52の帯域幅は、それぞれ、オーディオ信号D1の帯域幅の"1/2"となる。すなわち、2系統の信号D51,D52は、それぞれ、オーディオ信号D1の"1/2"に間引かれる。そして、変換部51は、帯域分割フィルタ61によって帯域分割された2系統の信号D51,D52のそれぞれに対して、順スペクトル変換部621,622のそれぞれにより、モディファイド離散コサイン変換(Modified Discrete Cosine Transform;以下、MDCTという。)等の所定の順スペクトル変換をそれぞれの帯域において施し、スペクトル信号D21,D22に変換する。これらのスペクトル信号D21,D22は、図1に示したスペクトル信号D2に相当するものである。

0083

なお、変換部51としては、図2に示したもの以外にも多数考えられ、例えば、入力したオーディオ信号D1に対して直接MDCTを施してスペクトル信号D2に変換してもよく、また、MDCTではなく、離散フーリエ変換(Discrete Fourier Transform;以下、DFTという。)や離散コサイン変換(Discrete Cosine Transform;以下、DCTという。)を施してもよい。また、変換部51としては、帯域分割フィルタ61によってオーディオ信号D1を帯域成分に分割することも可能であるが、ここでは、比較的少ない演算量で多数の周波数成分が得られるMDCT、DFT又はDCTといったスペクトル変換によって周波数成分に変換する手法をとる方が望ましい。

0084

このような変換部51によってオーディオ信号D1を周波数軸上の信号に変換して得られるスペクトル信号D2は、例えば図4に示すようになる。同図においては、MDCTを施して得られたスペクトル信号の絶対値をパワーレベルとしてデシベル[dB]表記したものである。同図に示すスペクトル信号分布は、入力されたオーディオ信号D1を所定の時間ブロック毎に64個のスペクトル信号に変換されたものであり、変換部51は、このようなスペクトル信号を後段の信号成分符号化部52に供給する。

0085

信号成分符号化部52は、変換部51によって変換されたスペクトル信号D2を周波数成分毎に符号化する。信号成分符号化部52は、同図に示したスペクトル信号を入力した場合には、64個のスペクトル信号を同図中[1]から[16]までに示される量子化ユニットと称される16個の帯域にまとめて正規化及び量子化を行う。信号成分符号化部52は、量子化精度を周波数成分の分布の仕方によって量子化ユニット毎に変化させることにより、音質の劣化を最小限に抑制した聴覚的に効率のよい符号化が可能である。

0086

ここで、信号成分符号化部52は、さらに、スペクトル信号D2から聴感上特に重要なトーン性の信号成分、すなわち、特定の周波数周辺にエネルギが集中している特定信号成分を分離して、他のスペクトル成分とは別に符号化することにより、オーディオ信号を聴感上の劣化を殆ど生じさせずに高い圧縮率での効率的な符号化が可能である。このように、トーン成分を分離して符号化する場合には、信号成分符号化部52は、例えば図5に示すようになる。

0087

すなわち、信号成分符号化部52は、同図に示すように、スペクトル信号D2をトーン成分と非トーン成分とに分離するトーン成分分離部71と、このトーン成分分離部71によって分離されたトーン成分信号D61を符号化するトーン成分符号化部72と、トーン成分分離部71によって分離された非トーン成分信号D62を符号化する非トーン成分符号化部73とを有する。

0088

このような信号成分符号化部52は、まず、変換部51から供給されたスペクトル信号D2をトーン成分分離部71によってトーン成分の信号であるトーン成分信号D61と非トーン成分の信号である非トーン成分信号D62とに分離する。例えば、信号成分符号化部52は、先に図4に示したスペクトル信号からトーン成分信号D61と非トーン成分信号D62とを分離する場合には、図6に示すように、4本のスペクトル信号からなる同図中[10]で示す量子化ユニットから特にパワーレベルが周囲のスペクトル信号よりも高い[a]で示す2本のスペクトル信号をトーン成分として分離し、8本のスペクトル信号からなる同図中[13]で示す量子化ユニットから特にパワーレベルが周囲のスペクトル信号よりも高い[b]で示す3本のスペクトル信号をトーン成分として分離し、8本のスペクトル信号からなる同図中[14]で示す量子化ユニットから特にパワーレベルが周囲のスペクトル信号よりも高い[c]で示す3本のスペクトル信号をトーン成分として分離する。

0089

また、信号成分符号化部52は、このようなトーン成分分離部71によって分離されたトーン成分信号D61に対して、トーン成分符号化部72によって正規化及び量子化を施すとともに、トーン成分の位置情報の符号化も行い、符号化信号D31を生成する。さらに、信号成分符号化部52は、トーン成分分離部71によって分離された非トーン成分信号D62に対して、非トーン成分符号化部73によって正規化及び量子化を施して符号化信号D32を生成する。これらの符号化信号D31,D32は、図1に示した符号化信号D3に相当するものである。

0090

具体的には、トーン成分符号化部72及び非トーン成分符号化部73は、ともに図7に示すように、トーン成分信号D61又は非トーン成分信号D62を正規化する正規化部81と、トーン成分信号D61又は非トーン成分信号D62に基づいて量子化精度を決定する量子化精度決定部82と、正規化部81によって正規化された正規化トーン成分信号又は正規化非トーン成分信号D7を量子化する量子化部83とを有するものとなる。

0091

トーン成分符号化部72及び非トーン成分符号化部73は、それぞれ、正規化部81によって所定の帯域毎にトーン成分信号D61又は非トーン成分信号D62をレベルが等価となるように所定の正規化係数除算することによって正規化した後、トーン成分信号D61又は非トーン成分信号D62に基づいて量子化精度決定部82によって決定された量子化精度に基づいて、正規化トーン成分信号又は正規化非トーン成分信号D7を量子化部83によって量子化し、符号化信号D31,D32を生成する。なお、符号化信号D31,D32には、量子化された信号成分に加え、正規化した際の正規化係数情報や量子化精度情報も含まれている。

0092

このように、信号成分符号化部52は、変換部51から供給されたスペクトル信号D2をトーン成分分離部71によってトーン成分信号D61と非トーン成分信号D62とに分離し、これらに対して別々に正規化及び量子化を施し、得られた符号化信号D31,D32を符号列生成部53に供給する。このとき、信号成分符号化部52は、各トーン成分に対して、その周波数幅や位置情報を得る必要があるが、トーン成分を抜き出した残りのスペクトル信号は、少ないビット数で量子化することが可能であることから、特定のスペクトル信号にエネルギが集中する信号に対して、このような手法をとることにより、効率のよい符号化を行うことが可能となる。

0093

符号列生成部53は、信号成分符号化部52によって生成された符号化信号D3、すなわち、量子化された信号成分、正規化係数情報及び量子化精度情報を、"0/1"からなる符号列D4として外部に出力する。なお、符号列生成部53は、例えば、量子化されたスペクトル信号である符号化信号D3のうち、頻度の高いものに対しては比較的短い符号長を割当て、頻度の低いものに対しては比較的長い符号長を割り当てることにより、符号化効率を高めることができる。

0094

このようなコンテンツ符号化装置50は、入力されたオーディオ信号D1を変換部51によって周波数成分のスペクトル信号D2に変換した後、信号成分符号化部52によってトーン成分信号D61と非トーン成分信号D62とに分離した上で、各スペクトル信号を量子化ユニット毎に符号化し、得られた符号化信号D3から符号列生成部53によって符号列D4を生成する。

0095

つぎに、このようなコンテンツ符号化装置50によって高能率符号化が施されて生成された符号列からオーディオ信号を復号して出力するコンテンツ復号装置について説明する。

0096

図8に示すコンテンツ復号装置100は、入力された符号列D11を分解して周波数成分毎の符号化信号D12を抽出する符号列分解部101と、この符号列分解部101によって抽出された符号化信号D12からスペクトル信号D13を復元する信号成分復号部102と、この信号成分復号部102によって復元されたスペクトル信号D13から時間軸上の波形信号であるオーディオ信号D14を生成する逆変換部103とを備える。

0097

符号列分解部101は、符号列D11を入力すると、この符号列D11から周波数成分毎の符号化信号D12を抽出する。符号列分解部101は、抽出した周波数軸上の信号である符号化信号D12を信号成分復号部102に供給する。

0098

信号成分復号部102は、符号列分解部102によって分解されて抽出された符号化信号D12からスペクトル信号D13を復元する。信号成分復号部102は、上述した信号成分符号化部52によってトーン成分が分離されて符号化された符号化信号D12を復元する場合には、例えば図9に示すようになる。

0099

すなわち、信号成分復号部102は、同図に示すように、符号化信号D12のうちトーン成分に対応する符号化信号D121を復号するトーン成分復号部111と、符号化信号D12のうち非トーン成分に対応する符号化信号D122を復号する非トーン成分復号部112と、トーン成分復号部111によって復号されたトーン成分信号D151と非トーン成分復号部112によって復号された非トーン成分信号D152とを合成するスペクトル信号合成部113とを有する。

0100

このような信号成分復号部102は、まず、符号列分解部101から供給された符号化信号D12のうち、トーン成分に対応する符号化信号D121に対して、上述したトーン成分符号化部72によって施された符号化に対応する復号を施すとともに、トーン成分の位置情報の復号も行い、スペクトル信号D151を生成する。また、信号成分復号部102は、上述した非トーン成分符号化部73によって施された符号化に対応する復号を施してスペクトル信号D152を生成する。

0101

具体的には、トーン成分復号部111及び非トーン成分復号部112は、ともに図10に示すように、符号化信号D121,D122のそれぞれに対して上述した量子化部83に対応した逆量子化を施す逆量子化部121と、この逆量子化部121によって逆量子化されて得られた正規化トーン成分信号又は正規化非トーン成分信号D16に対して上述した正規化部81に対応した逆正規化を施す逆正規化部122とを有するものとなる。

0102

トーン成分復号部111及び非トーン成分復号部112は、それぞれ、量子化精度情報に基づいて逆量子化部121によって符号化信号D121,D122に対して逆量子化を施して正規化トーン成分信号又は正規化非トーン成分信号D16を生成した後、正規化係数情報に基づいて逆正規化部122によって正規化トーン成分信号又は正規化非トーン成分信号D16に対して所定の正規化係数を乗算することによって所定の帯域毎のスペクトル信号D151,D152を生成する。

0103

また、信号成分復号部102は、このようなトーン成分復号部111によって復号されたトーン成分に対応するスペクトル信号D151と、非トーン成分復号部112によって復号された非トーン成分に対応するスペクトル信号D152とをスペクトル信号合成部113によって合成し、スペクトル信号D13を生成する。

0104

このように、信号成分復号部102は、符号列分解部101から供給された符号化信号D12をトーン成分の符号化信号D121と非トーン成分の符号化信号D122とに分離して別々に逆量子化及び逆正規化を施し、これらをスペクトル信号合成部113によって合成し、得られたスペクトル信号D13を逆変換部103に供給する。

0105

逆変換部103は、信号成分復号部102によって復号されたスペクトル信号D13を逆変換し、オーディオ信号D14を生成する。逆変換部103は、例えば図11に示すように、各帯域毎のスペクトル信号D131,D132のそれぞれに対して逆スペクトル変換を施す逆スペクトル変換部1311,1312と、これらの逆スペクトル変換部1311,1312のそれぞれによって時間軸上の波形信号に変換された複数系統の信号D171,D172を帯域合成する帯域合成フィルタ132とを有する。

0106

このような逆変換部103は、各帯域毎のスペクトル信号D131,D132のそれぞれに対して、上述した順スペクトル変換部621,622のそれぞれによって施された順スペクトル変換に対応する逆スペクトル変換を施し、得られた2系統の信号D171,D172を帯域合成し、オーディオ信号D14を生成する。

0107

このようなコンテンツ復号装置100は、入力された符号列D11から符号列分解部101によって周波数成分毎の符号化信号D12を抽出し、この符号化信号D12から信号成分復号部102によってスペクトル信号D13を復元した後、逆変換部103によってオーディオ信号D14を生成して出力する。

0108

さて、上述したコンテンツ符号化装置50によってオーディオ信号D1を符号化して得られた符号列D4は、当該コンテンツ符号化装置50が先に図1に示したデータ記録再生装置等に適用されることにより、図12に示すフォーマットにしたがって所定の記録媒体に記録され得る。コンテンツ復号装置100は、先に図1に示したデータ記録再生装置等に適用されることにより、記録媒体に対して記録された符号列を読み出して再生することができることになる。

0109

すなわち、符号列D4は、図12に示すように、ヘッダ、トーン成分情報、及び非トーン成分情報からなるフレーム毎に記録媒体に記録される。

0110

ヘッダは、各フレームの先頭に設けられる固定長からなるものである。ヘッダには、同期信号の他、先に図3に示した帯域分割フィルタ61による帯域分割数等も記述される。

0111

ヘッダに続いて設けられるトーン成分情報は、スペクトル信号D2から分離したトーン成分に関する情報である。トーン成分情報としては、トーン成分の数を示すトーン成分数情報、トーン成分の周波数幅を示すトーン幅情報、及び量子化精度情報が記述され、続いて各トーン成分の情報が記述される。各トーン成分の情報としては、正規化係数情報、トーン成分の位置情報を示すトーン位置情報、及びスペクトル係数情報が記述される。なお、図12においては、先に図6に示したスペクトル信号を記録した場合について示しており、低域から高域までの3つのトーン成分[a],[b],[c]のそれぞれに対して、正規化係数情報として、"30","27","24"が割り当てられている様子を示している。なお、この正規化係数情報としては、ここでは、デシベル値に比例した値が用いられている。

0112

トーン成分情報に続いて設けられる非トーン成分情報は、スペクトル信号D2から分離した非トーン成分に関する情報である。非トーン成分情報としては、量子化ユニットの数を示す量子化ユニット数情報、量子化ユニット数分の量子化精度情報、及び量子化ユニット数分の正規化係数情報が記述され、続いて正規化及び量子化されたスペクトル係数情報が記述される。なお、フレームが固定長である場合には、スペクトル係数情報の後段に空き領域が設けられる。同図においては、先に図6に示したスペクトル信号を記録した場合について示しており、最低域の量子化ユニット[1]から最高域の量子化ユニット[16]のそれぞれに対して、正規化係数情報として、"46","52","37",・・・,"21","18","12","10","8"が割り当てられている様子を示している。なお、この正規化係数情報としては、ここでも、デシベル値に比例した値が用いられている。

0113

ところで、実際には、このようなオリジナルのオーディオ信号D1を符号化して得られたオリジナルの符号列D4からコンテンツ符号化装置50によって試聴データが生成され、この試聴データが図13に示すフォーマットにしたがって記録媒体等に記録されて配布される。なお、同図においては、先に図6に示したように、試聴帯域として量子化ユニット[1]から量子化ユニット[12]までを指定した場合について示している。

0114

すなわち、試聴データのフォーマットは、図12に示した符号列D4のフォーマットと比較して、図13斜線部aに示すように、試聴帯域よりも高域である量子化ユニット[13]から量子化ユニット[16]までの非トーン成分情報における正規化係数情報を全て"0"として最小化したものとなる。すなわち、試聴データは、符号列D4から、試聴帯域内の量子化ユニット[1]から量子化ユニット[12]までの正規化係数情報を分離し、それ以外の正規化係数情報を全て"0"として最小化することによって生成される。したがって、試聴データにおいては、同図中斜線部bに示す非トーン成分情報における量子化ユニット[13]から量子化ユニット[16]のそれぞれに対して割り当てられるスペクトル係数情報は、有効な値が記述されるものの、当該試聴データの再生時には対応する正規化係数情報が"0"であることによって結果的に極小化されることになる。なお、スペクトル係数情報としては、一部の情報を値が"0"のダミーデータに置換するようにしてもよい。特に、中域のスペクトル信号は、音質上、重要な意味を有することから、試聴データにおいては、この部分を値が"0"のダミーデータに置換し、高域の部分についてはダミーの正規化係数情報に置換するようにしてもよい。この場合、試聴データにおいては、ダミーの正規化係数情報に置換する帯域とスペクトル係数情報の一部をダミーデータに置換する帯域とをオーバーラップさせてもよい。このようにすることにより、特にスペクトル係数情報の符号化に可変長符号を用いた場合には、中域の一部の情報が欠落することから、再生側は、それより高域のデータを解読することが全く不可能となる、といった利点がある。

0115

また、試聴データは、同図中斜線部c,dに示すように、トーン成分情報についても、試聴帯域よりも高域である量子化ユニット[13]から量子化ユニット[16]のそれぞれに割り当てられる正規化係数情報を全て"0"として最小化することにより、当該試聴データの再生時には対応するスペクトル係数情報を極小化せしめることができる。

0116

このようなフォーマットにしたがって記録媒体に記録される試聴データが再生された場合には、図14に示すようなスペクトル信号が得られる。すなわち、試聴データを再生して得られるオーディオ信号は、試聴帯域よりも高域である量子化ユニット[13]から量子化ユニット[16]のそれぞれに対して割り当てられている正規化係数情報が最小化されていることから、対応するスペクトル信号も極小化されたものとなり、さらに、試聴帯域よりも高域に属するトーン成分[b],[c]についても同様にスペクトル信号が極小化されたものとなる。したがって、オーディオ信号は、実質的には、量子化ユニット[1]から量子化ユニット[12]までの狭帯域の試聴データとして再生される。

0117

一方、このような試聴データに対して追加される追加データは、図15に示すように、1フレームがトーン成分に関する情報及び非トーン成分に関する情報からなるものである。

0118

トーン成分に関する情報としては、最小化したトーン成分の数を示す正規化係数情報数が記述され、続いて各トーン成分の情報として、正規化係数情報の周波数軸上の位置を示す正規化係数情報位置と正規化係数情報自体が順次記述される。なお、同図においては、先に図6に示したスペクトル信号についての追加データについて示しており、正規化係数情報数として、2つのトーン成分[b],[c]があることを示す"2"が記述される。また、トーン成分[b]の情報としては、正規化係数情報位置として、"34"が記述されるとともに、正規化係数情報として、先に図12に示した"27"が記述される。さらに、トーン成分[c]の情報としては、正規化係数情報位置として、"44"が記述されるとともに、正規化係数情報として、先に図12に示した"24"が記述される。

0119

非トーン成分に関する情報としては、最小化した量子化ユニットの数を示す正規化係数情報数が記述され、続いて最小化した量子化ユニットのうちの最低域側の量子化ユニット番号を示す正規化係数情報先頭位置が記述され、続いて各量子化ユニットの正規化係数情報が順次記述される。なお、図15においては、正規化係数情報数として、5つの量子化ユニット[12],[13],[14],[15],[16]があることを示す"5"が記述される。また、正規化係数情報先頭位置としては、量子化ユニット[13]を示す"13"が記述される。さらに、各量子化ユニットの正規化係数情報としては、量子化ユニット[12]から量子化ユニット[16]のそれぞれに対して、先に図12に示した"21","18","12" ,"10" ,"8"が記述される。

0120

このようなフォーマットにしたがって生成される追加データは、試聴データに追加される。先に図15に示した試聴データのスペクトル信号は、試聴データに対して追加データが追加されることにより、先に図6に示したスペクトル信号に復元される。

0121

さて、以上においては、符号化されたオリジナルデータを試聴データと追加データとに分離する基本技術について説明した。以下では、コンテンツ符号化装置50及びコンテンツ復号装置100を改良し、追加データのサイズを削減する、という本発明の内容について説明する。本発明をオーディオ信号に適用したものは、比較的低品質のオーディオ信号を内容の試聴用として自由に視聴できるように配布し、サイズが小さい追加データを別途購入等して入手することにより、高品質のオーディオ信号を視聴できるようにするものである。

0122

すなわち、本発明を実現するコンテンツ符号化装置は、上述したように、例えば図12に示したように記述されるオリジナルデータに基づいて、先に図13に示したように、試聴帯域よりも高域である量子化ユニット[13]から量子化ユニット[16]までの正規化係数情報に対してダミーデータとして"0"に置換されたデータを符号化する。このように、コンテンツ符号化装置においては、高域側の正規化係数情報を最小化することにより、先に図14に示したようなスペクトル信号が得られ、高域側のスペクトル信号は厳密には"0"とはならないものの、可聴性の観点からは実質的には"0"と等価なものとなる。以下では、このようなスペクトル信号を、この場合も含めて狭帯域信号と称するものとする。また、以下では、本発明を実現するコンテンツ符号化装置を、便宜上、コンテンツ符号化装置150と称するものとする。

0123

コンテンツ符号化装置150は、上述したコンテンツ符号化装置50と構成の面では同一の各部を備えるものとして実現される。コンテンツ符号化装置150は、コンテンツ符号化装置50と同様に、オーディオ信号や画像信号等を符号化して得られたオリジナルデータの符号列を、ダミーデータを含む低品質の試聴データと、試聴データに追加することによって高品質のオリジナルデータを復元するための追加データとに分離するが、オリジナルデータに含まれるトーン成分の数を予め制限することにより、追加データのサイズを削減することができる。ここで、試聴データ及びこの試聴データを高品質化して得られるオリジナルデータは、両者とも上述したコンテンツ復号装置100を用いて再生することが可能な形式で記述されることから、コンテンツ符号化装置150は、低品質の試聴データを無償で広く配布するとともに、小容量の追加データを有償で高速に配信することが可能となる。

0124

具体的には、コンテンツ符号化装置150は、上述したトーン成分分離部71によってトーン成分と非トーン成分とを分離する際に、図16に示す一連の処理を経ることにより、適切な条件下でトーン成分を分離する。

0125

すなわち、トーン成分分離部71は、同図に示すように、ステップS1において、トーン成分の検出処理を行う周波数帯域として、例えば試聴データの周波数帯域幅がコンテンツ提供者によって設定されると、ステップS2において、トーン成分の検出条件がコンテンツ提供者によって設定される。すなわち、トーン成分分離部71においては、上述した変換部51によって変換されたスペクトル信号D2から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たすトーン成分信号を分離するように、トーン成分の検出条件がコンテンツ提供者によって設定されるとともに、符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報が分離されるように、試聴データの周波数帯域幅がコンテンツ提供者によって設定される。より換言すれば、第1の条件とは、検出して分離すべきトーン成分の周波数範囲情報であり、第2の条件とは、トーン成分として分離すべき信号成分が属する周波数範囲情報、すなわち試聴データの周波数帯域幅である。このとき、第1の周波数範囲情報は、トーン成分信号を分離すべき上限周波数を示すものであり、第2の周波数範囲情報は、上限周波数以上の周波数であって正規化係数情報を分離すべき下限周波数を示すものである関係が成立する。

0126

ここで、トーン成分の検出条件としては、トーン成分の周波数幅や周囲のスペクトル信号とのレベル差等を設定することができる。すなわち、トーン成分としては、周波数幅が第1の既定値以下の信号成分であり且つ当該信号成分の周囲のスペクトル信号とのレベル差が第2の既定値以上である信号成分であることが条件とされる。トーン成分分離部71は、例えば、ステップS1にて設定された試聴帯域より低域側で正数幅のトーン成分を検出するとともに、試聴帯域以上では幅が"0"のトーン成分を検出する、すなわち、実質的に検出処理を行わない、といった処理を行うことができる。また、トーン成分の検出条件としては、トーン成分を一切検出しない、とすることも可能である。

0127

続いて、トーン成分分離部71は、ステップS3において、ステップS2にて設定された周波数幅のスペクトル信号を最低域側から順次選択し、ステップS4において、選択したスペクトル信号がステップS2にて設定されたトーン成分の検出条件を満たしているか否かを判定する。トーン成分分離部71は、スペクトル信号がトーン成分の検出条件を満たしておりトーン成分であるものと判定した場合には、ステップS5において、このスペクトル信号をトーン成分として分離し、ステップS6へと処理を移行する。一方、トーン成分分離部71は、スペクトル信号がトーン成分の検出条件を満たしておらずトーン成分でないものと判定した場合には、そのままステップS6へと処理を移行する。

0128

そして、トーン成分分離部71は、ステップS6において、ステップS3にて選択したスペクトル信号がステップS1にて設定された試聴帯域以上であるか否かを判定する。トーン成分分離部71は、試聴帯域以上であるものと判定した場合には、そのまま一連の処理を終了する。一方、トーン成分分離部71は、試聴帯域未満であるものと判定した場合には、次のスペクトル信号を選択して処理を続行すべくステップS3からの処理を繰り返す。

0129

このように、コンテンツ符号化装置150は、提供するコンテンツを符号化する際に、トーン成分分離部71における処理として、コンテンツ提供者によって試聴データの周波数幅等のトーン成分の検出条件を設定することができ、例えば、設定周波数以下のスペクトル信号に関して、そのスペクトル信号のレベルがその周囲のスペクトル信号よりも設定されたレベル以上高い場合には、トーン成分と判定して元のスペクトル信号から分離する。これにより、コンテンツ符号化装置150においては、検出条件外のトーン成分、例えば試聴帯域よりも高域に属するトーン成分についての正規化係数情報が追加データに記述されないことから、追加データのサイズを削減することが可能となる。

0130

さらに、コンテンツ符号化装置150は、例えば、トーン成分分離部71によってトーン成分の検出を行わないことにより、追加データの中にトーン成分に関する情報を一切記述しないようにすることも可能である。すなわち、コンテンツ符号化装置150においては、同じコンテンツであっても、信号成分符号化部52によってトーン成分の検出を行わずに符号化する場合には、信号成分符号化部52によってトーン成分を分離して符号化する場合と比較して、追加データにトーン成分情報が記述されないことから、追加データのサイズをより削減することが可能となる。

0131

コンテンツ符号化装置150は、このような一連の処理を用いて、トーン成分分離部71における処理を行う際に、スペクトル信号の中から、試聴帯域内で特にレベルが高いものをトーン成分として分離する。具体的には、コンテンツ符号化装置150は、例えば図17に示すように、先に図6に示した試聴帯域よりも高域に属するトーン成分[b],[c]については、トーン成分として分離せずに量子化ユニットとともに符号化し、試聴帯域内に属するトーン成分[a]についてのみトーン成分として分離して別途符号化する。

0132

このようなコンテンツ符号化装置150によってオーディオ信号D1を符号化して得られた符号列D4は、図18に示すフォーマットにしたがって所定の記録媒体に記録され得る。

0133

すなわち、符号列D4は、同図に示すように、ヘッダ、トーン成分情報、及び非トーン成分情報からなるフレーム毎に記録媒体に記録される。

0134

ヘッダは、先に図12に示したものと同様に、各フレームの先頭に設けられる固定長からなるものであって、ヘッダには、同期信号の他、先に図3に示した帯域分割フィルタ61による帯域分割数等も記述される。

0135

ヘッダに続いて設けられるトーン成分情報としては、トーン成分の数を示すトーン成分数情報、トーン成分の周波数幅を示すトーン幅情報、及び量子化精度情報が記述され、続いて各トーン成分の情報が記述される。各トーン成分の情報としては、正規化係数情報、トーン成分の位置情報を示すトーン位置情報、及びスペクトル係数情報が記述される。なお、図18においては、図12に示したフォーマットと比較して、1つのトーン成分[a]のみについての情報が記述されており、正規化係数情報としての"30"が割り当てられている様子を示している。

0136

トーン成分情報に続いて設けられる非トーン成分情報としては、量子化ユニットの数を示す量子化ユニット数情報、量子化ユニット数分の量子化精度情報、及び量子化ユニット数分の正規化係数情報が記述され、続いて正規化及び量子化されたスペクトル係数情報が記述される。図18においては、図12に示したフォーマットと同様に、最低域の量子化ユニット[1]から最高域の量子化ユニット[16]のそれぞれに対して、正規化係数情報として、"46","52","37",・・・,"21","18","12","10","8"が割り当てられている様子を示している。

0137

このようなオリジナルのオーディオ信号D1を符号化して得られた符号列D4からコンテンツ符号化装置150によって生成される試聴データのフォーマットは、図19に示すようになる。

0138

すなわち、試聴データのフォーマットは、図18に示した符号列D4のフォーマットと比較して、図19中斜線部eに示すように、試聴帯域よりも高域である量子化ユニット[13]から量子化ユニット[16]までの非トーン成分情報における正規化係数情報を全て"0"として最小化したものとなる。すなわち、試聴データは、符号列D4から、試聴帯域内の量子化ユニット[1]から量子化ユニット[12]までの正規化係数情報を分離し、それ以外の正規化係数情報を全て"0"として最小化することによって生成される。したがって、試聴データにおいては、同図中斜線部fに示す非トーン成分情報における量子化ユニット[13]から量子化ユニット[16]のそれぞれに対して割り当てられるスペクトル係数情報は、有効な値が記述されるものの、当該試聴データの再生時には対応する正規化係数情報が"0"であることによって結果的に極小化されることになる。また、試聴データは、試聴帯域よりも高域である量子化ユニット[13]から量子化ユニット[16]までにはトーン成分が存在しないことから、トーン成分情報については、図18に示したフォーマットから変更されることはなく、トーン成分[a]のみについての情報が記述される。

0139

このようなフォーマットからなる試聴データが再生された場合には、図20に示すようなスペクトル信号が得られる。すなわち、試聴データを再生して得られるオーディオ信号は、試聴帯域よりも高域である量子化ユニット[13]から量子化ユニット[16]のそれぞれに対して割り当てられている正規化係数情報が最小化されていることから、対応するスペクトル信号も極小化されたものとなり、実質的には、量子化ユニット[1]から量子化ユニット[12]までの狭帯域の試聴データとして再生される。したがって、このスペクトル信号は、先に図14に示したスペクトル信号と全く同一のものとなる。

0140

一方、このような試聴データに対して追加される追加データは、図21に示すように、先に図15に示した追加データとは異なり、1フレームが非トーン成分に関する情報のみからなるものである。

0141

非トーン成分に関する情報としては、最小化した量子化ユニットの数を示す正規化係数情報数が記述され、続いて最小化した量子化ユニットのうちの最低域側の量子化ユニット番号を示す正規化係数情報先頭位置が記述され、続いて各量子化ユニットの正規化係数情報が順次記述される。なお、同図においては、正規化係数情報数として、5つの量子化ユニット[12],[13],[14],[15],[16]があることを示す"5"が記述されている様子を示している。また、正規化係数情報先頭位置としては、量子化ユニット[13]を示す"13"が記述される。さらに、各量子化ユニットの正規化係数情報としては、量子化ユニット[12]から量子化ユニット[16]のそれぞれに対して、先に図12に示した"21","18" ,"12" ,"10" ,"8"が記述される。

0142

このようなフォーマットにしたがって生成される追加データは、試聴データに追加される。先に図20に示した試聴データのスペクトル信号は、試聴データに対して追加データが追加されることにより、先に図17に示したスペクトル信号に復元される。

0143

このように、コンテンツ符号化装置150は、コンテンツたるオーディオ信号を符号化する際に、例えば試聴帯域内に属するトーン成分についてのみ分離するといったように、適切な条件下でトーン成分を分離することにより、符号化されたオリジナルデータから試聴データと追加データとを生成する際に、試聴データの音質を劣化させることなく、追加データのサイズを削減することが可能となる。

0144

なお、コンテンツ符号化装置150は、試聴データと追加データとを分離する際に、コンテンツの符号列の全体に対して行う必要はなく、例えば、追加データの購買意欲喚起するために、上述した第2の条件として、試聴データの既定時間枠内でオリジナルデータと同様に高音質とすることも可能であり、その場合には、追加データの分離処理を行う必要はない。すなわち、コンテンツ符号化装置150は、上述した第2の条件を満たす正規化係数情報として、ディジタルコンテンツの既定時間枠内に相当する符号列についての正規化係数情報とすることにより、試聴帯域を可変とすることができる。

0145

一方、このようなコンテンツ符号化装置150に対応するコンテンツ復号装置を、オーディオ信号を再生するものとして適用した場合には、図22に示すように構成される。すなわち、コンテンツ復号装置200は、上述した符号列分解部101と同様の符号列分解部201と、追加データD23から真の正規化係数情報D24を抽出する制御部202と、符号列分解部201によって抽出された符号化信号D22と制御部202によって抽出された真の正規化係数情報D24とを用いて符号列を書き換えてオリジナルの符号化信号D25を生成する符号列書き換え部203と、上述した信号成分復号部102と同様の信号成分復号部204と、上述した逆変換部103と同様の逆変換部205とを備える。

0146

符号列分解部201は、一部がダミーデータに置換された試聴データからなる符号列D21を入力すると、この符号列D21から周波数成分毎の符号化信号D22を抽出する。符号列分解部201は、抽出した周波数軸上の信号である符号化信号D22を符号列書き換え部203に供給する。

0147

制御部202は、真の正規化係数情報を含む追加データD23を入力すると、この追加データD23から真の正規化係数情報D24を抽出する。制御部202は、抽出した真の正規化係数情報D24を符号列書き換え部203に供給する。

0148

符号列書き換え部203は、符号列分解部201によって分解されて抽出された符号化信号D22のうちのダミーの正規化係数情報の部分を、制御部202によって抽出された真の正規化係数情報D24に書き換える。符号列書き換え部203は、書き換えて生成したオリジナルの符号化信号D25を信号成分復号部204に供給する。

0149

信号成分復号部204は、符号列書き換え部203によって書き換えられて生成された符号化信号D25からスペクトル信号D26を復元する。信号成分復号部204は、上述した信号成分符号化部52によってトーン成分が分離されて符号化された符号化信号D12を復元する場合には、先に図9に示したように構成され、符号列書き換え部203から供給された符号化信号D25をトーン成分の符号化信号と非トーン成分の符号化信号とに分離して別々に逆量子化及び逆正規化を施し、これらを合成して得られたスペクトル信号D26を逆変換部205に供給する。

0150

逆変換部205は、信号成分復号部204によって復号されたスペクトル信号D26を逆変換し、時間軸上の波形信号であるオーディオ信号D27を生成する。

0151

このようなコンテンツ復号装置200は、図23に示す一連の処理を経ることにより、オーディオ信号D27を再生して出力する。

0152

すなわち、コンテンツ復号装置200は、同図に示すように、ステップS11において、符号列分解部201によってダミーデータを含んだ試聴データからなる符号列D21を分解して符号化信号D22を抽出する。

0153

続いて、コンテンツ復号装置200は、ステップS12において、高音質再生を実行するか否かを判定する。

0154

ここで、コンテンツ復号装置200は、高音質再生を実行しないものと判定した場合には、ステップS14へと処理を移行し、信号成分復号部204によって符号化信号D22を復号してスペクトル信号D26を復元し、ステップS15において、逆変換部205によってスペクトル信号D26を時系列信号への逆変換を行い、オーディオ信号D27を再生して出力する。

0155

一方、コンテンツ復号装置200は、高音質再生を実行するものと判定した場合には、ステップS13において、符号列書き換え部203によって符号化信号D22におけるダミーデータを追加データD23に含まれる真の正規化係数情報D24に書き換えてオリジナルの符号化信号D25を生成する。

0156

そして、コンテンツ復号装置200は、ステップS14において、信号成分復号部204によって符号化信号D25を復号してスペクトル信号D26を復元し、ステップS15において、逆変換部205によってスペクトル信号D26を時系列信号への逆変換を行い、オーディオ信号D27を再生して出力する。

0157

コンテンツ復号装置200は、このような一連の処理を経ることにより、入力された狭帯域信号であり低音質の試聴データからなる符号列D21から符号列分解部201によって周波数成分毎の符号化信号D22を抽出するとともに、入力された追加データD23から制御部202によって真の正規化係数情報D24を抽出し、符号列書き換え部203によって符号化信号D22のうちのダミーの正規化係数情報の部分を真の正規化係数情報D24に書き換えてオリジナルの符号化信号D25を生成する。そして、コンテンツ復号装置200は、この符号化信号D25から信号成分復号部204によってスペクトル信号D26を復元した後、逆変換部205によって広帯域であり高音質のオーディオ信号D27を再生して出力することができる。

0158

また、コンテンツ復号装置を、所定の記録媒体に対して符号化信号を記録するものとして適用した場合には、図24に示すように構成される。すなわち、コンテンツ復号装置200'は、上述した符号列分解部201、制御部202、符号列書き換え部203の他に、図示しない所定の記録媒体に対して符号化信号D28を記録する記録部206を備える。

0159

記録部206は、符号列書き換え部203によって書き換えられて生成された符号化信号D25を、符号化信号D28として記録媒体に記録する。ここで、記録媒体は、書き換えが可能なものである場合には、元々の試聴データである符号列D21を記録していたものであってもよい。

0160

このようなコンテンツ復号装置200'は、図25に示す一連の処理を経ることにより、符号化信号D28を記録媒体に記録する。

0161

すなわち、コンテンツ復号装置200'は、同図に示すように、ステップS21において、高音質記録を実行するか否かを判定する。

0162

ここで、コンテンツ復号装置200'は、高音質記録を実行しないものと判定した場合には、ステップS24へと処理を移行し、記録部206によって符号列D21を符号化信号D28として記録媒体に記録する。すなわち、コンテンツ復号装置200'は、低音質のオーディオ信号が再生される試聴データからなる符号列D21を記録媒体に記録する。

0163

一方、コンテンツ復号装置200'は、高音質記録を実行するものと判定した場合には、ステップS22において、符号列分解部201によってダミーデータを含んだ試聴データからなる符号列D21を分解して符号化信号D22を抽出する。

0164

続いて、コンテンツ復号装置200'は、ステップS23において、符号列書き換え部203によって符号化信号D22に含まれるダミーデータを追加データD23に含まれる真の正規化係数情報D24に書き換えてオリジナルの符号化信号D25を生成する。

0165

そして、コンテンツ復号装置200'は、ステップS24において、記録部206によって符号化信号D25を符号化信号D28として記録媒体に記録する。

0166

コンテンツ復号装置200'は、このような一連の処理を経ることにより、入力された狭帯域信号であり低音質の試聴データからなる符号列D21から符号列分解部201によって周波数成分毎の符号化信号D22を抽出するとともに、入力された追加データD23から制御部202によって真の正規化係数情報D24を抽出し、符号列書き換え部203によって符号化信号D22のうちのダミーの正規化係数情報の部分を真の正規化係数情報D24に書き換えてオリジナルの符号化信号D25を生成する。そして、コンテンツ復号装置200'は、広帯域であり高音質のオーディオ信号を再生して出力することが可能な符号化信号D25を記録部206によって記録媒体に記録することができる。

0167

以上説明したように、コンテンツ符号化装置は、コンテンツのオリジナルデータの推測が困難となるように改変した試聴データと、この試聴データに追加することによってオリジナルデータを再現可能とする追加データとに分離する際に、特定の周波数帯域に集中するスペクトル信号を適切な条件下で制限しながらトーン成分として分離し、正規化及び量子化を伴う符号化を行う。これにより、コンテンツ符号化装置は、オリジナルの符号化信号の高域側のスペクトル信号の正規化係数情報を改変することによって品質を抑制した試聴データをユーザに対して配布することが可能となるとともに、ユーザが試聴データの高品質化を希望する際に配信するオリジナルの正規化係数情報を含む追加データの情報量を大幅に削減することが可能となり、小容量の追加データを高速に配信することができる。

0168

また、コンテンツ符号化装置によってトーン成分及び非トーン成分に関する正規化係数情報をダミーデータとして作成された試聴データは、当該試聴データからオリジナルデータを推測させることを困難とするものである。したがって、コンテンツ符号化装置及びコンテンツ復号装置においては、試聴データを不正に改変しようとすると却って音質を劣化させる原因になることから、コンテンツの著作権を保護しつつ試聴データを効率的に広く配布することが可能となる。

0169

なお、本発明は、上述した実施の形態に限定されるものではない。例えば、上述した実施の形態では、オーディオ信号に対する符号化及び復号を行うものとして説明したが、本発明は、画像信号に対しても容易に適用可能である。すなわち、本発明は、例えば、画像信号に対して2次元DCTを用いて各ブロック毎に変換を行い、得られた信号に対して多様な量子化テーブルを用いて量子化を行う場合、ダミーの量子化テーブルとして高域成分を除去したものを指定しておき、これを高画質化する場合には、高域成分を除去しない真の量子化テーブルに置換することにより、オーディオ信号の場合と同様の処理を行うことが可能である。

0170

また、本発明は、符号列全体に暗号化が施され、再生時にその暗号を復号しながら再生するようなシステムにも容易に適用することができる。

0171

さらに、上述した実施の形態では、符号化されたビットストリームを記録媒体に対して記録する場合について説明したが、本発明は、ビットストリームを伝送する場合にも適用することができる。これにより、本発明は、例えば、全帯域にわたって真の正規化係数情報を入手した視聴者のみに対しては放送されているオーディオ信号の高音質再生を可能とし、その他の視聴者に対してはその内容が把握できるものの、比較的低音質の再生しかできないように制限することが可能となる。

0172

さらにまた、本発明は、上述したコンテンツの符号化及び復号処理をハードウェアで実現するのみならず、コンピュータ実行可能なソフトウェアで実現することもできる。すなわち、本発明は、ソフトウェアで実現する場合には、例えばパーソナルコンピュータ等の各種情報処理装置におけるCPU(Central Processing Unit)によって上述したコンテンツの符号化を行うコンテンツ符号化プログラムや上述したコンテンツの復号を行うコンテンツ復号プログラムを実行することにより、この機能を実現することができる。これらのコンテンツ符号化プログラム及びコンテンツ復号プログラムは、例えばコンパクトディスク等のコンピュータ実行可能な所定の記録媒体やインターネット等の伝送媒体によって提供することができる。

0173

このように、本発明は、その趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

発明の効果

0174

以上詳細に説明したように、本発明にかかるコンテンツ符号化装置は、任意のディジタルコンテンツに対して高能率符号化を施すコンテンツ符号化装置であって、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換手段と、この変換手段によって変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離手段と、この信号成分分離手段によって分離された特定信号成分を周波数成分毎に正規化する正規化手段と、この正規化手段によって正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化手段と、この量子化手段によって量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成手段と、この符号列生成手段によって生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離手段とを備える。

0175

したがって、本発明にかかるコンテンツ符号化装置は、スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を信号成分分離手段によって分離し、符号列生成手段によって生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を正規化係数情報分離手段によって分離することにより、分離して得られる狭帯域のデータから広帯域のオリジナルのディジタルコンテンツを再現すべく追加されるデータのサイズを削減することができ、このデータを高速に配信することができる。

0176

また、本発明にかかるコンテンツ符号化方法は、任意のディジタルコンテンツに対して高能率符号化を施すコンテンツ符号化方法であって、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換工程と、この変換工程にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離工程と、この信号成分分離工程にて分離された特定信号成分を周波数成分毎に正規化する正規化工程と、この正規化工程にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化工程と、この量子化工程にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成工程と、この符号列生成工程にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離工程とを備える。

0177

したがって、本発明にかかるコンテンツ符号化方法は、スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離し、生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離することにより、分離して得られる狭帯域のデータから広帯域のオリジナルのディジタルコンテンツを再現すべく追加されるデータのサイズを削減することが可能となり、このデータを高速に配信することが可能となる。

0178

さらに、本発明にかかるコンテンツ符号化プログラムは、任意のディジタルコンテンツに対して高能率符号化を施すコンピュータ実行可能なコンテンツ符号化プログラムであって、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、この変換処理にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、この信号成分分離処理にて分離された特定信号成分を周波数成分毎に正規化する正規化処理と、この正規化処理にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、この量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、この符号列生成処理にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを備える。

0179

したがって、本発明にかかるコンテンツ符号化プログラムは、スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離し、生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離することにより、このコンテンツ符号化プログラムが提供された機器が、分離して得られる狭帯域のデータから広帯域のオリジナルのディジタルコンテンツを再現すべく追加されるデータのサイズを削減することを可能とし、このデータを高速に配信することを可能とする。

0180

さらにまた、本発明にかかるコンテンツ符号化プログラムが記録された記録媒体は、任意のディジタルコンテンツに対して高能率符号化を施すコンピュータ実行可能なコンテンツ符号化プログラムが記録された記録媒体であって、コンテンツ符号化プログラムは、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、この変換処理にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、この信号成分分離処理にて分離された特定信号成分を周波数成分毎に正規化する正規化処理と、この正規化処理にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、この量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、この符号列生成処理にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを備える。

0181

したがって、本発明にかかるコンテンツ符号化プログラムが記録された記録媒体は、スペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離し、生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離するコンテンツ符号化プログラムを提供することができる。そのため、このコンテンツ符号化プログラムが提供された機器は、分離して得られる狭帯域のデータから広帯域のオリジナルのディジタルコンテンツを再現すべく追加されるデータのサイズを削減することができ、このデータを高速に配信することができる。

0182

また、本発明にかかるコンテンツ復号装置は、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換手段と、この変換手段によって変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離手段と、この信号成分分離手段によって分離された特定信号成分を周波数成分毎に正規化する正規化手段と、この正規化手段によって正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化手段と、この量子化手段によって量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成手段と、この符号列生成手段によって生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離手段とを備えるコンテンツ符号化装置によって高能率符号化が施された符号列を復号するコンテンツ復号装置であって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解手段と、この符号列分解手段によって分解されて抽出された符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え手段とを備える。

0183

したがって、本発明にかかるコンテンツ復号装置は、一部がダミーデータに置換された符号列を符号列分解手段によって分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出し、得られた符号化信号のうちのダミーの正規化係数情報を符号列書き換え手段によって真の正規化係数情報に書き換え、オリジナルの符号化信号を生成することにより、コンテンツ符号化装置によって分離して得られる狭帯域のデータから広帯域のオリジナルのディジタルコンテンツを再現すべく追加されるデータのサイズが削減されていても、広帯域のオリジナルの符号化信号を生成することができる。

0184

さらに、本発明にかかるコンテンツ復号方法は、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換工程と、この変換工程にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離工程と、この信号成分分離工程にて分離された特定信号成分を周波数成分毎に正規化する正規化工程と、この正規化工程にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化工程と、この量子化工程にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成工程と、この符号列生成工程にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離工程とを備えるコンテンツ符号化方法によって高能率符号化が施された符号列を復号するコンテンツ復号方法であって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解工程と、この符号列分解工程にて分解されて抽出された符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え工程とを備える。

0185

したがって、本発明にかかるコンテンツ復号方法は、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出し、得られた符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成することにより、コンテンツ符号化方法によって分離して得られる狭帯域のデータから広帯域のオリジナルのディジタルコンテンツを再現すべく追加されるデータのサイズが削減されていても、広帯域のオリジナルの符号化信号を生成することが可能となる。

0186

さらにまた、本発明にかかるコンテンツ復号プログラムは、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、この変換処理にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、この信号成分分離処理にて分離された特定信号成分を周波数成分毎に正規化する正規化処理と、この正規化処理にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、この量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、この符号列生成処理にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを経て高能率符号化が施された符号列を復号するコンピュータ実行可能なコンテンツ復号プログラムであって、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解処理と、この符号列分解処理にて分解されて抽出された符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え処理とを備える。

0187

したがって、本発明にかかるコンテンツ復号プログラムは、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出し、得られた符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成することにより、符号化の際に分離して得られる狭帯域のデータから広帯域のオリジナルのディジタルコンテンツを再現すべく追加されるデータのサイズが削減されていても、このコンテンツ復号プログラムが提供された機器が、広帯域のオリジナルの符号化信号を生成することを可能とする。

0188

また、本発明にかかるコンテンツ復号プログラムが記録された記録媒体は、ディジタルコンテンツとしての時間軸上の信号を周波数軸上の信号であるスペクトル信号に変換する変換処理と、この変換処理にて変換されたスペクトル信号から、少なくとも所定の第1の周波数範囲情報を含む第1の条件を満たす特定信号成分を分離する信号成分分離処理と、この信号成分分離処理にて分離された特定信号成分を周波数成分毎に正規化する正規化処理と、この正規化処理にて正規化された正規化特定信号成分を特定信号成分に基づいて決定された量子化精度に基づいて周波数成分毎に量子化する量子化処理と、この量子化処理にて量子化された信号成分、正規化係数情報及び量子化精度情報からなる符号化信号から、符号列を生成する符号列生成処理と、この符号列生成処理にて生成された符号列から、少なくとも所定の第2の周波数範囲情報を含む第2の条件を満たす正規化係数情報を分離する正規化係数情報分離処理とを経て高能率符号化が施された符号列を復号するコンピュータ実行可能なコンテンツ復号プログラムが記録された記録媒体であって、コンテンツ復号プログラムは、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出する符号列分解処理と、この符号列分解処理にて分解されて抽出された符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成する符号列書き換え処理とを備える。

0189

したがって、本発明にかかるコンテンツ復号プログラムが記録された記録媒体は、一部がダミーデータに置換された符号列を分解して周波数軸上の信号である周波数成分毎の符号化信号を抽出し、得られた符号化信号のうちのダミーの正規化係数情報を真の正規化係数情報に書き換え、オリジナルの符号化信号を生成するコンテンツ復号プログラムを提供することができる。そのため、符号化の際に分離して得られる狭帯域のデータから広帯域のオリジナルのディジタルコンテンツを再現すべく追加されるデータのサイズが削減されていても、このコンテンツ復号プログラムが提供された機器は、広帯域のオリジナルの符号化信号を生成することができる。

図面の簡単な説明

0190

図1本発明の実施の形態として示すコンテンツ符号化装置及びコンテンツ復号装置を適用して好適なデータ記録再生装置の構成を説明するブロック図である。
図2符号化されたオリジナルデータを試聴データと追加データとに分離するコンテンツ符号化装置の構成を説明するブロック図である。
図3同コンテンツ符号化装置が有する変換部の構成を説明するブロック図である。
図4同変換部によってオーディオ信号を周波数軸上の信号に変換して得られるスペクトル信号の分布を説明する図である。
図5同コンテンツ符号化装置が有する信号成分符号化部の構成を説明するブロック図である。
図6同変換部によってオーディオ信号を周波数軸上の信号に変換して得られるスペクトル信号の分布を説明する図であって、同信号成分符号化部によってトーン成分を分離する様子を説明するための図である。
図7同信号成分符号化部が有するトーン成分符号化部又は非トーン成分符号化部の構成を説明するブロック図である。
図8同コンテンツ符号化装置に対応するコンテンツ復号装置の構成を説明するブロック図である。
図9同コンテンツ復号装置が有する信号成分復号部の構成を説明するブロック図である。
図10同信号成分復号部が有するトーン成分復号部又は非トーン成分復号部の構成を説明するブロック図である。
図11同コンテンツ復号装置が有する逆変換部の構成を説明するブロック図である。
図12同コンテンツ符号化装置によってオーディオ信号を符号化して得られた符号列を記録媒体に対して記録する際のフォーマットを説明する図である。
図13図12にフォーマットを示す符号列から生成される試聴データのフォーマットを説明する図である。
図14図13にフォーマットを示す試聴データが再生された場合に得られるスペクトル信号の分布を説明する図である。
図15図13にフォーマットを示す試聴データに追加される追加データのフォーマットを説明する図である。
図16追加データの削減を図ることができるコンテンツ符号化装置が有するトーン成分分離部によってトーン成分を分離する際の一連の処理を説明するフローチャートである。
図17オーディオ信号を周波数軸上の信号に変換して得られるスペクトル信号の分布を説明する図であって、スペクトル信号の中から、試聴帯域内で特にレベルが高いものをトーン成分として分離する様子を説明するための図である。
図18追加データの削減を図ることができるコンテンツ符号化装置によってオーディオ信号を符号化して得られた符号列を記録媒体に対して記録する際のフォーマットを説明する図である。
図19図18にフォーマットを示す符号列から生成される試聴データのフォーマットを説明する図である。
図20図19にフォーマットを示す試聴データが再生された場合に得られるスペクトル信号の分布を説明する図である。
図21図19にフォーマットを示す試聴データに追加される追加データのフォーマットを説明する図である。
図22追加データの削減を図ることができるコンテンツ符号化装置に対応するコンテンツ復号装置を、オーディオ信号を再生するものとして適用した場合における構成を説明するブロック図である。
図23同コンテンツ復号装置によってオーディオ信号を再生して出力する際の一連の処理を説明するフローチャートである。
図24追加データの削減を図ることができるコンテンツ符号化装置に対応するコンテンツ復号装置を、符号化信号を所定の記録媒体に記録するものとして適用した場合における構成を説明するブロック図である。
図25同コンテンツ復号装置によって符号化信号を記録媒体に対して記録する際の一連の処理を説明するフローチャートである。

--

0191

50,150コンテンツ符号化装置、 51 変換部、 52 信号成分符号化部、 53符号列生成部、 61帯域分割フィルタ、 621,622順スペクトル変換部、 71トーン成分分離部、 72 トーン成分符号化部、 73非トーン成分符号化部、 81正規化部、 82量子化精度決定部、 83量子化部、 100,200,200'コンテンツ復号装置、101,201 符号列分解部、 102,204 信号成分復号部、 103,205逆変換部、 111 トーン成分復号部、 112 非トーン成分復号部、 113スペクトル信号合成部、 121逆量子化部、 122逆正規化部、 1311,1312 逆スペクトル変換部、 132帯域合成フィルタ、 202 制御部、 203 符号列書き換え部、 206 記録部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ