図面 (/)

技術 オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、MPEGオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、MPEGオーディオ復元装置、および挿入データ編集装置。

出願人 KDDI株式会社国立大学法人信州大学
発明者 中島康之田中清米山暁夫
出願日 2006年7月7日 (14年4ヶ月経過) 出願番号 2006-187925
公開日 2008年1月24日 (12年9ヶ月経過) 公開番号 2008-015326
状態 特許登録済
技術分野 音声の分析・合成
主要キーワード 品質順位 データ挿入位置 中点近傍 周波数量子 符号化サンプル 量子化周波数 マスク効果 マスクレベル
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2008年1月24日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

秘匿データ圧縮されたオーディオデータに効率的に挿入し、秘匿されたデータを効率的に検出することのできる圧縮オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法等を提供する。

解決手段

オーディオデータの量子化周波数成分の0係数情報と非0係数情報の位置の関係を用いて秘匿データを挿入する。符号化されたオーディオデータのサブバンド数m個の場合、キーとなる位置kについて、挿入データgの値(“0”や“1”)に応じてある規則サブバンドデータの位置を変更する。キーとなるサブバンドkを求め、埋め込むデータが“1”の場合は、位置pにあるサブバンドデータs(p)を高周波側のk+dの位置に移動させる。逆に、挿入データが“0”の場合は、サブバンドデータの移動は行わず、そのままにする。

概要

背景

圧縮オーディオデータ秘匿情報を埋め込む従来技術として、例えば下記の特許文献1,2に示されているものがある。

前記特許文献1には、聴覚心理モデルによって決定されるマスキングレベルと、ビット割り当てまたは量子化ステップ数によって定まる量子化誤差から求めたノイズレベルとの比率(MNR)を用いて、特定サブバンドにおけるMNRの品質順位グループ化した信号値によって電子透かし情報を埋め込むことにより、音質劣化を抑えることのできる電子透かし埋め込に装置が開示されている。

この電子透かし埋め込に装置によれば、フレーム毎または間欠フレーム量子化後、信号の所定のサブバンド復号時のMNRの品質順位をグループ化することにより得た信号値を、所望の透かし情報の信号値と一致するように調整することにより、所望の透かし情報を量子化後信号に埋め込むことができる。

また、前記特許文献2には、圧縮されたオーディオにデータを挿入する方法が開示されている。
特開2002−304184号公報
特開2001−184080号公報

概要

秘匿データを圧縮されたオーディオデータに効率的に挿入し、秘匿されたデータを効率的に検出することのできる圧縮オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法等を提供する。 オーディオデータの量子化周波数成分の0係数情報と非0係数情報の位置の関係を用いて秘匿データを挿入する。符号化されたオーディオデータのサブバンド数m個の場合、キーとなる位置kについて、挿入データgの値(“0”や“1”)に応じてある規則サブバンドデータの位置を変更する。キーとなるサブバンドkを求め、埋め込むデータが“1”の場合は、位置pにあるサブバンドデータs(p)を高周波側のk+dの位置に移動させる。逆に、挿入データが“0”の場合は、サブバンドデータの移動は行わず、そのままにする。

目的

本発明の目的は、前記した従来技術の問題点を解決し、秘匿データを圧縮されたオーディオデータに効率的に挿入し、秘匿されたデータを効率的に検出することのできる圧縮オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、MPEGオーディオ符号化データへの秘匿データ挿入装置、及び秘匿データ抽出装置を提供することにある。また、他の目的は、秘匿データを別の秘匿データに書き換える秘匿データ編集方法、及び秘匿データ編集装置、ならびにMPEGオーディオ復元装置を提供することにある。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

オーディオデータ量子化周波数成分最高周波数またはこれに近い周波数位置と指定する複数の非0係数の位置との関係によりデータを挿入する位置を決定し、秘匿データを挿入することを特徴とするオーディオデータへの秘匿データ挿入方法。

請求項2

請求項1に記載のオーディオデータへの秘匿データ挿入方法において、前記最高周波数またはこれに近い周波数位置と前記複数の非0係数の特定のものとの位置関係からキーとなる量子化周波数成分の位置を求め、前記非0係数の位置を該キーとなる位置の高周波側に変更することによりデータを挿入することを特徴とするオーディオデータへの秘匿データ挿入方法。

請求項3

請求項2に記載のオーディオデータへの秘匿データ挿入方法において、前記キーとなる位置は、前記最高周波数またはこれに近い周波数位置と前記複数の非0係数の特定のものの位置との中点またはその近傍であることを特徴とするオーディオデータへの秘匿データ挿入方法。

請求項4

請求項2または3に記載のオーディオデータへの秘匿データ挿入方法において、 指定するn+1個(nは正の整数)の非0係数について、該n+1個の非0係数のうちの1個の位置と前記最高周波数またはこれに近い周波数位置の中点を求め、前記非0係数の位置を該中点より高周波側の位置に変更することによりnビットのデータを挿入することを特徴とするオーディオデータへの秘匿データ挿入方法。

請求項5

請求項1ないし4のいずれかに記載のオーディオデータへの秘匿データ挿入方法において、前記オーディオデータの量子化周波数成分は、符号化オーディオデータを部分復号して得ることを特徴とするオーディオデータへの秘匿データ挿入方法。

請求項6

請求項1ないし4のいずれかに記載のオーディオデータへの秘匿データ挿入方法において、前記オーディオデータの量子化周波数成分は、オーディオデータを周波数変換し、量子化して得ることを特徴とするオーディオデータへの秘匿データ挿入方法。

請求項7

符号化されたオーディオ情報を部分的に復号し、周波数領域で量子化された符号化情報を抽出し、最高周波数またはこれに近い周波数位置と非0係数情報の位置関係を用いて符号化情報に埋め込まれたデータを抽出することを特徴とする符号化オーディオデータからの秘匿データ抽出方法

請求項8

符号化されたオーディオ情報を部分的に復号し、周波数領域で量子化された符号化情報を抽出し、最高周波数またはこれに近い周波数位置と非0係数情報の位置関係を用いて符号化情報に埋め込まれたデータを抽出し、前記最高周波数またはこれに近い周波数位置と非0係数情報の位置関係を用いて新たなデータを埋め込むことを特徴とすることを特徴とする符号化オーディオデータでの埋め込み秘匿データ編集方法

請求項9

MPEGオーディオ符号化データへの秘匿データ挿入装置であって、MPEGオーディオ入力手段と、符号化サンプルデータから量子化係数を抽出する量子化係数抽出手段と、非0周波数量子化係数と最大周波数量子化係数またはこれに近い周波数の量子化係数位置からビット挿入位置を求め、ビットの値に応じて該ビット挿入位置にデータを埋め込む手段と、該埋め込まれたデータを用いてMPEG規格準拠したオーディオデータを出力する手段とを具備したことを特徴とするMPEGオーディオ符号化データへの秘匿データ挿入装置。

請求項10

請求項9に記載のMPEGオーディオ符号化データへの秘匿データ挿入装置において、前記ビット挿入位置は、最大周波数の2つの非0量子化係数位置と最大周波数量子化係数またはこれに近い周波数の量子化係数位置から決定されることを特徴とするMPEGオーディオ符号化データへの秘匿データ挿入装置。

請求項11

請求項9に記載のMPEGオーディオ符号化データへの秘匿データ挿入装置において、最も高い周波数の非0量子化係数の位置を挿入ビットの値により移動させることを特徴とするMPEGオーディオ符号化データへの秘匿データ挿入装置。

請求項12

MPEGオーディオ符号化時にMPEGオーディオ符号化データへ秘匿データを挿入するMPEGオーディオ符号化データへの秘匿データ挿入装置であって、オーディオデータ入力手段と、MPEG符号化時に周波数変換後の量子化係数を抽出する量子化係数抽出手段と、非0周波数量子化係数と最大周波数量子化係数またはこれに近い周波数の量子化係数位置からビット挿入位置を求め、ビットの値により該ビット挿入位置にデータを埋め込む手段と、MPEGオーディオデータとして出力する手段とを具備したことを特徴とするMPEGオーディオ符号化データへの秘匿データ挿入装置。

請求項13

請求項12に記載のMPEGオーディオ符号化データへの秘匿データ挿入装置において、前記データを埋め込む手段は、非0周波数量子化係数と最大周波数量子化係数またはこれに近い周波数の量子化係数位置から複数のビット挿入位置を求め、該複数のビットの値により該複数のビット挿入位置にデータを埋め込むことを特徴とするMPEGオーディオ符号化データへの秘匿データ挿入装置。

請求項14

ビット挿入されたMPEGオーディオデータからの秘匿データ抽出装置であって、MPEGオーディオデータの入力手段と、該MPEGオーディオデータから量子化係数を抽出する量子化係数抽出手段と、非0周波数量子化係数位置と最大周波数量子化係数またはこれに近い周波数の量子化係数位置からビット挿入位置とビットの値を決定する手段とを具備したことを特徴とするMPEGオーディオ秘匿データにおける秘匿データ抽出装置。

請求項15

請求項14に記載のMPEGオーディオデータからの秘匿データ抽出装置において、前記ビット挿入位置とビットの値を決定する手段は、非0周波数量子化係数位置と最大周波数量子化係数またはこれに近い周波数の量子化係数位置から複数のビット挿入位置と複数の挿入ビットの値を決定することを特徴とするMPEGオーディオ秘匿データにおける秘匿データ抽出装置。

請求項16

ビット挿入されたMPEGオーディオデータから元のMPEGオーディオデータへ復元する符号化オーディオ復元装置であって、MPEGオーディオデータの入力手段と、該MPEGオーディオデータのから量子化係数を抽出する量子化係数抽出手段と、非0周波数量子化係数位置と最大周波数量子化係数またはこれに近い周波数の量子化係数位置からビット挿入位置とビットの値を決定する手段と、該挿入データを削除して挿入前のMPEGオーディオサンプルデータに復元する手段とを具備したことを特徴とするMPEGオーディオ復元装置。

請求項17

ビット挿入されたMPEGオーディオデータの挿入データ編集装置であって、MPEGオーディオデータの入力手段と、該MPEGオーディオデータから量子化係数を抽出する量子化係数抽出手段と、非0周波数量子化係数位置と最大周波数量子化係数またはこれに近い周波数の量子化係数位置からビット挿入位置とビットの値を決定する手段と、挿入データを削除して挿入前のMPEGオーディオサンプルデータに復元する手段と、非0周波数量子化係数と最大周波数量子化係数またはこれに近い周波数の量子化係数位置からビット挿入位置を求め、ビットの値に応じて該ビット挿入位置にデータを埋め込む手段と、該埋め込まれたデータを用いてMPEG規格に準拠したオーディオデータを出力する手段とを具備したことを特徴とするMPEGオーディオデータでの挿入データ編集装置。

技術分野

0001

本発明は、圧縮オーディオデータ秘匿情報を適用する技術に関し、特にオーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法MPEGオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、MPEGオーディオ復元装置、および挿入データ編集装置に関する。

背景技術

0002

圧縮オーディオデータに秘匿情報を埋め込む従来技術として、例えば下記の特許文献1,2に示されているものがある。

0003

前記特許文献1には、聴覚心理モデルによって決定されるマスキングレベルと、ビット割り当てまたは量子化ステップ数によって定まる量子化誤差から求めたノイズレベルとの比率(MNR)を用いて、特定サブバンドにおけるMNRの品質順位グループ化した信号値によって電子透かし情報を埋め込むことにより、音質劣化を抑えることのできる電子透かし埋め込に装置が開示されている。

0004

この電子透かし埋め込に装置によれば、フレーム毎または間欠フレーム量子化後、信号の所定のサブバンド復号時のMNRの品質順位をグループ化することにより得た信号値を、所望の透かし情報の信号値と一致するように調整することにより、所望の透かし情報を量子化後信号に埋め込むことができる。

0005

また、前記特許文献2には、圧縮されたオーディオにデータを挿入する方法が開示されている。
特開2002−304184号公報
特開2001−184080号公報

発明が解決しようとする課題

0006

しかしながら、前記した特許文献1のものは、符号化時に得られる符号化雑音情報(MNR)を制御情報として用いて挿入データにより再量子化する際に、透かし情報の埋め込み前のデータに戻せないため、音質劣化が生じるという問題、また情報量が増えた場合、書き換えができないという問題がある。

0007

また、前記した特許文献2のものは、圧縮されたオーディオに付加情報が埋め込まれると、別の値に変換されてしまうため、元のMPEGデータに戻すことが困難であるという問題、及び書き換えができないという問題があった。

0008

本発明の目的は、前記した従来技術の問題点を解決し、秘匿データを圧縮されたオーディオデータに効率的に挿入し、秘匿されたデータを効率的に検出することのできる圧縮オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、MPEGオーディオ符号化データへの秘匿データ挿入装置、及び秘匿データ抽出装置を提供することにある。また、他の目的は、秘匿データを別の秘匿データに書き換える秘匿データ編集方法、及び秘匿データ編集装置、ならびにMPEGオーディオ復元装置を提供することにある。

課題を解決するための手段

0009

前記した目的を達成するために、本発明は、オーディオデータの量子化周波数成分最高周波数またはこれに近い周波数位置と指定する複数の非0係数の位置との関係によりデータを挿入する位置を決定し、秘匿データを挿入するようにした点に第1の特徴がある。

0010

また、本発明は、符号化されたオーディオ情報を部分的に復号し、周波数領域で量子化された符号化情報を抽出し、最高周波数またはこれに近い周波数位置と非0係数情報位置関係を用いて符号化情報に埋め込まれたデータを抽出するようにした点に第2の特徴がある。

0011

また、本発明は、符号化されたオーディオ情報を部分的に復号し、周波数領域で量子化された符号化情報を抽出し、最高周波数またはこれに近い周波数位置と非0係数情報の位置関係を用いて符号化情報に埋め込まれたデータを抽出し、前記最高周波数またはこれに近い周波数位置と非0係数情報の位置関係を用いて新たなデータを埋め込むようにした点に第3の特徴がある。

0012

さらに、本発明は、MPEGオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、MPEGオーディオ復元装置、および挿入データ編集装置を提供する点に第4の特徴がある。

発明の効果

0013

本発明によれば、秘匿データを、単に、オーディオデータの量子化周波数成分の0係数情報と非0係数情報の位置の関係を用いて入することができるので、従来装置のように、MDCT係数等まで戻さずに秘匿データを挿入することができ、低処理負荷で秘匿データをオーディオデータに挿入できるようになる。また、秘匿データの抽出を容易に行うことができる。

0014

また、秘匿データの挿入後も、挿入前の符号化仕様準拠させることができる。また、高周波成分の位置を移動させるだけであるので、秘匿データの挿入後でも音質劣化が少ない。

0015

また、前記移動した高周波成分を元に戻せば、完全に秘匿データ挿入前のオーディオデータに復元できる。また、このため、挿入データの書き換え(秘匿データ編集)が可能になる。

0016

また、MPEG規格に準拠したオーディオデータへの秘匿データ挿入装置、秘匿データ抽出装置、MPEGオーディオ復元装置、および挿入データ編集装置を提供することができる。

発明を実施するための最良の形態

0017

以下に、図面を参照して、本発明を詳細に説明する。図1は、秘匿データを圧縮されたオーディオデータに効率的に挿入できるようにした一実施形態の概略のブロック図である。

0018

量子化周波数成分復元部11に符号化オーディオデータaが入力される。量子化周波数成分復元部11では符号化データを部分的に復号して量子化された周波数成分11aが抽出される。例えば、MPEG-1オーディオでは、量子化サブバンドデータ量子化MDCT係数がこれに相当する。なお、量子化周波数成分と無関係なヘッダ情報11bなどは、そのまま符号化データ再構成部13に入力される。量子化周波数成分復元部11から出力された量子化周波数成分11aは、“0”や“1”などの挿入データg(ビットデータ)、すなわち秘匿データと共に、第1のデータ挿入部12に入力される。データ挿入された量子化周波数成分12aは符号化データ再構成部13に入力されて、ヘッダ情報11bなどのデータ挿入に関連しない符号化オーディオデータと合わせて再構成されて、データ挿入されたオーディオ符号化データ13aとして出力される。

0019

図2は、前記第1のデータ挿入部12の動作を示したものである。ステップS1では、量子化周波数成分11aを受け取り、ステップS2では、非0成分と0成分が抽出され、ステップS3では、それらのデータからデータ挿入位置候補が決定される。ステップS4では、挿入データg(“0”、“1”)より決定されるデータ挿入位置に非0成分の位置を変更する。これにより、ステップS5では、量子化周波数成分上で量子化周波数成分の位置に透かしデータすなわち秘匿データを、1ビット埋め込むことができる。

0020

図3は、MPEG-1オーディオレイヤーIIで符号化されたオーディオデータにデータ挿入する場合を示したものである。入力されたMPEG-1オーディオデータaは、量子化サブバンドサンプル復元部15で部分復号されてサブバンドサンプル15aを出力する。ヘッダ情報などサブバンドサンプルに関係しない情報15bについては、MPEG符号化データ再構成部17に入力される。サブバンドサンプル15aは、第2のデータ挿入部16に挿入データgと共に入力される。第2のデータ挿入部16では、挿入するデータに依存して量子化サブバンドサンプルを変更する。MPEG符号化データ再構成部17では、データ挿入された量子化サブバンドサンプル16aとヘッダ情報15bなどが再構成され、MPEG-1規格に準拠したデータフォーマットが生成される。これによりデータ挿入されたMPEG-1オーディオデータ17aが出力される。

0021

図4は、MPEG-1の場合の第2のデータ挿入部16の動作を示したものである。ステップS11では、量子化サブサンプル復元部15から量子化周波数成分15aを受け取り、ステップS12では、非0量子化サブバンド成分と0量子化サブバンド成分を抽出する。ステップS13では、それらのデータからデータ挿入位置候補が決定される。なお、サブバンド成分とは、サブバンドサンプルにおける各サブバンドの成分を示す。ステップS14では、挿入データg(“0”、“1”)より決定されるデータ挿入位置に非0量子化サブバンド成分の位置を変更する。これにより、ステップS15では、量子化周波数成分上で量子化周波数成分の位置に透かしデータを1ビット埋め込むことができる。

0022

図5に、挿入する1ビットデータに対する具体的なサブバンドサンプルの変更方法をMPEG-1オーディオの例を用いて示す。

0023

符号化されたオーディオデータのサブバンド数m個で、図の例では、非0となるサブバンドは、サブバンド番号#0,1,2やq、pである。これに対して0となるサブバンドは、サブバンド番号6・・・や、kなどのpより大きいサブバンド番号が該当する。データ埋め込みは、非0サブバンドの位置を変更することによって実現する。一例として、キーとなる位置kについて、挿入データgの値(“0”や“1”)に応じてある規則でサブバンドデータの位置を変更する。

0024

たとえば、非0サブバンド成分のうち最高周波数成分の位置がpで、次に低い周波数の非0サブバンド成分の位置がq、0サブバンド成分の最高周波数(m−1)とした場合、キーとなるサブバンドkを、非0サブバンド成分qと最高周波数サブバンド(m−1)との中点に位置するサブバンドとして求める。求め方としては、k=((m−1)+q+1)/2として計算することができる。したがって、非0サブバンド成分qとサブバンドkとの間の距離、あるいは0サブバンド成分の最高周波数とサブバンドkとの間の距離lは、l=(m−1)−k=k−qとなる。

0025

データの挿入方法としては、最高周波数に位置する2つの非0サブバンドサブバンド成分pとqの距離をd(=p−q)として、埋め込むデータが“1”の場合は、位置pにあるサブバンドデータs(p)を高周波側のk+dの位置xに移動させる。逆に、挿入データが“0”の場合は、サブバンドデータの移動は行わず、そのままにする。最高周波数の0サブバンド位置(m−1)と2番目に高周波に位置する非0サブバンド成分の位置qは挿入データに依存せずに一定であるため、データ挿入された符号化オーディオデータからこれらのデータを手がかりにデータ挿入値を検出することができる。

0026

ここで、MPEG-1オーディオにおけるサブバンドサンプルについて図6に説明する。MPEG-1オーディオレイヤーIIでは、1秒間は38個のフレームデータで構成され(サンプリング周波数が44.1kHz の場合)、1フレームは36個のサブバンドサンプルで構成されている。また、1つのサブバンドサンプルには32個のサブバンドデータで構成されている。MPEG-1オーディオではサブバンド変換後にビット割り当てによって、各サブバンドについて聴覚心理モデルにより周波数特性マスク効果を測定して、可聴音について、ビットが割り当てられている。このため、サブバンドサンプルにつき1ビットのデータを埋め込むことができた場合、1フレームにつき、最大36ビット埋め込むことが可能である。また、1秒間には最大36ビット×38フレーム=1368ビットの情報量を埋め込むことが可能である。サブバンドサンプルはMPEGオーディオデータの最小アクセス単位(AAU:Audio Access Unit)として用いられているため、挿入データの抽出や編集についても簡易に実現することができる。

0027

なお、上記で説明したようなサブバンドデータの位置をずらすことにより透かしデータを挿入した場合、ビット割り当てされた位置が変わるだけであるため、全体の符号量に変化はない。また、データ挿入後もMPEG規格に準拠することが可能なため、透かし情報が入ったままの符号化データでも通常のMPEG復号器再生することができる。なお、高周波成分にデータ挿入を行ってサブバンド情報を変更しているため、通常のMPEG復号器で再生しても聴覚的な違和感は少ない。

0028

次に、本発明の第2の実施形態を説明する。この実施形態は、オーディオ符号化時にデータ挿入するものである。図7は、該実施形態の概略の構成を示すブロック図である。

0029

図7において、オーディオデータaが周波数変換部21に入力され、周波数情報21aに変換される。また、オーディオデータaは、聴覚心理モデル22にも入力され、入力オーディオに対する周波数特性とマスクレベルを測定される。ビット割当部24ではこれらのデータ22aから各周波数でのビット割当量が決定される。そのビット割り当て情報24aは量子化部23に入力される。周波数変換部21から出力された周波数軸上のオーディオデータ21aは、量子化部23において、ビット割当量24aに従って、量子化の精度を決定し量子化処理を行い量子化周波数成分23aが出力される。該量子化周波数成分23aは第1のデータ挿入部25に“0”や“1”などの挿入データg(ビットデータ)と共に入力される。データ挿入された量子化周波数成分25aは符号化データ構成部26に入力されて、ヘッダ情報などデータ挿入に関連しない符号化オーディオデータと合わせて符号化データが構成されて、データ挿入されたオーディオ符号化データ26aとして出力される。

0030

MPEG-1オーディオレイヤーII符号化におけるデータ挿入の実施例を図8に示す。オーディオデータaがサブバンド変換部31に入力され、サブバンド情報31aに変換される。また、オーディオデータaは、聴覚心理モデル32にも入力され、入力オーディオに対する周波数特性とマスクレベルを測定する。ビット割当部34ではこれらのデータ32aから各周波数でのビット割当量34aが決定される。そのビット割り当て情報は量子化部33に入力される。周波数変換部31から出力されたサブバンド上のオーディオデータ31aは、量子化部33において、ビット割当量34aに従って、量子化の精度を決定し、量子化処理を行い量子化周波数成分33aが出力される。量子化周波数成分33aは第2のデータ挿入部35に、“0”や“1”などの挿入データg(ビットデータ)と共に入力される。データ挿入された量子化周波数成分35aはMPEG符号化データ構成部36に入力されて、ヘッダ情報などデータ挿入に関連しない符号化オーディオデータと合わせて符号化データが構成されて、データ挿入されたMPEGオーディオ符号化データ36aとして出力される。

0031

次に、本発明の第3実施形態を説明する。この実施形態は、前記第1、第2実施形態で説明したようにしてデータ挿入された符号化オーディオデータから、データ抽出して元の符号化データを出力するようにするものである。図9は、この実施形態の概略の構成を示すブロック図である。

0032

図9において、データ挿入された符号化オーディオデータbが量子化周波数成分復元部41に入力され、量子化周波数成分41bが抽出される。また、ヘッダ情報などデータ抽出に関連のない符号化情報41cは符号化データ再構成部43に入力される。第1のデータ抽出部42では、“0”や“1”などの抽出データg(ビットデータ)が抽出されると共に、データ挿入前の量子化周波数成分42bが復元され、符号化データ再構成部43に入力される。符号化データ再構成部43では、ヘッダ情報などと共にデータ挿入前の量子化周波数成分を再構成して、データ挿入前のオーディオ符号化データ43bに完全に復元して出力する。

0033

図10に、第1のデータ抽出部42における挿入データ抽出動作フローを示す。ステップS31では、量子化周波数成分41bが入力され、ステップS32では、該量子化周波数成分41bから、非0成分と0成分が抽出される。ステップS33では、それらのデータからデータ抽出位置候補が決定される。図5の場合、最高周波数サブバンド(m−1)と2つ目に高い周波数の非0サブバンドqが決定される。ステップS34では、挿入データ抽出と非0成分の位置を変更する処理が行われる。例えば、キーとなる位置kが、前記最高周波数サブバンド(m−1)と2つ目に高い周波数の非0サブバンドqの中点から求められる。そして、1番高い周波数の非0サブバンド成分pが前記キーとなる位置kより大きい場合は埋め込みデータ=“1”、kより小さい場合は埋め込みデータ=“0”とされる。また、挿入データgが“1”の場合は、サブバンド位置がずらされているため、元のサブバンド位置に戻す。つまり、2つ目に高い周波数の非0サブバンドqから距離dの位置に戻す。これにより、量子化周波数成分上で量子化周波数成分の位置から透かしデータを1ビット抽出すると共に、ステップS35では、データ挿入前の量子化周波数成分を復元することができる。

0034

図11に、MPEG-1オーディオの場合の挿入データ抽出と元のオーディオ符号化データ復元方法について示す。データ挿入されたMPEG-1符号化オーディオデータbが量子化サブバンドサンプル復元部45に入力され、量子化サブバンド成分45bが抽出される。また、ヘッダ情報などデータ抽出に関連のない符号化情報45cはMPEG-1符号化データ再構成部47に入力される。第2のデータ抽出部46では、“0”や“1”などの抽出データg(ビットデータ)が抽出されると共に、データ挿入前の量子化サブバンド成分が復元され、MPEG-1符号化データ再構成部47に入力される。該符号化データ再構成部47では、ヘッダ情報45cなどと共にデータ挿入前の量子化周波数成分を再構成して、データ挿入前のMPEG-1オーディオ符号化データ47bに完全に復元して出力する。

0035

図12は、MPEG-1の場合における、第2のデータ抽出部46の動作を示したものである。ステップS41では、量子化サブバンドサンプル復元部45から量子化サブバンド成分45bを受け取り、ステップS42では、非0量子化サブバンド成分と0量子化サブバンド成分を抽出する。ステップS43では、それらのデータから抽出データ位置候補が決定される。ステップS44では、前記データ抽出位置候補に存在する非0サブバンド成分から挿入データg(“0”、“1”)を決定する。次に、データ挿入前の非0サブバンド成分の位置を決定し、その位置に非0サブバンド成分を変更する。これにより、量子化サブバンド成分上で量子化サブバンド成分の位置から透かしデータを1ビット抽出すると共に、ステップS45では、データ挿入前の量子化サブバンド成分を復元することができる。

0036

図13に具体的な挿入データ1ビットの抽出方法と、元の符号化データに戻すためのサブバンドサンプルの変更方法を示す。最高周波数サブバンドがm-1、非0サブバンド成分の中で高周波側から順にサブバンドの位置をp、qとする。挿入ビット抽出でキーとなる位置kは、最高周波数サブバンド(m−1)と2つ目に高い周波数の非0サブバンドqの中点から求められる。データの抽出方法としては、pの位置がkより大きい場合は埋め込みデータ=“1”、kより小さい場合は埋め込みデータ=“0”とする。埋め込むデータが“1”の場合は、サブバンド位置がずらされているため、元のサブバンド位置に戻す。この場合、pとkの距離をd=p−kとして、位置pにあるサブバンドデータs(p)をx=q+dの位置に移動させる。逆に、挿入データが“0”の場合は、サブバンドデータの移動は行わず、そのままにする。これにより、データ抽出と同時にデータ挿入前の符号化データに復元できることがわかる。

0037

次に、本発明の第4実施形態について説明する。この実施形態は、データ挿入された符号化オーディオデータにおける挿入データ編集(書き換え)に関するものである。図14は、この実施形態の概略の構成を示すブロック図である。

0038

データ挿入された符号化オーディオデータdは量子化周波数成分復元部51において部分復元される。該部分復号により得られた量子化周波数成分51dは第1のデータ抽出部52に送られる。また、ヘッダ情報などデータ抽出に関連のない符号化情報51eは符号化データ再構成部54に入力される。第1のデータ抽出部52では、“0”や“1”などのビットデータが抽出されると共に、データ挿入前の量子化周波数成分52dが復元される。次に、第1のデータ挿入部53に“0”や“1”などの新たなビットデータ(書き換えデータr)と共に、先に求めたデータ挿入前の量子化周波数成分52dが入力される。データ挿入された量子化周波数成分53dは符号化データ再構成部54に入力されて、ヘッダ情報などデータ挿入に関連しない符号化オーディオデータと合わせて符号化データが構成されて、新たなデータが挿入されたオーディオ符号化データ54dとして出力される。これにより、データ挿入の値を符号化データ上で高速に書き換えて符号化データとして出力することができる。

0039

図15を用いて、MPEG-1オーディオデータにおける挿入データの書き換えを説明する。データ挿入されたMPEGオーディオデータdは量子化サブバンド成分復元部55において部分復元され、量子化サブバンド成分55dが第2のデータ抽出部56に送られる。一方、ヘッダ情報などデータ抽出に関連のない符号化情報55eはMPEG符号化再構成部58に入力される。第2のデータ抽出部56では、“0”や“1”などのビットデータが抽出されると共に、データ挿入前の量子化サブバンド成分56dに復元される。次に、第2のデータ挿入部57に“0”や“1”などの新たなビットデータ(書き換えデータr)と共に、先に求めたデータ挿入前の量子化サブバンド成分56dが入力される。データ挿入された量子化サブバンド成分57dはMPEG符号化再構成部58に入力されて、ヘッダ情報などデータ挿入に関連しない符号化オーディオデータ55eと合わせて符号化データが構成されて、新たなデータが挿入されたMPEGオーディオ符号化データ58dとして出力される。これにより、データ挿入の値をMPEG符号化データ上で高速に書き換えてMPEG符号化データとして出力することができる。

0040

具体的には、以下のような例のように、データ抽出プロセスとデータ挿入プロセスは、抽出されたデータや挿入するデータにより、簡略化して実現することができる。図16はデータ挿入されたMPEGオーディオデータのあるサブバンドサンプルの例で、データ“1”が挿入された状態にある。

0041

挿入データの編集により、書き換えデータrが”0”になる場合は、挿入データがない場合と等価になるため、挿入データを抽出する場合と同様なプロセスを用いることができ、pの位置に存在するサブバンドs(p)をxの位置に変更することにより実現することができる。

0042

次に、書き換えデータrが“0”から“1”に変更される場合は、図17のようにデータ“0”が挿入されたサブバンドサンプルは挿入データがない場合と等価なため、新たに“1”を挿入する場合と同じプロセスが利用でき、pの位置にあるサブバンドs(p)をxの位置に変更することにより実現することができる。

0043

これらの手法では、挿入データの書き換えに伴う符号量の変化はなく、また、書き換えたあともMPEG規格に準拠することができる。

0044

次に、本発明の第5の実施形態について説明する。前記第1,2の実施形態では、1個のデータを符号化オーディオデータへ挿入するものであったが、この実施形態は、符号化オーディオデータへ複数のデータを挿入するようにするするものである。

0045

この実施形態は、図1図3で示した構成で実現することができる。図18に、MPEG-1でのサブバンドサンプルにnビットを挿入する場合を示す。非0サブバンド成分が存在するサブバンドを高周波から順にpn、・・・、p1、qとする。また、キーとなるサブバンドkを1ビット挿入時と同様に最高周波数サブバンド(m−1)とqから求める。各非0サブバンド成分pi(i=1・・・n)とqとの距離di=pi-qをベースに、1ビット挿入の場合と同様に挿入するデータに応じてキーとなるサブバンドkを用いて非0サブバンド成分の位置を変更する。

0046

もし、非0サブバンド成分piに“1”を埋め込む場合は、キーとなるサブバンドより高周波側に距離di移動した位置にサブバンドデータs(pi)を変更する(s(pi)→s(xi))。ただしxi=k+diである。また、非0サブバンド成分piに”0”を埋め込む場合は、サブバンド成分piについてはそのままにする。このようにしてサブバンドサンプルにnビットの情報を埋め込むことが可能になる。この場合も最大周波数サブバンド(m−1)と高周波側からn+1番目の非0サブバンド成分qはデータ挿入前後で不変であるため、これを手がかりに挿入データの抽出や元の符号化データへの復元や、図14図15の構成による挿入データの編集が可能である。また、サブバンドサンプルに複数のビットが挿入可能であるため、1秒間には最大36ビット×38フレーム×nビット=1368× nビット挿入可能になる。

0047

次に、本発明の第6の実施形態について説明する。この実施形態は、データ挿入された符号化オーディオデータからの複数のデータ抽出と元の符号化データ出力とを行えるようにしたものである。

0048

複数のビットがある量子化周波数係数に埋め込まれた場合、図9図11の構成で複数のビットを抽出することも可能である。

0049

図19は、MPEG-1オーディオデータのサブバンドサンプルにnビットが挿入された場合のデータ抽出を説明するものである。この場合も最高周波数のサブバンド(m-1)と高周波からn+1番目の非0サブバンド成分qからキーとなるサブバンドkを求め、kより高周波側に存在する非0サブバンド成分piについては埋め込みデータ=“1”、kより低周波側に存在する非0サブバンド成分piについては埋め込みデータ=“0”として抽出することが可能である。これによりすべてのサブバンド成分piについて埋め込まれたデータを抽出するとともに、挿入データに応じてサブバンド成分piの位置を変更することにより、データ挿入前のMPEGオーディオデータに復元することができる。

0050

なお、前記各実施形態では、最高周波数のサブバンド(m-1)を用いたが、本発明はこれに限定されず該最高周波数に近い周波数のサブバンド、例えば最高周波数の次に低い周波数のサブバンド(m-2)などを用いてもよい。

0051

また、前記各実施形態では、キーとなる位置kを最高周波数の位置と特定の非0係数の位置との中点としたが、本発明はこれに限定されず、中点近傍、例えば、中点より1つ上又は下の周波数位置であってもよい。

図面の簡単な説明

0052

本発明の一実施形態の概略の構成を示すブロック図である。
本実施形態のデータ挿入の動作を示すフローチャートである。
MPEG-1オーディオデータへ適用した概略の構成を示すブロック図である。
図3のデータ挿入部の動作を示すフローチャートである。
本発明の一実施例によるオーディオデータへの秘匿データ挿入方法の説明図である。
MPEG-1オーディオレイヤ2のデータ構成の説明図である。
本発明の第2実施形態のオーディオ符号化時にデータ挿入する符号化器の概略の構成を示すブロック図である。
MPEG-1オーディオ符号化器の概略の構成を示すブロック図である。
本発明の第3実施形態の、データ挿入された符号化オーディオデータからのデータ抽出方法または装置を説明するブロック図である。
図9のデータ抽出部の動作を示すフローチャートである。
MPEG-1オーディオからのデータ抽出方法または装置を説明するブロック図である。
図11のデータ抽出部の動作を示すフローチャートである。
挿入データ1ビットの抽出方法と、元の符号化データに戻すためのサブバンドサンプルの変更方法の説明図である。
データ挿入された符号化オーディオデータにおける挿入データ編集(書き換え)方法または装置を説明するブロック図である。
MPEG符号化オーディオに挿入されたデータの編集方法または装置を説明するブロック図である。
データ編集(“1”→“0”)されたサブバンドサンプルの例の説明図である。
データ編集(“0”→“1”)されたサブバンドサンプルの例の説明図である。
nビット挿入時のサブバンドサンプルの例の説明図である。
挿入されたnビットの抽出例の説明図である。

符号の説明

0053

11・・・量子化周波数成分復元部、12、25、53・・・第1のデータ挿入部、13、54・・・符号化データ再構成部、15・・・量子化サブバンドサンプル復元部、16、35、57・・・第2のデータ挿入部、17・・・MPEG符号化データ再構成部、21・・・周波数変換部、23、33・・・量子化部、26・・・符号化データ構成部、31・・・サブバンド変換部、51・・・量子化周波数成分復元部、52・・・第1のデータ抽出部、55・・・量子化サブバンドサンプル復元部、56・・・第2のデータ抽出部、58・・・MPEG符号化再構成部。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ