図面 (/)

技術 音声信号処理装置及び音声信号処理コンピュータプログラム

出願人 日本ビクター株式会社
発明者 岡山一仁桑岡俊治土方勲永田良一森晴之
出願日 2002年11月13日 (18年1ヶ月経過) 出願番号 2002-329774
公開日 2004年6月10日 (16年6ヶ月経過) 公開番号 2004-163681
状態 特許登録済
技術分野 音声の分析・合成
主要キーワード 係数補正値 テーブル作成回路 過多状態 オフフラグ 入力波形データ 処理帯域 極性検出回路 極性データ
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2004年6月10日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (13)

課題

半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止し、また、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感定位を強調する。

解決手段

係数補正テーブル(B)は複数の係数補正テーブルにより構成され、各係数補正テーブルには、3つの連続する各半波長におけるサンプル数Pre0、Pre1、Pre2に応じて<歪み感>、<余韻感>、<解像感、定位>の問題をそれぞれ防止するようにゲインテーブル(A)の係数補正するための係数補正値が記憶されている。半波長毎に係数補正テーブル内のテーブルが選択されて係数補正値がゲインテーブルの係数と乗算されてゲインテーブルの係数が補正されて係数テーブル(C)にセットされ、係数テーブルの係数により各サンプルが補正される。

概要

背景

一般に、アナログ音声信号をA/D変換したPCM音声データ量子化誤差を含むので、そのままD/A変換してスピーカにより再生しても原音忠実に再生することができない。また、PCM音声データを更に非可逆圧縮方式圧縮すると、再生した音声は、更に原音から遠ざかる。

概要

半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止し、また、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感定位を強調する。係数補正テーブル(B)は複数の係数補正テーブルにより構成され、各係数補正テーブルには、3つの連続する各半波長におけるサンプル数Pre0、Pre1、Pre2に応じて<歪み感>、<余韻感>、<解像感、定位>の問題をそれぞれ防止するようにゲインテーブル(A)の係数補正するための係数補正値が記憶されている。半波長毎に係数補正テーブル内のテーブルが選択されて係数補正値がゲインテーブルの係数と乗算されてゲインテーブルの係数が補正されて係数テーブル(C)にセットされ、係数テーブルの係数により各サンプルが補正される。

目的

本発明は上記従来例の問題点に鑑み、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる音声信号処理装置及び音声信号処理コンピュータプログラムを提供する

効果

実績

技術文献被引用数
1件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

デジタル音声信号半波長における各サンプル数及びサンプル位置に応じた係数を記憶する第1のテーブルと、前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第1のテーブルの係数を補正するための係数補正値を記憶する第2のテーブルと、前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正する係数補正手段と、前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正するサンプル補正手段とを、備えた音声信号処理装置

請求項2

コンピュータに、デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を第1のテーブルに記憶させるステップと、前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第1のテーブルの係数を補正するための係数補正値を第2のテーブルに記憶させるステップと、前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正させる係数補正ステップと、前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正させるサンプル補正ステップとを、有する音声信号処理コンピュータプログラム

請求項3

デジタル音声信号の半波長における補正対象の現サンプルと1サンプル前の差分に対して乗算する係数を記憶する第1のテーブルと、前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分に応じて前記第1のテーブルの係数を補正するための係数補正値を記憶する第2のテーブルと、前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正する係数補正手段と、前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと1サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正するサンプル補正手段とを、備えた音声信号処理装置。

請求項4

コンピュータに、デジタル音声信号の半波長における補正対象の現サンプルと1サンプル前の差分に対して乗算する係数を第1のテーブルに記憶させるステップと、前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分に応じて前記第1のテーブルの係数を補正するための係数補正値を第2のテーブルに記憶させるステップと、前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正させる係数補正ステップと、前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと1サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正させるサンプル補正ステップとを、有する音声信号処理コンピュータプログラム。

技術分野

0002

一般に、アナログ音声信号をA/D変換したPCM音声データ量子化誤差を含むので、そのままD/A変換してスピーカにより再生しても原音忠実に再生することができない。また、PCM音声データを更に非可逆圧縮方式圧縮すると、再生した音声は、更に原音から遠ざかる。

0003

そこで、デジタル音声信号を原音に近づける従来の方法としては、例えば特許文献1及び後述する式(1)に示すように補正対象現サンプル値と1サンプル前の値の差分を算出し、この成分に係数乗算し、この乗算結果を現サンプル値に加算することにより現サンプルのゲインを補正している。この場合、特許文献1では、PCM音声データの補正対象である頂点間(上限値から下限値まで、及び下限値から上限値までの半波長)のサンプル数を検出し、サンプル数に応じた係数をその半波長における各PCM音声データに乗算して重み付けする方法が提案されている。

0004

【特許文献1】
特開2002−169597号公報

0005

図5はその重み付け係数が記憶されたゲインテーブル(A)を示し、ゲインテーブル(A)にはあらかじめ、半波長におけるサンプル数に応じたその半波長における各PCM音声データの係数が記憶されている。この各PCM音声データの係数は、経験により半波長におけるサンプル数(FS)と各サンプル位置nに応じて最適になるようにあらかじめ固定で設定され、一例としては半波長におけるサンプル数(ゲインテーブル(A)のアドレス)としては2〜16個であり、それぞれの係数α(ゲインテーブル(A)のデータ)はサンプル数と同じ数である。また、ゲインテーブル(A)は2種類あり、波形増加傾向にある場合(下限値から上限値までの半波長)のテーブルA’と、波形が減少傾向にある場合(上限値から下限値までの半波長)のテーブルA”により構成される。

背景技術

0006

また、特許文献1では、上記の重み付けを行う前に原データアップサンプリングし、重み付け後ダウンサンプリングしている。この場合には、図5に示すゲインテーブル(A)には、アップサンプリングしたPCM音声データに対する係数があらかじめ固定で設定され、4倍にアップサンプリングする場合のサンプル数(アドレス)は、図5に示す従来例と対応させると、サンプル数FS及びサンプル位置nの最大値は2〜16×4個である。したがって、図5に示すテーブル(A)よりゲインを細かに補正して音質を改善することができる。

0007

しかしながら、上記従来例では、補正対象の半波長のみのサンプル数のみに基づいて固定の係数で一義的に重み付けするので、以下に示す<歪み感>、<余韻感>、<解像感定位>、<ハイサンプリング>について問題点がある。また、補正対象の半波長のみのサンプル数のみに基づいて補正対象の現サンプル値と1サンプル前の値の差分に固定の係数で一義的に重み付けするので、同様な問題点がある。

0008

<歪み感>
まず、半波長毎に比較的高いレベルで連続する音源に対しては過剰な重み付けが連続する状態(補正過多状態)となり、聴感上の歪み感として表れるという問題点がある。ここで、このような音源の例としては、ベル、チャイム鉄琴シンセサイザなどであって、半波長におけるサンプル数FSが2〜3個(f=7kHz〜10kHz)の繰り返し信号である。

0009

<余韻感>
逆に、音源としてボーカルピアノなどのほとんどのアコスティック楽器は、倍音を多く含むので、上記従来例のように補正対象の半波長のみのサンプル数のみに基づいて固定の係数で一義的に重み付けすると、重み付けが不足した状態となり、聴感上余韻が足りない感じとして表れるという問題点がある。ここで、このような音源は、半波長におけるサンプル数が6個以下(f=4kHz以下)であって繰り返し信号でない音である。また、その波形は複雑であり、その繰り返し周波数は検出されにくい。

0010

<解像感、定位>
さらに、繰り返し信号でない音源として、ハイハットシンバルなどのリズム系楽器やシンセサイザで効果を付加した電子楽器楽曲に対しては、解像感、定位の強調度が足りない感じとして表れるという問題点がある。ここで、このような音源は、半波長におけるサンプル数が3個以上(f=7kHz以上)であって、その波形は複雑であり、その繰り返し周波数は検出されにくい。

0011

<ハイサンプリング>
また、上記従来例では、アップサンプリングを行わない方法は、行う方法より音質改善効果が少ないという問題点がある。

発明が解決しようとする課題

0012

本発明は上記従来例の問題点に鑑み、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる音声信号処理装置及び音声信号処理コンピュータプログラムを提供することを目的とする。
本発明はまた、アップサンプリングを行わなくても音質を改善することができる音声信号処理装置及び音声信号処理プログラムを提供することを目的とする。
本発明はまた、アップサンプリングを行えば更に音質を改善することができる音声信号処理装置及び音声信号処理コンピュータプログラムを提供することを目的とする。

0013

本発明は上記目的を達成するために、補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて重み付け係数を補正するようにしたものである。
また、本発明は上記目的を達成するために、補正対象の半波長、及びそれより前の半波長におけるサンプル間の差分に応じて重み付け係数を補正するようにしたものである。
上記発明により、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。

0014

すなわち本発明によれば、デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を記憶する第1のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第1のテーブルの係数を補正するための係数補正値を記憶する第2のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正する係数補正手段と、
前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正するサンプル補正手段とを、
備えた音声信号処理装置が提供される。

0015

また本発明によれば、コンピュータに、
デジタル音声信号の半波長における各サンプル数及びサンプル位置に応じた係数を第1のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数に応じて前記第1のテーブルの係数を補正するための係数補正値を第2のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長の各サンプル数を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正させる係数補正ステップと、
前記係数補正手段により補正された係数により前記補正対象の半波長における各サンプル値を補正させるサンプル補正ステップとを、
有する音声信号処理コンピュータプログラムが提供される。

0016

また本発明によれば、デジタル音声信号の半波長における補正対象の現サンプルと1サンプル前の差分に対して乗算する係数を記憶する第1のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分に応じて前記第1のテーブルの係数を補正するための係数補正値を記憶する第2のテーブルと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正する係数補正手段と、
前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと1サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正するサンプル補正手段とを、
備えた音声信号処理装置が提供される。

課題を解決するための手段

0017

また本発明によれば、コンピュータに、
デジタル音声信号の半波長における補正対象の現サンプルと1サンプル前の差分に対して乗算する係数を第1のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分に応じて前記第1のテーブルの係数を補正するための係数補正値を第2のテーブルに記憶させるステップと、
前記デジタル音声信号の補正対象の半波長、及びそれより前の半波長におけるサンプルと1サンプル前の差分を検出し、その検出結果に応じて前記第1のテーブルの係数を前記第2のテーブルの係数補正値により補正させる係数補正ステップと、
前記係数補正手段により補正された係数を前記補正対象の半波長における現サンプルと1サンプル前の差分に対して乗算し、乗算結果を現サンプルに加算して現サンプルを補正させるサンプル補正ステップとを、
有する音声信号処理コンピュータプログラムが提供される。

0018

(第1の実施の形態)
第1の実施の形態を図1図9に基づき説明する。
この実施の形態では、本発明の音声信号処理装置はパーソナルコンピュータ(以下、PCと呼ぶ)により実施される。このため、以下に説明するように、PC及びこのPCに接続された周辺装置協働して、デジタル音声信号を取得し、この信号に本発明の音声信号処理を施し、処理した音声信号を再生する音声再生装置として機能する。また、本発明の音声信号処理方法は、上記PCで実行されるソフトウェアにより実現される。なお、下記の構成によれば、携帯型プレーヤが周辺装置の1つとしてPCに接続されるので、PCそれ自体ではなく、この携帯型プレーヤに、本発明に係る音声信号処理を実行させるようにしてもよい。

0019

図1は、PC及びその周辺装置から成る音声再生装置を示す。最初に、この装置の接続関係概要から説明する。この音声再生装置は、PC1と、このPC1に接続されたディスプレイ2と、キーボード3と、半導体メモリ5を搭載した携帯型プレーヤ4と、アンプ7とCD−ROM(Compact Disc Read Only Memory)ドライブ9とを備える。携帯型プレーヤ4はヘッドホン6に接続される。アンプ7はスピーカ8に接続される。CD−ROMドライブ9には、記録媒体としてのCD−ROM10が挿入される。

0020

PC1は、図1に示すように、所定のプログラムに従って演算及び処理を行うCPU(Central Processing Unit)11を備え、このCPU11がバスを介してメモリ12(ROM,RAM)、HDD(Hard Disc Drive)13、及びインターフェース(I/F)14に接続されている。このインターフェース14は、バスを介してキーボードコントローラ15、USB(Universal Serial Bus)I/F16(又はパラレルI/F、シリアルI/Fなど)、及び音声出力I/F17に接続されている。このうち、キーボードコントローラ15はキーボード3に接続される一方で、USBI/F16及び音声出力I/F17は前述した携帯型プレーヤ4及びアンプ7にそれぞれ接続されている。なお、オペレータが操作する入力装置は、キーボード3の代わりに、タッチパネルで構成してもよい。その場合には、キーボードコントローラ15はタッチパネルコントローラ置換される。

0021

インターフェース14は更に別のバスを介してディスプレイコントローラ18及びPCMCIA(Personal Computer Memory Card International Association)I/F19に接続されている。このうち、ディスプレイコントローラ18はディスプレイ2に接続され、PCMCIAI/F19はCD−ROMドライブ9に接続されている。

0022

なお、PCMCIAI/F19には、CD−ROMドライブ9の代わりに、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、MOなどの記録媒体からデータを読み込むドライブを接続してもよい。これにより、CD−ROM10の代わりに、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、MOなどの記録媒体を用いることができる。また、PCMCIAI/F19には、フラッシュメモリドライブ無線I/Fカードモデムカードなどが接続されることもある。

0023

これにより、CD−ROM10などの蓄積媒体に記録されているPCMフォーマットやMP3フォーマットなどの音声データがCD−ROMドライブ9から読み込まれ、直接もしくはいったん、HDD13に、例えばWAVEファイルやMP3ファイルとして蓄積される。この蓄積ファイルは、音声出力I/F17によりアナログ信号に変換されてからアンプ7に出力される。このアナログ信号はアンプ7で増幅されてスピーカ8から音声として出力される。なお、音声データは、インターネットなどから入手してHDD13に蓄積しておいてもよい。

0024

また、USBI/F16に接続された携帯型プレーヤ4には、半導体メモリ5が内蔵もしくは取り出し可能に設けられている。これにより、PC1のHDD13などに蓄積されているMP3ファイルの音声データは、携帯型プレーヤ4の半導体メモリ5に転送され、携帯型プレーヤ4で再生可能になる。この携帯型プレーヤ4には、図示しないが、CPU及びMP3などの音声データの再生プログラムが記録されているROMなどが内蔵されており、これにより、半導体メモリ5に記録された音声データを再生することができる。この携帯型プレーヤ4の音声データは、通常ヘッドホン6を介して再生される。

0025

なお、半導体メモリ5が携帯型プレーヤ4に着脱自在に挿入可能な場合は、PC1に設けられた半導体メモリドライブ(図示せず)に直接挿入して、このドライブを介して半導体メモリ5に音声データを転送させることができる。この場合、その半導体メモリ5を携帯型プレーヤ4に挿入して音声を再生することができる。また、携帯型プレーヤ4が録音可能な構成を有している場合、携帯型プレーヤ4はPC1に接続することなく、録音した音声データを再生するようにしてもよい。

0026

このようなPC1もしくは携帯型プレーヤ4において、音声データは図2に示すような手順により再生される。図2において、HDD13、CD−ROM(又はCD−RW、DVD−ROM、DVD−RAM、DVD−RW、MOなど)3、半導体メモリ5などの蓄積媒体21に記録されている音声データは、PC1もしくは携帯型プレーヤ4のI/F22を介して読み出され、MP3などの圧縮されている音声データが読み出された場合は、デコーダ23によりデコードされてPCMデータが出力される。このPCMデータは、本発明の主要部分である音質改善手段24に供給されて音質改善が行われてからD/A変換回路25に出力され、アナログ信号として、アンプ7とスピーカ8やヘッドホン6などの音声再生手段26に出力されて再生される。

0027

次に、本発明の主要部分である音質改善手段24における具体的な改善方法について図3及び図4と共に説明する。なお、この音質改善手段24は、HDD13又は半導体メモリ(ROM)5に記憶されてCPU11で動作する処理プログラムの機能として実現され、CPU11として動作周波数800MHzの32bitRISCプロセッサ実時間出力可能な処理プログラムを実施の形態として説明する。また、処理にあたっては、入力波形データ及び処理に必要な各種フラグやカウント値などのデータがメモリ(RAM)12に一時的に記憶される。

0028

まず、図3では示されていないがデコーダ23から出力されたサンプリング周波数fsのリニアPCMデータビット数が、音質改善手段24が処理するビット数のデータFs2に変換するスケーリング処理を行う。なお、ビット数が同じであればこのスケーリング処理は行わない。このデータFs2は極性検出回路33に供給され、データFs2の波形(横軸に時間、縦軸に音の大きさをとってグラフ化したときの音声波形)を監視して、上限値から下限値、及び下限値から上限値までの補正対象の半波長におけるサンプル数をカウントし、Fs2COUNTとしてテーブル生成回路35に出力する。

0029

テーブル生成回路35は補正対象の半波長におけるサンプル数Pre0と、その前の半波長におけるサンプル数Pre1と、更にその前の半波長におけるサンプル数Pre2に応じて、データFs2に重み付けする係数を適応的に変化させたTable Data(以下に示す係数テーブル(C))を出力データ生成回路36に出力する。テーブル生成回路35には図4に詳しく示すようにゲインバンクテーブル35aと、ゲインテーブル(A)と、係数補正テーブル(B)と、係数テーブル(C)が設けられている(図中は単にテーブルと示す)。ゲインテーブル(A)には図5に詳しく示すように、従来例と同様に半波長におけるサンプル数に応じて個々のサンプル位置n=2〜16の係数が一義的に決められて記憶される。また、ゲインテーブル(A)は2種類あり、波形が増加傾向にある場合(下限値から上限値までの半波長)のテーブルA’と、波形が減少傾向にある場合(上限値から下限値までの半波長)のテーブルA”により構成される。

0030

係数補正テーブル(B)は複数の係数補正テーブルにより構成され、各係数補正テーブルには、上記の3つの連続する各半波長におけるサンプル数Pre0、Pre1、Pre2に応じて<歪み感>、<余韻感>、<解像感、定位>の問題をそれぞれ防止するようにゲインテーブル(A)の係数を補正するための係数補正値が記憶されている。複数の係数補正テーブル(B)の一例として、図6(a)は解像度を強調するためのテーブルを示し、図6(b)は余韻感を強調するためのテーブルを示している。
ゲインバンクテーブル35aには、図7図8に示すように上記の3つの連続する各半波長におけるサンプル数Pre0、Pre1、Pre2に応じて係数補正テーブル(B)内のテーブルを選択するためのデータがあらかじめ記憶されている。そして、半波長毎に係数補正テーブル(B)内のテーブルが選択されてその係数補正値がゲインテーブル(A)の係数と乗算されてゲインテーブル(A)の係数が補正される。乗算結果は係数テーブル(C)にセットされ、係数テーブル(C)の係数データが出力データ生成回路36に印加される。ここで、係数テーブル(C)はゲインテーブル(A)と同様に、データFs2が増加傾向にある場合のテーブルC’と、減少傾向にある場合のテーブルC”により構成されている(後述)。

0031

また、データFs2は差分データ算出回路(差分データ算出手段)34にも供給され、現在のデータFs2と1Fs前のデータ(Fs2’とする)との差分データが算出されてFs2Differenceとして出力される。なお、差分データ算出回路34には1以上のサンプリングデータを記憶しておく機能を有しており、記憶してある前のサンプリングデータFs2’から現在のデータFs2を減算して、その音の大きさの差分データ(Fs2Difference)を出力データ生成回路36に出力している。

0032

そして、出力データ生成回路(出力データ生成手段)36には、データFs2と、差分データ算出回路34から出力されるFs2Differenceと、係数テーブル(C)から出力される補正データ(Table Data)とが供給され、元々の信号成分であるFs2に重み付けされた差分データを加算することにより、補正されたPCM信号Fs3を生成して出力することができる。この動作を式で示すと式(1)に示すようになる。

0033

Fs3 = Fs2 + (Fs2Difference ×
補正データTable Data) …(1)

0034

上記した音声処理装置音声処理方法について、その主要部である音質改善手段24の動作について図9及び図10に示すフローチャートを参照しながら、より詳細に説明する。図9に示すフローチャートにおいて、差分データ算出回路34では、供給されたデータFs2(PCM(Z0))を1サンプル前のデータFs2であるPCM(Z−1)と比較する(ステップ101)。供給されたデータPCM(Z0)の方が大きければ(ステップ101→Yes)、データが増加方向にあるので、供給されたデータPCM(Z0)から1サンプル前のデータPCM(Z−1)を減算して差分データPCMREF(Z0)を求めるとともに極性データPOLA(Z0)に増加を示すTRUEを格納する(ステップ102)。

0035

他方、供給されたデータPCM(Z0)の方が小さければ(ステップ101→No)、データが減少方向にあるので1サンプル前のデータPCM(Z−1)から供給されたデータPCM(Z0)を減算して差分データPCMREF(Z0)を求めるとともに極性データPOLA(Z0)に減少を示すFALSEを格納する(ステップ103)。この差分データPCMREF(Z0)は、(1)式ではFs2Differenceとして表記されたデータである。

0036

極性検出回路33では、まず、半波長においてカウントするサンプル数の最大値FSUPMAX=16、最小値FSUPMIN=2とする(ステップ104−1)。次いで、1サンプル前の極性データPOLA(Z−1)と算出した極性データPOLA(Z0)とを比較して、1サンプル前のデータに対して極性が変化しているかどうかを判断する(ステップ104−2)。極性データが同じであり、極性が変化していないと判断した場合には(ステップ104−2→Yes)、データの波形の傾きが変化していないことになるので、次サンプルの処理のためにデータPCM(Z0)及び極性データPOLA(Z0)を格納した後(ステップ105)、サンプル数でカウントしている波形頂点間隔FSCOUNTの値に1を加算して、出力データ生成回路36のオンオフフラグFSUPSWをオフ(FALSE)にしておく(ステップ106)。このFSCOUNTは、前記(1)式ではFs2COUNTとして表記された値である。

0037

他方、ステップ104−2において極性データが異なる場合は(ステップ104−2→No)、極性が変化しており、データの波形の傾きが変化していることになるので、次サンプルの処理のためにデータPCM(Z0)及び極性データPOLA(Z0)を格納した後(ステップ107)、実時間処理可能な最大処理Fs値を超えていないかどうかの判断を行う(ステップ108)。

0038

つまり、ステップ108では、波形頂点間隔FSCOUNTの値が2よりも大きく実時間処理可能な最大処理Fs値であるFSTBLMAX以下の範囲内にあるかどうかを判断し、範囲内にあれば(ステップ108→Yes)、波形頂点間隔FSCOUNTの値に1を加算して、出力データ生成回路36のオン/オフフラグFSUPSWをオン(TRUE)にする(ステップ109)。他方、波形頂点間隔FSCOUNTの値が範囲外にある場合は(ステップ108→No)、各種の値を初期化するとともに出力データ生成回路36のオン/オフフラグFSUPSWをオフ(FALSE)にする異常処理を行う(ステップ110)。

0039

そして、ステップ111−1において出力データ生成回路36のオン/オフフラグFSUPSWがTRUEの場合には(ステップ111−1→Yes)、
GainADJHist(Z−2)=GainADJHist(Z−1)
GainADJHist(Z−1)=GainADJHist(Z−0)
Pre2=GainADJHist(Z−2)
Pre1=GainADJHist(Z−1)
にセットし(ステップ111−2)、出力データ生成回路36による処理を行うようにする。他方、出力データ生成回路36のオン/オフフラグFSUPSWがFALSEの場合には(ステップ111−1→No)、出力データ生成回路36による処理をキャンセルする(図10参照)。

0040

次に図10に示すフローチャートにおいて、まず、出力データ生成回路36では、波形頂点間隔FSCOUNTの値から1を減算した値をBPに格納する(ステップ112−1)。次いでテーブル生成回路35ではステップ112−2〜112−4において係数テーブル(C)(=C’+C”)を生成する。この処理では、まず、
GainADJHist(Z−0)=BP
n=BP
Pre0=GainADJHist(Z−0)
係数補正テーブル(B)(Z−n)
=ゲインバンクテーブル(Pre2,Pre1,Pre0)
にセットする(ステップ112−2)。

0041

次いでPOLA(Z−0)=TRUEか否かを判断する(ステップ112−3)。そして、Yesの場合にはデータFs2が増加傾向にある場合のテーブルC’を
係数テーブル(C’)
=ゲインテーブル(A’)(Z−n)
×係数補正テーブル(B)(Z−n)
により算出し(ステップ112−4)、他方、Noの場合にはデータFs2が減少傾向にある場合のテーブルC”を
係数テーブル(C”)
=ゲインテーブル(A”)(Z−n)
×係数補正テーブル(B)(Z−n)
により算出する(ステップ112−5)。次いでFSUPMIN≦n≦FSUPMAXか否かを判断し(ステップ112−6)、Yesであればステップ112−3に戻り、他方、Noであればステップ113に進む。

0042

出力データ生成回路36では、まず、ステップ113においてBPの値をnとする。このとき、BP及びnの値は、データ波形頂点から頂点までのサンプル数を示す値と一致する。そして、極性データPOLA(Z0)が増加方向(TRUE)を示している場合には(ステップ114→Yes)、データFs2が増加傾向にある場合の係数テーブルC’を用いて、サンプルデータ位置を示すnの値と波形頂点間隔FSCOUNTの値とで参照し、係数テーブルC’の係数を差分データPCMREF(Z−n)に掛けた値を補正値として、n番目のサンプルデータPCM(Z−n)に加算して補正出力データとして出力する(ステップ115)。そして、nの値を1ずつ減算しながらn=0になるまで繰り返し補正を行ってデータを出力する(ステップ116→Yes→ステップ117)。

0043

また、極性データPOLA(Z0)が減少方向(FALSE)を示している場合には(ステップ114→No)、減少傾向にある場合のテーブルC”の係数を差分データPCMREF(Z−n)に掛けた値を補正値として、n番目のサンプルデータPCM(Z−n)に加算して補正出力データとして出力する(ステップ118)。そして、nの値を1ずつ減算しながらn=0になるまで繰り返し補正を行ってデータを出力する(ステップ119→Yes→ステップ120)。

0044

ステップ116又はステップ119において、n=0になると出力データ生成回路36での処理は終了する。そして、順次、出力データ生成回路36から出力されてくる補正出力データは、再スケーリング処理が施され、D/A変換回路25へ出力される。

0045

以上のようにして音声データの補正を行う際の具体例を図11に示す。また係数テーブルC’、C”の一部をそれぞれ図12(a)、(b)に示す。図12には波形頂点間隔が3〜6(2Fs〜5Fs)の各場合についてのデータ波形例とその補正個所、補正値(a〜d)と係数テーブル(C)の値(α〜θ)、補正後の出力データ例を表したものである。

0046

波形頂点間隔が3(2Fs)の場合を例にして説明すると、データ波形が増加している場合は図12(a)に示すテーブルC’を使用する。そして、データ波形が増加している部分の波形頂点間隔をカウントすると(C→B→A)となり、FSCOUNT=3となる。また、n=BP=FSCOUNT−1=2となる。そして、n=2で波形頂点間隔が3のときのテーブルC’の値は1/4であり、データBの補正値は図8中、aで示す式から導かれ、出力PCMデータは(B+a)となる。また、n=1で波形頂点間隔が3のときのテーブルC’の値は0であるので波形データCの補正値も0になり、出力PCMデータはCのままとなる。

0047

同様に、データ波形が減少している場合は図12(b)に示すテーブルC”を使用する。そして、データ波形が減少している部分の波形頂点間隔をカウントすると(E→D→C)となり、FSCOUNT=3、n=BP=2となる。そして、n=2で波形頂点間隔が3のときのテーブルC”の値は−1/4(=β)であり、データDの補正値は図11中、bで示す式から導かれ、出力PCMデータは(D+b)となる。なお、テーブルC”から得た値が−1/4であるので、実際にはPCMデータDから補正値を減算して出力PCMデータを得ることになる。また、n=1で波形頂点間隔が3のときの補正テーブルC”の値は0であるので波形データAの補正値も0になり、出力PCMデータはAのままとなる。

0048

同様に、FSCOUNTにより波形頂点間隔を検出することができるので、波形が増加方向にあるときにはテーブルC’を用い、減少方向にあるときにはテーブルC”を用いて、FSCOUNTとそのときのnの値から補正テーブルデータを得、これと差分データとを用いて波形データを補正することにより、音質の向上を果たすことができる。

0049

そして、上記実例では、32bitRISCプロセッサを用いて実時間処理することを想定しており、より高速なCPUを使用する場合は、より高次のFSCOUNTまで使用したり、補正テーブルデータとして桁数の大きい小数を用いて補正値を計算したりすることにより、より高音質な出力データを得ることも可能になる。なお、FSCOUNT=7(6Fs)とした場合には、補正個所が波形の増加方向と減少方向でそれぞれ1箇所ずつ増えるので、補正データもその分増えることになる。

0050

以上説明したように、ゲインテーブル(A)には、補正対象の半波長のみのサンプル数のみに基づく固定の係数を記憶し、係数補正テーブル(B)には、前述した<歪み感>、<余韻感>、<解像感、定位>の問題を防止するような係数補正値を記憶して、これによりゲインテーブル(A)を補正することにより、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。

0051

また、差分データ算出回路34が補正対象の半波長、及びそれより前の半波長における各サンプル間の差分を検出して、<歪み感>、<余韻感>、<解像感、定位>の問題を防止するような係数補正値によりゲインテーブル(A)を補正することにより、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。

0052

ここで、上述した実施の形態では、処理内容ブロックに示して説明したが、実際にはソフトウェアによる処理が可能であり、本願発明を実施する際に新たなハードウェア部品を必要としないので、本発明を適用可能な製品の種類が広がり、またコスト的にも優位である。

0053

さらに、サンプリングレートが低く、低ビットレートのPCM音声データを高音質化することができるので、記憶容量に制限のある半導体メモリに音声デ−タを記録する場合や、データ転送速度に制限のあるネットワークを介した音楽配信などにおいても、非常に利用価値の高い音質改善技術を提供することができる。

0054

さらに、HiFiオーディオの分野だけでなく、更に低ビットレートで音声信号が利用される携帯電話機、PHS、インターネット電話半導体音声レコーダなどの各種の再生装置に本願発明を適用することにより、再生音声明瞭度を向上させることができるという効果がある。

発明を実施するための最良の形態

0055

また、本発明に係る音質改善のための音声信号処理は、上述したように、非圧縮状態のPCM(リニアPCM)データに施される。このため、この音声信号処理はあらゆるフォーマットのデータに適用可能である。圧縮されているPCMデータはデコードした状態で、この音声信号処理に付される。非圧縮のPCMデータはそのまま、この音声信号処理に付される。したがって、重み付け及び処理帯域パラメータを適宜変更することで、音質の劣化状態に応じた最適な音質向上効果が得られる。非圧縮データファイル形式としては、MP3、WMA、AAC、Real Audioなどの種々のものがあり、これらファイル形式の音声データにも、本発明の音声信号処理が適用可能である。

図面の簡単な説明

0056

以上説明したように本発明によれば、半波長毎に比較的高いレベルで連続する音に対して最適な重み付けを行って聴感上の歪み感を防止することができるとともに、半波長毎に連続しない倍音などに対して最適な重み付けを行って余韻感、解像感、定位を強調することができる。また、アップサンプリングを行わなくても音質を改善することができ、アップサンプリングを行えば更に音質を改善することができる。

図1
本発明の音声信号処理装置を機能的に有する、第1の実施の形態に係る音声再生装置の例を示す構成図である。
図2
第1の実施の形態における音声再生装置の再生系の例を示す構成図である。
図3
第1の実施の形態で実施される音質改善のための音声信号処理を説明するブロックである。
図4
図3テーブル作成回路のテーブル及び処理を説明するための図である。
図5
図4のゲインテーブルの構成例を示す図である。
図6
図4の係数補正テーブルの構成例を示す図である。
図7
図4のゲインバンクテーブルの構成例を示す図である。
図8
図4のゲインバンクテーブルの構成例を示す図である。
図9
第1の実施の形態で実行される音声信号処理の一例を図10と共に示すフローチャート図である。
図10
第1の実施の形態で実行される音声信号処理の一例を図9と共に示すフローチャート図である。
図11
第1の実施の形態で実行される音声信号処理の変換アルゴリズムを説明するための図である。
図12
図4の係数テーブルの係数を説明するための図である。
【符号の説明】
33極性検出回路
34 差分データ算出回路
35テーブル生成回路(係数補正手段)
35a ゲインバンクテーブル
36出力データ生成回路(サンプル補正手段)
A ゲインテーブル(第1のテーブル)
B 係数補正テーブル(第2のテーブル)
C 係数テーブル

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ