図面 (/)

技術 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム

出願人 沖電気工業株式会社
発明者 藤枝大
出願日 2014年8月20日 (6年4ヶ月経過) 出願番号 2014-167743
公開日 2016年4月4日 (4年8ヶ月経過) 公開番号 2016-045249
状態 特許登録済
技術分野 音声の分析・合成
主要キーワード 濾波帯域 正規化振幅 ピークフィルタ 長期平均値 修正補正量 中心要素 全波整流信号 雑音加算
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年4月4日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

課題

入力信号に前処理が施されていても、高音質の広帯域化音声が得られる音声帯域拡張装置を提供する。

解決手段

本発明は、入力信号の成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張装置に関する。そして、入力信号から周波数特性に関する1つ以上の特徴量を抽出する第1手段と、抽出された特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する第2手段と、補正情報に基づいて、入力信号の周波数特性を補正した補正信号を生成する第3手段と、補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する第4手段と、補正特徴量に基づいて入力信号の帯域を拡張して広帯域化信号を生成する第5手段とを備えることを特徴とする。

概要

背景

従来の音声帯域拡張装置として、特許文献1に開示されているものがある。図8は、特許文献1に記載の音声帯域拡張装置を示すブロック図である(特許文献1の図1参照)。

特許文献1に開示されている音声帯域拡張装置700は、ModGI算出手段701、拡張ゲイン算出手段702、サンプリング変換手段703、バンドパスフィルタ(BPF)手段704、全波整流処理手段705、ハイパスフィルタHPF)手段706、ゲイ乗算手段707及び拡張信号加算手段708を有する。

次に、特許文献1に開示の音声帯域拡張装置700の動作を簡単に説明する。

ModGI算出手段701及びサンプリング変換手段703には、入力信号が与えられる。入力信号は、低いサンプリング周波数サンプリングされた音声である。低いサンプリング周波数とは、例えば、音声信号であれば8kHz、音楽信号であれば48kHzなどである。ModGI算出手段701は、周波数特性に関する特徴量の一つであるModGIを入力信号から算出する。ここで、ModGIは、入力信号の2階差分振幅又はパワーを、入力信号の振幅又はパワーで除した特徴量である。拡張ゲイン算出手段702は、例えば、ModGIを定数倍する方法などにより、ModGIに基づいて拡張ゲインを算出する。サンプリング変換手段703は、入力信号のサンプリング周波数を高いサンプリング周波数に変換する。BPF手段704により、高いサンプリング周波数の入力信号から2kHz〜4kHzの帯域を抽出し、その抽出出力を全波整流処理手段705で全波整流した後、HPF手段706で4kHz以上の成分を抽出することにより、拡張帯域(4kHz〜8kHz)に成分を有する拡張信号を得る。ゲイン乗算手段707は、拡張信号に拡張ゲインを乗じて、調整拡張信号を生成し、拡張信号加算手段708は、高いサンプリング周波数の入力信号と調整拡張信号とを加算して、広帯域化信号を生成する。

特許文献1によれば、拡張帯域の振幅と相関のあるModGIを拡張ゲインの算出に用いることで、広帯域化信号の無声部が聴き取り易くなり、明瞭度を向上させることができるとしている。

概要

入力信号に前処理が施されていても、高音質の広帯域化音声が得られる音声帯域拡張装置を提供する。 本発明は、入力信号の成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張装置に関する。そして、入力信号から周波数特性に関する1つ以上の特徴量を抽出する第1手段と、抽出された特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する第2手段と、補正情報に基づいて、入力信号の周波数特性を補正した補正信号を生成する第3手段と、補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する第4手段と、補正特徴量に基づいて入力信号の帯域を拡張して広帯域化信号を生成する第5手段とを備えることを特徴とする。

目的

そのため、入力信号に前処理が施されていても、高音質の広帯域化音声が得られる音声帯域拡張装置及びプログラムが望まれている

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

入力信号の成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張装置において、上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段とを備えることを特徴とする音声帯域拡張装置。

請求項2

上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号の異なる2つの周波数帯域の振幅において、高域側の振幅を低域側の振幅で除した比である入力帯域振幅比であることを特徴とする請求項1に記載の音声帯域拡張装置。

請求項3

上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号の2階差分の振幅又はパワーを、入力信号の振幅又はパワーで除したModGIであることを特徴とする請求項1に記載の音声帯域拡張装置。

請求項4

上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号を2つ以上のサブバンド帯域分割した各サブバンドの振幅又はパワーであるサブバンドパワーであることを特徴とする請求項1に記載の音声帯域拡張装置。

請求項5

上記入力信号補正手段は、上記入力信号の周波数特性を、補正情報に基づいて直接操作するものであることを特徴とする請求項1〜請求項4のいずれかに記載の音声帯域拡張装置。

請求項6

上記入力信号補正手段は、上記補正情報に基づいて、補正雑音を生成する補正雑音生成手段と、上記入力信号に上記補正雑音を加算する補正雑音加算手段とを有することを特徴とする請求項1〜請求項4のいずれかに記載の音声帯域拡張装置。

請求項7

上記入力信号が音声区間であるか否かを判定する音声区間検出手段をさらに備え、上記補正情報算出手段は、上記入力信号が音声区間でない場合に限り上記補正情報を形成、更新することを特徴とする請求項1〜請求項6のいずれかに記載の音声帯域拡張装置。

請求項8

上記入力信号が音声区間である場合に限り上記入力信号に基づいて上記補正情報を修正する補正情報修正手段をさらに備え、上記入力信号補正手段は、上記補正情報修正手段で修正された上記補正情報に基づいて上記入力信号を補正することを特徴とする請求項7に記載の音声帯域拡張装置。

請求項9

上記補正情報修正手段は、上記補正情報のうち補正の大きさに関する補正量を修正するものであって、上記入力信号の振幅の長期平均値を算出し、上記入力信号の振幅を上記長期平均値で除して正規化振幅を算出し、上記正規化振幅が第1の閾値より小さい場合には上記補正情報を修正せず、上記正規化振幅が上記第1の閾値以上かつ第2の閾値より小さい場合には、上記補正量に、予め定められた修正重み係数と上記正規化振幅を乗じることで修正し、上記正規化振幅が上記第2の閾値以上の場合には上記補正量に上記修正重み係数と上記第2の閾値を乗じることで修正することを特徴とする請求項8に記載の音声帯域拡張装置。

請求項10

入力信号に成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張プログラムであって、コンピュータを、上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段として機能させることを特徴とする音声帯域拡張プログラム。

請求項11

入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出装置において、上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段とを備えることを特徴とする音声特徴量抽出装置。

請求項12

入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出プログラムであって、コンピュータを、上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段として機能させることを特徴とする音声特徴量抽出プログラム。

技術分野

0001

本発明は音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムに関し、例えば、電話機器ソフトフォン等を含む)に適用し得るものである。なお、「音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム」とネーミングしているが、本発明が取扱う信号は、音声信号に限定されず、音楽信号等の他の音信号であっても良い。

背景技術

0002

従来の音声帯域拡張装置として、特許文献1に開示されているものがある。図8は、特許文献1に記載の音声帯域拡張装置を示すブロック図である(特許文献1の図1参照)。

0003

特許文献1に開示されている音声帯域拡張装置700は、ModGI算出手段701、拡張ゲイン算出手段702、サンプリング変換手段703、バンドパスフィルタ(BPF)手段704、全波整流処理手段705、ハイパスフィルタHPF)手段706、ゲイ乗算手段707及び拡張信号加算手段708を有する。

0004

次に、特許文献1に開示の音声帯域拡張装置700の動作を簡単に説明する。

0005

ModGI算出手段701及びサンプリング変換手段703には、入力信号が与えられる。入力信号は、低いサンプリング周波数サンプリングされた音声である。低いサンプリング周波数とは、例えば、音声信号であれば8kHz、音楽信号であれば48kHzなどである。ModGI算出手段701は、周波数特性に関する特徴量の一つであるModGIを入力信号から算出する。ここで、ModGIは、入力信号の2階差分振幅又はパワーを、入力信号の振幅又はパワーで除した特徴量である。拡張ゲイン算出手段702は、例えば、ModGIを定数倍する方法などにより、ModGIに基づいて拡張ゲインを算出する。サンプリング変換手段703は、入力信号のサンプリング周波数を高いサンプリング周波数に変換する。BPF手段704により、高いサンプリング周波数の入力信号から2kHz〜4kHzの帯域を抽出し、その抽出出力を全波整流処理手段705で全波整流した後、HPF手段706で4kHz以上の成分を抽出することにより、拡張帯域(4kHz〜8kHz)に成分を有する拡張信号を得る。ゲイン乗算手段707は、拡張信号に拡張ゲインを乗じて、調整拡張信号を生成し、拡張信号加算手段708は、高いサンプリング周波数の入力信号と調整拡張信号とを加算して、広帯域化信号を生成する。

0006

特許文献1によれば、拡張帯域の振幅と相関のあるModGIを拡張ゲインの算出に用いることで、広帯域化信号の無声部が聴き取り易くなり、明瞭度を向上させることができるとしている。

先行技術

0007

特開2014−106337号公報

発明が解決しようとする課題

0008

しかしながら、特許文献1の記載技術では、通信のための帯域制限ノイズキャンセラ等の前処理によって入力信号が変形している場合が考慮されていない。ここで、前処理とは、当該音声帯域拡張装置を搭載している音声通信装置における処理に限定されず、当該音声帯域拡張装置を搭載している音声通信装置へ音声信号を送信する音声通信装置における処理が該当する場合もある。

0009

例えば、当該音声帯域拡張装置への入力信号が帯域制限を受けている場合がある。この場合は、送信前に帯域制限フィルタかけられ、さらにボコーダを介して音声を受信するため、帯域制限フィルタとボコーダによって当該音声帯域拡張装置への入力信号の周波数特性が、送信しようとしている原信号の周波数特性から変化している可能性が高い。また例えば、前処理として、ノイズキャンセラが適用されている場合がある。ノイズキャンセラは、低い周波数雑音をより正確に除去できるため、周波数の低い成分が抑圧され易い。このように入力信号が変形していると、算出される拡張ゲインが不適切な値となり、結果として広帯域化音声の音質劣化が引き起こされる。

0010

そのため、入力信号に前処理が施されていても、高音質の広帯域化音声が得られる音声帯域拡張装置及びプログラムが望まれている。また、入力信号に前処理が施されていても、前処理の影響を除外した音声特徴量を得ることができる音声特徴量抽出装置及びプログラムが望まれている。

課題を解決するための手段

0011

以上の課題を解決するために、第1の本発明は、入力信号の成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張装置において、(1)上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、(2)抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、(3)上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、(4)上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、(5)上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段とを備えることを特徴とする。

0012

第2の本発明の音声帯域拡張プログラムは、入力信号に成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張プログラムであって、コンピュータを、(1)上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、(2)抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、(3)上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、(4)上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、(5)上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段として機能させることを特徴とする。

0013

第3の本発明は、入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出装置において、(1)上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、(2)抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、(3)上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、(4)上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段とを備えることを特徴とする。

0014

第4の本発明の音声特徴量抽出プログラムは、入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出プログラムであって、コンピュータを、(1)上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、(2)抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、(3)上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、(4)上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段として機能させることを特徴とする。

発明の効果

0015

第1及び第2の本発明によれば、入力信号に前処理が施されていても、高音質の広帯域化音声が得られる。また、第3及び第4の本発明によれば、入力信号に前処理が施されていても、前処理の影響を除外した音声特徴量を得ることができる。

図面の簡単な説明

0016

第1の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。
第1の実施形態の音声帯域拡張装置における入力信号補正手段の具体的構成を示すブロック図である。
第1の実施形態の音声帯域拡張装置における広帯域化手段の詳細構成例を示すブロック図である。
第2の実施形態の音声帯域拡張装置における入力信号補正手段の具体的構成を示すブロック図である。
第3の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。
第4の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。
第4の実施形態に係る音声帯域拡張装置における、音声区間での補正情報の修正方法の説明図である。
従来の音声帯域拡張装置の構成を示す機能ブロック図である。

実施例

0017

(A)各実施形態に共通する前提
後述する全ての実施形態において、拡張する対象を人間の音声であるとし、入力信号における帯域である入力帯域は0Hz〜4kHz(又は300Hz〜3.4kHz)の帯域を有することを前提とする。しかし、本発明は、これに限定されず、例えば0Hz〜24kHzの帯域を有する音楽信号を帯域拡張対象とする場合こともでき、周波数に関する数値を音楽信号用に設定し直すことで、本発明を適用することができる。

0018

(B)第1の実施形態
以下、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第1の実施形態を、図面を参照しながら説明する。

0019

(B−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。ここで、第1の実施形態の音声帯域拡張装置は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(音声帯域拡張プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。

0020

第1の実施形態の音声帯域拡張装置100は、図1に示すように、特徴量抽出手段101と、補正情報算出手段102と、入力信号補正手段103と、補正特徴量抽出手段104と、広帯域化手段105とを有する。

0021

ここで、特徴量抽出手段101、補正情報算出手段102、入力信号補正手段103及び補正特徴量抽出手段104でなる部分が、第1の実施形態の音声特徴量抽出装置を構成している。

0022

第1の実施形態の音声帯域拡張装置100に与えられた入力信号(入力音声)は、特徴量抽出手段101及び広帯域化手段105に与えられる。

0023

特徴量抽出手段101は、入力信号を解析して、入力信号の周波数特性に関する少なくとも1つ以上の特徴量を抽出し、得られた特徴量を補正情報算出手段102に与える。特徴量として、例えば、2kHz〜4kHzの帯域の振幅を0Hz〜2kHzの帯域の振幅で除した入力帯域振幅比、特許文献1に記載のModGI、サブバンドパワー等を適用することができる。

0024

補正情報算出手段102は、目標特徴量と、特徴量抽出手段101から与えられた特徴量とを比較して、補正情報を算出し、得られた補正情報を入力信号補正手段103に与える。

0025

目標特徴量は、特徴量抽出手段101で抽出された特徴量の目標となる値であり、予め定められた定数値で与えられる。目標特徴量は、例えば、音声帯域拡張装置100に与えられた入力信号が前処理の影響を受けないとした場合における、特徴量抽出手段101からの特徴量の平均等であり、例えば、前処理が施されていない入力信号を適用したシミュレーション等によって予め決定される。なお、目標特徴量を、ユーザが任意のタイミングで随時指定できるようにしても良い。補正情報は、例えば、補正される周波数と補正量に関する情報で構成されるが、入力信号を補正できる情報であれば、これに限定されるものではない。

0026

以下、補正情報算出手段102が補正情報を算出する方法の具体例を、特徴量が、入力帯域振幅比、ModGI、サブバンドパワーである場合のそれぞれについて説明する。

0027

まず、特徴量として入力帯域振幅比を用いる場合について説明する。入力信号に施される前処理がノイズキャンセラによる処理である場合、入力帯域振幅比は好適な特徴量であり、以下の説明では、前処理がノイズキャンセラによる処理であるとする。

0028

前処理がノイズキャンセラによる処理の場合、前処理によって低い周波数帯域が高い周波数成分よりも強く抑圧されている可能性が高い。そこで、低い周波数帯域の振幅を増大させる補正量を適用して目標特徴量に近付けるようにすれば良い。今、0Hz〜2kHzの帯域の振幅をAlow、2kHz〜4kHzの帯域の振幅をAhigh、補正量をC、入力帯域振幅比の目標特徴量をRtrg、期待値演算をE{・}で書くこととして、(1)式を満たすような補正量Cを求めるようにすれば、補正量Cを適用して得た後述する補正特徴量を目標特徴量Rtrgに近付けることができる。(1)式は、入力帯域振幅比Ahigh/Alowを補正量候補(補正量)Cで補正した値の期待値と目標特徴量Rtrgとの差の絶対値が最小となるような補正量候補を補正量とすることを表している。なお、補正量Cは、低い周波数帯域の振幅を増大させるものであるので、1以上であるという制約がある。(1)式を満たす補正量Cは(2)式で与えられる。そして、後述する補正処理で、0Hz〜2kHzの帯域の振幅がC倍となるように入力信号を補正すれば良い。なお、実行可能という意味では期待値の算出は必要ないが、期待値でなく瞬時値を用いると、特定の条件下(ここではC≧1が満たされている場合)においては補正後の特徴量が常に目標特徴量と等しくなって、入力信号の時間変化に応じた広帯域化処理(後述)が行えなくなるため、期待値に基づいて補正量を算出することが特に好ましい。

0029

次に、特徴量としてModGIを用いる場合について説明する。入力信号に施される前処理が通信のための帯域制限である場合、ModGIは好適な特徴量であり、以下の説明では、前処理が帯域制限であるとする。

0030

ModGIは、おおよそ、全帯域の振幅のうち高域側の振幅が占める割合を表しているから、ModGIを(3)式に示すように近似することとする。なお、(3)式において、ModGIをM、入力帯域0Hz〜4kHzの振幅をAinで表している。ModGIの目標特徴量をMtrgで書くこととして、(4)式を満たすような補正量Cを求めるようにすれば、補正量Cを適用して得た後述する補正特徴量を目標特徴量Mtrgに近付けることができる。(4)式は、ModGI(の近似値)Mを補正量候補(補正量)Cで補正した値の期待値と目標特徴量Mtrgとの差の絶対値が最小となるような補正量候補を補正量とすることを表している。なお、補正量Cは、入力帯域全体に対する制限を元に復帰させるものであるので、1以上であるという制約がある。(4)式を満たす補正量Cは(5)式で与えられる。そして、後述する補正処理で、2Hz〜4kHzの帯域の振幅がC倍となるように入力信号を補正すれば良い。

0031

最後に、特徴量としてサブバンドパワーを用いる場合について説明する。サブバンドパワーは、入力信号を少なくとも2つ以上のサブバンド帯域分割し、各サブバンドのパワー(又は振幅)を算出した系列であり、以下では、入力帯域のパワーで正規化したサブバンドパワーの場合を説明する。サブバンドパワーを特徴量として用い、かつ、各サブバンドパワーを目標値と比較すれば、前処理によってどの帯域がどの程度変化させられたのかが分かるので、多様な前処理に対応し得る。

0032

入力帯域0Hz〜4kHzのパワーをPin、サブバンドの番号をk(k=0〜K−1)、サブバンドkのサブバンドパワーをPk、Pinで正規化されたサブバンドkのパワーPk/Pinに対する目標値(目標特徴量)をQk、サブバンドkの補正量をCkで書くこととして、(6)式を満たすような補正量Ckを求めるようにすれば、補正量Ckを適用して得た後述する補正後のサブバンドパワーを目標値Qkに近付けることができる。(6)式は、Pinで正規化されたサブバンドkのパワーPk/Pinを補正量候補(補正量)Ckで補正した値の期待値((6)式では固定値を期待値演算の外に出しているが、意味合いは上述した通りである)と目標値Qkとの差の絶対値が最小となるような補正量候補を補正量とすることを表している。(6)式を満たす補正量Ckは(7)式で与えられる。そして、後述する補正処理で、入力信号を、各サブバンドのパワーがCk倍となるように補正すれば良い。

0033

入力信号補正手段103は、補正情報算出手段102から与えられた補正情報に基づいて入力信号を補正し、得られた補正後の信号を補正特徴量抽出手段104に与える。入力信号補正手段103は、上述した3つの具体例の説明で言及したように、入力信号を補正すれば良い。

0034

上述したように、特徴量が、入力帯域振幅比、ModGI、サブバンドパワーのいずれであっても、入力信号の補正は、その周波数特性の一部又は全てに対するゲインの増減である。そのため、入力信号補正手段103を、図2に示すように、周波数特性(F特)を補正するF特補正手段201を中心要素として実現することができる。F特補正手段201は、補正情報に基づいて入力信号の周波数特性を補正して補正信号を生成する。F特補正手段201における補正方法として、帯域分割して補正の対象となる帯域の振幅又はパワーを補正して再合成する方法など、既存の周波数特性の補正方法を適用することができる。F特補正手段201として、一部の帯域を増幅又は減衰させるイコライジングフィルタは好適である。

0035

以下では、F特補正手段201としてイコライジングフィルタを適用した場合の補正方法の具体例を、特徴量が、入力帯域振幅比、ModGI、サブバンドパワーである場合のそれぞれについて説明する。ノイズキャンセラによる影響を入力帯域振幅比に基づいて補正する場合には、特定の周波数より低い帯域を増幅又は減衰させるローシェルフフィルタ(Low Shelf Filter)と呼ばれるイコライジングフィルタを用いて低域側を増幅させる。帯域制限による影響をModGIに基づいて補正する場合には、特定の周波数より高い帯域を増幅又は減衰させるハイシェルフフィルタ(High Shelf Filter)と呼ばれるイコライジングフィルタを用いて高域側を増幅させる。サブバンドパワーに基づいて補正する場合には、各サブバンドに対応させた(サブバンドの中心周波数ピークに達する周波数特性を有する)ピークフィルタ(Peak Filter)と呼ばれるイコライジングフィルタをサブバンドの数と同じ数だけ用いてサブバンド毎に増幅又は減衰させる。

0036

補正特徴量抽出手段104は、広帯域化に必要となる少なくとも一つ以上の特徴量を補正信号から抽出し、得られた補正特徴量を広帯域化手段105に与える。補正特徴量の具体例については後述する。

0037

広帯域化手段105は、入力信号の拡張帯域に補正特徴量を反映させた適当な成分を追加して帯域を拡張して広帯域化信号を生成して出力する。拡張帯域に成分を追加する方法として、任意の方法(広帯域化方法)を用いることができる。図3は、広帯域化手段105の詳細構成例を示すブロック図であり、この詳細構成例は、拡張帯域に成分を追加するために全波整流を利用している。

0038

図3において、広帯域化手段105は、BPF手段301、全波整流処理手段302、HPF手段303、拡張ゲイン算出手段304、ゲイン調整手段305及び拡張信号加算手段306を有する。ここで、広帯域化手段105に与えられた入力信号は、BPF手段301及び拡張信号加算手段306に与えられ、広帯域化手段105に与えられた補正特徴量は、拡張ゲイン算出手段304に与えられる。

0039

BPF手段301は、入力信号から、バンドパスフィルタリングによって入力帯域の一部の帯域を濾波し、得られた濾波信号を全波整流処理手段302に与える。濾波帯域は限定されるものではないが、例えば、2kHz〜4kHzの帯域が好適である。なお、BPF手段301を省略し、0Hz〜4kHzの帯域を有する入力信号をそのまま全波整流処理手段302に与えるようにしても良い。

0040

全波整流処理手段302は、与えられた濾波信号に対して全波整流処理を施して、得られた全波整流信号をHPF手段303に与える。全波整流処理によって、拡張帯域にも成分を有する信号が得られる。

0041

HPF手段303は、与えられた全波整流信号から、ハイパスフィルタリングによって拡張帯域の全部又は一部の成分を濾波し、得られた拡張信号をゲイン調整手段305に与える。ハイパスフィルタリングによる濾波帯域は、拡張帯域に含まれる帯域であれば良く限定されるものではないが、4kHz〜8kHzの帯域が好適である。なお、HPF手段303に代え、4kHz〜7kHz等の拡張帯域に含まれる帯域を濾波するBPF手段を適用するようにしても良い。

0042

拡張ゲイン算出手段304は、補正特徴量に基づいて拡張ゲインを算出し、ゲイン調整手段305に与える。補正特徴量には、補正信号の周波数特性を表す任意の特徴量を用いることができる。補正特徴量は、広帯域化手段105で利用される広帯域化処理に適した特徴量であり、一方、上述した特徴量抽出手段101が抽出する特徴量は、入力信号における周波数特性の補正に適した特徴量であり、これら2つの特徴量は同一である必要はない(勿論、同一であっても良い)。図3に示す広帯域化手段105で利用される補正特徴量としてはModGIが好適である。補正特徴量としてModGIを抽出した場合には、特許文献1の記載技術と同様に、ModGIを定数倍した値を拡張ゲインとする方法が好適である。なお、広帯域化手段105で用いられている広帯域化方法によって、好適な補正特徴量は変化する。

0043

ゲイン調整手段305は、拡張ゲインに基づいて、拡張信号の振幅を調整し、得られた調整拡張信号を拡張信号加算手段306に与える。拡張信号の振幅を調整する方法には、拡張信号に拡張ゲインを乗じる方法が好適である。また、拡張ゲインを入力信号に加算すべき拡張信号の真の振幅であると捉えて拡張信号をそれ自身の振幅で除した後で拡張ゲインを乗じる構成としても良い。

0044

拡張信号加算手段306は、入力信号に調整拡張信号を加算して、広帯域化信号を生成する。

0045

(B−2)第1の実施形態の動作
次に、第1の実施形態の音声帯域拡張装置100の動作を説明する。

0046

音声帯域拡張装置100において、入力音声は、特徴量抽出手段101及び広帯域化手段105に与えられる。

0047

特徴量抽出手段101においては、入力信号が解析されて、入力信号の周波数特性に関する特徴量が抽出されて補正情報算出手段102に与えられる。補正情報算出手段102においては、特徴量抽出手段101から与えられた特徴量が目標特徴量と比較され、補正情報が算出されて入力信号補正手段103に与えられる。そして、入力信号補正手段103において、入力信号が、補正情報算出手段102から与えられた補正情報に基づいて補正され、補正後の信号が補正特徴量抽出手段104に与えられる。

0048

補正特徴量抽出手段104においては、広帯域化に必要となる特徴量(補正特徴量)が、補正後の信号から抽出されて広帯域化手段105に与えられる。そして、広帯域化手段105において、入力信号の拡張帯域に補正特徴量を反映させた適当な成分が追加され、帯域が拡張された広帯域化信号が生成されて出力される。

0049

広帯域化手段105の詳細構成は、図3に示すものに限定されないが、以下、図3に示す詳細構成を有する広帯域化手段105における内部動作を説明する。

0050

広帯域化手段105に与えられた入力信号は、BPF手段301及び拡張信号加算手段306に与えられ、広帯域化手段105に与えられた補正特徴量は、拡張ゲイン算出手段304に与えられる。

0051

BPF手段301において、入力信号から、入力帯域の一部の帯域が濾波され、得られた濾波信号が全波整流処理手段302に与えられる。次に、全波整流処理手段302において、濾波信号に対して全波整流処理が施され、得られた全波整流信号がHPF手段303に与えられる。その後、HPF手段303において、全波整流信号から、ハイパスフィルタリングによって拡張帯域の全部又は一部の成分が濾波され、得られた拡張信号がゲイン調整手段305に与えられる。

0052

また、拡張ゲイン算出手段304において、補正特徴量抽出手段104から与えられた補正特徴量に基づいて、拡張ゲインが算出されてゲイン調整手段305に与えられる。そして、ゲイン調整手段305において、拡張ゲインに基づいて、HPF手段303から与えられた拡張信号の振幅が調整され、得られた調整拡張信号が拡張信号加算手段306に与えられる。

0053

以上のようにして形成された調整拡張信号が、拡張信号加算手段306によって、入力信号に加算されて広帯域化信号が生成される。

0054

(B−3)第1の実施形態の効果
第1の実施形態によれば、前処理によって入力信号の周波数特性が変形させられている場合にも、入力信号を目標特徴量に基づいて補正し、広帯域化に用いる特徴量を補正した信号から抽出するようにしたので、広帯域化処理が前処理の影響を受け難くなり、明瞭性の高い広帯域化信号を生成することができる。

0055

(C)第2の実施形態
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第2の実施形態を、図面を参照しながら説明する。

0056

第1の実施形態は、入力信号補正手段103がフィルタを適用しているF特補正手段により入力信号(の周波数特性)を補正するものであった。しかし、ノイズキャンセラや帯域制限によって「完全に」抑圧された帯域は、F特補正手段(フィルタ)を用いて復元することはできない。

0057

そこで、この第2の実施形態では、入力信号に雑音を加算することによって、入力信号の周波数特性を調整することとした。

0058

第2の実施形態の音声帯域拡張装置も、構成要素は、図1に示した第1の実施形態の音声帯域拡張装置100と同様である。しかし、入力信号補正手段の詳細構成(具体的な構成)が第1の実施形態のものと異なっている。以下では、第2の実施形態の音声帯域拡張装置及び入力信号補正手段に対してそれぞれ、符号「100A」、「103A」を付与して言及する。

0059

なお、第2の実施形態の音声帯域拡張装置100Aにおいて、入力信号補正手段103A以外の構成は、第1の実施形態と同様であり、その機能及び動作説明は省略する。

0060

図4は、第2の実施形態の入力信号補正手段103Aの詳細構成を示すブロック図である。第2の実施形態の入力信号補正手段103Aは、補正雑音生成手段401及び補正雑音加算手段402を有する。

0061

入力信号補正手段103Aに与えられた入力信号は、補正雑音加算手段402に与えられ、入力信号補正手段103Aに与えられた補正情報は、補正雑音生成手段401に与えられる。

0062

補正雑音生成手段401は、与えられた補正情報に基づいて、補正雑音を生成して補正雑音加算手段402に与える。

0063

補正雑音加算手段402は、入力信号に、生成された補正雑音を加算し、入力信号の周波数特性を補正した補正信号を得て、補正特徴量抽出手段104(図1参照)に与える。

0064

ここで、補正雑音生成手段401に与えられる補正情報は、補正雑音生成手段401が生成する補正雑音の周波数特性を調整するために用いられる。

0065

以下、特徴量が、入力帯域振幅比、ModGI又はサブバンドパワーのときに算出された補正情報が与えられた場合における、補正雑音生成手段401による補正雑音の生成方法を説明する。

0066

まず、特徴量が入力帯域振幅比である場合、すなわち、ノイズキャンセラによる影響を入力帯域振幅比に基づいて補正する場合の補正雑音の生成方法を説明する。

0067

線形合同法によって、若しくは、線形帰還シフトレジスタを用いて乱数を生成し、生成した乱数をローパスフィルタに通すことにより、入力帯域の低域側に成分を有する低域雑音を生成する。そして、補正情報に基づいて、当該低域雑音の大きさを調整することで補正雑音を生成する。補正情報として、上述した(2)式で得られる補正量Cを用いることができる。しかし、第2の実施形態では、生成した補正雑音(低域雑音)を入力信号に乗算ではなく加算するので、低域に補正雑音が加算されたことを表現している(8)式を満たすように設計された(9)式によって算出された補正情報Cを補正雑音生成手段401が利用することが好ましい。このような補正情報Cの生成は、上述した補正情報算出手段102が実行する。

0068

次に、特徴量がModGIである場合、すなわち、帯域制限による影響をModGIに基づいて補正する場合の補正雑音の生成方法を説明する。

0069

上述したような方法によって乱数を生成し、生成した乱数をバンドパスフィルタに通すことにより、入力帯域の高域側に成分を有する高域雑音を生成する。そして、補正情報に基づいて、当該高域雑音の大きさを調整することで補正雑音を生成する。補正情報として、上述した(5)式で得られる補正量Cを用いることができる。しかし、第2の実施形態では、生成した補正雑音(高域雑音)を入力信号に乗算ではなく加算するので、高域の補正雑音を考慮したModGIの近似値が加算されたことを表現している(10)式を満たすように設計された(11)式によって算出された補正情報Cを補正雑音生成手段401が利用することが好ましい。このような補正情報Cの生成は、上述した補正情報算出手段102が実行する。

0070

最後に、特徴量がサブバンドパワーである場合、すなわち、サブバンドパワーに基づいて入力信号における前処理の影響を補正する場合の補正雑音の生成方法を説明する。

0071

上述したような方法によって乱数を生成し、生成した乱数を白色雑音として使用し、補正情報に基づいて、当該白色雑音の周波数特性と大きさを調整することで補正雑音を生成する。白色雑音の周波数特性を調整する方法としては、例えば、以下の通りである。補正雑音生成手段401では、サブバンドパワーの算出に用いた帯域分割フィルタと同ー又は同等の帯域分割フィルタによって白色雑音を帯域分割し、サブバンド毎に大きさを調整した後、再合成する方法が好適である。補正情報として、上述した(7)式で得られる補正量Ckを用いることができる。しかし、第2の実施形態では、生成した補正雑音を入力信号に乗算ではなく加算するので、入力信号のサブバンドに同じサブバンドの補正雑音が加算されたことを表現している(12)式を満たすように設計された(13)式によって算出されたサブバンド毎の補正情報Ckを補正雑音生成手段401が利用することが好ましい。このようなサブバンド毎の補正情報Ckの生成は、上述した補正情報算出手段102が実行する。

0072

第2の実施形態によれば、前処理によって入力信号の周波数特性が変形させられていて、仮に一部の帯域が完全に抑圧されている場合でも、入力信号を目標特徴量に基づいて補正し、広帯域化に用いる特徴量を補正した信号から抽出するようにしたので、広帯域化処理が前処理の影響を受け難くなり、明瞭性の高い広帯域化信号を生成することができる。

0073

(D)第3の実施形態
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第3の実施形態を、図面を参照しながら説明する。

0074

第1及び第2の実施形態では、補正情報を常に算出していた。しかし、音声は周波数特性が時間と共に大きく変化するため、予め定められる目標特徴量を適切な値に決定することは難しい。

0075

そこで、この第3の実施形態では、音声が存在しない入力信号の非音声区間で補正量の算出を行うこととした。

0076

図5は、第3の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。

0077

第3の実施形態の音声帯域拡張装置100Bは、図5に示すように、特徴量抽出手段101と、音声区間検出手段506と、補正情報算出手段502と、入力信号補正手段103と、補正特徴量抽出手段104と、広帯域化手段105とを有する。

0078

ここで、特徴量抽出手段101、音声区間検出手段506、補正情報算出手段502、入力信号補正手段103及び補正特徴量抽出手段104でなる部分が、第3の実施形態の音声特徴量抽出装置を構成している。

0079

第3の実施形態は、音声区間検出手段506及び補正情報算出手段502が第1の実施形態のものと異なっており、以下では、音声区間検出手段506及び補正情報算出手段502について説明し、特徴量抽出手段101、入力信号補正手段103、補正特徴量抽出手段104及び広帯域化手段105の説明は省略する。

0080

音声区間検出手段506は、入力信号が音声区間であるか否かを判定して、得られた音声区間判定値を補正情報算出手段502に与える。音声区間を検出する方法は限定されない。例えば、参考文献『R.Martin,“An Efficient Algorithm to Estimate the Instantaneous SNR of Speech Signals,”Proc.EUROSPEECH’93,pp.1093−1096,1993』に開示されている方法が好適である。なお、音声区間判定値には、入力信号が音声区間ならば真(True)、入力信号が音声区間でないならば(False)という値が設定されるとして、以下、説明する。

0081

補正情報算出手段502は、与えられた音声区間判定値が偽の場合にのみ、特徴量の値を蓄積し、補正情報を更新し、この補正情報を入力信号補正手段103に与える。補正情報算出手段502は、音声区間判定値が真の場合には、最後に更新された補正情報を入力信号補正手段103に与える。特徴量の値を蓄積するのは、(1)式〜(13)式において期待値を算出するために過去の特徴量を必要とするためである。第1の実施形態では、音声区間か否かに関わらず常に特徴量を蓄積して期待値の算出に使用していたが、この第3の実施形態では、音声区間でない区間の特徴量のみを蓄積して期待値の算出に使用する。

0082

以上では、上述した第1の実施形態をベースに、この第3の実施形態の技術的特徴盛り込んだ場合を説明したが、上述した第2の実施形態をベースに、この第3の実施形態の技術的特徴を盛り込むようにしても良い。

0083

第3の実施形態によれば、周波数特性が大きく変化する音声区間の情報を使わずに補正情報を更新するようにしたので、より安定した音質の広帯域化信号を生成することができる。

0084

(E)第4の実施形態
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第4の実施形態を、図面を参照しながら説明する。

0085

第1〜第3の実施形態では、入力信号の補正は音声区間か否かに関わらず同一の補正方法を用いていた。しかし、非音声区間(音声区間でない区間)のパワーが音声区間のパワーに比べて著しく小さい場合、第1〜第3の実施形態における入力信号補正手段103、103Aによる入力信号の補正では、音声区間のパワーが小さ過ぎるために不十分となる場合がある。

0086

そこで、この第4の実施形態では、音声区間では補正情報を修正してから入力信号を補正することで、音声区間でも十分に入力信号を補正できるようにした。

0087

図6は、第4の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図であり、上述した第3の実施形態に係る図5との同一、対応部分には同一、対応符号を付して示している。

0088

第4の実施形態の音声帯域拡張装置100Cは、図6に示すように、特徴量抽出手段101と、音声区間検出手段506と、補正情報算出手段502と、補正情報修正手段606と、入力信号補正手段103と、補正特徴量抽出手段104と、広帯域化手段105と、音声区間検出手段506とを有する。

0089

ここで、特徴量抽出手段101、音声区間検出手段506及び補正情報算出手段502、補正情報修正手段606、入力信号補正手段103及び補正特徴量抽出手段104でなる部分が、第4の実施形態の音声特徴量抽出装置を構成している。

0090

第4の実施形態は、補正情報修正手段606が第3の実施形態のものと異なっており、以下では、補正情報修正手段606について説明し、他の構成要素の説明は省略する。

0091

補正情報修正手段606は、補正情報と音声区間判定値に基づいて、補正情報を修正し、得られた修正補正信号を入力信号補正手段103に与える。補正情報の修正は、音声区間判定値が真の場合にのみ行われる。すなわち、補正情報修正手段606は、音声区間判定値が真のときには補正情報を修正して修正補正情報とし、音声区間判定値が偽のときには補正情報を修正せずにそのまま修正補正情報とする。

0092

音声区間における補正情報の修正は、入力帯域の振幅が大きい場合には補正量が大きくなるようにし、入力帯域の振幅が小さい場合には修正しないという処理であれば良く、このような要求を満たす任意の方法を適用することができる。以下、好適と考えられる方法の一例を説明する。

0093

補正情報修正手段606は、入力帯域の振幅の長期平均値を算出しておいて、現在の入力帯域の振幅を当該長期平均値で除することで正規化振幅を算出する。そして、正規化振幅をA、正規化振幅に対する2つの閾値をA1とA2(但し、A1<A2)、修正重み係数をWとして、補正量修正係数Bを(14)式で算出し、補正量算出手段502で算出された補正量C又はCkに補正量修正係数Bを乗じたものを修正補正量とする。図7は、(14)式の変換式グラフ状に示した説明図である。なお、閾値A1、A2や修正重み係数Wは、シュミレーション等によって最適値を定めれば良い。また、サブバンドパワーを特徴量とする場合のように補正量が2つ以上ある場合には、閾値A1、A2、修正重み係数Wを補正量毎に異なる値として、各補正量に対応する補正量修正係数を算出するようにしても良い。

0094

以上では、上述した第1の実施形態をベースに、この第4の実施形態の技術的特徴を盛り込んだ場合を説明したが、上述した第2又は第3の実施形態をベースに、この第4の実施形態の技術的特徴を盛り込むようにしても良い。

0095

第4の実施形態によれば、音声区間でも適切に入力信号を補正することができるので、より明瞭性の高い広帯域化信号を生成することが提供できる。

0096

(F)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。

0097

上記各実施形態においては、目標特徴量は予め定められていたが、ユーザが目標特徴量をその都度指定できるようにしても良い。

0098

入力信号補正手段として入力信号補正手段103Aを用いる実施形態に対しては以下の変形実施形態を挙げることができる。一部の特徴量については、入力信号から特徴量を抽出する特徴量算出手段101の抽出結果を有効として広帯域化手段105に直接与えて、広帯域化手段105がその一部特徴量をそのまま利用するようにしても良い。例えば、音声のピッチ周波数に関する特徴量は、雑音を加算すると却って推定精度が悪くなるため、入力信号を補正する前に抽出する方が望ましい。

0099

上記各実施形態の説明では、ModGIを特徴量の1つとしたものを示したが、特許文献1によって修正される前のGIも、信号波形の傾き方向が変化する回数とその大きさを測る指標であり、ModGIと同様に、おおよそ、全帯域の振幅のうち高域側の振幅が占める割合を表しているので、上記各実施形態におけるModGIに代えてGIを適用するようにしても良い。

0100

上記各実施形態においては、入力信号補正手段として、図2に示す詳細構成を有する入力信号補正手段103又は図4に詳細構成を示す入力信号補正手段103Aの一方を適用するものを示したが、これら2つの補正手段を組み合わせた構成を用いるようにしても良い。例えば、2つの入力信号補正手段が並列処理し、得られた2つの補正信号に固定又は適応的な係数を乗じて加算して最終的な補正信号とするようにしても良い。

0101

上記各実施形態では1種類の前処理に対応できるものを示したが、複数種類の前処理に対応できるように構成しておき、装置の立上げ時や通信の開始時等に適用する前処理の種類を設定し(固定設定でも随時設定でも良い)、その前処理に応じた動作を実行するようにしても良い。例えば、前処理の種類によって、特徴量抽出手段101が抽出する特徴量や、補正情報算出手段102の算出方法や、入力信号補正手段103、103Aの補正方法などを切り替えるようにすれば良い。このようにすることにより、前処理に応じた適切な補正信号を得ることができる。

0102

また、前処理の種類を推定するようにしても良い。例えば、前処理推定手段が、音声区間検出手段(第3の実施形態参照)から音声区間判定値の供給を受け、音声区間判定値が偽のときに周波数特性を解析して、その解析結果に基づいて前処理を推定する。解析結果から前処理処理を決定する方法として、例えば、周波数スペクトルパターンマッチングを挙げることができる。この場合にも、得られた前処理の種類の情報を入力信号補正手段103、103A等に与えることで、前処理に応じた適切な補正信号を得ることができる。

0103

上記各実施形態は、背景雑音の影響を除外又は軽減する構成を備えないものであったが、背景雑音の対策構成をも含むように構成しても良い。例えば、背景雑音推定手段が、音声区間検出手段から音声区間判定値の供給を受け、音声区間判定値が偽のときに周波数特性を解析して、その解析結果に基づいて背景雑音を推定する。解析結果から背景雑音を決定する方法として、例えば、周波数スペクトルのパターンマッチングを挙げることができる。得られた背景雑音情報を入力信号補正手段103、103Aに与えることで、背景雑音に応じた適切な補正信号を得ることができる。例えば、背景雑音が強いサブバンドと弱いサブバンドとで補正係数を変更する。

0104

上記各実施形態を、入力信号は広帯域化信号と同一のサンプリング周波数を有しているという前提で説明したが、入力信号のサンプリング周波数が広帯域化信号のサンプリング周波数より低くても良い。この場合には、広帯域化手段105の直前に、入力信号のサンプリング周波数を広帯域化信号のサンプリング周波数へと変換するサンプリング変換手段が挿入することを要する。

0105

上記各実施形態では、特徴的な処理が時間領域の信号で処理される場合を示したが、一部又は全ての処理を、周波数領域の信号で処理するようにしても良い。

0106

上記では、音声帯域拡張装置を電話機器に適用する場合に言及したが、本発明の音声帯域拡張装置の用途が電話機器に限定されないことは勿論である。

0107

また、上記各実施形態では、拡張帯域が高域側であるものを示したが、高域側に加えて低域側を拡張する場合にも、本発明の技術思想を適用することができる。

0108

上記各実施形態では、本発明の音声特徴量抽出装置を音声帯域拡張装置に適用する場合を示したが、特徴量(補正特徴量)を利用することを要する他の装置に、本発明の音声特徴量抽出装置を適用するようにしても良い。例えば、有声無声判定装置の中には、音声の特徴量を利用するものがあるが、有声無声判定装置における音声特徴量を抽出する構成として、本発明の音声特徴量抽出装置を適用するようにしても良い。

0109

100、100A、100B、100C…音声帯域拡張装置、101…特徴量抽出手段、102、502…補正情報算出手段、103、103A…入力信号補正手段、104…補正特徴量抽出手段、105…広帯域化手段、201…F特補正手段、401…補正雑音生成手段、402…補正雑音加算手段、506…音声区間検出手段、606…補正情報修正手段。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ