図面 (/)

技術 音声信号のピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置、音声信号の時間軸圧縮装置、音声信号の時間軸伸長装置、音声信号の時間軸圧縮伸長装置

出願人 三洋電機株式会社
発明者 井上健生
出願日 1999年6月24日 (21年4ヶ月経過) 出願番号 1999-178243
公開日 2000年11月2日 (20年0ヶ月経過) 公開番号 2000-305581
状態 特許登録済
技術分野 音声の分析・合成
主要キーワード 適宜ピッチ 最大ピッチ 固定幅 抽出回数 音声信号記録再生装置 着目点 再生速度設定 CM処理
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2000年11月2日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (15)

課題

音声信号圧縮伸長処理を行う場合には、連続する複数個音声波形ピッチ周期を常に求める必要があり、ピッチ周期が短い波形の場合にはピッチ周期が長い波形に比べて単位時間当たりのピッチ周期の抽出回数が多くなり、これによりピッチ周期抽出時間を要してしまう結果、処理手段(プロセッサ)に負担が掛かる問題点を有していた。

解決手段

音声信号のピッチ周期を抽出するに際して,音声波形のピッチ周期を抽出し、その抽出したピッチ周期が所定値以下の場合,新たにピッチ周期を抽出せず前記ピッチ周期と同一とすることにより,ピッチ周期の抽出回数を少なくすることを特徴とする。

概要

背景

半導体メモリ等に音声を記録する場合やディジタル伝送系等で音声を伝送する場合には、音声レベル直接符号化するPCM方法のほか、記録側で音声の特徴を表すパラメータ形式分析して記録し、再生側でそのパラメータから音声を合成する音声符号化方法等が注目されている。

斯かる音声の特徴を表すパラメータの1つにピッチ周期があり、このピッチ周期は一般的に声の高さを表すものである。

ピッチ周期抽出方法の1つに自己相関を利用するものがある。

自己相関を用いたピッチ周期抽出法には、信号は時間制限されていると仮定し、時間長Tsの区間内だけに信号が存在し、その時間長Tsの区間外では信号は常にゼロとして自己相関を求める短時間自己相関を用いる方法がある。これは、コロナ発行「音声のディジタル信号処理」(上)−L.R.Rabiner&R.W.Schafer著、鈴木久喜訳−p152-p152にも記載されているように、いま、音声波形ディジタル音声データx(n)で表すと、前述の方法による短時間自己相関値Rn(k)は下記のようになる。

概要

音声信号圧縮伸長処理を行う場合には、連続する複数個の音声波形のピッチ周期を常に求める必要があり、ピッチ周期が短い波形の場合にはピッチ周期が長い波形に比べて単位時間当たりのピッチ周期の抽出回数が多くなり、これによりピッチ周期抽出時間を要してしまう結果、処理手段(プロセッサ)に負担が掛かる問題点を有していた。

音声信号のピッチ周期を抽出するに際して,音声波形のピッチ周期を抽出し、その抽出したピッチ周期が所定値以下の場合,新たにピッチ周期を抽出せず前記ピッチ周期と同一とすることにより,ピッチ周期の抽出回数を少なくすることを特徴とする。

目的

従って、本発明は、このような着目点に基づいてなされたものであり、短い処理時間で入力音声信号からピッチ周期を抽出する音声信号のピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置等を提供することを目的とする。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

音声波形ピッチ周期を抽出し、その抽出したピッチ周期が所定値以下の場合、新たにピッチ周期を抽出せず前記ピッチ周期と同一とすることにより、ピッチ周期の抽出回数を少なくすることを特徴とする音声信号ピッチ周期抽出方法

請求項2

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、を備えることを特徴とする音声信号のピッチ周期抽出装置

請求項3

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸圧縮処理を行う時間軸圧縮手段と、を備えることを特徴とする音声信号の時間軸圧縮装置。

請求項4

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の伸長処理を行う時間軸伸長手段と、を備えることを特徴とする音声信号の時間軸伸長装置

請求項5

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、入力された音声信号を符号化する符号化手段と、前記符号化手段で符号化された信号を格納するメモリ手段と、前記メモリ手段に格納された信号を復号する復号手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて、前記復号手段より出力される信号の時間軸の圧縮処理を行う時間軸圧縮手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて、前記復号手段より出力される信号の時間軸の伸長処理を行う時間軸伸長手段と、前記復号手段より出力される信号を選択的に前記時間軸圧縮手段または時間軸伸長手段に導く選択手段と、を備えることを特徴とする音声信号の時間軸圧縮伸長装置。

請求項6

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、前記時間軸圧縮手段によって時間軸圧縮された信号を格納するメモリ手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて、前記メモリに格納された信号の時間軸の伸長処理を行う時間軸伸長手段と、を備えることを特徴とする音声信号の時間軸圧縮伸長装置。

請求項7

音声信号のピッチ周期を抽出する第1のピッチ周期抽出手段と、前記第1のピッチ周期抽出手段が抽出したピッチ周期を記憶する第1の記憶手段と、第1の閾値を設定する第1の閾値設定手段と、前記第1のピッチ周期抽出手段が抽出したピッチ周期と前記第1の閾値設定手段で設定した第1の閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を第1の記憶手段に保存すると共に、前記第1の記憶手段に保存されたピッチ周期を用いる第1のピッチ周期判定手段と、前記第1のピッチ周期抽出手段で抽出したピッチ周期、又は前記第1の記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、前記時間軸圧縮手段によって時間軸圧縮された信号を格納するメモリ手段と、前記メモリ手段に格納された信号よりピッチ周期を抽出する第2のピッチ周期抽出手段と、前記第2のピッチ周期抽出手段が抽出したピッチ周期を記憶する第2の記憶手段と、第2の閾値を設定する第2の閾値設定手段と、前記第2のピッチ周期抽出手段が抽出したピッチ周期と前記第2の閾値設定手段で設定した第2の閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を第2の記憶手段に保存すると共に、前記第2の記憶手段に保存されたピッチ周期を用いる第2のピッチ周期判定手段と、前記第2のピッチ周期抽出手段で抽出したピッチ周期、又は前記第2の記憶手段に保存されたピッチ周期に基づいて、前記メモリに格納された信号の時間軸の伸長処理を行う時間軸伸長手段と、を備えることを特徴とする音声信号の時間軸圧縮伸長装置。

請求項8

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、前記時間軸圧縮手段によって時間軸圧縮された信号を複数の帯域に分割して符号化する帯域分割符号化手段と、前記帯域分割符号化手段にによって符号化された信号を格納するメモリ手段と、前記メモリ手段に格納された信号を復号する帯域分割復号化手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて、前記帯域分割復号化手段から出力される信号の時間軸の伸長処理を行う時間軸伸長手段と、を備えることを特徴とする音声信号の時間軸圧縮伸長装置。

請求項9

音声信号のピッチ周期を抽出する第1のピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する第1の記憶手段と、第1の閾値を設定する第1の閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記第1の閾値設定手段で設定した第1の閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を第1の記憶手段に保存すると共に、前記第1の記憶手段に保存されたピッチ周期を用いる第1のピッチ周期判定手段と、前記第1のピッチ周期抽出手段で抽出したピッチ周期、又は前記第1の記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、前記時間軸圧縮手段によって時間軸圧縮された信号を複数の帯域に分割して符号化する帯域分割符号化手段と、前記帯域分割符号化手段にによって符号化された信号を格納するメモリ手段と、前記メモリ手段に格納された信号を復号する帯域分割復号化手段と、帯域分割復号化手段から出力される信号のピッチ周期を抽出する第2のピッチ周期抽出手段と、前記第2のピッチ周期抽出手段が抽出したピッチ周期を記憶する第2の記憶手段と、第2の閾値を設定する第2の閾値設定手段と、前記第2のピッチ周期抽出手段が抽出したピッチ周期と前記第2の閾値設定手段で設定した第2の閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を第2の記憶手段に保存すると共に、前記第2の記憶手段に保存されたピッチ周期を用いる第2のピッチ周期判定手段と、前記第2のピッチ周期抽出手段で抽出したピッチ周期、又は前記第2の記憶手段に保存されたピッチ周期に基づいて、前記帯域分割復号化手段から出力される信号の時間軸の伸長処理を行う時間軸伸長手段と、を備えることを特徴とする音声信号の時間軸圧縮伸長装置。

請求項10

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、再生速度情報を出力する再生速度設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と所定値とを比較判定して、前記ピッチ周期が前記所定値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記再生速度設定手段からの再生速度情報及び、前記ピッチ周期抽出手段で抽出したピッチ周期又は前記記憶手段に保存されたピッチ周期に基づいて、音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、を備えることを特徴とする音声信号の時間軸圧縮装置。

請求項11

前記再生速度設定手段からの再生速度情報に応じて、前記所定値の実質的な値を変化させることを特徴とする請求項10記載の音声信号の時間軸圧縮装置。

請求項12

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、再生速度情報を出力する再生速度設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と所定値とを比較判定して、前記ピッチ周期が前記所定値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記再生速度設定手段からの再生速度情報及び、前記ピッチ周期抽出手段で抽出したピッチ周期又は前記記憶手段に保存されたピッチ周期に基づいて、音声波形の時間軸の伸長処理を行う時間軸伸長手段と、を備えることを特徴とする音声信号の時間軸伸長装置。

請求項13

前記再生速度設定手段からの再生速度情報に応じて、前記所定値の実質的な値を変化させることを特徴とする請求項12記載の音声信号の時間軸圧縮装置。

請求項14

音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、再生速度情報を出力する再生速度設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と所定値とを比較判定して、前記ピッチ周期が前記所定値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、入力された音声信号を符号化する符号化手段と、前記符号化手段で符号化された信号を格納するメモリ手段と、前記メモリ手段に格納された信号を復号する復号手段と、前記再生速度設定手段からの再生速度情報及び、前記ピッチ周期抽出手段で抽出したピッチ周期又は前記記憶手段に保存されたピッチ周期に基づいて、前記復号手段より出力される信号の時間軸の圧縮処理を行う時間軸圧縮手段と、前記再生速度設定手段からの再生速度情報及び、前記ピッチ周期抽出手段で抽出したピッチ周期又は前記記憶手段に保存されたピッチ周期に基づいて、前記復号手段より出力される信号の時間軸の伸長処理を行う時間軸伸長手段と、前記復号手段より出力される信号を選択的に前記時間軸圧縮手段または時間軸伸長手段に導く選択手段と、を備えることを特徴とする音声信号の時間軸圧縮伸長装置。

請求項15

前記再生速度設定手段からの再生速度情報に応じて、前記所定値の実質的な値を変化させることを特徴とする請求項14記載の音声信号の時間軸圧縮装置。

技術分野

0001

本発明は、音声信号ピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置、並びに音声信号の時間軸圧縮装置、及び音声信号の時間軸伸長装置、さらには音声信号の時間軸圧縮伸長装置に関する。

背景技術

0002

半導体メモリ等に音声を記録する場合やディジタル伝送系等で音声を伝送する場合には、音声レベル直接符号化するPCM方法のほか、記録側で音声の特徴を表すパラメータ形式分析して記録し、再生側でそのパラメータから音声を合成する音声符号化方法等が注目されている。

0003

斯かる音声の特徴を表すパラメータの1つにピッチ周期があり、このピッチ周期は一般的に声の高さを表すものである。

0004

該ピッチ周期抽出方法の1つに自己相関を利用するものがある。

0005

自己相関を用いたピッチ周期抽出法には、信号は時間制限されていると仮定し、時間長Tsの区間内だけに信号が存在し、その時間長Tsの区間外では信号は常にゼロとして自己相関を求める短時間自己相関を用いる方法がある。これは、コロナ発行「音声のディジタル信号処理」(上)−L.R.Rabiner&R.W.Schafer著、鈴木久喜訳−p152-p152にも記載されているように、いま、音声波形ディジタル音声データx(n)で表すと、前述の方法による短時間自己相関値Rn(k)は下記のようになる。

0006

0007

ここで、Tsは音声信号が存在すると仮定した時間区間、kは短時間自己相関値Rn(k)を算出するときに音声波形を遅延させる際の遅延時間であり、Ts≫kの関係にある。

発明が解決しようとする課題

0008

然し乍ら、音声信号の圧縮伸長処理を行う場合には、音声波形のピッチ周期を求める必要があり、ピッチ周期が短い波形の場合にはピッチ周期が長い波形に比べて単位時間当たりのピッチ周期の抽出回数が多くなり、これによりピッチ周期抽出時間を要してしまう結果、処理手段(プロセッサ)に負担が掛かる問題点を有していた。

0009

さらに詳述すると、ピッチ周期を抽出する時間期間Tsは、想定される最大ピッチ(つまり最も長いピッチ周期)の2倍に設定している。そして2つのピッチ周期分を抽出しながら圧縮や伸長の処理を行うので(圧縮については図2、伸長については図7に示すが、その詳細は後述する)ピッチ周期が長い波形の場合は、図14(b)に示すように、ピッチ周期2つ分ずつ波形を抽出してもピッチ周期を抽出する時間期間Tsはオーバーラップすることはない。

0010

然し、ピッチ周期が短い波形の場合は、図14(a)に示すように、ピッチ周期2つ分ずつ波形を抽出していくと、ピッチ周期を抽出する時間期間Tsがオーバーラップしてしまう(ピッチ周期抽出1、2、3を参照)。これは、前述したように、ピッチ周期を抽出する時間期間Tsが、長いピッチ周期を有する波形のピッチ周期を抽出する時間期間Tsの2倍〜3倍の固定幅であるために生じる問題である。

0011

このようなことから、ピッチ周期が短い波形の場合は、ピッチ周期が長い波形に比べて、単位時間当たりのピッチ周期の抽出回数が多くなり、ピッチ周期の抽出処理を行う処理手段(プロセッサ)に大きな負担がかかっていた。

0012

ところで、前記したように、図14(a)に示すようにピッチ周期が短い波形の場合にはピッチ周期を抽出する時間期間Tsがオーバーラップしている。

0013

従って、例えば、前記図14(a)の場合において、ピッチ周期抽出1とピッチ周期抽出3のところで自己相関値Rn(k)を計算し、ピッチ周期抽出2のところでは自己相関値Rn(k)を計算しないようにしても影響が少ないことがわかった。即ち、ピッチ周期が短い波形の場合には、自己相関値Rn(k)を毎回計算しなくても影響が少ないといえる。

0014

また、人の声は同じピッチ周期で繰り返される波形で構成されることが多い。ピッチ周期が短い波形で構成される音声(即ち女性などの高い声)の場合には、ピッチ周期が長い波形で構成される音声(即ち弾性などの低い声)に比べて、所定期間内における同一ピッチ周期の波形の数が多いことになる。

0015

ピッチ周期が短い波形で構成される音声の場合は、前記13(a)のようにピッチ周期を抽出する時間期間Tsがオーバーラップすることになるが、前述のように、人の声は同じピッチ周期で繰り返される波形で構成されることが多いため、このような観点からも、自己相関値Rn(k)を毎回計算しなくても影響が少ないことがわかった。

0016

従って、本発明は、このような着目点に基づいてなされたものであり、短い処理時間で入力音声信号からピッチ周期を抽出する音声信号のピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置等を提供することを目的とする。

課題を解決するための手段

0017

上記の課題を解決するために本発明は、音声波形のピッチ周期を抽出し、その抽出したピッチ周期が所定値以下の場合、新たにピッチ周期を抽出せず前記ピッチ周期と同一とすることにより、ピッチ周期の抽出回数を少なくすることを特徴とする。

0018

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段とを備えることを特徴とする。

0019

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段とを備えることを特徴とする。

0020

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の伸長処理を行う時間軸伸長手段とを備えることを特徴とする。

0021

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、入力された音声信号を符号化する符号化手段と、前記符号化手段で符号化された信号を格納するメモリ手段と、前記メモリ手段に格納された信号を復号する復号手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて、前記復号手段より出力される信号の時間軸の圧縮処理を行う時間軸圧縮手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて、前記復号手段より出力される信号の時間軸の伸長処理を行う時間軸伸長手段と、前記復号手段より出力される信号を選択的に前記時間軸圧縮手段または時間軸伸長手段に導く選択手段とを備えることを特徴とする。

0022

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、前記時間軸圧縮手段によって時間軸圧縮された信号を格納するメモリ手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて、前記メモリに格納された信号の時間軸の伸長処理を行う時間軸伸長手段とを備えることを特徴とする。

0023

また本発明は、音声信号のピッチ周期を抽出する第1のピッチ周期抽出手段と、前記第1のピッチ周期抽出手段が抽出したピッチ周期を記憶する第1の記憶手段と、閾値を設定する第1の閾値設定手段と、前記第1のピッチ周期抽出手段が抽出したピッチ周期と前記第1の閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を第1の記憶手段に保存すると共に、前記第1の記憶手段に保存されたピッチ周期を用いる第1のピッチ周期判定手段と、前記第1のピッチ周期抽出手段で抽出したピッチ周期、又は前記第1の記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、前記時間軸圧縮手段によって時間軸圧縮された信号を格納するメモリ手段と、前記メモリ手段に格納された信号よりピッチ周期を抽出する第2のピッチ周期抽出手段と、前記第2のピッチ周期抽出手段が抽出したピッチ周期を記憶する第2の記憶手段と、閾値を設定する第2の閾値設定手段と、前記第2のピッチ周期抽出手段が抽出したピッチ周期と前記第2の閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を第2の記憶手段に保存すると共に、前記第2の記憶手段に保存されたピッチ周期を用いる第2のピッチ周期判定手段と、前記第2のピッチ周期抽出手段で抽出したピッチ周期、又は前記第2の記憶手段に保存されたピッチ周期に基づいて、前記メモリに格納された信号の時間軸の伸長処理を行う時間軸伸長手段とを備えることを特徴とする。

0024

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、閾値を設定する閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、前記時間軸圧縮手段によって時間軸圧縮された信号を複数の帯域に分割して符号化する帯域分割符号化手段と、前記帯域分割符号化手段にによって符号化された信号を格納するメモリ手段と、前記メモリ手段に格納された信号を復号する帯域分割復号化手段と、前記ピッチ周期抽出手段で抽出したピッチ周期、又は前記記憶手段に保存されたピッチ周期に基づいて、前記帯域分割復号化手段から出力される信号の時間軸の伸長処理を行う時間軸伸長手段とを備えることを特徴とする。

0025

また本発明は、音声信号のピッチ周期を抽出する第1のピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する第1の記憶手段と、閾値を設定する第1の閾値設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と前記第1の閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を第1の記憶手段に保存すると共に、前記第1の記憶手段に保存されたピッチ周期を用いる第1のピッチ周期判定手段と、前記第1のピッチ周期抽出手段で抽出したピッチ周期、又は前記第1の記憶手段に保存されたピッチ周期に基づいて音声波形の時間軸の圧縮処理を行う時間軸圧縮手段と、前記時間軸圧縮手段によって時間軸圧縮された信号を複数の帯域に分割して符号化する帯域分割符号化手段と、前記帯域分割符号化手段にによって符号化された信号を格納するメモリ手段と、前記メモリ手段に格納された信号を復号する帯域分割復号化手段と、帯域分割復号化手段から出力される信号のピッチ周期を抽出する第2のピッチ周期抽出手段と、前記第2のピッチ周期抽出手段が抽出したピッチ周期を記憶する第2の記憶手段と、閾値を設定する第2の閾値設定手段と、前記第2のピッチ周期抽出手段が抽出したピッチ周期と前記第2の閾値設定手段で設定した閾値とを比較判定して、前記ピッチ周期が前記閾値より小さいか、若しくは等しい場合には、そのピッチ周期を第2の記憶手段に保存すると共に、前記第2の記憶手段に保存されたピッチ周期を用いる第2のピッチ周期判定手段と、前記第2のピッチ周期抽出手段で抽出したピッチ周期、又は前記第2の記憶手段に保存されたピッチ周期に基づいて、前記帯域分割復号化手段から出力される信号の時間軸の伸長処理を行う時間軸伸長手段とを備えることを特徴とする。

0026

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、再生速度情報を出力する再生速度設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と所定値とを比較判定して、前記ピッチ周期が前記所定値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記再生速度設定手段からの再生速度情報及び、前記ピッチ周期抽出手段で抽出したピッチ周期又は前記記憶手段に保存されたピッチ周期に基づいて、音声波形の時間軸の圧縮処理を行う時間軸圧縮手段とを備えることを特徴とする。

0027

また本発明は、前記再生速度設定手段からの再生速度情報に応じて、前記所定値の実質的な値を変化させることを特徴とする。

0028

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、再生速度情報を出力する再生速度設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と所定値とを比較判定して、前記ピッチ周期が前記所定値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、前記再生速度設定手段からの再生速度情報及び、前記ピッチ周期抽出手段で抽出したピッチ周期又は前記記憶手段に保存されたピッチ周期に基づいて、音声波形の時間軸の伸長処理を行う時間軸伸長手段とを備えることを特徴とする。

0029

また本発明は、前記再生速度設定手段からの再生速度情報に応じて、前記所定値の実質的な値を変化させることを特徴とする。

0030

また本発明は、音声信号のピッチ周期を抽出するピッチ周期抽出手段と、前記ピッチ周期抽出手段が抽出したピッチ周期を記憶する記憶手段と、再生速度情報を出力する再生速度設定手段と、前記ピッチ周期抽出手段が抽出したピッチ周期と所定値とを比較判定して、前記ピッチ周期が前記所定値より小さいか、若しくは等しい場合には、そのピッチ周期を記憶手段に保存すると共に、前記記憶手段に保存されたピッチ周期を用いるピッチ周期判定手段と、入力された音声信号を符号化する符号化手段と、前記符号化手段で符号化された信号を格納するメモリ手段と、前記メモリ手段に格納された信号を復号する復号手段と、前記再生速度設定手段からの再生速度情報及び、前記ピッチ周期抽出手段で抽出したピッチ周期又は前記記憶手段に保存されたピッチ周期に基づいて、前記復号手段より出力される信号の時間軸の圧縮処理を行う時間軸圧縮手段と、前記再生速度設定手段からの再生速度情報及び、前記ピッチ周期抽出手段で抽出したピッチ周期又は前記記憶手段に保存されたピッチ周期に基づいて、前記復号手段より出力される信号の時間軸の伸長処理を行う時間軸伸長手段と、前記復号手段より出力される信号を選択的に前記時間軸圧縮手段または時間軸伸長手段に導く選択手段とを備えることを特徴とする。

0031

また本発明は、前記再生速度設定手段からの再生速度情報に応じて、前記所定値の実質的な値を変化させることを特徴とする。

発明を実施するための最良の形態

0032

以下、本発明の実施の形態を図1乃至図10に基づいて説明する。

0033

先ず、図1は音声信号の早聞き(早送り再生)を行うための再生装置の概略を示すブロック図である。同図において、1は入力されたディジタル音声信号(以下「音声信号」という。)の声の高さを表わすピッチ周期を抽出するピッチ周期抽出手段である。

0034

2は前記ピッチ周期抽出手段1で求められたピッチ周期と、予め定められた閾値(後述する)との比較・判定を行うピッチ周期判定手段である。

0035

前記ピッチ周期判定手段2が前記ピッチ周期抽出手段1の抽出したピッチ周期と後述する閾値とを比較・判定した結果、そのピッチ周期が閾値より小さいか、若しくは等しい場合には、前記ピッチ周期抽出手段1はその後の新たに音声信号のピッチ周期を抽出しないが、その詳細については、図3フローチャートに基づいて後述する。

0036

ここで、ピッチ周期の抽出方法は周知の自己相関を用いたピッチ周期抽出法を用いる。

0037

3は前記ピッチ周期抽出手段1で求めたピッチ周期の情報を一時的に記憶しておくバッファメモリからなるバッファ手段、また4は図2に示すように、例えばピッチ周期2個分の音声波形を切り出した後、1ピッチ周期分の波形A、波形Bのそれぞれに1から0に、及び0から1へ、直線的に変化する重み係数を乗じた波形(波形A’及び波形B’)を生成した後に足し合わせることによって波形Cを得ることで、音声信号の時間軸圧縮を行う時間軸圧縮手段、5はピッチ周期抽出手段1側、又はバッファメモリ3側の何れかに切り替わる切替手段である。

0038

尚、前記切替手段5は、前記ピッチ周期判定手段2の比較・判定結果に従って適宜ピッチ周期抽出手段1側、又はバッファメモリ3側の何れかに切り替えられる。また、6は閾値設定手段、7は再生速度設定手段であり、該再生速度設定手段は、使用者によって選択・設定された再生速度情報を出力する。

0039

次に、本発明の音声信号のピッチ周期抽出方法を図3のフローチャートを用いて説明する。図3において、先ずステップS1では使用者が再生速度設定手段7を操作して再生速度を設定する。設定された再生速度情報はピッチ周期判定手段2へ送られる。尚、再生速度は、例えば0.5倍速〜2.0倍速の中の予め決められたパターンの中から選択するか、あるいは数値直接入力するように構成しても良い。

0040

ステップS2では、前記ステップS1で設定された再生速度に基づき、音声信号のピッチ周期に関する閾値SH、及び分岐変数updについての初期値を設定する(ただし、閾値SH<分岐変数upd)。

0041

0042

ここでは、一例として、使用者が前記ステップS1にて再生速度として2倍速を選択したものとし、閾値SH=240(サンプル)、分岐変数upd=300(サンプル)として説明する(S2)。

0043

尚、この「サンプル」とは、音声信号がディジタル信号である場合に、所望のサンプリング周波数に従ってサンプリングされた音声信号の数をいう。下記表1は再生速度と、閾値SH及び分岐変数updとの関係を表している。

0044

尚、表1において、再生速度(再生速度設定手段からの再生速度情報)に応じて分岐変数updの計算方法を変えている(変数pnumに乗ずる係数を変えている)のは、歪を少なくするためである。この理由を以下に示す。

0045

図13(a)に示すように、例えば再生速度が2倍速の場合、1ピッチ周期目の波形と2ピッチ周期目の波形を1つの波形に圧縮して1つ目の出力波形とし、次に3ピッチ周期目の波形と4ピッチ周期目の波形を圧縮し2つ目の出力波形とする。即ち、1度のピッチ周期の抽出範囲に4ピッチ周期以上入っていれば、2つ目の出力波形を生成する際にピッチ周期の抽出は必要ない。このため、前記表1に示すように、変数pnumに乗ずる係数を4としている。

0046

また、図13(b)に示すように、例えば再生速度が1.5倍速の場合は、1ピッチ周期目の波形と2ピッチ周期目の波形を1つの波形に圧縮して1つ目の出力波形とし、次に3ピッチ周期目をそのまま2つ目の出力波形とし、さらに4ピッチ周期目の波形と5ピッチ周期目の波形を圧縮し3つ目の出力波形とする。即ち、1度のピッチ周期の抽出範囲に5ピッチ周期以上入っていれば3つ目の出力波形を生成する際にピッチ周期の抽出は必要ない。このため、前記表1に示すように、変数pnumに乗ずる係数を5としている。

0047

そして他の再生速度の場合にについても同様にしてそれぞれ適切な係数を与えており、このように変数pnumに乗ずる係数を最適な値に設定することで歪が低減することが確認できた。

0048

また、前記表1では、変数pnumに乗ずる係数を再生速度設定手段からの再生速度情報に応じて変更するようにしているが、これに変えて、再生速度に応じて閾値SHを変化させるように構成しても実質的に同じことが実現できる。即ち、「再生速度に応じて変数pnumに乗ずる係数または閾値SHを変える」ということは、請求項11、請求項13、請求項15における「再生速度設定手段からの再生速度情報に応じて、所定値の実質的な値を変化させる」ということを意味している。

0049

次にステップS3では、音声信号の早聞きを行うための再生装置に入力される音声信号の読み込みを行う。

0050

ステップS4では、分岐変数updと閾値SHとを比較し、分岐変数updの値が閾値SHの値より大きければステップS8に進み、音声信号からピッチ周期を抽出して変数pnumに格納する。一方、分岐変数updの値が閾値SHの値より小さいか若しくは等しければステップS5に進む。

0051

このステップS4において、前述のようにステップS2の初期値の設定で閾値SHの値を240サンプルに、また分岐変数updの値を閾値SHより大きい300サンプルに設定したため、初期値の設定直後は必ずステップS8に進んで、音声信号のピッチ周期を抽出することになる。このため、前記図1における切換え手段5はピッチ周期抽出手段1側に切換えられている。

0052

尚、音声信号のピッチ周期の抽出方法は周知の自己相関を用いたピッチ周期抽出法を用いる。

0053

ステップS9では、前記ステップS8で抽出したピッチ周期pnumの値を分岐変数updに設定する。この場合、前記表1にしたがって、upd←4×pnumとなる(矢印は代入を示す、以下同様)。

0054

次に、ステップS6においては、音声信号の時間軸圧縮を行う。この時間軸圧縮方法は前記図2に示すように、例えばピッチ周期2個分の音声波形を切り出した後、1ピッチ周期分のそれぞれの波形にそれぞれ異なる重み係数、例えば1から0に、及び0から1に、直線的に変化する重み係数を乗じた後に足し合わせることによって時間軸圧縮処理、即ち早聞きを行うことが可能である。

0055

ステップS7では、継続して処理を行うか否かを判定し、継続して処理を行うのであれば、ステップS3に戻り、一方処理を終了するのであれば終了する。

0056

尚、処理を終了する条件としては、例えば使用者が音声の再生を停止すべく停止ボタン(図示せず)を操作した場合などである。

0057

一方、前記ステップS4において、分岐変数updの値が閾値SHの値より小さいか若しくは等しくなった場合は、前記図1における切換え手段5をバッファ手段3側に切換え、ステップS5において、前記表1にしたがってupd←upd+2×pnumに設定し、次にステップS6にて時間軸圧縮を行ない、ステップS3へ戻る。

0058

従って、このS5で設定された分岐変数updの値が、閾値SHの値より小さいか、若しくは等しい限りは、ステップS8における音声信号のピッチ周期pnumの抽出処理及びステップS9による分岐変数updの設定を行うことはない(その間は図1の切換え手段5もバッファ手段3側に切換えられたままである)。即ち、ピッチ周期が短い場合には、ステップS8における音声信号のピッチ周期pnumの抽出処理及びステップS9による分岐変数updの設定を行う必要がないということである。

0059

以上の処理を繰り返すことによって、図4(a)に示すように、ピッチ周期が短い場合、ピッチ周期を抽出した音声波形に連続するピッチ周期2個分の波形についてはピッチ周期の抽出を行う必要がなくなるため、ピッチ周期抽出手段1の処理負担は軽減されることになる。

0060

一方、図4(b)に示すように、ピッチ周期が長い場合には、単位時間当たりに抽出するピッチ周期の抽出回数は少ないため、ピッチ周期抽出手段1の処理負担は以前と変わることはない。

0061

前述の実施の形態では、入力された音声信号を時間軸圧縮処理した例を述べたが、本発明はこれには限られず、入力された音声信号を時間軸伸長する場合には図1の「時間軸圧縮手段4」の代わりに、図5に示すように「時間軸伸長手段8」を備えることにより、音声信号の遅聞き(ゆっくり再生)を行うための再生装置とすることができる。

0062

この時間軸伸長手段8は、図7に示すように、例えばピッチ周期3個分の音声波形を切り出した後、ピッチ周期2個分の波形Aに例えば0から1に直線的に変化する重み係数を乗じて波形A’を生成し、またピッチ周期2個分の波形Bに例えば1から0に直線的に変化する重み係数を乗じて波形B’を生成し、それぞれを足し合わせることによって、ピッチ周期1個分の波形D及び波形Eを得ることで、時間軸伸長処理、即ち遅聞きを行うことが可能である。

0063

この場合の動作について、図6のフローチャートに基づいて説明する。ここでは、一例として、使用者が前記ステップS11にて再生速度として0.5倍速を選択したものとし、閾値SH=240(サンプル)、分岐変数upd=300(サンプル)として説明する(S12)。

0064

次にステップS13では、音声信号の早聞きを行うための再生装置に入力される音声信号の読み込みを行う。

0065

ステップS14では、分岐変数updと閾値SHとを比較し、分岐変数updの値が閾値SHの値より大きければステップS18に進み、音声信号からピッチ周期を抽出して変数pnumに格納する。一方、分岐変数updの値が閾値SHの値より小さいか若しくは等しければステップS15に進む。

0066

前記ステップ15及び後述するステップ19における分岐変数updの計算式と再生速度との関係は下記の表2のように設定されている。

0067

0068

このステップS14において、前述のようにステップS12の初期値の設定で閾値SHの値を240サンプルに、また分岐変数updの値を閾値SHより大きい300サンプルに設定したため、初期値の設定直後は必ずステップS18に進んで、音声信号のピッチ周期を抽出することになる。このため、前記図5における切換え手段5はピッチ周期抽出手段1側に切換えられている。

0069

尚、音声信号のピッチ周期の抽出方法は周知の自己相関を用いたピッチ周期抽出法を用いる。

0070

ステップS19では、前記ステップS18で抽出したピッチ周期pnumの値を分岐変数updに設定する。この場合、前記表1にしたがって、upd←3×pnumとなる。

0071

次に、ステップS16においては、音声信号の時間軸伸長を行う。この時間軸伸長方法は前記図7に示すように、例えばピッチ周期2個分の音声波形を切り出した後、1ピッチ周期分のそれぞれの波形にそれぞれ異なる重み係数、例えば1から0に、及び0から1に変化する重み係数を乗じた後に足し合わせることによって時間軸伸長処理、即ち遅聞きを行うことが可能である。

0072

次に、ステップS17では、継続して処理を行うか否かを判定し、継続して処理を行うのであれば、ステップS3に戻り、一方処理を終了するのであれば終了する。

0073

尚、処理を終了する条件としては、例えば使用者が音声の再生を停止すべく停止ボタン(図示せず)を操作した場合などである。

0074

一方、前記ステップS14において、分岐変数updの値が閾値SHの値より小さいか若しくは等しくなった場合は、前記図5における切換え手段5をバッファ手段3側に切換え、ステップS15において、前記表1にしたがってupd←upd+pnumに設定し、次にステップS16にて時間軸伸長を行ない、ステップS13へ戻る。

0075

従って、このS15で設定された分岐変数updの値が、閾値SHの値より小さいか、若しくは等しい限りは、ステップS18における音声信号のピッチ周期pnumの抽出処理及びステップS19による分岐変数updの設定を行うことはない(その間は図5の切換え手段5もバッファ手段3側に切換えられたままである)。

0076

即ち、ピッチ周期が短い場合には、ステップS18における音声信号のピッチ周期pnumの抽出処理及びステップS19による分岐変数updの設定を行う必要がなくなるため、ピッチ周期抽出手段1の処理負担は軽減されることになる。

0077

また、前述の実施の形態では、音声信号の早聞きを行うための再生装置、音声信号の遅聞きを行うための再生装置それぞれ単独の例について述べたが、図8に示すように、これらの機能を併せ持った装置とすることもできる。

0078

図8において、12は入力された音声信号を既存のADPCM処理によって符号化するADPCM符号化手段、9は前記ADPCM符号化手段12で符号化された信号を格納するメモリ、13は前記メモリ9からの信号を復号するADPCM復号化手段、14は選択手段、4は前記選択手段14を介して前記ADPCM復号化手段13からの信号が導かれる時間軸圧縮手段、8は前記選択手段14を介して前記ADPCM復号化手段13からの信号が導かれる時間軸伸長手段である。

0079

該構成により、選択手段14を時間軸圧縮手段4側に切り換えることで早聞き出力信号を得られ、一方、選択手段14を時間軸伸長手段8側に切り替えることで遅聞き出力信号を得られる。

0080

また、図9に示すように時間軸圧縮した音声信号を一旦メモリ9に格納し、そのメモリから読み出した音声信号を時間軸伸長することにより音声信号の圧縮伸長を実現する装置にも適用することができる。

0081

なお、この実施例では時間軸圧縮を行う部分に本発明のピッチ周期抽出装置を適用している。また、該装置においては、音声信号の早聞きまたは遅聞きを行うためのものではなく、音声信号を時間軸圧縮処理を施してメモリに格納することで、少ないメモリに多くの信号を記録するための装置である。以下、図10乃至図12に示す装置においても同様である。

0082

図10は前記図9に示す装置において、時間軸伸長処理を行う部分にも本発明のピッチ周期抽出装置を適用した例を示している。この例では、時間軸伸長処理を行う側にも、第2ピッチ周期抽出手段21、第2ピッチ周期判定手段22、第2バッファ23、第2切り換え手段24、第2閾値設定手段25を設けているので、メモリ9に格納された信号からピッチ周期を検出することができるため、メモリ9にピッチ周期まで格納する必要がなく、メモリ9の容量を節約することができる。

0083

図11は前記図9に示す装置に、さらに帯域分割符号化手段10及び帯域分割復号化手段11を備えた例を示している。この例においては、帯域分割符号化手段10及び帯域分割復号化手段11により、時間軸方向のみならず周波数帯域方向にも信号の圧縮・伸長処理を行うことができる。

0084

図12は、前記図11に示した回路に、さらに時間軸伸長処理を行う側にも、第2ピッチ周期抽出手段21、第2ピッチ周期判定手段22、第2バッファ23、第2切り換え手段24、第2閾値設定手段25を設けたものである。この例においては、帯域分割符号化手段10及び帯域分割復号化手段11により、時間軸方向のみならず周波数帯域方向にも信号の圧縮・伸長処理を行うことができ、さらに第2ピッチ周期抽出手段21、第2ピッチ周期判定手段22、第2バッファ23、第2切り換え手段24、第2閾値設定手段25によって、帯域分割復号化手段11から出力される信号よりピッチ周期を抽出するので、メモリ9にピッチ周期まで格納する必要がなく、メモリ9の容量を節約することができる。

発明の効果

0085

以上、詳述した如く本発明に依れば、ピッチ周期が短い音声波形についてピッチ周期を抽出する場合に、最初の音声波形についてのみピッチ周期を抽出すればよく、この音声波形に続く音声波形のピッチ周期を求める必要がなくなる結果、ピッチ周期抽出手段の処理負担が軽減される効果を奏する。

0086

また、再生速度設定手段からの再生速度情報に応じて、所定値の実質的な値を変化させることで、再生時の音の歪を少なくすることが出来る。

図面の簡単な説明

0087

図1本発明のピッチ周期抽出装置の構成を示すブロック図である。
図2時間軸圧縮処理を説明するためのフローチャートである。
図3本発明のピッチ周期抽出装置の動作を示すフローチャートである。
図4時間軸圧縮処理を説明するためのフローチャートである。
図5本発明の時間軸伸長装置の構成を示すブロック図である。
図6本発明の時間軸伸長装置の動作を示すフローチャートである。
図7時間軸伸長処理を説明するための図である。
図8本発明の時間軸圧縮伸長装置の構成を示すブロック図である。
図9本発明の音声信号記録再生装置の構成を示すブロック図である。
図10本発明の他の音声信号記録再生装置の構成を示すブロック図である。
図11本発明の他の音声信号記録再生装置の構成を示すブロック図である。
図12本発明の音声信号記録再生装置の構成を示すブロック図である。
図13歪を低減できる効果を説明するための図である。
図14従来の時間軸圧縮処理を示す図である。

--

0088

1ピッチ周期抽出手段
2 ピッチ周期判定手段
3バッファ手段
4時間軸圧縮手段
5切換え手段
6閾値設定手段
8時間軸伸長手段
9メモリ手段
10帯域分割符号化手段
11 帯域分割復号化手段
12ADPCM符号化手段
13ADPCM復号化手段
14 選択手段
21 第2ピッチ周期抽出手段
22 第2ピッチ周期判定手段
23 第2バッファ
24 第2切換え手段
25 第2閾値設定手段

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • ソニー株式会社の「 情報処理装置および電子機器」が 公開されました。( 2020/09/24)

    【課題・解決手段】本技術は、どのユーザに対して応答するべきかを正しく判断することができるようにする情報処理装置および電子機器に関する。発話者特定部は、ユーザが存在する環境の画像と音声に基づいて、所定の... 詳細

  • グーグルエルエルシーの「 オーディオベースのコンピュータプログラム出力の修正」が 公開されました。( 2020/09/24)

    【課題・解決手段】音声または非テキスト入力アクティブ化環境においてコンピュータプログラム出力を修正することが提供される。システムは、デバイスのマイクロフォンによって検出されるオーディオ信号を受信するこ... 詳細

  • グーグルエルエルシーの「 ホットワード認識音声合成」が 公開されました。( 2020/09/24)

    【課題・解決手段】方法(400)は、合成音声(160)に変換するためのテキスト入力データ(302)を受信することと、ユーザデバイス(110)に割り当てられているホットワード(130)の存在を検出するよ... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ