図面 (/)

技術 音声パケット伝送システム

出願人 日本電気株式会社
発明者 原田亮一
出願日 1995年10月18日 (23年7ヶ月経過) 出願番号 1995-268910
公開日 1997年5月2日 (22年0ヶ月経過) 公開番号 1997-116571
状態 特許登録済
技術分野 圧縮、伸長・符号変換及びデコーダ 広域データ交換 伝送媒体によって特徴づけられない伝送方式 電信方式
主要キーワード 計数更新 リニア信号 先頭区間 励振源 音声パケット伝送 無音処理 線形予測演算 パケット受信器
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1997年5月2日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (8)

課題

遅延の増加や有音率の低下を伴うことなく、話頭の音声品質劣化や異音の発生を防ぐ。

解決手段

音声符号化器21はPCM音声の符号化を行い、音声符号化データ予測係数とを出力する。音声検出器22は入力PCM音声の有音/無音を判定する。送信予測係数メモリ23は予測係数を記憶し、遅延回路24は音声符号化データを所定時間遅延する。送信回路25は無音から有音への変化が検出されると、先頭パケットとして予測係数を、それに続くパケットとして遅延された音声符号化データを出力する。受信回路31は符号化側から伝送されてきたパケットを受信すると、そのパケットを分解して予測係数及び符号化データを出力する。音声復号化器32は先頭パケットから分解された予測係数を用いて、それ以降のパケットから分解された音声符号化データをPCM信号復号化する。

概要

背景

従来、音声符号化データ有音区間のみをパケット化して伝送する際に、音声符号化方式として、リニア音声信号をA−LawPCM(Pulse Code Modulation)あるいはμ−Law PCM等のPCM符号化方式を用いる場合には無音区間の符号化データが伝送されなくても、有音区間の音声品質劣化することはない。

これはA−Law/μ−Law符号化データとPCMリニア信号とが1対1に対応しており、PCMリニア信号の1サンプルを復号化するのに過去の符号化データの影響を受けないためである。

それに対し、ITU−T勧告G.728に示される16kbps LD−CELP(Low−Delay Code Excited Liner Prediction:低遅延符号励振線予測)等の高能率音声符号化方式においては、バックワード線形予測法等によって過去の入力信号を用いて音声符号化復号化を行う。

つまり、高能率音声符号化器では音声符号化側が伝送される連続した符号化データによって音声符号化器と全く同じ内部状態を保ちながら音声復号化処理を行うことを前提としている。また、音声符号化側は過去の入力信号の分析から復号化信号を予測し、音声符号化を行っている。

有音区間のみを符号化データとして伝送する音声パケット伝送方式においては、高能率音声符号化方式が用いられた場合、符号化データが伝送されない無音区間に音声符号器の内部状態と音声復号器の内部状態とが、特に線形予測法器の予測係数不一致となり、有音区間の先頭部分(これを話頭と呼ぶ)の音声品質が劣化する。

従来、音声符号化器復号化器の内部状態の不一致に対しては、無音区間中に音声符号化器及び音声復号化器の双方を初期化(リセット)状態とし、強制的に内部状態を一致させる方法がある。この方法については、特開平2−181552号公報に開示されている。

あるいは、音声符号化器入力側に遅延回路を挿入し、有音区間が始まる前方の部分から有音区間として扱うことで、有音区間手前の無音部分で音声符号化器と音声復号化器とを駆動し、実際の有音区間が始まるまで内部状態の不一致を収束させて話頭部分の音声品質劣化を防いでいる。

概要

遅延の増加や有音率の低下を伴うことなく、話頭の音声品質劣化や異音の発生を防ぐ。

音声符号化器21はPCM音声の符号化を行い、音声符号化データと予測係数とを出力する。音声検出器22は入力PCM音声の有音/無音を判定する。送信予測係数メモリ23は予測係数を記憶し、遅延回路24は音声符号化データを所定時間遅延する。送信回路25は無音から有音への変化が検出されると、先頭パケットとして予測係数を、それに続くパケットとして遅延された音声符号化データを出力する。受信回路31は符号化側から伝送されてきたパケットを受信すると、そのパケットを分解して予測係数及び符号化データを出力する。音声復号化器32は先頭パケットから分解された予測係数を用いて、それ以降のパケットから分解された音声符号化データをPCM信号に復号化する。

目的

そこで、本発明の目的は上記の問題点を解消し、遅延の増加や有音率の低下を伴うことなく、話頭の音声品質劣化や異音の発生を防ぐことができる音声パケット伝送システムを提供することにある。

効果

実績

技術文献被引用数
0件
牽制数
2件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

電話帯域音声信号有音区間のみを符号化しかつその符号化データをパケット化して伝送路に出力する符号化装置と、相手先からのパケットデータを復号化して前記有音区間の再生音声信号を出力する復号化装置とを含む音声パケット伝送ステムであって、前記音声信号を線形予測法を用いて符号化する音声符号化手段と、前記音声信号を監視して前記有音区間及び無音区間を検出する音声検出手段と、前記音声符号化手段から出力された符号化データを遅延して出力する遅延手段と、前記音声符号化手段において前記線形予測法で算出された予測係数を記憶する記憶手段と、前記音声検出手段の検出結果に応じて前記遅延手段で遅延された前記符号化データと前記記憶手段に記憶された前記予測係数とのうち一方をパケット化して前記伝送路に出力する送信手段とを前記符号化装置に有し、前記伝送路上の前記パケットデータの受信状態から前記伝送路上の信号が前記有音区間及び前記無音区間のいずれかを判別する判別手段と、前記伝送路上の前記パケットデータから前記予測係数を分解する予測係数分解手段と、前記伝送路上の前記パケットデータから前記符号化データを分解する符号化データ分解手段と、前記判別手段の判別結果に応じて前記伝送路上の前記パケットデータを前記予測係数分解手段及び前記符号化データ分解手段のうちの一方に出力する切換手段と、前記予測係数分解手段で分解された前記予測係数を基に前記符号化データ分解手段で分解された前記符号化データを復号化して前記再生音声信号として出力する音声復号化手段とを前記復号化装置に有することを特徴とする音声パケット伝送システム。

請求項2

前記送信手段は、前記音声検出手段で前記無音区間から前記有音区間への変化が検出された時に前記記憶手段に記憶された前記予測係数をパケット化して前記伝送路に出力し、前記予測係数に連続して前記遅延手段で遅延された前記符号化データをパケット化して前記伝送路に出力するよう構成し、前記切換手段は、前記判別手段で前記無音区間から前記有音区間への変化が検出された時に前記伝送路上の前記パケットデータを前記予測係数分解手段に出力し、当該パケットデータに連続するパケットデータを前記符号化データ分解手段に出力するよう構成したことを特徴とする請求項1記載の音声パケット伝送システム。

請求項3

前記音声符号化手段及び前記音声復号化手段は、複数の励振源ベクトルで構成される音源符号帳ら線形予測係数を用いて合成音復号し、入力音声に最も近い合成音が得られる励振源ベクトルを前記予測係数として出力する低遅延符号励振線予測方式を用いるよう構成したことを特徴とする請求項1または請求項2記載の音声パケット伝送システム。

請求項4

前記音声符号化手段は、前記音声検出手段で前記無音区間が検出された時の演算精度が前記音声検出手段で前記有音区間が検出された時の演算精度よりも低くなるよう構成したことを特徴とする請求項1から請求項3のいずれか記載の音声パケット伝送システム。

請求項5

前記遅延手段は、前記音声符号化手段から出力された符号化データを前記記憶手段における更新時間分遅延するよう構成したことを特徴とする請求項1から請求項4のいずれか記載の音声パケット伝送システム。

請求項6

前記音声復号化手段は、前記判別手段で前記無音区間が検出された時に前記符号化データの復号化を行わず、前記判別手段で前記無音区間から前記有音区間への変化が検出された時に前記予測係数分解手段で分解された前記予測係数を基に前記判別手段で前記有音区間が検出された時に前記符号化データ分解手段で分解された前記符号化データを復号化するよう構成したことを特徴とする請求項1から請求項5のいずれか記載の音声パケット伝送システム。

技術分野

0001

本発明は音声パケット伝送ステムに関し、特に高速ディジタル専用線を利用した電話回線交換網に使用される音声符号化復号化装置において音声信号高能率音声符号化方式によって符号化し、その有音部分のみをパケット化して伝送する高能率音声パケット伝送方式に関する。

背景技術

0002

従来、音声符号化データ有音区間のみをパケット化して伝送する際に、音声符号化方式として、リニア音声信号をA−LawPCM(Pulse Code Modulation)あるいはμ−Law PCM等のPCM符号化方式を用いる場合には無音区間の符号化データが伝送されなくても、有音区間の音声品質劣化することはない。

0003

これはA−Law/μ−Law符号化データとPCMリニア信号とが1対1に対応しており、PCMリニア信号の1サンプルを復号化するのに過去の符号化データの影響を受けないためである。

0004

それに対し、ITU−T勧告G.728に示される16kbps LD−CELP(Low−Delay Code Excited Liner Prediction:低遅延符号励振線予測)等の高能率音声符号化方式においては、バックワード線形予測法等によって過去の入力信号を用いて音声符号化復号化を行う。

0005

つまり、高能率音声符号化器では音声符号化側が伝送される連続した符号化データによって音声符号化器と全く同じ内部状態を保ちながら音声復号化処理を行うことを前提としている。また、音声符号化側は過去の入力信号の分析から復号化信号を予測し、音声符号化を行っている。

0006

有音区間のみを符号化データとして伝送する音声パケット伝送方式においては、高能率音声符号化方式が用いられた場合、符号化データが伝送されない無音区間に音声符号器の内部状態と音声復号器の内部状態とが、特に線形予測法器の予測係数不一致となり、有音区間の先頭部分(これを話頭と呼ぶ)の音声品質が劣化する。

0007

従来、音声符号化器復号化器の内部状態の不一致に対しては、無音区間中に音声符号化器及び音声復号化器の双方を初期化(リセット)状態とし、強制的に内部状態を一致させる方法がある。この方法については、特開平2−181552号公報に開示されている。

0008

あるいは、音声符号化器入力側に遅延回路を挿入し、有音区間が始まる前方の部分から有音区間として扱うことで、有音区間手前の無音部分で音声符号化器と音声復号化器とを駆動し、実際の有音区間が始まるまで内部状態の不一致を収束させて話頭部分の音声品質劣化を防いでいる。

発明が解決しようとする課題

0009

上述した従来の高能率音声パケット伝送方式では、無音区間中に音声符号化器及び音声復号化器の双方を初期化状態とし、強制的に内部状態を一致させる方法の場合、話頭の音声品質の劣化を完全に防ぐことができない。

0010

すなわち、初期化処理によって、音声符号化復号化器の内部状態は完全な無音信号が入力され続けていた状態を想定した内部状態へと初期化する。無音圧縮処理において、無音区間から有音区間に切替わった際の有音先頭区間では音声検出器が有音と判定するのに十分に大きなパワーを持った音声信号が音声符号化器に入力される。

0011

初期化によって強制的に完全な無音状態の予測係数がセットされた音声符号化器及び音声復号化器では無音信号入力状態とは異なった不連続な有音区間の入力音声信号を、無音信号入力状態の線形予測係数を用いて符号化及び復号化処理を行う。そのため、話頭の音声品質が劣化したり、内部状態と入力される信号との不連続性によって線形予測処理が失敗して異音を発生したりする。

0012

また、ITU−T勧告G.728のLD−CELP音声符号化方式においては、バッファに蓄えられた過去の105サンプル、13.125msの区間の信号を用いて2.5msに一度だけ線形予測器が駆動され、予測係数が更新される。

0013

さらに、ITU−T勧告G.728のLD−CELP音声符号化方式の線形予測器は不連続な入力信号によって線形予測演算が異常処理となった場合には線形予測器の処理を途中終了させ、予測係数の更新を一切行わない。

0014

したがって、音声符号化器入力側に遅延回路を挿入し、有音区間前方の無音区間から音声符号化復号化器を駆動することで、予測係数を一致させる方法の場合、線形予測処理に用いられるバッファ中の105サンプルの全てが更新されることによって、バッファ中の信号が全て連続的となり、線形予測器の正常処理が可能となった後に、線形予測器の複数回の正常処理が繰返し行われる中で音声符号化器と音声復号化器とにおける線形予測係数の不一致が徐々に収束して行くという過程を経なければならない。

0015

その場合、話頭の音声品質劣化や異音発生の防止に対して予測係数の不一致を十分に収束させるには、20msから60msもの長い時間を必要とする。

0016

予測係数一致のために挿入された大きな遅延は音声パケット伝送区間全体の遅延を増加させてしまう。また、実際の有音区間の前方の無音区間から有音区間と同様に扱い、無音区間まで含めた区間を伝送するために無音区間を伝送しないことによって得られる無音圧縮効果、つまり一定時間中の無音パケット数と有音パケット数との比によって示される有音率を有音区間前方の無音区間分、すなわち挿入される遅延量だけ低下させてしまう。

0017

そこで、本発明の目的は上記の問題点を解消し、遅延の増加や有音率の低下を伴うことなく、話頭の音声品質劣化や異音の発生を防ぐことができる音声パケット伝送システムを提供することにある。

課題を解決するための手段

0018

本発明による音声パケット伝送システムは、電話帯域の音声信号の有音区間のみを符号化しかつその符号化データをパケット化して伝送路に出力する符号化装置と、相手先からのパケットデータを復号化して前記有音区間の再生音声信号を出力する復号化装置とを含む音声パケット伝送システムであって、前記音声信号を線形予測法を用いて符号化する音声符号化手段と、前記音声信号を監視して前記有音区間及び無音区間を検出する音声検出手段と、前記音声符号化手段から出力された符号化データを遅延して出力する遅延手段と、前記音声符号化手段において前記線形予測法で算出された予測係数を記憶する記憶手段と、前記音声検出手段の検出結果に応じて前記遅延手段で遅延された前記符号化データと前記記憶手段に記憶された前記予測係数とのうち一方をパケット化して前記伝送路に出力する送信手段とを前記符号化装置に有し、前記伝送路上の前記パケットデータの受信状態から前記伝送路上の信号が前記有音区間及び前記無音区間のいずれかを判別する判別手段と、前記伝送路上の前記パケットデータから前記予測係数を分解する予測係数分解手段と、前記伝送路上の前記パケットデータから前記符号化データを分解する符号化データ分解手段と、前記判別手段の判別結果に応じて前記伝送路上の前記パケットデータを前記予測係数分解手段及び前記符号化データ分解手段のうちの一方に出力する切換手段と、前記予測係数分解手段で分解された前記予測係数を基に前記符号化データ分解手段で分解された前記符号化データを復号化して前記再生音声信号として出力する音声復号化手段とを前記復号化装置に備えている。

発明を実施するための最良の形態

0019

まず、本発明の作用について以下に述べる。

0020

電話帯域の音声信号の有音区間のみを符号化しかつその符号化データをパケット化して伝送路に出力する音声符号化装置と、相手先からのパケットデータを復号化して有音区間の再生音声信号を出力する音声復号化装置とを含む音声パケット伝送システムにおいて、音声検出器が無音から有音への変化を検出した時に有音パケットの先頭の1パケットとして送信予測係数メモリ最新の線形予測係数を送信回路から音声復号化装置に伝送し、その有音パケットに続けて遅延回路で遅延された音声符号化器からの音声符号化データを有音パケットとして送信回路から音声復号化装置に伝送する。

0021

音声復号化装置においては音声符号化装置から伝送されてきた線形予測係数を基に、それに続けて伝送されてきた音声符号化データを音声復号化器で復号化する。

0022

これによって、有音パケット先頭の線形予測係数を用いて音声符号化器の内部状態と音声復号化器の内部状態とを一致させることができるので、遅延の増加や有音率の低下を伴うことなく、話頭の音声品質劣化や異音の発生を防ぐことができる。

0023

次に、本発明の一実施例について図面を参照して説明する。図1は本発明の一実施例の構成を示すブロック図である。図において、音声パケット伝送システム1は音声符号化装置2と、音声復号化装置3とから構成されている。

0024

音声符号化装置2は音声符号化器21と、音声検出器22と、送信予測係数メモリ23と、遅延回路24と、送信回路25とから構成されている。音声符号化器21は入力PCM音声の高能率音声符号化を行い、符号化データを遅延回路24に出力する。また、音声符号化器21は内部の線形予測法器で生成された予測係数を送信予測係数メモリ23に出力する。

0025

音声検出器22は入力PCM音声の有音/無音を判定し、有音無音判定情報として音声符号化器21及び送信回路25に出力する。送信予測係数メモリ23は音声符号化器21の線形予測法器から送られてくる予測係数を記憶する。

0026

遅延回路24は先入れ先出し方式のバッファメモリからなり、音声符号化器21からの符号化データを所定時間遅延する。送信回路25は音声検出器22からの有音無音判定情報に基づいて送信予測係数メモリ23からの予測係数データと遅延回路24で遅延された符号化データとを図示せぬ伝送路に出力する。

0027

音声復号化装置3は受信回路31と、音声復号化器32とから構成されている。受信回路31は符号化側から伝送されてきたパケットを受信すると、パケットの受信/非受信に応じてそのパケットを分解して予測係数あるいは符号化データとして出力する。このとき、受信回路31はパケット内容が予測係数であったか、あるいは符号化データであったのかを示す制御信号を音声符号化器32に出力する。

0028

音声復号化器32は受信回路31からパケット内容が予測係数であることが通知されると符号化データの復号化を行わずに受信回路31からのデータを音声復号化器32内部の予測係数に入力し、符号化データであることが通知されると、その前に入力された予測係数を用いて符号化データをPCM信号に復号化して出力する。

0029

この図1を用いて本発明の一実施例による音声符号化処理及び音声復号化処理について以下説明する。音声検出器22は入力されたPCM音声信号の一定区間のレベルを監視し、入力信号が有音か無音かを判定する。音声検出器22は25msのパケット区間単位で有音無音判定情報を音声符号化器21及び送信回路25に出力する。

0030

音声符号化器21は音声検出器22からの有音無音判定情報が有音判定であれば、通常の高能率音声符号化を行う。また、音声符号化器21は音声検出器22からの有音無音判定情報が無音判定であれば、線形予測演算の演算精度を落として演算を行い、音声の符号化を行う。

0031

ITU−T勧告G.728のLD−CELP音声符号化方式においては、32ビットの演算精度で次数が50次の線形予測法が過去13.125ms(64kbit/sで105サンプル分の信号)を用いて2.5ms毎に行われる。

0032

すなわち、
50(次)×32(bit)=1600[bit]
の予測係数が用いられている。このとき、演算精度を32ビットから8ビットに落として演算を行うようにする。

0033

すると、予測係数の総ビット数は、
50(次)×8(bit)=400[bit]
となる。線形予測の演算精度を落とすことによって復号化される音声品質は劣化するが、無音区間中の線形予測演算は無音区間中の音声信号の復号化ではなく、有音に変化した時の音声復号化器32との内部状態を一致させることにあるので問題はない。

0034

有音判定中に音声符号化器21によって符号化された符号化データは遅延回路24に出力される。また、音声符号化器21は無音判定中に符号化データを出力せずに、演算精度が32ビットから8ビットに落とされた予測係数を送信予測係数メモリ23に出力する。

0035

送信予測係数メモリ23は無音区間中の最も最近の2.5msに8bitの精度で演算された音声符号化器21内の線形予測法器の出力である400bitの予測係数を記憶する。

0036

音声符号化器21は1024個の励振源ベクトルで構成される音源符号帳コードブック)のベクトル候補を、線形予測器による線形予測係数を用いた合成フィルタに通し、1024個のベクトルの中でもっとも入力音声信号に近い合成フィルタ出力を得られるベクトルを選択し、選択したコードブックのインデックスを予測係数として音声復号化装置3側に送信する。

0037

遅延回路24では有音区間中に音声符号化器21によって符号化された符号化データを、符号化データが更新される2.5ms分遅延させ、遅延が挿入された符号化データは送信回路25に出力される。音声符号化器21では2.5ms毎に更新される予測係数を、次の2.5msの信号の予測処理に用いる。

0038

したがって、遅延回路24によって遅延を挿入することで、予測係数とその予測係数が用いられて音声符号化処理あるいは音声復号化処理が行われる信号区間時間関係整合される。

0039

音声復号化装置3側では有音先頭の1パケットで音声符号化装置2側からの予測係数を受取り受取った予測係数によって有音先頭の1パケットの次に連続するパケットの符号化データに対して音声復号化処理を行うことが可能となる。

0040

送信回路25では音声検出器22からの有音無音判定情報が無音判定であれば、パケット化処理及びパケット送信処理を行わない。送信回路25は音声検出器22からの有音無音判定情報が無音判定から有音判定に変化すると、最初の1パケットに送信予測係数メモリ23に記憶された400bitの予測係数をパケット化して音声復号化装置3側に送信する。

0041

ITU−T勧告G.728のLD−CELP音声符号化方式においては、25msをパケット単位として送信する場合には400bitが1パケットとなり、有音区間の先頭の1パケットで400bitの予測係数を伝送することが可能となる。

0042

送信回路25は有音パケットの先頭の1パケットを送信すると、それに続けて遅延回路24で遅延された符号化データを夫々パケット化して音声復号化装置3側に送信する。

0043

音声復号化装置3の受信回路31ではパケットを受信すると有音中と判断し、パケットを受信しなければ無音中と判断してその有音/無音状態を、夫々有音処理/無音処理を示す制御信号として音声復号化器32に出力する。

0044

また、受信回路31はパケットを受信すると、受信したパケットを分解し、先頭の1パケットを予測係数として音声復号化器32に出力し、先頭の1パケットの後に続くパケットを符号化データとして音声復号化器32に出力する。

0045

音声復号化器32では受信回路31からの制御信号が無音処理を示していれば音声信号の復号化処理を行わず、受信回路31から入力されるデータを予測係数として内部の予測係数に入力する。

0046

音声復号化器32では受信回路31からの制御信号が有音処理を示していれば受信回路31からのデータを音声符号化データとして音声の復号化処理を行い、復号化された音声信号をPCM音声信号として音声復号化装置3から出力する。

0047

音声復号化器32では音声符号化装置2から予測係数としてコードブックのインデックスを受信すると、受信したインデックスによって音源符号帳から励振源ベクトルを抽出する。尚、音声復号化器32には音声符号化器21内の音源符号帳と同一内容の音源符号帳が配設されている。

0048

音声復号化器32は音源符号帳から抽出した励振源ベクトルを、音声符号化器21と同じ内部状態を有する合成フィルタに入力することで、符号化データから音声を復号化する。

0049

図2図1の受信回路31の構成を示すブロック図である。図において、受信回路31はパケット受信器33と、スイッチ34,37と、予測係数分解器35と、音声符号化データ分解器36とから構成されている。

0050

受信回路31ではパケット受信器33が音声符号化データの入力からパケット受信/非受信を監視することで有音/無音を判断し、そのパケットを予測係数分解器35及び音声符号化データ分解器36のいずれで処理するかの制御を行う。

0051

この場合、パケット受信器33は有音/無音の判断結果に応じて有音処理/無音処理を示す有音/無音制御情報として音声復号化器32に出力するとともに、その制御情報を基にスイッチ34,37を制御することでそのパケットを予測係数分解器35及び音声符号化データ分解器36のいずれで処理するかの制御を行う。

0052

スイッチ34はパケット受信器33の判断結果が無音から有音への変化であれば、先頭の1パケットを予測係数分解器35で処理するためにパケットデータを予測係数分解器35側に出力する。このとき、スイッチ37は予測係数分解器35で分解された予測係数を音声復号化器32に出力するために、予測係数分解器35の出力を音声復号化器32に出力する。

0053

また、スイッチ34はパケット受信器33の判断結果が有音であれば、先頭の1パケットに続くパケットを音声符号化データ分解器36で処理するためにパケットデータを音声符号化データ分解器36側に出力する。このとき、スイッチ37は音声符号化データ分解器36で分解された符号化データを音声復号化器32に出力するために、音声符号化データ分解器36の出力を音声復号化器32に出力する。

0054

図3図2の予測係数分解器35の処理動作を示す図である。図において、予測係数分解器35はパケットデータが入力されると、400bitのパケットデータを8ビット1ワードで、50次の線形予測係数へと分解して出力する。

0055

図4図2の音声符号化データ分解器36の処理動作を示す図である。図において、音声符号化データ分解器36はパケットデータが入力されると、最上位ビットから形状コードブック7ビット及び利得コードブック3ビットを1ベクトルのデータとして分解し、入力されたパケットを1パケット40ベクトル分のITU−T勧告G.728のLD−CELP音声符号化方式における音声CODC符号化データとして分解する。

0056

図5図1の音声符号化装置2の処理動作を示すタイミングチャートであり、図6図1の音声復号化装置3の処理動作を示すタイミングチャートであり、図7図1の音声符号化装置2において遅延を行わない時の処理動作を示すタイミングチャートである。これら図5図7を用いて音声符号化装置2における遅延処理について説明する。

0057

ITU−T勧告G.728のLD−CELP音声符号化方式においては、音声符号化器21で2.5ms毎に線形予測係数が演算され、その演算結果によって音声符号化器21内の線形予測係数が更新される。すなわち、送信予測係数メモリ23の内容も2.5ms毎に更新されることとなる。音声符号化器21及び音声復号化器32では2.5ms毎に更新される最新の線形予測係数を用いて音声符号化処理及び音声復号化処理が行われる。

0058

例えば、図5における音声符号化器21の動作では線形予測係数演算t1〜t15の時点で入力PCM音声A〜Oに対する線形予測係数a〜oが演算されて更新される。このとき、音声符号化器21では夫々線形予測係数a〜oを用いて入力PCM音声A〜Oに対する音声符号化処理が行われる。

0059

したがって、音声符号化器21から遅延回路24に音声符号化データA〜Oが出力されるとともに、音声符号化器21から送信予測係数メモリ23に線形予測係数a〜oが出力される。

0060

線形予測係数演算t8の時点で音声検出器22が無音から有音への変化を検出し、線形予測係数演算t13の時点まで音声検出器22が有音を検出すると、送信回路25は有音パケットの先頭の1パケットとして線形予測係数hを出力し、それに続けて音声符号化データH〜Lの有音パケットを出力する。

0061

音声復号化装置3ではそれらのパケットを受取ると、図6に示すように、音声復号化器32において有音パケットの先頭の1パケットから分解した線形予測係数hで線形予測計数更新処理を行い、それに続く有音パケットから分解した音声符号化データH〜Lの復号化を行う。

0062

これに対し、音声符号化装置2で符号化データの遅延を行わない場合、図7に示すように、音声符号化装置2側から出力されるパケットデータとしては線形予測係数演算t8の時点で更新された送信予測係数メモリ23からの線形予測係数hと、線形予測係数演算t9以降の時点の音声符号化データI〜Mとが音声復号化装置3側に伝送されることとなる。

0063

本来、音声復号化装置3側の内部状態を音声符号化装置2側の内部状態に一致させるためには、線形予測演算t8の線形予測係数hであれば、音声符号化器21で符号化された音声符号化データHに対して復号化処理を行い、線形予測演算t9の線形予測係数iであれば、音声符号化器21で符号化された音声符号化データIに対して復号化処理を行うべきである。

0064

しかしながら、音声符号化装置2から音声復号化装置3に線形予測係数hと音声符号化データI〜Mとが伝送されるので、音声復号化装置3では線形予測係数hを用いて音声符号化データIの復号化処理を行わなければならないという不都合が生ずる。

0065

この不都合は、音声符号化装置2において遅延回路24で音声符号化データH〜Lを、送信予測係数メモリ23での更新時間(線形予測係数の更新時間)分遅延することで、解決することができる。

0066

このように、電話帯域の音声信号の有音区間のみを符号化しかつその符号化データをパケット化して伝送路に出力する音声符号化装置2と、相手先からのパケットデータを復号化して有音区間の再生音声信号を出力する音声復号化装置3とを含む音声パケット伝送システム1において、音声検出器22が無音から有音への変化を検出した時に有音パケットの先頭の1パケットとして送信予測係数メモリ23の最新の線形予測係数を送信回路25から音声復号化装置3に伝送し、その有音パケットに続けて遅延回路24で遅延された音声符号化器21からの音声符号化データを有音パケットとして送信回路25から音声復号化装置3に伝送し、送信回路25から伝送されてきた線形予測係数を基に、それに続けて伝送されてきた音声符号化データを音声復号化器32で復号化することによって、有音パケット先頭の線形予測係数を用いて音声符号化器21の内部状態と音声復号化器32の内部状態とを一致させることができる。よって、遅延の増加や有音率の低下を伴うことなく、話頭の音声品質劣化や異音の発生を防ぐことができる。

発明の効果

0067

以上説明したように本発明によれば、電話帯域の音声信号の有音区間のみを符号化しかつその符号化データをパケット化して伝送路に出力する音声符号化装置と、相手先からのパケットデータを復号化して有音区間の再生音声信号を出力する音声復号化装置とを含む音声パケット伝送システムにおいて、無音から有音への変化が検出された時に有音パケットの先頭の1パケットとして最新の線形予測係数を音声復号化装置に伝送し、その有音パケットに続けて遅延された音声符号化データを有音パケットとして音声復号化装置に伝送し、音声復号化装置において伝送されてきた線形予測係数を基に、それに続けて伝送されてきた音声符号化データを復号化することによって、遅延の増加や有音率の低下を伴うことなく、話頭の音声品質劣化や異音の発生を防ぐことができるという効果がある。

図面の簡単な説明

0068

図1本発明の一実施例の構成を示すブロック図である。
図2図1の受信回路の構成を示すブロック図である。
図3図2の予測係数分解器の処理動作を示す図である。
図4図2の音声符号化データ分解器の処理動作を示す図である。
図5図1の音声符号化装置の処理動作を示すタイミングチャートである。
図6図1の音声復号化装置の処理動作を示すタイミングチャートである。
図7図1の音声符号化装置において遅延を行わない時の処理動作を示すタイミングチャートである。

--

0069

1音声パケット伝送システム
2音声符号化装置
3音声復号化装置
21音声符号化器
22音声検出器
23 送信予測係数メモリ
24遅延回路
25送信回路
31受信回路
32音声復号化器
33パケット受信器
34,37 スイッチ
35 予測係数分解器
36音声符号化データ分解器

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ