図面 (/)

技術 適応性のある動き精度をもった動き推定方法

出願人 シャープ株式会社
発明者 ジョディーリバスジャンドンシェン
出願日 2000年7月24日 (20年5ヶ月経過) 出願番号 2000-256484
公開日 2001年7月10日 (19年5ヶ月経過) 公開番号 2001-189934
状態 特許登録済
技術分野 TV信号の圧縮,符号化方式 TV信号の圧縮,符号化方式 圧縮、伸長・符号変換及びデコーダ
主要キーワード 同一精度 歪み判定 フレーム層 精度モード 解像度グリッド 部分最適化 凸曲線 使用性能
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2001年7月10日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (19)

課題

計算量の増加が少ない高画素精度動きベクトルの計算技法を含む適応性のある動き精度をもった動き推定方法を提供する。

解決手段

1つの技法は、最適動きベクトルスマートに探索する部分画素空間におけるファストサーチ戦略を用いる。別の技法は、異なる段階で異なる補間フィルタを用い高精度動きベクトルを推定して、計算の複雑さを軽減する。他の技法は、異なる動き精度に従って適応するレートひずみ判定基準を用いて最適の動きベクトルと最適の動き精度の両方を決定する。さらに他の技法は、関連動ベクトル精度に従い異なる符号化単位において異なって解釈されるVLCテーブルを使用する。

概要

背景

従来の動き推定方法において、符号化する現フレームを、“マクロブロック”と称する、例えば16×16ピクセル同一サイズ画像ブロックに分割する。各現マクロブロック毎に、符号化器は、現マクロブロックに最も一致する、前に符号化されたフレーム(“参照フレーム”)内ブロックサーチする。1個の現マクロブロックと参照フレーム内の最も一致するマクロブロック間の座標移動量は、マクロブロックの2次元ベクトル(“動きベクトル”)によって表現される。動きベクトルの各成分は画素単位で測定される。

例えば、現マクロブロックに最も一致する参照マクロブロックが同一位置にある場合、静止背景画像が代表的な例であるように、現マクロブロックの動きベクトルは(0,0)である。最も一致する参照マクロブロックが、現マクロブロックの座標から右に2画素及び上に3画素の位置で発見された場合の動きベクトルは(2,3)である。かような動きベクトルは、水平成分X及び垂直成分Yが整数画素値を有しているので、整数画素(又は“整数ペル”又は“完全ペル”)の精度を有すると云う。図1において、ベクトルV1=(1,1)は、任意の現マクロブロックに対する完全ペルの動きベクトルを表わしている。

動画シーン中の移動オブジェクトは、しかしながら、フレームからフレームへ整数画素増分単位では移動しない。真の動きは、X及びY方向に沿った実数値を取る。従って、現マクロブロックにより良く一致する参照マクロブロックは、前フレームをN×Nの因子ファクタ)で補間し、次に補間したフレーム内の最も一致するマクロブロックをサーチすることにより発見できることがよくある。動きベクトルはXとYに沿って1/N画素の増分値を取ることができ、1/N画素(又は1/Nペル)の精度を有すると表現される。

ITU電気通信標準化部門の“H.26L規格に対する提案呼びかけへの応答(Response to Call for Proposals for H.26L)”(Q.15/SG16,文書Q15−F−11,ソウル,1998年11月)及びITU電気通信標準化部門の“H.26L規格に対するTelenorの提案の強化(Enhancement of theTelenor Proposal for H.26L)”(Q.15/SG16,文書Q15−G−25,モントレー,1999年2月)において、Gisle Bjoitegaardは、動画符号化規格H.26L(“Telenor符号化器”)に関し1/3ペル精度の動きベクトルと立方体補間法の使用を提案した。これを実施するために、Telenor符号化器は、立方体状補間フィルタを用いて参照フレームを3×3補間するか又は“アップサンプリング”する。この補間バージョンは、参照フレームの9倍のメモリを必要とする。1個の与えられたマクロブロックにおいて、Telenor符号化器は最適動きベクトルを2つのステップ推定する。即ち、符号化器は、先ず最適な整数ペルベクトルを探索し、次にV1に近い最適な1/3画素精度のベクトルV1/3を探索する。図1の例では、3×3補間参照フレーム内の(16×16画素)の全8ブロックを調べ、図示のように動きベクトルV1/3=(VX,VY)=(1+1/3,1)に関連するブロックである最も一致するブロックを見つけ出す。このTelenor符号化器は、幾つかの問題を有している。先ず、1/3ペル精度の動きベクトルを計算するために部分最適なファストサーチ戦略と複雑な立方体フィルタを(全段階において)使用することである。結果として、計算した動きベクトルは、最適ではなく、莫大な記憶容量と計算量を要し非常に高価につく。さらに、このTelenor符号化器は、1/3画素に固定した有効レー歪み判定基準による精度を用い、そのために、より良い動き精度を選択するようには適応できない。同様に、このTelenor符号化器の可変長符号(“VLC”)テーブルは、1/3画素に固定した精度を有しているので、異なる精度に対して適応できず異なる解釈ができない。

最も良く知られている動画圧縮方法では、1/2画素精度で動きベクトルを推定して符号化するが、その理由は、従前の研究によれば、より高い又はより適応性を有する動き精度では計算が複雑になるだけで追加の圧縮利得が得られないことを示唆していたからである。しかしながら、これらの従前の研究は、最適化レート歪み判定基準を用いて動きベクトルを推定しておらず、計算の複雑化を減少させるためにかような基準の凸状特性を利用しておらず、動きベクトルと動きベクトルの精度を符号化する有効な戦略を用いていなかった。

かような従前の研究の1つとして、Bernd Girodの論文(以後Girodの論文と略記する)“分数ペル精度による動き補償予測(Motion-Compensating Prediction with Fractional-Pel Accuracy)”(IEE通信会報,第41巻4号,604−612頁,1993年4月)が挙げられる。このGirodの論文は、動画符号化に部分画素サブピクセル)の動き精度を用いる利点に関する最初の基本的な分析である。Girodは、部分画素空間における最適動きベクトルを探索するために簡単な階層戦略を用いた。彼はまた所与の精度に対する最適な動きベクトルを選択するために単純平均絶対差分(“MAD”)の基準を用いた。この最適精度は、理想化された仮定基くために非実用的な公式を用いて選択され、非常に複雑であり、また、全ての動きベクトルは1フレーム内の同一精度を持つものに制限される。最後に、Girodは、予測誤差エネルギーにのみ注目し、動きベクトルを符号化するためのビット使用法には言及しなかった。

他の従前の研究として、Smita Gupta及びAllen Gershoの論文(以後“Guptaの論文”と略記する)“分数画素の動き推定(On Fractional Pixel Motion Estimation)”(SPIEVCIP会報,2094巻408−419頁,ケンブリッジ,1993年11月)が挙げられる。このGuptaの論文は、動画圧縮のために部分画素精度で動きベクトルを計算し選択して符号化する方法を提示している。Guptaの論文は、平均自乗誤差(“MSE”)と双線形補間に基づく公式を開示し、この公式を用いて理想的な動きベクトルを見つけ出し、かようなベクトルを所望の動き精度に量子化した。所与の精度に対する、この最適な動きベクトルは、部分最適MSE判定基準を用いて決定され、この最適精度は歪みビット当たりエネルギー差を最大限減少させる方法を用いて選択された。これは、望された(部分最適な)判定基準である。所与の動きベクトルの符号化は、最初に1/2ペル精度で符号化し、次に詳細化ビットでより高精度に符号化する方法で行われた。粗から微細への符号化は、かなりのビットを必要とするきらいがある。

論文“ブロックに基づく動き補償動画符号化器の場合の最適動きベクトル精度(On the Optimal Motion Vector Accuracy for Block-Based Motion-Compensated Video Coders)”(IST/SPIEディジタル動画圧縮会報:アルゴリズムと技術,302−314頁,サンジョセ,1996年2月)(以後、Ribasの論文と略記する)において、Jordi Ribas−Corbera及びDavid L. Neuhoffは、動き精度のビットレートへの影響をモデル化し、ビットレートを最小にする最適精度を推定する幾つかの方法を提案した。このRibasの論文は、任意精度に対する動きベクトルを計算するためのフルサーチ方法を記述し、双線形補間のみを考慮した。最適な動きベクトルはMSEを最小にすることにより発見し、最適精度はレート歪みの最適化により導出された幾つかの公式を用いて選択した。動きベクトルと精度は、リアルタイム装置には実装が難しい、複雑なフレーム適応エントロピー符号化器を用いて符号化した。

論文“より高いビットレートでの予測強化に関する新しいコア実験の提案(Proposal for a new core experiment on Prediction enhancement at higher bitrates)”(ISO/IECJTC1/SC29/WG11動画及び音声の符号化、MPEG97/1827,セビリア,1997年2月)及び“1/4ペル動き補償のための複雑さを軽減した実装装置性能評価(Performance Evaluatior of a Reduced Complexity Implemetatior for Quarter Pel Motion Compensatior)”(ISO/IEC JTC1/SC29/WG11動画及び音声の符号化,MPEG97/3146,サンジョセ、1998年1月)において、Urich Benzler は、動画シーケンスのために1/4ペル精度の動きベクトルの使用と、MPEG4動画符号化基準のさらに進んだ補間フィルタの使用を提案した。しかしながら、Benzlerは、1/4ペルの動きベクトルの発見にGirodのファストサーチ技法を用いた。Benzlerは、異なる補間フィルタを考慮しなかったが、第1段階で複合フィルタを使用して第2段階でより簡単なフィルタを使用することを提案し、一度に1つのマクロブロックを補間した。この方法は、多量のキャッシュメモリは必要としないが、複雑であり、全ての動きベクトルを1つのマクロブロック内の全ての可能なモード(例えば、16×16,4−8×8,16−4×4等)につき1/4ペル精度で計算して最適のモードを決定するために、計算量が多大である。BenzlerはMAD判定基準を使用して、全シーケンスに対し1/4ペル精度に固定した最適な動きベクトルを発見した。従って、最適な動き精度を選択する方法は示さなかった。最後に、Benzlerは、1/2及び1/4画素精度のベクトルを符号化するために使用可能な可変長符号(“VLC”)テーブルを用いて動きベクトルを符号化した。

概要

計算量の増加が少ない高画素精度の動きベクトルの計算技法を含む適応性のある動き精度をもった動き推定方法を提供する。

1つの技法は、最適動きベクトルをスマートに探索する部分画素空間におけるファストサーチ戦略を用いる。別の技法は、異なる段階で異なる補間フィルタを用い高精度動きベクトルを推定して、計算の複雑さを軽減する。他の技法は、異なる動き精度に従って適応するレートひずみ判定基準を用いて最適の動きベクトルと最適の動き精度の両方を決定する。さらに他の技法は、関連動ベクトル精度に従い異なる符号化単位において異なって解釈されるVLCテーブルを使用する。

目的

効果

実績

技術文献被引用数
1件
牽制数
9件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

1つのマクロブロックに対する最適な動きベクトルを見つけ出すことにより、動き補償動画符号化における動きベクトルを推定するための、ファストサーチ適応性のある動き精度をもったサーチ方法であって、(a)最適動きベクトルV2を見つけ出すために、部分画素解像度グリッド上でV1を中心とする予め定められた正方形範囲内の動きベクトル候補の第1セットをサーチするステップと、(b) 最適動きベクトルV3を見つけ出すために、部分画素解像度グリッド上でV2を中心とする予め定められた正方形範囲内の動きベクトル候補の第2セットをサーチするステップと、(c) 前記マクロブロックの前記最適な動きベクトルを見つけ出すために、部分画素解像度グリッド上でV3を中心とする予め定められた正方形範囲内の動きベクトル候補の第3セットをサーチするステップとを含んで成ることを特徴とする動きベクトルを推定するためのファストサーチ適応性のある動き精度をもったサーチ方法。

請求項2

最適動きベクトルV2を見つけ出すために、部分画素解像度グリッド上でV1を中心とする予め定められた正方形範囲内の第1セットの動きベクトル候補をサーチする前記ステップは、最適動きベクトルV2を見つけ出すために、1/2画素解像度グリッド上でV1を中心とする正方形範囲1内の8個の動きベクトル候補の第1セットをサーチするステップをさらに含むことを特徴とする請求項1に記載の動きベクトルを推定するためのファストサーチ適応性のある動き精度をもったサーチ方法。

請求項3

最適動きベクトルV3を見つけ出すために、部分画素解像度グリッド上でV2を中心とする予め定められた正方形範囲内の第2セットの動きベクトル候補をサーチする前記ステップは、最適動きベクトルV3を見つけ出すために、1/6画素解像度グリッド上でV2を中心とする正方形範囲1内の8個の動きベクトル候補の第2セットをサーチするステップをさらに含むことを特徴とする請求項1に記載の動きベクトルを推定するためのファストサーチ適応性のある動き精度をもったサーチ方法。

請求項4

V2が最小レート歪みコストを有する場合に前記ブロックに対する動きベクトルとしてV2を使用するステップと、請求項1のステップ(c)をスキップするステップとをさらに含むことを特徴とする請求項1に記載の動きベクトルを推定するためのファストサーチ適応性のある動き精度をもったサーチ方法。

請求項5

前記マクロブロックの前記最適な動きベクトルを見つけ出すために、部分画素解像度グリッド上でV3を中心とする予め定められた正方形範囲内の第3セットの動きベクトル候補をサーチする前記ステップは、前記マクロブロックの前記最適な動きベクトルを見つけ出すために、1/6画素解像度グリッド上でV3を中心とする正方形範囲1内の8個の動きベクトル候補の第3セットをサーチするステップをさらに含むことを特徴とする請求項1に記載の動きベクトルを推定するためのファストサーチ適応性のある動き精度をもったサーチ方法。

請求項6

前記マクロブロックの前記最適な動きベクトルを見つけ出すために、部分画素解像度グリッド上でV3を中心とする予め定められた正方形範囲内の第3セットの動きベクトル候補をサーチする前記ステップは、前記第3セットの動きベクトル候補中の既にテスト済みの候補をスキップするステップをさらに含むことを特徴とする請求項1に記載の動きベクトルを推定するためのファストサーチ適応性のある動き精度をもったサーチ方法。

請求項7

前記第1セットの動きベクトル候補をサーチする前記ステップは、第1の補間を行うために第1のフィルタを使用して前記第1セットの動きベクトル候補をサーチするステップをさらに含み、前記第2セットの動きベクトル候補をサーチする前記ステップは、第2の補間を行うために第2のフィルタを使用して前記第2セットの動きベクトル候補をサーチするステップをさらに含み、前記第3セットの動きベクトル候補をサーチする前記ステップは、第3の補間を行うために第3のフィルタを使用して前記第3セットの動きベクトル候補をサーチするステップをさらに含むことを特徴とする請求項1に記載の動きベクトルを推定するためのファストサーチ適応性のある動き精度をもったサーチ方法。

請求項8

最適動きベクトルV3を見つけ出すために、部分画素解像度グリッド上でV2を中心とする予め定められた正方形範囲内の第2セットの動きベクトル候補をサーチする前記ステップは、(a) V2が中心にある場合、1/3ペル精度の3候補V2と次に最低のRDコストをもつ1/2ペル位置をサーチするステップと、(b) V2がコーナーベクトルである場合は、V2に最も近い1/3ペル精度の4ベクトル候補をサーチするステップと、(c) V2が2つのコーナーベクトル間にある場合は、2つのコーナーの中のより低いRDコストをもつコーナーを決定し、より低いRDコストを持つ前記コーナーとの間のラインに最も近い1/3ペル精度の4ベクトル候補をサーチするステップとをさらに含むことを特徴とする請求項1に記載の動きベクトルを推定するためのファストサーチ適応性のある動き精度をもったサーチ方法。

請求項9

1つのマクロブロックに対する最適な動きベクトルを見つけ出すことにより、動き補償動画符号化における動きベクトルを推定するための、適応性のある動き精度をもったサーチ方法であって、(a) 第1補間を行うための第1フィルタを用いて、最適動きベクトルV2を見つけ出すために、V1を中心とするグリッド内の第1セットの動きベクトル候補をサーチするステップと、(b) 第2補間を行うための第2フィルタを用いて、最適動きベクトルV3を見つけ出すために、V2を中心とするグリッド内の第2セットの動きベクトル候補をサーチするステップと、(c) 第3補間を行うための第3フィルタを用いて、前記マクロブロックの前記最適な動きベクトルを見つけ出すために、V3に中心を有するグリッド内の第3セットの動きベクトル候補をサーチするステップとを含んで成ることを特徴とする動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項10

第1補間を行うための第1フィルタを用いてサーチする前記ステップは、粗い補間を行うための簡単なフィルタの使用をさらに含むことを特徴とする請求項9に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項11

第1補間を行うための第1フィルタを用いてサーチする前記ステップは、粗い補間を行うための簡単なフィルタの使用をさらに含み、第2補間を行うための第2フィルタを用いてサーチする前記ステップは、細かい補間を行うための複合フィルタの使用をさらに含むことを特徴とする請求項9に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項12

第3補間を行うための第3フィルタを用いてサーチする前記ステップは、細かい補間を行うための複合フィルタの使用をさらに含むことを特徴とする請求項11に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項13

第1補間を行うための第1フィルタを用いてサーチする前記ステップは、2×2の参照フレームを補間するための双線形フィルタの使用をさらに含むことを特徴とする請求項9に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項14

第1補間を行うための第1フィルタを用いてサーチする前記ステップは、2×2の参照フレームを補間するために双線形フィルタの使用をさらに含み、第2補間を行うための第2フィルタを用いてサーチする前記ステップは、細かい補間を行うための立方体フィルタの使用をさらに含むことを特徴とする請求項9に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項15

第3補間を行うための第3フィルタを用いてサーチする前記ステップは、細かい補間を行うための立方体フィルタの使用をさらに含むことを特徴とする請求項14に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項16

1つのマクロブロックに対する最適な動きベクトルを見つけ出すことにより、動き補償動画符号化における動きベクトルを推定するための、適応性のある動き精度をもったサーチ方法において、(a) 前記マクロブロックの第1の最適動きベクトルに対する第1の動き精度をサーチするステップと、(b) 前記第1の最適動きベクトルと前記第1の動き精度を符号化するステップと(c) 少なくとも1つの第2の動き精度で前記マクロブロックの少なくとも1つの第2の最適動きベクトルをサーチするステップと、(d) 前記少なくとも1つの第2の最適動きベクトルと、前記少なくとも1つの第2の動き精度とを符号化するステップと、(e) 前記第1と少なくとも1つの最適動きベクトルの中から前記最適な動きベクトルをレー歪み判定基準を用いて選択するステップとを含んで成ることを特徴とする動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項17

レート歪み判定基準を用いて前記最適な動きベクトル選択する前記ステップは、前記最適動きベクトルと前記最適動き精度の両方を決定するために異なる動き精度に従って前記レート歪み判定基準を適応させるステップをさらに含むことを特徴とする請求項16に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項18

少なくとも1つの第2の動き精度で少なくとも1つの第2の最適動きベクトルをサーチする前記ステップは、前記第1の動き精度より細かい少なくとも1つの第2の動き精度で、少なくとも1つの第2の最適動きベクトルをサーチするステップをさらに含むことを特徴とする請求項16に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項19

レート歪み判定基準を用いて前記最適な動きベクトル選択する前記ステップは、前記最適な動きベクトルを選択するために“歪み+L×ビット”型のレート歪み判定基準を使用するステップをさらに含むことを特徴とする請求項16に記載の動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項20

1つのマクロブロックに対する最適な動きベクトルを見つけ出すことにより、動き補償動画符号化における動きベクトルを推定するための適応性のある動き精度をもったサーチ方法であって、(a) 前記マクロブロックの1つの最適動きベクトルに対する1つの動き精度をサーチするステップと、(b) 関連する動きベクトル精度により異なる符号化単位において異なって解釈された可変長符号(VLC)テーブルからのコードを用いて、前記動き精度を符号化するステップと(c) 個々の精度空間において前記最適な動きベクトルを符号化するステップとを含んで成ることを特徴とする動きベクトルを推定するための適応性のある動き精度をもったサーチ方法。

請求項21

1つのマクロブロックに対する1つの最適な動きベクトルを見つけ出すことにより、動き補償動画符号化における動きベクトルを推定するためのシステムであって、(a)最適動きベクトルV2を見つけ出すために、部分画素解像度グリッド上でV1を中心とする予め定められた正方形範囲内の第1セットの動きベクトル候補をサーチするための第1符号化器と、(b) 最適動きベクトルV3を見つけ出すために、部分画素解像度グリッド上でV2を中心とする予め定められた正方形範囲内の第2セットの動きベクトル候補をサーチするための第2符号化器と、(c) 前記マクロブロックの前記最適な動きベクトルを見つけ出すために、部分画素解像度グリッド上でV3を中心とする予め定められた正方形範囲内の第3セットの動きベクトル候補をサーチするための第3符号化器とを含んで成ることを特徴とする動きベクトルを推定するためのシステム。

請求項22

前記第1符号化器,第2符号化器および第3符号化器が単一の符号化器であることを特徴とする請求項21に記載の動きベクトルを推定するためのシステム。

技術分野

0001

本発明は、ディジタル動画ビット圧縮又は符号化方法に関し、特に、動き補償動画符号化における動きベクトル推定して符号化する効果的な方法に関する。

背景技術

0002

従来の動き推定方法において、符号化する現フレームを、“マクロブロック”と称する、例えば16×16ピクセル同一サイズ画像ブロックに分割する。各現マクロブロック毎に、符号化器は、現マクロブロックに最も一致する、前に符号化されたフレーム(“参照フレーム”)内ブロックサーチする。1個の現マクロブロックと参照フレーム内の最も一致するマクロブロック間の座標移動量は、マクロブロックの2次元ベクトル(“動きベクトル”)によって表現される。動きベクトルの各成分は画素単位で測定される。

0003

例えば、現マクロブロックに最も一致する参照マクロブロックが同一位置にある場合、静止背景画像が代表的な例であるように、現マクロブロックの動きベクトルは(0,0)である。最も一致する参照マクロブロックが、現マクロブロックの座標から右に2画素及び上に3画素の位置で発見された場合の動きベクトルは(2,3)である。かような動きベクトルは、水平成分X及び垂直成分Yが整数画素値を有しているので、整数画素(又は“整数ペル”又は“完全ペル”)の精度を有すると云う。図1において、ベクトルV1=(1,1)は、任意の現マクロブロックに対する完全ペルの動きベクトルを表わしている。

0004

動画シーン中の移動オブジェクトは、しかしながら、フレームからフレームへ整数画素増分単位では移動しない。真の動きは、X及びY方向に沿った実数値を取る。従って、現マクロブロックにより良く一致する参照マクロブロックは、前フレームをN×Nの因子ファクタ)で補間し、次に補間したフレーム内の最も一致するマクロブロックをサーチすることにより発見できることがよくある。動きベクトルはXとYに沿って1/N画素の増分値を取ることができ、1/N画素(又は1/Nペル)の精度を有すると表現される。

0005

ITU電気通信標準化部門の“H.26L規格に対する提案呼びかけへの応答(Response to Call for Proposals for H.26L)”(Q.15/SG16,文書Q15−F−11,ソウル,1998年11月)及びITU電気通信標準化部門の“H.26L規格に対するTelenorの提案の強化(Enhancement of theTelenor Proposal for H.26L)”(Q.15/SG16,文書Q15−G−25,モントレー,1999年2月)において、Gisle Bjoitegaardは、動画符号化規格H.26L(“Telenor符号化器”)に関し1/3ペル精度の動きベクトルと立方体補間法の使用を提案した。これを実施するために、Telenor符号化器は、立方体状補間フィルタを用いて参照フレームを3×3補間するか又は“アップサンプリング”する。この補間バージョンは、参照フレームの9倍のメモリを必要とする。1個の与えられたマクロブロックにおいて、Telenor符号化器は最適動きベクトルを2つのステップで推定する。即ち、符号化器は、先ず最適な整数ペルベクトルを探索し、次にV1に近い最適な1/3画素精度のベクトルV1/3を探索する。図1の例では、3×3補間参照フレーム内の(16×16画素)の全8ブロックを調べ、図示のように動きベクトルV1/3=(VX,VY)=(1+1/3,1)に関連するブロックである最も一致するブロックを見つけ出す。このTelenor符号化器は、幾つかの問題を有している。先ず、1/3ペル精度の動きベクトルを計算するために部分最適なファストサーチ戦略と複雑な立方体フィルタを(全段階において)使用することである。結果として、計算した動きベクトルは、最適ではなく、莫大な記憶容量と計算量を要し非常に高価につく。さらに、このTelenor符号化器は、1/3画素に固定した有効レー歪み判定基準による精度を用い、そのために、より良い動き精度を選択するようには適応できない。同様に、このTelenor符号化器の可変長符号(“VLC”)テーブルは、1/3画素に固定した精度を有しているので、異なる精度に対して適応できず異なる解釈ができない。

0006

最も良く知られている動画圧縮方法では、1/2画素精度で動きベクトルを推定して符号化するが、その理由は、従前の研究によれば、より高い又はより適応性を有する動き精度では計算が複雑になるだけで追加の圧縮利得が得られないことを示唆していたからである。しかしながら、これらの従前の研究は、最適化レート歪み判定基準を用いて動きベクトルを推定しておらず、計算の複雑化を減少させるためにかような基準の凸状特性を利用しておらず、動きベクトルと動きベクトルの精度を符号化する有効な戦略を用いていなかった。

0007

かような従前の研究の1つとして、Bernd Girodの論文(以後Girodの論文と略記する)“分数ペル精度による動き補償予測(Motion-Compensating Prediction with Fractional-Pel Accuracy)”(IEE通信会報,第41巻4号,604−612頁,1993年4月)が挙げられる。このGirodの論文は、動画符号化に部分画素サブピクセル)の動き精度を用いる利点に関する最初の基本的な分析である。Girodは、部分画素空間における最適動きベクトルを探索するために簡単な階層戦略を用いた。彼はまた所与の精度に対する最適な動きベクトルを選択するために単純平均絶対差分(“MAD”)の基準を用いた。この最適精度は、理想化された仮定基くために非実用的な公式を用いて選択され、非常に複雑であり、また、全ての動きベクトルは1フレーム内の同一精度を持つものに制限される。最後に、Girodは、予測誤差エネルギーにのみ注目し、動きベクトルを符号化するためのビット使用法には言及しなかった。

0008

他の従前の研究として、Smita Gupta及びAllen Gershoの論文(以後“Guptaの論文”と略記する)“分数画素の動き推定(On Fractional Pixel Motion Estimation)”(SPIEVCIP会報,2094巻408−419頁,ケンブリッジ,1993年11月)が挙げられる。このGuptaの論文は、動画圧縮のために部分画素精度で動きベクトルを計算し選択して符号化する方法を提示している。Guptaの論文は、平均自乗誤差(“MSE”)と双線形補間に基づく公式を開示し、この公式を用いて理想的な動きベクトルを見つけ出し、かようなベクトルを所望の動き精度に量子化した。所与の精度に対する、この最適な動きベクトルは、部分最適MSE判定基準を用いて決定され、この最適精度は歪みビット当たりエネルギー差を最大限減少させる方法を用いて選択された。これは、望された(部分最適な)判定基準である。所与の動きベクトルの符号化は、最初に1/2ペル精度で符号化し、次に詳細化ビットでより高精度に符号化する方法で行われた。粗から微細への符号化は、かなりのビットを必要とするきらいがある。

0009

論文“ブロックに基づく動き補償動画符号化器の場合の最適動きベクトル精度(On the Optimal Motion Vector Accuracy for Block-Based Motion-Compensated Video Coders)”(IST/SPIEディジタル動画の圧縮会報:アルゴリズムと技術,302−314頁,サンジョセ,1996年2月)(以後、Ribasの論文と略記する)において、Jordi Ribas−Corbera及びDavid L. Neuhoffは、動き精度のビットレートへの影響をモデル化し、ビットレートを最小にする最適精度を推定する幾つかの方法を提案した。このRibasの論文は、任意精度に対する動きベクトルを計算するためのフルサーチ方法を記述し、双線形補間のみを考慮した。最適な動きベクトルはMSEを最小にすることにより発見し、最適精度はレート歪みの最適化により導出された幾つかの公式を用いて選択した。動きベクトルと精度は、リアルタイム装置には実装が難しい、複雑なフレーム適応エントロピー符号化器を用いて符号化した。

0010

論文“より高いビットレートでの予測強化に関する新しいコア実験の提案(Proposal for a new core experiment on Prediction enhancement at higher bitrates)”(ISO/IECJTC1/SC29/WG11動画及び音声の符号化、MPEG97/1827,セビリア,1997年2月)及び“1/4ペル動き補償のための複雑さを軽減した実装装置性能評価(Performance Evaluatior of a Reduced Complexity Implemetatior for Quarter Pel Motion Compensatior)”(ISO/IEC JTC1/SC29/WG11動画及び音声の符号化,MPEG97/3146,サンジョセ、1998年1月)において、Urich Benzler は、動画シーケンスのために1/4ペル精度の動きベクトルの使用と、MPEG4動画符号化基準のさらに進んだ補間フィルタの使用を提案した。しかしながら、Benzlerは、1/4ペルの動きベクトルの発見にGirodのファストサーチ技法を用いた。Benzlerは、異なる補間フィルタを考慮しなかったが、第1段階で複合フィルタを使用して第2段階でより簡単なフィルタを使用することを提案し、一度に1つのマクロブロックを補間した。この方法は、多量のキャッシュメモリは必要としないが、複雑であり、全ての動きベクトルを1つのマクロブロック内の全ての可能なモード(例えば、16×16,4−8×8,16−4×4等)につき1/4ペル精度で計算して最適のモードを決定するために、計算量が多大である。BenzlerはMAD判定基準を使用して、全シーケンスに対し1/4ペル精度に固定した最適な動きベクトルを発見した。従って、最適な動き精度を選択する方法は示さなかった。最後に、Benzlerは、1/2及び1/4画素精度のベクトルを符号化するために使用可能な可変長符号(“VLC”)テーブルを用いて動きベクトルを符号化した。

発明が解決しようとする課題

0011

上述の参考文献は、最適化したレート歪み基準を用いて動きベクトルを推定しておらず、かような基準の凸状特性を利用して計算の複雑さを軽減していない。さらに、これらの参考文献は、動きベクトルと精度を符号化する有効な戦略を用いていない。

課題を解決するための手段

0012

本発明の1つの実施形態は、高画素精度(“分数”又は“部分画素”精度とも称される)の動きベクトルを僅かな計算量の増加で計算することにより従来技術の問題を解決する。

0013

本発明の戦略を用いると、動画符号化器はかなりの圧縮利得(例えば、動き精度の古典的な選択に比較して30%に達するビットレートの削減)を同等の計算レベルで達成できることが、実験により明らかになっている。動き精度に適応して計算し選択するので、本発明は適応動き精度(“AMA”)方式として記述できる。

0014

本発明の好ましい実施形態の1つは、部分画素(サブピクセル)空間におけるファストサーチ戦略を用いて最適な動きベクトルをスマートにサーチする。この技法は、1マクロブロックに対する最適な動きベクトルを発見することにより、動き補償動画符号化時の動きベクトルを推定する。第1ステップは、V1に中心をもつ予め定められた正方形範囲の部分画素解像度グリッド内で、第1セットの動きベクトル候補をサーチして最適な動きベクトルV2を見つけ出す。次に、V2に中心をもつ予め定められた正方形範囲の部分画素解像度をもつグリッド内で、第2セットの動きベクトル候補を探索して最適な動きベクトルV3を見つけ出す。その後、V3に中心をもつ予め定められた正方形範囲の部分画素解像度をもつグリッド内で、第3セットの動きベクトル候補を探索してマクロブロックの最適動きベクトルを見つけ出す。

0015

本発明の別の好ましい実施形態において、高精度の動きベクトル推定技法は異なる段階において異なる補間フィルタを使用して計算の複雑さを低減することができる。

0016

本発明の別の好ましい実施形態は、レート歪み(RD)に関して最適のベクトルと精度を選択する。この実施形態は、異なる動き精度に従い対応するレート歪み判定基準を用いて最適な動きベクトルと最適な動き精度の両方を決定する。

0017

本発明のさらに別の好ましい実施形態は、有効な可変長符号化(VLC)法により、動きベクトルと精度を符号化する。この技法は、異なる符号化単位で異なる解釈が可能な、関連する動きベクトル精度に従ったVLCテーブルを使用する。

0018

本発明の上述及び他の目的、特徴及び利点は、添付図面を参照し本発明の以下の詳細な説明を読めば容易に理解されよう。

発明を実施するための最良の形態

0019

本発明の諸方法は、各画像ブロックにおいて動き精度を変更して説明するが、精度を全シーケンスに対して固定又はフレーム毎に変更する場合にも適用できる。本発明は、又、発明の背景において記述したように、Telenorの動画符号化器(及び特殊にはTelenorの符号化器)を使用するものとして記述する。Telenorの動画符号化器の用語を用いて説明するが、ここに記述する技術は、任意の他の動き補償動画符号化器にも適用できる。

0020

動画符号化器の多くは、半画素(又は“1/2ペル”)精度の動きベクトルと双線形補間を用いる。Telenorの符号化器の第1バージョンは、1/2ペル動きベクトルと双線形補間を用いる。しかしながら、Telenorの符号化器の最新バージョンは、さらなる圧縮利得を得るために1/3ペルベクトルと立方体形補間機能を内蔵している。特に、1つの与えられたマクロブロックにおいて、Telenorの符号化器は、図2に示す2つのステップで最適な動きベクトルを推定する。先ず、このTelenor符号化器は、最適な整数ペルベクトルV1(図1)を探索する(ステップ100)。次に、このTelenor符号化器は、V1付近の最適な1/3ペル精度ベクトルV1/3(図1)をサーチする(ステップ102)。この第2ステップは図1グラフに示すように、3×3内挿(補間)参照フレーム内の(各々16×16の画素列を有する)全部で8個のブロックを調べて最も一致するブロックを見つけ出す。8個のブロックの動きベクトルは、V1に中心をもつグリッド中に8個の実点で表示してある。図1において、最も一致するのは、動きベクトルV1/3=(VX,VY)=(1+1/3,1)に関連するブロックである。

0021

本発明の技術によれば、符号化器は、フルサーチ戦略又はファストサーチ戦略のいずれかを用いて任意の動き精度の組(例えば、1/2, 1/3及び1/6ペル精度動きベクトル)間で精度を選択できる。

0022

(フルサーチAMA方式のサーチ戦略)図3及び図4に示すように、このフルサーチ適応動き精度(AMA)方式サーチ戦略の場合、Telenor符号化器は、図3に示す5個の画素の(上方画素数、下方画素数及び両側の画素数により規定される正方形ブロックとして定義される)“正方形範囲”と1/6画素解像度のグリッド上の全ての動きベクトル候補をサーチする。図4に示すように、フルサーチAMAの第1ステップ(104)では最適な整数ペルベクトルV1(図1)をサーチする。フルサーチAMAの第2ステップ(106)において、符号化器はV1付近の最適な1/6画素精度ベクトルV1/6(図3)をサーチする。換言すれば、このフルサーチAMAは、Telenorプロセスの第2ステップを変更して符号化器が速度空間内の他の部分画素位置における動きベクトル候補もサーチできるようにしたものである。この目的は、グリッド内の最適動きベクトル、即ち、現マクロブロックに最も一致するブロック(補間参照フレーム内)を指示するベクトルを発見することである。このフルサーチ戦略は、120個の部分画素候補をサーチするので計算は複雑ではあるが、本発明のこの実施形態の全潜在能力を示している。

0023

動きベクトルサーチにおける重要な課題は、所与のマクロブロックに最も符合するブロックを確定する判定測度又は基準の選択である。実際には、殆どの方法は、平均自乗誤差(MSE)又は平均絶対差分(MAD)の何れかの判定基準を用いている。2つのブロック間のMSEは、2つのブロックの画素値引き算して、画素値差自乗し、平均値を取る。2つのブロック間のMAD差分は、自乗計算の代わりに画素値差の絶対値を計算することを除き同様な歪み測度である。2つの画像ブロックが互いに類似であれば、MSE及びMADの値は小さい。しかしながら、画像ブロックが類似でなければ、これらの値は大きい。従って、代表的な動画符号化器は、最小のMSE又は最小のMADの何れかをもたらす動きベクトルを選択することにより、マクロブロックに最も符合するマクロブロックを見つけ出す。言い換えれば、最適動きベクトルに関連するブロックは、MSE又はMADにおいて所与のマクロブロックに最も近似のブロックである。

0024

残念ながら、MSE及びMADの歪み測度は、ベクトルを実際に符号化するビットのコストを考慮していない。例えば、1つの任意動きベクトルはMSEを最小にできるが、しかし、ビットで符号化するコストが非常に高く、符号化の観点から最適の選択でない場合があり得る。

0025

この問題を処理するために、Telenorが記述しているような最新の符号化器は、“歪み+L×ビット”形のレート歪み(RD)判定基準を使用して最適な動きベクトルを選択する。“歪み”値は、代表的にはMSE又はMADであり、“L”は圧縮レベル(即ち、量子化ステップサイズ)に依存する定数であり、“ビット”は動きベクトルの符号化に要するビット数である。一般に、このタイプのどのRD判定基準も本発明に使用できる。しかしながら、本発明の場合、“ビット”は、ベクトルの符号化に要するビットとそのベクトル精度の符号化に要するビットを含んでいる。事実、幾つかの候補が、幾つかの精度モードをもつために、若干数の“ビット”値をもち得る。例えば、位置(1/2, −1/2)に在る候補は、1/2又は1/6画素精度をもつと考えられる。

0026

(ファストサーチAMA方式サーチ戦略)図5及び図6に示すように、ファストサーチ適応動き精度(AMA)方式サーチ戦略の場合、符号化器は動きベクトル候補の小さいセットのみを調べる。ファストサーチAMAの第1ステップ(108)では、符号化器は、1/2画素解像度のグリッドにおいてV1に中心をもち一辺が1の正方形(正方形範囲1内)の8個の動きベクトル候補をチェックする。最小のRDコストを有する候補(即ち、8個の前ベクトルとV1の中で最適のもの)を表現するためにV2を設定する(110)。次に、符号化器は、1/6画素解像度のグリッド上でV2に中心をもち一辺が1の正方形内の8個の動きベクトル位置をチェックする(112)。V2が最小RDコストを有している場合(114)、符号化器は探索を中止し、V2をブロックの動きベクトルとして選択する。そうでなければ、8個の前ベクトルの中で最適のものを表現するためにV3を設定する(116)。符号化器は、次に1/6画素解像度のグリッドにおいてV3に中心をもつ正方形範囲1内の新しい動きベクトル候補をサーチする(118)。このグリッド内の幾つかの候補は既にチェック済みであり飛ばすことができることに注意すべきである。この最終ステップでは最小のRDコストをもつ候補をブロックの動きベクトルとして選択する(120)。

0027

実験データによれば、この簡単なファストサーチ戦略は、平均で(Telenor探索戦略より10個多い)部分画素空間における代表的な約18の位置のRDコストをチェックするので、従って、全体としての計算の複雑さは適度の増加に留まる。

0028

図8乃至図18に関連して以下に説明する実験結果は、このAMA方式のファストサーチバージョンを用いることによる圧縮性能損失が実際に皆無であることを示している。その理由は、このファストサーチAMA探索戦略が、RDコストが高レベルから低レベルにスマートに移行するパス創設することによって“歪み+L×ビット”曲線凸度(“歪み”は凸性であることは知られている)を活用しているからである。

0029

本発明の別の実施態様は、ステップ108−120のうちの1つ又はそれ以上を変更する。これらの実施形態も効率的であり、部分画素速度空間においてチェックする動きベクトル候補数をさらに削減している。

0030

図7の例では、1/3ペル精度の候補をチェックする。この実施例において、ステップ112は3つの可能なシナリオの1つで置き換えられる。先ず、ステップ110からの最適な動きベクトル候補がV1(“整数ペルベクトル”)の中心にあれば(130)、符号化器は中心ベクトルと次に最低のRDコストをもつ1/2ペル位置の間にある1/3ペル精度の3候補をチェックする(132)。次に、ステップ110からの最適な動きベクトル候補がコーナーのベクトルであれば(134)、符号化器はかようなコーナーベクトルに最も近い1/3ペル精度の4ベクトル候補をチェックする(136)。第3に、ステップ110からの最適な動きベクトル候補が2つのコーナーベクトルの間にあれば(138)、符号化器は2つのコーナーベクトルの中でRDコストが低い方を決定し、ステップ110からの最適な動きベクトル候補とかようなコーナーとの間の直線に最も近い1/3ペル精度の4ベクトル候補をチェックする(140)。V2が中心に無く又コーナーベクトルでも無い場合は2つのコーナー間にある筈であり、このプロセスを実行する際にステップ138は不必要になることに注意すべきである。符号化器を1/3画素精度の動きベクトルの探索に設定する場合、図7は、ステップ114への続行ではなく終了になるように変更可能である。

0031

(計算量とメモリの削減)ステップ108では1/2画素精度の動きベクトル候補のみをチェックするために、ハードウェアソフトウェアの実装に要する計算量とメモリは大幅に削減される。特に、このファストサーチのスマートな実装において、参照フレームは2×2だけ補間して1/2ペルベクトル候補に対するRDコストを得る。ハードウェア又はソフトウェア符号化器用のファスト(又はキャッシュ)メモリは、参照フレームを3×3だけ補間するために要するTelenorの方法と比較してかなりの量削減される。Telenorの符号化器と比較し、キャッシュメモリは9/4の削減又は2.25倍の削減になる。若干の追加補間はブロック単位で後で行うことができる。

0032

さらに、ステップ108における補間はRDコスト関数値下げる方向にサーチを方向づけるように用いるので、これらの補間には複合フィルタを必要としない。従って、計算量はステップ108用に簡単な双線形フィルタを用いることにより節減できる。

0033

又、マクロブロックモード(例えば、16×16,4個の8×8等)の選択のような他の主要な符号化に関する決定は、そのような決定は高精度を用いることによる有意な利益がないので、1/2ペルベクトルを用いて行うことができる。次に、符号化器は残りのステップにおいてチェックする若干の追加ベクトル候補に対して必要な部分画素値を補間するためにより複雑な立方体(3次)フィルタを使用することができる。マクロブロックモードは既に選択済みであるので、これらの最後の補間は選択モードに対し実施する必要がある。

0034

複数フィルタを使用することにより、常時立方体補間を用いるTelenorの方法と比較し、Sparc Ultra 10型ワークステーションでの稼動時間で20%を超える計算量の削減が得られた。さらに、ファストメモリの必要性は、略半分に減少した。又、圧縮性能に関しては損失は殆どなかった。このファストサーチの1実施形態での比較において、Benzler技法は、Telenor符号化器において画素当たり約70の補間を必要とするのに対し、本発明は画素当たり約7つの補間を要するのみである。

0035

(動きベクトルと精度のビット符号化)最適な動きベクトルと精度が決定されると、符号化器は動きベクトルと精度値の両方をビットで符号化する。1つの方法は、所与の精度(例えば、半画素精度)で動きベクトルを符号化し、次に、そのベクトルをより高い動き精度に詳細化するために幾つかのエクストラビットを追加する。これは、B.Girodが提案した戦略であるが、但し、レート歪みの点では部分最適化である。

0036

本発明の1つの好ましい実施形態では、1つのマクロブロックに対する動きベクトルの精度を表1に示したような簡単な符号を用いて最初に符号化する。符号長{1,2,2}の任意の他のテーブルを用いることも可能である。ビットレートは、代表的なDPCM法を用いてさらに減少させることができる。

0037

0038

次に、各々の精度空間におけるベクトル値を符号化する。これらのビットはH26Lコーディックにおいて使用されるような単一VLCテーブルの項目より得ることができる。重要なアイデアは、これらのビットはマクロブロックの動き精度によって異なって解釈されることである。例えば、動き精度が1/3であり、異なる動きベクトルのX成分に対する符号ビットが000011である場合、ベクトルのX成分はVx=2/3である。精度が1/2であれば、ベクトルのX成分はVx=1に相当する。

0039

1/2及び1/4画素精度ベクトルの符号化に使用できる可変長符号(VLC)テーブルにより動きベクトルを符号化するBenzlerの方法と比較して、本発明の方法は、任意の動き精度のベクトルを符号化するのに用いられ、テーブルは、各フレームとマクロブロックにおいて異なって解釈できる。さらに、本発明の全体的方法は、任意の動き精度に適用でき、互いに倍数であったり1/n(nは整数)型である必要はない。所与の部分画素空間における増分数は単純に計数し、テーブルの関連項目中のビットを符号として使用する。復号器の観点からは、動き精度を復号すれば動きベクトルもまた容易に復号することができる。その後、前フレーム中の関連ブロックを代表的な4タップの立方体補間器を用いて再構築する。各動き精度毎に異なる4タップフィルタが存在する。AMA方式は、予測ブロックの再構築に要する動作数は同じで、動き精度とは無関係なので、復号の複雑さを増大させることはない。

0040

(実験結果)図8乃至図18は、表2に記載の種々の動画シーケンス、解像度及びフレームレートでAMAを使用又は使用せずにTelenorの符号化コーディックを試験した結果を示している。これらの図面は、各ケース毎にレート歪み(“RD”)を作図したものである。“Anchor”曲線は、最適化H.263+(図8図9のみ)からのRD点を示している。“Telenor 1/2+b”曲線は1/2ペルベクトルと双線形補間によるTelenor(古典的な例)を示している。“Telenor1/3”曲線は、現Telenorの提案(“Telenor符号化器”)を示している。“Telenor+AMA+c”曲線は、本発明のフルサーチ戦略によるTelenor符号化器を示している。図15乃至図17に示す“Telenor+FSAMA+c”曲線は、本発明のファストサーチ戦略によるTelenor符号化器を示している。(他に規定がない限り、AMAのフルサーチバージョンは実験に使用した符号化器の戦略であった。)全ての試験結果は、符号化器と復号器においてクロスチェックを行った。これらの結果は、AMAを実施する場合、信号対雑音ノイズ)比のピーク(“PSNR”)における利得は、H26Lを超え1dBの高さであり、古典的な例よりもさらに高い。

0041

0042

動画シーケンスは、“ゆれるパリ”を除き、動画符号化共同体により共通に使用されている。後者は、よく知られているシーケンス“パリ”を、XとY成分が[−1,1]の範囲で任意の値をとる動きベクトルだけ移動させることにより得られた合成動画である。この合成動画は、代表的な動画電話シーンにおいて手持ちカメラにより生じた小さな動きをシミュレートする。

0043

(動き精度適応(AMA)方式のフルサーチ及びファストサーチの比較)図16及び17に示した実験結果は、AMAに関するファストサーチ戦略(“TelenorFSAMA+c”)とフルサーチ戦略(Telenor AMA+c“)方式の符号化器の使用性能が実際には同じであることを示している。ファストサーチ戦略は部分画素速度空間においてRDコスト曲線の凸性を利用するのでこれは間違いない。言い換えれば、RDコスト曲線の形状はなだらかな凸曲線を辿るので、その最小値は、曲線を下降させる幾つかのスマートなファストサーチスキームを用いて容易に発見できる。

0044

(AMA及び複数参照フレームの結合)図18に示すグラフにおいて、“1r”の標識をもつ曲線は、動き補償のために1枚の参照フレームのみを使用した。従って、これらの曲線は図10に示した曲線と同じである。“5r”の標識をもつ曲線は5枚の参照フレームを使用した。AMAによる利得は複数の参照フレームを使用して得た曲線に付加されることを実験は示している。参照フレーム1枚の場合のAMAによる利得は、緑とピンクの曲線(注:凡例で×と△)を比較することにより測定でき、参照フレーム5枚の場合の利得は青と赤の曲線(注:凡例で○と●)間で測定できる。

0045

特に注意すべきことは、本発明はフレームレベルで実施でき、異なるフレームは異なる動き精度を用いることができるが、1フレーム内の全ての動きベクトルには同一精度を用いることである。この実施形態において、動きベクトル精度は、フレーム層において1度だけ信号化されるのが好ましい。実験は、全フレームに対して最適な固定動き精度を用いることによっても、マクロブロック適応の場合につき提示したような圧縮利得が生じることを示している。

0046

他のフレームベースの実施形態において、符号化器は、異なるベクトル精度でフレーム全体に動き補償を行い、その後、RD判定基準に従って最適な精度を選択することができる。この方法は、パイプライン方式ワンパス符号化器には適しないが、ソフトウェアベースの符号化器又はより複雑な符号化には適用できる。他のフレームベースの実施形態において、符号化器は所与のフレームに対する最適精度を予測するために以前の統計値及び/又は公式を用いることができる(例えば、Ribasの論文に記述されている公式又はそのバージョンを使用することができる)。この方法は、性能利得は予測に用いる公式の精度に依存するが、ワンパス符号化器には適している。

0047

上述の明細書に用いた用語と表現は説明のためのものであり制限するものではなく、かような用語と表現を用いるに当たって表示及び記述の特徴又はその部分の同等の用語及び表現を排除する意図は全くなく、本発明の範囲は特許請求範囲の請求項によってのみ規定され限定されることを確認する。

図面の簡単な説明

0048

図1速度空間における完全ペル及び1/3ペルの位置の例を示す図である。
図2最適動きベクトルを推定する従来技術による方法を説明するためのフローチャート図である。
図3部分画素速度空間におけるフルサーチ時の動きベクトル候補位置の例を示す図である。
図4本発明によるフルサーチ方式の最適動きベクトル推定方法の好ましい実施態様を説明するためのフローチャート図である。
図5部分画素速度空間におけるファストサーチ時の動きベクトル候補位置の例を示す図である。
図6本発明によるファストサーチ方式の最適動きベクトル推定方法の好ましい実施形態を説明するためのフローチャート図である。
図7図6のステップ114の別の好ましい実施形態を説明するためのフローチャート図である。
図8動画シーケンス“コンテナ”において毎秒10フレームのフレームレートと解像度QCIFで適応動き精度(AMA)を使用、または使用しないでTelenor符号化器の性能試験をした結果を示すグラフ図である。
図9動画シーケンス“ニュース”において毎秒10フレームのフレームレートと解像度QCIFで適応動き精度(AMA)を使用または使用しないでTelenor符号化器の性能試験をした結果を示すグラフ図である。
図10動画シーケンス“自動車”において毎秒10フレームのフレームレートと解像度QCIFで適応動き精度(AMA)を使用または使用しないでTelenor符号化器の性能試験をした結果を示すグラフ図である。
図11動画“庭園”においてい毎秒15フレームのフレームレートと解像度SIFで適応動き精度(AMA)を使用または使用しないでTelenor符号化器の性能試験をした結果を示すグラフ図である。
図12動画シーケンス“庭園”において毎秒15フレームのフレームレートと解像度QCIFで適応動き精度(AMA)を使用または使用しないでTelenor符号化器の性能試験をした結果を示すグラフ図である。
図13動画シーケンス“Tempete”において毎秒15フレームのフレームレートと解像度SIFで適応動き精度(AMA)を使用または使用しないでTelenor符号化器の性能試験をした結果を示すグラフ図である。
図14動画シーケンス“Tempete”において毎秒15フレームのフレームレートと解像度QCIFで適応動き精度(AMA)を使用または使用しないでTelenor符号化器の性能試験をした結果を示すグラフ図である。
図15動画シーケンス“ゆれるパリ”において毎秒15フレームのフレームレートと解像度QCIFで適応動き精度(AMA)を使用または使用しないでTelenor符号化器の性能試験をした結果を示すグラフ図である。
図16動画シーケンス“自動車”において、毎秒10フレームのフレームレートと解像度QCIFでファストサーチ戦略(“TelenorFSAMA+c")及びフルサーチ戦略(“Telenor AMA+c”)の性能試験の結果を示すグラフ図である。
図17動画シーケンス“コンテナ”において毎秒10フレームのフレームレートと解像度QCIFでファストサーチ戦略(“Telenor FSAMA+c")及びフルサーチ戦略(“Telenor AMA+c”)の性能試験の結果を示すグラフ図である。
図18動画シーケンス“自動車”において解像度QCIFと毎秒10フレームのフレームレートで動き補償のために1枚の参照フレームのみを使用し試験した場合と動き補償のために複数枚のフレームを使用し試験した場合とを比較する性能試験結果を示すグラフ図である。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ