図面 (/)

この項目の情報は公開日時点(1994年1月14日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (19)

構成

放送セグメント連続パターン認識装置は、中央設備22と複数の接続されたローカル設備21とから構成される。各ローカル設備は各地理的領域での放送監視し、放送セグメントからディジタルパラメータ化したディジタルシグナチュア構築する。放送セグメントのフレーム位置と対応するシグナチュアは、ローカル設備のライブラリ内に記憶されたシグナチュアと対応させることにより放送セグメントが自動的に識別される。未知セグメントのシグナチュアは通信ネットワーク23a,bを介して中央設備22へ転送され、広域ライブラリ検索される。

効果

特別なコードの挿入等が不要で、かつ、リアルタイムで多数のコマーシャル放送(放送セグメント)を識別し記録することができる。

概要

背景

概要

放送セグメント連続パターン認識装置は、中央設備22と複数の接続されたローカル設備21とから構成される。各ローカル設備は各地理的領域での放送監視し、放送セグメントからディジタルパラメータ化したディジタルシグナチュア構築する。放送セグメントのフレーム位置と対応するシグナチュアは、ローカル設備のライブラリ内に記憶されたシグナチュアと対応させることにより放送セグメントが自動的に識別される。未知セグメントのシグナチュアは通信ネットワーク23a,bを介して中央設備22へ転送され、広域ライブラリ検索される。

特別なコードの挿入等が不要で、かつ、リアルタイムで多数のコマーシャル放送(放送セグメント)を識別し記録することができる。

目的

本発明の目的は、特別なコードの挿入や信号内に起こる合図の認識によらずに、コマーシャル放送データを記録するための自動化された方法および装置を提供することである。

また、本発明の他の目的は、高価な並列処理または大型コンピュータに依存することなく、リアルタイムで多数の広告経済的且つ効率良く識別できる方法および装置を提供することである。

効果

実績

技術文献被引用数
0件
牽制数
3件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

セグメントの各々が音声部分映像部分の少なくとも1つを有し、更にセグメントが放送されるたびに同じである第1の部分とセグメントが放送されるたびに異なる第2の部分とを有する、放送セグメント連続パターン認識方法において、認識すべきそのようなセグメントの第1の部分の既知サンプルからシグナチュア構築し、前記第2の部分の既知のサンプルから追加データを記録し、前記シグナチュアと前記追加データとを記憶し、前記第2の部分の存在の表示を前記記憶されたシグナチュアに結合し、放送信号監視し、前記監視放送信号における放送セグメントの第1の部分を前記シグナチュアと符合させ、そして前記放送セグメントの第2の部分を識別するために前記追加データを使用することからなる放送セグメントの連続パターン認識方法。

請求項2

追加データを記録する前記ステップは、前記第2の部分用の第2のシグナチュアを構築することからなり、かつ前記使用するステップは、前記放送セグメントの第2の部分を前記第2のシグナチュアと符合させることからなる請求項1記載の方法。

請求項3

前記セグメントの各々は少なくとも映像部分を有し、追加データを記録する前記ステップは前記第2の部分の少なくとも1つの映像フレームを記録することからなり、かつ前記使用するステップは、前記少なくとも1つの映像フレームと前記監視放送信号の少なくとも1つの映像フレームとの直接比較を実行することからなる請求項1記載の方法。

請求項4

セグメントの各々が音声部分と映像部分の少なくとも1つを有し、かつセグメントが放送されるたびに同じである第1の部分とセグメントが放送されるたびに異なる第2の部分とを有する、放送セグメントの連続パターン認識装置において、認識すべきそのようなセグメントの第1の部分の既知のサンプルからシグナチュアを構築する手段と、前記第2の部分の既知のサンプルから追加データを記録する手段と、前記シグナチュアと前記追加データとを記憶する手段と、前記第2の部分の存在の表示を前記記憶されたシグナチュアに結合する手段と、放送信号を監視する手段と、前記監視放送信号における放送セグメントの第1の部分を前記シグナチュアと符合させる手段と、そして前記放送セグメントの第2の部分を識別するために前記追加データを使用する手段とから構成される放送セグメントの連続パターン認識装置。

請求項5

前記記録手段は、前記第2の部分用の第2のシグナチュアを構築するための手段からなり、かつ前記使用する手段は、前記放送セグメントの第2の部分を前記第2のシグナチュアに符合させる手段からなる請求項4記載の装置。

請求項6

前記セグメントの各々は少なくとも1つの映像部分を有し、前記記録手段は前記第2の部分の少なくとも1つの映像部分を記録する手段からなり、かつ前記使用する手段は、前記少なくとも1つの映像フレームと前記監視放送信号の少なくとも1つの映像フレームとの直接比較を実行する手段からなる請求項4記載の装置。

技術分野

0001

この発明は、放送セグメント自動認識係り、特にテレビ局によるコマーシャル広告放送に関する。

0002

広告主は、種々の広告ラジオまたはテレビジョンで何時放送されるかを示す記録データに関心がある。この関心が起因するものは、広告料を払った放送時間が実際に放送されたかどうかの確認や同業者の広告戦略を見ることへの興味である。

0003

特別なコードの挿入や信号内に起こる合図の認識によらずに、コマーシャル放送データの記録用の自動化された方法やシステムを提供することには利点が多い。

0004

また、高価な並列処理または大型コンピュータに依存することなく、リアルタイムで多数の広告を経済的且つ効率良く識別できる方法、装置、およびシステムを提供することも望ましいことである。

発明が解決しようとする課題

0005

本発明の目的は、特別なコードの挿入や信号内に起こる合図の認識によらずに、コマーシャル放送データを記録するための自動化された方法および装置を提供することである。

0006

また、本発明の他の目的は、高価な並列処理または大型コンピュータに依存することなく、リアルタイムで多数の広告を経済的且つ効率良く識別できる方法および装置を提供することである。

0007

この発明の方法および装置によれば、放送セグメントのリアルタイム連続パターン認識は、認識されるセグメントの公知見本からディジタルシグナチュアを構成することにより達成される。このシグナチュアは、ディジタルにセグメントをパラメータ化し、シグナチュアを形成するために、所定の定義された規則によりセグメントを中の任意のフレーム位置の中からある部分を選択し(例えば、異なるフレームが各セグメントに対し選択されるが、この選択は常に同じ基準に基づく)、そして前記部分のフレーム位置にシグナチュアを対応させることにより構成される。このシグナチュアおよび対応するフレーム位置は、シグナチュアのライブラリに記憶される。ライブラリにおける各シグナチュアは、認識されるように特定のセグメントと識別される。放送信号は、監視されそしてディジタルにパラメータ化される。パラメータ化された監視信号の各フレーム毎に、ライブラリにおいて、そのフレームに対応しうるシグナチュアが検索される。シグナチュアと共に記憶されたフレーム情報を使用して、潜在的に結合し記憶されたシグナチュアのそれぞれを、パラメータ化された信号の適正なフレームと比較する。もし、記憶されたシグナチュアが監視されるデータと比較される場合には、一致が宣言され、シグナチュアと対応する識別データを用いて、放送セグメントは識別される。

0008

この発明による方法および装置の別の実施例において、パラメータ化されるセグメント内での指定されたフレームより得られるディジタルキーワードは、セグメントシグナチュアと対応で識別されるが、しかし特定のセグメントシグナチュアとキーワードとの結合は排他的ではない。例えば、同じキーワードは、1つ以上のシグナチュアと対応させることができる。複数の追加フレームは、所定の定義された規則に従いセグメント中の任意のフレーム位置の中から選択され、そしてシグナチュアのライブラリにおいて、指定されたフレームを表すキーワードと追加フレームを表わすワードとは、その指定されたフレームと関連がある追加フレームのオフセット一緒に記憶される。放送信号は、監視され、そしてディジタル方式でパラメータ化される。パラメータ化された監視信号のうち、監視された各ディジタルワードに対し、ライブラリは、監視されたワードと一致するキーワードに結合されたシグナチュアを検索し、またこのようなシグナチュアの追加ワードは、記憶されたオフセット量により監視されたワードから分離されかつパラメータ化され監視された信号のこれらのワードと比較される。もし、記憶されたシグナチュアが監視されたデータと比較される場合には、一致が宣言され、シグナチュアデータと対応する識別データを用いて、放送セグメントは識別される。

0009

この発明の方法および装置を適用するシステムは、監視信号特性内に、識別すべき潜在的な未知の放送セグメント信号のアーティファクトの発生を検出する手段と、その様な可能性のある未知のセグメントを分類し、識別する手段を有する。ここで、アーティファクトとは、監視された信号内に存在する認識すべき潜在的な未知の放送セグメントの信号のことをいう。前記した様なシステムの一実施例として、異なる地理的領域において、その領域での放送を監視するための複数のローカル設備と、通信網によりそのローカル設備と連結された中央設備とを備える。各ローカル設備はその地理的領域に適用できるセグメントシグナチュアのライブラリをもち、そして少なくともそれぞれ上述した記憶し、監視し、検索し、比較しおよび検出するタスクを実行する手段を有する。中央設備は、全てのローカルライブラリにおける全ての情報を含む広域ライブラリをもつ。潜在的な未知のセグメントの分類および識別はローカル設備において、圧縮された音声および映像情報、一時的なディジタルシグナチュア、およびローカル設備のライブラリで見つけられない潜在的な未知のセグメントに対するパラメータ化された監視信号情報の生成を伴う。少なくとも、パラメータ化された監視信号情報および一時的なシグナチュアは、通信網を介して中央設備へ転送される。中央設備では、広域ライブラリの特定個所に記憶された一時的なシグナチュアが検索され、また広域ライブラリの主要部に記憶されたシグナチュアも検索され、転送されパラメータ化された監視信号情報と比較され、その結果、潜在的な未知のセグメントが以前に他のローカル設備で受信され、システムに既に知らされているかどうかが決められる。もしそうであり、且つ広域シグナチュアが既に生成されているのであれば、起点ローカル設備での一時的シグナチュアは以前に生成した広域シグナチュアに置換され、広域ライブラリの主要部で検知されなかった潜在的な未知のセグメントと同様に一緒にグループ化される。そのグループにおけるセグメントの少なくとも1つに対し圧縮された音声および映像がローカル設備から要求され、そして中央設備でのオペレータはそれを分類し識別するために再生する。オペレータがセグメントを識別すると、システムは自動的に、広域ライブラリと適当なローカルライブラリとに加えるシグナチュアを構築する。

0010

この発明は、リアルタイム基準で明確な連続パターン認識によって放送信号のセグメントを識別することができる。転送前に放送信号にコードを挿入する必要はなく、そして放送において生じる合図または事象信号(例えば、黒色消去または場面変更)もこの認識プロセスでは必要とされない。放送信号は、認識プロセスに対し明らかに使用し得る音声情報としてのラジオ放送、もしくは音声情報、映像情報もしくは両者の情報としてのテレビジョン放送とすることができ、空間伝播信号ケーブル信号、またはビデオテープ信号を使用することができる。

0011

音声または映像情報のどちらを使用するにしても、放送信号は、好適には信号の1/30秒毎に1つの16ビットディジタルワードからなるディジタルデータストリームを生成するためにパラメータ化される。(映像情報と結合された音声情報である場合、この音声データは音声フレームを形成するために、映像フレーム速度と同期化される。)この情報は、それが音声または映像として生じたとしても同様の方法で処理される。

0012

ディジタルシグナチュアは認識されるべくセグメントのそれぞれに対し構築される。このディジタルシグナチュアの構成は以下に詳細に説明される。しかしながら、好適には、一連の所定の定義された規則に従ってセグメントの中の任意のフレーム位置の中から選択される信号情報の8つのフレームに対応する8つの16ビットワード表現される128ビットで構成される。

0013

入力された音声または映像信号は好適にはデータのそれぞれのフレームに対し16ビットディジタルワードとなるようにディジタル化され、パラメータ化される。このこともまた以下に詳細に説明される。入力された信号が受信されると、その信号は、例えば、シグナルデータを2分間保持するバッファに読み込まれる。このデータのそれぞれのワードは8ワードシグナチュアの最初のワードとなると仮定される。そのような各ワードとその最初のシグナチュアワードとの間隔(例えば、フレーム数)を示すオフセット情報は、シグナチュアの各ワードに結合される。受信されたワードそれぞれがバッファ内の予定された観察点に達すると、認識される既知のシグナチュアのライブラリでは、そのワードで始まるシグナチュアが検索される。シグナチュアと共に記憶されたオフセット情報を用いて、既にバッファ内にあるその後に受信されたワードは、シグナチュアのこれら残部のワードが一致するかどうかを決定するため、シグナチュアワードの残部と比較される。

0014

この方法をリアルタイムで作動させるために、全てのライブラリの比較は、受信されたワードが観察点にある時間内でされなければならない。テレビジョンフレームは1/30秒持続するので、受信されたワードに対する比較はすべて1/30秒内でされなければならない。もしそのライブラリのすべてのセグメントシグナチュアが入力されるフレームシグナチュアデータと1/30秒毎に比較されなけらばならないとすると、現状のコンピュータスピードではたった数千のライブラリシグナチュアの比較が達成できるだけである。このことにより、ライブラリに記憶できるシグナチュアのセグメントの数と高価な並列処理や大容量のコンピュータを用いないで監視できる放送セグメント(例えば、コマーシャル)の数の上限が決められることになる。

0015

しかしながら、合衆国において、500種類もの異なったコマーシャルがある一定の時間にある市場地域で放送されている。ある市場に監視されるべき6つの放送局があると仮定すると、全体としては、毎日4,000以上もの異なるコマーシャルが存在することになる。さらに、全国的には40,000種類もの異なるコマーシャルがある一定の時間に放送されており、また毎年全国的に90,000種類以上の新しいコマーシャルが紹介されている。従って、本発明のシステムにおいて、入力されるフレームシグナチュアデータが多くの異なるコマーシャルのうち代表的な数万のセグメントシグナチュアとリアルタイムで比較できることが望ましい。

0016

1/30秒というリアルタイムでのリミット内で記憶され、検索されるシグナチュアの数および監視され得る放送セグメントの数は指定フレームキーワード探索データ低減方法を用いることによって、数十万に増加することができる。このような方法を用いることによって、シグナチュアが既知のセグメントに対し構築される場合、以下に述べる基準を用いて、セグメントからの1つのフレームが、キーフレームとして、つまりキーワードになるディジタルパラメータ化されたものとして選択される。シグナチュアはなお好ましくは8つの16ビットワードであるが、記憶されたオフセット情報は第一番目のシグナチュアワードからよりもむしろキーワードからの距離を表示する。このキーワードはシグナチュアデータワードのひとつとなり得、その場合にはこのワードのオフセットは0あるいは第9番目のワードとなり得る。そのキーワードはまた一時的にも他のシグナチュアワードの全てに先行する必要はなく、またほとんどその様にはならない。もし16ビットワードが用いられるなら、216すなわち65,536のキーワードが存在可能である。シグナチュアは、探索テーブル内にこれら65,536のキーを用いて記憶される。バッファ内の観察点に到達し受信されたワードは、それぞれがキーワードであるとみなされる。探索テーブルを用いて、そのキーワードに対応する少数の可能なシグナチュアが識別される。以下述べるように、キーワードの選択基準のひとつは、4つのシグナチュアが平均してそれぞれ同じキーワードを持つということである。一般に、4つのシグナチュアの比較は、受信データにデータエラーがないとした場合、1/30秒の制限時間内で行われ得る最大のものである。65,536のキーと掛け合わされた4つのキーワードは、システムに262,144通りの可能なシグナチュアをもたらし、このことはこのシステムがその数の放送セグメントをリアルタイムで識別できる能力を有することを意味している。

0017

指定フレームキーワード探索技術を使うかどうかにかかわらず、本発明は認識処理中に、合図や信号事象あるいは放送シグナルに予め設定されたコードを必要としない。単に入力される信号を監視し、連続的にパターン認識を行うだけである。

0018

映像情報は以下に述べるようにパラメータ化され、ディジタル化される。以下述べるようにパラメータ化は信号の輝度に基づくけれども、映像信号の他の或いは追加の属性がこの目的に用いられることは明らかである。

0019

幾つかの領域、好適には16(より多いあるいは少ない領域でも使用し得るけれども)の映像フィールドあるいはフレームが選択される。各領域の大きさは好適には8×2の画素であるが、他の大きさの領域も使用できる。各領域の輝度は、例えば0−225のグレイスケールの絶対値になるように平均化される。この値は以下のいずれかと比較することによって、0あるいは1のビット値正規化される。

0020

1.全体のフィールドあるいはフレームの平均輝度

0021

2.フィールドまたはフレームのある領域の平均輝度。

0022

3.ある前のフィールドまたはフレームの同じ領域の平均輝度。

0023

4.ある前のフィールドまたはフレームのある領域の平均輝度。

0024

どの比較をするかの選択を行う際に、その目的はエントロピー最大化すること、例えば、領域間相関関係を最小にすることである。(相関関係は一方の領域の輝度値が他方の領域の輝度値と関連づけられるあるいは従うような程度と関係がある。)このため、上記の第4番目の比較は現在のフレームの後の1〜4フレーム前に存在するフレームとすることが好適である。また同じ理由で、フィールドあるいはフレーム内の16個の領域の分布はそれより前のフィールドあるいはフレーム内の16個の領域と同様に、そのフィールドあるいはフレームの中心に対して非対称であることが望ましい。というのは、映像フレームは対称的に設定された領域間ではかなりの相関関係が存在するように構成されるということが経験的に測定されているからである。

0025

図1は、あるフレームにおける領域の部分的な分布の一例である。フレーム10はサンプルとしての画素の映像フィールドである。(これ以降、フレームはフィールドあるいはフレームのどちらかを意味するものとする。)輝度領域ln(n=1−16)(16個すべては図示されていない)は、現在のフレームに対してパラメータ化されたディジタルワードを決定するために用いられる領域である。また輝度領域ln′(n=1−16)(16個すべては図示されていない)は、その値が前のフレームデータとして後のフレームに用いられるために保持される。

0026

どの比較が行われたとしても、今取り扱われている領域の輝度が比較されている領域の輝度を越える場合は、1ビットの値がリターンされ、今取り扱われている値が比較されている領域の輝度より小さいか等しい場合は0ビットの値がリターンされる。(ここにおいて、また以下の説明において、データおよびマスク値の1および0の割当を逆にすることができることは明白である。)このようにデータを正規化することによって、異なる局からあるいは異なる時間(例えば、異なる転送制御の設定によって生じる)に転送された信号間のオフセットおよびゲインの差が最小化される。このようにして得られた16個の値は、パラメータ化されたフレームシグナチュアを作成する。

0027

16ビットのマスクワードは、各16ビットのフレームシグナチュアに応じて作成される。このマスクワードはフレームシグナチュアの信頼性を表すものである。フレームシグナチュアの各々のビットに対し、そのビット値を計算するのに用いられる輝度差の絶対値がしきい値あるいはガードバンド値より小さい場合は、輝度値にはエラーが起こりやすいとされ(転送におけるノイズのため)、そのビットのマスクビットは信頼性の低いデータを表示する0に設定される。輝度差の絶対値がガードバンド値より大きいか等しい場合は、輝度値はノイズレベルよりかなり大きくなり、対応するマスクビット値は信頼性の高いデータを表示する1に設定される。以下に述べるように、マスクワードの1や0の数字はセグメントシグナチュアを生成したり比較のためのしきい値を設定する際に用いられる。

0028

音声フレームシグナチュアは、もし用いるのであれば、映像フレームシグナチュアと同様のフォーマットで構成できるので、映像フレームシグナチュアと同様の方法で処理できる。前記音声シグナチュアはラジオ放送のセグメントの認識や、信頼性に欠けるデータを持つ可能性の高い映像セグメントデータ識別の確認に用いられる。しかしながら、音声シグナチュアの使用は本発明において必ずしも必要でない。

0029

パラメータ化されたフレームシグナチュア情報は、循環バッファに記憶される。前記バッファは、識別される最長の放送セグメントの約2倍の信号情報を保持できることが望ましい。セグメントシグナチュアがフレームシグナチュアデータと比較される場合には、比較するためのフレームシグナチュアを選択するためにセグメントシグナチュアと共に記憶されたオフセットデータを用いて、観察点を通過する各々のフレームに対し、セグメントシグナチュアデータとフレームシグナチュアデータとの間で一度に1ワードづつ、8つの比較がなされる。フレームシグナチュアワードとセグメントシグナチュアワードの比較には、ビット単位エクスルシNOR演算が用いられる。この演算では、両方のビットが等しい場合は1をリターンし、異なる場合は0をリターンする。エクスクルシブNOR演算によって得られた数は、8つのワード比較全てに渡って蓄積される。比較をするために、オフセットパラメータ化されたフレームシグナチュアワードを連鎖することにより、パラメータシグナチュアを構成することは、実際上必ずしも必要でない。エクスクルシブNOR演算により蓄積された数が、後述するような変更で、所定のデフォルトしきい値を越える場合には、観察点においてフレームの一致が起こると考えられる。

0030

シグナチュアは、以下のようにセグメントに割当てる。

0031

複数の、好適には8つの、ワードが次の基準すなわち、安定データ、ノイズフリーデータハミング距離およびエントロピーという基準に合うパラメータ化されたセグメントから選択される。

0032

安定データは、放送セグメントにおける最小の持続機関を有すべく選択されたワードを意味する。すなわち、同一または類似のデータの少なくとも最小数(例えば20以上)のフレームが存在するセグメントの部分から得られる。

0033

ノイズフリーデータは、マスクされていないビットの最大数に対応するマスクワードをもつデータである(持続期間又は、安定の最大化、およびマスクされたビット又はノイズの最小化は、2つの競合する基準で行うことができる)。

0034

ハミング距離は、ディジタルデータの非類似性に関係がある。より明確で信頼性の高い放送セグメントの識別のためには、ある放送セグメントのシグナチュアが、ハミング距離として知られている少なくとも最小数のビットという点で、他の放送セグメントのシグナチュアと異なるということが望まれる。データベースにおいて、2番目あるいはそれ以降のシグナチュアを発生する際には、シグナチュアの存在点からのハミング距離を考慮せねばならない。

0035

エントロピーは、データの異なる部分間に最小の相関関係が存在するというデザイアビリティーに関する。このため、好適なシグナチュアデータ長さ(8ワード、1ワードにつき16ビット)が与えられた場合、2つのシグナチュアワードをセグメント中の1秒と離れていない近接点から作成すべきでない。これにより、容易に認識され得る放送セグメントの長さの下限が設定される。例えば、8つのワードでシグナチュアを構成し、それらは少なくとも1秒は離れていなければならないとすると、確実に認識できる最短のセグメントは約10秒の長さのセグメントである。

0036

これらの基準を用いて、8つのフレームシグナチュアがパラメータ化されたセグメントから選択され、これらの8つのフレームシグナチュアから作成する8つのワードセグメントシグナチュアが生成され、記憶される。この持続時間の基準およびマスクワードも認識処理において用いるため、そのセグメントシグナチュアと共に記憶される。持続期間のパラメータは、フレームデータがある期間安定しているので、認識処理の間に、そのデータに関して何回かの連続した一致が起こるべきであるということを意味している。より以上の或いはより少ない一致が起こる場合には、その一致は統計的異常として切り捨てられる。マスクデータによってしきい値パラメータが定義される。そのパラメータは、認識処理の間にシグナチュアが放送データと一致するであろう前に要求された一致ビットのデフォルト数を調整するために用いられる。例えば、ある特定のセグメントシグナチュアを一致しようとする間に、そのシグナチュアに対応するマスクされたビットの数の半数により低くなるシステムに対してデフォルトしきい値が設定される。

0037

指定フレームキーワード探索技術が用いられる場合、あるキーワードがセグメント内から選択される。バッファを少なくとも識別される最長セグメントの2倍の長さにすることによって、認識するのに十分な放送信号の履歴が、キーワードが観察点に到達する時点において、バッファに残ることになる。キーワードを選択するのに用いられる基準はシグナチュアワードを選択するのに用いるものと同様であり、レベルリストの必要性によって増加されて、安定した持続期間をもち、相対的にノイズフリーとされるべきである。例えば、必要とされる計算が1/30秒というリアルタイムリミット以内で行われるためには、同じキーワードを持つシグナチュアは、多くとも約4つとすべきである。

0038

キーワードを用いる技術は一般に4つの比較のみが行われる必要があるけれども、(それぞれのキーワードに割り当てられるシグナチュアは4つまでであるため)、放送信号のパラメータ化におけるエラーの可能性(例えば、信号の転送時のノイズのために発生する)を考慮して追加比較が行われる。また、この様な追加の比較により、放送セグメントが不正確に認識されることを減らすことになる。フレームシグナチュアごとに1ビットのエラー率と仮定した場合、名目上のキーワードに加え、16の追加キーワード(名目上のキーワードに関しそれぞれ異なるビットを逐次補足することによって得られる)もまた確認される。確認された17のキーワードのそれぞれが対応する4つのシグナチュアをもつ場合には、1/30秒間隔ごとに68もの比較が行われなければならない。もしフレームシグナチュアごとに2ビットのエラー率を過程すると、キーワードの数は、

0039

ID=000003HE=020 WI=029 LX=1355 LY=1900
に増加し、548もの比較が要求されることとなる。現状のコンピュータ技術において、この比較は1/30秒間隔で行われることが可能である。

0040

シグナチュアがセグメントシグナチュアデータベースに追加するセグメントとして構成される前に、放送セグメントが受信されていることが確定されていなければならない。ある場合には、新しいセグメントが手動でシステムに組み込まれることもある。例えば、広告主や広告代理店が新しい広告のビデオテープを供給する場合である。このような場合、オペレータやシステムは、新しいセグメントであり、このシグナチュアがまだセグメントシグナチュアライブラリに記憶されていないことを知っている。しかし、新しい広告が、その広告のビデオテープが前もって提供されておれず、そのため未だシステムに知らされていない状態で、ローカル放送局により放送されることが起こりうる。従って、本発明はまた、新しいおよび現在未知の、認識すべき潜在的セグメントが入力信号の中に存在することを検出することができる。この目的だけのため(即ち、認識するのではなく、検出するため)に、本発明は放送信号内のこの様な潜在的な未知のアーティファクトの存在に対しても有効である。これらアーティファクトは黒色消去、消音を含む音声出力の変化(”音声の黒色消去”)および例えば映像信号の垂直期間に現れる予めコード化された識別データの存在(内容ではない)を含むことができる。これらアーティファクト自体は新しい未知の認識すべきセグメントの存在を表示するようには想定されていない。むしろ、意思決定プロセスの一部として用いられる。例えば、2つのアーティファクトが1時間あるいは30分ぐらい離れた時間で30秒,60秒または120秒発生し、既知のセグメントがこれらの発生時間内に識別されなかった場合、関心のある新しい未知のセグメントが存在した可能性がかなり高い。一方、このアーティファクトの期間が識別されたセグメントによるものである場合、このアーティファクトは使用されないか、もしそうでなかったら、このシステムにより確認され、アーティファクトが発生したという事実はメモリから消去される。関心のある新しく且つ未知のセグメントの存在の他の可能性のある表示は、30秒、60秒或いは120秒離れた間隔あるいは既知のセグメントが識別されていない間の間隔での二つの既知のセグメントの発生或いは、ある既知のセグメントから上記の間隔だけ離れた一つのアーティファクトの発生である。一旦、関心のある新しい未知のセグメントが存在することが決定されると、未知のセグメントから得られるパラメータ化された情報はその未知のセグメントに対応する音声および映像情報と共に保存される。未知であると記されたアーティファクトは保持されずまた何の記録も残されない。

0041

保存された音声および映像情報は新しくかつ未知のセグメントを識別すると共にその識別をセグメントシグナチュアライブラリに記録する際に用いるために、圧縮された形(以下述べるような)で結局オペレータに表示される。また、オペレータはセグメントに対するシグナチュアを準備するのに必要な特別の要求を記録する。例えば、全国的なコマーシャルは二つの部分を持つ。一つはコマーシャルが放送される地域に関係なく常に同じであるもの(一定部分)、もう一つはコマーシャルが放送される地域によって変わる部分(可変あるいはタグ部分)である。その様な全国的コマーシャルの中の異なる部分を正確に識別することは重要である。全国を対象にした商品のコマーシャルにある地域に特定するというタグが付いている場合、そのコマーシャルは、異なる地域用のタグが付けられた同じ種類のコマーシャルとは異なるとみなされる。したがって、オペレータはシグナチュアがセグメントのタグ部分からのデータを含むに違いないということおよび追加データがそのタグから得られるはずであるということに注意するようにする。このとき、シグナチュアは前述したように自動的に生成される。

0042

異なるタグを持つ同一の広告の違いを見分ける能力は、本発明の重要な特徴の一つである。広告に付けられたタグの形式によって、二つの異なる方法が用いられる。タグの一つの形式は実動タグとして知られており、それは少なくとも5秒間の音声/映像部分の実際の動作である。タグのもう一つの形式は静止タグとして知られており、これは独自のシグナチュアを生成するには不充分な映像内容を有する静止画であり、例えばテキストである。どちらの種類のタグであっても広告内の任意の個所で発生することが可能である。

0043

実動タグが含まれる場合、分離シグナチュアがそのタグに対して生成される。このシステムは広告の発生とタグの発生の両方を記録し、このデータをシグナチュアデータベースにポインタの助けを借りて組み込む。静止タグに対して、その広告シグナチュアに結合されたフラグあるいはポインタが静止タグのフレームと対照タグのフレームとの映像比較強制的に開始させる。この比較は必ずしもリアルタイムで行われる必要はない。

0044

本発明により構築されるシステムは、好適には1又はそれ以上のローカル設備および1つの中央設備から構成される。上記された認識方法を利用して、ローカル設備は1又はそれ以上のテレビ放送の映像および音声信号走査し、既知の放送セグメントを探す。既知のセグメントが検出された場合は、ローカル設備は、時間および日付けの情報、監視されるチャンネル、セグメントの識別ラベルおよび他の情報をデータベースに記録する。また、アーティファクトに対しても有効とする場合、ローカル設備は、システムに未だ知られていなくて関心のある新しいセグメントとなりそうな、検知した信号をも注目して記録する。

0045

周期的に、中央設備は例えば電話回線を介して、ローカル設備と通信することにより、どの既知の放送セグメントが検出され、どの潜在的な未知のセグメントが発見され、保存されたかを決定すると共に、ローカル設備には未だ知られていない新しい放送セグメントに対応する適正なローカル設備のセグメントシグナチュアと検出情報とをローカル設備に行き渡らせる。新しい未知のセグメントの最終的な識別は中央設備において人間であるオペレータによる視覚的あるいは口頭による翻訳が必要となることが予期される。

0046

図2は中央設備22と複数の接続されたローカル設備21とを含むシステムのブロック結線図を示す。各ローカル設備21は、地理的領域での放送を監視する。好適には、ローカル設備21は明瞭な入力信号を保証するためにケーブルテレビヘッドエンド局に設置される。ローカル設備21は既知の放送セグメントの認識および識別を行うこと、日、時、期間、チャンネル、識別ラベルおよびその他の所望の情報によるこれらセグメントの発生を記録することができる。ローカル設備はまた、潜在的で新規かつ未知のセグメントの発生を認識し、そのような未知のセグメントに対する一時的なキーシグナチュアを生成することができるので、中央設備22によりセグメントを識別するまでは、その様なセグメントのそれぞれの発生の全記録を保持することができる。ローカル設備21は通信チャンネル23a,bを経由して、認識された既知セグメントの全ての記録情報と全ての潜在的新規かつ未知のセグメントに関する情報とを中央設備22へ伝え、その代りに、ソフトウェア更新情報およびシグナチュアライブラリ更新情報を受信し、追加情報を要求する。ローカル設備21により転送され受信された新しいシグナチュアが、そのローカル設備21により中央設備へ最初に転送された未知のセグメントとして始まる場合には、そのローカル設備21は、一時的な記録を中央設備22への転送の待機中の他のデータの中に組み込んだ後、このデータベースから一時的シグナチュアを除去する。

0047

ローカル設備21aは中央設備22またはその近辺に設置され、高速直結データ回線24により中央設備22の残部に接続される。この中央−ローカル設備は他のローカル設備21と同一であり、ローカル設備と中央設備22が設置されている放送市場に対し、他のローカル設備21と同じ機能を果たす。しかし、中央−ローカル設備21aは直結高速データリンク24により中央設備22に接続されているため、中央設備22により監視される新規セグメントは、中央設備22ですぐに識別のために利用できる。このため、全国規模となるこれら新規のセグメントのシグナチュアは、遠く離れたローカル設備21にすぐに広められ、その結果、ローカル設備21により受信されたセグメントが未知であると分類する時間を最小にし、通信チャンネル23a、bが、ローカル的に未知な全国規模のセグメントに対応するシグナチュアおよび他のデータ(圧縮された音声および映像)を不必要に転送する負担を防ぐ。

0048

新規かつ未知のセグメントに対応する音声および映像情報は、識別処理の間にオペレータにより再検討されるように通信チャンネル23a,bを介して中央設備22へ転送されなければならないので、このデータは通信のオーバーヘッド費用を低減するよう圧縮フォーマットでローカル設備21により収集される。

0049

映像データの圧縮は、好適には以下の様に行われる。まず第1に、全てのフレームが捕捉されるわけではない。中央設備22におけるオペレータの要求によりもっと頻繁にフレームを捕捉できるオプション付きであるが、好適には、4秒毎に1フレームのみがスライド表示効果を作成するために捕捉される。第2に、周知のように、テレビ映像フレームは1/60秒毎に起こる2つの飛び越しフィールドからなる。このスライド表示効果では、フィールド間の小さな動きが著しいちらつきを生じる。従って、1つのフィールドのみが捕捉され、それにより認識できるイメージが提供される。第3には、必ずしも全ての画素が、十分に認識できるイメージに対し必要であるわけではない。中央設備22におけるオペレータの要求により、1フィールドごとに320×240画素を捕捉できるオプション付きであるが、160×120の画素で十分であることが知られている。第4に、色彩情報を捕捉することは必ずしも必要でない。

0050

音声圧縮を達成することはもっと困難である。認識できるイメージを保持したままで、映像データからはかなりの情報を除去できる。しかしながら、残っている音声が理解できなくならずに、或いはオペレータに受け入れ難い疲労なくして、音声から除去できる情報の量はほんの僅かな量である。この点では、音声圧縮の好ましい方法は、アダプティブディファレンシャルパルスコードモジュレーションADPCM)であり、これは電話機業界で使用され、通話品質の良い音声が得られる。ADPCM技術および回路は周知である。

0051

ローカル設備21が潜在的な新規且つ未知の放送セグメントを検出する場合、その未知のセグメントに対し生成したフレームシグナチュアデータ、一時的セグメントあるいはキーシグナチュアおよびそのセグメントに対する圧縮された音声および映像情報が記憶される。ローカル設備21は中央設備22により周期的にポーリングされ、その時点で記憶されたフレームシグナチュアデータおよび一時的シグナチュアは識別のために通信チャンネル23a、bを介して中央設備22へ転送される。以下に述べるように、音声および映像情報は任意選択的に転送される。しかし、これらのデータはこのセグメントの識別ラベル及びシグナチュアが中央設備22により返送されるまで、ローカル設備21に常に記憶される。

0052

中央設備22が未知のセグメントに対応するフレームシグナチュアデータおよび一時的キーシグナチュアをローカル設備21から受信すると、未知のセグメントが以前に識別されており既にシステムに知られているか(多分、異なるローカル設備は前に放送セグメントを調べているので)どうかを決めるために、中央設備22に対応するシグナチュアコプロセッサ25はまず初めに広域シグナチュアデータベースに対し、フレームシグナチュアデータをチェックする。この広域シグナチュアデータは、システムに対し既知である全放送セグメントの全ローカルデータベースからの全シグナチュアを含むが、全ローカル設備21に未だ送信されていないか、あるいは限定された地理的範囲で識別され、従ってローカル設備21の幾つかにしか送信されていないシグナチュアは含まない。未知のフレームシグナチュアデータが広域データベースのシグナチュアと一致する場合は、そのセグメントに対する広域シグナチュア(それは一時的シグナチュアとは幾分異なる)が起点のローカル設備に返送され、そして、起点のローカル設備21はローカルに生成された一時的キーシグナチュアを広域キーシグナチュアと置換するよう指示される。フレームシグナチュアデータが広域データベースのシグナチュアと一致しない場合、対応する一時的キーシグナチュアが一時的シグナチュアを記憶するのに用いる広域データベースの分離部分に加えられる。この一時的広域データベースにより、コプロセッサ25は、前記したように未知のセグメントのようなもののグループ分けを行う。というのは、もし同じ未知のものが他のローカル設備21から到来する場合、それは広域データベースに記憶された一時的シグナチュアと一致しなければならないからであり、これにより、おそらく他のローカル設備21によって既に送られた同じセグメントであるということをコプロセッサ25へ指示する。

0053

新規セグメントに対する一時的シグナチュアがコプロセッサ25により広域データベースに記憶されると同時に、コプロセッサ25によりホストコンピュータ27はローカル設備21から圧縮された音声および/もしくは映像データがまだ転送されていない場合、それらのデータを要求する。通信の経済性のため、フレームシグナチュアデータは広域データベースへの比較により既知のセグメントであると識別され得るという理論に基づき、音声および映像データはローカル設備から最初に転送されないことが望ましい。しかしながら、新しいセグメントが次々と生まれるような競争の激しい市場では(例えば、シカゴ、ロサジェルス、ニューヨーク)、音声および/もしくは映像データはまた、そのグループの他のセグメントにも既に送られている。更に、音声および映像の両方が必ずしも転送される必要はない。新規且つ未知のセグメントには、音声のみあるいは映像のみで識別が可能であるものもあれば、識別するのに両方ともが必要であるような新規かつ未知のセグメントもある。音声あるいは映像データとも送られない場合、オペレータは一式のデータを要求する。この場合、未知のセグメントデータ不足の音声あるいは映像データが到着するまで、記憶され、その後オペレータのワークスション26に待機させる。オペレータが音声データ(映像のみが送られた場合)あるいは映像データ(音声のみが送られた場合)もまた必要であると決めた場合、データが再待機されて、不足情報が到着するまでその未知のデータは再び記憶される。同様にオペレータは、より高い解像度の映像(1秒毎に320×240画素またはそれ以上のフレーム)が必要とされ、未知のデータが再び記憶されることを決定する。高い解像度が要求されるような場合に、ローカル設備21が常に高解像度映像を捕捉し、ただ単に経済性のために転送しないのであれば、要求に応じてすぐに転送することができる。しかし、ローカル設備21がルーチン的に高解像度映像を捕捉しないような方法でシステムが実行される様な場合、セグメントが再びその地域で放送されるまで待つ必要がある。

0054

必要な情報の全てをオペレータが入手すると、未知のセグメントを識別するために、音声および/もしくは映像情報を再生し、上記したようにシグナチュアの生成のためのいかなる特別な要求をも詳しく記す。また、オペレータはアーティファクトの生じた結果捕捉された情報が、実際に2つのセグメントであること(例えば,30秒間隔では、2つの15秒間広告が起こる)あるいは、2つの連続する間隔が単一セグメントのそれぞれ半分であること(例えば、2つの30秒セグメントは1つの60秒の広告を表す)を決定し得る。このような場合、オペレータは、システムにセグメントを解体しあるいは連結してフレームシグナチュアおよびセグメントシグナチュアデータを再構成し、その結果得られたセグメントに対する識別プロセス再開始するよう指示する。

0055

オペレータにより、セグメントが識別された後、広域キーシグナチュアが構成される前に、そのグループ内の各セグメントに対するフレームシグナチュアデータをそのグループの互いのセグメントに対するデータフレームシグナチュアデータと整列させねばならない。グループ内の異なるセグメントは、異なるアーティファクトを検出してローカル設備21により捕捉されているので、整列させることが必要である。このように、すべてのセグメントは、例えば同じポイントであっても、同じように捕捉されるのではない。例えば、名目上60秒の長さは捕捉されると55秒の長さになる、というのはセグメントは不完全に放送されるからである。あるいは、グループのメンンバーセグメントは長すぎたり、短すぎたりする、何故ならば、それは黒色消去アーティファクトまたは音声出力変更アーティファクトの結果として捕捉されるからである。

0056

整列はコプロセッサ25により実行される。第1に、グループ内の第1セグメントのフレームシグナチュアデータがバッファに設定される。次に、第2セグメントのデータが1ワードずつ他のバッファにクロックされ、2つのセグメントの全てのビット間のエクスクルシブNORは、第2のセグメントがクロックされている間継続的に実行される。エクスクルシブNORにより反転された1の集合数が最大(比較されたビットが同じであることを意味する、つまり0か1である。)になると、整列が完成される。整列されたデータは、そのグループの残りのセグメントを整列する際に基準線として用いられる。この整列処理は時間がかかる。しかしながら、これはリアルタイムで行われる必要はない。好適には、整列は夜間あるいは、システムの活動が低い時点の他の時間に行われる。

0057

一旦グループ内の全てのセグメントに対するパラメータ化されたデータが整列されると、フレームシグナチュアデータおよびマスクデータの両方に対する最良適合が、セグメントの大多数を占めるセグメントのビット位置の値を各ビット位置に割り当てることによって計算される。そして、この最良適合にパラメータ化されたデータを用いて、シグナチュアコプロセッサ25はそのセグメントに対し新しい広域シグナチュアを生成する。

0058

この新しい広域シグナチュアが生成されると、それが適用されるグループ内の未知のセグメントの全部に対するフレームシグナチュアデータと比較され、各セグメントに対するデータがこのシグナチュアと一致することを確認する。この新しい広域シグナチュアがフレームシグナチュアデータのどの組みとも一致しない場合、エラーがキーワードあるいは他のデータワードを選択する際に起きたということか、あるいはグループ内の1又はそれ以上の組のデータが実際には同じセグメントを表していないということを意味する。この様な場合、オペレータはグループ内の追加セグメントを調べなければならないかもしれない。

0059

新しい広域シグナチュアがそれぞれグループ分けされたセグメントと一致する場合、シグナチュアはそれぞれのローカル設備21へ、あるいは新しく識別されたセグメントが全国的なものでない場合は、ローカル設備の適当なサブセット逆転送される。各ローカル設備21は一時的シグナチュアに基づき、保持していたデータを合併して中央設備22へ送り、保持していた一時的シグナチュアをローカルデータベース内の新しい広域シグナチュアと置換する。そして、そのセグメントから音声、映像およびフレームシグナチュアデータを除去する。

0060

ローカル設備30の第1の好適な実施例は図3に示される。そして、この実施例においては、IBM PCパーソナルコンピュータ31と、シリアルリンク34,35で従来のRS−232Cにより結合された2つのIntel310コンピュータ32,33を備える。パーソナルコンピュータ31は、サーキットカード36と入力映像信号から映像パラメータデータを抽出するためのソフトウエアプログラムとを使用する。コンピュータ32は、新規且つ未知のセグメントに対するシグナチュアを創作し、入力フレームシグナチュアデータに対しシグナチュアライブラリに保持され存在しているシグナチュアと合うものを見つける。コンピュータ33はパーソナルコンピュータ32により作られた”ヒット”あるいは一致を記録する。

0061

PCビィジョンフレームグラバーバイイメージングテクノロジースのようなフレーム取出カード36によりパーソナルコンピュータ31において入力映像情報の各フレームに対し512×256の画素を生成する。しかし、フレーム取出部36は、フレーム毎に1フィールドのみがサンプルとされるように利用される。フレーム取出部36はまたコンピュータ31により用いられる映像フィールドクロックを提供する。コンピュータ31によりフレーム取出出力が処理され各フレームを表わす4ビットワードを作成する。パーソナルコンピュータ31で用いられるプログラムリストするマイクロソフトマクロアセンブラーはAppendixAとしてここに添付し、フローチャートおよびプログラムリストライン適合するブロックが図4および図5に示される。フローチャートおよびプログラムリストは当業者において容易に理解されるであろう。

0062

パーソナルコンピュータ31からのパラメータ化されたデータはシリアルリンク34を介してコンピュータ32へ転送される。そのコンピュータ32において、パラメータ化されたデータはポインタを用い、モジュロ2048循環バッファとして区画されたRAMの1セクションクロック入力される。このバッファは34秒のデータを保持する。フレーム取出部36およびパーソナルコンピュータ31は非常に遅く、リアルタイムでフレームデータの全てを取り出すことができない。(しかしながら以下に述べられる第2の実施例では、この機能はリアルタイムで作動するハードウエアにより実行される。)結果的に、幾つかのデータは失われる。しかし、シリアルリンク34を介して提供されるデータは、それらの現在のリアルタイム位置でのバッファ内に挿入される。コンピュータ32は、空ポジションを次に継続するリアルタイムデータで埋めることでそのバッファを埋め戻す。上記のようにコンピュータ32によりシグナチュアが作成され、指定フレームキーワード探索技術を使用せずに、入力フレームシグナチュアデータとシグナチュアデータベースとが合うものを見つける。シグナチュア生成プログラムPL/MリストがAppendixBとしてここに添付し、フローチャートおよびプログラムリストのラインに対し適合するブロックが図6,7および8に示されている。シグナチュア検出プログラムのPL/MリストがAppendixCとしてここに添付されており、フローチャート、プログラムリストのラインに適合するフローチャートは図9,10に示されている。このフローチャートおよびプログラムリストは当業者には容易に理解されよう。

0063

この実施例におけるシグナチュア作成の目的のために、最初の半セクション、その後の8つの完璧なセクション、そして最後の半セクションの9セクションに分けられる。2つの半セクションは、放送される際に、セグメントの最初あるいは最後の裁断を可能にするように切り捨てられる。次に、ワードが、前に述べられた安定データ、ノイズフリーデータ、ハミング距離およびエントロピーの基準を用いて、8つのセクションのそれぞれから選択される。作成されたシグナチュアはコンピュータ32のメモリに記憶され、一方、一致データはシリアルリンク35を介して一致のトラックを保持するコンピュータ33に転送される。コンピュータ33において用いられるPL/MプログラムのリストがAppendixDとしてここに添付されており、フローチャート、プログラムリストのラインに適合するブロックが図11,12に示される。このフローチャートおよびプログラムリストは当業者には容易に理解されるであろう。

0064

図3のシステムにおいて、コンピュータ32によりシグナチュアが生成される。しかしながら、シグナチュアの生成は前に述べたように、そして第2の実施例で行われる(以下述べられる)ようには、始まらない。むしろ、図3のシステムにおいて、オペレータはセグメントの長さを条件として指定し、システムにテープ組み入れ、バッファを埋める処理を手動で開始させることによりシステムの準備をすべきである。その後コンピュータ32は自動的にシグナチュアを構築する。しかし、ここでは前に述べられたようなそして第2の実施例に行われる(以下述べられる)ようなしきい値やガードバンドは計算されない。この第2の実施例において、シグナチュアに対応するしきい値はデフォルトしきい値からシグナチュアのマスクされたビットの半数をとることにより変更される。一方、図3のシステムにおいて、デフォルトしきい値は比較されるときに、比較されるデータ内のマスクされたビットの半数により増加される。

0065

本発明のシステムの第2の好適な実施例は、図13〜18に示される。

0066

図13〜17は、ローカル設備21の詳細を示す。図13はローカル設備21のブロック結線図である。ローカル設備21は2つの主要なサブシステムからなる。その2つとは、信号処理サブシステム80および制御コンピュータ81である。

0067

信号処理サブシステム80は、図14に更に詳細に示されるが、入力RF放送信号を受信し、そして3つの異なるタスクを実行する。

0068

1.受信されたフレームシグナチュアデータをセグメントシグナチュアのローカルライブラリと比較することにより既知の放送セグメントを認識する。

0069

2.フレームシグナチュアデータがどのローカルに記憶されたセグメントシグナチュアとも一致しない潜在的に未知の放送セグメントを記述し捕捉する目的のために、受信された放送信号内のアーティファクトを検出する。

0070

3.中央設備でのオペレータによりその後の未知のセグメントを識別できるように、データ(圧縮された映像および音声、日時など)を収集する。ハードウエアは、最高動作速度で提供するために、これらのタスクのほとんどを実行する。更に、ソフトウエア駆動のマイクロプロセッサは、これらのタスクの低速度部分補助するために、また、プログラム化融通性がもてるようにハードウエアと協動する。

0071

信号処理サブシステム80のハードウエアは一致モジュール82、圧縮モジュール83および1つ又はそれ以上のチューナ84(監視される放送局にはそれぞれ1つのチューナがある。)を有する。チューナ84は従来のRFチューナが用いられ、本実施例においてはゼニスモデルST−3100が用いられている。一致モジュール82と圧縮モジュール83は、周知のインテルコーポレーションマルチバス(Multibus)(登録商標)IIバスストラクチュアによって構築される。マルチバスIIは、マルチバスIIバスアーキテクチュアデータブック(インテルオーダNo.230893)とマルチバスIIバス アーキテクチュアスペシフィケーションハンドブック(インテルオーダNo.146077C)に説明されており、両者は参考文献としてここに含められる。上記した最初の2つのタスクは、一致モジュール82で実行され、第3のタスクは圧縮モジュール83で実行される。

0072

2つのモジュール82と83は、セントラルサービスモジュール(CSM)90を含み、これは全てのマルチバスIIシステムにおいて要求される標準規格品目(インテルオーダNo.SBC−CSM−001)である。各モジュールは、それぞれのモジュールと制御コンピュータ81との間の通信を制御する実行マイクロコンピュータボード91a,91bを有する。各モジュールの全ての構成要素は、公衆バス92と接続され、一方、これら構成要素間で多量の高速データ転送が必要とされる構成要素は私用バス93により付加的に接続される。

0073

一致モジュール82は更に、監視されるチャンネルそれぞれに対し1つのチャンネルカード94を有している。例えば、ローカル市場における広告局それぞれに1つもっている。チャンネルカード94により、上述された方法で、音声および映像の両方に対し、各フレーム毎に16ビットのパラメータ化された信号データおよびそれに対応する16ビットマスクを生成する。チャンネルカード94はまた、潜在的な未知のセグメントを表示し、あるいは記述および捕捉するのに用いられるアーティファクトの発生を知らせる。更に、一致モジュール82には2つの循環バッファメモリ95が含まれている。一方のバッファ95は音声用であり、もう一方のバッファは、映像用である。上述したように、これらのバッファには、一時的基準で、入力されパラメータ化されたフレームシグナチュアデータが記憶される。この好適な実施例において、認識される放送セグメントの最大長は1分であると考えられる。より長いセグメントに対しては、そのうち1分間部分のみが認識目的に用いられる。従って、各バッファは4,096フレームを保持し得、1秒当り30フレームのフレーム率で映像につき136.5秒となり、また丁度2分超過である。4,096は212であり、各シグナチュアと対応するオフセットデータは(前述したように)、12ビットの長さとなる。パラメータ化された信号情報は、実行マイクロコンピュータ91aにより要求されると、チャンネルカード94から循環バッファ95へと移動する。

0074

一致モジュール82はまた図15に詳細に示されるように相関カード96を有する。相関カード96は、入力される放送セグメントを認識するタスクを実行する。このことは、相関カード96が一致を見つけるために入力映像および音声フレームシグナチュアデータをキーシグナチュアのローカルに記憶されたデータベースと比較することにより達成される。ローカルシグナチュアデータベースはメモリ97に(従来のランダムアクセスメモリの13メガバイトまで)記憶される。この好適な実施例の相関カード96は音声および映像データの両方で作動し得るので(しかし、例えば、映像のみが用いられることが可能であるが)、相関カード96は監視されるチャンネルの2倍に等しい量のデータを処理するのに十分な容量を持たねばならない。

0075

相関カード96は最終相関、すなわちセグメントの一致を決定するための生データを生成するために必要とされる全ての機能を実行する。実行マイクロコンピュータ91aは、相関カード96により行われたキーシグナチュアの比較から得られた一致を蓄積し、そして蓄積された一致を制御コンピュータ81へ転送する。

0076

図15に示されるように、相関カード96はシグナチュア比較プロセッサSCP)101およびマルチバスIIの公衆および私用バスに対する独立した2つのインターフェース102,103を含む。SCP101は実行マイクロコンピュータ91aの命令の基で動作するプログラマブル要素である。SCP101は以下の主要な機能に対し責務を果たす。

0077

1.キーシグナチュア、現在の循環バッファデータおよびセグメントシグナチュア(後者は、このカードが、以下に述べられるように、コプロセッサにおいて用いられる場合である。)をアクセスするためのデータベースメモリ97への全アドレスの生成。

0078

2.フレームシグナチュアデータと記憶されたセグメントシグナチュアの実際のビット毎の比較を実行すること。

0079

3.実行マイクロコンピュータ91aにより要求されるような自己点検診断機能の実行。

0080

4.最終セグメント相関のために実行マイクロコンピュータへ各キーシグナチュアの比較結果を中継すること。

0081

SCP101の制御ユニット104は、SCP101の動作を指示する。制御ユニット104はSCPの動作を定義する全マイクロプログラム命令を備えるメモリを含む。また更に、要求されるマイクロ命令を効率よく配列させ得るに十分な機能性を持つ。制御ユニットの動作は、実行マイクロコンピュータ91aにより生成された命令により上位レベルで指示される。

0082

論理ユニット105は、比較のためにオンボードバッファに入力され且つ以前に定義された基準シグナチュアの両方をロードすべく要求される全アドレスおよびデータの操作を実行する。シグナチュアデータは私用バスによりアクセス可能な外部のオフボードメモリに常駐し、論理ユニット105および制御ユニット104は共に私用バスインタフェース機能の全てを実行する。

0083

また論理ユニット105は、実行マイクロコンピュータ91aへのメッセージを生成すると共に、実行マイクロコンピュータ91aからのメッセージを翻訳する。論理ユニット105により翻訳されたメッセージの一例は、キーシグナチュアデータベースにおける選択されたキーシグナチュアを現在の入力されるセグメントシグナチュアと比較するという要求である。論理ユニット105により生成されたメッセージの一例は、入力されるシグナチュアがどのくらい基準と一致するのか(比較後適正あるいは不適正の合計がどの位あるか)を規定する比較の終了時に生成されるものである。

0084

論理ユニットの周辺ハードウエアモジュール106は、シグナチュア比較の実行に際し、論理ユニット105を補助する。特に、このモジュールはSCP101の処理能力の向上を意図する論理を含む。モジュール106の特徴は次の通りである。

0086

2.内部論理ユニットレジスタの情報が高速で位置的に交換されることを可能にするワードスワップハードウエア。

0087

3.所定のしきい値に対してテストを行う準備段階で、予備のシグナチュア比較結果での実際のビット数を数えるハードウエア。

0088

実行マイクロコンピュータ91aは80286マイクロプロセッサに基づく標準的な市販マイクロコンピュータカード(例えば、インテルオーダーNo.SBC−286−100)である。このカードの機能は以下の通りである。

0089

1.シグナチュアデータベースを保持すること。

0090

2.チャンネルカードから循環バッファへデータを転送すること。

0091

3.キーワードのポインタを保持すること。

0092

4.相関結果を蓄積すること(期間基準を提供する際に用いる)。

0093

5.セグメント識別のためにデータを捕捉すること。

0094

6.制御コンピュータ81に対するインターフェース路を提供すること(中央設備22へ転送されるデータ全部が制御コンピュータ81により要求される。このキーシグナチュアデータベースは、制御コンピュータ81からダウンロードされる。)。

0095

圧縮モジュール83は(中央サービスモジュール90および実行マイクロコンピュータ91bに加えて)音声捕捉カード98a、映像捕捉カード98b、およびそれに対応する循環バッファメモリ99a,99bを有する。音声及び映像捕捉カードは図16および図17に、それぞれ詳しく示される。

0096

音声および映像捕捉カード98a,98bは、各々8つの放送チャンネルまで監視できる(より多くのチャンネルを監視するためには、複数のカードが必要である。)。映像捕捉カード98b、は入力される映像フレームを1秒間に1つのフレームというスライド表示率で捕捉し、そして映像データをディジタル化すると共に圧縮する。一方、音声カード98aは8つのそれぞれのチャンネルに対し連続的に音声をディジタル化して、捕捉する。

0097

8つまでのチャンネルからの音声および映像は、同軸ケーブルによりチャンネルチューナ84からこれらのカード(チャンネルカードと同様に)に送られる。映像捕捉カード98bにおいて、従来の1−オブ−8マルチプレクサ110(本実施例では、CMOS4066集積回路を使用したT形スイッチ回路方式として適用される)により捕捉のために8つのチャンネルのうち1つが選択される。

0098

図16に示されるように、音声カード98aでは、各チャンネルからの音声はナシナルセミコンダクタ3054集積回路のような8つまでのフィルタコーダデコーダ組合わせ回路111のうち1つに送られる。組合わせ回路111において、音声信号はローパスフィルタを通り、そして圧縮された振幅をもつディジタル信号を結果として生じる対数的アナログディジタル変換を行うコーダ/デコーダを通る(音声信号は、中央設備22においてオペレータにより検査される前に再度拡張される。)。次に、圧縮ディジタル信号は更に圧縮されるように、電話機業界で使われているものと同じアダプティブディファレンシャルパルスコードモジュレイタ(ADPCM)112− 例えば、NEC7730集積回路 −を通過させる。インテル80188マイクロプロセッサ113によりADPCM112からバスインターフェース114を介して圧縮モジュール83の私用バス93へ、更に、循環バッファメモリ99aへの圧縮音声データの動きが制御される。JEDEC規格のRAM/EPROM113aは、マイクロプロセッサ113により使用されるプログラムおよびメモリのワークスペースを持つ。

0099

図17に示されるように、映像カード98bにおいて、共通の映像回路115は、映像信号のアナログ−ディジタル変換のためのクロックパルスとアドレスを生成するために、受信されたアナログ映像信号に含まれる同期信号を使用する。回路115は、116および117で1秒当り1フィールドの率で映像を表示するアドレス信号とディジタル化されたデータ信号の両方をそれぞれに出力する。データは算術論理ユニットALU)118を通過する。その算術論理ユニット(ALU)では、映像フィールドあるいはフレームを160(水平)×120(垂直)画素に低減することにより、更に映像データが圧縮される。各画素は寸法当り4×2画素領域で平均化され、グレイスケール画素平均値が採用される。アドレスデータは、共通の映像回路115から疑似ランダム数−回路115による各映像アドレス出力の数−の表を有するディザPROM119へと通過する。アドレスがディザPROM119により受信された場合、そのアドレスに対応する疑似ランダム数はALU118を通過し圧縮映像データに加えられる。このディザリング技術により、低情報内容の映像信号が視覚的に改善され、映像フレームが9600バイトほどに圧縮され得ることが可能になる。ディザされた圧縮映像データは2つのラインバッファ1101a,b(一方が読まれていたり、空になっている間は、他方が満たされている)のうちの1つに送られ、そこから、ダイレクトメモリアクセスコントローラ1102の制御の基に、圧縮モジュール83の私用バス93へそして循環バッファメモリ99bへと通過する。

0100

音声および映像データは、制御コンピュータ81および実行マイクロコンピュータ91bの指示により、そのチャンネルの最も最近の2分間のデータを保持している循環バッファ99aおよび99bに配置される。実行マイクロコンピュータ91bは、好適には80286マイクロプロセッサに基づく標準的な市販マイクロコンピュータカード(例えば、インテルオーダNo.SBC−286−100)である。このカードにより制御コンピュータ81へのインターフェース路が設定される。中央設備へ転送される全データは、制御コンピュータ81により要求される。

0101

信号処理サブシステム80はローカル設備21のフロントエンドと称され、制御コンピュータ81はバックエンドと称される。

0102

制御コンピュータ81(図13)は、好適にはDEC VMS仮想メモリオペレーティングシステムで動作するディジタルイクイップメント コーポレイション(DEC)製の市販マイクロバックスIIミニコンピュータである。RAMメモリの1と9メガバイト間には、456メガバイトの容量を持つDEC RA81ウインチスタディスクドライブコントローラ付き)が使用されている。DPV11同期インターフェースは、制御コンピュータ81をモデムを介して通信チャンネル23a,bへ接続する。DRV11ダイレクトメモリアクセスコントローラが、制御コンピュータ81を信号処理サブシステム80に接続する。

0103

制御コンピュータ81の機能は検出されたアーティファクトを用い、いつ新規で且つ未知の放送セグメントが受信されたのかを決めることである。また制御コンピュータ81は、セグメントが中央設備22により識別されるまで、そのようなセグメントを一時的記録のトラックに保持する。制御コンピュータ81の別の機能は、期間や日時などの他の基準に基づいて、実行マイクロコンピュータ91aにより蓄積された一致が、実際にセグメントが認識されたということを表すかどうかを決めることである。(例えば、プライムタイムでは、例えば、その時間の7分後には広告は通常放送されていない。)これらの機能を実行する際に、制御コンピュータ81は、実行マイクロコンピュータ91a、91bを介して、全セグメント処理サブシステム80を制御する。

0104

制御コンピュータ81の指示により、モジュール82および83は音声/映像データを捕捉するためにある特定のチャンネルにチューニングされ、一対のフレームおよびキーシグナチュアを比較し、又はローカルシグナチュアを生成する。これらの指示は制御コンピュータ81自体あるいは最終的に中央設備22で発せられる。例えば、新規のセグメントを識別する際に、オペレータは高解像度の映像情報を必要とするかもしれない。その場合、制御コンピュータ81は、所望のセグメントが次に受信される際、モジュール83が要求されたデータを捕捉するよう要求することにより、中央設備22からの指示に基づいて実行する。制御コンピュータ81はまた、RAMメモリ97に記憶されたシグナチュアデータベースのバックアップコピーディスクに記憶する。

0105

再び図2を参照すると、中央システム22は中央−ローカル設備21a、コプロセッサ25、大容量記憶装置28と結合されたメインフレーム”ホスト”コンピュータおよびメモリ27、通信プロセッサ29およびワークステーション26を含む。

0106

コプロセッサ25は、中央設備22のシグナチュア処理必要条件に関するある集約計算機能を補助するのに用いられる。コプロセッサ25のフロントエンドは、チャンネルカード94のコプロセッサ25からの省略以外は、前述したように、ローカル設備21の一致モジュール82と同一である。しかしながら、コプロセッサ25内のシグナチュアデータベース用メモリは、全ローカル設備で用いられる全キーシグナチュアがコプロセッサ25に常駐されるように、ローカル設備のメモリより拡張されるのが望ましい。

0107

コプロセッサ25のバックエンドは、異なる種類のコンピュータを使用できるけれども、好適にはローカル設備21(図13)で用いられたものと同じマイクロVAXコンピュータを使用する。その他の変更は、コプロセッサのフロントエンドを中央設備において通信プロセッサ29に取り付け得ることである。また、第1のコプロセッサに故障が起こった場合においてもバックアップシステムが使用できるように、コプロセッサのハードウエアは中央設備で二重にされることが望ましい。コプロセッサのシグナチュア生成および比較機能はフロントエンドで行われ、一方、上述したように検査およびグループ分け機能はフロントエンドの比較機能を利用し、そのバックエンドによって制御される。

0108

ワークステーション26により新規且つ未知のセグメントがオペレータに提供され、そしてオペレータにより分類分けされる。またワークステーション26の第2の機能は、ホスト常駐のデータベースを保持する際の端末として動作することである。ワークステーション26は以下のように構成される。

0109

1.ホストコンピュータ27とローカル処理および通信することができる標準IBM3270ATコンピュータ

0110

2.3270ATと接続された30MBのハードディスク駆動装置、1.2MBのフロッピー駆動装置カラーコンソールモニタキーボード

0111

3.2つのセグメントを同時に見るための2つの映像モニタ

0112

4.セグメントの音声部分聴取するための音声出力装置(例えば、ヘッドフォン)。

0113

5.セグメントの映像部分を制御するための3270ATに装着された映像カード。

0114

6.セグメントの音声部分を制御するための3270ATに装着された音声カード。

0115

ワークステーション26の心臓部はIBM3270ATコンピュータである。3270ATはIBM3270端末とIBM ATパーソナルコンピュータとを結合したものである。これら構成要素を結合することにより、非常に効果的なメインフレームのワークステーションが作成される。ワークステーション26は常にホスト27と容易に通信でき、またそれ自身の処理能力を有する。コンソールスクリーン上の別々のウィンドゥにローカル処理を全て見られるばかりでなく、ホスト27との4つまでのセッションを開始することができる。ホストとローカル処理の組合わせはオペレータによって行われる。

0116

3270ATに備えられる映像カードにより、2つの異なるセグメントが表示できる。各映像カードは、圧縮されたグレイスケール映像データを保持するための一対の”ピンポン”(A/B RAM)メモリから構成される。ピン−ポンメモリは2つの方法のうち1つが使用され得る。1つは、RAM Bが表示されている間に、セグメントがRAM Aにプレ・ロードされる。もう1つは、他のメモリが表示されている間に、ピン−ポンメモリをセグメントの次のフレームをロードするのに使用することができる。グレイスケールデータは、映像ディジタル−アナログ変換器を通過する前に映像フォーマットに戻され、スムーズ化される。

0117

音声制御カードもまた、3270AT内に設けられる。音声制御カード上のADPCM回路(例えば、NEC7730)はデータを拡張し、オペレータのヘッドフォンで再生されるアナログ情報に変換するために、シリアルビット列を出力する。

0118

ワークステーション26は、新規の広告セグメントの識別処理を支持し、装置および構成要素の状態を検査するために自己点検ルーチンを備える。ワークステーション26はホスト27から必要な情報を要求し、結果を返送する単独動作モードで操作することが可能である。また、ホスト27は応用制御でき、ワークステーション26への音声/映像要求を送ることができる。オペレータはワークステーション26で、音声および映像カードを制御して、選択されたセグメントの音声および/もしくは映像部を表示し出力させることができる。

0119

ホストコンピュータ27は、好適にはIBM3083のような308XシリーズのIBMメインフレームである。ホストコンピュータ27は、広域シグナチュアデータベースのコピーと、およびシグナチュアデータベースが生成された、パラメータ化され圧縮された音声/映像データの全記録とを保持する。この記録により、例えば突発的な事故でデータが消滅したような場合にも、シグナチュアデータを作成しなおすことができる。

0120

ホストコンピュータ27には、以下の市販のソフトウエアパッケージが使用される。

0121

1.オペレーティングシステム−IBM MVS/XA。

0122

2.通信ソフトウエア−IBM ACF/VTAM,NCP,NPAA。

0123

3.遠隔通信モニタ−IBMCICS。

0124

4.データベース管理システム−Cullinet IDMS。

0125

ホスト27はまた、ワークステーション26、コプロセッサ25および最終的にローカル設備21に指令する。例えば、ある特定のローカル設備21からの追加情報が必要であるということを決定する。適当なローカル設備の制御コンピュータ81に対し信号処理サブシステム80が追加データを捕捉しあるいは、例えば、以前に捕捉されていたデータをアップロードするよう要求するための指示による決定に基づきホスト27は作動する。

0126

ホスト27はまた、セグメントの発生に関しては、システムの使用者により要求された1又はそれ以上のレポートおよび生成の記録をコンパイルするために種々のローカル設備21により転送された情報を使用する。

0127

通信チャンネル23a,bおよび通信プロセッサ29は、図18により詳細に示されている。この実施例において、コプロセッサ25は、分離制御コンピュータ121を有しているが、上記したように、そのコンピュータの機能は通信プロセッサ29により操作される。

0128

中央設備22およびローカル設備21内の全ての通信は、ディジタルイクイップメント コーポレイション(DEC)の装置により統合される。したがって、このシステムを介する通信はDECのDECNetプロトコルに基づくものである。中央設備22内では、DECNetプロトコルがローカル領域ネットワーク120上で作動する。DECNetとIBMのシステムネットワークアーキテクチャ間の翻訳をするために、DEC製のSNAゲートウエイがローカル領域ネットワーク120に接続される。その結果、ホスト27と残りのシステムとの間の通信ができる。IBM3725通信制御装置123は、SNAゲートウエイ122とホスト27間をインターフェースする。IBM3274クラスターコントローラ124は装置123およびワークステーション26間をインターフェースし、その結果、ワークステーション26がホスト27と通信できるようになる。中央−ローカル設備21aは、上述したように、高速リンク24によりローカル領域ネットワーク120と接続される。

0129

通信制御コンピュータ29は、好適にはディジタルイクイップメント コーポレイションVAX8200である。コプロセッサ制御コンピュータ121は同じコンピュータであり、実際、上述したように、その機能は所望ならば通信制御コンピュータ29により実行することができる。

0130

通信制御コンピュータ29は、ローカル領域ネットワーク120とローカル設備21間をインターフェースする。高速あるいは大容量通信が必要あるいは所望される市場−例えば、ニューヨーク、シカゴやロサンジェルスのような主要な競争の激しい市場におけるローカル設備21にとって、通信は高速リースライン23bによって行われる。しかし、大抵のローカル設備21において、周知のX.25プロトコルを実行する低速のパケットスイッチングデータネットワーク23aが用いられる。X.25プロトコルはDECNetに対し透過性であり、TelenetあるいはTymnetのような広告データ通信ネットワークを利用できる。個々のローカル設備21とネットワーク23a間の通信ライン125は、リースラインによりあるいは電話ダイアルアップネットワークを介してのどちらによっても提供できる。

発明の効果

0131

このように、本発明による放送セグメントの認識方法および装置により、合図や信号のコードを用いずに、多くの放送セグメントの発生を、正確に(エラー率は1%以下)、高速で且つ信頼性を損なわずに記録することができ、更に、少ない人的労力で新規セグメントを識別できる。

0132

本発明はここに記載された実施例に限らず実施されること、ここに記載された実施例は本発明の説明を目的とし本発明を限定するものではないこと、および本発明は特許請求の範囲にのみ限定されるものであること、は当業者にとって容易に理解される。

図面の簡単な説明

0133

図1パラメータ化される信号データを導出するための見本とした映像フレームの領域説明図である。
図2本発明に係る装置のブロック結線図である。
図3本発明に係る装置の実験的ローカル設備のブロック結線図である。
図4図3に示す装置に使用されるソフトウエアプログラムのフローチャート図である。
図5図3の装置に使用されるソフトウエアプログラムのフローチャート図であり、図4の分図である。
図6図3の装置に使用される第2のソフトウエアプログラムのフローチャート図である。
図7図3の装置に使用される第2のソフトウエアプログラムのフローチャート図であり、図6の分図である。
図8図3の装置に使用される第2のソフトウエアプログラムのフローチャート図であり、図7の分図である。
図9図3の装置に使用される第3のソフトウエアプログラムのフローチャート図である。
図10図3の装置に使用される第3のソフトウエアプログラムのフローチャート図であり、図9の分図である。
図11図3の装置に使用される第4のソフトウエアプログラムのフローチャート図である。
図12図3の装置に使用される第4のソフトウエアプログラムのフローチャート図であり、図11の分図である。
図13本発明に係る装置のローカル設備のブロック結線図である。
図14図13の信号処理サブシステムのブロック結線図である。
図15図14の相関カードのブロック結線図である。
図16図14の音声捕捉カードのブロック結線図である。
図17図14の映像捕捉カードのブロック結線図である。
図18本発明に係る装置の中央設備とシステム通信のブロック結線図である。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ