図面 (/)

技術 インターネット上で運用されている複数の検索エンジンを使ってWEBページの検索レポートを作成する方法と装置

出願人 株式会社ガーラ
発明者 菊川暁
出願日 2000年5月17日 (19年4ヶ月経過) 出願番号 2000-145098
公開日 2001年11月22日 (17年10ヶ月経過) 公開番号 2001-325275
状態 特許登録済
技術分野 検索装置 計算機間の情報転送
主要キーワード 事業コスト クエリー情報 情報精度 企業ホームページ 開発技術 ネットワーク結合 報告対象 重複排除
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2001年11月22日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (4)

課題

経時的、内容的に重複を除き、最新明確な報告を多数の利用者に迅速に提供出来るWEBページ検索レポートを作成する方法と装置を提供する。

解決手段

複数の検索エンジンSにクエリーを発しキーワードを含む検索条件を共通に与える。クエリーに対する各検索エンジンSからの検索レポートであるエンジン別検索レポートは、クエリーに対しヒットしたWEBページPのURLと更新日時との集合であるエンジン別ヒットリストを含む。このリスト対照しURLの重複を検出排除して更新日時が最新のデータを採択しエンジン統合ヒットリストを作る。最新のエンジン統合ヒットリストと前回のエンジン統合ヒットリストとを対照し、最新リストにのみ含まれるURLと既存でも更新日時が新しいURLを抽出し報告対象URLとする。このURLに該当するWEBページPを取得し、キーワードに基づいて文字情報摘出してインデックスを作る。1つのクエリーを起源とする複数の報告対象URLに基づいて作られたインデックス集合をエンジン統合検索レポートとして依頼人送達する。

概要

背景

従来企業における業務の効率化、人員の削減、或いは多業種間での商品共同購入による事業コストの削減などをにらんだEコマース電子商取引)サイトや、企業コンセプトなどを発信する企業ホームページがあらゆる業種において勃興しつつあり、また躍進著しいIT(情報関連)企業の提供する各種コミュニティサイト掲示板システムなどもインターネット上においてその数を急速に伸ばしている。また、こういった大規模な企業のみならず個人においても趣味ホームページやごく小規模な個人電子商店等を立ち上げることが盛んになっており、インターネットにおけるWEBページ総数は膨大な数にのぼっている。

そして、このように膨大なWEBページの中から所望の情報のみを検索抽出し、希望者配送する情報クリッピングサービスなるものの需要が特に企業において根強い。自社や自社商品等に関係したキーワードに対し検索を行うクリッピングサービスにより、世間一般に流布されている自らのイメージを知り、以後の経営生かす意向が強いためである。この情報クリッピングサービスは、当該サービスを提供する企業独自の情報検索システムの他、インターネット上のポータルサイト等に備えられた検索エンジンを用いて、所定のキーワードに対する全文検索を行い、その検索結果である文書情報を一定日時毎にメール配信するのが一般的である。

概要

経時的、内容的に重複を除き、最新明確な報告を多数の利用者に迅速に提供出来るWEBページの検索レポートを作成する方法と装置を提供する。

複数の検索エンジンSにクエリーを発しキーワードを含む検索条件を共通に与える。クエリーに対する各検索エンジンSからの検索レポートであるエンジン別検索レポートは、クエリーに対しヒットしたWEBページPのURLと更新日時との集合であるエンジン別ヒットリストを含む。このリスト対照しURLの重複を検出排除して更新日時が最新のデータを採択しエンジン統合ヒットリストを作る。最新のエンジン統合ヒットリストと前回のエンジン統合ヒットリストとを対照し、最新リストにのみ含まれるURLと既存でも更新日時が新しいURLを抽出し報告対象URLとする。このURLに該当するWEBページPを取得し、キーワードに基づいて文字情報摘出してインデックスを作る。1つのクエリーを起源とする複数の報告対象URLに基づいて作られたインデックス集合をエンジン統合検索レポートとして依頼人送達する。

目的

しかし、このメタ検索エンジンは、単に各検索エンジンにおいて得られる検索結果を羅列するに過ぎず、検索エンジン相互に発生している検索結果の重複を排除する機能もなく、また、更新以前の古い情報を除き常に最新の情報のみを抽出して表示するといった機能も備えていなかった。しかも、検索にヒットしたWEBページのURLに付す説明としては、各検索エンジンが一般に提供する説明文や各WEBページ先頭HTMLを単純に抜粋して転載したものであり、検索キーワードに本当に対応した検索結果であるのか、一見して判断することは困難であった。

してみれば、上記のような検索手法から得られた情報をもとに構成されたクリッピングサービスは、結局のところこのサービスを利用している各自で、配信された情報についてわざわざWEBページにアクセスしたりして確度と最新性とを高める必要がある情報しか提供できないのであった。他方、重複情報を除いて提供する情報精度を高めようとすれば、検索結果の妥当性や最新性の確認はほとんどすべて人間によらなければならない。つまり多数の利用者毎の異なる検索対象について得られた多様な検索結果全てに目を通し、重複部分については取り除き、最新の情報だけを取り出す手作業を、例えば一日で処理して毎日配信する作業が必要とされる。このため、配置されるべき人員や機材を想定すれば事業ベースに乗せることなど到底かなわないと言える。

本発明はこのような従来の課題に着目してなされたもので、経時的にも内容的にも重複情報を確実に排除し、常に最新で明確な検索結果を多数の利用者に迅速に提供可能であるインターネット上で運用されている複数の検索エンジンを使ってWEBページの検索レポートを作成する方法と装置を提供するものである。

効果

実績

技術文献被引用数
1件
牽制数
11件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

次の特定事項(1)〜(6)を充足する発明。(1)インターネットに接続されたサーバコンピュータにより実行される情報処理方法であって、インターネット上で運用されている複数の検索エンジンを使ってWEBページ検索レポートを作成する方法である。(2)依頼人から指定されたキーワードを含む検索条件を保存しておく。インターネット上で運用されている複数の検索エンジンに対してクエリー発行して保存された前記検索条件を共通に与えることを定期的に繰り返す。(3)前記クエリーに対して各検索エンジンからそれぞれ送られてくる検索レポート(エンジン別検索レポートとする)を受領する。各エンジン別検索レポートには前記クエリーに対してヒットしたWEBページのURLと更新日時とが含まれている(このURLと更新日時のデータ集合のことをエンジン別ヒットリストとする)。(4)各エンジン別ヒットリストを対照し、同一URLの重複を検出して更新日時が最新のデータを採択することで、同一URLの重複を排除したエンジン統合ヒットリストを作成する。(5)作成された最新のエンジン統合ヒットリストと前回作成された古いエンジン統合ヒットリストとを対照し、最新リストに含まれていて古いリストに含まれていないURLを抽出するとともに、両リストに含まれているが最新リストの方が更新日時が新しいURLを抽出し、これらURLを報告対象URLとして集約する。(6)報告対象URLをインターネットに送出して該当するWEBページを取得し、前記クエリー中の前記キーワードに基づいて前記WEBページから文字情報摘出してインデックスを作成する。1つの前記クエリーを起源とする複数の報告対象URLに基づいて作成されたインデックス集合をエンジン統合検索レポートとして前記依頼人に送達する。

請求項2

インターネット上で運用されている複数の検索エンジンを使ってWEBページの検索レポートを作成する請求項1に記載の情報処理方法を実行する前記サーバコンピュータとしての情報処理装置

技術分野

0001

本発明はインターネット上で運用されている複数の検索エンジンを使ってWEBページ検索レポートを作成する方法と装置に関する。

背景技術

0002

従来企業における業務の効率化、人員の削減、或いは多業種間での商品共同購入による事業コストの削減などをにらんだEコマース電子商取引)サイトや、企業コンセプトなどを発信する企業ホームページがあらゆる業種において勃興しつつあり、また躍進著しいIT(情報関連)企業の提供する各種コミュニティサイト掲示板システムなどもインターネット上においてその数を急速に伸ばしている。また、こういった大規模な企業のみならず個人においても趣味ホームページやごく小規模な個人電子商店等を立ち上げることが盛んになっており、インターネットにおけるWEBページの総数は膨大な数にのぼっている。

0003

そして、このように膨大なWEBページの中から所望の情報のみを検索抽出し、希望者配送する情報クリッピングサービスなるものの需要が特に企業において根強い。自社や自社商品等に関係したキーワードに対し検索を行うクリッピングサービスにより、世間一般に流布されている自らのイメージを知り、以後の経営生かす意向が強いためである。この情報クリッピングサービスは、当該サービスを提供する企業独自の情報検索システムの他、インターネット上のポータルサイト等に備えられた検索エンジンを用いて、所定のキーワードに対する全文検索を行い、その検索結果である文書情報を一定日時毎にメール配信するのが一般的である。

発明が解決しようとする課題

0004

しかしながら、例えばインターネット上の単独の検索エンジンを使ってクリッピング作業を行うとした場合、検索エンジン毎登録整理されているWEBページのジャンルや数が異なり、単独の検索エンジンのみから得られる検索結果は限定的なものとなるから低い有用性しか発揮しえない。したがって、インターネットという、国籍年齢性別、趣味等を越えて極めて広範に亘った情報ソースの中から求めている情報を確実に獲得するという意義自体が薄れ、クリッピングサービスの信頼性、実用性の低下が否めない。

0005

一方、単独の検索エンジンに依存した場合の上記欠点を補う意味でメタ検索エンジンを用いることが考えられる。このメタ検索エンジンは所定のクエリーを同時に複数の検索エンジンに向けて発することで、今まで各検索エンジンにて逐一検索作業を行って別個画面上で各検索結果を得ていたのが、複数の検索エンジンの検索結果について一括表示出来るようにしたものである。

0006

しかし、このメタ検索エンジンは、単に各検索エンジンにおいて得られる検索結果を羅列するに過ぎず、検索エンジン相互に発生している検索結果の重複を排除する機能もなく、また、更新以前の古い情報を除き常に最新の情報のみを抽出して表示するといった機能も備えていなかった。しかも、検索にヒットしたWEBページのURLに付す説明としては、各検索エンジンが一般に提供する説明文や各WEBページ先頭HTMLを単純に抜粋して転載したものであり、検索キーワードに本当に対応した検索結果であるのか、一見して判断することは困難であった。

0007

してみれば、上記のような検索手法から得られた情報をもとに構成されたクリッピングサービスは、結局のところこのサービスを利用している各自で、配信された情報についてわざわざWEBページにアクセスしたりして確度と最新性とを高める必要がある情報しか提供できないのであった。他方、重複情報を除いて提供する情報精度を高めようとすれば、検索結果の妥当性や最新性の確認はほとんどすべて人間によらなければならない。つまり多数の利用者毎の異なる検索対象について得られた多様な検索結果全てに目を通し、重複部分については取り除き、最新の情報だけを取り出す手作業を、例えば一日で処理して毎日配信する作業が必要とされる。このため、配置されるべき人員や機材を想定すれば事業ベースに乗せることなど到底かなわないと言える。

0008

本発明はこのような従来の課題に着目してなされたもので、経時的にも内容的にも重複情報を確実に排除し、常に最新で明確な検索結果を多数の利用者に迅速に提供可能であるインターネット上で運用されている複数の検索エンジンを使ってWEBページの検索レポートを作成する方法と装置を提供するものである。

課題を解決するための手段

0009

この発明は上記目的を達成するためになされたもので、第1の発明は、次の特定事項(1)〜(6)を充足する発明。

0010

(1)インターネットに接続されたサーバコンピュータにより実行される情報処理方法であって、インターネット上で運用されている複数の検索エンジンを使ってWEBページの検索レポートを作成する方法である。

0011

(2)依頼人から指定されたキーワードを含む検索条件を保存しておく。インターネット上で運用されている複数の検索エンジンに対してクエリーを発行して保存された前記検索条件を共通に与えることを定期的に繰り返す。

0012

(3)前記クエリーに対して各検索エンジンからそれぞれ送られてくる検索レポート(エンジン別検索レポートとする)を受領する。各エンジン別検索レポートには前記クエリーに対してヒットしたWEBページのURLと更新日時とが含まれている(このURLと更新日時のデータ集合のことをエンジン別ヒットリストとする)。

0013

(4)各エンジン別ヒットリストを対照し、同一URLの重複を検出して更新日時が最新のデータを採択することで、同一URLの重複を排除したエンジン統合ヒットリストを作成する。

0014

(5)作成された最新のエンジン統合ヒットリストと前回作成された古いエンジン統合ヒットリストとを対照し、最新リストに含まれていて古いリストに含まれていないURLを抽出するとともに、両リストに含まれているが最新リストの方が更新日時が新しいURLを抽出し、これらURLを報告対象URLとして集約する。

0015

(6)報告対象URLをインターネットに送出して該当するWEBページを取得し、前記クエリー中の前記キーワードに基づいて前記WEBページから文字情報摘出してインデックスを作成する。1つの前記クエリーを起源とする複数の報告対象URLに基づいて作成されたインデックス集合をエンジン統合検索レポートとして前記依頼人に送達する。

0016

また、第2の発明は、インターネット上で運用されている複数の検索エンジンを使ってWEBページの検索レポートを作成する第1の発明に記載の情報処理方法を実行する前記サーバコンピュータとしての情報処理装置である。

発明を実施するための最良の形態

0017

本実施例においては、例えば自らの対外イメージや誹謗中傷記事などを客観的調査したい企業を依頼人として設定し、この依頼人が自社や自社製品・サービスの名称通称愛称などを検索キーワードとして指定した場合を想定する。WEBページの検索レポート作成サービス(以後、クリッピングサービスと称する)を行うクリッピング業者は、前記検索キーワードに基づいてクリッピング作業を行うのである。

0018

クリッピング対象としての情報ソースは、一般的ニュースソースたる新聞雑誌などのオンラインサービスの他に、各種電子掲示板メーリングリスト、企業や個人のホームページなどが考えられる。基本的にはクリッピング業者がクリッピング作業に使用するコンピュータネットワーク結合され、検索エンジンによる検索が可能な形式のものであれば、いかなる情報ソースでもクリッピング対象となりうる。

0019

====クリッピングサービスを実現する基本システム====
図1は本発明のWEBページの検索リポート作成方法を実現する基本システム図である。クリッピングサービスの提供を望む依頼人は例えばクリッピング結果(検索レポート)を受け取るための装置としてユーザコンピュータ10を備えている。このコンピュータ10は公衆回線を介してインターネットに接続されているものであり、電子メールソフトWEBブラウザインストールされている。一般にクリッピングサービスは商業ベースで運営されるものであるから、このユーザコンピュータ10は依頼人の数だけ広域的に多く並存しており、インターネットを介して下記のサーバコンピュータ20と集約的に結ばれている。

0020

一方、クリッピング業者は、依頼人から示された指定キーワードを含むクエリーを複数の検索エンジンに発行し、最終的に、前記クエリー中の検索キーワードに基づきヒットした各WEBページのインデックスを作成し、そのインデックス集合をエンジン統合検索レポートとして依頼人に送達するといったプロセスを実行するサーバコンピュータ20を備えている。

0021

このサーバコンピュータ20は、SMTP(Symple Mail Transfer Protocol)、POP(Post Office Protocol)などの標準的な電子メール転送用のプロトコルに基づき、インターネットを通じて他のコンピュータと電子メールの送受信を行う電子メールサーバとしての機能や、HTML(Hypertext Markup Language)ファイルをHTTP(Hypertext Transfer Protocol)を使ってクライアント(この場合、ユーザコンピュータ10)に配信し、クライアントのWEBブラウザが表示できるようにするWEBサーバとしての機能を備えるコンピュータである。このサーバコンピュータ20がインターネット上の各種検索エンジンを用いた検索作業等を行うわけであるから、勿論WEBブラウザや電子メールソフトもインストールされ使用可能となっている。

0022

上記のように、ユーザコンピュータ10とサーバコンピュータ20とがインターネットを介して結合されて、クリッピングサービスの依頼や検索キーワードの設定といった依頼人側からのアクションと、それに対するクリッピング結果の送達(例えば電子メールを利用)といったクリッピング業者からのリアクションが一定日時毎に往来することとなる。

0023

前記サーバコンピュータ20とインターネットを介して結びついて、クリッピング対象としての情報ソースを提供するのが、新聞や雑誌などのオンラインサービスを行っているニュースサーバ21や、メッセージ掲載希望者からインターネットを介して投稿されたメッセージを定型の画面データ(通常はHTML形式)に作成し、その画面データをインターネット上に公開する電子掲示板サーバー22、電子メールの送受信や管理等を行うメールサーバ23、および企業や個人のホームページなどを配信するWEBサーバ24などである。

0024

上述のユーザコンピュータ10、サーバコンピュータ20、並びにその他のサーバ類21、22、23、24はいずれもインターネットを介して接続されているとしたが、これに限定されず、利用目的や必要機能に応じてLANやパソコン通信等種々の接続手段を利用できるものとする。

0025

また、サーバコンピュータ20は、1つのサーバコンピュータに全ての機能を集約させて用いてもよいが、複数のサーバコンピュータをネットワーク結合させ種々の作業を分散処理することとしてもよい。

0026

====依頼人および検索キーワードの登録====
図2は本発明のWEBページの検索レポート作成方法を表す流れ図である。クリッピングサービスを希望する依頼人は、インターネットに接続されているユーザコンピュータ10により例えばクリッピングサービスを提供するWEBサイトのURLをサーバコンピュータ20に送信する。ユーザコンピュータ10とサーバコンピュータ20とが接続されると、登録申請画面(図示しない)がサーバコンピュータ20より送達される。

0027

登録申請画面には例えば検索条件としての、企業名(氏名)、住所配信希望メールアドレス代金決済手段などの依頼人情報と、検索対象を絞り込むための検索キーワード(複数指定可能)や検索にヒットしたWEBページ上の抜粋範囲を設定するクエリー情報とを入力するブランクボックスプルダウンメニューが設けられている。抜粋範囲とは、クエリー(検索キーワード含む)に対しヒットしたWEBページを記述しているHTMLのうち、検索キーワード前後の所定範囲について文字数として規定する範囲である。例えば“100文字”と指定すれば検索キーワード前後100文字分のHTMLを抜粋しサーバコンピュータ20内に取り込むのである。

0028

また、検索キーワードは依頼人の判断で決定されるべき性質のものであり、例えば自社商品のイメージを探るべく、「・・・株式会社」、「・・・ビール」、「イメージ」、「のどごし」、「きれ」などと設定すると、会社名とビール名とをAND検索で結びつけ、それ以下の「イメージ」、「のどごし」、「きれ」などのキーワードについてOR検索条件付けを行うなどして効率的な検索が実行される。 他方、自社に対する誹謗中傷記事を探し出して早めの顧客対策を行いたいといった要望がある場合、自社名や商品名などの他に、「クレーム」、「告発」、「糾弾」といった検索キーワードを設定する。そのほかにも、自社の開発技術と関連する学術研究論文や、ニュース、外国機関発表記事などに対応付けされた検索キーワードを据えて世界の最新技術動向を知るといった設定も行える。

0029

依頼人が上述したような所定事項記入・選択して登録操作を行うとユーザコンピュータ10は登録申請画面に記入された依頼人情報やクエリー情報などの検索条件をサーバコンピュータ20へ返送する。

0030

サーバコンピュータ20は、ユーザコンピュータ10から送られてきた検索条件に対して例えば「企業・個人は実在のもので、その決済手段が正当なものか」などの検証を行い、検証により正当と認められた場合はその内容を依頼人情報ファイル30に整理して記録する。もしくはこのクリッピングサービスを利用するにあたり予め郵送などにより申し込み書面を依頼人に提出させ、前記登録申請画面ではその依頼人情報の再度の確認と、検索キーワードの設定のみを行うとしてもよい。

0031

依頼人情報ファイル30は依頼人の企業名(氏名)、住所、電子メールアドレス等のID情報と、検索キーワードや検索にヒットしたWEBページ上の抜粋範囲を設定するクエリー情報とが依頼人ごと整理され検索条件として記録されるものであり、ハードディスク装置などの外部記憶装置上に作成される。なお、この依頼人情報ファイル30中には、例えば企業名を格納した企業名テーブル31、検索キーワードを格納した検索キーワードテーブル32が階層的に設けられている。

0032

このように、依頼人はクリッピング業者が提供する登録申請画面に検索キーワードなどの必要事項を記入し登録しておけば、一旦登録したこの検索条件に基づいて本発明を適用したクリッピングサービスによりインターネット上の所望の情報を例えば電子メールで定期的に通知してもらえるのである。

0033

====WEBページの検索レポートを作成する手順====
1.メインプログラム
本発明においてWEBページの検索レポートの作成を実際に行うメインプログラムとして、Perl(Practical Extraction and Report Language)言語でスクリプト記述をしたCGI(Common Gateway Interface)プログラムを想定する。このメインプログラムは、依頼人毎(ユーザコンピュータ10毎)に動作するものであり、前記の依頼人のID情報(名称そのまま、もしくは記号化されたID名)と電子メールアドレスとを引数とする。また、登録申請画面において入力したクエリー(検索キーワード含む)をサーバコンピュータ20内の検索キーワードテーブル32などから引き出し、SQL(Strucured Query Language)言語に変換して所定の検索エンジンSに発行する任を果たす。この際、企業名テーブル31から引き出した依頼人の企業名も検索キーワードに絡めて対応付けしておく。

0034

またこれに対し、所定の検索エンジンSは、各々の検索エンジンが備えるデータベース内のURLレコードに沿って前記検索キーワードに基づいた全文検索をし、その検索結果であるエンジン別検索レポートをメインプログラムへとそれぞれ返す。得られたエンジン別検索レポートは、各キーワード、各検索エンジンS毎に分類されてエンジン別ヒットテーブル40(ハードディスクなど外部記憶装置内に設けられる)へと記録される。以下得られる検索結果は対応したテーブル名を付けて外部記憶装置に適宜記録するものとする。

0035

メインプログラムが使用する検索エンジンSは複数あり、例えばクエリー発行順序を設定して使用序列固定化しておく。なお、エンジン別ヒットテーブル40に記録された検索エンジンS毎のWEBページのヒット数が同一であれば、日時が更新されていたとしても新規のWEBページは無いものと判断して処理の高速化を図ると好ましい。

0036

各エンジン別検索レポートには前記クエリーに対してヒットしたWEBページのURLと更新日時のリストが含まれている。エンジン別検索レポートの前記リストのことをエンジン別ヒットリストと称する。このエンジン別ヒットリストを検索エンジンSに跨って相互に対照し、URLが同じであればその重複したWEBページを排除し更新日時が最新のデータを採択することで、更新日時情報を各々備えたURLリストを作成する。このURLリストのことをエンジン統合ヒットリストと称し、統合ヒットテーブル50に記録される。各検索エンジンS毎に同じWEBページがそれぞれ登録されている場合はかなり多く、このURLに基づいた重複排除を行わなければ迅速な検索は難しくなる。

0037

前記エンジン統合ヒットリストは、一旦登録しておいたクエリーを検索エンジンSに定期的に繰り返し発行することで、一定日時毎に繰り返し作成される。検索エンジンSの登録更新ペースに合わせて、例えば毎日、あるいは1週間毎に行われると効率的である。最新のエンジン統合ヒットリストの作成にあたっては、その直前に作成された古いものと当該リスト中のURLおよび更新日時について対照しその重複を排除する。

0038

例えば、最新リストには含まれているが古いリストには含まれていないURLは、対応する検索エンジンに新規登録されたものであるとしてこれを抽出し、新旧両リストに含まれているURLではあるが最新リストでは更新日時が新しくなっている場合、WEBページ内容が更新されているとしてこれも抽出する。このように得られた最新で重複のないURLを集約し報告対象URLとする。この報告対象URLは統合ヒットテーブル50内に収められる。

0039

従って、一番最初に作成したエンジン統合ヒットリストと比較して、繰り返し作成されればされるほどその重複部分は排除され、当該リストのサイズは絞られるのが普通である。このようにして統合ヒットテーブル50には常に最新のエンジン統合ヒットリストおよび報告対象URLのみが残されることとなる。

0040

2.ロボットプログラム
このプログラムは上記のエンジン統合ヒットリストにおいて特定された報告対象URLをインターネットに向けて送ることで、検索キーワードを含んだWEBページPにアクセスする。このWEBページPは、例えば、「・・・社の製品評価」、「・・・会社の告発」、「・・・技術報告」と、いわゆる告発サイトから純粋な研究機関による技術報までそのジャンルは様々であり、サイト運営者も個人、企業、研究機関などの境界は特にない。予めジャンル分けが必要とあらば、クエリー情報の登録段階において設定しておくか、ロボットプログラムによるアクセス時に制限をかけることなどで対処可能である。

0041

そして、このWEBページPを記述するHTMLを読み込み、検索キーワードを中心とした所定文字数分抜粋する。WEBページPにはリンク先が設けられているのが普通であるから、リンク先にもHTMLを読み込みに行き、検索キーワードを含む前後文を抜粋する。HTMLの抜粋が完了すればテキスト変換しサーバコンピュータ20の抜粋文テーブル60に向けてその抜粋文を送出する。ただし、ロボットプログラム自体に検索キーワードを中心とした所定文字数の抜粋機能を持たせずに、ロボットプログラムは単にWEBページPの全HTMLを読みとって、メインプログラムがその所定文字数分の抜粋作業を行ってもよい。

0042

3.WEBページの検索レポート送達
図3は本発明におけるWEBページの検索レポート70(エンジン統合検索レポート)の一例を示す説明図である。メインプログラムは、上述のように得られて統合ヒットテーブル50や抜粋文テーブル60において記録されたURLや更新日時、また検索キーワード前後の抜粋文といったクリッピング結果を、前記クエリー中の検索キーワード毎、或いは更新日時毎などのWEBページインデックス(図示しない)として整理してまとめる。そのインデックス集合をエンジン統合検索レポート70として依頼人に送達するのである。

0043

作成したエンジン統合検索レポート70(WEBページの検索レポート)は、様々な手段で依頼人に送達されることが考えられるが、通常は電子メールを利用する。メインプログラムが作成したエンジン統合検索レポート70は電子メールに転載され、インターネットを介して依頼人のユーザコンピュータ10へと送達される。

0044

====その他の実施形態====
(1)上記実施例においてはエンジン統合検索レポートの送達を、電子メールを利用して行った例を示したが、他にWEB画面上で表示する方法や、ファックスなどを利用することも可能である。依頼人の希望やインフラ状況に合わせていかようにも設定可能である。

0045

(2)ユーザコンピュータは、クリッピングサービスが送達するエンジン統合検索レポートの形式に応じて適宜変更可能なものであり、例えば、インターネット接続または電子メール受信可能な携帯電話や、PDA(Personal Digital Assistant)、WEB閲覧機能付きTV及びゲーム機、更にはファックス機といった様々な情報端末装置を適用できる。

発明の効果

0046

本発明によれば、従来手法が抱えていた、単独の検索エンジンからは限定的な検索結果しか得られず、インターネットという極めて広範に亘った情報ソース中から求める情報を確実に獲得するという意義自体が薄れ、クリッピングサービスの信頼性、実用性が低下するといった問題や、メタ検索エンジンを用いた際の、検索エンジン相互に発生している検索結果の重複や古い情報を排除できないなどの問題が解消される。

0047

つまり、複数の検索エンジンを組み合わせて利用するこでインターネット上の広範な情報ソースを検索対象とすることができ、さらにそこで得られた多様な検索結果における重複情報を排除し更新日時やURLの新規性が吟味されたエンジン統合ヒットリストを定期的に得ることが出来る。そして依頼人に対して、検索キーワードを含んだ抜粋文を掲載することで当該キーワードに対応したことが一見して明白であり、かつ重複のない最新の検索結果をエンジン統合検索レポートとして送達することが出来るのである。

0048

したがって、依頼人各自で、配信された情報についてわざわざ各WEBページにアクセスしたりして確度と最新性とを高める必要など無くなる。その上、クリッピングサービスを行う側としてもサービス提供用サーバーなどを適宜数投入するだけで検索からレポート送達に至るまでのほぼ全ての業務を自動的に実施可能で、提供情報の精度を高めるための過大な人員や機材の配置なども必要ないのである。このため、サービス提供側はいかに利用者が増加しようと、その要求が複雑多岐に亘ろうとも、小規模な投資のみでコスト的にも効率的にも優れた運営を実現することができる。

0049

しかして、経時的にも内容的にも重複情報を確実に排除し、常に最新で明確な検索結果を多数の利用者に迅速に提供可能となるのである。

図面の簡単な説明

0050

図1本発明のWEBページの検索リポート作成方法を実現する基本システム図である。
図2本発明のWEBページの検索リポート作成方法を表す流れ図である。
図3本発明におけるWEBページの検索レポート(エンジン統合検索レポート)の一例を示す説明図である。
S検索エンジンP WEBページ10ユーザコンピュータ20 サーバコンピュータ

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 三菱電機株式会社の「 情報処理装置および情報処理方法」が 公開されました。( 2019/08/08)

    【課題・解決手段】情報処理装置(10)は、時系列データである入力データを取得するデータ取得部(101)と、時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する学習部分列を... 詳細

  • オムロン株式会社の「 センシングデバイス管理装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】センサ側メタデータに相当するデータカタログの生成が簡単且つ適正に行えるセンシングデバイス管理装置を提供する。デバイス情報取得機能部11dが、測定対象をセンシングするセンシングデバイス... 詳細

  • オムロン株式会社の「 マッチング処理装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】利活用対象のセンシングデータによる容易なセンサマッチングを行うマッチング処理部50が提供される。マッチング処理部50は、提供側端末11により入力された提供側センシングデータを取得する... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ