図面 (/)

技術 クローラ型検索及び索引型検索を実行するシステム及び方法

出願人 ゼロックスコーポレイション
発明者 ミシェールキューワングバルドナド
出願日 2000年11月17日 (18年10ヶ月経過) 出願番号 2000-350474
公開日 2001年7月10日 (18年2ヶ月経過) 公開番号 2001-188803
状態 拒絶査定
技術分野 検索装置
主要キーワード 二重分岐 商標情報 ローケータ コンピュータ技術者 構文法 検索索引 分散ネットワーク内 表示技法
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2001年7月10日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (7)

課題

索引検索クローラ型検索とを組合わせることにより、ユーザがより容易に検索を実行することを可能にする。

解決手段

ここに説明したシステム及び方法は、ユーザが標準ウェブブラウザから局地的な検索を実行することを可能にする。特に、本発明のシステム及び方法は、二つの分岐した方法を使い、動的な幅の第一クローラ型検索と脈絡化索引型検索の両方を達成し、検索結果を生成する。検索結果は次に、一つにまとめられた結果ページに集められ、ユーザに表示される。

概要

背景

現存する検索エンジンは迅速であり、ランク付けされた結果を作り出す。しかしながら、これらのランク付けされた結果の正確さは、特定の検索エンジンにおいて生成された内部索引に基づく。もし、これらの索引が定期的にメンテナンスを受けなければ、不完全な索引が不正確な結果を作り出す場合もあり、索引が、場所を移動したページへの壊れたリンク(broken link)を含む場合もあり、又は索引が、索引の最終再作成時より後に更新されたリンクを欠く場合もある。

更に、現存する検索エンジンは、ユーザの現在の脈絡(context)、例えばユーザがブラウズしている現在の仮想位置を考慮しない。

概要

索引型検索クローラ型検索とを組合わせることにより、ユーザがより容易に検索を実行することを可能にする。

ここに説明したシステム及び方法は、ユーザが標準ウェブブラウザから局地的な検索を実行することを可能にする。特に、本発明のシステム及び方法は、二つの分岐した方法を使い、動的な幅の第一クローラ型検索と脈絡化索引型検索の両方を達成し、検索結果を生成する。検索結果は次に、一つにまとめられた結果ページに集められ、ユーザに表示される。

目的

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

分散ネットワーク上で、索引検索及びクローラ型検索を実行する方法であって、少なくとも一つのキーワードに対するクローラ型検索を、脈絡中で実行するステップと、前記少なくとも一つのキーワードに対する索引型検索を、少なくとも一つの索引において実行するステップと、前記クローラ型検索及び前記索引型検索の結果を集めるステップと、を、含むことを特徴とする方法。

請求項2

請求項1に記載の方法であってさらに、分散ネットワーク内のユーザの位置に基づいて前記脈絡を検出するステップを含むことを特徴とする方法。

請求項3

分散ネットワーク上で、索引型検索及びクローラ型検索を実行するシステムであって、少なくとも一つのキーワードに対するクローラ型検索を、脈絡中で実行するクローラ型検索回路と、前記少なくとも一つのキーワードに対する索引型検索を、少なくとも一つの索引において実行する索引型検索回路と、前記クローラ型検索及び前記索引型検索の結果を集める、結果開発回路と、を、有することを特徴とするシステム。

請求項4

請求項3に記載のシステムであってさらに、ブラウザインターフェースから受信した前記少なくとも一つのキーワード及び前記脈絡情報を、前記クローラ型検索回路及び前記索引型検索回路に転送するクエリ開発回路を有することを特徴とするシステム。

請求項5

請求項3に記載のシステムであってさらに、前記クローラ型検索及び前記索引型検索の、前記集められた結果を表示する表示装置を有することを特徴とするシステム。

請求項6

分散ネットワーク上で、索引型検索及びクローラ型検索を実行する情報記憶媒体であって、少なくとも一つのキーワードに対するクローラ型検索を、脈絡中で実行する情報と、前記少なくとも一つのキーワードに対する索引型検索を、少なくとも一つの索引において実行する情報と、前記クローラ型検索及び前記索引型検索の結果を集める情報と、を、含むことを特徴とする情報記憶媒体。

請求項7

請求項6に記載の情報記憶媒体であってさらに、分散ネットワーク内のユーザの位置に基づいて、前記脈絡を検出する情報を含むことを特徴とする情報記憶媒体。

技術分野

0001

本発明は、分散ネットワーク検索システムに関する。

背景技術

0002

現存する検索エンジンは迅速であり、ランク付けされた結果を作り出す。しかしながら、これらのランク付けされた結果の正確さは、特定の検索エンジンにおいて生成された内部索引に基づく。もし、これらの索引が定期的にメンテナンスを受けなければ、不完全な索引が不正確な結果を作り出す場合もあり、索引が、場所を移動したページへの壊れたリンク(broken link)を含む場合もあり、又は索引が、索引の最終再作成時より後に更新されたリンクを欠く場合もある。

0003

更に、現存する検索エンジンは、ユーザの現在の脈絡(context)、例えばユーザがブラウズしている現在の仮想位置を考慮しない。

発明が解決しようとする課題

0004

したがって、ユーザが、現在見ているウェブサイト内で、特定の題目ついての情報を見つけたいと望む場合、ユーザは五つの選択肢から選択しなければならない。第一にユーザは、グローバルな検索エンジンを使用し、現在のウェブサイトと関連する可能性の高いワード、例えばウェブサイトが属する会社の名前などをクエリ(query)に付け足すことができる。この作業は、ユーザ側に専門知識を要求し、該サイトからの結果のみを作り出すことを保証しない。例えば、ヤフー(登録商標)(Yahoo)、アルタヴィスタ(登録商標)(AltaVista)、エクサイト(登録商標)(Excite)などの索引に基づく検索エンジンの例では、検索エンジンは、ユーザが入力したキーワードを受信する。この入力されたキーワード又は複数のワードは次に、検索エンジンの索引と比較される。そして、キーワードと索引内出現率との相関が行われる。この相関が結果リストを作り出し、この結果リストは、この相関に基づいて整理又はランク付けできる。

0005

第二にユーザは、グローバルな検索エンジンのいずれかにおいて「高等検索」を実行し、結果が、現在のウェブサイトからのものである必要があることを指定することができる。この場合、結果は、該サイトからのものであることを保証できるが、大半の検索エンジンの索引の不完全性や古さ(staleness)のため、ユーザが満足できる結果の集合を受信できない場合もある。これに加えこの種類の検索は、ユーザに対して専門知識を要求する。

0006

第三にユーザは、ウェブサイト自体に局地的に設けられた検索インターフェース探すことができる。局地的に設けられた検索インターフェースは、発見するのが難しい場合、すなわちユーザがブラウズしている現在位置では使用不可能な場合や、特有構文法を有する場合や、最新のものでない場合などがある。

0007

第四にユーザは、手動でサイトをブラウズし、特定の情報を検索することができる。複雑なサイトではこれは、時間を費やす作業であり、誤りがちである。

0008

最後にユーザは、ウェブサイトの管理者に連絡することができる。これは遅い処理であり、いつでも可能なわけではなく、結果を全く作り出さない場合もある。

課題を解決するための手段

0009

本発明のシステム及び方法は、索引型検索(インデックスサーチ:index type search)とクローラ型検索(クローラ・サーチ:crawl type search)とを組合わせることにより、ユーザがより容易に検索を実行することを可能にする。更に、本発明のシステム及び方法は、索引型検索及びクローラ型検索の一方又は両方において、脈絡(文脈)情報を含むことを可能にし、これにより検索の範囲を更に精密にできる。詳述すると、ユーザの現在の脈絡、例えば仮想位置又はユニフォームリソースローケータ(URL)を認識し、ユーザのために脈絡化した索引型検索を実行し、脈絡化したクローラ型検索を実行し、ユーザのクエリと一致する結果を探すことにより、本発明は、専門家でないユーザに、局地的な検索結果を素早く理解しやすい形で提供する。

0010

詳述すると、クローラ型検索の場合、キーワード、脈絡、及び境界情報の組み合わせが使われ、分散ネットワークの指定された領域での検索を実行する。この方法は、リアルタイム又はリアルタイムに近い状態で機能するため、索引型検索における欠点の数々が克服される。

0011

本発明のシステム及び方法は、索引型検索とクローラ型検索とを組合わせる。

0012

本発明はまた、一つ又はそれ以上の分散ネットワークの検索を実行するユーザを助けるシステム及び方法を提供する。

0013

本発明はまた、ユーザがユーザインターフェースを通じて検索ツールにつなげることのできるシステム及び方法を提供する。

0014

本発明はまた、ユーザが、一つ又はそれ以上の分散ネットワークに適用する検索戦略カスタム化設定することを可能にするシステム及び方法を提供する。

0015

本発明の検索システム及び方法は、索引に基づく検索戦略と、クローラに基づく検索戦略と、脈絡情報との組合わせを使い、理解しやすい結果リストをユーザに提供する。すなわち、ユーザが、所望の題目についての情報に対応する、一つ又はそれ以上のキーワードを入力する。本発明のシステム及び方法は、このクエリを受信し、直列又は並列で、既存の索引の索引型検索と、特定の脈絡内のクローラ型検索とを実行する。そしてこれらのクエリの結果が集められ、ユーザに表示される。よって、ユーザに表示される結果は理解しやすく、また、各々の欠点を克服するようお互いを補い合う二つのクエリの組み合わせである。

0016

本発明のこれら及びその他の特徴及び利点は、これに続く、好適な実施形態の詳細な説明に示される又はこの詳細な説明から明らかである。

発明を実施するための最良の形態

0017

クローラ型検索と索引型検索とを、合併させた「検索エンジン」として組合わせることにより、結果の独特リストをユーザに提供できる。更に、クローラに基づく脈絡化した検索と、索引に基づく脈絡化した検索とを、合併させた「脈絡を認識する検索エンジン」として組合わせることにより、ユーザがどのサイトを現在訪れていても、独特の脈絡化した結果リストをユーザに提供できる。

0018

詳述すると、クローラ型検索は、高品質の結果を見つける可能性が高いが、通常、実行するためにより多くの時間と、より広いネットワーク帯域幅とを必要とする。これに対して、索引型検索は通常、結果を素早く返す可能性が高いが、結果の内のいくらかは、すでに存在しない品目を指している場合もあり、関連する全ての結果が見つからない場合もある。例えば、検索エンジンは現在では、インターネットなどの分散ネットワーク全体を索引する能力を有さない。更に、これらの与えられた索引のいずれの更新速度も、一般的には、与えられたウェブサイトの平均更新回数よりも遅い。

0019

本発明のシステム及び方法は、手近な本当の仕事中断を最小化する検索をユーザが実行することを可能にする。詳述すると、脈絡を認識する検索ツールを提供することにより、検索とブラウズとの境界がより流動的になる。本発明のシステム及び方法はまた、検索が開始される機械が、例えば機械が遅いプロセッサを有する、単一の実行スレッドを有する、または遅いネットワーク接続を有する、などの理由から、比較的「遅い」機械であっても、ユーザが検索結果を素早く取り出すことを可能にする。本発明の二重分岐(dual-prong)検索戦略は、ユーザが、グローバルな索引で使用可能な脈絡内で、一致するものを素早く取得することを可能にし、同時に、索引中にない現在の脈絡中のページ、すなわち新しく導入されたページ、新しく編集されたページ、索引に載せられていないような不明瞭な場所にあるページ、ファイヤウォール後ろに存在するページ、などに、一致するものを見つけることを可能にする。

0020

図1は、分散ネットワーク検索の際に使われる脈絡化した検索システム10の構成要素の一実施形態を示す。脈絡化した検索システム10は、ユーザ装置100を有する。ユーザ装置100は、コントローラ110と、メモリ120と、I/Oインターフェース130と、ブラウザインターフェース140と、クエリ開発回路150と、結果開発回路160と、を備える。これらの素子は、リンク50によってリンクされている。これに加え、ユーザ装置100は、表示装置170と、ユーザ入力装置180と、に、リンク50を通じて接続される。ユーザ装置100はまた、少なくとも一つの分散ネットワーク200に接続され、この分散ネットワークは、一つ又はそれ以上の他のユーザ装置、サーバデータベース、又は他の分散ネットワーク210及び220に接続されている場合も接続されていない場合もある。

0021

脈絡化した検索システム10はまた、検索サーバ300を有する。検索サーバ300は、コントローラ310と、メモリ320と、I/Oインターフェース330と、少なくとも一つのデータベース340と、クエリ管理回路350と、を備える。クエリ管理回路350は、クローラ型検索管理回路360と、索引型検索管理回路370と、を含む。

0022

図1に例示する実施形態は、ユーザ装置100と検索サーバ300とを、構内ネットワーク広域ネットワークイントラネット及び/又はインターネットなどの分散ネットワーク上の、距離を置かれた部分に配置したものを示すが、検索サーバ300の構成要素とユーザ装置100の構成要素とは、一つの装置に組合わせてもよく、また、分散ネットワーク上の特定のノードに並べて置かれていてもよいことを理解すべきである。後述から理解できるように、そして計算効率の理由から、ユーザ装置100の構成要素と検索サーバ300の構成要素とは、システムの機能に影響を及ぼすこと無く、分散ネットワーク内のどの場所に配置されてもよい。

0023

更にリンク50は、有線又は無線リンク、又は、接続された素子から及び接続された素子へと電子データを供給する能力のある、既知の又は後に開発される素子のいずれであってもよい。

0024

機能中は、ユーザが、現在の脈絡内で特定の題目に関する情報が望まれると判断する。例えばユーザは、インターネットのブラウズをするために、ブラウザインターフェース140によって管理されるネットスケープナビゲータ(登録商標)(Netscape Navigator)又はマイクロソフト(登録商標)(Microsoft)社のインターネットエクスプローラ(登録商標)(Internet Explorer)などのウェブブラウザ立ち上げる場合もある。ウェブブラウザによる、ウェブサイトの予備ブラウズによって、ユーザは、現在の脈絡内で特定の題目に関する追加の情報が望まれると判断する。アルタヴィスタ(登録商標)などの従来の検索エンジンへのハイパーリンククリックする又はそのURLを打ち込む代わりに、ユーザは本発明による検索を呼び出す。例えば検索は、ネットスケープナビゲータ(登録商標)などのウェブブラウザのツールバーにクリック可能なボタンを含むこと、ジャヴァスクリプト(JavaScript)ルーチンなどのプログラムを実行すること、オペレーティングシステムグラフィカルユーザインターフェース内の専用ボタン、専用の配線によるボタン、又はプログラムの実行を起動する広く知られたその他の方法のいずれによって呼び出されることができる。例えば、検索システムの呼び出しは、ユーザが、例えばマウスをクリックすることにより、ウェブブラウザのツールバー上のボタンを選択し、本発明の検索システム及び方法を実行するようにして達成してもよい。

0025

検索が開始されると、ユーザ装置100がクエリ開発回路150と協働し、キーワード打込みダイアログボックスを表示装置170上に生成する。このキーワード打込みダイアログボックスは通常、従来のインターネット検索エンジンに見られるキーワード打込みダイアログボックスと同様な形で機能する。よって、キーワードは通常、ユーザが探している特定の情報に関連する重要な概念純化したもの(distillation)に対応する。

0026

ユーザは次に、ユーザ入力装置180を介して、一つ又はそれ以上のキーワードをキーワード打込みダイアログボックスに打込む。ユーザが一つ又はそれ以上のキーワードをキーワード打込みダイアログボックスを通じて打込む代わりに、ブラウザインターフェース140が、ウェブブラウザ内に表示されたウェブページなどの文書内の強調された又は選択された部分を検出してもよい。例えばマウスの左ボタンを押し続け、ウェブページ内文章の一部上を移動させることにより、ユーザが文章を強調した場合、検索開始ボタンが選択された時に、強調された部分が自動的に複写されキーワード情報として使われてもよい。これらのキーワードは、リンク50とI/Oインターフェース130を介してコントローラ110及びメモリ120の助けにより、クエリ開発回路150に送信される。

0027

クエリ開発回路150は、いくつかの仕事を実行する。第一に、クエリ開発回路150は、一つ又はそれ以上のキーワードをユーザ入力装置180から受信し、メモリ120に記憶する。これに加え、クエリ開発回路150は、ブラウザインターフェース140と通信し、分散ネットワーク上のユーザの現在の仮想位置又は脈絡を判断する。この代わりに、脈絡情報は、一つ又はそれ以上のキーワードと共に直接転送されてもよい。例えば前述のように、キーワード打込みダイアログボックスは、検索のための脈絡情報の打込みを可能にする部分を備えていてもよい。よって、この脈絡情報は、ここに挙げるものに制限されないが、ユニフォームリソースローケータ(URL)、インターネットプロトコルアドレスIPアドレス)、ファイル転送プロトコルアドレス(FTPアドレス)、ディレクトリドメイン名、ユニバーサルリソースネーム(universal resource name)などを含んでもよい。

0028

脈絡及びキーワード情報を取得した後、クエリ開発回路150は、検索を開始する。すなわち、クエリ開発回路は、二つの異なるクエリを集め、検索サーバ300に送る。第一のクエリは、クローラ型検索である。クローラ型検索は、ユーザによって打込まれた又はブラウザインターフェース及びユーザ入力装置と協働して検出したキーワード情報と共に脈絡情報を含む。前述のように、この脈絡情報は、例えばユーザが検索サービスを要求したウェブページのURLに対応していてもよい。

0029

その代わりに、脈絡情報は、ユーザによって編集されることができ、これにより、脈絡のより明確な線引きが可能になる。例えば、ユーザがサーフィンをしている間に、「http://example.com」のURLを有するウェブサイトにブラウズした場合、脈絡情報は、URL自体、すなわち「http://www.example.com」であってもよい。その代わりに脈絡情報は、「example.com」ウェブサイトの様々な構成を考慮するために一つ又はそれ以上のワイルドカードを含んでいてもよい。例えば、脈絡情報は、http://*.example.comであってもよい。

0030

この例では、「*」はワイルドカードを表し、URL「example.com」内の接頭詞の全てを指し、これらもクローラ型検索の際に問合わせられる。これに加え、ユーザが、高度に専門化された脈絡情報を直接打込むこともでき、この脈絡情報をキーワード情報と組合わせ、ユーザが実際に特定のウェブページにブラウズする必要無く、特定のクエリをカスタム設定できることを理解されたい。

0031

例えば、「example.com」ウェブサイトが商標についての特別な部分を有し、商標部分が、「最近の動向」部分と、「過去」部分とに分けられていた場合、ユーザは、脈絡情報を編集し、ウェブサイトの特定の領域を目標に指定してもよい。例えば、脈絡情報は、http://www.example.com/trademarks/current/*であってもよい。この脈絡情報は、「example.com」ウェブサイトの商標部分の「現在」部分又はディレクトリ内での、キーワードに対する検索を可能にする。この代わりに、ウェブサイトの組合わせを脈絡情報として指定することもできる。例えば、ユーザは、脈絡情報を「www.example.com」及び「www.example2.com」として指定してもよい。一般的には、分散ネットワーク内の一つ又はそれ以上の場所を示す情報のいずれも脈絡情報として使うことができる。

0032

キーワードと脈絡情報の組み合わせは次に、リンク50及びネットワーク200を介して検索サーバ300に送られる。検索サーバ300は、クエリ及び脈絡をI/Oインターフェース330を介して、クエリ管理回路350で受信する。クエリ管理回路350は、クエリ及び脈絡情報をクローラ型検索管理回路360に転送する。クローラ型検索管理回路は、受信したキーワード及び脈絡情報を分析する。脈絡情報に基づき、クローラ型検索管理回路360は、脈絡情報に対応するクロール境界を決定する。これらのクロール境界は、分散ネットワーク内でのクローラ型検索の幅を規定する。

0033

この代わりに、クローラ型検索管理回路350は、脈絡情報の変更を可能にしてもよい。例えば、クローラ型検索管理回路350は、検索の前又は検索中に、ユーザにプロンプトを返し、決定された脈絡情報が条件に合っているか、又は変更又はカスタムクローラ型脈絡情報が望まれるかをねてもよい。

0034

クロール境界を確立した後、脈絡はクロール列に追加される。クローラ型検索管理回路360の指示にしたがい、コントローラ310及びメモリ320と共に、クローラ型検索が、クロール列の脈絡内の、例えばウェブページなどの文書又は情報に対して実行される。詳述すると、送られたキーワードが、クロール列内に記憶された脈絡中を検索される。一旦クロール列内の脈絡が検索されると、クロール列内のその脈絡は除去される。

0035

次に、脈絡情報及び一つ又は複数のキーワードの両方と一致する結果が、メモリ320に記憶されている結果リストに追加される。クローラ型検索管理回路360は次に、クロール境界内の一つ又はそれ以上のリンクに対応する脈絡がクローラ型検索中に見つかった場合、そのような脈絡をクロール列に追加する。クローラ型検索管理回路360は次に、クロール列が空であるかを判断する。もしクロール列が空であれば、クローラ型検索は完了する。クロール列が空でなければ、クローラ型検索管理回路360は、上述のようにクロール列に追加された脈絡内の検索を続ける。

0036

例えば、図2にウェブサイト「example.com」のウェブサイトツリー構造を例示する。ウェブサイトは、「ホームページ」、例えば「www.example.com/index.html」と、特許ページ、例えば「www.example.com/patents.html」と、商標ページ、例えば「www.example.com/trademarks.html」と、著作権ページ、例えば「www.exmaple.com/copyright.html」と、複数の商標情報補足ページ、例えば「page1.html」から「page3.html」と、を含む。

0037

例えば、ユーザが商標についての情報を探していると仮定する。これに加え、ユーザが検索の実行時に、「www.example.com」のホームページに位置していると仮定する。クローラ型検索は次のように発展される。最初の脈絡情報は、クエリが呼び出されたウェブページ、すなわち「www.example.com」に対応してもよい。よって、「example.com」ウェブサイト内の全てのウェブページに問い合わせできる。この脈絡はクロール列に追加される。次に、クローラ型検索が、クロール列に記憶された脈絡情報について実行される。ここで示す例では、特許ウェブページ、商標ウェブページ、及び著作権ウェブページに対応する結果が返される。クローラ型検索の完了時に、クロール列内の脈絡は除去される。

0038

次に、結果ページの各々が分析され、これらのページがクローラ型検索条件に一致するかどうかを判断する。詳述すると、クローラ型検索管理回路360が、各結果ウェブページが所望のキーワード、例えば商標を含むかどうかを判断する。もしそうであれば、結果は結果リストに追加される。そうでなければ、結果は破棄される。この例では、「商標」ウェブページが、クロール型検索条件に当てはまるとして、結果リストに追加される。クロールクエリと一致する、クローラ型検索からの結果を結果リストに追加した後、クローラ型検索の際に見つかったリンクに対応する脈絡がクロール列に追加される。

0039

よって、この例ではクロール境界が、「www.example.com」ウェブサイト内の全ウェブページであるのて、クローラ型検索は、商標ウェブページの下の、下位ページの検索を続ける。例えば、商標ウェブページが、商標の情報を含む、図では「page1.html」、「page2.html」、及び「page3.html」として示す、三つの追加ページへのリンクを有すると仮定する。クローラ型検索が、商標ページ、すなわち「www.example.com/trademarks.html」を構文解析するにしたがって、商標ウェブページ内では下線を引いて示す、ページ内のリンクがクロール列に追加される。システムは次にクロール列を調べ、主要商標ページの下に位置する各商標ページについてのクロール型検索の実行へと進む。

0040

しかしながら、ウェブページが検索されたキーワードを含まない場合でも、ページ内のリンクをクロール列に追加できることを理解すべきである。したがって、与えられた脈絡内の全てのページを検索することができる。

0041

クエリ管理回路350は、クエリと、任意に脈絡と、を索引型検索管理回路370にも転送する。詳述すると、索引型検索は、クエリ開発回路150から、リンク50、ネットワーク200、及びI/Oインターフェース330を介してクエリ管理回路350へと転送される。この索引型検索もまた、ユーザが打込んだキーボード及び任意の脈絡情報を含む。クエリ管理回路350は、索引型検索を索引型検索管理回路370へと振り向ける。次に索引型検索が、例えばアルタヴィスタ(登録商標)などの検索エンジンにおける、既存の一つ又は複数の索引の検索に基づいて実行される。

0042

クローラ型検索と同様、索引型検索管理回路370は、コントローラ310及びメモリ320と協働し、所望の脈絡情報が編集されるべきか、又はその代わりに脈絡情報自体が望まれるかどうかをユーザに問い合わせることができる。例えば上述のように、索引型検索管理回路370は、ユーザ装置100のユーザにプロンプトを転送し、脈絡情報の補正又は消去要請することができる。次に、最終的な脈絡情報に基づき、索引型検索管理回路370は、コントローラ310の指示に従って、データベース340に記憶されている既存の索引上の検索を実行する。

0043

クローラ型検索と同様、索引型検索管理回路370も、望まれる脈絡内のみに、検索を限定することができる。例えば、検索エンジンのいくつかは、検索基準としてキーワード情報のみを打込むことを可能にし、他の検索エンジンは、キーワード及び脈絡情報の両方の打込みを可能にする。よって、クエリ自体の管理に加え、索引型検索管理回路370は、索引型検索が転送される検索エンジンの種類、すなわち、キーワードのみ又はキーワード及び脈絡、を判断する能力を有する。したがって、索引型検索管理回路370は、ユーザと対話することができ、又は索引型検索が送られる検索エンジンの種類に基づき自動的にクエリ情報を集めることができる。

0044

一般的には索引型検索は、索引型検索管理回路370が実際に検索を実行しても、索引型検索が、検索を実行し結果を索引型検索管理回路370に返す他の検索エンジンに転送しても、同様にうまく機能する。

0045

クローラ型検索管理回路360及び索引型検索管理回路370は、それぞれの検索の実行が完了すると、結果を結果開発回路160に転送する。図では、この結果開発回路160は、ユーザ装置100に配置されて示される。すなわち、クエリ管理回路350が、リンク50、ネットワーク200、及びI/Oインターフェース130を介して、検索結果又はヒットを結果開発回路160へと返す。結果開発回路160は、ユーザに対して、表示装置170上に表示するために、結果のリストを集める。結果開発回路160は、例えば、クローラ型検索と索引型検索の両方の結果を含んで示されるグラフィカルユーザインターフェースなどの形式の、表示を生成する。従来の検索エンジン同様、結果開発回路160によって生成された結果ページは、結果に関連する情報を各結果ページにリンクするハイパーリンクを含んでもよい。次に、結果ページが表示装置170上に表示される。

0046

クローラ型検索及び索引型検索の結果を表示装置170上に表示した後、ユーザは、従来の検索エンジン内のユーザ入力装置を使い、マウスのクリックなどによって、結果ページ内の情報を選択できる。そしてユーザは、結果に対応するウェブページへ進められる。

0047

更に、前述のように、クエリ管理回路350は、「検索サーバ」又は検索エンジン上の配置されている必要はない。その代わりに、例えば、計算効率の理由などから、クエリ管理回路350は専門の検索サーバ又はユーザ装置100自体に配置されていてもよい。

0048

更に、図1に例示する実施形態は、データベース340を検索サーバ300内に備えるが、データベース340は分散ネットワーク内のどこに配置されてもよいことを理解されたい。一般的には、データベースが、分散ネットワークの少なくとも一部の索引を含むものである限り、データベースは、分散ネットワーク上のどこに存在していてもよい。

0049

これに加え、ユーザが、どの特定の索引又は複数の索引において索引型検索を実行するかを決定してもよい。詳述すると、脈絡情報に加え、ユーザは、一つ又はそれ以上の被検索索引データベースを示す特定の索引情報を、クエリ開発回路150を介して転送してもよい。例えば、ユーザは、インフォシーク(登録商標)(Inforseek)及びライコス(登録商標)(Lycos)の両方の索引を検索することを示してもよい。

0050

図3は、結果開発回路160によって生成できる結果ページの例を示す。詳述すると、例えば、ブラウザインターフェース600内に表示された結果ページ610は、図示するように、一つ又はそれ以上の打込まれたキーワードを表示する場所540と、脈絡情報、例えばURLを表示する場所515と、索引型検索結果部640と、クローラ型検索結果部650と、一つ又はそれ以上の策引型検索結果645と、一つ又はそれ以上のクローラ型検索結果リスト655と、検索ボタン670と、検索停止ボタン680と、を備える。

0051

結果ページ610は、検索が進むにしたがって「大急ぎで」生成されてもよく、又は、クローラ型検索及び索引型検索の一つ又は両方又はその組み合わせの完了時に集められてもよい。これに加え、結果ページ610は、ブラウザインターフェースウィンドウ内のウェブページとして示されているが、結果ページをウェブページ510の上に、キーワード打込みダイアログボックス530と同様の方法又はコンピュータ技術者には広く知られている他の表示技法によって、積層してもよい。

0052

したがって、クローラ型検索及び索引型検索の完了時には、個々の結果又はヒットが、索引型検索結果ボックス640及びクローラ型検索結果ボックス650にそれぞれ現れる。現在の検索エンジンと同様、これらのボックスに表示された結果又はヒットは、検索されたキーワードを含む、実際のウェブページ又はその一部へのハイバーリンクを含む。

0053

結果ページ610はまた、検索ボタン670を備えてもよい。例えば、ユーザが検索キーワード540を変更したいと望む場合、ユーザは結果ページから直接これらのキーワードを編集し、例えば検索ボタン670を、例えばマウスボタンのクリックによって選択することにより、検索を再実行できる。これに加え、ユーザは検索停止ボタン680を選択することにより検索を停止できる。例えば、ユーザが検索を始め、望まれる結果又はヒットが結果ボックスの一つに現れた場合、検索を停止できる。

0054

更に、ユーザは、URL又は脈絡情報515を、結果ページから直接編集できる。例えば、ユーザが望まれる情報がこの検索では見つからなかったと判断した場合、ユーザは、例えば脈絡情報を、例えばワイルドカード文字などによって、広げることができる。

0055

従来の検索エンジンと同様、結果645及び655は、キーワードを含む実際のウェブページ又はその一部へのハイパーリンクであってもよい。よって、ユーザが、例えばマウスのクリックなどによって、結果の一つを選択した場合、ユーザはその特定の結果又はヒットに対応するウェブページへと運ばれる。

0056

図4は、本発明による分散ネットワークを検索する方法の一実施形態の概要を示すフローチャートである。制御は、ステップS100に始まり、ステップS200に続き、ここでクエリが受信される。次に、ステップS300においてクローラ型検索が実行され、ステップS400において索引型検索が実行される。制御はステップS500へと続く。

0057

ステップS500では、検索結果が集められ、次に、ステップS600において結果が表示される。制御はステップS700に進み、そこで制御手順が終了する。

0058

図5は、図4に示す索引型検索ステップにおいて実行される一実施形態の概要をより詳しく例示するフローチャートである。制御は、ステップS1000に始まり、ステップS1100に進み、ここで脈絡情報が引き出される。次に、ステップS1200において、脈絡情報が編集されるのかどうかが判断される。脈絡情報が編集される場合、制御はステップS1300に進む。そうでなければ、制御はステップS1400に飛ぶ。ステップS1300では、脈絡情報が編集され、制御はステップS1400に続く。

0059

ステップS1400では、索引型検索が実行される。制御は次に、ステップS1500に続き、ここでステップS500に戻る。

0060

図6は、図4に示すクローラ型検索ステップの一実施形態の概要をより詳しく例示するフローチャートである。制御は、ステップS2000に始まり、ステップS2100に続き、ここで脈絡情報が引き出される。次に、ステップS2020において、脈絡情報が編集されるべきかどうかが判断される。脈絡情報が編集される場合、制御はステップS2030に続き、脈絡情報が編集される。そうでなければ制御はステップS2040に飛ぶ。

0061

ステップS2040において、クロール境界が定義される。次に、ステップS2050において、脈絡がクロール列に追加される。そして、ステップS2060におて、クローラ型検索が、クロール列内の脈絡に対して実行される。制御はステップS2070に続く。

0062

ステップS2070において、脈絡がクロール列から除去される。次に、ステップS2080において、クエリと一致する結果が結果リストに追加され、ステップS2090において、クローラ型検索の際に見つけられ、クロール境界内にあるリンクに対応する脈絡が存在するのであれば、その脈絡がクロール列に追加される。制御は次に、ステップS2100へと続く。

0063

ステップS2100では、クロール列が空かどうかの判断が行われる。クロール列が空でなければ、制御はステップS2060に飛ぶ。そうでなければ、制御はステップS2110に続き、制御手順はステップS500に戻る。

図面の簡単な説明

0064

図1本発明による検索システムの第一実施形態を示す機能ブロック図である。
図2ウェブページのツリー構成を例示する図である。
図3ウェブページの第二の例を示す図であり、本発明のシステム及び方法により実行された検索結果の例を示す図である。
図4本発明による、クロール型検索及び索引型検索を実行する方法の一実施形態例の概要を示すフローチャートである。
図5図4の索引型検索ステップの概要を、より詳細に示すフローチャートである。
図6図4の脈絡化クローラ型検索ステップの概要を、より詳細に説明するフローチャートである。

--

0065

10脈絡化検索システム、50リンク、100ユーザ装置、110,310コントローラ、120,320メモリ、130,330 I/Oインターフェース、140ブラウザインターフェース、150クエリ開発回路、160 結果開発回路、170表示装置、180ユーザ入力装置、200,210,220分散ネットワーク、300検索サーバ、350 クエリ管理回路、340データベース、360クローラ型検索管理回路、370索引型検索管理回路。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • オムロン株式会社の「 マッチング処理装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】利活用対象のセンシングデータによる容易なセンサマッチングを行うマッチング処理部50が提供される。マッチング処理部50は、提供側端末11により入力された提供側センシングデータを取得する... 詳細

  • オムロン株式会社の「 検索用データ生成装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】センサの検索精度を向上させることができる検索用データ生成装置が提供される。検索用データ生成装置50は、入力された、センシングデバイス20に関連する検索条件301から検索用データを取得... 詳細

  • 三菱電機株式会社の「 情報処理装置および情報処理方法」が 公開されました。( 2019/08/08)

    【課題・解決手段】情報処理装置(10)は、時系列データである入力データを取得するデータ取得部(101)と、時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する学習部分列を... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ