図面 (/)

技術 文書検索サービス提供方法及び装置及び文書検索サービス提供プログラム及び文書検索サービス提供プログラムを格納した記憶媒体

出願人 日本電信電話株式会社
発明者 牛島浩一
出願日 2001年7月11日 (18年0ヶ月経過) 出願番号 2001-210873
公開日 2003年1月31日 (16年5ヶ月経過) 公開番号 2003-030231
状態 拒絶査定
技術分野 検索装置
主要キーワード 切り詰める 情報利用者端末 フリーソフト 検索利用者 フリーソフトウェア RDBMS ロボット型 リンク切れ
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2003年1月31日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

課題

特定の話題興味を持つ人々が各人の推薦する最新WWWページ情報を共有することを容易にすると共に、特定の話題に特化したWWWページ検索サービス構築する。

解決手段

本発明は、情報登録者端末から入力されたWWWサイト情報及び登録者名をWWWサイト情報DBに記憶し、指定されたWWWサイトから該WWWサイトに含まれるWWWページ群を取得し、検索用DBに格納し、検索時に、検索キーワードに関連するWWWページ群を検索用DBから検索し、WWWサイト毎にグループ化し、グループ毎に、WWWサイト情報と、情報登録者名前を付加したページを作成し、検索利用者端末に表示する。

概要

背景

従来、特定の話題興味を持つ人々の間で、どこのWWWサイトにどのような情報があるかという情報を共有するために、リンク集と呼ばれるページを作成する方法が採られている。リンク集は図10のようなものであり、WWWのハイパーリンク機能を用いて、関連するWWWサイトへのリンクを配置し、リンク先タイトルロゴ、簡単な紹介文などを付加したものである。利用者はこの紹介文を見て、どのサイトに所望の情報があるかを判断することができる。

しかし、従来のリンク集を用いる方法では、関連サイトが多くなるにつれてリンク集から所望のサイトを探すことが困難となっている。そこで考えられたのが、“Yahoo”に代表されるディレクトリ型検索サービスである。これは、人手により、WWWサイトのカテゴリ分けや説明文の入力を行なっており、これを元にWWWサイトの検索を行なうシステムである。ディレクトリ型検索サービスはいわば、すべての話題を扱う大規模なリンク集に検索機能を付加したものであると言える。

一方、増加し続けるWWWページを探し出すためのサービスとして、ロボット型検索と呼ばれる検索サービスも広く利用されている。ロボット型検索サービスは、WWWページのリンクを辿りながら自動的にWWWページを収集する「情報収集ロボット」あるいは「クローラー」と呼ばれるプログラムを使用している。これらは、機械的に情報の収集が行なわれるため、リンク集やディレクトリ型検索サービスのようにカテゴリや紹介文を提供することはできないが、新しく現れたWWWページを自動的に発見することが可能であることや、WWWページそのものを検索対象としているためにディレクトリ型検索サービスでは発見できないようなWWWページも見つけ出すことができる。また、情報収集ロボットにより絶えず情報が更新されているため、最新の情報に基づいた検索を行なうことができる。

ロボット型検索サービスのこのような利点を生かしながら、特定の話題のみに特化した検索サービスを提供することも行なわれている。これは、ロボット巡回するWWWサイトを、特定の話題に関連したWWWサイトのみに限定することによって実現されている。

概要

特定の話題に興味を持つ人々が各人の推薦する最新のWWWページ情報を共有することを容易にすると共に、特定の話題に特化したWWWページ検索サービスを構築する。

本発明は、情報登録者端末から入力されたWWWサイト情報及び登録者名をWWWサイト情報DBに記憶し、指定されたWWWサイトから該WWWサイトに含まれるWWWページ群を取得し、検索用DBに格納し、検索時に、検索キーワードに関連するWWWページ群を検索用DBから検索し、WWWサイト毎にグループ化し、グループ毎に、WWWサイト情報と、情報登録者名前を付加したページを作成し、検索利用者端末に表示する。

目的

本発明は、上記の点に鑑みなされたもので、特定の話題に興味を持つ人々が各人の推薦する最新のWWWページ情報を共有することを容易にすると共に、特定の話題に特化したWWWページ検索サービスを構築するための文書検索サービス提供方法及び装置及び文書検索サービス提供プログラム及び文書検索サービス提供プログラムを格納した記憶媒体を提供することを目的とする。

効果

実績

技術文献被引用数
3件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

コンピュータネットワーク上に存在するWWWページ集合から所望の文書発見するための文書検索サービス提供方法において、情報登録者情報登録者端末からのアクセスに対して、情報登録者の認証を行い、前記情報登録者端末に対して、検索対象となるWWWサイト名前、URL、紹介文を含むWWWサイト情報の入力を促し、前記情報登録者端末から入力された前記WWWサイト情報及び登録者名を、WWWサイト情報データベースに記憶し、指定されたWWWサイトから該WWWサイトに含まれるWWWページ群を取得し、検索用データベースに格納し、検索利用者検索利用者端末に対して、検索キーワードの入力を促し、前記検索利用者端末から入力された検索キーワードに関連するWWWページ群を前記検索用データベースから検索し、検索されたWWWページ群をWWWサイト毎にグループ化し、グループ毎に、WWWサイトの名前、紹介文を含むWWWサイト情報と、前記情報登録者の名前を付加したページを作成し、作成された前記ページを検索結果として前記検索利用者端末に表示することを特徴とする文書検索サービス提供方法。

請求項2

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供方法において、情報登録者の情報登録者端末からのアクセスに対して、情報登録者の認証を行い、前記情報登録者端末に対して、検索対象となるWWWサイトの名前、URL、紹介文を含むWWWサイト情報の入力を促し、前記情報登録者端末から入力された前記WWWサイト情報及び登録者名を、WWWサイト情報データベースに記憶し、指定されたWWWサイトから該WWWサイトに含まれるWWWページ群を取得し、検索用データベースに格納することを特徴とする文書検索サービス提供方法。

請求項3

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供方法において、検索利用者の検索利用者端末に対して、検索キーワードの入力を促し、前記検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索用データベースから検索し、検索されたWWWページ群をWWWサイト毎にグループ化し、グループ毎に、WWWサイトの名前、紹介文を含むWWWサイト情報と、前記情報登録者の名前を付加したページを作成し、作成された前記ページを検索結果として前記検索利用者端末に表示することを特徴とする文書検索サービス提供方法。

請求項4

所定の条件を満たしている場合に、前記WWWサイト情報データベースに保存されているWWWサイト情報を読み出し、前記WWWサイト情報に含まれているURLからWWWページ群を取得し、取得した前記WWWページを元に、前記検索用データベースを更新する請求項1または、2記載の文書検索サービス提供方法。

請求項5

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供装置であって、情報登録者の認証を行なう会員認証手段と、前記会員認証手段により認証された情報登録者からURL、タイトル、紹介文を含むWWWサイト情報を受け付けるWWWサイト情報入力手段と、前記WWWサイト情報入力手段からのWWWサイト情報及び情報登録者名を保持するWWWサイト情報保持手段と、前記WWWサイト情報保持手段に保持された前記WWWサイト情報に基づいて、WWWページ情報を収集するWWWページ収集手段と、前記WWWページ収集手段によって収集されたWWWページの情報を検索可能な形で保持するWWWページ索引保持手段と、検索利用者の検索利用者端末からのアクセスに対して検索キーワードの入力を促し、該検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索し、WWWサイト毎にグループ化し、WWWサイト情報及び情報登録者名を付加した検索結果を該検索利用者端末に表示する検索手段とを有することを特徴とする文書検索サービス提供装置。

請求項6

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供装置であって、情報登録者の認証を行なう会員認証手段と、前記会員認証手段により認証された情報登録者からURL、タイトル、紹介文を含むWWWサイト情報を受け付けるWWWサイト情報入力手段と、前記WWWサイト情報入力手段からのWWWサイト情報及び情報登録者名を保持するWWWサイト情報保持手段と、前記WWWサイト情報保持手段に保持された前記WWWサイト情報に基づいて、WWWページ情報を収集するWWWページ収集手段と、前記WWWページ収集手段によって収集されたWWWページの情報を検索可能な形で保持するWWWページ索引保持手段とを有することを特徴とする文書検索サービス提供装置。

請求項7

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供装置であって、検索利用者の検索利用者端末からのアクセスに対して検索キーワードの入力を促し、該検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索し、WWWサイト毎にグループ化し、WWWサイト情報及び情報登録者名を付加した検索結果を該検索利用者端末に表示する検索手段とを有することを特徴とする文書検索サービス提供装置。

請求項8

時間を計測するタイマと、前記タイマが一定の時間を計数する度に、前記WWWページ収集手段において収集されたWWWページで、前記WWWページ索引保持手段に保持されているWWWページ情報を更新する更新手段とを更に有する請求項5または、6記載の文書検索サービス提供装置。

請求項9

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供プログラムであって、情報登録者の認証を行なう会員認証プロセスと、前記会員認証プロセスにより認証された情報登録者からURL、タイトル、紹介文を含むWWWサイト情報を受け付けるWWWサイト情報入力プロセスと、前記WWWサイト情報入力プロセスからのWWWサイト情報及び情報登録者名を保持するWWWサイト情報データベースに保持された前記WWWサイト情報に基づいて、WWWページ情報を収集するWWWページ収集プロセスと、前記WWWページ収集プロセスによって収集されたWWWページの情報を検索可能な形で保持するWWWページ索引データベースに格納するWWWページ索引格納プロセスとを有することを特徴とする文書検索サービス提供プログラム。

請求項10

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供プログラムであって、検索利用者の検索利用者端末からのアクセスに対して検索キーワードの入力を促し、該検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索し、WWWサイト毎にグループ化し、WWWサイト情報及び情報登録者名を付加した検索結果を該検索利用者端末に表示する検索プロセスとを有することを特徴とする文書検索サービス提供プログラム。

請求項11

時間を計測するタイマが一定の時間を計数する度に、前記WWWページ収集プロセスにおいて収集されたWWWページで、前記WWWページ索引データベースに保持されているWWWページ情報を更新する更新プロセスとを更に有する請求項9または、10記載の文書検索サービス提供プログラム。

請求項12

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供プログラムを格納した記憶媒体であって、情報登録者の認証を行なう会員認証プロセスと、前記会員認証プロセスにより認証された情報登録者からURL、タイトル、紹介文を含むWWWサイト情報を受け付けるWWWサイト情報入力プロセスと、前記WWWサイト情報入力プロセスからのWWWサイト情報及び情報登録者名を保持するWWWサイト情報データベースに保持された前記WWWサイト情報に基づいて、WWWページ情報を収集するWWWページ収集プロセスと、前記WWWページ収集プロセスによって収集されたWWWページの情報を検索可能な形で保持するWWWページ索引データベースに格納するWWWページ索引格納プロセスとを有することを特徴とする文書検索サービス提供プログラムを格納した記憶媒体。

請求項13

コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供プログラムを格納した記憶媒体であって、検索利用者の検索利用者端末からのアクセスに対して検索キーワードの入力を促し、該検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索し、WWWサイト毎にグループ化し、WWWサイト情報及び情報登録者名を付加した検索結果を該検索利用者端末に表示する検索プロセスとを有することを特徴とする文書検索サービス提供プログラムを格納した記憶媒体。

請求項14

時間を計測するタイマが一定の時間を計数する度に、前記WWWページ収集プロセスにおいて収集されたWWWページで、前記WWWページ索引データベースに保持されているWWWページ情報を更新する更新プロセスとを更に有する請求項12記載の文書検索サービス提供プログラムを格納した記憶媒体。

技術分野

0001

本発明は、文書検索サービス提供方法及び装置及び文書検索サービス提供プログラム及び文書検索サービス提供プログラムを格納した記憶媒体係り、特に、ネットワーク上に存在する文書集合から特定の条件に適合する文書を探し出す検索システムにおいて、検索対象となる文書集合を収集するための文書検索サービス提供方法及び装置及び文書検索サービス提供プログラム及び文書検索サービス提供プログラムを格納した記憶媒体に関する。

背景技術

0002

従来、特定の話題興味を持つ人々の間で、どこのWWWサイトにどのような情報があるかという情報を共有するために、リンク集と呼ばれるページを作成する方法が採られている。リンク集は図10のようなものであり、WWWのハイパーリンク機能を用いて、関連するWWWサイトへのリンクを配置し、リンク先タイトルロゴ、簡単な紹介文などを付加したものである。利用者はこの紹介文を見て、どのサイトに所望の情報があるかを判断することができる。

0003

しかし、従来のリンク集を用いる方法では、関連サイトが多くなるにつれてリンク集から所望のサイトを探すことが困難となっている。そこで考えられたのが、“Yahoo”に代表されるディレクトリ型検索サービスである。これは、人手により、WWWサイトのカテゴリ分けや説明文の入力を行なっており、これを元にWWWサイトの検索を行なうシステムである。ディレクトリ型検索サービスはいわば、すべての話題を扱う大規模なリンク集に検索機能を付加したものであると言える。

0004

一方、増加し続けるWWWページを探し出すためのサービスとして、ロボット型検索と呼ばれる検索サービスも広く利用されている。ロボット型検索サービスは、WWWページのリンクを辿りながら自動的にWWWページを収集する「情報収集ロボット」あるいは「クローラー」と呼ばれるプログラムを使用している。これらは、機械的に情報の収集が行なわれるため、リンク集やディレクトリ型検索サービスのようにカテゴリや紹介文を提供することはできないが、新しく現れたWWWページを自動的に発見することが可能であることや、WWWページそのものを検索対象としているためにディレクトリ型検索サービスでは発見できないようなWWWページも見つけ出すことができる。また、情報収集ロボットにより絶えず情報が更新されているため、最新の情報に基づいた検索を行なうことができる。

0005

ロボット型検索サービスのこのような利点を生かしながら、特定の話題のみに特化した検索サービスを提供することも行なわれている。これは、ロボット巡回するWWWサイトを、特定の話題に関連したWWWサイトのみに限定することによって実現されている。

発明が解決しようとする課題

0006

しかしながら、上記従来のリンク集やディレクトリ検索サービスでは、更新を手作業に負っているため、情報が古くなりやすく、リンク先が既に存在しなくなっている、いわゆるリンク切れや、新しいWWWサイトの情報が存在しない、という状態が発生し易い。特に、ディレクトリサービスでは、データ登録時の情報を検索対象としているため、最近のキーワードでは検索できないことも多い。

0007

また、ロボット型検索サービスでは、情報の更新は、頻繁に行なわれるものの、特定の話題に検索対象を制限することができず、検索結果に利用者にとって必要のないWWWページが大量に含まれることになる。また、紹介文やカテゴリなどの付加情報がないため、利用者が検索結果の中からどのリンクを選べば良いかを判断することが難しくなっている。

0008

また、ロボットが巡回するWWWサイトを制限して話題を特定する方法では、ロボット型検索サービスの特徴である新しいWWWサイトを発見する機能が生きず、やはり情報が古くなるという問題が発生する。

0009

本発明は、上記の点に鑑みなされたもので、特定の話題に興味を持つ人々が各人の推薦する最新のWWWページ情報を共有することを容易にすると共に、特定の話題に特化したWWWページ検索サービスを構築するための文書検索サービス提供方法及び装置及び文書検索サービス提供プログラム及び文書検索サービス提供プログラムを格納した記憶媒体を提供することを目的とする。

課題を解決するための手段

0010

図1は、本発明の原理を説明するための図である。

0011

本発明(請求項1)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供方法において、情報登録者情報登録者端末からのアクセスに対して、情報登録者の認証を行い(ステップ1)、情報登録者端末に対して、検索対象となるWWWサイトの名前、URL、紹介文を含むWWWサイト情報の入力を促し(ステップ2)、情報登録者端末から入力されたWWWサイト情報及び登録者名をWWWサイト情報データベースに記憶し(ステップ3)、指定されたWWWサイトから該WWWサイトに含まれるWWWページ群を取得し、検索用データベースに格納し(ステップ4)、検索利用者検索利用者端末に対して、検索キーワードの入力を促し(ステップ5)、検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索用データベースから検索し(ステップ6)、検索されたWWWページ群をWWWサイト毎にグループ化し(ステップ7)、グループ毎に、WWWサイトの名前、紹介文を含むWWWサイト情報と、情報登録者の名前を付加したページを作成し(ステップ8)、作成されたページを検索結果として検索利用者端末に表示する(ステップ9)。

0012

本発明(請求項2)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供方法において、情報登録者の情報登録者端末からのアクセスに対して、情報登録者の認証を行い、情報登録者端末に対して、検索対象となるWWWサイトの名前、URL、紹介文を含むWWWサイト情報の入力を促し、情報登録者端末から入力されたWWWサイト情報及び登録者名をWWWサイト情報データベースに記憶し、指定されたWWWサイトから該WWWサイトに含まれるWWWページ群を取得し、検索用データベースに格納する。

0013

本発明(請求項3)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供方法において、検索利用者の検索利用者端末に対して、検索キーワードの入力を促し、検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索用データベースから検索し、検索されたWWWページ群をWWWサイト毎にグループ化し、グループ毎に、WWWサイトの名前、紹介文を含むWWWサイト情報と、情報登録者の名前を付加したページを作成し、作成されたページを検索結果として検索利用者端末に表示する。

0014

本発明(請求項4)は、所定の条件を満たしている場合に、WWWサイト情報データベースに保存されているWWWサイト情報を読み出し、WWWサイト情報に含まれているURLからWWWページ群を取得し、取得したWWWページを元に、検索用データベースを更新する。

0015

図2は、本発明の原理構成図である。

0016

本発明(請求項5)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供装置であって、情報登録者の認証を行なう会員認証手段11と、会員認証手段11により認証された情報登録者からURL、タイトル、紹介文を含むWWWサイト情報を受け付けるWWWサイト情報入力手段12と、WWWサイト情報入力手段12からのWWWサイト情報及び情報登録者名を保持するWWWサイト情報保持手段15と、WWWサイト情報保持手段15に保持されたWWWサイト情報に基づいて、WWWページ情報を収集するWWWページ収集手段14と、WWWページ収集手段14によって収集されたWWWページの情報を検索可能な形で保持するWWWページ索引保持手段16と、検索利用者の検索利用者端末40からのアクセスに対して検索キーワードの入力を促し、該検索利用者端末40から入力された検索キーワードに関連するWWWページ群を検索し、WWWサイト毎にグループ化し、WWWサイト情報及び情報登録者名を付加した検索結果を該検索利用者端末40に表示する検索手段17とを有する。

0017

本発明(請求項6)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供装置であって、情報登録者の認証を行なう会員認証手段と、会員認証手段により認証された情報登録者からURL、タイトル、紹介文を含むWWWサイト情報を受け付けるWWWサイト情報入力手段と、WWWサイト情報入力手段からのWWWサイト情報及び情報登録者名を保持するWWWサイト情報保持手段と、WWWサイト情報保持手段に保持されたWWWサイト情報に基づいて、WWWページ情報を収集するWWWページ収集手段と、WWWページ収集手段によって収集されたWWWページの情報を検索可能な形で保持するWWWページ索引保持手段とを有する。

0018

本発明(請求項7)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供装置であって、検索利用者の検索利用者端末からのアクセスに対して検索キーワードの入力を促し、該検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索し、WWWサイト毎にグループ化し、WWWサイト情報及び情報登録者名を付加した検索結果を該検索利用者端末に表示する検索手段とを有する。

0019

本発明(請求項8)は、時間を計測するタイマと、タイマが一定の時間を計数する度に、WWWページ収集手段において収集されたWWWページで、WWWページ索引保持手段に保持されているWWWページ情報を更新する更新手段とを更に有する。

0020

本発明(請求項9)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供プログラムであって、情報登録者の認証を行なう会員認証プロセスと、会員認証プロセスにより認証された情報登録者からURL、タイトル、紹介文を含むWWWサイト情報を受け付けるWWWサイト情報入力プロセスと、WWWサイト情報入力プロセスからのWWWサイト情報及び情報登録者名を保持するWWWサイト情報データベースに保持されたWWWサイト情報に基づいて、WWWページ情報を収集するWWWページ収集プロセスと、WWWページ収集プロセスによって収集されたWWWページの情報を検索可能な形で保持するWWWページ索引データベースに格納するWWWページ索引格納プロセスとを有する。

0021

本発明(請求項10)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供プログラムであって、検索利用者の検索利用者端末からのアクセスに対して検索キーワードの入力を促し、該検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索し、WWWサイト毎にグループ化し、WWWサイト情報及び情報登録者名を付加した検索結果を該検索利用者端末に表示する検索プロセスとを有する。本発明(請求項11)は、時間を計測するタイマが一定の時間を計数する度に、WWWページ収集プロセスにおいて収集されたWWWページで、WWWページ索引データベースに保持されているWWWページ情報を更新する更新プロセスとを更に有する。

0022

本発明(請求項12)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供プログラムを格納した記憶媒体であって、情報登録者の認証を行なう会員認証プロセスと、会員認証プロセスにより認証された情報登録者からURL、タイトル、紹介文を含むWWWサイト情報を受け付けるWWWサイト情報入力プロセスと、WWWサイト情報入力プロセスからのWWWサイト情報及び情報登録者名を保持するWWWサイト情報データベースに保持されたWWWサイト情報に基づいて、WWWページ情報を収集するWWWページ収集プロセスと、WWWページ収集プロセスによって収集されたWWWページの情報を検索可能な形で保持するWWWページ索引データベースに格納するWWWページ索引格納プロセスとを有する。

0023

本発明(請求項13)は、コンピュータネットワーク上に存在するWWWページの集合から所望の文書を発見するための文書検索サービス提供プログラムを格納した記憶媒体であって、検索利用者の検索利用者端末からのアクセスに対して検索キーワードの入力を促し、該検索利用者端末から入力された検索キーワードに関連するWWWページ群を検索し、WWWサイト毎にグループ化し、WWWサイト情報及び情報登録者名を付加した検索結果を該検索利用者端末に表示する検索プロセスとを有する。本発明(請求項14)は、時間を計測するタイマが一定の時間を計数する度に、WWWページ収集プロセスにおいて収集されたWWWページで、WWWページ索引データベースに保持されているWWWページ情報を更新する更新プロセスとを更に有する。

0024

上記のように、本発明では、インターネット上のホームページ等の情報の在処を提供する検索サービス(例えば、サーチエンジン、Yahooのようなディレクトリ)において、登録型とロボット検索型の両方の長所を併せ持つシステムを構築することで、情報登録者は、WWWサイトの情報をネットワーク上から自由に登録することができる。これにより、検索サービスの対象が固定されず、情報登録者の働きかけによって検索対象を拡張することを可能とする。

0025

ここで、情報登録者は、検索利用者であってもよい。この場合、検索サービスを利用する利用者コミュニティ内の興味の変化に応じて検索対象を変化させることができるようになり、検索サービスの利用価値を向上させることができる。

0026

また、本発明では、実際にWWWサイトからWWWページ群を取得し、検索対象としているため、実際にWWWページ中に現れるキーワードで検索できるようになる。また、実際には存在しないURLが入力されたとしてもこの段階でWWWページが取得できないため、リンク切れを未然に防ぐことができる。

0027

また、本発明による検索結果は、WWWサイト毎に纏められ、WWWサイトを登録した情報登録者の名前と紹介文が提示される。検索利用者は、この紹介文により適切なWWWサイトを選別することが可能となる。また、情報登録者の名前が提示されるため、コミュニケーション内での信頼関係を利用した選別、例えば、「ある分野の専門家であるAさん紹介ならば有効だろう」、あるいは、「自分と趣味の似ているBさんの推薦は重要だ」、という選別ができるようになる。また、本発明では、情報登録者の名前を提示するため、コミュニティの話題にそぐわないWWWサイトを登録することに対する抑止効果が期待できる。

0028

これらの機能より、コミュニティの活性化が図られ、特定の話題に向けた検索サービスの情報を最新に維持できるようになる。

0029

また、本発明では、所定の条件を満たした場合に、保存されているWWWサイト情報を読み出し、WWWサイト情報に含まれているURLからWWWページ群を取得し、取得したWWWページを元に検索用データベースを更新することが可能であり、例えば、1日1回のように、定期的にWWWサイトから最新のWWWページ情報を取得し、検索用データベースを更新する。これにより、検索対象の情報を最新に保ち、かつリンク切れを防ぐことが可能となる。

発明を実施するための最良の形態

0030

以下、図面と共に本発明の実施の形態について説明する。

0031

図3は、本発明の一実施の形態における文書検索サービス提供装置の構成を示す。

0032

同図示す装置10は、情報登録者端末20、WWWサーバ30、検索利用者端末40に接続されている。

0033

情報登録者端末20及び情報利用者端末40には、WWWブラウザインストールされている。例えば、マイクロソフト社の「インターネットエクスプローラ」等などで本装置10にアクセスすることができる。

0034

装置10は、サーバコンピュータ上に構成されており、情報登録者端末20、情報利用者端末40からの要求を受け付けるためにHTTPサーバを利用することができる。例えば、フリーソフトの“apache(アパッチ)”等を利用してもよい。

0035

装置10は、会員認証部11、WWWサイト情報入力部12、タイマ13、WWWページ収集部14、WWWサイト情報保持部15、WWWぺージ索引保持部16、検索部17より構成される。

0036

このうち、WWWサイト情報入力部12、検索部17は、HTTPサーバの機能拡張方法であるCGIインタフェースを使って作成することができる。

0037

会員認証部11は、HTTPサーバの認証機構をそのまま利用してもよい。他に認証サーバを用意して、認証結果を“Cookie”などの技術を使って伝えるという一般的な手法で実現してもよい。

0038

タイマ13は、設定された時間間隔で信号を出力し、WWWページ収集部14を起動させることができる。タイマ13は、例えば、UNIX(登録商標)の“cron”などの機能を使って実現することができる。

0039

WWWページ収集部14は、一般に情報収集ロボットと呼ばれるものであり、フリーソフトウェアの“wget”または、“httpdown”などのソフトウェアを使えばよい。

0040

WWWサイト情報保持部15は、WWWサイト情報DB151を含んでいる。WWWサイト情報DB151は、市販のRDBMSを使って実現することができる。

0041

WWWページ索引保持部16は、WWWページDB161と、全文検索エンジン162を含んでいる。WWWページDB161は、WWWサイト情報DB151と同様に、市販のRDBMSを使って実現することができる。全文検索エンジン162は、全文検索機能を提供するもので、“N−gram”を使ったもの、形態素解析を使ったもの、ベクトル空間法などの手法を使ったものが一般に使用されている。

0042

次に、本発明の動作を説明する。

0043

最初に、情報登録時の動作について説明する。

0044

図4は、本発明の一実施の形態における情報登録動作のフローチャートである。

0045

ステップ101) まず、情報登録者端末20からのアクセスに対して、ログイン即ち、会員認証が完了しているかどうかを検査する。ログインが完了していなければ、ステップ111に移行する。

0046

ステップ102)ログインが完了していれば、WWWサイト情報が入力されているかどうかを確認する。ここで、WWWサイト情報が入力されていなければ、ステップ121に移行する。WWWサイト情報が入力されている場合には、ステップ103に移行する。

0047

ステップ103)図5に示すWWW情報登録画面(詳細は、ステップ121で後述する)で入力されたWWWサイト情報と認証によって取得された情報登録者IDをWWWサイト情報DB151に格納する。

0048

ステップ104)WWWページ収集部17により、指定されたWWWサイトからWWWページを収集する。このとき、図5の「ハイパーリンクを辿る」チェックボックス103の状態によってWWWページ収集部17の動作を替える。

0049

ステップ105)WWWページ収集部17でWWWページの取得が成功したかどうかを検査する。もし取得に失敗していれば、ステップ131に移行する。取得に成功していればステップ106に移行する。

0050

ステップ106) 情報の取得に成功していれば、「ご登録ありがとうございました」というメッセージを表示する。

0051

ステップ107) 取得したWWWページに基づいてWWWページDB161及び全文検索エンジン162を更新し、終了する。

0052

ステップ111) ステップ101において、ログインが完了していない場合には、ログイン画面あるいはログインサーバへ情報登録者端末を移動させるように制御して終了する。

0053

ステップ121) ステップ102において、WWW情報が入力されていない場合には、WWWサイト登録画面を表示して終了する。図5の画面には、WWWサイトのタイトルを入力するテキストフィールド101、URLを入力するテキストフィールド102、指定したURLの中に含まれるハイパーリンクをさらにたどってそのWWWサイトの内容も検索対象に含めるかどうかを指定するチェックボックス103、紹介文を入力するテキストエリア104、登録ボタン105が表示される。

0054

ステップ131) ステップ105において、WWWページの取得に失敗している場合には、「指定されたサイトから情報が取得できません」というメッセージを表示して終了する。

0055

ここで、データベースの構造について説明する。

0056

図6は、本発明の一実施の形態におけるWWWサイト情報DB及びWWWページDBのテーブル構造を示す。本装置10は、WWWサイト情報DB151とWWWページDB161の2つのデータベースを使用している。

0057

WWWサイト情報DB151のWWWサイト情報は、それぞれサイトIDを付与して他のWWWサイト情報と区別される。一方、WWWページDB161では、ページを区別するページIDの他に、そのページがどのWWWサイトに含まれるかを示すサイトIDを持っている。サイトIDは検索時のグループ化の際に使用される。

0058

次に、検索時の処理について説明する。

0059

図7は、本発明の一実施の形態における検索動作のフローチャートである。

0060

ステップ201) まず、検索利用者端末40からのアクセスに対し、検索キーワードが与えられているかを確認する。検索キーワードが与えられていなければ、ステップ211に移行する。

0061

ステップ202)検索キーワードが与えられている場合には、全文検索エンジン162を使って与えられた検索キーワードを含むWWWページのページIDの集合を取得する。

0062

ステップ203) ステップ202における検索結果がある場合には、ステップ204に移行し、ない場合には、ステップ221に移行する。

0063

ステップ204)検索結果がある場合には、WWWぺージDB161を使って、各ページIDをサイトID毎にグループ化する。

0064

ステップ205) 各サイトID毎にサイトのスコアを計算する。このスコアは、全文検索エンジンがWWWページ毎に返却するスコアの和でも良いし、単純にヒットしたWWWページが何件WWWサイトに含まれているかでもよい。

0065

ステップ206) ステップ205で求められたスコアの大きい順番サイト情報を並べ替える。

0066

ステップ207)検索結果画面に表示可能な件数に検索結果を切り詰める処理を行なう。1画面に表示できるWWWページの件数は、設定で変更できるように構築することが望ましい。

0067

ステップ208) ステップ207で残ったWWWサイト、WWWページに関する表示データをWWWサイト情報DB151及びWWWページDB161から取得する。

0068

ステップ209) ステップ208で取得した表示データを組み合わせた検索結果画面を作成し、検索利用者端末40に送信して終了する。

0069

ステップ211) ステップ201で検索キーワードが入力されていない場合には、検索画面を表示する。検索画面は、検索キーワードを入力するテキストフィールドと検索ボタンを含んでいる。

0070

ステップ221) ステップ203において、検索結果がゼロの場合には、「検索件数は0です」というメッセージを表示して終了する。

0071

図8は、本発明の一実施の形態における検索結果画面の例を示す。検索結果は、WWWサイト毎にタイトル203、情報登録者が入力したサイトの紹介文204、情報登録者の名前(ID)205と、検索キーワードで照合に成功したWWWページのタイトル群206が表示されている。タイトル203とタイトル群206はハイパーリンクになっている。タイトル203をクリックすると、WWWサイトのトップページジャンプする。また、タイトル群206は、検索にヒットしたWWWページそのものにジャンプする。また、情報登録者ID206を情報登録者のメールアドレスへのハイパーリンクにすることもできる。このように、本装置10の検索結果は、サイト別に紹介文を付与して提示されるので、どのWWWページを見ればよいかが分かりやすい。また、情報登録者名が提示されているので、Aさんの推薦なら間違いないだろうという判断材料を提供することができる。

0072

次に、WWWページの更新処理について説明する。

0073

図9は、本発明の一実施の形態におけるWWWページ情報更新のフローチャートである。

0074

当該WWWページの更新は、タイマ13によって起動されるものである。

0075

ステップ301) まず、WWWページ収集部14が一日に一度など、タイマ13から定期的に処理が起動されると、WWWサイト情報DB151から1レコードずつWWWサイト情報を取り出す。

0076

ステップ302)WWWサイト情報DB151からのレコードの取り出しが最後のレコードに到達したかをチェックする。レコードの終わりでなければ、ステップ303に移行し、最終レコードである場合には、ステップ311に移行する。

0077

ステップ303)レコードの終わりでなければ、取り出されたレコードのURLからWWWページ収集部14を使って、WWWページを取得し、再び、ステップ301の処理を行なう。

0078

ステップ311) ステップ302において、取り出されたレコードが最終レコードである場合には、WWWページ収集部14において、収集されたWWWページの情報を使って、WWWページDB161及び全文検索エンジン162の情報を更新し、終了する。

0079

また、上記の実施の形態における図4図7図9に示す各フローチャートの処理をプログラムとして構築し、文書検索サービス提供装置として利用されるコンピュータのCPUにインストールする、または、ネットワークを介して流通させることが可能である。

0080

また、構築されたプログラムを文書検索サービス提供装置として利用されるコンピュータに接続されるハードディスク装置や、フロッピー(登録商標)ディスクCD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより、容易に本発明を実現できる。

0081

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。

発明の効果

0082

上述のように、本発明によれば、特定の話題に興味を持つ人々が各人の推薦する最新のWWWページ情報を共有することを容易にすることができると共に、特定の話題に特化したWWWページ検索サービスを構築することが可能である。

図面の簡単な説明

0083

図1本発明の原理を説明するための図である。
図2本発明の原理構成図である。
図3本発明の一実施の形態における文書検索サービス提供装置の構成図である。
図4本発明の一実施の形態における情報登録動作のフローチャートである。
図5本発明の一実施の形態におけるWWWサイト情報登録画面の例である。
図6本発明の一実施の形態におけるWWWサイト情報DB及びWWWページDBテーブルの構造を示す図である。
図7本発明の一実施の形態における検索動作のフローチャートである。
図8本発明の一実施の形態における検索結果画面の例である。
図9本発明の一実施の形態におけるWWWページ情報更新のフローチャートである。
図10従来のリンク集の例である。

--

0084

10文書検索サービス提供装置
11会員認証手段、会員認証部
12WWWサイト情報入力手段、WWWサイト情報入力部
13タイマ
14WWWページ収集手段、WWWページ収集部
15 WWWサイト情報保持手段、WWWサイト情報保持部
16ページ索引保持手段、WWWページ索引保持部
17検索手段
20情報登録者端末
30WWWサーバ
40検索利用者端末
101タイトルを入力するテキストフィールド
102 URLを入力するテキストフィールド
103チェックボックス
104紹介文を入力するテキストエリア
105登録ボタン
151 WWWサイト情報DB
161 WWWページDB
162全文検索エンジン
203 タイトル
204 WWWサイトの紹介文
205情報登録者の名前
206 情報登録者ID

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社サードパーティートラストの「 情報処理システム、処理方法、処理プログラム」が 公開されました。( 2019/05/23)

    【課題】ウェブサイトに含まれる複数のウェブページ間の移動に基づいて、ウェブサイトにおけるパフォーマンス改善を行う為の技術を提供することを課題とする。【解決手段】ウェブサイトにおけるパフォーマンス改善を... 詳細

  • 尾和剛一の「 特許文献集合の分析方法」が 公開されました。( 2019/05/23)

    【課題】特定のコア技術や、特定の出願人の特定の分野の全特許文献集合の文献件数時系列動向とは異なる動向を示す文献項目を抽出する方法を提供する。【解決手段】特定文献集合分折方法は、特定の文献集合の特許文献... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法および情報処理プログラム」が 公開されました。( 2019/05/23)

    【課題】位置情報を付加したコンテンツを作成する際の利便性を高めることができる情報処理装置、情報処理方法および情報処理プログラムを提供する。【解決手段】情報処理装置1は、コンテンツ取得部31と、位置候補... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ