図面 (/)

技術 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体

出願人 三菱電機株式会社
発明者 新堂隆夫
出願日 2000年7月18日 (19年2ヶ月経過) 出願番号 2000-217005
公開日 2002年1月31日 (17年7ヶ月経過) 公開番号 2002-032401
状態 未査定
技術分野 検索装置
主要キーワード 同居家族 適合度情報 文書登録者 街区番号 プロファイル登録 業種情報 過去一定期間 入力画
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2002年1月31日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (13)

課題

ユーザの検索意図適合する文書検索装置及び方法を提供する。

解決手段

ユーザが入力した検索条件に基づいて文書データベース104の中から目的とする文書検索し、個々のユーザの検索意図に対する適合度を検索結果の一覧表を作成して、ユーザに提示する文書検索装置及び方法において、文書を文書蓄積部107に登録する際に、文書自体に含まれるキーワードによる索引に加えて、どのようなプロファイル情報を持つユーザに該文書が適合するかを示す適合度情報を予め作成して適合度情報格納部109へ格納しておき、ユーザが検索毎に入力した検索条件に加えて、ユーザが検索毎に入力する必要のない個々のユーザのプロファイル情報と前記適合度情報に基づいて、検索結果の各文書のスコア計算及びランキングスコアの大小順序)を行い、個々のユーザに応じて各文書の検索結果の一覧表内での提示順序を変更する。

概要

背景

従来の文書検索方法では、文書検索は次のように行なわれる。まず、ユーザが単一のキーワードまたは複数のキーワードの組合わせからなる検索条件検索端末から入力する。入力された検索条件は、インターネットローカルエリアネットワークなどのネットワークを介して文書検索装置へ送信される。

文書検索装置には、検索対象である文書群を格納した文書データベースと、検索条件を使って文書データベースの検索を行なう検索手段が備えられている。文書検索装置は、検索端末から受信した検索条件を使って、検索条件に適合する文書の検索を行なう。検索結果は、一覧表の形で、検索端末に、ネットワークを介して返される。

ここで、検索手段が検索を効率よく行なうために、文書データベースに格納された文書群に含まれるキーワードを用いた索引が前もって作成される。文書データベースは、文書群そのものを蓄積する文書蓄積部と、索引格納部からなっており、索引格納部には、前記索引が格納される。索引には、文書群に含まれるテキストデータの中から抽出したキーワードと、それを含む文書の格納場所を示すポインタが含まれている。

文書検索装置は、索引を用いた検索の結果として複数の文書が検索された場合、各文書がユーザの検索意図にどれくらい適合しているかを、その検索に対する各文書のスコアという数値として計算し、スコアの大小順に各文書の順位、すなわちランキングを決定して、検索結果の一覧表の中でランキングの順に並べる。検索端末には、検索結果の文書がランキングの順序に並べられて、ユーザに提示される。

スコアの計算には、各種の方法が行われているが、例えば、検索条件で指定されたキーワードが数多く含まれている文書のスコアを高くする方法がある。また、前記方法に加えて、そのキーワードが文書群全体の中でどれくらい多くの文書に含まれているかを調べ、数少ない文書に含まれているキーワードの重みを大きくするという補正を行なう方法がある。

いずれにしても、従来の方法では、キーワードの文書群の中での頻度分布と、ユーザが入力した検索条件に含まれるキーワードとの関係のみを用い、ユーザ固有の情報を反映せずに、各文書のスコアを計算していた。

また、スコア計算に、個々のユーザの嗜好情報興味情報を含める方法も知られている。例えば、予めユーザが興味のあるキーワード及びその重み付けを文書検索装置に登録しておき、検索された文書にそれらのキーワードが含まれている場合にその文書のスコアを高くする方法がある。

また、予めユーザの嗜好情報を明示的に登録するか、または、ユーザの操作履歴などから自動的に嗜好情報を推定し、さらにその情報からキーワードを導出しておき、検索された文書にそれらのキーワードが含まれている場合にその文書のスコアを高くする方法がある。

概要

ユーザの検索意図に適合する文書検索装置及び方法を提供する。

ユーザが入力した検索条件に基づいて文書データベース104の中から目的とする文書を検索し、個々のユーザの検索意図に対する適合度を検索結果の一覧表を作成して、ユーザに提示する文書検索装置及び方法において、文書を文書蓄積部107に登録する際に、文書自体に含まれるキーワードによる索引に加えて、どのようなプロファイル情報を持つユーザに該文書が適合するかを示す適合度情報を予め作成して適合度情報格納部109へ格納しておき、ユーザが検索毎に入力した検索条件に加えて、ユーザが検索毎に入力する必要のない個々のユーザのプロファイル情報と前記適合度情報に基づいて、検索結果の各文書のスコア計算及びランキング(スコアの大小順序)を行い、個々のユーザに応じて各文書の検索結果の一覧表内での提示順序を変更する。

目的

本発明は、以上のような問題点を解決するためになされたもので、ユーザ固有のプロファイル情報を反映したスコア計算及びランキングを行い、ユーザの検索意図に十分に適合した検索結果一覧表を提示することを目的とする。

また、文書提供者の意図に十分適合したユーザに提供文書が検索、閲覧されることができる文書検索装置と、それに用いられる文書検索方法と、該方法を実施するためのプログラムを保持する記憶媒体とを提供することを目的とする。

効果

実績

技術文献被引用数
9件
牽制数
14件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

入力を受け付け検索条件に基づいて文書データベースの中から適合する文書検索し、検索した文書の一覧表提示する文書検索方法において、上記文データベース内に、文書を蓄積する記憶領域である文書蓄積部と、ユーザのプロファイル情報が上記文書に適合する度合いを示す適合度情報を格納する記憶領域である適合度情報格納部とを形成する記憶領域形成工程と、文書を上記文書蓄積部へ蓄積する文書蓄積工程と、上記文書蓄積工程で蓄積する文書に対応する適合度情報の入力を受け付け、受け付けた適合度情報を上記文書蓄積部に蓄積する文書に対応させて上記適合度情報格納部へ格納する適合度情報格納工程と、検策条件と上記検策条件を入力したユーザのプロファイル情報とを入力し、入力した検策条件に基づいて、上記文書蓄積部から文書を検索し、上記適合度情報格納部から適合度情報を読み込み、入力したプロファイル情報と読み込んだ適合度情報とに基づいて、検索した文書の適合度数値で示すスコアを計算し、上記スコアに基づいて文書を一覧表に提示する順序を決定する検策実行工程とを備えたことを特徴とする文書検索方法。

請求項2

上記プロファイル情報は、複数のデータ値を採る複数種類特性情報を含み、上記適合度情報格納工程は、適合度情報として、適合度の度合いを数値で指定し、プロファイル情報に含まれる複数種類の特性情報それぞれが採り得る複数のデータ値それぞれに対応する数値を指定する入力を受け付け、受け付けた複数種類の特定情報それぞれが採り得る複数のデータ値それぞれに対応する数値を適合度情報として格納することを特徴とする請求項1記載の文書検索方法。

請求項3

上記検索実行工程は、上記プロファイル情報に含まれる複数の特性情報それぞれについて、特性情報が採るデータ値に対応する適合度情報として示される数値を取得し、取得した複数の特性情報それぞれに対応する数値を用いてスコアを計算することを特徴とする請求項2記載の文書検索方法。

請求項4

上記文書検策方法は、検索条件と、予め検索に先立ってユーザが入力したプロファイル情報とを通信網を介して受信し、上記検索実行工程は、受信した検索条件とプロファイル情報とを入力することを特徴とする請求項1から3いずれかに記載の文書検索方法。

請求項5

上記プロファイル情報は、ユーザの性別年齢生年月日住所、ユーザが関係の深い地域、業種職種家族構成年収趣味、特に関心の深い分野の内の少なくとも一つを含むことを特徴とする請求項1から4いずれかに記載の文書検索方法。

請求項6

上記検索実行工程は、さらに、上記検索条件と上記プロファイル情報とを受信した時に取得する通信情報から、ユーザが上記検索条件と上記プロファイル情報とを入力した検索端末に関する情報を収集することを特徴とする請求項4記載の文書検索方法。

請求項7

上記検索端末に関する情報は、検索端末もしくは検索端末が接続しているプロキシサーバインターネットプロトコルアドレスと、検索端末もしくは検索端末が接続しているプロキシサーバの属するインターネットドメイン名とのいずれか一つを含み、さらに、上記インターネットプロトコルアドレスから特定されるユーザの属する国名と、上記インターネットドメイン名から特定されるユーザの属する国名及びユーザの属する組織の種類とのいずれか一方を含むこと特徴とする請求項6記載の文書検索方法。

請求項8

上記検索実行工程は、上記検索条件と上記プロファイル情報に加え、検索条件を入力したユーザが過去に上記文書蓄積工程で蓄積された文書を検索した履歴情報を入力し、入力した履歴情報が所定の条件を示す場合は、上記検索した文書のスコアを高くすることを特徴とする請求項1から7いずれかに記載の文書検索方法。

請求項9

上記履歴情報は、上記文書蓄積工程で蓄積された文書を予め複数のカテゴリ分類し、過去一定期間内に閲覧した文書が属するカテゴリと、上記カテゴリを閲覧した閲覧回数と、閲覧した日時時刻及び閲覧した曜日及び時間帯とのいずれか一つとを含み、上記検索実行工程は、ユーザが所定の期間内に、所定の回数上記文書が属するカテゴリを閲覧した場合は、上記文書のスコアを高くすることを特徴とする請求項8記載の文書検索方法。

請求項10

入力を受け付けた検索条件に基づいて文書データベースの中から適合する文書を検索し、検索した文書の一覧表を提示する文書検索装置において、上記文書データベースは、文書を予め蓄積する文書蓄積部と、ユーザに関する情報を収集したプロファイル情報が上記文書蓄積部に蓄積される文書に適合する度合いを示す適合度情報の入力を受け付け、受け付けた適合度情報を上記文書蓄積部に蓄積される文書に対応させて格納する適合度情報格納部とを有し、上記文書検索装置は、検策条件と上記検策条件を入力したユーザに関するプロファイル情報とを入力し、入力した検策条件に基づいて、上記文書蓄積部から文書を検索し、上記適合度情報格納部から適合度情報を読み込み、入力したプロファイル情報と読み込んだ適合度情報とに基づいて、検索した文書の適合度を数値で示すスコアを計算し、上記スコアに基づいて文書を一覧表に提示する順序を決定する検策実行部とを備えたことを特徴とする文書検索装置。

請求項11

上記プロファイル情報は、複数のデータ値を採る複数の特性情報を含み、上記適合度情報格納部は、適合度情報として、適合度の度合いを数値で指定し、プロファイル情報に含まれる複数種類の特性情報それぞれが採り得る複数のデータ値それぞれに対応する数値を指定する入力を受け付け、受け付けた複数種類の特定情報それぞれが採り得るの複数のデータ値それぞれに対応する数値を適合度情報として格納することを特徴とする請求項10記載の文書検索装置。

請求項12

上記検索実行部は、上記プロファイル情報に含まれる複数の特性情報それぞれについて、特性情報が採るデータ値に対応する適合度情報として示される数値を取得し、取得した複数の特性情報それぞれに対応する数値を用いてスコアを計算することを特徴とする請求項11記載の文書検索装置。

請求項13

上記文書検策装置は、さらに、通信網と接続し、検索条件と、予め検索に先立ってユーザが入力したプロファイル情報とを通信網を介して受信する特徴とする請求項10から12いずれかに記載の記載の文書検索装置。

請求項14

上記文書検索装置は、上記通信網を介して検索端末と接続し、プロファイル情報をユーザに入力させるプロファイル情報入力画面を上記検索端末へ送信し、送信したプロファイル情報入力画面を用いてユーザにプロファイル情報の入力を促し、入力されたプロファイル情報を上記検索端末へ保存させることを特徴とする請求項13記載の文書検索装置。

請求項15

上記検索実行部は、上記検索条件と上記プロファイル情報とを受信した時に取得する通信情報から、ユーザが上記検索条件と上記プロファイル情報とを入力した検索端末に関する情報を収集することを特徴とする請求項13または14記載の文書検索装置。

請求項16

入力を受け付けた検索条件に基づいて文書データベースの中から適合する文書を検索し、検索した文書の一覧表を提示する文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体において、上記文書データベース内に、文書を蓄積する記憶領域である文書蓄積部と、ユーザに関する情報を収集したプロファイル情報が上記文書に適合する度合いを示す適合度情報を格納する記憶領域である適合度情報格納部とを形成する記憶領域形成工程と、文書を上記文書蓄積部へ蓄積する文書蓄積工程と、上記文書蓄積工程で蓄積する文書に対応する適合度情報の入力を受け付け、受け付けた適合度情報を上記文書蓄積部に蓄積する文書に対応させて上記適合度情報格納部へ格納する適合度情報格納工程と、検策条件と上記検策条件を入力したユーザに関するプロファイル情報とを入力し、入力した検策条件に基づいて、上記文書蓄積部から文書を検索し、上記適合度情報格納部から適合度情報を読み込み、入力したプロファイル情報と読み込んだ適合度情報とに基づいて、検索した文書の適合度を数値で示すスコアを計算し、上記スコアに基づいて文書を一覧表に提示する順序を決定する検策実行工程とを備えた文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体。

請求項17

上記文書検策方法は、上記文書データベースを有し、文書を検索する文書検索装置と、ユーザが検索条件を入力する検索端末とを用いて実行し、上記検索端末において、予め検索に先立ってユーザが入力したプロファイル情報を保存し、検索条件の入力を受け付け、受け付けた検索条件と上記検索条件を入力したユーザに対応するプロファイル情報とを上記文書検索装置へ送信し、上記文書検索装置において、送信された検索条件とプロファイル情報とを受信し、上記検索実行工程により、上記検索条件とプロファイル情報とを入力することを特徴とする請求項1から4いずれかに記載の文書検索方法。

技術分野

0001

この発明は、ユーザが入力した検索条件に基づいて文書データベースの中から検索条件に適合する文書を容易に検索する文書検索方法及び文書検索装置及び文書検索方法を実現するためのプログラムを記録する記録媒体に関する。

背景技術

0002

従来の文書検索方法では、文書検索は次のように行なわれる。まず、ユーザが単一のキーワードまたは複数のキーワードの組合わせからなる検索条件を検索端末から入力する。入力された検索条件は、インターネットローカルエリアネットワークなどのネットワークを介して文書検索装置へ送信される。

0003

文書検索装置には、検索対象である文書群を格納した文書データベースと、検索条件を使って文書データベースの検索を行なう検索手段が備えられている。文書検索装置は、検索端末から受信した検索条件を使って、検索条件に適合する文書の検索を行なう。検索結果は、一覧表の形で、検索端末に、ネットワークを介して返される。

0004

ここで、検索手段が検索を効率よく行なうために、文書データベースに格納された文書群に含まれるキーワードを用いた索引が前もって作成される。文書データベースは、文書群そのものを蓄積する文書蓄積部と、索引格納部からなっており、索引格納部には、前記索引が格納される。索引には、文書群に含まれるテキストデータの中から抽出したキーワードと、それを含む文書の格納場所を示すポインタが含まれている。

0005

文書検索装置は、索引を用いた検索の結果として複数の文書が検索された場合、各文書がユーザの検索意図にどれくらい適合しているかを、その検索に対する各文書のスコアという数値として計算し、スコアの大小順に各文書の順位、すなわちランキングを決定して、検索結果の一覧表の中でランキングの順に並べる。検索端末には、検索結果の文書がランキングの順序に並べられて、ユーザに提示される。

0006

スコアの計算には、各種の方法が行われているが、例えば、検索条件で指定されたキーワードが数多く含まれている文書のスコアを高くする方法がある。また、前記方法に加えて、そのキーワードが文書群全体の中でどれくらい多くの文書に含まれているかを調べ、数少ない文書に含まれているキーワードの重みを大きくするという補正を行なう方法がある。

0007

いずれにしても、従来の方法では、キーワードの文書群の中での頻度分布と、ユーザが入力した検索条件に含まれるキーワードとの関係のみを用い、ユーザ固有の情報を反映せずに、各文書のスコアを計算していた。

0008

また、スコア計算に、個々のユーザの嗜好情報興味情報を含める方法も知られている。例えば、予めユーザが興味のあるキーワード及びその重み付けを文書検索装置に登録しておき、検索された文書にそれらのキーワードが含まれている場合にその文書のスコアを高くする方法がある。

0009

また、予めユーザの嗜好情報を明示的に登録するか、または、ユーザの操作履歴などから自動的に嗜好情報を推定し、さらにその情報からキーワードを導出しておき、検索された文書にそれらのキーワードが含まれている場合にその文書のスコアを高くする方法がある。

発明が解決しようとする課題

0010

従来の文書検索方法では、上記のような方法で文書検索を行なっていたため、ユーザ固有の情報を反映せずに各文書のスコア計算及びランキングを行なう方法では、個々のユーザの検索意図に十分に適合した検索結果一覧表が提示されるとは限らないという問題があった。

0011

また、個々のユーザの嗜好情報、興味情報をスコア計算及びランキングに反映しようとする方法の場合も、ユーザの嗜好情報、興味情報は、結局、検索対象の文書群の中に含まれているキーワードに変換される必要があるが、文書中のキーワードは必ずしもユーザの嗜好情報、興味情報と強い相関があるとは限らず、個々のユーザの検索意図に十分に適合した検索結果一覧表が提示されるとは限らないという問題があった。

0012

また、文書の提供者立場においては、自分が提供した文書が、必ずしも提供者が意図した対象のユーザによって検索され、閲覧されるとは限らないという問題があった。

0013

本発明は、以上のような問題点を解決するためになされたもので、ユーザ固有のプロファイル情報を反映したスコア計算及びランキングを行い、ユーザの検索意図に十分に適合した検索結果一覧表を提示することを目的とする。

0014

また、文書提供者の意図に十分適合したユーザに提供文書が検索、閲覧されることができる文書検索装置と、それに用いられる文書検索方法と、該方法を実施するためのプログラムを保持する記憶媒体とを提供することを目的とする。

課題を解決するための手段

0015

この発明に係る文書検索方法は、入力を受け付けた検索条件に基づいて文書データベースの中から適合する文書を検索し、検索した文書の一覧表を提示する文書検索方法において、上記文データベース内に、文書を蓄積する記憶領域である文書蓄積部と、ユーザのプロファイル情報が上記文書に適合する度合いを示す適合度情報を格納する記憶領域である適合度情報格納部とを形成する記憶領域形成工程と、文書を上記文書蓄積部へ蓄積する文書蓄積工程と、上記文書蓄積工程で蓄積する文書に対応する適合度情報の入力を受け付け、受け付けた適合度情報を上記文書蓄積部に蓄積する文書に対応させて上記適合度情報格納部へ格納する適合度情報格納工程と、検策条件と上記検策条件を入力したユーザのプロファイル情報とを入力し、入力した検策条件に基づいて、上記文書蓄積部から文書を検索し、上記適合度情報格納部から適合度情報を読み込み、入力したプロファイル情報と読み込んだ適合度情報とに基づいて、検索した文書の適合度を数値で示すスコアを計算し、上記スコアに基づいて文書を一覧表に提示する順序を決定する検策実行工程とを備えたことを特徴とする。

0016

上記プロファイル情報は、複数のデータ値を採る複数種類特性情報を含み、上記適合度情報格納工程は、適合度情報として、適合度の度合いを数値で指定し、プロファイル情報に含まれる複数種類の特性情報それぞれが採り得る複数のデータ値それぞれに対応する数値を指定する入力を受け付け、受け付けた複数種類の特定情報それぞれが採り得る複数のデータ値それぞれに対応する数値を適合度情報として格納することを特徴とする。

0017

上記検索実行工程は、上記プロファイル情報に含まれる複数の特性情報それぞれについて、特性情報が採るデータ値に対応する適合度情報として示される数値を取得し、取得した複数の特性情報それぞれに対応する数値を用いてスコアを計算することを特徴とする。

0018

上記文書検策方法は、検索条件と、予め検索に先立ってユーザが入力したプロファイル情報とを通信網を介して受信し、上記検索実行工程は、受信した検索条件とプロファイル情報とを入力することを特徴とする。

0019

上記プロファイル情報は、ユーザの性別年齢生年月日住所、ユーザが関係の深い地域、業種職種家族構成年収趣味、特に関心の深い分野の内の少なくとも一つを含むことを特徴とする。

0020

上記検索実行工程は、さらに、上記検索条件と上記プロファイル情報とを受信した時に取得する通信情報から、ユーザが上記検索条件と上記プロファイル情報とを入力した検索端末に関する情報を収集することを特徴とする。

0021

上記検索端末に関する情報は、検索端末もしくは検索端末が接続しているプロキシサーバインターネットプロトコルアドレスと、検索端末もしくは検索端末が接続しているプロキシサーバの属するインターネットドメイン名とのいずれか一つを含み、さらに、上記インターネットプロトコルアドレスから特定されるユーザの属する国名と、上記インターネットドメイン名から特定されるユーザの属する国名及びユーザの属する組織の種類とのいずれか一方を含むこと特徴とする。

0022

上記検索実行工程は、上記検索条件と上記プロファイル情報に加え、検索条件を入力したユーザが過去に上記文書蓄積工程で蓄積された文書を検索した履歴情報を入力し、入力した履歴情報が所定の条件を示す場合は、上記検索した文書のスコアを高くすることを特徴とする。

0023

上記履歴情報は、上記文書蓄積工程で蓄積された文書を予め複数のカテゴリ分類し、過去一定期間内に閲覧した文書が属するカテゴリと、上記カテゴリを閲覧した閲覧回数と、閲覧した日時時刻及び閲覧した曜日及び時間帯とのいずれか一つとを含み、上記検索実行工程は、ユーザが所定の期間内に、所定の回数上記文書が属するカテゴリを閲覧した場合は、上記文書のスコアを高くすることを特徴とする。

0024

この発明に係る文書検索装置は、入力を受け付けた検索条件に基づいて文書データベースの中から適合する文書を検索し、検索した文書の一覧表を提示する文書検索装置において、上記文書データベースは、文書を予め蓄積する文書蓄積部と、ユーザに関する情報を収集したプロファイル情報が上記文書蓄積部に蓄積される文書に適合する度合いを示す適合度情報の入力を受け付け、受け付けた適合度情報を上記文書蓄積部に蓄積される文書に対応させて格納する適合度情報格納部とを有し、上記文書検索装置は、検策条件と上記検策条件を入力したユーザに関するプロファイル情報とを入力し、入力した検策条件に基づいて、上記文書蓄積部から文書を検索し、上記適合度情報格納部から適合度情報を読み込み、入力したプロファイル情報と読み込んだ適合度情報とに基づいて、検索した文書の適合度を数値で示すスコアを計算し、上記スコアに基づいて文書を一覧表に提示する順序を決定する検策実行部とを備えたことを特徴とする。

0025

上記プロファイル情報は、複数のデータ値を採る複数の特性情報を含み、上記適合度情報格納部は、適合度情報として、適合度の度合いを数値で指定し、プロファイル情報に含まれる複数種類の特性情報それぞれが採り得る複数のデータ値それぞれに対応する数値を指定する入力を受け付け、受け付けた複数種類の特定情報それぞれが採り得るの複数のデータ値それぞれに対応する数値を適合度情報として格納することを特徴とする。

0026

上記検索実行部は、上記プロファイル情報に含まれる複数の特性情報それぞれについて、特性情報が採るデータ値に対応する適合度情報として示される数値を取得し、取得した複数の特性情報それぞれに対応する数値を用いてスコアを計算することを特徴とする。

0027

上記文書検策装置は、さらに、通信網と接続し、検索条件と、予め検索に先立ってユーザが入力したプロファイル情報とを通信網を介して受信する特徴とする。

0028

上記文書検索装置は、上記通信網を介して検索端末と接続し、プロファイル情報をユーザに入力させるプロファイル情報入力画面を上記検索端末へ送信し、送信したプロファイル情報入力画面を用いてユーザにプロファイル情報の入力を促し、入力されたプロファイル情報を上記検索端末へ保存させることを特徴とする。

0029

上記検索実行部は、上記検索条件と上記プロファイル情報とを受信した時に取得する通信情報から、ユーザが上記検索条件と上記プロファイル情報とを入力した検索端末に関する情報を収集することを特徴とする。

0030

この発明に係る文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体は、入力を受け付けた検索条件に基づいて文書データベースの中から適合する文書を検索し、検索した文書の一覧表を提示する文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体において、上記文書データベース内に、文書を蓄積する記憶領域である文書蓄積部と、ユーザに関する情報を収集したプロファイル情報が上記文書に適合する度合いを示す適合度情報を格納する記憶領域である適合度情報格納部とを形成する記憶領域形成工程と、文書を上記文書蓄積部へ蓄積する文書蓄積工程と、上記文書蓄積工程で蓄積する文書に対応する適合度情報の入力を受け付け、受け付けた適合度情報を上記文書蓄積部に蓄積する文書に対応させて上記適合度情報格納部へ格納する適合度情報格納工程と、検策条件と上記検策条件を入力したユーザに関するプロファイル情報とを入力し、入力した検策条件に基づいて、上記文書蓄積部から文書を検索し、上記適合度情報格納部から適合度情報を読み込み、入力したプロファイル情報と読み込んだ適合度情報とに基づいて、検索した文書の適合度を数値で示すスコアを計算し、上記スコアに基づいて文書を一覧表に提示する順序を決定する検策実行工程とを備えたことを特徴とする。

0031

上記文書検策方法は、上記文書データベースを有し、文書を検索する文書検索装置と、ユーザが検索条件を入力する検索端末とを用いて実行し、上記検索端末において、予め検索に先立ってユーザが入力したプロファイル情報を保存し、検索条件の入力を受け付け、受け付けた検索条件と上記検索条件を入力したユーザに対応するプロファイル情報とを上記文書検索装置へ送信し、上記文書検索装置において、送信された検索条件とプロファイル情報とを受信し、上記検索実行工程により、上記検索条件とプロファイル情報とを入力することを特徴とする。

発明を実施するための最良の形態

0032

実施の形態1.以下、本発明の一実施の形態の文書検索装置を、図面を用いて説明する。まず、システム構成について説明する。図1は、本発明の文書検索装置を含む全体システムの構成を示す図である。文書検索装置101は、インターネットやローカルエリアネットワークなどのネットワーク103を介して、検索端末102と接続されている。

0033

文書検索装置101は、文書データベース104と、検索端末から受信した検索条件に基づいて文書データベースの検索を行なう検索実行部105と、ネットワークを介して検索端末と通信を行なう通信部106から構成されている。

0034

文書データベース104は、検索対象の文書群そのものを格納する文書蓄積部107と、検索対象の文書から抽出したキーワードとそれを含む文書の格納場所を示すポインタとを含む索引を格納する索引格納部108と、どのようなプロファイル情報を持つユーザに各文書が適合するかを示す適合度情報を格納する適合度情報格納部109とから構成される。図2は、文書蓄積部107のデータ構成の一例を示した図である。文書蓄積部107は、複数の文書が貯えられているだけであり、一般的なファイルシステムであってもよい。

0035

図3は、索引格納部108のデータ構成の一例を示した図である。索引格納部108は、キーワードと文書名とキーワードの位置を関連づけて格納する。索引格納部108は、各文書から抽出されたキーワードが、どの文書のどこにあるかの情報を格納する。同一のキーワードが1つの文書内に複数存在することもある。また、複数の文書が同一のキーワードを含むこともある。

0036

図4は、適合度情報格納部109のデータ構成の一例を示した図である。適合度情報格納部109は、各文書毎に適合度情報を格納する。省略された適合度は、1.0(平均値)とみなされる。例えば、<趣味>は省略されているので、どんな趣味に対しても1.0であり、また、<住所>の中で北海道や大阪は省略されているので、1.0ということを意味する。

0037

次に、ユーザのプロファイル情報について説明する。ユーザのプロファイル情報の種類としては、(1)ユーザが予め検索に先立って明示的に入力しておくものと、(2)予めユーザが明示的に入力することなく取得するものとの2種類がある。

0038

まず、ユーザが予め検索に先立って明示的に入力しておくプロファイル情報は、文書検索装置101から検索端末102へ送信したプロファイル情報入力画面により、個々のユーザが自分のプロファイル情報を入力する。図5に、プロファイル情報入力画面の一例を示している。ユーザがこのプロファイル情報入力画面を用いてプロファイル情報を入力することにより、検索時に用いる適合度情報に対応したプロファイル情報を取得することができる。

0039

入力されたユーザプロファイル情報は、いったん文書検索装置101に送信されるが、再びそのユーザの検索端末102に送り返され、検索端末102の内部に格納される。後で、ユーザがその検索端末102から検索を行なったとき、ユーザがプロファイル情報が検索条件とともに、自動的に文書検索装置101に送信される。

0040

検索端末102と文書検索装置101の間の通信がHTTP(Hyper Text Transfer Protocol)によっている場合、これは、クッキー(Cookie)と呼ばれる仕組みを用いることで実現できる。「cookie(クッキー)」というのは、ユーザがプロファイル情報を登録すると、その情報は一旦文書検索装置101(=Webサーバ)へ送信される。文書検索装置101(=Webサーバ)は、ユーザから受け取ったプロファイル情報をcookieの形にして、次の画面(例えば、プロファイル登録完了通知画面)といっしょにユーザの検索端末102に送信する。すると、検索端末(の上で動作しているWebブラウザ)は、cookieを検索端末102のディスク装置に格納する。格納されたcookieは、次に同じ文書検索装置101(=Webサーバ)にHTTPリクエストを送信するとき、常にいっしょに送信される。

0041

この実施の形態では、このような技術を用いて実現するが、これに限られるわけではない。また、図1には明記していないが、検索端末102は、プロファイル情報を格納する記憶領域であるプロファイル情報格納部を備える。

0042

ユーザが予め検索に先立って明示的に入力しておくユーザのプロファイル情報としては、次のものがある。ユーザの性別、年齢、生年月日、住所、ユーザが関係の深い地域、業種、職種、家族構成、年収、趣味、関心の深い分野。

0043

ユーザの性別は、男性女性のいずれかである。ユーザの生年月日が入力されている場合は、それから年齢を計算することが可能であるため、ユーザが年齢を入力する必要は必ずしもない。ユーザがプライバシー保護上の理由などにより、生年月日の入力を拒否した場合、年齢の入力だけならば行なってもらえる可能性があるため、独立した項目としている。

0044

住所は、都道府県名市町村名、大字名、丁目、街区番号、方書からなる。ユーザが関係の深い地域は、都道府県名、市町村名からなり、ユーザの出身地、かつて居住したところなど、地縁のある地域である。

0045

業種は、勤務先または自営の場合はその企業の業種を複数の選択肢の中から選択して入力する。職種は、例えば、営業経理、技術、研究開発などといったもので、複数の選択肢の中から選択して入力する。家族構成は、同居家族の人数、各家族の性別、年齢からなる。

0046

趣味は、ユーザの趣味を複数の選択肢から選択して入力し、複数の趣味を入力することができる。関心の深い分野は、ユーザが業務上または個人的に関心を持っている分野を複数の選択肢から選択して入力し、複数の分野を入力することができる。プロファイル情報のいずれの項目でも、ユーザはプライバシー保護上の理由などにより、その項目の全部または一部の入力を行なわないことができる。

0047

次に、予めユーザが明示的に入力することなく取得するプロファイル情報には、ユーザの検索端末102もしくはユーザの検索端末102が接続しているプロキシサーバのIPアドレス、ユーザの検索端末102もしくはユーザの検索端末102が接続しているプロキシサーバの属するインターネットドメイン名がある。これらの情報は、検索端末102に関する情報である。

0048

これらの情報は、もし取得が可能な場合には、曖昧さなく確定的な情報を取得することができる。これらのプロファイル情報は、ユーザの検索端末102から文書検索装置101へTCP/IPプロトコルによって接続を行なう度に取得することができるので、検索端末102の内部に格納しておく必要はない。

0049

ユーザの検索端末102もしくはユーザの検索端末102が接続しているプロキシサーバのIPアドレスからは、検索端末102が存在している国名を推定することができる。ユーザの住所、地縁情報が入力されていない場合、これを住所、地縁情報の代わりに用いる。ユーザの検索端末102もしくはユーザの検索端末102が接続しているプロキシサーバの属するインターネットドメイン名からは、検索端末102が所属している組織の特性が推定できる。例えば、日本国内(JPドメイン)では、co.jpは企業、ac.jpは大学を示す。ユーザの業種が入力されていない場合、これを業種情報の代わりに用いる。

0050

上記で説明したユーザが明示的に入力することなく取得するプロファイル情報は、文書検索装置において、プロファイル情報を受信したときに収集される。

0051

予めユーザが明示的に入力することなく取得するプロファイル情報として、ユーザが過去に文書を閲覧した履歴情報も用いる。まず、文書検索装置101内の検索対象文書を、複数のカテゴリに分類しておく。そして、ユーザが閲覧した文書の属するカテゴリ毎に、過去一定期間内(例えば、1ヶ月間または1年間)にそのユーザが閲覧した回数を閲覧回数として、時間帯(、午前中、昼、午後、夕方、夜、深夜)、曜日毎に記録しておく。

0052

履歴情報は、文書検索装置101でカウントされ、カウントした履歴情報は、文書検索装置101から検索端末102へ送信される。閲覧回数などの履歴情報の記録は、ユーザが明示的に入力するプロファイル情報の場合と同様に、検索端末102の内部に格納しておく。

0053

図6に文書検索装置101で利用するプロファイル情報のデータの構成の一例を示している。検索端末102には、図6に一例として示すプロファイル情報のうち、<端末プロキシーIPアドレス>と<インターネットドメイン名>とを除いた各データが記憶されていることになる。<端末/プロキシーIPアドレス>と<インターネットドメイン名>とは、文書検索装置101において、検索端末102から検索条件とプロファイル情報とを受信したときに、収集されるデータである。

0054

また、上記で説明した履歴情報は、検索端末102に記憶されるプロファイル情報に追加されてもよいし、プロファイル情報とは別にして記憶されていてもよい。履歴情報は、検索端末102から文書検索装置101へ検索条件とプロファイル情報とを送信するときに一緒に送信されればよい。

0055

次に、適合度情報について説明する。文書提供者は、自分の文書が文書検索装置101に登録される際に、その文書が、どのようなプロファイル情報を持つユーザにどれくらい適したものであるかについての情報を、適合度情報として、文書検索装置101の適合度情報格納部109に登録する。

0056

適合度情報は、複数種類の特性情報から構成される。特性情報は、性別、年齢、生年月日、住所等である。これらの登録方法については、下記に説明する。また、上記特性情報は、複数のデータ値を採りうる。たとえば、性別の場合は、という具合である。従って、複数の特定情報それぞれは、複数のデータ値を採り得るものである。また、適合度情報の複数の特性情報は、ユーザが明示的に入力するプロファイル情報と対応付けられる。しかしながら、必ずしも、一対一で対応する場合でなくともよい。

0057

なお、文書がHTML(Hyper Text Markup Language)により記述されてインターネット上のWWWサーバ公開されており、文書検索装置101への登録がWWWロボットによって自動的に行われる場合、この処理は、文書中のHTMLタグの1つである<META>タグ内に、ある定められた方法により適合度情報を記述することによって、自動的に行なうことができる。

0058

適合度情報の登録方法について、まず、性別の場合を例に説明する。性別が男性、女性のユーザに対する、その文書の適合度を、本実施の形態では、0.0から2.0の範囲の数値で指定する。平均の適合度は、1.0と考える。適合度が1.0よりも大きければ、平均よりも適合度が高いことを示し、適合度が1.0よりも小さければ、平均よりも適合度が低いことを示す。例えば、主として女性向けの文書の場合、男性に対する適合度を0.2、女性に対する適合度を2.0と指定する。性別が不明のユーザに対しては、適合度は1.0と見なされる。

0059

次に、年齢に対する適合度の登録方法について説明する。年齢層を、6以下、7歳〜12歳(小学生)、13歳〜15歳(中学生)、16歳〜18歳(高校生)、19歳〜22歳(大学生)、23歳〜29歳、30歳〜39歳、...70歳〜79歳、80歳以上と12個に分割し、各年齢層に対する文書の適合度を、それぞれ0〜2.0の範囲の数値で指定する。例えば、主として大学生向けの文書であれば、19歳〜22歳に対する適合度を2.0とし、16歳〜18歳及び23歳〜29歳に対する適合度を1.8として、残りの年齢層に対する適合度を1.0とする。

0060

次に、生年月日について説明する。生年月日から分かる情報として年齢については、前記、年齢層に対する適合度として説明した。生年月日からは、この他に、誕生月や星占い星座が分かる。誕生月毎、あるいは星座毎の適合度を、前記年齢層の場合と同様に指定する。また、年収、業種、職種、趣味、関心の深い分野に対する適合度についても、前記年齢層の場合と同様に指定することができる。

0061

次に、住所の場合について説明する。住所に対する適合度は、都道府県単位及び市町村単位について設定することができる。いずれも、前記年齢層に対する指定と同様に行なうことができる。ユーザが関係の深い地域についても、前記住所の場合と同様に適合度を指定できる。

0062

次に、家族構成について説明する。例えば、同居家族の構成を、1人(独居)、2人(夫婦)、2人(親子)、2人(その他)、3〜4人、5人〜6人、7人以上と分類することにより、前記、年齢層などの場合と同様に適合度情報を指定することができる。

0063

次に、ユーザが要求した検索に対する各文書のスコアを計算する方法について説明する。まず、検索条件に含まれるキーワードと検索対象文書群に含まれるキーワードの頻度分布から、従来から知られている方法を使って、各文書dkの従来型スコアSo(dk)を計算する。

0064

例えば、検索条件に含まれるキーワードをtj(j=1,2,3...)として、文書dkのスコアは、
So(dk)=Σtf(tj,dk)・idf(tj)(但し、j=1,2,3...について総和をとる。)
で計算することができる。上記の式において、dkは、文書を示す。So(dk)は、文書dkのスコアを示す。tj(j=1,2,3...)は、検索条件に含まれるキーワードを示す。

0065

ここで、tfは、文書dkに含まれるキーワードtjの数、idfは、文書の総数をN、文書全体の中でキーワードtjを含んでいる文書の数をdf(tj)とするとき、
idf(tj)=log(N/df(tj))+1
である。

0066

次に、検索要求を出しているユーザの各プロファイル情報ui(i=1,2,3,...)に対する各文書の適合度情報ai(dk,ui)(i=1,2,3,...)を、前記従来型スコアSo(dk)に乗じた結果が、本実施の形態によるスコアSnとなる。すなわち、
Sn(dk)=So(dk)・a1(dk,u1)・a2(dk,u2)・a3(dk,u3)・...

0067

さらに、ユーザの閲覧履歴情報を考慮することができる。そのユーザが過去一定期間(例えば、1ヶ月間)に閲覧した文書の属するカテゴリ毎の閲覧回数をcm(m=1,2,3...)とし、文書dkの属するカテゴリの閲覧回数をc0とする。このとき、閲覧履歴情報を考慮したスコアは、
Sn’(dk)=Sn(dk)・(1+c0/Σcm)
として計算できる。

0068

また、ユーザのカテゴリ毎の閲覧履歴を、時間帯、曜日毎に記録しておけば、上記と同様に、時間帯毎、曜日毎の閲覧履歴情報を考慮したスコアを計算することができる。

0069

次に、文書検索装置101へ文書を登録する場合の動作について、図7フローチャートに従って説明する。図8は、文書登録時に検索端末102に表示されるメイン画面の一例である。文書提供者は、文書データベース104の文書蓄積部107へ文書の本体を登録する(ステップ201)。文書提供者は、「登録する文書名」と「登録する文書のファイル名」を入力する。

0070

次に、索引格納部108に、登録する文書から抽出したキーワードとその文書の格納場所を示すポインタとが格納される。このステップは、文書データベース104に備えられた索引生成プログラムによって自動的に行なわれる(ステップ202)。

0071

次に、文書提供者は、ユーザのプロファイル情報に対するその文書の適合度情報を、適合度情報格納部109に格納する。このステップは、文書登録用の画面によって、文書提供者が対話的に行なってもよいし、文書に付属する制御情報の中に予め適合度情報を含めて置くことにより、プログラムにより自動的に行なってもよい(ステップ203)。

0072

文書登録用の画面によって適合度を設定する場合は、適合度を設定する項目(例えば、年齢層)をマウスクリックすることによって選択する。図9は、文書登録用の画面によって年齢層に対する適合度を設定する画面の一例を示している。

0073

最後に、閲覧履歴情報を考慮に入れるために必要な文書が属するカテゴリを指定する。このステップも、文書登録用の画面によって、文書提供者が対話的に行なってもよいし、文書に付属する制御情報の中に予めカテゴリ情報を含めて置くことにより、プログラムにより自動的に行なってもよい(ステップ204)。図8の例では、「文書が属するカテゴリ」の項目に直接カテゴリを入力するか、メニューからカテゴリを選択する。

0074

次に、検索端末102から文書検索装置101に格納された文書を検索する場合の動作について、図10のフローチャートに従って説明する。図11は、文書検索時に検索端末102に表示される画面の一例である。ユーザは、検索端末102から検索条件を入力する(ステップ301)。図11の例では、「携帯端末」が検索条件として入力されている。その他、ユーザは、検索の条件(and検索、or検索)、ユーザのプロファイル情報の使用の有無を選択する。

0075

入力された検索条件は、ネットワーク103を介して文書検索装置101に送信される。このとき、検索端末に格納されていたユーザのプロファイル情報も、検索条件といっしょに、ネットワーク103を介して文書検索装置101に送信される(ステップ302)。

0076

文書検索装置101へ送信された検索条件とユーザプロファイル情報は、通信部106により受信され、検索実行部105に渡される(ステップ303)。検索実行部105は、検索条件に含まれるキーワードと索引格納部108に格納された索引情報を用いて、複数の候補文書の従来型スコアを算出する(ステップ304)。

0077

また、検索実行部105は、ユーザプロファイル情報と、適合度情報格納部109に格納された適合度情報を用いて、ステップ404で算出された各候補文書の従来型スコアをもとに、前述したスコアを計算する方法によるスコアを算出する(ステップ305)。スコアの算出については後述する。さらに、検索実行部105は、ユーザの閲覧履歴情報をもとに、閲覧履歴を考慮したスコアを算出することもできる(ステップ306)。

0078

最後に、検索実行部105は、候補文書の名前をスコアの順に並べ替えて、通信部106に渡す(ステップ307)。通信部106は、検索実行部105から渡された情報を、検索端末が表示できる形式のデータに変換し、ネットワーク103に対応した通信プロトコルで、検索端末102に送信する(ステップ308)。検索端末102は、文書検索装置101から受取ったデータを画面に表示する(ステップ309)。図12は、上記のようにして文書検索装置101を用いて検索した結果、検索端末102に表示される検索結果の画面の一例を示している。

0079

以下に、スコアの算出の具体例について従来型スコア計算と比較して説明する。
(1)検索条件
検索条件として、「携帯端末」が与えられたとする。
(2)従来型スコア計算
検索条件には唯一のキーワード「携帯端末」が含まれる。このキーワードは、文書1には2回含まれる。また、文書2には5回含まれる。文書3,4,5・・・Nには1回も含まれないものとする。idf(「携帯端末」)=log(N/2)+1=9+1=10(但し、N=1024とする)であるから、
So(文書1)=2×10=20、
So(文書2)=5×10=50、
文書3,4,5...についてはSo=0。すなわち、従来型スコア計算では、文書2のスコアが文書1より高くなる。

0080

(3)ユーザプロファイルと適合度情報に基づくスコア計算
検索要求を出しているユーザ1のプロファイル情報が次のものであったとする。
性別:女性、年齢:25歳、職種:OL、住所:東京
また、ユーザ2のプロファイル情報は以下のものとする。
性別:男性、年齢:35歳、職種:技術者、住所:大阪
ユーザ1が検索している場合、文書1の適合度情報は、女性であることに対して2.0、年齢25歳に対して2.0、職種がOLであることに対して2.0、住所が東京であることに対して2.0であるので、ユーザプロファイルを考慮したスコアは、
Sn(文書1)=So(文書1)×2.0×2.0×2.0×2.0
=20×16=320

0081

また、文書2の適合度情報は、年齢25歳に対して1.5のみであり、ユーザプロファイルを考慮したスコアは、
Sn(文書2)=So(文書2)×1.5=50×1.5=75
ユーザ2に対して同様に文書1、文書2のスコアを計算すると、
Sn(文書1)=So(文書1)×1.8=20×1.8=36
Sn(文書2)=So(文書2)×1.8×2.0×2.0=50×7.2=360
すなわち、ユーザ1とユーザ2で同一の検索条件を指定しても、文書1、文書2のスコアは逆転し、よりそのユーザに適した文書のランクが上位となる。

0082

(4)閲覧履歴を考慮したスコア計算
文書1はカテゴリ「営業情報」に属し、文書2はカテゴリ「技術情報」に属するものとする。ユーザ3は、次のプロファイル情報を持つとする。
性別:男性、年齢:20歳、職種:学生、住所:大阪
すると、ユーザプロファイルと適合度までを考慮したスコアは、
Sn(文書1)=20×1.8×2.0=72、
Sn(文書2)=50×0.6×2 =60
となる。

0083

ここで、ユーザ3が過去1ヶ月間100回の検索を行い、その内、営業情報のカテゴリに属する文書を閲覧した回数が5回、技術情報に属する文書を閲覧した回数が80回であったとすれば、閲覧履歴を考慮したスコアは、
S(文書1)=72×(1+5/100) =75.6、
S(文書2)=60×(1+80/100)=108
となり、技術情報に属する文書のスコアが高くなる。以上のようにして、スコアを算出する。

0084

このように、個々のユーザのプロファイル情報と適合度情報とを用いて、スコア計算を行うため、文書中のキーワードに影響されることなくスコアを計算することができる。このため、ユーザの嗜好情報、興味情報を、検索結果に十分反映することが可能になる。ユーザは、自己のプロファイル情報の特性情報を変えることによって、その時の嗜好情報、興味情報を反映する検索結果を取得することが可能になる。

0085

また、文書を登録した文書提供者によって、適合度情報を入力することができるため、文書提供者の意図する嗜好情報や興味情報を有するユーザに適合するような検索結果を提供することが可能になる。文書提供者は、提供した文書に対応する適合度情報の適合度を示す数値を変更することによって、文書を提供する対象となるユーザを拡大、縮小することが可能になる。

0086

さらに、文書検索端末102側によって、プロファイル情報を入力するプロファイル情報入力画面を提供するため、上記適合度情報との対応が取りやすい。また、文書提供者が入手したいプロファイル情報をプロファイル情報入力画面に反映することも柔軟に行うことができる。従って、文書提供者の意図する嗜好情報や興味情報を有するユーザと、ユーザの嗜好情報と興味情報とを、より綿密に関連付けることが可能になる。

0087

このように、この文書検索方法及び装置では、プロファイル情報として、性別、年齢、住所のような客観性の高い情報を使用すること、また、趣味、関心の深い分野のように主観的な情報については、ユーザ自身が入力することにより正確性の高い情報を使用することを特徴とする。また、上記のようにして、プロファイルを作成するため、プロファイルの客観性と正確性とを維持することができる。さらに、上記プロファイル情報に対する適合度情報を、文書登録者が予め検索対象文書に付加しておくことにより、プロファイル情報と適合度情報を基にしてスコアを計算することを特徴とする。また、文書に適合度情報を対応づけることによって、プロファイル情報と適合度情報をスコア計算に使用することを可能にしている。

0088

以上のように、この文書検索方法及び文書検索装置は、ユーザが入力した検索条件に基づいて文書データベースの中から目的とする文書を検索し、個々のユーザの検索意図に対する適合度を検索結果の各文書毎の数値(以下、スコアと記す)として計算し、スコアの大小順序(以下、ランキングと記す)に従って検索結果の一覧表を作成して、ユーザに提示する文書検索方法及び装置において、文書を文書データベースに登録する際に、文書自体に含まれるキーワードによる索引に加えて、どのようなプロファイル情報を持つユーザに該文書が適合するかを示す適合度情報を予め作成しておき、ユーザが検索毎に入力した検索条件に加えて、ユーザが検索毎に入力する必要のない個々のユーザのプロファイル情報と前記適合度情報に基づいて、検索結果の各文書のスコア計算及びランキングを行い、個々のユーザに応じて各文書の検索結果の一覧表内での提示順序を変更することを特徴とする。

0089

実施の形態2.上記実施の形態1で説明した文書検索装置及び文書検索方法は、コンピュータを用いて、文書検索装置101と検索端末102を実現する場合を説明した。この文書検索装置及び文書検索方法は、コンピュータ上で動作するプログラム(ソフトウェア)、ハードウェアファームウェア等によって実現することができる。従って、この文書検索装置及び文書検索方法を実現するためのプログラムを記録したコンピュータ読み取り可能な記録媒体に記録されたプログラムをコンピュータに読み込ませることによって、この文書検索装置及び文書検索方法を実施することが可能である。

0090

また、上記プログラムは、記録媒体に記録されたプログラムに限られず、ネットワークを介して、他のコンピュータから転送し、転送したプログラムによって実現することも可能である。コンピュータに読み込める方法であれば、記録媒体、ネットワークに限られず、その他の方法であっても、構わないことは言うまでもない。

0091

実施の形態3.上記実施の形態1では、WWWの機能を用いて、文書検索方法及び装置を実現する場合を説明したが、これに限られるわけではない。この他の手段を用いてこの文書検索方法及び装置を実現しても構わない。

0092

実施の形態4.上記実施の形態1では、ユーザのプロファイル情報、文書提供者が入力する適合度情報は、それぞれ入力画面を用いて入力する場合を説明した。しかし、これに限られることはない。所定の形式に基づいて作成したファイルによってプロファイル情報、適合度情報を登録することも可能である。更に、この他の方法を用いてプロファイル情報、適合度情報を登録しても構わない。

発明の効果

0093

この発明に係る文書検索方法及び文書検索装置によれば、ユーザの検索意図を反映した検索結果を容易に表示することができる。

0094

また、この発明によれば、文書中のキーワードに影響されることなく、ユーザの嗜好情報、興味情報を十分反映した検索結果を提供することができる。

0095

この発明によれば、文書提供者が適合度情報を指定することができるため、文書提供者の意図に応じた検索結果を提供することができる。

0096

この発明によれば、ユーザは、検索する度にプロファイル情報を入力することなく、予め入力されたプロファイル情報を用いて検索することができるため、ユーザは、少ない入力操作によってユーザの嗜好情報、興味情報を十分反映した検索結果を取得することができる。

0097

この発明によれば、ユーザが入力するプロファイル情報に基づいて、ユーザに関する情報を収集するため、ユーザは、少ない入力操作によってユーザの嗜好情報、興味情報を十分反映した検索結果を取得することができる。

0098

この発明によれば、文書検索端末によって提供されるプロファイル情報入力画面により、ユーザに関する情報が取得できるとともに、取得したプロファイル情報を検索端末に保存することにより、ユーザが毎回プロファイル情報を入力する作業を削減することができる。

図面の簡単な説明

0099

図1実施の形態1の文書検策装置の構成のブロック図の一例を示した図。
図2文書蓄積部のデータ構成の一例を示した図。
図3索引格納部のデータ構成の一例を示した図。
図4適合度情報格納部のデータ構成の一例を示した図。
図5検策端末に表示される画面(プロファイル情報入力)の一例を示した図。
図6プロファイル情報のデータ構成の一例を示した図。
図7実施の形態1の文書を登録する動作の一例を示した図。
図8検策端末に表示される画面(文書登録時のメイン画面)の一例を示した図。
図9検策端末に表示される画面(文書登録時の年齢層に対する適合度設定画面)の一例を示した図。
図10実施の形態1の文書を検策する動作の一例を示した図。
図11検策端末に表示される画面(文書検策時)の一例を示した図。
図12検策端末に表示される画面(文書検策結果)の一例を示した図。

--

0100

101文書検索装置、102検索端末、103ネットワーク、104文書データベース、105検索実行部、106通信部、107文書蓄積部、108索引格納部、109適合度情報格納部。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 三菱電機株式会社の「 情報処理装置および情報処理方法」が 公開されました。( 2019/08/08)

    【課題・解決手段】情報処理装置(10)は、時系列データである入力データを取得するデータ取得部(101)と、時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する学習部分列を... 詳細

  • オムロン株式会社の「 センシングデバイス管理装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】センサ側メタデータに相当するデータカタログの生成が簡単且つ適正に行えるセンシングデバイス管理装置を提供する。デバイス情報取得機能部11dが、測定対象をセンシングするセンシングデバイス... 詳細

  • オムロン株式会社の「 マッチング処理装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】利活用対象のセンシングデータによる容易なセンサマッチングを行うマッチング処理部50が提供される。マッチング処理部50は、提供側端末11により入力された提供側センシングデータを取得する... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ