図面 (/)

技術 情報評価値の推定装置、その推定プログラム、及びその推定方法

出願人 株式会社日立製作所
発明者 森津俊之
出願日 2007年1月19日 (14年3ヶ月経過) 出願番号 2007-009765
公開日 2008年7月31日 (12年9ヶ月経過) 公開番号 2008-176592
状態 未査定
技術分野 検索装置
主要キーワード 分散傾向 パーソナライズド 推定評価値 時間ズレ 対応キーワード パラメータ格納領域 比較グループ 全集合
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2008年7月31日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (15)

課題

グループ内で評価値が定められていない情報に関して、評価値を推定する。

解決手段

複数のグループ毎であって複数のキーワード毎に、当該キーワードを含む情報の複数の時間帯毎の評価値を用いて、当該キーワードの複数の時間帯毎のキーワード評価値を求めるグループ内キーワード特徴評価値算出部412と、複数のグループ相互間での類似度を求めるグループ間類似度算出部413と、あるグループから評価値が定められていない特定情報に関して評価値の要求を受け付け、他のグループでの特定情報のキーワード毎のキーワード評価値に対して、あるグループに対する他のグループの類似度を重み付けし、該特定情報の評価値を求めて、あるグループに送るグループ外評価値算出部416とを備える。グループ間類似度算出部413は、あるグループでの最新時間帯に対して、他のグループの各時間帯のうちで最も類似性が高いことを示す時間帯の類似度を、あるグループに対する他のグループの類似度とする。

概要

背景

近年、企業内での情報検索に関するニーズが高まりつつある。一般に、情報検索においては、情報の有効度を示す評価値に応じて、複数の情報の表示順序を定めて、利用者が目的の情報に到達し易くしている。例えば、インターネットにおける情報提供では、情報へのリンク数アクセス数が多く、これらから情報の評価値を求め易い。しかし、企業内の情報の評価は、広く普及しているインターネット上での情報評価と比較して、利用するユーザ数が限定されており、また情報間のリンク数もそれ程多くないために、難しいとされている。

このような点を改善する手法としては、例えば、特許文献1及び特許文献2に記載されているパーソナライズドサーチと呼ばれる手法がある。この手法は、検索を行う利用者は過去に検索した情報に類似した情報を好むであろうとの仮説のもと、利用者の過去の検索履歴検索パターンの類似する他の利用者の検索履歴をもとに、その利用者が好むであろう情報を推定しその評価を高めるものである。

また、特許文献3では、複数の他のユーザの評価情報を利用し、対象ユーザの情報評価を行う手法が開示されている。この手法では、対象ユーザと他のユーザとの類似度を考慮し、類似度の高い他のユーザの評価情報を優先的に利用している。

特開2005−190065号広報
特開2005−174094号広報
特開2000−348039号広報

概要

グループ内で評価値が定められていない情報に関して、評価値を推定する。 複数のグループ毎であって複数のキーワード毎に、当該キーワードを含む情報の複数の時間帯毎の評価値を用いて、当該キーワードの複数の時間帯毎のキーワード評価値を求めるグループ内キーワード特徴評価値算出部412と、複数のグループ相互間での類似度を求めるグループ間類似度算出部413と、あるグループから評価値が定められていない特定情報に関して評価値の要求を受け付け、他のグループでの特定情報のキーワード毎のキーワード評価値に対して、あるグループに対する他のグループの類似度を重み付けし、該特定情報の評価値を求めて、あるグループに送るグループ外評価値算出部416とを備える。グループ間類似度算出部413は、あるグループでの最新時間帯に対して、他のグループの各時間帯のうちで最も類似性が高いことを示す時間帯の類似度を、あるグループに対する他のグループの類似度とする。

目的

そこで、本発明は、このような要望応えるべく、グループ内での情報の有効性をより的確に示す情報評価値推定装置、その推定プログラム、及びその推定方法を提供することを目的とする。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

情報の参照範囲が共通するグループ内で、参照できる複数の情報のうちで所定の条件を満たさず、アクセス状況に応じて情報の有効性を示す情報評価値が定められていない情報の情報評価値を推定する評価値推定装置において、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の複数の時間帯毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得するグループ内評価値取得手段と、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の時間帯毎の情報評価値を用いて、当該特徴の複数の時間帯毎の特徴評価値を求めるグループ内特徴評価値算出手段と、複数のグループ相互間での類似度を求めるグループ間類似度算出手段と、複数のグループのいずれか一のグループから、前記情報評価値が定められていない特定情報に関して、情報評価値の要求を受け付け要求受付手段と、前記要求受付手段が前記一のグループから前記特定情報の情報評価値要求を受け付けると、該一のグループを除く他のグループでの該特定情報の1以上の特徴毎の特徴評価値に対して、該一のグループに対する該他のグループの類似度を、類似性の高いグループでの特徴評価値の値が大きくなるよう、それぞれ重み付けし、該重み付けした値を用いて、該一のグループでの該特定情報のグループ外情報評価値を求めるグループ外評価値算出手段と、前記グループ外評価値算出手段が求めた前記グループ外情報評価値を、前記特定情報の情報評価値として前記一のグループに送る評価値送信手段と、を備え、前記グループ間類似度算出手段は、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差を求め、当該偏差に基づいて、該一のグループに対する他のグループの各時間帯毎の類似度を求め、該一のグループに対する他のグループの各時間帯毎の類似度のうち、最も類似性が高いことを示す時間帯の類似度を、該一のグループに対する他のグループの類似度とし、前記グループ外評価値算出手段は、前記他のグループでの前記特定情報の1以上の特徴毎の特徴評価値として、前記最も類似性が高いことを示す時間帯の特徴評価値を用いる、ことを特徴とする評価値推定装置。

請求項2

情報の参照範囲が共通するグループ内で、参照できる複数の情報のうちで所定の条件を満たさず、アクセス状況に応じて情報の有効性を示す情報評価値が定められていない情報の情報評価値を推定する評価値推定装置において、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得するグループ内評価値取得手段と、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の情報評価値を用いて、当該特徴の特徴評価値を求めるグループ内特徴評価値算出手段と、複数の特徴の特徴評価値毎に、複数のグループ相互間での分散値を求める分散値算出手段と、複数のグループのいずれか一のグループから、情報評価値が定められていない特定情報に関して、情報評価値の要求を受け付ける要求受付手段と、前記要求受付手段が前記一のグループから前記特定情報の情報評価値要求を受け付けると、複数のグループ毎の該特定情報の1以上の特徴毎の特徴評価値に対して、当該特徴評価に対する前記分散値を、分散傾向が高い特徴評価値の値が小さくなるように、それぞれ重み付けし、該重み付けした値を用いて、該一のグループでの該特定情報のグループ外情報評価値を求めるグループ外評価値算出手段と、前記グループ外評価値算出手段が求めた前記グループ外情報評価値を、前記特定情報の情報評価値として前記一のグループに送る評価値送信手段と、を備えていることを特徴とする評価値推定装置。

請求項3

請求項2に記載の評価値推定装置において、複数のグループ相互間での類似度を求めるグループ間類似度算出手段を備え、前記グループ内評価値取得手段は、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の複数の時間帯毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得し、前記グループ内特徴評価値算出手段は、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の時間帯毎の情報評価値を用いて、当該特徴の複数の時間帯毎の特徴評価値を求め、前記グループ間類似度算出手段は、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差を求め、当該偏差に基づいて、該一のグループに対する他のグループの各時間帯毎の類似度を求め、該一のグループに対する他のグループの各時間帯毎の類似度のうち、最も類似性が高いことを示す時間帯の類似度を、該一のグループに対する他のグループの類似度とし、前記分散値算出手段は、前記一のグループでの最新時間帯の全ての特徴評価値毎に、当該特徴評価値と、他のグループの各時間帯毎の対応特徴評価値のうちの前記最も類似性が高いことを示す時間帯の対応特徴評価値とに関する分散値を求め、前記グループ外評価値算出手段は、前記要求受付手段が前記一のグループから前記特定情報の情報評価値要求を受け付けると、該一のグループを除く他のグループでの該特定情報の1以上の特徴のうち、前記最も類似性が高いことを示す時間帯の1以上の対応特徴の特徴評価値に対して、該一のグループに対する該他のグループの類似度を、類似性の高いグループでの特徴評価値の値が大きくなるよう、それぞれ重み付けすると共に、該対応特徴の特徴評価に対する前記分散値を、分散傾向が高い特徴評価値の値が小さくなるように、それぞれ重み付けし、該重み付けした特徴評価値を用いて、該一のグループでの該特定情報に関する前記グループ外情報評価値を求める、ことを特徴とする評価値推定装置。

請求項4

請求項3に記載の評価値推定装置において、前記分散値に対する分散値重み、及び前記類似度に対する類似度重みを求める重み算出手段を備え、前記重み算出手段は、前記分散重み及び前記類似度重みをそれぞれ変数として、前記一のグループで情報評価値が定められている各情報毎の前記グループ外評価値を求め、各情報毎のグループ外情報評価値と該一のグループで定められた対応情報の該情報評価値との差の合計が最小になるように、前記分散重み及び前記類似度重みを求め、前記グループ外評価値算出手段は、前記類似度及び前記分散値が重み付けされた前記特徴評価値に対して、さらに前記分散重み及び前記類似度重みを重み付けし、該重み付けした特徴評価値を用いて、該一のグループでの前記特定情報に関する前記グループ外情報評価値を求める、ことを特徴とする評価値推定装置。

請求項5

請求項1、3、4のいずれか一項に記載の評価値推定装置において、前記グループ間類似度算出手段は、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差をそれぞれ求め、各偏差を統計処理して、複数の偏差に関する代表値を求め、該代表値を類似度とする、ことを特徴とする評価値推定装置。

請求項6

請求項1から5のいずれか一項に記載の評価値推定装置において、前記グループ内特徴評価値算出手段は、特徴の特徴評価値を求めるにあたり、該特徴を含む情報の複数の情報評価値を統計処理して、該複数の情報評価値に関する代表値を求め、該代表値を該特徴の特徴評価値とする、ことを特徴とする評価値推定装置。

請求項7

請求項1から6のいずれか一項に記載の評価値推定装置において、前記グループ外情報評価値算出手段は、前記特定情報の1以上の特徴に対して、それぞれ前記重み付けした特徴評価値を統計処理して、該特徴評価値に関する代表値を求め、該代表値を該特定情報の前記グループ外情報評価値とする、ことを特徴とする評価値推定装置。

請求項8

請求項1から7のいずれか一項に記載の評価値推定装置と、複数の前記グループ毎の、当該グループ内で参照可能な複数の情報を所有していると共に、該複数の情報毎の情報評価値及び1以上の特徴情報を前記評価値推定装置へ送ると共に、当該グループ内の前記特定情報の情報評価値を該評価値推定装置に要求する情報管理装置と、を備えていることを特徴とするシステム

請求項9

情報の参照範囲が共通するグループ内で、参照できる複数の情報のうちで所定の条件を満たさず、アクセス状況に応じて情報の有効性を示す情報評価値が定められていない情報の情報評価値を推定する評価値推定プログラムにおいて、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の複数の時間帯毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得し、該複数の情報毎の複数の時間帯毎の情報評価値と該複数の情報毎の1以上の特徴とを、コンピュータのグループ内情報格納領域に格納するグループ内評価値取得ステップと、複数のグループ毎であって当該グループでの複数の特徴毎に、前記グループ内情報格納領域に格納されている当該特徴を含む情報の複数の時間帯毎の情報評価値を用いて、当該特徴の複数の時間帯毎の特徴評価値を求め、該複数の時間帯毎に複数の特徴毎の特徴評価値を、前記コンピュータの特徴評価値格納領域に格納するグループ内特徴評価値算出ステップと、複数のグループ相互間での類似度を求め、複数のグループ毎に当該グループに対する他のグループの類似度を、前記コンピュータのグループ外評価値用パラメータ格納領域に格納するグループ間類似度算出ステップと、複数のグループのいずれか一のグループから、前記情報評価値が定められていない特定情報に関して、情報評価値の要求を受け付ける要求受付ステップと、前記要求受付ステップで前記一のグループから前記特定情報の情報評価値要求を受け付けると、該一のグループを除く他のグループでの該特定情報の1以上の特徴毎の、前記特徴評価値格納領域に格納されていた前記特徴評価値に対して、該一のグループに対する該他のグループの、前記グループ外評価値用パラメータ格納領域に格納されていた類似度を、類似性の高いグループでの特徴評価値の値が大きくなるよう、それぞれ重み付けし、該重み付けした値を用いて、該一のグループでの該特定情報のグループ外情報評価値を求めるグループ外評価値算出ステップと、前記グループ外評価値算出ステップで求めた前記グループ外情報評価値を、前記特定情報の情報評価値として前記一のグループに送る評価値送信ステップと、を前記コンピュータに実行させ、前記グループ間類似度算出ステップでは、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差を求め、当該偏差に基づいて、該一のグループに対する他のグループの各時間帯毎の類似度を求め、該一のグループに対する他のグループの各時間帯毎の類似度のうち、最も類似性が高いことを示す時間帯の類似度を、該一のグループに対する他のグループの類似度とし、前記グループ外評価値算出ステップでは、前記他のグループでの前記特定情報の1以上の特徴毎の特徴評価値として、前記最も類似性が高いことを示す時間帯の特徴評価値を用いる、ことを特徴とする評価値推定プログラム。

請求項10

情報の参照範囲が共通するグループ内で、参照できる複数の情報のうちで所定の条件を満たさず、アクセス状況に応じて情報の有効性を示す情報評価値が定められていない情報の情報評価値を推定する評価値推定プログラムにおいて、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得し、該複数の情報毎の情報評価値と該複数の情報毎の1以上の特徴とをコンピュータのグループ内情報格納領域に格納するグループ内評価値取得ステップと、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の情報評価値を用いて、当該特徴の特徴評価値を求め、該複数の特徴毎の特徴評価値を前記コンピュータの前記特徴評価値格納領域に格納するグループ内特徴評価値算出ステップと、複数の特徴の特徴評価値毎に、複数のグループ相互間での分散値を求め、該複数の特徴の特徴評価値毎の分散値を、前記コンピュータのグループ外評価値用パラメータ格納領域に格納する分散値算出ステップと、複数のグループのいずれか一のグループから、情報評価値が定められていない特定情報に関して、情報評価値の要求を受け付ける要求受付ステップと、前記要求受付ステップで前記一のグループから前記特定情報の情報評価値要求を受け付けると、複数のグループ毎の該特定情報の1以上の特徴毎の、前記特徴評価値格納領域に格納されていた前記特徴評価値に対して、当該特徴評価に対する前記グループ外評価値用パラメータ格納領域に格納されていた前記分散値を、分散傾向が高い特徴評価値の値が小さくなるように、それぞれ重み付けし、該重み付けした値を用いて、該一のグループでの該特定情報のグループ外情報評価値を求めるグループ外評価値算出ステップと、前記グループ外評価値算出ステップで求めた前記グループ外情報評価値を、前記特定情報の情報評価値として前記一のグループに送る評価値送信ステップと、を前記コンピュータに実行させることを特徴とする評価値推定プログラム。

請求項11

請求項10に記載の評価値推定プログラムにおいて、複数のグループ相互間での類似度を求めるグループ間類似度算出ステップを前記コンピュータに実行させ、前記グループ内評価値取得ステップでは、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の複数の時間帯毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得し、該複数の情報毎の複数の時間帯毎の情報評価値と該複数の情報毎の1以上の特徴とを前記グループ内情報格納領域に格納し、前記グループ内特徴評価値算出ステップでは、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の時間帯毎の情報評価値を用いて、当該特徴の複数の時間帯毎の特徴評価値を求め、該複数の時間帯毎に複数の特徴毎の特徴評価値を前記特徴評価値格納領域に格納し、前記グループ間類似度算出ステップでは、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差を求め、当該偏差に基づいて、該一のグループに対する他のグループの各時間帯毎の類似度を求め、該一のグループに対する他のグループの各時間帯毎の類似度のうち、最も類似性が高いことを示す時間帯の類似度を、該一のグループに対する他のグループの類似度とし、該類似度を前記グループ外評価値用パラメータ格納領域に格納し、前記分散値算出ステップでは、前記一のグループでの最新時間帯の全ての特徴評価値毎に、当該特徴評価値と、他のグループの各時間帯毎の対応特徴評価値のうちの前記最も類似性が高いことを示す時間帯の対応特徴評価値とに関する分散値を求め、該特徴評価値毎の該分散値を前記グループ外評価値用パラメータ格納領域に格納し、前記グループ外評価値算出ステップでは、前記要求受付ステップで前記一のグループから前記特定情報の情報評価値要求を受け付けると、該一のグループを除く他のグループでの該特定情報の1以上の特徴のうち、前記最も類似性が高いことを示す時間帯の1以上の対応特徴の、前記特徴評価値格納領域に格納されていた前記特徴評価値に対して、該一のグループに対する該他のグループの、前記グループ外評価値用パラメータ格納領域に格納されていた類似度を、類似性の高いグループでの特徴評価値の値が大きくなるよう、それぞれ重み付けすると共に、該対応特徴の特徴評価に対する前記グループ外評価値用パラメータ格納領域に格納されていた前記分散値を、分散傾向が高い特徴評価値の値が小さくなるように、それぞれ重み付けし、該重み付けした特徴評価値を用いて、該一のグループでの該特定情報に関する前記グループ外情報評価値を求める、ことを特徴とする評価値推定プログラム。

請求項12

請求項11に記載の評価値推定プログラムにおいて、前記分散値に対する分散値重み、及び前記類似度に対する類似度重みを求める重み算出ステップを前記コンピュータに実行させ、前記重み算出ステップでは、前記分散重み及び前記類似度重みをそれぞれ変数として、前記一のグループで情報評価値が定められている各情報毎の前記グループ外評価値を求め、各情報毎のグループ外情報評価値と該一のグループで定められた対応情報の該情報評価値との差の合計が最小になるように、前記分散重み及び前記類似度重みを求め、該分散重み及び該類似度重みを前記グループ外評価値用パラメータ格納領域に格納し、前記グループ外評価値算出ステップでは、前記類似度及び前記分散値が重み付けされた前記特徴評価値に対して、さらに前記グループ外評価値用パラメータ格納領域に格納されていた前記分散重み及び前記類似度重みを重み付けし、該重み付けした特徴評価値を用いて、該一のグループでの前記特定情報に関する前記グループ外情報評価値を求める、ことを特徴とする評価値推定プログラム。

請求項13

情報の参照範囲が共通するグループ内で、参照できる複数の情報のうちで所定の条件を満たさず、アクセス状況に応じて情報の有効性を示す情報評価値が定められていない情報の情報評価値を推定する評価値推定方法において、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の複数の時間帯毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得するグループ内評価値取得工程と、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の時間帯毎の情報評価値を用いて、当該特徴の複数の時間帯毎の特徴評価値を求めるグループ内特徴評価値算出工程と、複数のグループ相互間での類似度を求めるグループ間類似度算出工程と、複数のグループのいずれか一のグループから、前記情報評価値が定められていない特定情報に関して、情報評価値の要求を受け付ける要求受付工程と、前記要求受付工程で前記一のグループから前記特定情報の情報評価値要求を受け付けると、該一のグループを除く他のグループでの該特定情報の1以上の特徴毎の特徴評価値に対して、該一のグループに対する該他のグループの類似度を、類似性の高いグループでの特徴評価値の値が大きくなるよう、それぞれ重み付けし、該重み付けした値を用いて、該一のグループでの該特定情報のグループ外情報評価値を求めるグループ外評価値算出工程と、前記グループ外評価値算出工程で求めた前記グループ外情報評価値を、前記特定情報の情報評価値として前記一のグループに送る評価値送信工程と、を含み、前記グループ間類似度算出工程では、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差を求め、当該偏差に基づいて、該一のグループに対する他のグループの各時間帯毎の類似度を求め、該一のグループに対する他のグループの各時間帯毎の類似度のうち、最も類似性が高いことを示す時間帯の類似度を、該一のグループに対する他のグループの類似度とし、前記グループ外評価値算出工程では、前記他のグループでの前記特定情報の1以上の特徴毎の特徴評価値として、前記最も類似性が高いことを示す時間帯の特徴評価値を用いる、ことを特徴とする評価値推定方法。

請求項14

情報の参照範囲が共通するグループ内で、参照できる複数の情報のうちで所定の条件を満たさず、アクセス状況に応じて情報の有効性を示す情報評価値が定められていない情報の情報評価値を推定する評価値推定方法において、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得するグループ内評価値取得工程と、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の情報評価値を用いて、当該特徴の特徴評価値を求めるグループ内特徴評価値算出工程と、複数の特徴の特徴評価値毎に、複数のグループ相互間での分散値を求める分散値算出工程と、複数のグループのいずれか一のグループから、情報評価値が定められていない特定情報に関して、情報評価値の要求を受け付ける要求受付工程と、前記要求受付工程で前記一のグループから前記特定情報の情報評価値要求を受け付けると、複数のグループ毎の該特定情報の1以上の特徴毎の特徴評価値に対して、当該特徴評価に対する前記分散値を、分散傾向が高い特徴評価値の値が小さくなるように、それぞれ重み付けし、該重み付けした値を用いて、該一のグループでの該特定情報のグループ外情報評価値を求めるグループ外評価値算出工程と、前記グループ外評価値算出工程で求めた前記グループ外情報評価値を、前記特定情報の情報評価値として前記一のグループに送る評価値送信工程と、を備えていることを特徴とする評価値推定方法。

請求項15

請求項14に記載の評価値推定方法において、複数のグループ相互間での類似度を求めるグループ間類似度算出工程を含み、前記グループ内評価値取得工程では、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の複数の時間帯毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得し、前記グループ内特徴評価値算出工程では、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の時間帯毎の情報評価値を用いて、当該特徴の複数の時間帯毎の特徴評価値を求め、前記グループ間類似度算出工程では、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差を求め、当該偏差に基づいて、該一のグループに対する他のグループの各時間帯毎の類似度を求め、該一のグループに対する他のグループの各時間帯毎の類似度のうち、最も類似性が高いことを示す時間帯の類似度を、該一のグループに対する他のグループの類似度とし、前記分散値算出工程では、前記一のグループでの最新時間帯の全ての特徴評価値毎に、当該特徴評価値と、他のグループの各時間帯毎の対応特徴評価値のうちの前記最も類似性が高いことを示す時間帯の対応特徴評価値とに関する分散値を求め、前記グループ外評価値算出工程では、前記要求受付工程で前記一のグループから前記特定情報の情報評価値要求を受け付けると、該一のグループを除く他のグループでの該特定情報の1以上の特徴のうち、前記最も類似性が高いことを示す時間帯の1以上の対応特徴の特徴評価値に対して、該一のグループに対する該他のグループの類似度を、類似性の高いグループでの特徴評価値の値が大きくなるよう、それぞれ重み付けすると共に、該対応特徴の特徴評価に対する前記分散値を、分散傾向が高い特徴評価値の値が小さくなるように、それぞれ重み付けし、該重み付けした特徴評価値を用いて、該一のグループでの該特定情報に関する前記グループ外情報評価値を求める、ことを特徴とする評価値推定方法。

請求項16

請求項15に記載の評価値推定方法において、前記分散値に対する分散値重み、及び前記類似度に対する類似度重みを求める重み算出工程を含み、前記重み算出工程では、前記分散重み及び前記類似度重みをそれぞれ変数として、前記一のグループで情報評価値が定められている各情報毎の前記グループ外評価値を求め、各情報毎のグループ外情報評価値と該一のグループで定められた対応情報の該情報評価値との差の合計が最小になるように、前記分散重み及び前記類似度重みを求め、前記グループ外評価値算出工程では、前記類似度及び前記分散値が重み付けされた前記特徴評価値に対して、さらに前記分散重み及び前記類似度重みを重み付けし、該重み付けした特徴評価値を用いて、該一のグループでの前記特定情報に関する前記グループ外情報評価値を求める、ことを特徴とする評価値推定方法。

技術分野

0001

本発明は、情報の参照範囲が共通するグループ内、例えば、企業内や所定の団体内での情報の検索時に、複数の情報の表示順序を定めるためなどに用いられる情報評価値推定する評価値推定装置、その推定プログラム、及びその推定方法に関する。

背景技術

0002

近年、企業内での情報検索に関するニーズが高まりつつある。一般に、情報検索においては、情報の有効度を示す評価値に応じて、複数の情報の表示順序を定めて、利用者が目的の情報に到達し易くしている。例えば、インターネットにおける情報提供では、情報へのリンク数アクセス数が多く、これらから情報の評価値を求め易い。しかし、企業内の情報の評価は、広く普及しているインターネット上での情報評価と比較して、利用するユーザ数が限定されており、また情報間のリンク数もそれ程多くないために、難しいとされている。

0003

このような点を改善する手法としては、例えば、特許文献1及び特許文献2に記載されているパーソナライズドサーチと呼ばれる手法がある。この手法は、検索を行う利用者は過去に検索した情報に類似した情報を好むであろうとの仮説のもと、利用者の過去の検索履歴検索パターンの類似する他の利用者の検索履歴をもとに、その利用者が好むであろう情報を推定しその評価を高めるものである。

0004

また、特許文献3では、複数の他のユーザの評価情報を利用し、対象ユーザの情報評価を行う手法が開示されている。この手法では、対象ユーザと他のユーザとの類似度を考慮し、類似度の高い他のユーザの評価情報を優先的に利用している。

0005

特開2005−190065号広報
特開2005−174094号広報
特開2000−348039号広報

発明が解決しようとする課題

0006

以上のように、情報の参照範囲が共通するグループ内での情報の評価手法として、複数の手法がある。しかしながら、ユーザは、情報へのアクセスをより容易にするために、グループ内での情報に対する評価値が、当該グループ内での情報の有効性をより的確に示すものであることを望んでいる。

0007

そこで、本発明は、このような要望応えるべく、グループ内での情報の有効性をより的確に示す情報評価値の推定装置、その推定プログラム、及びその推定方法を提供することを目的とする。

課題を解決するための手段

0008

前記目的を達成するための情報評価値の推定装置に係る発明は、
情報の参照範囲が共通するグループ内で、参照できる複数の情報のうちで所定の条件を満たさず、アクセス状況に応じて情報の有効性を示す情報評価値が定められていない情報の情報評価値を推定する評価値推定装置において、
グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の複数の時間帯毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得するグループ内評価値取得手段と、
複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の時間帯毎の情報評価値を用いて、当該特徴の複数の時間帯毎の特徴評価値を求めるグループ内特徴評価値算出手段と、
複数のグループ相互間での類似度を求めるグループ間類似度算出手段と、
複数のグループのいずれか一のグループから、前記情報評価値が定められていない特定情報に関して、情報評価値の要求を受け付け要求受付手段と、
前記要求受付手段が前記一のグループから前記特定情報の情報評価値要求を受け付けると、該一のグループを除く他のグループでの該特定情報の1以上の特徴毎の特徴評価値に対して、該一のグループに対する該他のグループの類似度を、類似性の高いグループでの特徴評価値の値が大きくなるよう、それぞれ重み付けし、該重み付けした値を用いて、該一のグループでの該特定情報のグループ外情報評価値を求めるグループ外評価値算出手段と、
前記グループ外評価値算出手段が求めた前記グループ外情報評価値を、前記特定情報の情報評価値として前記一のグループに送る評価値送信手段と、
を備え、
前記グループ間類似度算出手段は、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差を求め、当該偏差に基づいて、該一のグループに対する他のグループの各時間帯毎の類似度を求め、該一のグループに対する他のグループの各時間帯毎の類似度のうち、最も類似性が高いことを示す時間帯の類似度を、該一のグループに対する他のグループの類似度とし、
前記グループ外評価値算出手段は、前記他のグループでの前記特定情報の1以上の特徴毎の特徴評価値として、前記最も類似性が高いことを示す時間帯の特徴評価値を用いる、
ことを特徴とする。

0009

本発明では、グループ内で所定の条件を満たさず評価値が定められていない情報に関しても、グループ相互間で情報の共有化を図ることなく、他のグループでの情報評価値に関する情報に基づいて、評価値を定めることができる。また、本発明では、あるグループと他のグループとの類似性を考慮し、類似性が高いグループからの評価値を価値の高いものとして扱っているため、あるグループでの情報の評価値の有効性を高めることができる。からである。しかも、本発明では、各グループ毎に重要視される情報は、時間軸においてズレがあることが想定されるので、このズレも踏まえたて、グループ間の類似性を定めているため、より情報評価値の有効性を高めることができる。

0010

また、前記目的を達成するための情報評価値の推定装置に係る他の発明は、
情報の参照範囲が共通するグループ内で、参照できる複数の情報のうちで所定の条件を満たさず、アクセス状況に応じて情報の有効性を示す情報評価値が定められていない情報の情報評価値を推定する評価値推定装置において、
グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得するグループ内評価値取得手段と、
複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の情報評価値を用いて、当該特徴の特徴評価値を求めるグループ内特徴評価値算出手段と、
複数の特徴の特徴評価値毎に、複数のグループ相互間での分散値を求める分散値算出手段と、
複数のグループのいずれか一のグループから、情報評価値が定められていない特定情報に関して、情報評価値の要求を受け付ける要求受付手段と、
前記要求受付手段が前記一のグループから前記特定情報の情報評価値要求を受け付けると、複数のグループ毎の該特定情報の1以上の特徴毎の特徴評価値に対して、当該特徴評価に対する前記分散値を、分散傾向が高い特徴評価値の値が小さくなるように、それぞれ重み付けし、該重み付けした値を用いて、該一のグループでの該特定情報のグループ外情報評価値を求めるグループ外評価値算出手段と、
前記グループ外評価値算出手段が求めた前記グループ外情報評価値を、前記特定情報の情報評価値として前記一のグループに送る評価値送信手段と、
を備えていることを特徴とする。

0011

本発明でも、グループ内で所定の条件を満たさず評価値が定められていない情報に関しても、グループ相互間で情報の共有化を図ることなく、他のグループでの情報評価値に関する情報に基づいて、評価値を定めることができる。また、本発明では、他の複数のグループでの情報の特徴に関する各評価値を採用するにあたり、例えば、他の一のグループによる特徴に関する評価値が異常に高く、この特徴に関する評価値をそのまま用いると、他の一のグループの特異な外乱を受ける可能性が高まるため、このような特徴に関する評価値を価値の低いものとして扱っているため、あるグループでの情報の評価値の有効性を高めることができる。

0012

ここで、この評価値推定装置において、
複数のグループ相互間での類似度を求めるグループ間類似度算出手段を備え、
前記グループ内評価値取得手段は、グループ内で前記所定の条件を満たし前記情報評価値が定められた複数の情報毎の複数の時間帯毎の情報評価値と、該複数の情報毎の1以上の特徴とを、複数のグループ毎に取得し、
前記グループ内特徴評価値算出手段は、複数のグループ毎であって当該グループでの複数の特徴毎に、当該特徴を含む情報の複数の時間帯毎の情報評価値を用いて、当該特徴の複数の時間帯毎の特徴評価値を求め、
前記グループ間類似度算出手段は、前記一のグループでの最新時間帯の全ての特徴評価値毎に、他のグループの各時間帯毎の対応特徴評価値との偏差を求め、当該偏差に基づいて、該一のグループに対する他のグループの各時間帯毎の類似度を求め、該一のグループに対する他のグループの各時間帯毎の類似度のうち、最も類似性が高いことを示す時間帯の類似度を、該一のグループに対する他のグループの類似度とし、
前記分散値算出手段は、前記一のグループでの最新時間帯の全ての特徴評価値毎に、当該特徴評価値と、他のグループの各時間帯毎の対応特徴評価値のうちの前記最も類似性が高いことを示す時間帯の対応特徴評価値とに関する分散値を求め、
前記グループ外評価値算出手段は、前記要求受付手段が前記一のグループから前記特定情報の情報評価値要求を受け付けると、該一のグループを除く他のグループでの該特定情報の1以上の特徴のうち、前記最も類似性が高いことを示す時間帯の1以上の対応特徴の特徴評価値に対して、該一のグループに対する該他のグループの類似度を、類似性の高いグループでの特徴評価値の値が大きくなるよう、それぞれ重み付けすると共に、該対応特徴の特徴評価に対する前記分散値を、分散傾向が高い特徴評価値の値が小さくなるように、それぞれ重み付けし、該重み付けした特徴評価値を用いて、該一のグループでの該特定情報に関する前記グループ外情報評価値を求める、ことが好ましい。

0013

さらに、この評価値推定装置において、
前記分散値に対する分散値重み、及び前記類似度に対する類似度重みを求める重み算出手段を備え、
前記重み算出手段は、前記分散重み及び前記類似度重みをそれぞれ変数として、前記一のグループで情報評価値が定められている各情報毎の前記グループ外評価値を求め、各情報毎のグループ外情報評価値と該一のグループで定められた対応情報の該情報評価値との差の合計が最小になるように、前記分散重み及び前記類似度重みを求め、
前記グループ外評価値算出手段は、前記類似度及び前記分散値が重み付けされた前記特徴評価値に対して、さらに前記分散重み及び前記類似度重みを重み付けし、該重み付けした特徴評価値を用いて、該一のグループでの前記特定情報に関する前記グループ外情報評価値を求める、ことが好ましい。

発明の効果

0014

本発明によれば、グループ内で所定の条件を満たさず評価値が定められていない情報に関しても、グループ相互間で情報の共有化を図ることなく、他のグループでの情報評価値に関する情報に基づいて、評価値を定めることができる上に、あるグループでの情報の評価値の有効性を高めることができる。

発明を実施するための最良の形態

0015

以下、本発明に係る情報検索システムの一実施形態について、図面を用いて説明する。

0016

本実施形態の情報検索システムは、図1に示すように、複数のグループi,j,k,…毎に設けられている各種装置100,200,300と、各グループi,j,k,…とグローバルネットワークNを介して接続されている評価値推定装置400とを備えている。

0017

各グループi,j,k,…は、当該グループ内の複数の情報が蓄積されている情報管理装置100と、当該グループ内の利用者による情報の検索を補助する検索装置200と、当該グループ内の利用者が直接用いる利用者端末300と、を備えている。これら各装置100,200,300は、互いにローカルネットワーク1により接続されている。

0018

情報管理装置100は、一般的に、Webサーバメールサーバ等と呼ばれるもので、各種処理を実行するCPU110と、このCPU110での処理実行時のワークエリア等として利用されるメモリ120と、外部と通信するための入出力インタフェース130と、利用者が利用する複数の情報や各種プログラム等が蓄積されているハードディスクドライブ装置等の記憶装置140と、を備えている。

0019

CPU110は、その機能として、利用者端末300から入出力インタフェース130を介して登録情報等を受け付けて、これを記憶装置140に格納する受付・登録部111と、記憶装置140に格納された情報から、この情報の特徴であるキーワードを抽出するキーワード抽出部112と、記憶装置140に格納されている情報へのアクセス数を更新するアクセス数更新部113と、記憶装置140に格納されている各情報の有効性を示す評価値(以下、グループ内情報評価値、又は単にグループ内評価値とする)を求めるグループ内評価値算出部114と、記憶装置140に格納されている各種情報等を入出力インタフェース130から送信するための処理を行う送信処理部115と、を有する。なお、これらの各機能部は、いずれも、記憶装置140に格納されている情報管理プログラムをCPU110が実行することで機能する。

0020

記憶装置140は、前述の情報管理プログラムが格納されるプログラム格納領域141と、複数の情報が格納される情報格納領域150とを有する。情報格納領域150は、図2に示すように、各情報毎に、当該情報に関するインデックス情報が格納されるインデックスフィールド151と、当該情報自体が格納される情報フィールド159を有する。インデックスフィールド151は、さらに、当該情報のIDが格納されるIDフィールド152と、当該情報の標題が格納される標題フィールド153と、当該情報のキーワードが格納されるキーワードフィールド154と、当該情報のリンク情報が格納されるリンク情報フィールド155と、グループ内評価値が格納されるグループ内評価値フィールド156と、後述のグループ外評価値が格納されるグループ外評価値フィールド157と、当該情報に対するアクセス数が格納されるアクセス数フィールド158と、を有する。情報格納領域150に格納される情報としては、例えば、HTML文書メール文書等、企業内で管理される情報全般が該当する。

0021

検索装置200は、図1に示すように、各種処理を実行するCPU210と、このCPU210での処理実行時のワークエリア等として利用されるメモリ220と、外部と通信するための入出力インタフェース230と、CPU210が実行する検索プログラム241等が格納されている記憶装置240と、を備えている。

0022

CPU210は、その機能として、利用者端末300から入出力インタフェース230を介して検索する情報のキーワードを受け付けるキーワード受付部211と、キーワード受付部211が受け付けたキーワードを含む全ての情報のインデックス情報を情報管理装置100から取得するインデックス情報取得部222と、このインデックス情報取得部222が取得した1以上のインデックス情報に含まれている情報の評価値を取得する評価値取得部223と、評価値取得部223が取得した各情報毎の評価値に従って、各情報の表示ランキングを付与するランキング付与部224と、ランキング付与部224で付与された表示ランキング順に各情報を並べた表示データを作成する表示データ作成部225と、を有する。なお、これらの各機能部は、いずれも、記憶装置240に格納されている検索プログラム241をCPU210が実行することで機能する。

0023

評価値推定装置400は、各グループi,j,k,…での情報管理装置100でグループ内評価値が未だ定められていない情報の評価値(以下、グループ外情報評価値、又は単にグループ外評価値とする)を求めるものである。この評価値推定装置400は、各種処理を実行するCPU410と、このCPU410での処理実行時のワークエリア等として利用されるメモリ420と、外部と通信するための入出力インタフェース430と、各種情報が格納される記憶装置440と、を備えている。

0024

CPU410は、その機能として、各グループi,j,k,…の情報管理装置100から、各情報のインデックス情報を取得するグループ内情報取得部411と、各情報のインデックス情報に含まれているキーワードの評価値を求めるグループ内キーワード評価値算出部412と、各グループi,j,k,…相互間の類似度を求めるグループ間類似度算出部413と、各グループi,j,k,…の対応キーワード評価値相互の分散値を求めるキーワード評価値分散算出部414と、グループ外評価値を求める際に用いる分散値及び類似度に対する重みを求める重み算出部415と、いずれかのグループから未だグループ内評価値が求められていない情報に関する評価値の要求を受け付けて、この情報のグループ外評価値を求めるグループ外評価値算出部416と、を有する。なお、これらの各機能部は、いずれも、記憶装置440に格納されている評価値推定プログラムをCPU410が実行することで機能する。

0025

記憶装置440は、前述の評価値推定プログラムが格納されるプログラム格納領域441と、各グループi,j,k,…毎の各情報のインデックス情報が格納されるグループ内情報格納領域442と、各時間帯毎に各グループi,j,k,…毎のグループ内キーワード評価値が格納されるキーワード評価値格納領域450と、グループ外評価値を求めるために必要なキーワード評価値の分散値及びその重み、さらにグループ間類似度及びその重み等が格納されるグループ外評価値用パラメータ格納領域460と、を有する。なお、キーワード評価値格納領域450、グループ外評価値用パラメータ格納領域460に格納されるデータの詳細に関しては、後述する。

0026

ところで、以上では、各グループi,j,k,…毎に、情報管理端末100、検索装置200、利用者端末300が存在することにしているが、各グループi,j,k,…毎にこれらハードウェアとしての装置100,200,300が存在する必要はなく、各グループi,j,k,…相互間で同一のハードウェアとしての装置100,200,300を利用し、同一のハードウェアとしての装置100,200,300でのソフトウェア上の処理で、グループ分割するようにしてもよい。

0027

次に、本実施形態の情報検索システムの動作について、図5に示すシーケンス図に従って説明する。

0028

利用者端末300は、利用者が登録しようとしている情報を受け付ける(S310)。この際、利用者端末300は、その情報の標題、その情報のリンク情報も併せて受け付ける。利用者端末300は、受け付けた情報、その標題、そのリンク情報を情報管理装置100へ送信する。

0029

情報管理装置100は、利用者端末300から登録すべき情報等を受信すると、この情報を登録する(S110)。

0030

ここで、情報管理装置100による情報の登録処理(S110)の詳細について、図6に示すフローチャートに従って説明する。

0031

情報管理装置100の受付・登録部111は、入出力インタフェース130を介して、利用者端末300から登録すべき情報等を受信すると(S111)、この情報のIDを設定する(S112)。次に、キーワード抽出部112は、この情報からキーワードを抽出する(S113)。なお、このキーワード抽出方法は、周知技術であるため、その説明を省略する。そして、受信・受付部111は、記憶装置140の情報格納領域150に情報等を登録する(S114)。具体的には、図2に示すように、ステップ112で設定した情報のIDは、インデックスフィールド151中のIDフィールド152に格納され、ステップ13で抽出されたキーワードは、インデックスフィールド151中のキーワードフィールド154に格納される。また、ステップ111で受信した標題及びリンク情報は、それぞれ、インデックスフィールド151中の標題フィールド153、リンク情報フィールド155に格納され、ステップ111で受信した情報自体は、情報フィールド159に格納される。なお、この登録処理(S110)では、情報格納領域150中のグループ内評価値フィールド156、グループ外評価値フィールド157、アクセス数フィールド158には、データが格納されず、後述の処理でデータが格納される。また、標題、リンク情報は、利用者端末300から送信されてこない場合には、当然、登録されない。

0032

再び、図5に基づいて説明する。

0033

利用者端末300は、所定の検索キーワードを受け付けると、この検索キーワードを含む検索要求を検索装置200へ送信する(S315)。検索装置200は、利用者端末300から検索要求を受け付けると、検索処理(S210)を実行する。この検索処理(S210)では、情報管理装置100から検索キーワードを含む全ての情報のインデックス情報の提供を受け(S115)、このインデックス情報に含まれている評価値に基づいて、検索キーワードを含む全ての情報の表示ランキングを付け、この表示ランキング順に並べた複数の情報の表示データを作成して、これを利用者端末300へ送信する。なお、この検索処理(S300)の詳細内容に関しては後述する。

0034

利用者端末300は、表示ランキング順に並べた複数の情報の表示データを受信すると、これを表示して、利用者から複数の情報のうちの一つの情報の選択を受け付け、この情報の提供を情報管理装置100に要求する(S316)。情報管理端末100は、情報提供の要求を受け付けた情報を記憶装置140から読み込み、これを利用者端末300へ送信する(S116)。この際、情報管理端末100のアクセス数更新部113は、情報格納領域150のアクセス数フィールド158(図2に示す)に格納されているアクセス数に1を加える。

0035

以上が、情報の登録時、情報へのアクセス時の基本的な動作である。

0036

情報管理装置100のグループ内評価値算出部114は、定期的に、例えば、1日毎、1週間毎に、起動し、情報に関するグループ内評価値を算出する(S120)。

0037

ここで、情報管理装置100のグループ内評価値算出部114によるグループ内評価値の算出処理(S120)の詳細について、図7に示すフローチャートに従って説明する。

0038

グループ内評価値算出部114は、起動すると、情報格納領域150に格納されている情報のうちの一つの情報のIDを選択する(S121)。そして、この情報のアクセス数フィールド158から、この情報へのアクセス数を取得する(S122)。グループ内評価値算出部114は、取得したアクセス数nが予め定められた数N以上であるか否かを判断し、予め定められた数Nより小さければ、ステップ125に進み、予め定められた数N以上であれば、このアクセス数nに応じたグループ内評価値を算出し、これをグループ内評価値フィールド156(図2に示す)に格納する(S124)。アクセス数からグループ内評価値を算出する方法としては、既知の各種方法が考えられるが、例えば、単純に、アクセス数nをそのままグループ内評価値としてもよいし、アクセス数nの増加に伴ってグループ内評価値が累積的に増加するような関数を用いるようにしてもよい。また、アクセス数以外に、アクセス時間を考慮して、グループ内評価値を算出してもよい。グループ内評価値算出部114は、グループ内評価値の格納にあたり、今回の起動時刻から前回の起動時刻までの時間帯、つまり最新の時間帯tと対応付けて、このグループ内評価値をこの情報のグループ内評価値フィールド156に格納する。なお、図2では、IDが「1i」の情報のグループ内評価値フィールド156に、最新時間帯tのグループ内評価値として「72」が格納され、前回の時間帯(t−1)のグループ内評価値として「50」が格納された例を示している。また、アクセス数フィールド158に格納されているアクセス数nは、このグループ内評価値の算出処理(S120)の終了毎に、又は、複数回のグループ内評価値の算出処理(S120)の終了毎に、アクセス数更新部113により、「0」にリセットされる。

0039

グループ内評価値算出部114は、ある情報のグループ内評価値の算出及び登録(S124)が終了すると、情報格納領域150に格納されている全ての情報のIDを選択したか否かを判断する(S125)。全ての情報のIDを選択していなければ、ステップ121に戻って新たなIDを選択する。また、全ての情報のIDを選択していれば、情報格納領域150に格納されている全ての情報のインデックス情報をグループ内情報として、評価値推定装置400へ送信して(S126)、このグループ内評価値の算出処理(S120)を終了する。

0040

全ての情報のインデックス情報、言い換えると、グループ内情報は、全ての情報のインデックス情報フィールド151(図2に示す)に格納されている情報である。このインデックス情報は、ある情報に関して、一度、評価値推定装置400へ送信した後は、このインデックス情報のうち、情報IDとグループ内評価値のみを評価値推定装置400へ送信するようにしてもよい。

0041

また、ここでは、キーワードを情報の特徴としているが、類似検索分野で扱われているような他の特徴を用いてもよい。例えば、キーワード及びキーワード間関連情報や、情報の論理構造画像情報では画像の特徴情報カラー情報エッジ情報)など様々が考えられる。但し、本実施形態では、説明を単純化するために、キーワードを特徴とする場合についてのみ述べる。また、情報の特徴を送信するにあたっては、情報漏洩の観点から情報の特徴を例えばハッシュ値として送信してもよい。この場合、以下の説明中、キーワードに関する処理は全てハッシュ値に対する処理となる。また、本実施形態では、情報管理装置100が情報の特徴抽出を行うが、評価値推定装置100に全ての情報を送り、評価値推定装置100が各情報の特徴抽出を行うようにしてもよい。

0042

再び、図5に基づいて説明する。

0043

評価値推定装置400は、各グループi,j,k,…毎のグループ内評価値を受信すると、このグループ内評価値に基づいて、グループ外評価値を求めるための各種パラメータを算出する(S400)。この算出方法に関しては後で詳細に説明する。

0044

情報管理装置100の送信処理部115は、定期的に起動し、情報格納領域150に格納されている情報のうち、アクセス数nが予め定められた数Nに至らず、未だグループ内評価値が定められていない情報を抽出し、入出力インタフェース130を介して、評価値推定装置400に対して、これらの情報全てに関して、グループ外評価値を要求する(S130)。この際、送信処理部115は、未だグループ内評価値が定められていない情報のIDと、この情報のキーワードとを対応付けて、この情報のグループ外評価値を要求する。

0045

評価値推定装置400は、この要求を受け付けると、この要求に含まれている情報IDに対応付けられたキーワードと、ステップ400で求めた各種パラメータとを用いて、この情報IDに対するグループ外評価値を求め、情報IDとそのグループ外評価値とを対応付けて、これを情報管理装置100へ送る(S460)。情報管理装置100は、これを受信すると、情報格納領域150に格納されている情報のうち、評価値推定装置400から送られてきた情報IDに対応する情報のグループ外評価値フィールド157(図2に示す)に、グループ外評価値を格納する。なお、評価値推定装置400によるグループ外評価値の算出処理(S460)については、後で詳細に説明する。

0046

前述したように、利用者端末300が検索要求を検索装置200へ送信すると(S315)、検索装置200が検索処理(S210)を実行する。

0047

ここで、この検索処理(S210)について、図14に示すフローチャートに従って説明する。

0048

検索装置200のキーワード受付部211は、入出力インタフェース230を介して、利用者端末300から、検索要求として、検索キーワードを受け付けると(S211)、検索装置200のインデックス情報取得部212は、情報管理装置100から、この検索キーワードを含む全ての情報のインデックス情報を取得する(S212)。続いて、評価値取得部213は、各情報ID毎に、インデックス情報に含まれている評価値を取得する(S213)。この際、評価値取得部213は、グループ内評価値が既に定まっている情報に関しては、最新のグループ内評価値を取得する。また、グループ内評価値が未だ定まっていない情報に関しては、グループ外評価値を取得する。

0049

検索装置200のランキング付与部214は、評価値取得部213が取得した各情報の評価値の大きなものが上位になるように、各情報毎に表示ランキングを付与する(S214)。そして、表示データ作成部215は、各情報の標題を表示ランキング順に並べた表示データを作成して、これを利用者端末300へ送信する(S215)。

0050

以上で、検索処理(S210)は終了する。

0051

なお、ここでは、検索キーワードを受け付けると(S211)、情報管理装置100から、この検索キーワードを含む全ての情報のインデックス情報を取得しているが、定期的に、情報管理装置100が管理している全ての情報のインデックス情報を取得し、これを記憶装置240に格納し、表示ランキング付けでは、このインデックス情報を利用するようにしてもよい。また、ここでは、各情報の標題を表示ランキング順に並べた表示データを作成しているが、各情報の標題と共に、又は標題無しで、検索キーワードを含む情報の一部を表示ランキング順に並べた表示データを作成するようにしてもよい。

0052

次に、前述の評価値推定装置400によるパラメータ算出処理(S400)の詳細について、図8に示すフローチャートに従って説明する。

0053

前述したように、あるグループiの情報管理装置100が定期的に起動し、この情報管理装置100がグループ内評価値を算出し、このグループ内評価値を含むグループ内情報を評価値推定装置400に送信すると(S120)、評価値推定装置400のグループ内情報取得部411が入出力インタフェース430を介して、このグループ内情報を受信し、これを記憶装置440のグループ内情報格納領域442の該当グループiの領域に格納する(S410)。すなわち、各グループi,j,k,…からの各グループ内情報は、グループ内情報格納領域442の該当グループの領域に格納される。なお、前述したように、情報管理装置100から情報自体が送られてくる場合には、このグループ内情報取得部411が、情報管理装置100から送られてきた情報から特徴(例えば、キーワード)を抽出する。但し、情報の特徴は各グループでの検索時に必要であること、情報自体をグループ外に送ることは情報漏洩の可能性が高まること等の理由により、情報の特徴抽出は、グループ内で行い、情報自体をグループ外の評価値推定装置400に送ることは避けることが好ましい。

0054

次に、グループ内キーワード評価値算出部412が、各情報のグループ内情報評価値に基づいて、各キーワード毎のグループ内キーワード評価値を算出する(S420)。

0055

ここで、以下の説明の都合上、定型化したグループ内評価値の定義について説明する。

0056

ここでは、全グループの集合をGとし、その中の特定のグループをiと表す。また、また、グループiと異なるグループをj({i,j|i,j∈G, j≠i})と表わす。さらに、グループiが所有する情報の全集合Ciをとし、とする。また、Ci の中で個々の情報をci ({ci| ci∈Ci})とする。また、全グループの集合Gが有する全情報の集合をCG({Ci| Ci∈CG})とする。

0057

グループ内評価値を収集する離散的な全時間帯の集合をTとし、その中で特定の時間帯をtで表す。また、最後にグループ内評価値を収集した時刻をTnowと表す。なお、単純化のために、全グループでグループ内評価値を収集するタイミングは同一であるとする。つまり、全ての時間帯tで、各グループのグループ内評価値が存在するとする。

0058

ここで、情報ciの時間帯tにおけるグループ内評価値をEV_INT(ci,t)とする。例えば、グループ内評価値をグループ内での一定期間内のアクセス数から算出するとし、その算出する関数を ev_access (ci,t) とするのであれば、情報ciの時間帯tにおけるグループ内評価値は、以下の(数1)のように表せる。

0059

0060

なお、アクセス数が少なく、グループ内評価値が定まらない場合は、ev_access (ci,t)=nullとして定義する。

0061

次に、グループ内キーワード評価値の算出方法の定式化について説明する。

0062

CGで表される全情報から抽出されるキーワードの全集合を K とし、その中の特定のキーワードを k ({k|k∈K})とする。ここでグループiの時間帯t でのグループ内情報評価値から算出される キーワードkのグループ内キーワード評価値をEV_KEY(k,i,t) とする。EV_KEY(k,i,t)は、例えば、キーワードkを含む全ての情報ciの時間帯tでのグループ内評価値の平均として求めるとする。このとき、情報ciがキーワードkを含むかを判定する真偽関数を include(ci,k)とすると、EV_KEY(k,i,t) は、{ci | include(ci,k)∧EV_INT(ci,t)≠null∧ci∈Ci}を満たす情報ciの集合Ci_sub の範囲において、以下の(数2)にように表せる。

0063

0064

以上のように、定式化したグループ内キーワード評価値は、図9に示す手順で求められる。

0065

グループ内キーワード評価値算出部412は、まず、記憶装置440のグループ内情報格納領域442に格納されている各グループi,j,k,…毎の各情報のインデックス情報のうち、いずれか一つのグループiを選択する(S421)。続いて、このグループiの各時間帯のうち、キーワードに関して未だ評価していない時間帯tを一つ選択する(S422)。次に、この時間帯t中で評価された情報中に含まれているキーワードkを一つ選択する(S423)。そして、グループi内で且つ時間帯t内で、このキーワードkを含む情報の全IDを抽出し(S424)、さらに、ステップ424で抽出した各IDに関するグループ内情報評価値を取得して(S245)、これらのグループ内情報評価値の平均値を求め、これをこのグループi内で且つ時間帯t内でのキーワードkに関するグループ内キーワード評価値として、グループ内キーワード評価値格納領域450に登録する(S246)。すなわち、(数2)を用いて説明したように、グループi内で且つ時間帯t内で、このキーワードkを含む全情報のグループ内情報評価値の平均値が、グループi内で且つ時間帯t内でのキーワードkに関するグループ内キーワード評価値EV_KEY(k,i,t)となる。

0066

ここで、グループ内キーワード評価値格納領域450のデータ構成について、図3を用いて説明する。

0067

このグループ内キーワード評価値格納領域450には、各時間帯毎にテーブルが設定されており、各テーブルには、各キーワードが格納されるキーワードフィール452と、各キーワードに付される項番号が格納される項番号フィールド451と、各グループi,j,k,…に各キーワード毎のグループ内キーワード評価値が格納されるグループ内キーワード評価値フィールド453i,453j,…とを有している。

0068

前述のステップ426では、ある時間帯tのグループi内でのあるキーワードkに関するグループ内キーワード評価値が求められると、該当時間帯tのテーブル中で、項番号フィールド451に項番号が格納され、この項番号に対応するキーワードフィールド452にキーワードkが格納され、このキーワードkに対応するグループiのグループ内キーワード評価値フィールド453iに、求められたグループ内キーワード評価値が格納される。

0069

再び、図9に示すフローチャートに従って説明する。

0070

グループ内キーワード算出部412は、あるキーワードkのグループ内キーワード評価値を登録すると(S426)、全てのキーワードを選択したか否かを判断し、選択していなければ、ステップ423に戻って、全てのキーワードを選択し終わるまで、ステップ423〜ステップ427の処理を繰り返す。また、ステップ427で、全てのキーワードを選択したと判断すると、全ての未評価時間帯を選択したか否かを判断し、選択していなければ、ステップ422に戻って、全ての未評価時間帯を選択し終わるまで、ステップ422〜ステップ428の処理を繰り返す。また、ステップ428で、全ての未評価時間帯を選択したと判断すると、全てのグループを選択したか否かを判断し、選択していなければ、ステップ421に戻って、全てのグループを選択し終わるまで、ステップ421〜ステップ429の処理を繰り返す。また、ステップ429で、全てのグループを選択したと判断すると、このグループ内キーワード評価値の算出処理(S420)は終了する。

0071

再び、図8に示すフローチャートに従って説明する。

0072

以上のように、グループ内キーワード評価の算出処理(S420)が終了すると、グループ間類似度算出部413がグループ相互間の類似度を算出する(S430)。

0073

ここで、グループ間類似度の算出方法の定式化について説明する。

0074

グループ間類似度、例えば、グループiに対するグループjの類似度は、SIM(i,j) と表す。SIM(i,j)は、グループiが有する情報のグループ外評価値を算出するのに用いるものであり、グループjが有する情報のグループ外評価値を算出するのに用いるSIM(j,i)とは、区別して用いられる。最新の時間帯をTnow とし、この時間帯Tnowのグループiに対する任意の時間帯tのグループjの類似度を SIM(i,j,Tnow,t) とすると、SIM(i,j)は、以下の数3に示すように、{t|t∈T} となる全ての t でのSIM(i,j,Tnow,t)の最小値として表せる。

0075

0076

ここで、上記最小値を与える時間帯をtij と表す。つまり 、ti,j は、最新時間帯Tnowでのグループiに対してグループjで最も類似している時間帯である。このtijは、後述のキーワード評価値分散の算出で使用するパラメータの一つである。ここで、SIM(i,j,Tnow,t) を、以下の(数4)に示すように、例えば、グループiの最新時間帯Tnow での全キーワードに対する各グループ内キーワード評価値と、グループjの時間帯tでの全キーワードに対するグループ内キーワード評価値との差の絶対値の平均値とする。

0077

0078

すなわち、グループiに対するグループjの類似度SIM(i,j)は、繰り返すことになるが、以下のように求める。まず、(数4)により、グループiの最新時間帯Tnow での全キーワードに対する各グループ内キーワード評価値と、グループjの時間帯tでの全キーワードに対するグループ内キーワード評価値との差の絶対値の平均値を求め、さらに、グループjの他の全ての時間帯に関しても、同様の処理を行って、これらの時間帯での上記平均値を求め、これら平均値のうちで最小値をグループiに対するグループjの類似度SIM(i,j)とする。

0079

以上のように、定式化したグループ間類似度は、図10に示す手順で求められる。

0080

グループ間類似度算出部413は、対象グループを一つ選択し(S431)、記憶装置440のキーワード評価値格納領域450(図3に示す)から、対象グループiの最新時間帯tの全グループ内キーワード評価値を取得する(S432)。続いて、この対象グループに対する類似度を求める比較グループjを一つ選択し(S433)、この比較グループjの任意の時間帯を一つ選択して(S434)、この選択時間帯の全グループ内キーワード評価値を前述のキーワード評価値格納領域450から取得する(S435)。そして、グループ間類似度算出部413は、各グループ内キーワード評価値の差の平均値を算出する。すなわち、前述の(数4)で、SIM(i,j,Tnow,t)を求める(S436)。

0081

グループ間類似度算出部413は、最新時間帯の対象グループiに対する任意の時間帯tの比較グループjの類似度SIM(i,j,Tnow,t)を求めると、比較グループj内の全時間帯を選択したか否かを判断し、選択していなければ、ステップ434に戻って、全ての時間帯を選択し終わるまで、ステップ434〜ステップ437の処理を繰り返す。また、ステップ437で、比較グループj内の全時間帯を選択したと判断すると、各時間帯のSIM(i,j,Tnow,t)のうち、最小の値をグループiに対するグループjの類似度SIM(i,j)として、記憶装置440のグループ外評価値用パラメータ格納領域460に登録する(S438)。

0082

ここで、図4を用いて、グループ外評価値用パラメータ格納領域460のデータ構成について説明する。

0083

グループ外評価値用パラメータ格納領域460は、各グループ毎にテーブルが設けられており、各テーブルには、各キーワードが格納されるキーワードフィール462と、各キーワードに付される項番号が格納される項番号フィールド461と、当該対象グループiの最新時間帯Tnowの各キーワード毎のグループ内キーワード評価値が格納される対象グループ内キーワード評価値フィールド463iと、各比較対象グループj,k,…の類似時間帯tijの各キーワード毎のグループ内キーワード評価値が格納される比較グループ内キーワード評価値フィールド463j,463k,…と、各キーワード相互間のキーワード評価値の分散値が格納されるキーワード評価値分散フィールド464と、このキーワード評価値の分散値に対する重みが格納されるキーワード分散重みフィールド465と、当該対象グループに対する他のグループの類似度が格納されるグループ間類似度フィールド467と、このグループ間類似度の重みが格納されるグループ間類似度重みフィールド468と、を有している。

0084

前述のステップ438では、対象グループ内キーワード評価値フィールド463iに、対象グループiの最新時間帯Tnowの各キーワード毎のグループ内キーワード評価値が格納され、比較グループ内キーワード評価値フィールド463iに、比較対象グループj,k,…の類似時間帯tijの各キーワード毎のグループ内キーワード評価値が格納され、グループ間類似度フィールド467の比較対象グループjの欄に類似度SIM(i,j)が格納される。

0085

グループ間類似度算出部413は、対象グループiに対する比較グループjの類似度SIM(i,j)を求めると(S438)、比較グループを全て選択したか否かを判断し(S439a)、全てを選択していなければステップ433に戻って、比較グループを全て選択するまでステップ433〜ステップ439aの処理を繰り返す。また、ステップ439aで、全ての比較グループを選択したと判断すると、対象グループを全て選択したか否かを判断し(S439b)、全てを選択していなければステップ431に戻って、対象グループを全て選択するまでステップ431〜ステップ439bの処理を繰り返す。また、ステップ439bで、対象グループを全て選択したと判断すると、こんグループ間類似度の算出処理(S430)は終了する。

0086

再び、図8に示すフローチャートに従って説明する。

0087

以上のように、グループ間類似度の算出処理(S430)が終了すると、キーワード評価値分散算出部414が各キーワード評価値相互間の分散値を算出する(S440)。

0088

ここで、キーワード評価値の分散値の算出方法の定式化について説明する。

0089

あるキーワードkに関するキーワード評価値の分散値は、あるキーワードkの各グループi,j,k,…でのグループ内キーワード評価値のばらつきを表す値である。対象グループiでのあるキーワードkのキーワード評価値の分散値を σ(k,i) とすると、σ(k,i) は,最新時間帯Tnow におけるグループiのキーワードkのグループ内キーワード評価値V_KEY(k,i, Tnow)と、他の全てのグループjの類似時間帯tijにおけるキーワードkのグループ内キーワード評価値EV_KEY(k,j, Tij)との分散として算出できる。例えば、図4に示すように、キーワードkが「通達」である場合、σ(k,i) は、この「通達」の横に並んでいる、(86, 78, 82, 88)の分散である。分散の算出は、一般的な分散の算出方式と同様である。つまり、av(k,i) をキーワードkの全グループ内キーワード評価値の平均値とすれば、このav(k,i)は、以下の(数5)に示すように、最新時間帯Tnow におけるグループiのキーワードkのグループ内キーワード評価値V_KEY(k,i, Tnow)に、他の全てのグループjの類似時間帯tijにおけるキーワードkのグループ内キーワード評価値EV_KEY(k,j, Tij)を加えたものを、キーワード評価値の数|G|で割った値で表せる。但し、jは{j|j∈G,j≠i}である。

0090

0091

次に、このav(k,i)を用いて、以下の(数6)に示すように、σ(k,i) を求める。

0092

0093

以上のように、定式化したキーワード評価値の分散値は、図11に示す手順で求められる。

0094

グループ内キーワード評価値分散算出部414は、まず、複数のグループのうちの一のグループを対象グループとして選択する(S441)。次に、グループ外評価値用パラメータ格納領域460の対象グループiのテーブルから最新時間帯Tnowのグループ内評価値のうち、一つのキーワードkのグループ内キーワード評価値を選択する(S442)。そして、他の全グループjの類似時間帯tijにおける該当グループ内キーワード評価値を取得し(S443)、前述の(数5)及び(数6)を用いて、このキーワードkに関するグループ内キーワード評価値の分散値を求める(S444)。

0095

グループ内キーワード評価値分散算出部414は、あるキーワードkに関するグループ内キーワード評価値の分散値を求めると、全てのキーワードのグループ内キーワード評価値を選択したか否かを判断する(S445)。選択していなければ、ステップ442に戻り、全てのキーワードのグループ内キーワード評価値を選択するまで、ステップ442〜ステップ445の処理を繰り返す。また、ステップ445で、全てのキーワードのグループ内キーワード評価値を選択したと判断すると、全ての対象グループを選択したか否かを判断し、選択していなければ、ステップ441にもとり、全ての対象グループを選択するまで、ステップ441〜ステップ446の処理を繰り返す。また、ステップ446で、全ての対象グループを選択したと判断すると、このグループ内キーワード評価値の分散値の算出処理(S440)は、終了する。

0096

再び、図8に示すフローチャートに従って説明する。

0097

以上のように、グループ内キーワード評価値の分散値の算出処理(S440)が終了すると、重み算出部415がグループ間類似度及びキーワード評価値の分散値に対する重みを算出する(S450)。

0098

ここで、グループ間類似度及びキーワード評価値の分散値に対する重みの算出方法の定式化について説明する。

0099

このグループ間類似度及びキーワード評価値の分散値に対する重みは、あるグループiで、グループ内情報評価値が未だ定まっていない情報に関して、以上で求めた、グループ内キーワード評価値、グループ間類似度、分散値を用いて、グループ外情報評価値を求めた際、このグループ外情報評価値と、このグループiで複数の情報に関して既に定まっているグループ内情報評価値との差が小さくなるようにするための値である。

0100

そこで、まず、グループ外情報評価値の算出方法の定型化について説明する。

0101

あるグループiの情報ciのグループ外評価値は、情報ciが含む1以上のキーワードに対するグループ内キーワード評価値に対して、グループ間類似度、キーワード評価値分散で重み付けを行った上での加重平均することで求めるものとする。このとき、グループiのある情報に関するグループ外情報評価値を算出するにあたり、グループ間類似度、キーワード評価値分散の影響度を調整する値がグループ間類似度重みαi、キーワード評価値分散重みβiである。

0102

グループiの情報ciに含まれるキーワードの集合を Kci とし、この情報ciのグループ外評価値をEV_EXT(ci,αi,βi)とすると、グループ外評価値EV_EXT(ci,αi,βi)は、以下の(数7)に示すように、情報ciに含まれる各キーワードk毎の、他のグループjのグループ内キーワード評価値V_KEY(k,j,tij)に、グループ間類似度SIM(i,j)の逆数、その重みαi、キーワード評価値分散σ(k,i)の逆数、その重みβiを、それぞれ重み付けし、これを全ての他のグループj({j|j∈∧Gj≠i})に関して行うと共に、これを情報ciに含まれる全てのキーワードk({k|k∈Kci})に関して行い、 これらの平均値として求める。

0103

0104

例えば、図4の例で、仮に、グループiの情報ci が、項番1,2,3 のキーワードを含むものとすると、この情報ciのグループ外評価値EV_EXT(ci,αi,βi)は、他のグループj,k,…の項番1のグループ内キーワード評価値に対して、対応グループのグループ間類似度の逆数、その重み、対応キーワード評価値分散の逆数、その重みを重み付けし、さらに、項番2,3のキーワードに関しても、同様に処理して、これらの平均値として求められる。

0105

なお、上記(数7)は、σ(k,i)或いはSIM(i,j)が0の場合に無限大になるため、実際にはこれらが0にならないような調整を行う必要があるが、ここでは単純化したモデルで示す。

0106

グループ外評価値を算出するために必要な各重みを求める際には、グループiの全情報の中でグループ内評価値を有する{EV_INT(ci,t)≠null }を満たす情報の集合Ci_sub2に関し、以下の(数8)に示すように、グループ間類似度重みαi、キーワード評価値分散重みβi を変数とする関数f(αi, βi)を想定し、この関数f(αi, βi)を最小にするαi,βi を、グループ外評価値を算出するために必要な重みΑi,Βiとする。なお、この関数f(αi, βi)は、グループiでグループ内評価値が定まっている各情報に関して、そのグループ外評価値とそのグループ内評価との差の合計を示す関数である。これらΑi,Βiの算出方法は一般的に知られている最適化問題の解を求める方法であり詳細は割愛する。

0107

0108

以上のように、定式化した各重みは、図12に示す手順で求められる。

0109

重み算出部415は、まず、複数のグループのうちの一のグループを対象グループとして選択する(S451)。次に、この対象グループ内でグループ内情報評価値が求められている情報を全て抽出する(S452)。グループ内情報格納領域442には、各グループ毎に、グループ内情報評価値が求められた情報のインデックス情報が格納されているので、ここでは、ここに格納されている情報IDのうちの対象グループに関する全て情報IDを抽出する。次に、抽出した情報IDのうちの一つを選択し(S453)、この情報に関して、(数7)を用いて、各重みをα、βとしたときのグループ外評価値を前述の(数7)を用いて求める(S454)。

0110

重み算出部415は、次に、対象グループ内の全ての情報を選択したか否かを判断する(S455)。選択していなければ、ステップ453に戻り、対象グループ内の全ての情報を選択し終わるまで、ステップ453〜ステップ455の処理を繰り返す。また、ステップ455で、対象グループ内の全ての情報を選択したと判断すると、対象グループの全情報に関するグループ内評価値をグループ内情報格納領域442から取得する(S456)。

0111

次に、重み算出部415は、(数8)に示すように、各情報毎のグループ外評価値とグループ内評価値との差の合計が最小になるα、βを求め、これらの値を重みの定数A,Bとしてグループ外評価値用パラメータ格納領域460の重みフィールド467,468に格納する(S457)。そして、全てのグループを選択したか否かを判断し(S458)、全てのグループを選択していなければ、ステップ451に戻り、全てのグループを選択し終わるまで、ステップ451〜ステップ458を繰り返す。また、ステップ458で全てのグループを選択したと判断すると、この重みの算出処理(S450)は、終了する。

0112

以上の図8に示すグループ外評価値の算出用パラメータの算出処理(S400)が終了する。

0113

以上の評価値推定装置400の動作(S400,S460)に対して、グループ内の情報管理装置100は、図5を用いて前述したように、定期的に、未だグループ内評価値が定められていない全ての情報に関して、グループ外評価値を要求する(S130)。情報管理装置100は、未だグループ内評価値が定められていない情報のIDと、この情報のキーワードとを対応付けて、この情報のグループ外評価値を要求する。

0114

評価値推定装置400のグループ外評価値算出部416は、この要求を受け付けると、この要求に含まれている情報IDが示す情報のグループ外評価値を求める(S460)。

0115

ここで、このグループ外評価値の算出処理(S460)について、図13に示すフローチャートに従って説明する。

0116

評価値推定装置400のグループ外評価値算出部416は、あるグループの情報管理装置100からグループ外評価値の要求を受け付けると(S461)、この要求に含まれている情報IDを一つ選択し(S462)、この要求に含まれている情報IDが示す情報の各キーワードに関して、要求を送信したグループを除く他のグループでのグループ内キーワード評価値をグループ外評価値用パラメータ格納領域460から抽出する。さらに、グループ外評価値用パラメータ格納領域460から、各キーワードの分散値、あるグループに対する他のグループのグループ間類似度、各重みを抽出する。そして、これらのパラメータを前述の(数7)に代入して、この情報IDが示す情報のグループ外評価値を求める(S464)。なお、ここで、(数7)中の変数α、βに関して、グループ外評価値用パラメータ格納領域460に格納されている定数A,Bを用いる。

0117

ある情報に関するグループ外評価値を求めると、全ての情報IDを選択したか否かを判断する(S465)。選択していなければ、ステップ462に戻り、全ての情報IDを選択し終わるまで、ステップ462〜ステップ465の処理を繰り返す。また、ステップ465で全ての情報IDを選択したと判断すれば、要求に含まれている各情報ID毎に、グループ外評価値を対応付けたものを、要求元のグループに送信する(S466)。

0118

以上で、グループ外評価値の算出処理(S460)が終了する。

0119

利用者端末300から検索要求を受けた検索装置200は、前述したように、情報管理装置100から、検索キーワードを含む全情報に関するインデックス情報を受けており、検索キーワードを含む全情報のうち、グループ内評価値が求められている情報に関しては、このグループ内評価値を用い、グループ内評価値が求められておらず、グループ外評価値が求められている情報に関しては、このグループ外評価値を用いて、各情報をランキング付けする。

0120

以上のように、本実施形態では、グループ内でアクセス数が少なく評価値が定められていない情報に関しても、グループ相互間で情報の共有化を図ることなく、他のグループでの評価値に関する情報に基づいて、評価値を定めることができる。

0121

さらに、本実施形態では、他のグループでの評価値を用いて、あるグループでの情報の評価値を求める際、以下の理由により、あるグループでの情報の評価値の有効性を高めることができる。

0122

第1の理由は、あるグループと他のグループとの類似性を考慮し、類似性が高いグループからの評価値を価値の高いものとして扱っているからである。この際、本実施形態では、各グループ毎に重要視される情報は、時間軸においてズレがあることが想定されるので、このズレも踏まえたている。例えば、ある製品の情報に関して、現在、その製品の研究中のグループでは、製品の研究に関する情報の重要度が高まり、逆に、その製品のマーケッティングに関する情報の重要度は低い。これに対して、現在、その製品の営業展開を行っているグループでは、その製品の研究に関する情報の重要度が低く、その製品のマーケッティングに関する情報の重要度が高まる。本実施形態では、前述したように、このような情報が重視される時間ズレを考慮して、グループ間の類似性を定めている。

0123

第二の理由は、他の複数のグループでの情報の特徴に関する各評価値を採用するにあたり、例えば、他の一のグループによる特徴に関する評価値が異常に高く、この特徴に関する評価値をそのまま用いると、他の一のグループの特異な外乱を受ける可能性が高まるため、このような特徴に関する評価値を価値の低いものとして扱っているからである。

0124

第三の理由は、あるグループでの既に評価値が定まっている情報に関して、他のグループからの評価値を用いて、この情報の評価値を推定し、この推定評価値と既知の評価値とを比較し、情報の評価の重みを決定し、この重みを用いて、未だ評価値が定まっていない情報の評価値を推定し、あるグループの特性を情報評価に反映させることができるからである。

図面の簡単な説明

0125

本発明に係る一実施形態としての情報検索システムの構成を示す説明図
本発明に係る一実施形態としての情報管理装置の情報格納領域のデータ構成を示す説明図
本発明に係る一実施形態としての評価値推定装置のグループ内キーワード評価値格納領域のデータ構成を示す説明図
本発明に係る一実施形態としての評価値推定装置のグループ外評価値用パラメータ格納領域のデータ構成を示す説明図
本発明に係る一実施形態としての情報検索システムを構成する各装置の動作を示すシーケンス図
本発明に係る一実施形態としての情報管理装置の登録処理の詳細を示すフローチャート
本発明に係る一実施形態としての情報管理装置のグループ内評価値の算出処理の詳細を示すフローチャート
本発明に係る一実施形態としての評価値推定装置のグループ外評価値の算出用パラメータの算出処理の詳細を示すフローチャート
本発明に係る一実施形態としての評価値推定装置のグループ内キーワード評価値の算出処理の詳細を示すフローチャート
本発明に係る一実施形態としての評価値推定装置のグループ間類似度の算出処理の詳細を示すフローチャート
本発明に係る一実施形態としての評価値推定装置のグループ内キーワード評価値分散の算出処理の詳細を示すフローチャート
本発明に係る一実施形態としての評価値推定装置の重み算出処理の詳細を示すフローチャート
本発明に係る一実施形態としての評価値推定装置のグループ外評価値の算出処理の詳細を示すフローチャート
本発明に係る一実施形態としての検索装置の検索処理の詳細を示すフローチャート

符号の説明

0126

100:情報管理装置、110:CPU、111:受付・登録部、112:キーワード抽出部、113:アクセス数更新部、114:グループ内評価値算出部、115:送信処理部、120:メモリ、130:入出力インタフェース、140:記憶装置、150:情報格納領域、200:検索装置、210:CPU、211:キーワード受付部、212:インデックス情報取得部、213:評価値取得部、214:ランキング付与部、215:表示データ作成部、220:メモリ、230:入出力インタフェース、240:記憶装置、300:利用者端末、400:評価値推定装置、410:CPU、411:グループ内情報取得部、412:グループ内キーワード評価値算出部、413:グループ間類似度算出部、414:キーワード評価値分散算出部、415:重み算出部、416:グループ外評価値算出部、420:メモリ、430:入出力インタフェース、440:記憶装置、441:プログラム格納領域、442:グループ内情報格納領域、450:グループ内キーワード評価値格納領域、460:グループ外評価値用パラメータ格納領域

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社日立製作所の「 計算機システム及び文書の分類方法」が 公開されました。( 2021/03/18)

    【課題】文書の分類結果とともに、分類の根拠をユーザに提示する計算機システム及び文書の分類方法を提供する。【解決手段】計算機システムは、文書のデータの入力を受け付け、文書及び文書の要素を構成要素とする非... 詳細

  • 大日本印刷株式会社の「 画像処理装置及び画像検索方法」が 公開されました。( 2021/03/18)

    【課題】適切な画像を用いて顔検索を行い、検索対象人物が写っている画像を精度良く検索する。【解決手段】画像処理装置は、複数のイベントの販売画像を記憶する記憶部と、検索対象人物が写った検索用画像をユーザ端... 詳細

  • 株式会社NTTドコモの「 情報提供システム」が 公開されました。( 2021/03/18)

    【課題】ユーザによって用いられる蓋然性が高いキーワードを精度良く提供する情報提供システムを提供する。【解決手段】情報提供システムは、対象ユーザを含む複数の閲覧者が第1情報源から提供される第1コンテンツ... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ