図面 (/)

技術 近位キューを使用するウェブサイトの使用を予測するための方法

出願人 ゼロックスコーポレイション
発明者 エドエイチカイキムケイチェン
出願日 2002年3月27日 (17年3ヶ月経過) 出願番号 2002-088346
公開日 2003年2月7日 (16年5ヶ月経過) 公開番号 2003-036256
状態 特許登録済
技術分野 検索装置
主要キーワード 構成ワード 最終ロケーション 要求ベクトル 情報コンテント 開始ロケーション ワード行 ビリーフ 位相要素
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2003年2月7日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

課題

近位キューを使用する、ドキュメント集合またはウェブサイトの使用を予測する。

解決手段

ユーザ情報要求を入力する工程S15と、コンテント要素集合位相行列を決定する工程S30と、コンテント要素の接続に関連する近位情報キューワードを決定し、少なくとも1つの近位情報キューワードを保存する工程S35又はS50及びS60と、近位情報キューワードとユーザ情報要求との間の類似性から、コンテント要素の集合における予測されたユーザの行動を決定する工程S70〜S100と、予測されたユーザの行動と開始ロケーションとを用いる拡張アクティベーションによって、ユーザ情報要求に基づく開始ロケーションから最終ロケーションまでのユーザ経路を決定する工程S110〜S120とを含む方法により上記課題を解決する。

概要

背景

ますます、ワールドワイドウェブ(World Wide Web)は会社や個人ユーザの両方が選択する情報配信メカニズムとなってきている。ワールドワイドウェブブラウザが遍在し、多くの会社が共有シェルフ技術(COTS:common off the shelf technology)の採用を押し進めているため、ワールドワイドウェブがほとんどの情報システムに対する必要な配信オプションとなっている。

しかしながら、現在、ワールドワイドウェブを介して、情報源は本来の受け手入手し易くなっているが、依然として関連情報へのアクセスは、ユーザのワールドワイドウェブおよび目的ウェブサイトナビゲートし、必要な情報を積極的に蓄積する能力によって制限されている。多くのサイトは情報を提供するのに異なる方法またはサイト設計モデルを使用する。例えば、地方行政査定局(country government tax assessors office)サイトのウェブサイト設計者はどの問い合わせも地方税の査定に関連するものであると仮定するかもしれない。対照的に、オンラインデパートの設計者はユーザにトースターから宝石にわたる製品情報へのアクセスを提供する必要がある。法人内部情報サイトのウェブサイト設計者は法人税情報、不動産所有営業許可証および/または健康および安全記録へのアクセスを提供する必要があるかもしれない。そのため、ウェブサイトを含む情報の宝庫へのユーザのアクセスを容易にするために、ビジネスおよび消費者にとって、直観的なインタフェースを提供することがますます重要になっている。

したがって、ウェブサイト設計者、情報システム管理者および研究員は、絶えずユーザが必要とする情報を得るためにたどる経路を理解するための新しいツールを開発している。例えば、最も関連のあるウェブサイト上に情報を出したいと望むウェブサイト設計者、研究者およびウェブサイトバナー広告主は様々な技術を用いてウェブログファイル解析していた。ウェブログファイルは、ユーザがどのウェブページからそのサイトに行ったのか、およびそのサイト内のどのウェブページを訪れたのかに関する情報を含む。ユーザのIPアドレスおよびブラウザタイプに関する情報はしばしばウェブログファイル中に再検討用に保存される。

アクルーコーポレーション(Accrue Corporation)からのインサイト(Insight)、マーキュリーインタラクティブ(Mercury Interactive)からのアストラサイトマネージャー(Astra Site Manager)およびウエブクライテリア(Web Criteria)のサイトアナリシス(Site Analysis)、タスクアナリシス(Task Analysis)およびマックス(MAX)製品などのツールにより、ウェブサイト開発者はウェブサイトについての一般統計を解析することができる。例えば、ウエブクライテリアのサイトアナリシス製品により、マックスソフトウエアエージェント製品の使用により蓄積された説明的な統計が得られる。マックスソフトウエアエージェントはウェブサイトを移動し、模擬ブラウジングから有用性行列を導き出す。しかし、模擬ブラウジングは単にウェブサイトのランダムウォークを提供するにすぎない。模擬ブラウジングは、ユーザのナビゲーション選択無作為であると仮定し、各ページおよび周囲の各リンク上の情報キュー(cue)の存在を単純に無視するランダムウォークに基づいている。しかし、サイトの実際の使用では、情報キューは、他の経路を越えてウェブサイトを通じて1つの経路を選択するか否かのユーザの選択に影響する。

チャクラバーティらおよびシルバ(チャクラバーティ.S、B.ドム、P.ラグバン、S.ラジャパラン、D.ギブソンおよびJ.クラインベルグ:ハイパーリンク構造および関連テキストの解析による自動資源編集:1998年、オーストラリアブリベーン、第7回国際ワールドワイドウェブ会議(WWW7)の議事録、pp.65−74、およびシルバ.I、B.リベイロ−ネト、P.カラド、E モウラおよびN.ジビアニ:ビリーフネットワークモデルにおけるリンクベースおよびコンテントベース証拠情報:2000年、ギリシャ、アテネ、情報検索における研究と開発に関する第21回ACMSIGIR会議の議事録、pp.96−103)では、検索結果のランキング重み付けの決定にキーワードとリンクの結合が使用される。しかし、チャクラバーティおよびシルバは仮想ユーザ情報要求に基づいてウェブサイトの利用を予測しようとしていない。

その代わりに、これらのシステムは単に、過去にユーザがどのようにそのウェブサイトを移動したかを説明しているにすぎない。これらのシステムは、サイトを移動することを必要とする特定の情報要求を持つユーザに対して、ドキュメントまたはウェブページの変化がどのように影響するかについて説明するために客観的な予測を、ウェブサイト設計者に提供することができない。しかし、遠位情報は、ユーザがまだ見ていない情報と定義される。したがって、現在のまたは近位のドキュメントまたはウェブページのナビゲーション選択にユーザが遭遇した時に、遠位情報の解析は、ドキュメント集合またはウェブサイトの実際初めてのユーザによる判断の客観的な指示を反映することができない。その代わりに、ドキュメント集合またはウェブサイトの有用的な解析では、ユーザの経験が近位のあるいは現在のドキュメントまたはウェブページにおける情報キューにより、どのように影響されるかについての測定を含むことが必要とされる。

したがって、ドキュメント集合またはウェブサイトの使用を予測するシステム及び方法では、近位キューを使用するものが好適である。本発明における様々な例示的な実施の形態では、近位キューを使用することによって、ドキュメント集合またはウェブサイトの客観的又は仮想的なユーザの使用予測が決定される。

本発明における様々な他の実施の形態では、ドキュメント集合またはウェブサイトのイメージリンクに対する近位情報キューの認識および供給が提供される。

概要

近位キューを使用する、ドキュメント集合またはウェブサイトの使用を予測する。

ユーザ情報要求を入力する工程S15と、コンテント要素集合位相行列を決定する工程S30と、コンテント要素の接続に関連する近位情報キューワードを決定し、少なくとも1つの近位情報キューワードを保存する工程S35又はS50及びS60と、近位情報キューワードとユーザ情報要求との間の類似性から、コンテント要素の集合における予測されたユーザの行動を決定する工程S70〜S100と、予測されたユーザの行動と開始ロケーションとを用いる拡張アクティベーションによって、ユーザ情報要求に基づく開始ロケーションから最終ロケーションまでのユーザ経路を決定する工程S110〜S120とを含む方法により上記課題を解決する。

目的

その代わりに、これらのシステムは単に、過去にユーザがどのようにそのウェブサイトを移動したかを説明しているにすぎない。これらのシステムは、サイトを移動することを必要とする特定の情報要求を持つユーザに対して、ドキュメントまたはウェブページの変化がどのように影響するかについて説明するために客観的な予測を、ウェブサイト設計者に提供することができない。しかし、遠位情報は、ユーザがまだ見ていない情報と定義される。したがって、現在のまたは近位のドキュメントまたはウェブページのナビゲーション選択にユーザが遭遇した時に、遠位情報の解析は、ドキュメント集合またはウェブサイトの実際初めてのユーザによる判断の客観的な指示を反映することができない。その代わりに、ドキュメント集合またはウェブサイトの有用的な解析では、ユーザの経験が近位のあるいは現在のドキュメントまたはウェブページにおける情報キューにより、どのように影響されるかについての測定を含むことが必要とされる。

本発明は、上記従来技術を鑑みて、近位キューを使用するウェブサイトの使用を予測するためのシステムおよび方法を提供することを目的とする。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

コンテント要素集合の使用の予測を行なう方法であって、ユーザ情報要求と、リクエストされたユーザの開始ロケーションと、リクエストされた繰り返し回数と、を入力する工程と、前記コンテント要素の集合における接続の位相を決定する工程と、前記決定された接続の各々に対し、前記接続の各々に関連する近位情報キューワードを決定し、前記接続に基づき少なくとも1つの近位情報キューワードを保存する工程と、前記保存された近位情報キューワードと前記ユーザ情報要求との間の類似性を決定することにより、前記コンテント要素の集合における予測されたユーザの行動を決定する工程と、前記コンテント要素の集合における前記予測されたユーザの行動と、前記リクエストされた繰り返し回数に対する前記リクエストされた開始ロケーションと、を用いる拡張アクティベーションに基づいて、前記ユーザ情報要求に基づく前記リクエストされた開始ロケーションから最終ロケーションまでのユーザ経路を決定する工程と、を含むことを特徴とする方法。

技術分野

0001

本発明は、ユーザの情報要求に関する情報を与えるドキュメント集合使用パターン予測する技術に関する。

背景技術

0002

ますます、ワールドワイドウェブ(World Wide Web)は会社や個人ユーザの両方が選択する情報配信メカニズムとなってきている。ワールドワイドウェブブラウザが遍在し、多くの会社が共有シェルフ技術(COTS:common off the shelf technology)の採用を押し進めているため、ワールドワイドウェブがほとんどの情報システムに対する必要な配信オプションとなっている。

0003

しかしながら、現在、ワールドワイドウェブを介して、情報源は本来の受け手入手し易くなっているが、依然として関連情報へのアクセスは、ユーザのワールドワイドウェブおよび目的ウェブサイトナビゲートし、必要な情報を積極的に蓄積する能力によって制限されている。多くのサイトは情報を提供するのに異なる方法またはサイト設計モデルを使用する。例えば、地方行政査定局(country government tax assessors office)サイトのウェブサイト設計者はどの問い合わせも地方税の査定に関連するものであると仮定するかもしれない。対照的に、オンラインデパートの設計者はユーザにトースターから宝石にわたる製品情報へのアクセスを提供する必要がある。法人内部情報サイトのウェブサイト設計者は法人税情報、不動産所有営業許可証および/または健康および安全記録へのアクセスを提供する必要があるかもしれない。そのため、ウェブサイトを含む情報の宝庫へのユーザのアクセスを容易にするために、ビジネスおよび消費者にとって、直観的なインタフェースを提供することがますます重要になっている。

0004

したがって、ウェブサイト設計者、情報システム管理者および研究員は、絶えずユーザが必要とする情報を得るためにたどる経路を理解するための新しいツールを開発している。例えば、最も関連のあるウェブサイト上に情報を出したいと望むウェブサイト設計者、研究者およびウェブサイトバナー広告主は様々な技術を用いてウェブログファイル解析していた。ウェブログファイルは、ユーザがどのウェブページからそのサイトに行ったのか、およびそのサイト内のどのウェブページを訪れたのかに関する情報を含む。ユーザのIPアドレスおよびブラウザタイプに関する情報はしばしばウェブログファイル中に再検討用に保存される。

0005

アクルーコーポレーション(Accrue Corporation)からのインサイト(Insight)、マーキュリーインタラクティブ(Mercury Interactive)からのアストラサイトマネージャー(Astra Site Manager)およびウエブクライテリア(Web Criteria)のサイトアナリシス(Site Analysis)、タスクアナリシス(Task Analysis)およびマックス(MAX)製品などのツールにより、ウェブサイト開発者はウェブサイトについての一般統計を解析することができる。例えば、ウエブクライテリアのサイトアナリシス製品により、マックスソフトウエアエージェント製品の使用により蓄積された説明的な統計が得られる。マックスソフトウエアエージェントはウェブサイトを移動し、模擬ブラウジングから有用性行列を導き出す。しかし、模擬ブラウジングは単にウェブサイトのランダムウォークを提供するにすぎない。模擬ブラウジングは、ユーザのナビゲーション選択無作為であると仮定し、各ページおよび周囲の各リンク上の情報キュー(cue)の存在を単純に無視するランダムウォークに基づいている。しかし、サイトの実際の使用では、情報キューは、他の経路を越えてウェブサイトを通じて1つの経路を選択するか否かのユーザの選択に影響する。

0006

チャクラバーティらおよびシルバ(チャクラバーティ.S、B.ドム、P.ラグバン、S.ラジャパラン、D.ギブソンおよびJ.クラインベルグ:ハイパーリンク構造および関連テキストの解析による自動資源編集:1998年、オーストラリアブリベーン、第7回国際ワールドワイドウェブ会議(WWW7)の議事録、pp.65−74、およびシルバ.I、B.リベイロ−ネト、P.カラド、E モウラおよびN.ジビアニ:ビリーフネットワークモデルにおけるリンクベースおよびコンテントベース証拠情報:2000年、ギリシャ、アテネ、情報検索における研究と開発に関する第21回ACMSIGIR会議の議事録、pp.96−103)では、検索結果のランキング重み付けの決定にキーワードとリンクの結合が使用される。しかし、チャクラバーティおよびシルバは仮想ユーザの情報要求に基づいてウェブサイトの利用を予測しようとしていない。

0007

その代わりに、これらのシステムは単に、過去にユーザがどのようにそのウェブサイトを移動したかを説明しているにすぎない。これらのシステムは、サイトを移動することを必要とする特定の情報要求を持つユーザに対して、ドキュメントまたはウェブページの変化がどのように影響するかについて説明するために客観的な予測を、ウェブサイト設計者に提供することができない。しかし、遠位情報は、ユーザがまだ見ていない情報と定義される。したがって、現在のまたは近位のドキュメントまたはウェブページのナビゲーション選択にユーザが遭遇した時に、遠位情報の解析は、ドキュメント集合またはウェブサイトの実際初めてのユーザによる判断の客観的な指示を反映することができない。その代わりに、ドキュメント集合またはウェブサイトの有用的な解析では、ユーザの経験が近位のあるいは現在のドキュメントまたはウェブページにおける情報キューにより、どのように影響されるかについての測定を含むことが必要とされる。

0008

したがって、ドキュメント集合またはウェブサイトの使用を予測するシステム及び方法では、近位キューを使用するものが好適である。本発明における様々な例示的な実施の形態では、近位キューを使用することによって、ドキュメント集合またはウェブサイトの客観的又は仮想的なユーザの使用予測が決定される。

0009

本発明における様々な他の実施の形態では、ドキュメント集合またはウェブサイトのイメージリンクに対する近位情報キューの認識および供給が提供される。

発明が解決しようとする課題

0010

その代わりに、これらのシステムは単に、過去にユーザがどのようにそのウェブサイトを移動したかを説明しているにすぎない。これらのシステムは、サイトを移動することを必要とする特定の情報要求を持つユーザに対して、ドキュメントまたはウェブページの変化がどのように影響するかについて説明するために客観的な予測を、ウェブサイト設計者に提供することができない。しかし、遠位情報は、ユーザがまだ見ていない情報と定義される。したがって、現在のまたは近位のドキュメントまたはウェブページのナビゲーション選択にユーザが遭遇した時に、遠位情報の解析は、ドキュメント集合またはウェブサイトの実際初めてのユーザによる判断の客観的な指示を反映することができない。その代わりに、ドキュメント集合またはウェブサイトの有用的な解析では、ユーザの経験が近位のあるいは現在のドキュメントまたはウェブページにおける情報キューにより、どのように影響されるかについての測定を含むことが必要とされる。

0011

本発明は、上記従来技術を鑑みて、近位キューを使用するウェブサイトの使用を予測するためのシステムおよび方法を提供することを目的とする。

0012

すなわち、ドキュメント集合またはウェブサイトの使用を予測するシステム及び方法では、近位キューを使用するものが好適である。本発明における様々な例示的な実施の形態では、近位キューを使用することによって、ドキュメント集合またはウェブサイトの客観的又は仮想的なユーザの使用予測が決定される。

0013

本発明における様々な他の実施の形態では、ドキュメント集合またはウェブサイトのイメージリンクに対する近位情報キューの認識および供給が提供される。

課題を解決するための手段

0014

上記課題を解決するための本発明は、コンテント要素集合の使用の予測を行なう方法であって、ユーザ情報要求と、リクエストされたユーザの開始ロケーションと、リクエストされた繰り返し回数と、を入力する工程と、前記コンテント要素の集合における接続の位相を決定する工程と、前記決定された接続の各々に対し、前記接続の各々に関連する近位情報キューワードを決定し、前記接続に基づき少なくとも1つの近位情報キューワードを保存する工程と、前記保存された近位情報キューワードと前記ユーザ情報要求との間の類似性を決定することにより、前記コンテント要素の集合における予測されたユーザの行動を決定する工程と、前記コンテント要素の集合における前記予測されたユーザの行動と、前記リクエストされた繰り返し回数に対する前記リクエストされた開始ロケーションと、を用いる拡張アクティベーションに基づいて、前記ユーザ情報要求に基づく前記リクエストされた開始ロケーションから最終ロケーションまでのユーザ経路を決定する工程とを含むことを特徴とする。

発明を実施するための最良の形態

0015

本発明の様々な例示的な実施の形態について、添付の図面を用いて詳細に説明する。

0016

図1は、本発明におけるウェブサイトの使用を予測するためのシステム100の第1の例示的な実施の形態の例示的なブロック図である。ウェブサイトの使用を予測するためのシステム100は制御部15と、メモリ20と、位相決定回路25と、近位キュー決定回路30と、ワード/ドキュメント頻度決定回路35と、キーワード行列決定回路40と、ゼロ以外位相要素決定回路45と、近位予想決定回路50と、正規化回路55と、近位および遠位予想結合回路60と、拡張アクティベーション回路65と、予想行列決定回路75と、キーワードx重み付けワード/ドキュメント決定回路と、重み付けワード/ドキュメント行列決定回路80と、遠位予想決定回路85と、通信リンク110に接続するための入力/出力回路10と、を含む。ウェブサーバ95は通信リンク110によりドキュメント集合またはウェブサイトページ90へのアクセスを提供する。

0017

入力/出力回路10はウェブサーバ95から通信リンク110によりウェブサイト90のドキュメントまたはウェブページを検索し、メモリ20にドキュメントまたはページを保存する。本発明の例示的な実施の形態では、ウェブサーバ95の使用について説明する。しかしながら、本発明における近位キューを使用してウェブサイトの使用を予測するためのシステム100は、ドキュメント集合、ウェブサイトまたは他の型のコンテント部分へのアクセスを提供するどのシステムまたは方法を使用して実行してもよいことは明らかであろう。これらのシステムおよび方法では、ドキュメント、ウェブページまたはコンテント部分の間でリンク、レファレンスおよび/または接続が提供される。

0018

入力/出力回路10によって解析すべきサイト内の各ドキュメントまたは各ウェブページが検索され、位相決定回路25は検索された各ドキュメントまたは各ウェブページ間のリンクまたはコネクション記述する例示的な位相行列構築する。記述の目的で、例示的なサイトは限られた数のドキュメントまたはウェブページおよび関連リンクを示す。しかし、本発明のシステムおよび方法は、任意数のドキュメントまたはウェブページを処理することもできる。

0019

入力/出力回路10はドキュメント集合またはウェブサイト90の各ドキュメントページを検索し、ドキュメントまたはウェブサイトの位相は位相決定回路25を用いて決定される。その後、ドキュメントまたはウェブページ上の各リンクまたは接続が近位キュー解析回路30により解析される。近位キュー解析回路30は、仮想ユーザへ情報を伝達する情報キューを識別する。例えば、リンクまたはコネクションに関連するテキストは、リンクされる情報の性質を示す近位キューを提供しても良い。近位キュー解析回路30は、リンクまたはコネクションを構成ワードに分解する。また、近位キューワードは、リンクを取り囲むテキストの部分を含んでもよい。リンクまたはコネクションが典型的なURL形態であれば、URLに関連する読および‘/’符号を使用してワード境界を規定する。例えば、リンクまたはURL“http://www.xerox.com/products/support/index.html”が処理された場合は、http、www、xerox、com、products、support及びindexというワードはすべて関連するリンクに対するキーワード行列に近位キューワードとして追加される。様々な他の実施の形態では、追加の重み付け係数がドキュメントまたはウェブページ内のリンクの位置などの近位キューワード情報に追加されてもよい。例えば、重み付け情報を与えるために、ドキュメントまたはウェブページの構造内でより重要な部分に現れるキューワードにより高い重要性を与える重み付け方法を使用することができる。

0020

リンクがGIF、JPEG、PNG、BMPあるいは他のイメージファイル型などのイメージリンクである場合、リンクから導かれる近位キューワードの数は制限されても良く、あるいは実在しなくてもよい。さらに、イメージリンクに対する近位キューワードを決定するのは困難な問題である。イメージを解析する場合、処理時間および資源が大きく増加することになるだろう。イメージ解析に基づきイメージの意味または語義を決定することは非常に複雑であり、誤りが多い処理となる。しかし、ウェブサイト開発者はそれらのウェブサイトの有用性を改善しようとするので、イメージリンクの使用は増大する。したがって、仮想ユーザまたは客観的なユーザが応答する近位キューを決定する際にイメージリンクを含むことが重要である。

0021

制御部15において、保存されたドキュメントまたはウェブページがイメージリンクであると決定されると、そのイメージにリンクされた遠位ドキュメントまたはウェブページが検索される。本発明の例示的な実施の形態では、リンクおよび/またはリンクを取り囲むテキストからの近位キューワード情報が近位キュー計算回路30により解析される。また、リンクされたドキュメント又はウェブページ、または遠位のドキュメントまたはウェブページは、近位キュー計算回路30によって近位キューワードとして解析しても良い。このように、リンクされた、または遠位のドキュメントまたはウェブページは、イメージリンクに対する現在のまたは近位のページ上の不十分なまたは無効近位キューワード情報を補充または置換するための代用として機能する。様々な他の実施の形態では、リンクされた、または遠位の情報として、遠位ドキュメントタイトルおよびドキュメントテキストのみを用いても良いし、またはイメージリンクを取り囲むテキストからのキューワードなどの近位キュー情報を共に含んでも良い。近位キューの存在を反映する要素は、メモリ20に保存されたキーワード行列データ構造として保存される。

0022

位相決定回路25がドキュメント集合またはウェブサイトに対する位相情報を全て決定すると、情報はメモリ20に保存された例示的な位相行列データ構造として保存される。ワード/ドキュメント頻度決定回路35は、ウェブサイト90を構成するドキュメント集合またはウェブページの組内の各関連ワードのワード/ドキュメント頻度を決定する。その後、重み付けワード/ドキュメント決定回路80は、ドキュメント集合またはウェブサイト内の各ワードに対し、重み付けされたターム頻度(tf:term frequency)及び逆ドキュメント頻度(idf:inversedocument frequency)を決定する。

0023

その後、ゼロ以外位相要素決定回路45は、メモリ20に保存された例示的な位相行列データ構造を解析する。ここで、メモリ20内に保存された位相行列のゼロでない要素のそれぞれが識別される。

0024

メモリ20内の識別されたゼロでない位相要素のそれぞれに対し、制御部15は位相行列から関連リンク/ドキュメントを識別する。その後、リンク/ドキュメント識別情報は、キーワード行列決定回路40に伝えられる。キーワード行列決定回路40は、リンク/ドキュメント識別情報に対応する要素に対して、メモリ20に保存された近位行列を解析する。リンク/ドキュメントに対する近位キューワード行列要素におけるゼロでない要素はリンクに関連するワードを示す。

0025

近位キューワードベクトルにおいて特定された各ゼロでない要素に対し、近位予想決定回路50は、メモリ20に保存された近位キューワード行列内の各要素とメモリ20に以前に保存されたユーザ情報要求ベクトルとの間の類似性を決定することにより近位予想を決定する。本発明における例示的な実施の形態では、類似性は、近位キューワードx重み付けワード/ドキュメント決定回路70を用いて、メモリ20に保存された近位キューワード行列にメモリ20に保存された重み付けワード/ドキュメント頻度行列をかけ、得られた結果にメモリ20に以前に保存されたユーザ情報要求ベクトルをかけることにより決定される。しかしながら、本発明における様々な他の例示的な実施の形態では、周知のあるいは最近開発された類似性決定技術を使用してもよい。例えば、ベクトル間の角度の余弦の決定を使用してもよい。

0026

遠位予想決定回路85は接続された、または遠位のドキュメントまたはウェブページからの情報を使用して遠位予想行列を決定する。接続された、または遠位のドキュメントあるいはウェブページは遠位予想行列を決定するためのキュー情報を提供する。

0027

その後、近位および遠位予想結合回路60がアクティブにされ、遠位予想行列要素がゼロでなく、近位予想要素がゼロであれば、前に決定した遠位予想行列を近位予想行列に置換する。作成された新しい行列を予想行列と呼ぶ。このように、近位情報が不十分である場合、遠位情報が代用品として提供される。結合すべき近位および遠位予想の比率を決定する他の技術は本発明の範囲内であることは明らかであろう。例えば、以下の関係を使用してもよい。

0028

予想=ALPHA*(近位予想)+BETA*(遠位予想) (1)

0029

その後、正規化回路55がアクティブとされ、予想行列の列の合計が1となる正規化予想行列が作成される。これは、その特別な点でのユーザのナビゲーション選択に対する全て確率の和が1であることを反映する。各要素は特定の情報要求を有するユーザが関連経路を選択する可能性を反映する。

0030

その後、制御部15は、以前にメモリ20に保存された最初の、または開始ページベクトルEを選択する。最初の、または開始ページベクトルは仮想的または客観的なユーザがドキュメント集合またはウェブサイトを移動する際に選択する最初のドキュメントまたはページを反映する。第1のドキュメントまたはページはドキュメント集合またはウェブサイト内のどのドキュメントまたはページを反映してもよい。拡張アクティベーション回路65は、実行される繰り返し数により初期化される。特定数繰り返し後、行列が解析される。行列要素は仮想ユーザまたは客観的なユーザが示されたロケーションに到達する可能性を反映する。

0031

ウェブサイト設計者はドキュメント集合またはウェブサイトを変更するので、ドキュメント集合またはウェブサイト有用性の客観的な指示を発生させることができる。このように、ウェブサイト設計者は相互に、ウェブサイトの設計を調整し、所望の情報を標的とする聴衆に配信するより良好な技術を開発する。

0032

図2は、本発明におけるウェブサイトの使用を予測するための例示的な方法のフローチャート図である。プロセスはステップS10から始まり、直ちにステップS15へと継続する。そこでは、ユーザの情報要求がクエリの形態で入力される。クエリ中で現れるワードを表すクエリベクトルが作成される。制御はステップS20へと継続する。ステップS20では、ドキュメント集合またはウェブサイトに対する位相行列が決定される。例示的な実施の形態では、位相行列には、解析すべきドキュメントまたはウェブページ間に存在するリンクを示す情報がコード化されている。例示的な実施の形態は、情報をコード化する行列を示す。ここで、要素間の関係を示すことができる行列、隣接リストまたは他の周知若しくは最近開発されたデータ構造などの任意の型のデータ構造も、本発明の実施において使用することができることは明らかであろう。

0033

ステップS30では、位相行列の第1のゼロでないリンクが選択される。位相行列には、どのドキュメント、またはどのウェブページが他のドキュメントまたはウェブページへのリンクを含むかを示す情報がコード化されている。そのため、関連リンクを含むドキュメントを容易に識別することができる。その後、制御はステップS40に継続する。ステップS40ではリンク構造がイメージリンクであるか否かが判断される。

0034

イメージの主題を決定するのに複雑なイメージ解析を必要とするため、イメージリンクは困難な意味上の解析の問題を生じさせる。リンクを取り囲む近位キューワードはしばしば幾つかのキューワードを与える。しかし、近位キューワードを決定できない場合は、遠位ドキュメントからのキューワードを使用することができる。ステップS40において、リンク構造がイメージリンクであると判断されると、制御はステップS50へと継続する。リンク構造がイメージリンクではないと決定されると、制御はステップS35へと継続する。

0035

ステップS35では、近位キューワードを求めるために、ゼロでない位相行列の要素が解析される。近位キューワードは、例えば、リンク構造のテキストを含み、’/’および’.’などの文字を含むリンクでは、その文字をワード境界マーカ、および近位キューワードのリストに追加されるテキストの各部分として使用してもよい。リンク構造を取り囲むテキスト、近位ページのタイトル又はドキュメント内でリンクが見出される特徴などもまた追加してもよい。本発明を実行する際に、近位キューワードを求めるために、近位ドキュメントまたはウェブページのいかなる特徴をも使用しても良いことは明らかであろう。その後、制御はステップS60に継続する。

0036

イメージ決定ステップS40において、リンク構造がイメージであることを示されると、制御はステップS50へと継続する。ステップS50では、遠位ドキュメントまたは遠位ウェブページ上のキューワードを用いることによって、イメージリンク構造に対する追加のキューワードを求めても良い。本発明の例示的な実施の形態では、リンク、リンクを取り囲むテキスト、遠位ドキュメントのタイトルおよび/若しくは遠位ドキュメントのテキストのそれぞれ、またはそれらの組み合わせから、リンクに対する近位キューワードは決定される。遠位ドキュメントまたは遠位ウェブページキューワードが不十分であれば、イメージリンク構造を指定する際に使用されたイメージファイル名を用いて、キューワードを求めることもできる。その後、制御はステップS60へと継続する。

0037

その後、ステップS60では、近位キューワード行列Kに近位キューワードを追加することができる。近位キューワード行列Kは、どのワードがどのリンクと関連するかについての情報を保存する。行要素により表されるキーワード行列における各リンクは、個々の近位キューワードと関連付けられる。そのリンクの組の中の各リンクは、それぞれのキューワードと関連する要素を有する。

0038

その後、制御はステップS70へと継続する。ステップS70では、ワード/ドキュメント頻度行列がWと決定される。ワード/ドキュメント頻度行列は列要素に示されるワードがどれだけ頻繁に、行要素により特定されるドキュメントに現れるかを示す。重み付けワード/ドキュメント頻度はターム頻度、逆ドキュメント頻度、ターム頻度、ターム頻度の対数、ターム頻度の(1+log10)まはた周知若しくは最近開発された重み付け技術を用いて決定される。制御はステップS80へと継続し、ステップS80では近位予想行列が決定される。

0039

近位予想行列の決定の詳細は、図3を用いて後に説明する。近位予想行列がステップS80で決定された後、制御はステップS90へと継続し、そこで遠位予想行列が決定される。遠位予想行列の決定の詳細を、図4を用いて後に説明する。その後、制御はステップS100へと継続し、そこで近位および遠位予想行列が結合しても良い。本発明の例示的な実施の形態では、遠位予想行列要素がゼロではなく、近位予想行列がゼロである場合、近位予想行列の要素は遠位予想行列の要素に置換される。このように、遠位予想行列は、近位予想行列によって入手することができない情報を与える。例えば、結合された予想行列は、式2に示されるように、遠位および近位予想行列を任意に結合して表すことができる。その後、制御はステップS110へと継続する。

0040

予想=a*近位予想+b*遠位予想 (2)

0041

ステップS110では、拡張アクティベーションのための開始ページが選択される。開始ページはベクトルEで表される。例えばE={1000000}は図6の例示的なドキュメント集合またはウェブサイトにおける開始ページP0を表す。その後、制御はステップS120へと継続し、拡張アクティベーション繰り返しが始まる。

0042

拡張アクティベーションがステップS120で「n」回適用または繰り返される。拡張アクティベーションの各繰り返しで、パラメータαは次のリンクへと行くユーザの割合を示す。すなわち、拡張アクティベーションの各繰り返しは、ページEから開始され、クエリベクトルQで表される情報要求を有するユーザが示されたページを移動する可能性をモデル化するものである。このように、示された情報要求および開始点を有するユーザによるウェブサイトの使用の予測が得られる。拡張アクティベーションが「n」回繰り返されると、制御はステップS130に継続し、プロセスは終了する。

0043

図3は、本発明における近位予想を計算するための例示的な方法の詳細図である。プロセスは、ステップS200で開始し、直ちにステップS210に継続する。

0044

ステップS210では、位相行列Tの第1の要素が選択され、制御はステップS220に継続する。ステップS220では、解析すべき位相要素が残っているかどうかについて決定される。

0045

解析すべきリンク要素がさらに残っていないと決定されると、制御はステップS290に移り、ステップS290では近位予想行列が正規化される。行列の正規化は、行列の列上で基本の列演算を実行し列の合計を確実に1とすることにより達成される。その後、制御はステップS295に継続し、制御は図2の呼び出しステップS80に戻る。

0046

位相行列にさらに要素が残っていると決定されると、制御はステップ230に継続する。ステップS230では、位相行列要素が0値を含むかどうかについて決定される。位相行列中のゼロ値はリンクが存在しないことを示す。その決定により位相要素がゼロであることが示されると、制御はステップS250に移され、そうでなければ、制御はステップS240に移される。本発明の例示的な実施の形態では、ゼロ値はリンクが存在しないことを示す。しかし、位相行列にリンクが存在しないことを示す値、例えば負の数を使用してもよいことは明らかであろう。

0047

制御がステップS250に移ると、位相要素に対応する近位予想行列要素はゼロに設定される。存在しないリンクにより情報予想を伝達することはできないからである。その後、制御はステップS280へと継続する。

0048

ステップS230での決定が、位相要素が0でないことを示す場合、制御はステップS240へと継続する。ステップS240では、リンクに関連する近位キューワードベクトルが近位キューワード行列Kから決定される。近位キューワードベクトルは、所定のリンクと関連する全ての近位キューワードに対する情報を保存する。その後、制御はステップS260へと継続し、ステップS260では、近位キューワードベクトル中の各近位キューワードに重み付けワード/ドキュメント頻度行列がかけられ、第2の重み付け近位キューワードベクトルが得られる。その後、制御はステップS270へと継続し、ステップS270では、第2の重み付け近位キューワードベクトルの最初のクエリベクトルに対する類似性が決定される。上述したように、最初のクエリベクトルはユーザの情報要求を示す。例示的な実施の形態では、類似性は、第2の重み付け近位キューワードベクトルに最初のクエリベクトルをかけることにより得られる。しかし、様々な他の例示的な実施の形態では、類似性はたとえば、ベクトル間の余弦を使用して、あるは類似性を決定する周知のあるいは最近開発された技術を使用して決定してもよいことは明らかであろう。その後、制御はステップS280へと継続する。

0049

ステップS280では、位相行列中の次の要素が選択される。その後、制御はステップS220へと継続し、ステップS220では、解析すべき位相リンク要素が残っていないという決定がステップS220で行われるまでプロセスが繰り返され、制御はステップS290に移される。ステップS90では近位予想行列が正規化される。行列の正規化は、行列の列上で基本の列演算を実行し、列の合計を確実に1とすることにより達成される。その後、制御はステップS295へと継続し、制御は図2の呼び出しステップS80にもどる。

0050

図4は、本発明における遠位予想を決定する例示的な方法の詳細図である。プロセスは、ステップS300で始まり、制御は直ちにステップS310に移される。

0051

ステップS310では、遠位予想行列が決定される。キューワードは遠位または接続されたドキュメントまたはウェブページの情報コンテントに基づき決定される。その後、制御はステップS320へと継続する。

0052

ステップS320では、遠位予想行列が正規化され、そのため、行列中の列の和は1と等しい。これは、ドキュメントまたはウェブページの集合内の個々の経路の移行の確率を示す。その後、制御はステップS330へと継続し、プロセスは図2の呼び出しステップS90へと戻る。

0053

図5は、本発明における拡張アクティベーションの例示的な方法の詳細図である。プロセスは、ステップS400で始まり、制御は直ちにステップS410に移される。

0054

ステップS410では、最初の開始ドキュメントまたはウェブページがベクトルEとして保存される。最初のベクトルは、拡張アクティベーションネットワークの第1の繰り返しとして規定される。その後、制御はステップS420へと継続する。

0055

ステップS420では、アルファパラメータが設定される。アルファパラメータは、各リンクを通じてクリックする、または各リンクを移動するユーザの割合を示す。その後、制御はステップS430へと継続し、ステップS430では拡張アクティベーションの繰り返し数が入力され、アクティベーションカウンタが1に設定される。その後、制御はステップS440へと継続する。

0056

ステップS440では、カウントがステップS430で選択された繰り返し数より大きいか、またはその繰り返し数と等しいかについて判断する。カウントが選択された繰り返し数より小さいと、制御はステップS445へとジャンプする。ステップS445では、以下の式(3)を適用することにより新しいアクティベーションが決定される。

0057

A(カウント)=アルファ*(予想行列)*A(カウント−1)+E (3)

0058

その後、制御はステップS450へと継続し、ステップS450ではカウントが加算され、ステップS440での決定によりカウント値がnより大きいあるいはnと等しいことが示されるまでプロセスが繰り返される。カウントがnより大きい、またはnと等しいと決定されると、制御はステップS460にジャンプしプロセスは終了する。

0059

図6は、例示的な1組のドキュメントまたはウェブページ間の接続リンクを示す例示的なグラフである。

0060

図7は、本発明にかかる例示的な位相行列Tを示す。位相行列はドキュメントまたはウェブページ間のコネクションについての情報を保存する。位相行列中の0でない要素は、近位および遠位予想行列の要素が計算されるリンクを示す。

0061

図8は、本発明における例示的な近位キューワード行列Kを示す。ドキュメントまたはウェブページ中で現れる各ワードは、ターム頻度/逆ドキュメント頻度基準に従い解析される。各重み付けワードは、キーワード行列中の列要素として現れる。行列中のゼロでない要素の存在により、行指数により特定されたリンクと関連する近位キューワードが示される。同様に、所定のリンクに対する特定の近位キューワードが、リンクに関連する行の列における対応するゼロでない要素により識別される。

0062

例えば、行「0」は、近位キューワード「SUN」および「HOME」がドキュメントP0において現れることを示す。同様に、行「1」は、「JAVA(登録商標)」および「HOME」がドキュメントP1において現れることを示す。行「2」における要素は、ワード「JAVA(登録商標)」および「SUPPORT」がドキュメントP2において現れることを示す。行「3」におけるゼロでない要素は「JAVA(登録商標)」および「API」がドキュメントP3において現れることを示す。行「4」のゼロでない行要素は「HOME」および「PETE'S」がドキュメントP4において現れることを示す。行「5」のゼロでない要素は「JAVA(登録商標)」および「COFFEE」がドキュメントP5において現れることを示す。最後に、行「6」のゼロでない要素は、ドキュメントP6が「TEA」を含むことを示す。このように、キーワード行列が形成される。

0063

以上で概略を説明した様々な例示的な実施の形態では、ウェブサイトの使用を予測するためのシステム100は、プログラムによって汎用コンピュータを用いて実装することができる。しかし、ウェブサイトの使用を予測するためのシステム100は、特殊用途コンピュータ、プログラムドマイクロプロセッサマイクロコントローラおよびペリフェラル集積回路素子ASIC若しくは他の集積回路、またはデジタル信号プロセッサディスクリート素子回路などのハードワイヤード電子、または論理回路PLD、PLA、FGPA、またはPALなどのプログラム可能論理素子などを用いて実現することもできる。一般に、有限状態機械を実装することができ、図2〜5において示したフローチャート図を実現することができるどのデバイスも、ウェブサイトの使用を予測するためのシステム100を実現するために使用することができる。

0064

以上で概略を説明したウェブサイトの使用を予測するためのシステム100の回路25〜80のそれぞれは、適当にプログラムされた汎用コンピュータの一部として実現することができる。その代わりに、以上で概略を説明したウェブサイトの使用を予測するためのシステム100の回路25〜80は、ASIC内の物理的に別個ハードウエア回路として、またはFPGA、PDL、PLA若しくはPALを使用して、またはディスクリート論理素子若しくはディスクリート回路素子を使用して実装することができる。以上で概略を説明したウェブサイトの使用を予測するためのシステム100の回路25〜80のそれぞれの特別形態は、設計において適宜選択できることは当業者には明らかであり、予測可能である。

0065

さらに、上述したウェブサイトの使用を予測するためのシステム100および/または様々な回路は、それぞれプログラム汎用コンピュータ、特殊用途コンピュータ、マイクロプロセッサなど上で実行されるソフトウエアルーチン、マネージャーまたはオブジェクトとして実装することができる。この場合、上述したウェブサイトの使用を予測するためのシステム100および/または様々な回路は、それぞれ通信ネットワークに組み込まれた1以上のルーチンとして、サーバ上に存在する資源などとして実装することができる。上述したウェブサイトの使用を予測するためのシステム100および/または様々な回路は、ウェブサイトの使用を予測するためのシステム100を、ウェブサーバのハードウエアおよびソフトウエアシステムなどのソフトウエアおよび/またはハードウエアシステムに物理的に組み込むことにより実現することもできる。

0066

図1に示されるように、メモリ20は、書換え可能な、揮発性または不揮発性メモリ、または書換え不能な、あるいは固定メモリのいずれかの適当な組み合わせを用いて実現することができる。書換え可能なメモリは、揮発性であろうと不揮発性であろうと、1以上のスタティック若しくはダイナミックRAMフロッピー(登録商標)ディスクおよびディスクドライブ、または書き込み可能な若しくは再書込み可能な光ディスクおよびディスクドライブ、ハードドライブフラッシュメモリなどを使用して実装することができる。同様に、書換え不能な若しくは固定メモリは、1以上のROM、PROMEPROM、EEPROM、ROM光ディスク、例えばCD−ROMまたはDVD−ROMディスクおよびディスクドライブなどを用いて実現することができる。

0067

図1に示した通信リンク110は、それぞれ通信装置をウェブサイトの使用を予測するためのシステム100に接続するための周知の若しくは最近開発された装置またはシステムであり、例えば直接ケーブルコネクション、広域ネットワーク若しくはローカルエリアネットワークによるコネクション、イントラネットによるコネクション、インターネットによるコネクション、他の分散型処理ネットワークまたはシステムによるコネクションが挙げられる。一般に、通信リンク110は装置を接続し、通信を容易にするために使用することができる周知若しくは最近開発されたコネクションシステムまたは構造とすることができる。

0068

さらに、通信リンク110は、ネットワークへの有線リンクまたは無線リンクとすることができる。ネットワークは、ローカルエリアネットワーク、広域ネットワーク、イントラネット、インターネット、または他の分散型の処理および保存ネットワークとすることができる。

図面の簡単な説明

0069

図1本発明におけるウェブサイトの使用を予測するための例示的なシステムを示すブロック図である。
図2本発明におけるウェブサイトの使用を予測するための例示的な方法のフローチャートである。
図3本発明における近位予想を決定するための例示的な方法の詳細図のフローチャートである。
図4本発明における遠位予想を決定するための例示的な方法の詳細図のフローチャートである。
図5本発明における拡張アクティベーション例示的な方法の詳細フローチャートである。
図6本発明における解析すべき1組のドキュメントを示す例示的なグラフである。
図7本発明における例示的な位相行列である。
図8本発明における例示的な近位キューワード行列である。

--

0070

10 入力/出力回路、15 制御部、20メモリ、25位相決定回路、30近位キュー決定回路、35ワード/ドキュメント頻度決定回路、40キーワード行列決定回路、45 ゼロ以外位相要素決定回路、50 近位予想決定回路、55正規化回路、60 近位/遠位予想結合回路、65拡張アクティベーション回路、70 キーワードx重み付けワード/ドキュメント決定回路、75 予想行列決定回路、80 重み付けワード/キーワード行列決定回路、85 遠位予想決定回路、90ウェブサイトページ、95ウェブサーバ、110通信リンク、100 システム。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社大和総研ビジネス・イノベーションの「 名寄せシステムおよびプログラム」が 公開されました。( 2019/05/16)

    【課題】効率的な並列分散処理を実現することができ、サーバのスケールアウトによる性能改善を図ることが可能な名寄せシステムを提供する。【解決手段】名寄せマスタの構成データを用いて同一の名称(例えば姓名)を... 詳細

  • シグニファイホールディングビーヴィの「 汚染推定システム」が 公開されました。( 2019/05/16)

    【課題・解決手段】自動車の排気ガスに起因する汚染レベルを推定するための汚染推定システム(100)が提供される。システムは、自動車音のオーディオサンプルを含む音響センサからの使用データを取得するよう構成... 詳細

  • キヤノン株式会社の「 画像データ管理装置」が 公開されました。( 2019/05/09)

    【課題】 従来複数の画像から同じ場所に存在した人や物を判断することでしか判断し得なかった、撮影の場にあった人や物の情報を判断し、画像に紐づけて記憶することで、効率的な画像の検索を可能にすること。【解... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ