図面 (/)

技術 電子文書改善提案装置

出願人 キヤノン株式会社
発明者 長井宏之
出願日 2002年12月9日 (16年7ヶ月経過) 出願番号 2002-356222
公開日 2004年7月8日 (15年0ヶ月経過) 公開番号 2004-192087
状態 未査定
技術分野 検索装置
主要キーワード 装置運用者 構造改 改善提案 改善案 修正項目 分布解析 入力語 文書提示
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2004年7月8日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (10)

課題

検索エンジンへのアクセス履歴を利用して、サイト構造改善案を提供する装置を提案する。

解決手段

検索エンジンの履歴とその統計データをとる検索要求履歴解析装置、履歴によってサイトで必要なページと不要なページを解析する電子文書解析装置、結果を表示する装置からなる。

概要

背景

ネットワークの普及が本格化するにつれ、そこで参照される電子文書の量も膨大になってきている。このことによって、文書閲覧者が目的の文書に到達することが難しいという問題が起こっている。例えば、企業がインターネット上でホームページ公開している例は多いが、そのサイトでは同時に検索機能が提供されることが必要不可欠になっている。これは、電子文書の量が増大していること、ページ閲覧者ニーズページ作成者の意図を合致させることが困難であることからきていると思われる。この現象はインターネットに限らず、イントラネット内で公開されているサイトでも同様に起こっている。

概要

検索エンジンへのアクセス履歴を利用して、サイトの構造改善案を提供する装置を提案する。検索エンジンの履歴とその統計データをとる検索要求履歴解析装置、履歴によってサイトで必要なページと不要なページを解析する電子文書解析装置、結果を表示する装置からなる。

目的

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

閲覧者検索要求履歴を保持する電子文書検索装置が存在するとき、該検索要求履歴を用いて電子文書改善案を示すことを特徴とする電子文書改善提案装置。

請求項2

請求項1で定義される電子文書改善提案装置であり、該電子文書の改善案が、現存しない追加すべき文書提示であることを特徴とする電子文書改善提案装置。

請求項3

請求項1で定義される電子文書改善提案装置であり、該電子文書の改善案が、現存するが必要性の低い文書の提示であることを特徴とする電子文書改善提案装置。

技術分野

0001

本発明は、ネットワーク上に配置された電子文書改善提案を行う装置に関するものである。

0002

ネットワークの普及が本格化するにつれ、そこで参照される電子文書の量も膨大になってきている。このことによって、文書閲覧者が目的の文書に到達することが難しいという問題が起こっている。例えば、企業がインターネット上でホームページ公開している例は多いが、そのサイトでは同時に検索機能が提供されることが必要不可欠になっている。これは、電子文書の量が増大していること、ページ閲覧者ニーズページ作成者の意図を合致させることが困難であることからきていると思われる。この現象はインターネットに限らず、イントラネット内で公開されているサイトでも同様に起こっている。

背景技術

0003

そのような中、特開平9−325937では、電子文書へのアクセス履歴を用いて改善する方法が提案されている。文書へのアクセス履歴が閲覧者の意図を反映していることを利用して、電子文書のリンク関係を閲覧者のニーズに合わせようというものである。

発明が解決しようとする課題

0004

しかし、特開平9−325937の方法では、いくつか問題があるように思われる。まず、
現存する文書間の関係を改善することは出来るが、「閲覧者は望んでいるが存在しない文書」を考慮することは出来ない点である。例えば、閲覧者が「ユーザサポート」のページを期待していても、もともとそのような文書が存在しなければ、アクセス履歴は存在し得ない。また、リンク構造に問題が多ければ、閲覧者がそもそも目的の文書にたどりついていないことも往々にして考えられる。この場合も、アクセス履歴は閲覧者のニーズと合致しない。さらに、文書の内容によっては、その文書の何処を読みたくて閲覧者がアクセスしたのかアクセス履歴からでは判断しにくいことも考えられる。

0005

上記課題を解決するため、本出願に係る第一の発明は、閲覧者のニーズを反映するデータとして検索装置への閲覧者の入力語統計情報を利用する。この入力語の統計情報は、文書へのアクセス履歴よりも忠実に閲覧者のニーズを反映していると考えられるからである。

0006

また上記課題を解決するため、本出願に係る第二の発明は。電子文書の改善案として、現存しないが閲覧者に望まれている文書を提示する。これにより、文書作成者は作成すべき文書を把握できる。

課題を解決するための手段

0007

また上記課題を解決するため、本出願に係る第三の発明は。電子文書の改善案として、閲覧者にほとんど必要とされていないと思われる文書を提示する。これにより、文書作成者はその文書を抹消するなり修正するなりして、サイトの有効性を高めることが出来る。

0008

(実施例)
図1に本出願で提案する電子文書改善提案装置例を示す。装置は101に示す検索要求履歴解析装置と、102に示す電子文書解析装置、103に示す要作成文書提示装置、104に示す不必要文書提示装置からなる。

0009

図2に検索要求履歴解析装置へのデータの流れを示す。閲覧者(201)はサイトに用意されている電子文書検索装置(202)に検索要求(203)を送信することで、目的の電子文書を発見する行為を行う。この行為によって202は複数の201からの203を蓄積することが出来る。一定量蓄積された203は、検索要求履歴データ(204)として201のニーズを推し量るための有意なデータとなる。検索要求履歴解析装置(205)は204を102が利用できる形にデータを加工する。このデータが検索要求統計データ(206)である。

0010

図3に検索要求の詳細を示す。検索要求は301のように検索語からなる。閲覧者はこの語が含まれる文書が提示されることを期待している。また、検索語が302のように複数指定されることもある。この場合、閲覧者はその複数の語が同時に存在する文書が提示されることを期待している。

0011

図4に検索要求履歴データの詳細を示す。このデータは一定以上の数量を持った検索要求の集合である。どれぐらいの数量があれば閲覧者のニーズを推し量るのに適当であるかは装置運用者の裁量に任される。

0012

図5に検索要求統計データの詳細を示す。501はどのような語が何度検索に用いられたかを示す検索語の頻度である。この数が大きい検索語を含む電子文書へのアクセスを容易にすることが、サイトの利便性を上げるものと考えられる。502は、302のように同時に複数の検索語が送られたときの組み合わせを数え上げたデータである。閲覧者が複数の検索語を一度に送信するのは、その複数の語が同じ電子文書に記述されていることを期待するからであり、サイトの利便性を上げるには、同時に検索された語は同じ文書に含まれているようにすることが望ましいと考えられる。

0013

図6に電子文書解析装置へのデータの流れを示す。検索要求履歴解析装置(601)からの検索要求統計データ(602)と、文書の改善を行いたいWWWサーバからの電子文書(604)を入力として、電子文書解析装置(605)は、改善案データ(606)を出力する。

0014

図7に電子文書解析装置の詳細を示す。まず701で示される、検索に用いられた語、サイト内のどの電子文書中で使われているかを解析する検索語分布解析が行われる。次に702で示される、検索頻度の高い語が、サイト内のどの文書中に見られるか、ほとんど検索にヒットしない(検索に用いられた語を含まない)文書がどれであるかを解析する検索語分布偏り解析が行われる。これらの解析によって、閲覧者のニーズと電子文書のずれを推し量ることが出来る。

0015

図8に要作成文書の提示例を示す。801は、解析によって改善が必要と思われた語が示される。この例ではファックスである。802は、801で示された語が、サイト中の文書の何処で用いられているかを視覚的に示している。803は文書の単位を示しており、文書間の線分リンクを示している。文書中の斜線部が、語の用いられている部分である。804は、802に対する改善案である。805のように検索語の頻度中「ファックス」が上位にあるのに、現在の文書配置では、ファックスの記述は一箇所にまとまっておらず、ファックスの情報のみが書かれた文書も存在しない。よって、804では「fax.html」という独立した文書を作成すること、現在のどの文書から記述を移動する必要があるかということを視覚的に示している。

0016

図9に不必要文書の提示例を示す。901は、装置により不必要と判断された文書の名前を示している。902は、サイト内の電子文書において、どこに検索頻度の高い語が見受けられるかを示している。903は改善案を示している。902で、斜線部分の見られない「support.html」を装置は不必要とみなして、×印をつけている。

0017

(他の実施例)
1.上記の実施例では、検索要求のデータとして検索語のみを用いたが、検索要求がなされた日時を解析に加えることも考えられる。日時の情報は、例えば食べ物を扱うサイトであれば季節による閲覧者の嗜好の変化を把握するのに有用だと思われるので、季節ごとの統計結果を出力するようにすれば、サイトは季節ごとに閲覧者のニーズに応えられるものとなる。

発明を実施するための最良の形態

0018

2.上記の実施例では改善案の提案にとどまったが、改善案は明確であるので、装置が文書を改善することも可能である。

0019

本出願に係る第一の発明によれば、電子文書検索装置の検索要求履歴を利用することにより、閲覧者のニーズに合わせた電子文書の改善提案が出来る。

発明の効果

0020

また本出願に係る第二の発明によれば、追加すべき文書の提示を行うことによって、サイト運営者は追加すべき文書の把握が容易になる。

図面の簡単な説明

0021

また本出願に係る第三の発明によれば、必要性の低い文書の提示を行うことによって、サイト運営者は抹消すべき文書の把握が容易になる。

図1
電子文書改善提案装置
図2
検索要求履歴解析装置
図3
検索要求
図4
検索要求履歴データ
図5
検索要求統計データ
図6
電子文書解析装置
図7
電子文書解析装置詳細
図8
要作成文書提示
図9
不必要文書提示
【符号の説明】
101 検索要求履歴解析装置
102 電子文書解析装置
103 要作成文書提示装置
104 不必要文書提示装置
201閲覧者
202電子文書検索装置
203 検索要求
204 検索要求履歴データ
205 検索要求履歴解析装置
206 検索要求統計データ
301検索語(単独)
302 検索語(複数)
501頻度
502 同時に検索された頻度
601 検索要求履歴解析装置
602 検索要求統計データ
603WWWサーバ
604 電子文書
605 電子文書解析装置
606改善案データ
701 検索語分布解析
702 検索語分布偏り解析
801修正項目
802 現在の文書配置
803 電子文書
804 改善案
805 検索語の頻度の高いもの
901 修正項目
902 現在の文書配置
903 改善案

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • グーグルエルエルシーの「 ビデオマッチングシステムのサービス品質向上のための画像マッチングシステムの使用」が 公開されました。( 2019/05/30)

    【課題・解決手段】システムは、対象のビデオを受信する。システムは、対象のビデオ内の動的セグメントと準静的セグメントとを識別する。システムは、対象のビデオの動的セグメントと参照ビデオの参照動的セグメント... 詳細

  • 尾和剛一の「 特許文献集合の分析方法」が 公開されました。( 2019/05/23)

    【課題】特定のコア技術や、特定の出願人の特定の分野の全特許文献集合の文献件数時系列動向とは異なる動向を示す文献項目を抽出する方法を提供する。【解決手段】特定文献集合分折方法は、特定の文献集合の特許文献... 詳細

  • 株式会社大塚商会の「 画像解析システム」が 公開されました。( 2019/05/23)

    【課題】 画像解析システムを提供することを目的とする。【解決手段】 画像解析システムであって,対象物と対象物関連情報とを対応づけて記憶する対象物情報記憶部と,第1の画像情報と,少なくとも一以上の第... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ