図面 (/)

技術 情報検索システム

出願人 今井義充
発明者 今井義充
出願日 2003年10月16日 (17年6ヶ月経過) 出願番号 2003-388540
公開日 2005年5月12日 (16年0ヶ月経過) 公開番号 2005-122668
状態 未査定
技術分野 検索装置
主要キーワード スライド形式 請求項目 対応パターン 検索記録 クエリ文 利用者側コンピュータ 文字補正 検索キーワード群
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2005年5月12日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (5)

課題

デジタルデータの利点と従来の紙媒体の利点のみを併せ持ち、かつ利用者にとって、楽しく得して為になる情報を自動的に抽出して質の高い情報を利用者へ供給すること。また、取得した情報から要約書を生成し、利用者側の携帯端末及びコンピュータに対して要約書を迅速に送信する機能を提供すること。

解決手段

携帯端末または、利用者側コンピュータ、またはWWWサーバーから検索要求された文字列を、複数のWWWサーバーや、デジタル化した書籍データベースから同時検索を実行する。さらに、検索結果から楽しく得して為になる情報を自動抽出する。各項目ごとに類似する単語群集が予め登録されている。登録してある単語群が文章中に含まている場合は自動的に情報抽出する。そして、検索済情報から要約書を生成し、利用者側コンピュータや、携帯端末へ送信する。日常において質の高い情報を最小限の時間で取得可能となった。

概要

背景

従来の検索文字列を単純符合させて検索実行する技術では、日常において限られた人材、限られた時間、限られた情報源、限られた予算など様々な制約の中で、利用者にとって本当に欲しい情報や質の高い情報を最小限の時間で取得するには技術と労力を必要としている。

例えば、インターネット上のWWWサーバーから検索を実行した場合、文字列の単純照合で符合したホームページを羅列して表示するので情報量が膨大になりすぎ、さらに絞り込みをかけて情報量を精査してゆかなければならず、情報精査の時間と検索の方法には技術が必要となるものであった。

また、インターネット上に公開されていないより質の高い情報を得たい場合、書籍雑誌新聞等の従来の紙媒体から情報検索するこの方法では、検索者索引などを手がかりとして本文の活字を目で追って行くという検索者の労力と時間を必要としている。

概要

デジタルデータの利点と従来の紙媒体の利点のみを併せ持ち、かつ利用者にとって、楽しく得して為になる情報を自動的に抽出して質の高い情報を利用者へ供給すること。また、取得した情報から要約書を生成し、利用者側の携帯端末及びコンピュータに対して要約書を迅速に送信する機能を提供すること。携帯端末または、利用者側コンピュータ、またはWWWサーバーから検索要求された文字列を、複数のWWWサーバーや、デジタル化した書籍データベースから同時検索を実行する。さらに、検索結果から楽しく得して為になる情報を自動抽出する。各項目ごとに類似する単語群集が予め登録されている。登録してある単語群が文章中に含まている場合は自動的に情報抽出する。そして、検索済情報から要約書を生成し、利用者側コンピュータや、携帯端末へ送信する。日常において質の高い情報を最小限の時間で取得可能となった。

目的

上記の従来の技術に絡み、本発明はデジタルデータの利点と従来の紙媒体の利点のみを併せ持ち、かつ利用者にとって「楽しい情報」や「得する情報」及び「為になる情報」を自動的に抽出して質の高い情報を利用者へ迅速に供給することにある。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

インターネット上のデジタル情報と、予めスキャナーで読み込んでイメージデータからOCR文字認識システム)を使用して文字認識させたデータをデータベース登録した書籍新聞雑誌等の情報を対象に、同時複数に対して検索する機能を持つことを特徴とする検索システム

請求項2

利用者にとって、「楽しい事」に類似する単語群、「得する事」に類似する単語群、「為になる事」に類似する単語群集が、予めデータベース登録されており、請求項1の検索機能により取得した情報の文節または、文章中に「楽しい情報単語」か「得する情報単語」か、または「為になる情報単語」が含まれているかを判断し、文節または文章中に含まれている場合は、項目ごとに自動抽出し、含まれていない場合は情報自体を破棄する機能を特徴とする情報処理技術。

請求項3

前記請求項1、及び請求項目2により取得抽出した情報を、自動的に要約処理を実行し、要約書を生成後に検索要求のあった利用者側の携帯端末コンピュータへ要約書を送信する機能と、要約書を基に自動的にスライド生成処理及びHTML出力、テキスト出力自動印刷機能を特徴とする情報処理技術。

技術分野

0001

本発明は、情報検索システムに関するものである。

背景技術

0002

従来の検索文字列を単純符合させて検索実行する技術では、日常において限られた人材、限られた時間、限られた情報源、限られた予算など様々な制約の中で、利用者にとって本当に欲しい情報や質の高い情報を最小限の時間で取得するには技術と労力を必要としている。

0003

例えば、インターネット上のWWWサーバーから検索を実行した場合、文字列の単純照合で符合したホームページを羅列して表示するので情報量が膨大になりすぎ、さらに絞り込みをかけて情報量を精査してゆかなければならず、情報精査の時間と検索の方法には技術が必要となるものであった。

0004

また、インターネット上に公開されていないより質の高い情報を得たい場合、書籍雑誌新聞等の従来の紙媒体から情報検索するこの方法では、検索者索引などを手がかりとして本文の活字を目で追って行くという検索者の労力と時間を必要としている。

発明が解決しようとする課題

0005

インターネット上のデジタルデータの利点とは、記録されている情報の加工のしやすさに加えて情報を迅速に取得することが可能であり、従来の紙媒体の情報は先達の叡智からより質の高い情報を得ることが可能である。

0006

上記の従来の技術に絡み、本発明はデジタルデータの利点と従来の紙媒体の利点のみを併せ持ち、かつ利用者にとって「楽しい情報」や「得する情報」及び「為になる情報」を自動的に抽出して質の高い情報を利用者へ迅速に供給することにある。

0007

また、取得した情報を要約処理し、要約書を生成後、利用者側の携帯端末及びコンピュータに対して検索結果と要約書を送信する機能を提供することにより、いつでも、どこでも、だれでも質の高い情報を迅速に得ることが可能となる。

課題を解決するための手段

0008

本発明は、前記のデジタルデータの利点と従来の紙媒体の利点を、利用者側へ迅速に供給する事を達成するために、まず検索したい書籍や雑誌、新聞などの紙媒体をスキャナーイメージデータ化し、OCR文字認識システム)で文字認識させ、デジタルデータ化したものをデータベース登録する。そして、前記データベースから情報検索するためのSQLクエリ文を検索対象データベースに予め登録する。また、インターネット上のWWWサーバーから検索したい場合は、WWWサーバーのCGIクエリ文を検索対象データベースに予め登録する。検索を実行すると、検索対象データベースを参照し、登録した書籍から検索する場合はSQLクエリ文を登録書籍データベース要求発行し、インターネット上のWWWサーバーから検索実行する場合はCGIクエリ文をWWWサーバーへ要求発行する。これによりインターネット上のWWWサーバーへの検索と登録した書籍データベースへの検索が同時に、また複数の対象に実行可能にしたものである。

0009

また、第2の解決手段とは、前記第1の解決手段によって取得した情報を、利用者にとって「楽しい情報」なのか「得する情報」なのか「為になる情報」なのかを自動的に抽出してふるい分けした質の高い情報を利用者へ迅速に送信可能にしたことにある。利用者にとって、「楽しい事」に類似する単語群、「得する事」に類似する単語群、「為になる事」に類似する単語群集を予めデータベースに登録する。第1解決手段で取得した情報の文節または文章中に、これらの単語が含まれているかを判断して、一定の単語量が含まれている場合はその情報を抽出して分別する。文節または文章中に一定の単語量が含まれていない場合は、情報自体を廃棄することにより、利用者にふるい分けした質の高い情報を供給することことが可能となった。

0010

第3の解決手段とは、前記第1の解決方法及び第2の解決方法により取得抽出した情報を、迅速に利用者側へ送信可能にしたことにある。取得抽出した情報を設定値の文字量内で自動的に要約処理を施し、要約書を自動生成する。生成した要約書を自動的にプリンタへ出力し、さらにスライド形式及びHTML形式テキスト形式としても出力可能。さらにその要約書を利用者側の携帯端末及びコンピュータに自動的に送信出来るようにしたものである。

発明の効果

0011

前記の解決手段により、いつでも、どこでも、だれでも質の高い情報を迅速に得られることを可能にしたものである。

発明の実施するための最良の形態

0012

本発明の実施形態を図1に基づいて説明する。また、図2〜3の実施例についても、図1との相関関係について併せて説明する。

0013

利用者にとって調べたい事柄があったとき、利用者側携帯端末1(図1)または、利用者側コンピュータ3(図1)を使用して検索文字列を検索サーバーブロック4(図1)へ対してメールで検索要求をかける。また、検索要求WWWサーバー2b(図1)からも検索要求が発生した場合も検索サーバーブロック4(図1)は検索要求を受け付ける。

0014

利用者側携帯端末1(図1)から検索要求を受け付けた場合は、A3(図2)においてメール本文から検索単語抽出処理を行い、検索実行するキーワード群をセットする。利用者側コンピュータ3(図1)の画面コンソール上から検索要求があった場合は、C3(図4)において検索単語抽出処理後にキーワード群をセットする。WWWサーバーから検索要求があった場合は、指定のページに含まれる文字列からB3(図3)の検索要求WWWサーバーから検索単語抽出処理を行い、検索キーワード群をセットする。

0015

検索サーバーブロック4(図1)は、利用者側携帯端末1(図1)及び利用者側コンピュータ3(図1)または検索要求WWWサーバー2b(図1)から受け付け、キーワードがセットされた文字列を検索要求実行部4a(図1)、A4(図2)、B4(図3)、C4(図4)に遷移し、検索実行に移す。

0016

検索要求実行部4a(図1)、A4(図2)、B4(図3)、C4(図4)は、6b(図1)の検索対象DBを参照して検索対象を登録順に実行に移す。登録されている書籍から検索を行う場合にはSQLクエリを6a(図1)の登録書籍DBに送信し、検索要求を発行する。また、インターネット上のWWWサーバー2a(図1)から検索を行う場合は、CGIクエリを送信し、検索要求を発行する。6b(図1)の検索対象DBには予め、オートドキュメントフィーダースキャナーブロック5(図1)からイメージデータ取込OCR処理部5a(図1)によって文字認識されたデータを登録している。

0017

6a(図1)の登録書籍DBと、2a(図1)のインターネット上のWWWサーバーから送信された検索結果を自動抽出処理部4b(図1)、A8(図2)、B8(図3)、C8(図4)が受け取る。自動抽出処理部は、6c(図1)の登録単語群DBに登録された単語群を参照し、検索結果の文章の文中に単語群が含まれているか判断し、その情報が利用者にとって「楽しい情報」なのか「得する情報」なのか「為になる情報」なのかを自動的に抽出する。6c(図1)の登録単語群DBには利用者にとって「楽しい事」に類似する単語群、「得する事」に関する単語群、「為になる事」に関する単語群が予め登録してある。利用者が設定した、一定の単語量以上が文節中、または文章中に含まれていれば各項目ごとに抽出し、含まれていない場合は検索結果自体を破棄する。これにより利用者にふるい分けした質の高い情報を供給することことができる。

0018

自動抽出処理部4b(図1)、A8(図2)、B8(図3)、C8(図4)の処理を通過した検索結果は、文字補正処理部4c(図1)、A9(図2)、B9(図3)、C9(図4)へ遷移する。自動抽出処理部は6d(図1)の文字補正DBを参照し、前述5a(図1)イメージデータ取込OCR処理部で処理しきれなかった誤認識文字補正する。6d(図1)の文字補正DBには予め、誤認識文字を補正する単語置換対応パターンが登録されている。

0019

検索結果を文字補正処理部で補正後、4d(図1)、A11(図2)、B11(図3)、C11(図4)の要約及び要約書自動生成処理へ遷移する。利用者が設定した文字総数以内に要約処理を行い、要約書を自動的に生成する。

0020

要約及び要約書自動生成処理終了後、検索記録を6e(図1)の検索ログDBに書き込み処理を行う。前述の一連の処理終了後、6e(図1)の要約書送信処理部へ遷移する。要約書送信処理部6e(図1)は、要約書を7(図1)、A12(図2)、B12(図3)、C12(図4)においてプリンタ出力する。また、要約書を自動的にスライド化して出力する場合8(図1)、A13(図2)、B13(図3)、C13(図4)の要約書スライド生成出力部において処理する。また、要約書をHTML/TEXT、ファイルに出力する場合9(図1)、10(図1)、A14(図2)、B14(図3)、C14(図4)において処理する。

0021

最後に、要約書及び検索結果を利用者に送信する処理に遷移する。検索結果が0件だった場合は、利用者側携帯端末1(図1)にメールで結果を送信する。利用者側コンピュータ3(図1)には画面コンソール上にて結果を表示する。検索結果が1件以上で最大取得件数を達成し、かつ要約書の生成処理が終了した場合は、要約書を利用者側携帯端末1(図1)にメールで送信し、利用者側コンピュータ3(図1)には画面コンソール上で表示し、閲覧が可能となる。

0022

前記、発明の発明を実施するための最良の形態及び、図2の実施例と図1の相関関係を参照。

0023

前記、発明の発明を実施するための最良の形態及び、図3の実施例と図1の相関関係を参照。

0024

前記、発明の発明を実施するための最良の形態及び、図4の実施例と図1の相関関係を参照。

図面の簡単な説明

0025

情報検索システム用装置のシステ厶ブロック図 実施例を説明するためのフローチャート1(携帯端末からの検索要求の場合) 実施例を説明するためのフローチャート2(検索要求WWWサーバーからの検索要求の場合) 実施例を説明するためのフローチャート3(利用者側コンピュータからの検索要求の場合)

符号の説明

0026

1利用者側携帯端末
2a検索対象WWWサーバー
2b検索要求WWWサーバー
3利用者側コンピュータ
4検索サーバーブロック
4a 検索要求実行部
4b自動抽出処理部
4c文字補正処理部
4d 要約及び要約書自動生成処理部
4e 要約書送信処理部
5オートドキュメントフィーダスキャナーブロック
5aイメージデータ取込OCR処理部
6 RDBブロック
6a登録書籍DB
6b 検索対象DB
6c登録単語群DB
6d 文字補正DB
6e検索ログDB
6f言語変換DB
7プリンタ出力
8スライド生成出力
9HTML/TEXT出力
10ファイル出力
A1 検索対象エントリー
A2 携帯端末からメールで検索要求発生?
A3メール本文から検索単語抽出処理部
A4 検索要求実行部
A5 検索対象は?
A6 登録書籍DB検索要求実行部
A7インターネット検索要求実行部
A8 自動抽出処理部
A9 文字補正処理部
A10検索結果件数は?
A11 要約及び要約書自動生成処理
A12 要約書プリンタ出力部
A13 要約書スライド生成出力部
A14 要約書HTML/TEXT出力部
A15 要約書メール送信
A16検索結果メール送信部
B1 検索対象エントリー
B2 検索要求WWWサーバーから検索要求発生?
B3 検索要求WWWサーバーから検索単語抽出処理部
B4 検索要求実行部
B5 検索対象は?
B6 登録書籍DB検索要求実行部
B7 インターネット検索要求実行部
B8 自動抽出処理部
B9 文字補正処理部
B10 検索結果件数は?
B11 要約及び要約書自動生成処理
B12 要約書プリンタ出力部
B13 要約書スライド生成出力部
B14 要約書HTML/TEXT出力部
B15 要約書メール送信部
B16 検索結果メール送信部
C1 検索対象エントリー
C2 利用者側コンピュータから検索要求発生?
C3 利用者側コンピュータからの検索単語抽出処理部
C4 検索要求実行部
C5 検索対象は?
C6 登録書籍DB検索要求実行部
C7 インターネット検索要求実行部
C8 自動抽出処理部
C9 文字補正処理部
C10 検索結果件数は?
C11 要約及び要約書自動生成処理
C12 要約書プリンタ出力部
C13 要約書スライド生成出力部
C14 要約書HTML/TEXT出力部
C15 要約書メール送信部
C16 検索結果メール送信部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社日立製作所の「 計算機システム及び文書の分類方法」が 公開されました。( 2021/03/18)

    【課題】文書の分類結果とともに、分類の根拠をユーザに提示する計算機システム及び文書の分類方法を提供する。【解決手段】計算機システムは、文書のデータの入力を受け付け、文書及び文書の要素を構成要素とする非... 詳細

  • 大日本印刷株式会社の「 画像処理装置及び画像検索方法」が 公開されました。( 2021/03/18)

    【課題】適切な画像を用いて顔検索を行い、検索対象人物が写っている画像を精度良く検索する。【解決手段】画像処理装置は、複数のイベントの販売画像を記憶する記憶部と、検索対象人物が写った検索用画像をユーザ端... 詳細

  • 株式会社NTTドコモの「 情報提供システム」が 公開されました。( 2021/03/18)

    【課題】ユーザによって用いられる蓋然性が高いキーワードを精度良く提供する情報提供システムを提供する。【解決手段】情報提供システムは、対象ユーザを含む複数の閲覧者が第1情報源から提供される第1コンテンツ... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ