図面 (/)

技術 検索装置、検索方法及びプログラム

出願人 株式会社リューシス
発明者 齋藤孝春
出願日 2010年7月23日 (9年11ヶ月経過) 出願番号 2010-166412
公開日 2012年2月9日 (8年4ヶ月経過) 公開番号 2012-027729
状態 拒絶査定
技術分野 検索装置
主要キーワード 特定ルーチン 記録媒体ドライブ装置 見出しデータ 論理位置 各辞書データ 派生語 活用形 表示画
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2012年2月9日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

課題

検索を効率化するための検索装置等を提供することである。

解決手段

外部記憶部3は、電子辞書辞書データ及びデータベース型辞書データの少なくともいずれかを記憶する。そして、制御部1は、入力部4を介して1個以上の検索候補を取得し、これらを検索キーとして、上述の辞書データ内の単語データのうち、第1の属性(たとえば「見出し語」という属性)を与えられている部分を検索し、検索キーを索出できたか否かを判別する。索出できていれば、索出されたデータを出力部5に表示させる。一方、索出できなかったと判別すると、当該本文データ及び単語データのうち、第2の属性(たとえば「訳語」という属性)を与えられている部分を検索し、索出できていれば、索出されたデータを出力部5に表示させる。

概要

背景

辞書などを構成する文字列を表すデータを検索する手法として、たとえば特許文献1及び特許文献2に示すような、見出し検索、例文検索全文検索の手法があった。
見出し検索は、検索される対象のデータが、その全体又は各部に、見出し語を表す見出しデータ対応付けられているというデータ構造をとるものとして、この見出しデータのうちから検索キー合致するものを索出するという手法である。
例文検索は、検索される対象の上述のデータが、上述の見出し語を用いた例文を表す部分を含んでいるものとして、この例文を表す部分のうちから検索キーに合致するものを索出するという手法である。
全文検索は、検索される対象の上述のデータ全体から検索キーに合致するものを索出するという手法である。

概要

検索を効率化するための検索装置等を提供することである。外部記憶部3は、電子辞書辞書データ及びデータベース型辞書データの少なくともいずれかを記憶する。そして、制御部1は、入力部4を介して1個以上の検索候補を取得し、これらを検索キーとして、上述の辞書データ内の単語データのうち、第1の属性(たとえば「見出し語」という属性)を与えられている部分を検索し、検索キーを索出できたか否かを判別する。索出できていれば、索出されたデータを出力部5に表示させる。一方、索出できなかったと判別すると、当該本文データ及び単語データのうち、第2の属性(たとえば「訳語」という属性)を与えられている部分を検索し、索出できていれば、索出されたデータを出力部5に表示させる。

目的

本発明は、上述の問題点に鑑みてなされたもので、検索を効率化するための検索装置、検索方法及びプログラムを提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

1個以上の辞書データを格納する記憶領域を有する外部の記憶装置アクセスして前記辞書データを検索する検索装置であって、各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データ論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、1個以上の検索候補を取得する検索候補取得手段と、前記検索候補取得手段が取得した各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第1の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第1検索手段と、前記第1検索手段が部分データを索出できたか否かを判別する第1判別手段と、前記部分データを索出できなかったと前記第1判別手段が判別したことに応答して、各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第2の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第2検索手段と、を備える検索装置。

請求項2

前記第2検索手段が部分データを索出できたか否かを判別する第2判別手段と、前記部分データを索出できなかったと前記第2判別手段が判別したことに応答して、各前記検索候補に所定の変換を施す検索候補変換手段と、を更に備え、前記第1検索手段は、前記検索候補変換手段が前記検索候補に所定の変換を施したことに応答し、前記検索候補変換手段により変換された各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第1の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する、請求項1に記載の検索装置。

請求項3

前記第1検索手段及び前記第2検索手段が索出した部分データを出力する出力手段を更に備え、前記出力手段は、前記第1検索手段及び/又は前記第2検索手段が索出した部分データが所定の条件に合致するか否かを判別し、合致しないと判別した部分データの出力を省略する、請求項1又は2に記載の検索装置。

請求項4

1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索する検索装置であって、各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、検索候補の集合を表すデータを取得し、当該データに基づいて前記検索候補を特定する検索候補特定手段と、前記検索候補特定手段が特定したそれぞれの前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の属性を指定されている部分データを検索し、各該検索キーのうちいずれか1個以上に合致する部分を含む部分データを索出する検索手段と、を備える検索装置。

請求項5

前記検索手段が索出した部分データを出力する出力手段を更に備え、前記出力手段は、前記検索手段が索出したそれぞれの部分データにつき、当該部分データに含まれている前記検索候補の種類数又は個数所定条件に達しているか否かを判別する手段を備えており、当該所定条件に達していないと判別した部分データのうち、所定の個数を超える分の出力を省略する、請求項4に記載の検索装置。

請求項6

前記検索候補特定手段は、検索候補の集合を表す前記データが表す所定の制御情報を取得し、取得した当該制御情報が指定する規則に従って前記検索候補を特定する、請求項4又は5に記載の検索装置。

請求項7

前記検索候補特定手段は、検索候補の集合を表す前記データが表す所定の検索対象指定情報を取得し、前記検索手段は、前記検索候補特定手段が特定したそれぞれの前記検索候補につき、前記検索候補特定手段が取得した前記検索対象指定情報によって、当該検索候補を検索キーとする検索を行う対象として指定されている辞書データのみを検索する、請求項4乃至6のいずれか1項に記載の検索装置。

請求項8

1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索する検索方法であって、各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、1個以上の検索候補を取得する検索候補取得ステップと、前記検索候補取得ステップで取得した各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第1の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第1検索ステップと、前記第1検索ステップで部分データを索出できたか否かを判別する判別ステップと、前記部分データを索出できなかったと前記判別ステップ判別したことに応答して、各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第2の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第2検索ステップと、より構成される検索方法。

請求項9

1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索する検索方法であって、各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、検索候補の集合を表すデータを取得し、当該データに基づいて前記検索候補を特定する検索候補特定ステップと、前記検索候補特定ステップで特定したそれぞれの前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の属性を指定されている部分データを検索し、各該検索キーのうちいずれか1個以上に合致する部分を含む部分データを索出する検索ステップと、より構成される検索方法。

請求項10

コンピュータに、1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索させるためのプログラムであって、各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、前記コンピュータを、1個以上の検索候補を取得する検索候補取得手段と、前記検索候補取得手段が取得した各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第1の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第1検索手段と、前記第1検索手段が部分データを索出できたか否かを判別する第1判別手段と、前記部分データを索出できなかったと前記第1判別手段が判別したことに応答して、各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第2の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第2検索手段と、して機能させるプログラム。

請求項11

コンピュータに、1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索させるためのプログラムであって、各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、前記コンピュータを、検索候補の集合を表すデータを取得し、当該データに基づいて前記検索候補を特定する検索候補特定手段と、前記検索候補特定手段が特定したそれぞれの前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の属性を指定されている部分データを検索し、各該検索キーのうちいずれか1個以上に合致する部分を含む部分データを索出する検索手段と、して機能させるプログラム。

技術分野

0001

本発明は、検索装置及び検索方法に関する。

背景技術

0002

辞書などを構成する文字列を表すデータを検索する手法として、たとえば特許文献1及び特許文献2に示すような、見出し検索、例文検索全文検索の手法があった。
見出し検索は、検索される対象のデータが、その全体又は各部に、見出し語を表す見出しデータ対応付けられているというデータ構造をとるものとして、この見出しデータのうちから検索キー合致するものを索出するという手法である。
例文検索は、検索される対象の上述のデータが、上述の見出し語を用いた例文を表す部分を含んでいるものとして、この例文を表す部分のうちから検索キーに合致するものを索出するという手法である。
全文検索は、検索される対象の上述のデータ全体から検索キーに合致するものを索出するという手法である。

先行技術

0003

特開2006−215636号公報
特開2008−176349号公報

発明が解決しようとする課題

0004

しかしながら、見出し検索、例文検索、全文検索の手法を単純に並列して用いた場合、ユーザーは、所望の検索結果を得やすい手法を自ら経験的に選択するなどする必要があり、検索が非効率的になっていた。

0005

本発明は、上述の問題点に鑑みてなされたもので、検索を効率化するための検索装置、検索方法及びプログラムを提供することを目的とする。

課題を解決するための手段

0006

上記目的を達成するため、本発明の第1の観点に係る検索装置は、
1個以上の辞書データを格納する記憶領域を有する外部の記憶装置アクセスして前記辞書データを検索する検索装置であって、
各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データ論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、
1個以上の検索候補を取得する検索候補取得手段と、
前記検索候補取得手段が取得した各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第1の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第1検索手段と、
前記第1検索手段が部分データを索出できたか否かを判別する第1判別手段と、
前記部分データを索出できなかったと前記第1判別手段が判別したことに応答して、各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第2の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第2検索手段と、
を備える。

0007

前記検索装置は、
前記第2検索手段が部分データを索出できたか否かを判別する第2判別手段と、
前記部分データを索出できなかったと前記第2判別手段が判別したことに応答して、各前記検索候補に所定の変換を施す検索候補変換手段と、を更に備えてもよく、
前記第1検索手段は、
前記検索候補変換手段が前記検索候補に所定の変換を施したことに応答し、前記検索候補変換手段により変換された各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第1の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出するものであってもよい。

0008

前記検索装置は、前記第1検索手段及び前記第2検索手段が索出した部分データを出力する出力手段を更に備えてもよく、
前記出力手段は、前記第1検索手段及び/又は前記第2検索手段が索出した部分データが所定の条件に合致するか否かを判別し、合致しないと判別した部分データの出力を省略するものであってもよい。

0009

また、本発明の第2の観点に係る検索装置は、
1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索する検索装置であって、
各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、
検索候補の集合を表すデータを取得し、当該データに基づいて前記検索候補を特定する検索候補特定手段と、
前記検索候補特定手段が特定したそれぞれの前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の属性を指定されている部分データを検索し、各該検索キーのうちいずれか1個以上に合致する部分を含む部分データを索出する検索手段と、
を備える。

0010

前記検索装置は、前記検索手段が索出した部分データを出力する出力手段を更に備えてもよく、
前記出力手段は、
前記検索手段が索出したそれぞれの部分データにつき、当該部分データに含まれている前記検索候補の種類数又は個数所定条件に達しているか否かを判別する手段を備えていてもよく、
当該所定条件に達していないと判別した部分データのうち、所定の個数を超える分の出力を省略するものであってもよい。

0011

前記検索候補特定手段は、検索候補の集合を表す前記データが表す所定の制御情報を取得し、取得した当該制御情報が指定する規則に従って前記検索候補を特定するものであってもよい。

0012

前記検索候補特定手段は、検索候補の集合を表す前記データが表す所定の検索対象指定情報を取得するものであってもよく、
前記検索手段は、前記検索候補特定手段が特定したそれぞれの前記検索候補につき、前記検索候補特定手段が取得した前記検索対象指定情報によって、当該検索候補を検索キーとする検索を行う対象として指定されている辞書データのみを検索するものであってもよい。

0013

また、本発明の第3の観点に係る検索方法は、
1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索する検索方法であって、
各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、
1個以上の検索候補を取得する検索候補取得ステップと、
前記検索候補取得ステップで取得した各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第1の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第1検索ステップと、
前記第1検索ステップで部分データを索出できたか否かを判別する判別ステップと、
前記部分データを索出できなかったと前記判別ステップ判別したことに応答して、各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第2の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第2検索ステップと、
より構成される。

0014

また、本発明の第4の観点に係る検索方法は、
1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索する検索方法であって、
各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、
検索候補の集合を表すデータを取得し、当該データに基づいて前記検索候補を特定する検索候補特定ステップと、
前記検索候補特定ステップで特定したそれぞれの前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の属性を指定されている部分データを検索し、各該検索キーのうちいずれか1個以上に合致する部分を含む部分データを索出する検索ステップと、
より構成される。

0015

また、本発明の第5の観点に係るプログラムは、
コンピュータに、1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索させるためのプログラムであって、
各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、
前記コンピュータを、
1個以上の検索候補を取得する検索候補取得手段と、
前記検索候補取得手段が取得した各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第1の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第1検索手段と、
前記第1検索手段が部分データを索出できたか否かを判別する第1判別手段と、
前記部分データを索出できなかったと前記第1判別手段が判別したことに応答して、各前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の第2の属性を指定されている部分データを検索し、各該検索キーに合致する部分を含む部分データを索出する第2検索手段と、
して機能させる。

0016

また、本発明の第6の観点に係るプログラムは、
コンピュータに、1個以上の辞書データを格納する記憶領域を有する外部の記憶装置にアクセスして前記辞書データを検索させるためのプログラムであって、
各前記辞書データはそれぞれ、本文データと、当該本文データを構成する部分データの論理位置及び属性を指定する属性データとを含んだ電子辞書型辞書データ、又は、見出しデータと、当該見出しデータに対応付けられている単位データとを含み、当該単位データが、当該単位データを構成する部分データの属性を指定する属性データを含んでいるデータベース型辞書データより構成されており、
前記コンピュータを、
検索候補の集合を表すデータを取得し、当該データに基づいて前記検索候補を特定する検索候補特定手段と、
前記検索候補特定手段が特定したそれぞれの前記検索候補を検索キーとして、前記本文データ及び前記単位データのうち、前記属性データによって所定の属性を指定されている部分データを検索し、各該検索キーのうちいずれか1個以上に合致する部分を含む部分データを索出する検索手段と、
して機能させる。

発明の効果

0017

本発明によれば、検索を効率化するための検索装置、検索方法及びプログラムが実現される。

図面の簡単な説明

0018

本発明の実施の形態に係る検索システムの構成を示す図である。
データベース型の辞書データのデータ構造を説明する図である。
データベース型の辞書データの内容を例示する図である。
電子書籍型の辞書データのデータ構造を説明する図である。
電子書籍型の辞書データの内容を例示する図である。
検索システムが検索候補を取得する処理を示すフローチャートである。
検索システムが1個の検索キーを用いて検索を行う処理を示すフローチャートである。
検索システムが複数個の検索キーを用いて検索を行う処理を示すフローチャートである。

実施例

0019

以下、本発明の実施の形態を、検索システムを例として、図面を参照しつつ説明する。
この検索システムSは、たとえば図1に示すように、制御部1と、主記憶部2と、外部記憶部3と、入力部4と、出力部5とより構成されている。主記憶部2、外部記憶部3、入力部4及び出力部5は、いずれも制御部1に接続されている。

0020

制御部1は、たとえばCPU(Central Processing Unit)等のプロセッサより構成されており、たとえば、外部記憶部3が記憶するプログラムを読み出して実行することにより、後述する処理を行う。

0021

主記憶部2は、たとえばRAM(Random Access Memory)等のメモリより構成されており、制御部1のワークエリアとなる記憶領域を提供する。

0022

外部記憶部3は、たとえばハードディスク装置等の記憶装置より構成されており、たとえば上述のプログラムを記憶し、更に、検索対象である1個以上の辞書データを記憶する。外部記憶部3は、制御部1が供給する指示に従って、自己の記憶領域に格納されているこれらのプログラム及びデータを読み出して制御部1に供給し、また、制御部1が供給する指示に従って、当該記憶領域に、制御部1より供給されたデータを記憶する。

0023

入力部4は、たとえばキーボードマウス等を備えており、また、たとえばUSB(Universal Serial Bus)等のインターフェース回路を備えている。入力部4は、ユーザー等の操作に従ったデータを表す信号を制御部1に供給する。

0024

出力部5は、たとえば液晶ディスプレイ等より構成されており、制御部1が供給するデータが表す画像を自己の表示画面上に表示する。

0025

次に、辞書データのデータ構造を説明する。検索システムSによる検索の対象となる各辞書データは、いずれも「データベース型」のデータ構造をとるものとする。

0026

データベース型の辞書データは、たとえば図2及び図3に示すように、見出しデータと、単語データとを、両者が1対1に対応付けられる形で含んでいる。

0027

データベース型の辞書データに含まれる見出しデータは、たとえば辞書の見出し語に相当する文字列を表すデータ(ないしは「見出し語」の属性を与えられているデータ)より構成される。
なお、図3は、辞書データを構成する単語データ全部からなる集合が、見出し語の数がn(nは自然数)である1冊の英和辞典の全文をなす場合において、見出しデータが、見出し語"improve"を表すものである場合を模式的に例示している。

0028

単語データは、たとえば見出しデータが辞書の見出し語に相当する文字列を表すデータからなる場合、当該見出し語の意味を説明する文字列(たとえば、辞書データが英和辞典をなすものであれば、見出し語である英語和訳である日本語、等)、当該見出し語を用いた例文をなす文字列、当該見出し語の活用形ないし派生語を示す文字列などを表すデータより構成されている。
なお、図3は、k番目(kはn以下の自然数)の見出しデータが上述の英和辞典のひとつの見出し語"improve"を表すものであるとして、単語データが、見出し語"improve"の和訳、品詞区分を示す記号、見出し語"improve"を用いた英文の文例、見出し語"improve"から派生した派生語"improvable"、"improvably"及び"improbability"及びこれらの派生語それぞれの和訳、を表す各データを含んでいる場合を模式的に例示するものである。

0029

単語データは更に1個以上の部分に細分化されており、個々の部分には、当該部分の属性を示す(ないしは、当該部分に属性を付与する)データが付されている。ただし、1個の単語データはその全体が1個の単位をなすものであり、従来より行われている全文検索の処理においては、1個の全文として識別される対象は1個の単語データの全体である。

0030

単語データをいかなる観点に基づいてどのように細分化するか、また、細分化された個々の部分にいかなる属性を与えるか、はいずれも任意であり、たとえば、当該単語データを含む辞書データの作成者があらかじめ任意に設定すればよい。
たとえば、単語データが見出し語の意味を説明する文字列、当該見出し語を用いた例文をなす文字列、当該見出し語の活用形ないし派生語を説明する文字列を表すデータより構成されている場合、当該単語データは、見出し語の意味を説明する文字列を表す部分と、個々の例文をなす文字列を表す部分と、当該見出し語の個々の活用形ないし派生語を示す文字列を表す部分とに細分化されていればよい。そして、たとえば見出し語の意味を説明する文字列を表す部分には「意味」という属性を示すデータが付され、例文をなす文字列を表す部分には「例文」という属性を示すデータが付され、個々の活用形ないし派生語を説明する文字列を表す部分には「派生語」という属性を示すデータが付されていればよい。

0031

また、個々の部分は、当該部分の見出し語となる副見出しを表すデータを含んでいてもよい。具体的には、たとえば「派生語」の属性を付された文字列を表す部分は、当該文字列が説明している活用形ないし派生語そのものである文字列を副見出しとして表すデータを含んでいてもよい。そして、副見出しを表すデータには、たとえば「副見出し」という属性を示すデータが付されていればよい。

0032

なお、図3は、k番目の見出しデータに対応付けられた単語データが、上述したように見出し語"improve"の和訳、品詞の区分を示す記号、見出し語"improve"を用いた英文の文例、見出し語"improve"の派生語及びその和訳、を表す各データを含んでいるとして、見出し語"improve"の和訳に「訳語」という属性を示すデータ、品詞の区分を示す記号に「品詞区分」という属性を示すデータ、見出し語"improve"を用いた英文の文例に「例文」という属性を示すデータ、見出し語"improve"の派生語に「副見出し」という属性を示すデータ、派生語の和訳に「訳語」という属性を示すデータ、がそれぞれ付されている場合を模式的に例示するものである。

0033

なお、辞書データのデータ構造としては、以下説明する「電子書籍型」と呼ばれるものも知られている。しかし以下では、断りのない限り、この検索システムSはもっぱらデータベース型の辞書データを検索の対象とするものとして説明する。

0034

電子書籍型の辞書データは、たとえば図4及び図5に示すように、1個の本文データと、当該本文データの所定の各部分に1対1に対応付けられる複数の見出しデータとを含んでいる。

0035

本文データは、たとえば辞書の全文に相当する文字列を表すデータより構成されている。本文データは、データベース型の辞書データにおける単語データの集合とは異なり、単語毎に異なるデータとして構成されているわけではない。このため、従来より行われている全文検索の処理においては、制御部1により1個の全文として識別される対象は本文データ全体となる。

0036

電子書籍型の辞書データにおける見出しデータは、たとえば、本文データに含まれる特定の部分を占めるデータ(以下、指示対象部分と呼ぶ)の論理位置を指示するデータ(ポインタ)と、当該指示対象部分の属性を示す(ないしは、当該指示対象部分に属性を付与する)データとより構成されている。
電子書籍型の辞書データにおける本文データのどの部分を指示対象部分として特定するか、また、それぞれの指示対象部分にどのような属性を与えるか、はいずれも任意であり、たとえば、当該辞書データの作成者があらかじめ任意に設定すればよい。

0037

なお、図5は、本文データの内容が、図3の辞書データにおける単語データ全部からなる集合の内容と同一の1冊の英和辞典の全文をなす場合において、K番目(Kは自然数)の見出しデータが、K番目の指示対象部分である見出し語"improve"の論理位置を表すものである場合を模式的に例示している。
図5に示す本文データ内には、K番目の指示対象部分である、見出し語"improve"を表すデータに続き、(K+20)番目の指示対象部分に至るまで、見出し語"improve"の和訳、品詞の区分を示す記号、見出し語"improve"を用いた英文の文例、見出し語"improve"派生語及びその和訳、を表す各データが連続して含まれており、これらが合計20個の指示対象部分をなしている(ただし、K+20はN以下の整数)。そして、見出し語"improve"の和訳に「訳語」という属性を示すデータ、品詞の区分を示す記号に「品詞区分」という属性を示すデータ、見出し語"improve"を用いた英文の文例に「例文」という属性を示すデータ、見出し語"improve"の派生語に「副見出し」という属性を示すデータ、派生語の和訳に「訳語」という属性を示すデータ、がそれぞれ対応付けられている。

0038

次に、この検索システムSの動作を説明する。
図6は、検索システムSが検索候補を取得する処理を示すフローチャートである。
図7は、検索システムSが1個の検索キーを用いて検索を行う処理を示すフローチャートである。
図8は、検索システムSが複数個の検索キーを用いて検索を行う処理を示すフローチャートである。

0039

(検索候補の取得)
制御部1が、外部記憶部3からプログラムを読み出して実行すると、まず、制御部1は、検索候補の入力を促す画像を出力部5に表示させる(図6、ステップS001。すなわち、そのような画像を表す画像データを生成して出力部5に供給する)。ユーザー等が入力部4を操作して、検索候補を表すデータを入力部4から制御部1へと供給させると、制御部1はこのデータを取得する(ステップS002)。

0040

検索候補を表すデータを取得すると、制御部1は、このデータが1個の検索候補を表すものか否かを判別し(ステップS003)、このデータが1個の検索候補を表すものであると判別すると、図7に示すステップS101へと処理を進める。一方、そうではない(すなわち、複数個の検索候補を表すものである)と判別すると、図8に示すステップS201へと処理を進める。

0041

ステップS003における判別は、たとえば、このデータ全体が1個の語句を表すものとして、当該語句を検索キーとして、外部記憶部3が記憶する各辞書データの見出し語を検索し、該当する見出し語が索出されたか否かを判別することにより行えばよい。見出し語の検索は、具体的には、各辞書データの見出しデータを検索することにより行えばよい。

0042

(1個の検索キーによる検索)
ステップS002で取得したデータが1個の検索候補を表すものであると判別して、ステップS101に処理を進めると、制御部1は、この検索候補を検索キーとして、外部記憶部3が記憶する各辞書データの見出し語を検索する。もっとも、ステップS003における判別を行うために上述の見出し語の検索を既に行っている場合は、この検索を重ねて行う必要はない。

0043

制御部1は次に、検索キーに合致する見出し語がステップS101(又はステップS003)で索出されたか否かを判別し(ステップS102)、索出されたと判別すると、各辞書データ内で該当する見出し語に対応付けられているデータを読み出し、読み出したデータを出力部4に表示させ(ステップS103)、処理をステップS104に進める。一方、索出されなかったと判別すると、ステップS103の処理を経ず直ちにステップS104へと処理を進める。ステップS103で制御部1が読み出す部分は、たとえば索出された見出し語を表す見出しデータに対応付けられている単語データ全体である。

0044

ステップS104で制御部1は、ステップS003で特定した検索候補を検索キーとして、外部記憶部3が記憶する各辞書データのうち、「訳語」の属性を与えられた部分を検索する。そして制御部1は、検索キーに合致する語が索出されたか否かを判別する(ステップS105)。

0045

検索キーに合致する語が「訳語」の属性を与えられた部分から索出されたとステップS105で判別すると、制御部1は、各辞書データ内で該当する部分に相当するデータを読み出し、読み出したデータを出力部4に表示させ(ステップS106)、処理をステップS107に進める。一方、索出されなかったと判別すると、ステップS106の処理を経ず直ちにステップS107へと処理を進める。なお、属性の名称をXとしたとき、属性「X」を与えられた部分に相当するデータとは、たとえば索出された語を含み、属性「X」を与えられた、単語データ内で連続する論理位置を占める部分である。

0046

ステップS107で制御部1は、ステップS003で特定した検索候補を検索キーとして、外部記憶部3が記憶する各辞書データのうち、「例文」の属性を与えられた部分を検索する。そして制御部1は、検索キーに合致する語が索出されたか否かを判別する(ステップS108)。索出されたと判別すれば、各辞書データ内で該当する部分に相当するデータを読み出し、読み出したデータを出力部4に表示させ(ステップS109)、処理をステップS110に進める。一方、索出されなかったと判別すると、ステップS109の処理を経ず直ちにステップS110へと処理を進める。

0047

(1個の検索キーの検索:原型を特定して行う検索)
ステップS110で制御部1は、原形特定ルーチンを実行して、ステップS002で取得した検索候補の原形にあたる語を特定する。そして、ステップS110で特定された語を検索キーとして、ステップS101〜S109までの処理と実質的に同一の処理を行う(ステップS111)。
ステップS111の処理の結果、ステップS002で取得した検索候補の原形にあたる語が各辞書データ内の見出し語に合致していれば、該当する見出し語に対応付けられている部分が出力部4により表示され、更に、合致する語が「訳語」あるいは「例文」の属性を与えられた部分に含まれていれば、該当する部分も表示される。

0048

なお、検索候補の原形とは、たとえば検索候補の本来の語形として想定される語形をいい、具体的には、たとえば検索候補が英語の動詞であるとみた場合における不定詞型に相当する語形であってもよいし、検索候補が英語の形容詞の比較級ないし最上級であるとみた場合における原級に相当する語形であってもよいし、検索候補がタイプミスを含んだ単語であるとみた場合の正しい綴りに相当する語形であってもよい。

0049

そして原形特定ルーチンは、具体的には、たとえば、検索候補を表すデータと当該検索候補の原形を表すデータとを対応付けて記憶する原形変換テーブルを、検索候補を検索キーとして検索することにより、検索キーである検索候補の原形を特定する、という処理であればよい。この場合、原形変換テーブルは、たとえば外部記憶部3があらかじめ記憶していればよい。

0050

あるいは、原形特定ルーチンは、規則活用をする品詞のように、活用した語形から一定の規則に従って原形を導くことができるという関係を利用するものであってもよい。具体的には、たとえば制御部1はまず、検索候補が規則活用をする品詞の活用形であるか否かを、単語のリスト(このリストも、たとえば外部記憶部3があらかじめ記憶していればよい)を参照するなどして判別し、規則活用をする品詞の活用形であると判別したときは、当該品詞について当てはまる所定の規則に従って検索候補を変形することにより原型を特定し、規則活用をする品詞の活用形ではないと判別したときは、上述の原形変換テーブルを用いた処理を行うようにしてもよい。

0051

(複数個の検索キーによる検索)
次に、検索候補が複数である場合について説明する。ステップS002で取得したデータが複数個の検索候補を表すものであると判別して、ステップS201に処理を進めると、制御部1は、ステップS002で取得したデータを、それぞれが1個の検索候補を表す複数の部分へと分解する。

0052

制御部1がステップS201でデータを分解して複数の検索候補を得るために行う処理の内容は任意である。従って、たとえばステップS002で取得したデータが、英語など、空白により単語間を区切る形で表記される言語を表すものである場合は、当該データが表す文字列(全体文字列)内に含まれる、空白を表す所定の空白文字を特定し、全体文字列の端又は特定された空白文字に挟まれた、連続する部分文字列を、1個の検索候補として特定するようにすればよい。
なお、1個の検索候補内に空白文字が含まれていても差し支えない(従って、必ずしも1個の検索候補が1個の単語を表すものである必要はない)。このように、空白文字が含まれた検索候補は、当該空白文字により区切られた複数の単語からなる成句等を検索するための検索候補として用い得る。

0053

一方、たとえばステップS002で取得したデータが、日本語あるいは中国語など、空白により単語間を区切る表記が通常行われない言語を表すものである場合、ステップS201で制御部1は、ステップS002で取得したデータが表す全体文字列を、その先頭から所定文字数毎に区切って得られる複数の部分文字列へと分解する処理を行えばよい。
あるいは、外部記憶部3が記憶する各辞書データの各見出し語を検索キーとして、ステップS002で取得したデータが表す全体文字列を検索するなどして、この全体文字列のうち、いずれかの見出し語に合致する部分を特定し、特定された部分とその他の部分とにこの全体文字列を分解する処理を行うようにしてもよい。
なお、空白により単語間を区切る表記が行われていない言語を表す全体文字列から検索候補を得る場合であっても、1個の検索候補が必ずしも1個の単語を表すものである必要がないのは同様である。

0054

制御部1がステップS201の処理を終えると、この検索システムSは、分解により得られた各語が検索候補であるものとして、それぞれの検索候補につき、ステップS101〜S111の処理と実質的に同一の処理を行う(ステップS202〜S212)。

0055

ただし、ステップS102に相当するステップS203で制御部1は、検索キーとした各検索候補に合致する見出し語がすべて索出されたか否かを判別し、すべて索出されたと判別したときはステップS204(ステップS103に相当)に処理を進め、いずれかが索出されていないと判別すると、ステップS205(ステップS204に相当)へと処理を進める。
同様に、ステップS206(ステップS105に相当)で制御部1は、検索キーとした各検索候補が「訳語」の属性を与えられた部分からすべて索出されたか否かを判別し、すべて索出されたと判別したときはステップS207(ステップS106に相当)に処理を進め、いずれかが索出されていないと判別すると、ステップS208(ステップS107に相当)へと処理を進める。また、ステップS209(ステップS108に相当)では、検索キーとした各検索候補が「例文」の属性を与えられた部分からすべて索出されたか否かを判別し、すべて索出されたと判別したときはステップS210(ステップS109に相当)に処理を進め、いずれかが索出されていないと判別すると、ステップS211(ステップS110に相当)へと処理を進める。
ステップS111に相当するステップS212の処理でも、制御部1は、ステップS102、S105及びS108の各処理に代えて、ステップS201で得られた各検索候補の原形にあたる語が検索キーであるものとしてそれぞれステップS203、S206及びS209の処理を行うものとする。

0056

また、ステップS103、S106及びS109に相当するステップS204、S207及びS210では、制御部1は、たとえば出力部5に表示させる対象であるデータの個数が所定量を超えるか否かを判別し、超えると判別したときは、当該所定量を超える個数分のデータを読み出して出力部5に表示させる処理を省略する。ステップS212で行う、ステップS204、S207及びS210に相当する処理においても同様である。
出力部5に表示させる対象であるデータの個数とは、具体的には、ステップS204では、いずれかの検索候補が索出された見出し語に対応付けられた部分の総個数であり、ステップS207では、「訳語」の属性を与えられた部分のうちいずれかの検索候補が索出された部分に相当するデータの総個数であり、ステップS210では、「例文」の属性を与えられた部分のうちいずれかの検索候補が索出された部分に相当するデータの総個数である。

0057

ただし、制御部1は、出力部5に表示させる対象であるデータ1個にすべての検索候補が含まれているか否かも判別し、すべての検索候補が含まれていると判別されたデータについては、これを読み出して表示させる処理を省略せず実行するようにしてもよい。

0058

なお、読み出し及び表示を省略する対象となるデータを選別する手法及び基準はいずれも任意であり、たとえば制御部1は、索出された語の個数が当該所定量に達した時点で検索の処理を打ち切ることにより、この時点以後も検索を続けていれば表示対象として特定されるはずであったデータの読み出し及び表示を省略する、という手法をとってもよい。

0059

この検索システムSがステップS212の処理を終えると、制御部1は、ステップS202〜S212の処理で、すべての検索候補について出力部5に表示させる対象となるデータを索出できたか否かを判別する(ステップS213)。そして、索出できた判別したときは処理を終了し、索出なかったと判別すると、処理をステップS201に戻す。

0060

ただし、ステップS213から戻ってステップS201の処理を再度行う場合、制御部1は、前回にステップS201で行った処理とは異なる態様でデータの分解を行う。
具体的には、たとえばステップS201で前回、ステップS002で取得したデータが表す全体文字列を、その末尾のa個(aは自然数)の文字からなる部分と、それ以外の部分とに分解する処理を行った場合、ステップS201の処理を再度行う際は、検索候補が表す文字列を、その末尾の(a+1)個の文字からなる部分と、それ以外の部分とに分解する処理を行うようにしてもよい。
あるいは、たとえばステップS201で前回、ステップS002で取得したデータが表す全体文字列を、辞書データのいずれかの見出し語に合致する部分とその他の部分とに分解する処理を行っていた場合、ステップS201の処理を再度行う際は、この全体文字列を、当該辞書データが表す文例に含まれるいずれかの語に合致する部分とその他の部分とに分解する処理を行うものとしてもよい。

0061

以上説明した処理を行うことにより、この検索システムSは、ユーザー等が入力部3を操作して入力した検索候補又はその原形にあたる語を検索キーとして、外部記憶部3が記憶するデータベース型の辞書データを検索し、この検索キーを含む見出し語、訳語あるいは例文があれば、これらを特定して表示する。
検索候補が複数入力された場合は、これらの検索候補のすべて、又はこれらの検索候補の原形にあたる語のすべてを含んだ見出し語、訳語あるいは例文があれば、これらを特定して表示する。更に、これらの検索候補又はその原形にあたる語のいずれかを含んでいる見出し語、訳語あるいは例文があれば、これらも特定し、所定数を上限としてこれらも表示する。

0062

検索候補が複数入力される場合の典型例は、たとえば、複数の語句を含んだ文章がそのまま検索候補を表すものとして入力される場合である。この場合、この検索システムSは、この文章をまとめて検索候補の集合として扱い、この文章に含まれる各語句のいずれかを含んだ見出し語、訳語あるいは例文を表示することになる。また、これらの語句をすべて含んだ見出し語、訳語あるいは例文については、優先的な表示を行うことも可能である。
文章をなすようにして入力された検索候補がフレーズ)をなしている場合、この句は成句を構成していたり、あるいは当該成句を含んだ表現をなしていたりする可能性が高い。従って、そのような句からなる検索候補を含む見出し語、訳語あるいは例文を表示すれば、成句を含んだ検索結果が優先的に表示されることになり、ユーザーが潜在的に求めている知識が的確に提示され、検索の効率が向上し得ることとなる。

0063

一方、辞書データを検索する手法として、従来より行われている全文検索の手法を用いた場合、たとえば以下述べる問題がある。本実施形態の検索システムSは、このような問題による非効率を軽減するものである。

0064

すなわち、複数の語を検索キーとして辞書データを全文検索する場合、この辞書データが電子書籍型であると、これらの語をすべて含む単位を辞書データから抽出するという処理ができない。電子書籍型の辞書データの場合、検索の対象とできるデータの全文を1個の本文データが包含しており、全文が唯一の単位をなしていて、これより小さな単位が存在しないから、「全文」という単位より小さな単位へと絞り込む処理ができないからである。
一方、辞書データがデータベース型の場合は、この辞書データを全文検索する場合、個々の単語データが全文であるとして検索を行うことが可能である。しかしたとえば、単語データに見出し語を用いた例文が含まれているものとして、検索キーとなる複数の語が共に含まれる例文を索出しようとして単語データに対して全文検索を行った場合、1個の例文に検索キーがすべて含まれていなくても、1個の単語データ内にすべての検索キーが含まれていれば、この単語データは索出されてしまうことになる。このような単語データは索出されてもユーザーの要求を満たすものではないから、検索の効率が極めて悪くなる。

0065

これに対し、本実施形態の検索システムSは、データベース型の辞書データの単語データを更に細分化して捉え、単語データ内で特定の属性を与えられている語を単位として検索を行うので、検索キーとなる複数の語が共に含まれる例文を索出しようとした場合に、検索キーをすべて含んではいない例文が、この例文を表すデータが属する単語データ内にすべての検索キーが含まれているという原因により誤って索出されてしまう、という現象が回避される。

0066

なお、上記実施形態に係る検索システムSの構成は上述のものに限られない。
たとえば、入力部4は、音声を入力して、当該音声が表す語句を表すデータを生成して、検索候補を表すデータとして制御部1へと供給する音声認識装置や、画像を入力して、当該画像が表す語句を表すデータを生成して、検索候補を表すデータとして制御部1へと供給する画像認識装置を備えていてもよい。この場合、当該音声あるいは当該画像が表す語句を表すデータを生成する機能を、制御部1を構成するプロセッサ等が分担してもよい。

0067

辞書データ、及びその他制御部1がプログラムを実行する過程で参照するデータは、ネットワーク等を介して制御部1に接続された外部の記憶装置が記憶していてもよい。
また、制御部1は、入力部4を構成するインターフェース回路を介して外部よりこれらのデータを取得し、外部記憶部3の記憶領域に格納するようにしてもよい。あるいは、入力部4が、CD−ROM(Compact Disk Read-Only Memory)、DVD(Digital Versatile Disk)あるいはその他のコンピュータ読み取り可能な記録媒体からデータを読み取って制御部1に供給する記録媒体ドライブ装置を備えるものとして、制御部1が、供給されたこれらのデータを外部記憶部3の記憶領域に格納するようにしてもよい。

0068

また、図7及び図8に示した処理では、検索キーに合致する見出し語(「見出し語」の属性を与えられている部分)をまず検索し、次いで「訳語」の属性を与えられている部分を検索し、次いで「例文」の属性を与えられている部分を検索する、という順序をとっているが、検索の対象となるデータが有する属性(及びそのような属性の個数)、各属性のデータが検索の対象となる順序は、いずれも任意である。

0069

また、制御部1は、たとえばステップS002で取得したデータが表す全体文字列が所定の言語(たとえば、日本語)を表しているか否かを判別し、当該所定の言語を表していると判別した場合、ステップS201では、この全体文字列を分解して得た部分文字列が表す品詞の所定の活用形に相当する文字列を特定し、特定した文字列を検索候補と決定してもよい。品詞の所定の活用形に相当する文字列を特定する処理は、たとえば、上述した原形特定ルーチンにおける「原形」を当該所定の活用形に置き換えた処理と実質的に同一であればよい。

0070

ステップS203、S206、S209及びS211で制御部1が出力部5に表示させるデータの個数を制限する基準も任意であり、たとえば、それぞれの検索候補について個別に、索出されたデータのうち表示するものの個数を決定してもよい。

0071

また、制御部1は、複数個の検索キー(検索候補、又はその原形にあたる語)をすべて含む部分でなくても、検索キーを複数種類(ないし複数個)含んでいる部分はすべて出力部5に表示させるようにしてもよいし、表示させるデータの個数の制限を緩やかにする(具体的には、たとえば、表示させる上限の個数をより大きくする)ようにしてもよい。複数個の検索キーをすべて含んだ部分でなくても、検索キーを複数種類ないし複数個含んだ部分は、これらの検索キーからなる成句を構成し、あるいは含んでいる可能性が高いといえる。従って、そのような部分を表示させる個数の制限を緩やかにするなどして優先的に表示するようにすれば、検索の効率は向上し得る。また、多くの種類(ないし個数)の検索キーを含んでいる部分ほど出力部5に表示させるデータの個数の制限を緩やかにする、としてもよい。

0072

また、制御部1は、ステップS204又はS207の処理を行ったのち、処理を直ちにステップS211に移してもよい。
また、制御部1は、ステップS002で取得したデータが、空白により単語間を区切る形で表記される言語(たとえば英語など)を表すものである場合、ステップS204の処理の後はステップS205へ、ステップS207の処理の後はステップS208へ、それぞれ処理を移すものとし、一方、空白により単語間を区切る表記が行われていない言語(たとえば中国語や日本語)を表すものである場合は、ステップS204又はS207の処理を行ったのち、処理を直ちにステップS211に移すものとしてもよい。

0073

また、検索システムSによる検索の対象として外部記憶部3に記憶等される各辞書データのうちには、上述した電子書籍型のデータ構造をとるものが含まれていてもよい。
制御部1がステップS101及びこれと実質的に同一の処理において、検索候補を検索キーとして、電子書籍型の辞書データの見出し語を検索する場合は、本文データのうち「見出し語」の属性(「副見出し」の属性を含んでいてもよい)を与えられている部分を検索すればよい。
また、ステップS103及びこれと実質的に同一の処理において、制御部1が電子辞書型の辞書データからデータを読み出す場合、読み出す部分は、たとえば本文データ中、索出された見出し語に対応付けられている部分全体(すなわち、当該見出し語を表すデータの論理位置から次の見出し語を表すデータの直前のデータの論理位置までの部分を占めるデータ全体)であればよい。
また、属性の名称をXとしたとき、属性「X」を与えられた部分に相当するデータとは、電子書籍型の辞書データの場合、たとえば本文データ中、索出された語を表すデータが含まれる部分に対応付けられている見出しデータが示す論理位置から、その次の見出しデータが示す論理位置までの部分を占めるデータであるものとして、制御部1は、ステップS106、S109及びこれらと実質的に同一の処理を行えばよい。

0074

本実施形態の検索システムSが、電子書籍型の辞書データを検索の対象として扱うものとすれば、電子書籍型の辞書データを全文検索する場合に生じる上述の問題による非効率も軽減され得る。すなわち、複数の語を検索キーとして電子書籍型の辞書データを全文検索する場合、「全文」という単位より小さな単位へと絞り込む処理ができないのに対し、この検索システムSは、電子書籍型の辞書データの本文データ内で特定の属性を与えられている語を単位とした検索も行うので、全文より小さな単位への絞り込みも行われる。

0075

また、制御部1は、ステップS202以下の処理を行う際、ステップS002で取得したデータに含まれる所定の制御情報に応答して、この制御情報が指示する態様で検索候補の特定及び辞書データの検索を行うよう構成されていてもよい。以下この点を、ステップS002で取得したデータが「一個人流泪到天亮」という中国語の文章をなす全体文字列を表すものであった場合を例として説明する。

0076

記文章は、文法上は本来、「一個人」「流泪」「到」「天亮」と区切られるべきものである。これに対し、ステップS202で行う処理が、この全体文字列のうち、辞書データのいずれかの見出し語に合致する部分を特定し、特定された部分とその他の部分とにこの全体文字列を分解する、という処理であったとして、いずれの辞書データも「一個人」という見出し語を含んでおらず、一方で「人流」という見出し語を含んでいる辞書データがあったとする。この場合、制御部1は、この全体文字列を、たとえば「一個」「人流」「泪」「到」「天亮」のように誤って区切った上で、得られた各語を検索候補として検索を行う可能性がある。

0077

これを防ぐためには、たとえば制御部1が、単語間の区切り位置を指定する所定の区切り記号(区切り記号は任意である。以下では、区切り記号は記号「/」であるものとする)が全体文字列に含まれているか否かを判別して、含まれていると判別した場合は、当該区切り記号の全体文字列中での位置を検出し、検出された位置が単語間の区切りであるものとしてステップS202の処理を行うものとすればよい。
制御部1がこのような構成をとる場合、たとえばユーザーがステップS002で、全体文字列「一個人流泪到天亮」を表すデータに代えて、全体文字列「一個人/流泪到天亮」を表すデータを入力すれば、制御部1は、ステップS202で「人流」という検索候補を特定することを回避する。

0078

更に、ステップS202の処理により得られるそれぞれの検索候補を検索キーとした検索をどの辞書データを用いて行うかをユーザーが指定できるようにするためには、たとえば制御部1が、検索の対象とされるべき辞書データを指定する所定の指定用記号が全体文字列に含まれているか否かを判別して、含まれていると判別した場合は、該当する各指定用記号の全体文字列中での位置を検出し、検出されたそれぞれの指定用記号について、当該指定用記号(「後側の記号」と呼ぶ)が検出された位置と、当該後側の記号に先行する直近の指定用記号(「前側の記号」と呼ぶ)が検出された位置(又は全体文字列の前端)とに挟まれた部分文字列が1個の単語をなすものとしてステップS202の処理を行い、かつ、この部分文字列を検索キーとした検索を、後側の記号により指定される辞書データのみを対象として行うものとすればよい。

0079

指定用記号は任意である。従って、たとえば辞書データとして、中英辞典をなすものと、中日辞典をなすものとがあるとした場合、「後続する部分文字列を検索キーとした検索は中英辞典のみを対象として行う」ことを指定する指定用記号「/ce/」、「後続する部分文字列を検索キーとした検索は中日辞典のみを対象として行う」ことを指定する指定用記号「/cj/」、及び「後続する部分文字列を検索キーとした検索は行わない」ことを指定する指定用記号「/no/」、の3つを指定用記号とする、などのように、制御部1が実行するプログラムなどによってあらかじめ決められていればよい。
制御部1がこのような構成をとる場合、たとえばユーザーがステップS002で、全体文字列「一個人流泪到天亮」を表すデータに代えて、全体文字列「一個人/ce/流泪/cj/到/no/天亮/cj/」を表すデータを入力すれば、制御部1は、ステップS202で「一個人」「流泪」「到」「天亮」という各検索候補を特定した上、検索キー「一個人」を用いた検索は中英辞典をなす辞書データのみを対象として行い、検索キー「流泪」又は「天亮」を用いた検索は中日辞典をなす辞書データのみを対象として行う。一方で制御部1は、検索キー「到」を用いた検索を行わない。

0080

なお、それぞれの辞書データは、たとえば各自を識別する識別データを含んでいてもよく、制御部1は、対象である辞書データを限定した検索を行う場合は、たとえば辞書データに含まれる識別データを参照して、この識別データを含む辞書データが検索の対象であるか否かを判別し、検索の対象であると判別したときにこの辞書データを検索し、検索の対象ではないと判別したときはこの辞書データへのアクセスを中止するものとすればよい。

0081

以上、本実施の形態に係る検索システムSを説明したが、この検索システムSは、通常のコンピュータシステムを用いても実現することができる。
例えば、制御部1が行う上述の処理を実行させるためのプログラムを、CD−ROM、DVDあるいはその他のコンピュータ読み取り可能な記録媒体に格納して配布し、このプログラムをコンピュータにインストールすることにより、上述の検索システムSを構成することができる。

0082

また、プログラムをインターネット等の通信ネットワーク上の所定のサーバ装置が有するディスク装置等に格納しておき、例えば、搬送波重畳させて、コンピュータにダウンロード等するようにしてもよい。更に、通信ネットワークを介してプログラムを転送しながら起動実行することによっても、上述の処理を達成することができる。
また、上述の機能を、OS(Operating System)が分担して実現する場合又はOSとアプリケーションとの協働により実現する場合等には、OS以外の部分のみを媒体に格納して配布してもよく、また、コンピュータにダウンロード等してもよい。

0083

S検索システム
1 制御部
2主記憶部
3外部記憶部
4 入力部
5 出力部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 楽天株式会社の「 要約作成装置、要約作成方法、及びプログラム」が 公開されました。( 2020/04/30)

    【課題】要約の精度を高める。【解決手段】要約作成装置(10)の取得手段(101)は、文書から1又は複数の要素を抽出し、抽出された要素の各々の出現度を取得するアルゴリズムであって、互いに異なる複数のアル... 詳細

  • ジャパンモード株式会社の「 施術支援システム」が 公開されました。( 2020/04/30)

    【課題】 施術の精度を向上させることが可能となる施術支援システムを提供する。【解決手段】施術支援システムは、施術対象者の施術前の横顔と正面顔とを含む施術前顔画像を有する対象情報を取得する取得部と、予... 詳細

  • 株式会社日立製作所の「 データ管理システムおよびデータ管理方法」が 公開されました。( 2020/04/30)

    【課題】要求対象の時間に合ったデータを提供可能なデータ管理システムを提供する。【解決手段】複数のストレージ装置を含んで構成されるデータ管理システムであって、要求対象の時間を示す情報が含まれる要求を受け... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ