図面 (/)

技術 情報検索装置、情報検索システム、及び情報検索方法

出願人 株式会社NTTドコモ
発明者 内田渉森田千晶吉村健
出願日 2012年10月24日 (7年4ヶ月経過) 出願番号 2012-234811
公開日 2014年5月12日 (5年10ヶ月経過) 公開番号 2014-085874
状態 特許登録済
技術分野 検索装置
主要キーワード 質問パターン 文字数データ エンティティ属性 物理構成図 文字数判定 属性候補 一般常識 関連人物
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2014年5月12日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

課題

ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置情報検索システム、及び情報検索方法を提供する。

解決手段

データベース検索装置10によれば、取得された検索語からエンティティ検索キー及び属性検索キーが検出される。そして、エンティティ検索キーと完全一致する「エンティティ」に対応付けられているとともに属性検索キーに対応付けられている所望情報を検索する完全一致検索処理が行われる。ここで、完全一致検索処理の検索結果がゼロ件の場合に、エンティティ検索キーと部分一致する「エンティティ」に対応付けられている所望情報を検索する前方一致検索処理が行われる。このように、完全一致検索処理の検索結果がゼロ件の場合に、前方一致検索処理が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。

概要

背景

従来、音声認識技術タッチパネル活用したユーザインタフェース進化無線通信技術の進化により、ユーザからの特定の分野に限定されない様々な分野に関する質問回答するマルチドメイン型の質問応答システムが普及しつつある。

マルチドメイン型の質問応答システムでは、ユーザの日常生活に関するあらゆる質問が想定されており、映画といったエンターテイメントに関する情報、地理歴史といった一般常識の情報等についての問い合わせに対して回答する。これらの情報は、システム内部のデータベース管理システム又はシステムと通信接続可能な外部サービス実施サーバ等から取得される。

情報を検索するにあたって、ユーザが問い合わせた対象物エンティティ)が格納されているデータベースから如何にして適切にエンティティを取り出すかが重要である。データベースに格納された情報をユーザが全て把握しているとは限らないため、ユーザが入力した検索フレーズ検索ワード)をそのまま用いて検索しても、検索結果が適切に出力されるとは限らない。例えば、ユーザが、「テリーポッター秘密の部屋」という作品名を取り出すことを意図して、「テリーポッター」という検索ワードを指定しても、「テリーポッターと秘密の部屋」のみが検索結果として出力される可能性は低いことからユーザにとっての利便性が低くなることがある。

このような問題に対処する場合、前方一致検索の実施が検討されることが一般的である。前方一致検索は、検索ワードの文字列の表現先頭(前方)から全て含む文字列を、データベースの中から検索して検索結果として出力する方法である。前方一致検索を行うことにより、上記の例を用いれば、「テリーポッターと秘密の部屋」、「テリーポッターと不死の騎士団」といった、先頭から「テリーポッター」を含む作品名を全て検索結果として出力することができる。これにより、シリーズを構成する作品群の作品名を、作品名のサブタイトルに関係なく取り出すこと等が可能なため、ユーザが意図した作品名を列挙して出力できる可能性がある。

しかしながら、前方一致検索を実施すると、様々に表現された作品名が検索対象となるため、ユーザが意図していないものも検索結果として出力されてしまう可能性もある。例えば、「テリー」という作品名の作品が存在している状況で、ユーザが、「テリーポッターと秘密の部屋」を検索結果として得ようとするために、「テリー」を検索ワードとして指定したとする。この場合、「テリーポッターと秘密の部屋」及び「テリーポッターと不死鳥の騎士団」だけでなく、ユーザが意図していない「テリー」も検索結果として含まれて出力されてしまう。

例えば、特許文献1に記載のナビゲーション装置では、ユーザにより入力された文字に対して部分一致するキーワード絞り込み、選択可能なキーワードとして表示する。ユーザは、該当するキーワードを選択することにより、入力操作を省略することができる。例えば、最短一文字の入力操作と選択操作の計二つの操作により、三文字以上のキーワードを選択することで、操作を短縮することが可能になる。

しかしながら、ユーザによる音声検索等の一回のインタラクション(検索のための音声等の入力から、出力された検索結果の確認までの一連の操作)による、ユーザの心理面への負担(コスト)及びユーザを待たせることの負担を考慮すると、適切な検索結果を出力するまでに何度もユーザに検索操作をさせることは望ましくない。このため、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが求められる。

概要

ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置情報検索システム、及び情報検索方法を提供する。データベース検索装置10によれば、取得された検索語からエンティティ検索キー及び属性検索キーが検出される。そして、エンティティ検索キーと完全一致する「エンティティ」に対応付けられているとともに属性検索キーに対応付けられている所望情報を検索する完全一致検索処理が行われる。ここで、完全一致検索処理の検索結果がゼロ件の場合に、エンティティ検索キーと部分一致する「エンティティ」に対応付けられている所望情報を検索する前方一致検索処理が行われる。このように、完全一致検索処理の検索結果がゼロ件の場合に、前方一致検索処理が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。

目的

本発明は、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置、情報検索システム、及び情報検索方法を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

ユーザが所望する所望情報検索する情報検索装置であって、前記所望情報を検索するための検索語を取得する検索語取得手段と、前記検索語取得手段により取得された前記検索語から、前記所望情報に関連する関連ワードと、前記所望情報の属性を示す属性情報とを検出する検出手段と、前記関連ワードの候補である関連ワード候補情報と、前記属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、前記検出手段により検出された前記関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、前記検出手段により検出された前記属性情報に対応付けられている、前記所望情報を検索する第一の検索処理を行う検索手段と、を備え、前記検索手段は、前記第一の検索処理の検索結果がゼロ件の場合に、前記候補記憶手段から、前記検出手段により検出された前記関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、前記所望情報を検索する第二の検索処理を行う、情報検索装置。

請求項2

前記検索手段は、前記第一の検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりも前記関連ワードの文字数の方が大きい場合に、前記第二の検索処理を行う、請求項1に記載の情報検索装置。

請求項3

前記検出手段により検出される前記属性情報と、前記所望情報に関連する前記関連ワードのカテゴリを示すカテゴリ情報とを、対応付けて記憶するカテゴリ記憶手段と、前記カテゴリ情報と、前記予め定められた所定の文字数とを、対応付けて記憶する文字数記憶手段と、を更に備え、前記検索手段は、前記検出手段により検出された前記属性情報と対応付けて記憶される前記カテゴリ情報を前記カテゴリ記憶手段から取得し、当該カテゴリ情報と対応付けて記憶される前記予め定められた所定の文字数を前記文字数記憶手段から取得する、請求項2に記載の情報検索装置。

請求項4

前記関連ワード候補情報と、当該関連ワード候補情報から派生した派生語とを、対応付けて記憶する派生語記憶手段を更に備え、前記検索手段は、前記検出手段により検出された前記関連ワードから派生した文字列と完全一致する前記派生語に対応付けて記憶される前記関連ワード候補情報に対応付けられている前記所望情報を前記候補記憶手段から検索する処理を前記第一の検索処理として行い、前記第一の検索処理の検索結果がゼロ件の場合に、前記検出手段により検出された前記関連ワードから派生した文字列と部分一致する前記派生語に対応付けて記憶される前記関連ワード候補情報に対応付けられている前記所望情報を前記候補記憶手段から検索する処理を前記第二の検索処理として行う、請求項1〜3のいずれか1項に記載の情報検索装置。

請求項5

前記検出手段は、前記検索語取得手段により取得された前記検索語から、前記関連ワードと前記属性情報との組を複数検出し、前記検索手段は、前記検出された前記関連ワードと前記属性情報との組を複数用いて前記第一の検索処理を行って検索結果が一件以上となった時点で当該検索結果を出力するとともに、前記第一の検索処理の検索結果がゼロ件の場合に、前記検出された前記関連ワードと前記属性情報との組を複数用いて前記第二の検索処理を行って検索結果が一件以上となった時点で当該検索結果を出力する、請求項1〜4のいずれか1項に記載の情報検索装置。

請求項6

ユーザが所望する所望情報を検索する情報検索装置と、当該情報検索装置と通信可能な通信端末とを備える情報検索システムであって、前記情報検索装置は、前記所望情報を検索するための検索語を前記通信端末から取得する検索語取得手段と、前記検索語取得手段により取得された前記検索語から、前記所望情報に関連する関連ワードと、前記所望情報の属性を示す属性情報とを検出する検出手段と、前記関連ワードの候補である関連ワード候補情報と、前記属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、前記検出手段により検出された前記関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、前記検出手段により検出された前記属性情報に対応付けられている、前記所望情報を検索する第一の検索処理を行う検索手段と、を有し、前記検索手段は、前記第一の検索処理の検索結果がゼロ件の場合に、前記候補記憶手段から、前記検出手段により検出された前記関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、前記所望情報を検索する第二の検索処理を行い、前記通信端末は、前記検索語を前記情報検索装置に送信する送信手段と、前記検索手段による前記第一の検索処理又は前記第二の検索処理の検索結果を前記情報検索装置から取得する結果取得手段と、を有する、情報検索システム。

請求項7

ユーザが所望する所望情報を検索する情報検索装置が行う情報検索方法であって、前記所望情報を検索するための検索語を前記情報検索装置が取得する検索語取得ステップと、前記検索語取得ステップにより取得された前記検索語から、前記所望情報に関連する関連ワードと、前記所望情報の属性を示す属性情報とを前記情報検索装置が検出する検出ステップと、前記関連ワードの候補である関連ワード候補情報と、前記属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、前記検出ステップにより検出された前記関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、前記検出ステップにより検出された前記属性情報に対応付けられている、前記所望情報を検索する第一の検索処理を前記情報検索装置が行う検索ステップと、を有し、前記検索ステップでは、前記第一の検索処理の検索結果がゼロ件の場合に、前記候補記憶手段から、前記検出ステップにより検出された前記関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、前記所望情報を検索する第二の検索処理を前記情報検索装置が行う、情報検索方法。

技術分野

0001

本発明は、ユーザが所望する所望情報検索する情報検索装置、当該情報検索装置を備える情報検索システム、及び当該情報検索装置が行う情報検索方法に関する。

背景技術

0002

従来、音声認識技術タッチパネル活用したユーザインタフェース進化無線通信技術の進化により、ユーザからの特定の分野に限定されない様々な分野に関する質問回答するマルチドメイン型の質問応答システムが普及しつつある。

0003

マルチドメイン型の質問応答システムでは、ユーザの日常生活に関するあらゆる質問が想定されており、映画といったエンターテイメントに関する情報、地理歴史といった一般常識の情報等についての問い合わせに対して回答する。これらの情報は、システム内部のデータベース管理システム又はシステムと通信接続可能な外部サービス実施サーバ等から取得される。

0004

情報を検索するにあたって、ユーザが問い合わせた対象物エンティティ)が格納されているデータベースから如何にして適切にエンティティを取り出すかが重要である。データベースに格納された情報をユーザが全て把握しているとは限らないため、ユーザが入力した検索フレーズ検索ワード)をそのまま用いて検索しても、検索結果が適切に出力されるとは限らない。例えば、ユーザが、「テリーポッター秘密の部屋」という作品名を取り出すことを意図して、「テリーポッター」という検索ワードを指定しても、「テリーポッターと秘密の部屋」のみが検索結果として出力される可能性は低いことからユーザにとっての利便性が低くなることがある。

0005

このような問題に対処する場合、前方一致検索の実施が検討されることが一般的である。前方一致検索は、検索ワードの文字列の表現先頭(前方)から全て含む文字列を、データベースの中から検索して検索結果として出力する方法である。前方一致検索を行うことにより、上記の例を用いれば、「テリーポッターと秘密の部屋」、「テリーポッターと不死の騎士団」といった、先頭から「テリーポッター」を含む作品名を全て検索結果として出力することができる。これにより、シリーズを構成する作品群の作品名を、作品名のサブタイトルに関係なく取り出すこと等が可能なため、ユーザが意図した作品名を列挙して出力できる可能性がある。

0006

しかしながら、前方一致検索を実施すると、様々に表現された作品名が検索対象となるため、ユーザが意図していないものも検索結果として出力されてしまう可能性もある。例えば、「テリー」という作品名の作品が存在している状況で、ユーザが、「テリーポッターと秘密の部屋」を検索結果として得ようとするために、「テリー」を検索ワードとして指定したとする。この場合、「テリーポッターと秘密の部屋」及び「テリーポッターと不死鳥の騎士団」だけでなく、ユーザが意図していない「テリー」も検索結果として含まれて出力されてしまう。

0007

例えば、特許文献1に記載のナビゲーション装置では、ユーザにより入力された文字に対して部分一致するキーワード絞り込み、選択可能なキーワードとして表示する。ユーザは、該当するキーワードを選択することにより、入力操作を省略することができる。例えば、最短一文字の入力操作と選択操作の計二つの操作により、三文字以上のキーワードを選択することで、操作を短縮することが可能になる。

0008

しかしながら、ユーザによる音声検索等の一回のインタラクション(検索のための音声等の入力から、出力された検索結果の確認までの一連の操作)による、ユーザの心理面への負担(コスト)及びユーザを待たせることの負担を考慮すると、適切な検索結果を出力するまでに何度もユーザに検索操作をさせることは望ましくない。このため、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが求められる。

先行技術

0009

特開2009−14703号公報

発明が解決しようとする課題

0010

そこで本発明は、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置、情報検索システム、及び情報検索方法を提供することを目的とする。

課題を解決するための手段

0011

本発明の一形態に係る情報検索装置は、ユーザが所望する所望情報を検索する情報検索装置であって、所望情報を検索するための検索語を取得する検索語取得手段と、検索語取得手段により取得された検索語から、所望情報に関連する関連ワードと、所望情報の属性を示す属性情報とを検出する検出手段と、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出手段により検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出手段により検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を行う検索手段と、を備え、検索手段は、第一の検索処理の検索結果がゼロ件の場合に、候補記憶手段から、検出手段により検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を行う、ことを特徴とする。

0012

本発明の一形態に係る情報検索装置によれば、検索語が取得され、取得された検索語から上記の関連ワードと属性情報とが検出される。そして、検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに属性情報に対応付けられている所望情報を検索する第一の検索処理が行われる。ここで、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理が行われる。このように、上記の第一の検索処理(例として完全一致検索)の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理(例として前方一致検索、後方一致検索等の部分一致検索)が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。

0013

別の形態に係る情報検索装置では、検索手段は、第一の検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりも関連ワードの文字数の方が大きい場合に、第二の検索処理を行ってもよい。

0014

この形態では、第一の検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりも関連ワードの文字数の方が大きい場合に、第二の検索処理が行われる。関連ワードの文字数の方が大きくなればなるほど、上記の第一の検索処理(例として完全一致検索)の検索結果がゼロ件になる可能性も高くなる。このため、所定の文字数よりも関連ワードの文字数の方が大きいため第二の検索処理を行う方がより適切な状態である場合に、第二の検索処理を行うことが可能になる。

0015

別の形態に係る情報検索装置では、検出手段により検出される属性情報と、所望情報に関連する関連ワードのカテゴリを示すカテゴリ情報とを、対応付けて記憶するカテゴリ記憶手段と、カテゴリ情報と、予め定められた所定の文字数とを、対応付けて記憶する文字数記憶手段と、を更に備え、検索手段は、検出手段により検出された属性情報と対応付けて記憶されるカテゴリ情報をカテゴリ記憶手段から取得し、当該カテゴリ情報と対応付けて記憶される予め定められた所定の文字数を文字数記憶手段から取得してもよい。

0016

この形態では、検出された属性情報と対応付けて記憶されるカテゴリ情報が取得され、当該カテゴリ情報と対応付けて記憶される所定の文字数が取得される。検出された属性情報に適した所定の文字数が取得され、所定の文字数よりも関連ワードの文字数の方が大きいために第二の検索処理を行うのが、より適切な状態である場合に、第二の検索処理を行うことが可能になる。

0017

別の形態に係る情報検索装置では、関連ワード候補情報と、当該関連ワード候補情報から派生した派生語とを、対応付けて記憶する派生語記憶手段を更に備え、検索手段は、検出手段により検出された関連ワードから派生した文字列と完全一致する派生語に対応付けて記憶される関連ワード候補情報に対応付けられている所望情報を候補記憶手段から検索する処理を第一の検索処理として行い、第一の検索処理の検索結果がゼロ件の場合に、検出手段により検出された関連ワードから派生した文字列と部分一致する派生語に対応付けて記憶される関連ワード候補情報に対応付けられている所望情報を候補記憶手段から検索する処理を第二の検索処理として行ってもよい。

0018

この形態では、検出された関連ワードから派生した文字列と完全一致する派生語に対応付けて記憶される関連ワード候補情報に対応付けられている所望情報を候補記憶手段から検索する処理が第一の検索処理として行われ、第一の検索処理の検索結果がゼロ件の場合に、検出手段により検出された関連ワードから派生した文字列と部分一致する派生語に対応付けて記憶される関連ワード候補情報に対応付けられている所望情報を候補記憶手段から検索する処理が第二の検索処理として行われる。これにより、検出された関連ワードが、関連ワードとして適切なものから派生したものであっても、適切な関連ワードの取得及び検出が可能になる。

0019

別の形態に係る情報検索装置では、検出手段は、検索語取得手段により取得された検索語から、関連ワードと属性情報との組を複数検出し、検索手段は、検出された関連ワードと属性情報との組を複数用いて第一の検索処理を行って検索結果が一件以上となった時点で当該検索結果を出力するとともに、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと属性情報との組を複数用いて第二の検索処理を行って検索結果が一件以上となった時点で当該検索結果を出力してもよい。

0020

この形態では、検索語から、関連ワードと属性情報との組が複数検出され、検出された関連ワードと属性情報との組を複数用いて第一の検索処理を行って検索結果が一件以上となった時点で当該検索結果が出力されるとともに、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと属性情報との組を複数用いて第二の検索処理を行って検索結果が一件以上となった時点で当該検索結果が出力される。このように、検出された関連ワードと属性情報との組を複数用いて検索結果が一件以上となった時点で当該検索結果が出力されるため、検索処理に必要な時間を短縮することが可能になる。

0021

本発明の一形態に係る情報検索システムは、ユーザが所望する所望情報を検索する情報検索装置と、当該情報検索装置と通信可能な通信端末とを備える情報検索システムであって、情報検索装置は、所望情報を検索するための検索語を通信端末から取得する検索語取得手段と、検索語取得手段により取得された検索語から、所望情報に関連する関連ワードと、所望情報の属性を示す属性情報とを検出する検出手段と、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出手段により検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出手段により検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を行う検索手段と、を有し、検索手段は、第一の検索処理の検索結果がゼロ件の場合に、候補記憶手段から、検出手段により検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を行い、通信端末は、検索語を情報検索装置に送信する送信手段と、検索手段による第一の検索処理又は第二の検索処理の検索結果を情報検索装置から取得する結果取得手段と、を有する、ことを特徴とする。

0022

本発明の一形態に係る情報検索システムによれば、検索語が取得され、取得された検索語から上記の関連ワードと属性情報とが検出される。そして、検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに属性情報に対応付けられている所望情報を検索する第一の検索処理が行われる。ここで、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理が行われる。このように、上記の第一の検索処理(例として完全一致検索)の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理(例として前方一致検索、後方一致検索等の部分一致検索)が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。

0023

本発明の一形態に係る情報検索方法は、ユーザが所望する所望情報を検索する情報検索装置が行う情報検索方法であって、所望情報を検索するための検索語を情報検索装置が取得する検索語取得ステップと、検索語取得ステップにより取得された検索語から、所望情報に関連する関連ワードと、所望情報の属性を示す属性情報とを情報検索装置が検出する検出ステップと、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出ステップにより検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出ステップにより検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を情報検索装置が行う検索ステップと、を有し、検索ステップでは、第一の検索処理の検索結果がゼロ件の場合に、候補記憶手段から、検出ステップにより検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を情報検索装置が行う、ことを特徴とする。

0024

本発明の一形態に係る情報検索方法によれば、検索語が取得され、取得された検索語から上記の関連ワードと属性情報とが検出される。そして、検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに属性情報に対応付けられている所望情報を検索する第一の検索処理が行われる。ここで、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理が行われる。このように、上記の第一の検索処理(例として完全一致検索)の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理(例として前方一致検索、後方一致検索等の部分一致検索)が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。

発明の効果

0025

本発明によれば、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置、情報検索システム、及び情報検索方法を提供することができる。

図面の簡単な説明

0026

本実施形態に係る情報検索システムの主な機能構成の概略を説明するための機能ブロック図である。
本実施形態に係るデータベース検索装置の主な物理構成の概略を説明するための物理構成図である。
エンティティ属性データベースのテーブル構成の一例を示すテーブル構成図である。
マッチング情報データベースのテーブル構成の一例を示すテーブル構成図である。
属性エンティティカテゴリデータベースのテーブル構成の一例を示すテーブル構成図である。
前方一致最低文字数データベースのテーブル構成の一例を示すテーブル構成図である。
属性エンティティカテゴリデータベースと前方一致最低文字数データベースとを統合したデータベースのテーブル構成の一例を示すテーブル構成図である。
データベース検索装置における検索処理の流れを説明するためのフローチャートである。

実施例

0027

以下、添付図面を参照しながら本発明の好適な実施形態を説明する。なお、図面の説明において同一要素には同一符号を付し、重複する説明を省略する。

0028

(1)情報検索システムの構成
まず、本実施形態に係る情報検索システム全体の構成について、図1及び図2を用いて説明する。本実施形態に係る情報検索システム1は、本実施形態に係る情報検索装置であるデータベース検索装置10と、データベース検索装置10との通信ネットワークNWを介した通信が可能なユーザ端末20(通信端末)とを備えている。図1は、情報検索システム1の主な機能構成の概略を説明するための機能ブロック図であり、図2は、データベース検索装置10の主な物理構成の概略を説明するための物理構成図である。通信ネットワークNWは、インターネットなどの公衆通信網専用線、同一物理装置内の通信バス等の組み合わせであってもよく、これらの物理的な配置は限定されない。

0029

データベース検索装置10は、ユーザ端末20のユーザが所望する情報である所望情報を検索するサーバ装置である。また、ユーザ端末20は、携帯電話端末スマートフォンパーソナルコンピュータ等の端末装置である。ユーザ端末20は、タッチパネルディスプレイ等のディスプレイ、CPU(Central Processing Unit)、記憶装置通信モジュールキーボード等の入力モジュール録音モジュール音声認識処理モジュール等の一般的な構成要素を有しており、これら構成要素の組合せにより、ユーザによる質問(検索語)の入力を受け付けてデータベース検索装置10に出力し、この出力に対するデータベース検索装置10からの回答の出力を受信することが可能である。

0030

データベース検索装置10は、図2に示されるように、主な物理的な構成要素としてCPU11、主記憶装置であるRAM12(Random Access Memory)及びROM13(Read Only Memory)、通信を行うための通信モジュール14、並びにハードディスク等の補助記憶装置15等のハードウェアを備えるコンピュータとして構成される。なお、主記憶装置は、RAM、ROMといったものに限定されず、例えばフラッシュメモリといった主記憶装置の役割を果たすものに置き換えてもよい。データベース検索装置10は、上記の記憶装置に記憶されたプログラムにおける命令によって、これらの構成要素が動作することにより、各種処理を実行する機能が発揮される。

0031

データベース検索装置10は、図1に示されるように、主な機能的な構成要素として、入出力制御部101(検索語取得手段)、キー候補検出部102(検出手段)、完全一致制御部103(検索手段)、完全一致検索部104(検索手段)、エンティティ属性データベース105(候補記憶手段)、マッチング情報データベース106(派生語記憶手段)、前方一致制御部107(検索手段)、前方一致検索部108(検索手段)、エンティティカテゴリ判定部109(情報記憶手段)、属性エンティティカテゴリデータベース110(カテゴリ記憶手段)、前方一致文字数判定部111(判定手段)、及び前方一致最低文字数データベース112(文字数記憶手段)を有している。なお、データベース検索装置10における各機能は、単一のサーバ装置内に配置されていなくてもよく、物理的な構成は限定されない。各機能が、LAN(Local Area Network)やインターネットで接続された別個のサーバ装置内に配置されていてもよい。

0032

入出力制御部101は、ユーザ端末20との通信を行う通信処理部分である。例えば、入出力制御部101は、上記の所望情報を検索するための検索語を含む検索情報をユーザ端末20から受信して、受信した検索情報から検索語を取得する処理を行うことが可能である。入出力制御部101は、ユーザ端末20においてユーザにより入力された検索フレーズ(検索情報)を受信すると、この検索フレーズから検索語を取得する。そして、入出力制御部101は、この検索語をキー候補検出部102に渡す。

0033

また、入出力制御部101は、完全一致制御部103又は前方一致制御部107により得られた後述の検索結果を受け取って、ユーザ端末20に出力して送信することが可能である。検索フレーズは、ユーザ端末20において入力された音声に対して音声認識処理が行われて得られた文字等の情報であってもよく、ユーザ端末20のキーボードやタッチパネルを用いて入力されたものであってもよい。検索フレーズは、例えば、ある映画の監督を問い合わせるものから、歴史的な事実をねるものまで、様々な分野について質問する型式で入力される。検索フレーズの一例として、「テリーポッター」という題名の映画が存在すると仮定した場合に、「テリーポッターの監督は誰」といった自然文の検索フレーズ、「テリーポッター 監督」といった複数の検索キーワードの組合せである検索フレーズ等がある。

0034

キー候補検出部102は、入出力制御部101により取得された検索語から、所望情報に関連するエンティティ検索キー(関連ワード)と、所望情報の属性を示す属性検索キー(属性情報)とを決定して検出する演算処理部分である。エンティティ検索キーは、所望情報に関連する情報を表現するキーワードであり、属性検索キーは、所望情報の側面を示す属性を表現するキーワードである。キー候補検出部102は、入出力制御部101により取得された検索語によっては、この検索語から、エンティティ検索キーと属性検索キーとのペア(組)を複数決定して検出する場合がある。キー候補検出部102は、検出したエンティティ検索キー及び属性検索キー(場合によってはエンティティ検索キー及び属性検索キーの複数のペア)を完全一致制御部103に渡す。キー候補検出部102によるエンティティ検索キー及び属性検索キーの抽出方法には、後述する種々の方法が考えられる。

0035

例えば、入出力制御部101により取得された検索語が二つの検索キーワードの組合せである場合、キー候補検出部102は、一つ目の検索キーワードがエンティティ検索キーであると判断してエンティティ検索キーを検出し、二つ目の検索キーワードが属性検索キーであると判断して属性検索キーを検出する。より詳しくは、例えば、入出力制御部101により取得された検索語が「テリーポッター監督」である場合、一つ目の検索キーワードである「テリーポッター」がエンティティ検索キーであるとして検出され、二つ目の検索キーワードである「監督」が属性検索キーであるとして検出される。

0036

また、エンティティ検索キー及び属性検索キーのペア(組み合わせ)は、複数であってもよい。例えば、入出力制御部101により取得された検索語が「テリーポッター監督」である場合、「テリーポッター」がエンティティ検索キーであるとして検出されて且つ「監督」という文字列を含む「映画監督」が属性検索キーであるとして検出される組み合わせだけでなく、更に、「テリーポッター」がエンティティ検索キーであるとして検出されて且つ「監督」という文字列を含む「サッカーチーム監督」が属性検索キーであるとして検出される組み合わせが存在してもよい。すなわち、キー候補検出部102は、二つ目の検索キーワードを含む文字列を候補として予め複数記憶しておき、二つ目の検索キーワードの文字列を含むこれら複数の文字列が属性検索キーであるとして検出してもよい。この場合、エンティティ検索キー及び属性検索キーの一つ目のペアは「テリーポッター」及び「映画監督」となり、二つ目のペアは「テリーポッター」及び「サッカーチーム監督」となる。

0037

また、キー候補検出部102は、入出力制御部101により取得される検索語の候補である雛形(すなわち、自然文形態の質問パターン)と、当該検索語の候補に対応する属性検索キーとを対応付けて記憶することが可能である。例えば、入出力制御部101により取得される検索語の候補である雛形としての「〜の監督は誰」(〜の部分は任意の文字列であり、エンティティ検索キーとして判断される文字列)と、この候補に対応する属性検索キーとしての「監督」とが、対応付けて記憶される。そして、入出力制御部101により取得された検索語が「テリーポッターの監督は誰」である場合、キー候補検出部102が上記のパターンに当てはまったと判定することにより、「テリーポッター」がエンティティ検索キーであるとして検出され、「監督」が属性検索キーであるとして検出される。

0038

エンティティ属性データベース105は、エンティティ検索キーの候補である「エンティティ」(関連ワード候補情報)と、属性検索キーの候補である「属性」(属性候補情報)と、当該エンティティ検索キー及び当該属性検索キーの組み合わせから特定される「値」(所望情報及びその候補)とを、対応付けて記憶するデータベースである。エンティティ属性データベース105のテーブル構成図の一例が、図3に示されている。ここでは、「エンティティ」としての「テリーポッターと秘密の部屋」と、「属性」としての「映画監督」と、「値」としての「AAAAAA」(すなわち、「テリーポッターと秘密の部屋」の映画監督の名前)とが、対応付けて記憶されている。エンティティ属性データベース105は、MySQL登録商標)、PostgreSQL(登録商標)等のデータベース管理システムを用いて構成され、SQL等の問い合わせ言語を受け付けるシステムであってもよいし、データベース検索装置10の内部メモリに記憶されたハッシュ等のデータであってもよい。

0039

マッチング情報データベース106は、エンティティ検索キーの候補である「エンティティ」(関連ワード候補情報)と、この「エンティティ」から派生した派生語とを、対応付けて記憶するデータベースである。マッチング情報データベース106の「エンティティ」における内容と、エンティティ属性データベース105の「エンティティ」における内容とは、通常、一致している。マッチング情報データベース106のテーブル構成図の一例が、図4に示されている。ここでは、「エンティティ」としての「テリーポッターと秘密の部屋」と、「エンティティマッチング文字列」としての「テリポタ1作目」とが、対応付けて記憶されている。上記の派生語は、上記の「エンティティ」の文字列に対して後述する正規化処理が行われて得られた文字列であり、例えば、上記の「エンティティ」の文字列の一部、「ー」(長音符)、「〜」(長音符)等の長音、「ッ」等の促音除去処理された文字列、この除去処理された文字列の一部、この除去処理された文字列の一部に「エンティティ」の特徴、説明等を示す修飾ワードが付加された文字列、この除去処理された文字列の一部に「揺らぎ」(ユーザによって異なる可能性のある表記の違い)が加えられた文字列等である。マッチング情報データベース106は、MySQL(登録商標)、PostgreSQL(登録商標)等のデータベース管理システムを用いて構成され、SQL等の問い合わせ言語を受け付けるシステムであってもよいし、データベース検索装置10の内部メモリに記憶されたハッシュ等のデータであってもよい。

0040

完全一致制御部103は、完全一致検索部104による完全一致検索処理(第一の検索処理)を制御する制御部分である。例えば、完全一致制御部103は、キー候補検出部102から受けたエンティティ検索キー及び属性検索キーを、完全一致検索部104に渡して、完全一致検索処理を実行させるよう指示する。また、完全一致制御部103は、完全一致検索部104から受信した検索結果が一件以上であると判定した場合に、当該検索結果を入出力制御部101に渡す。これにより、当該検索結果がユーザ端末20に出力される。なお、完全一致制御部103は、完全一致検索部104から受信した検索結果がゼロ件であると判定した場合に、キー候補検出部102から受けたエンティティ検索キー及び属性検索キーを、前方一致制御部107に渡す。

0041

完全一致検索部104は、完全一致制御部103から受けたエンティティ検索キーと完全一致する上記の「エンティティ」に対応付けられているとともに、キー候補検出部102により検出された属性検索キーに対応付けられている(完全に一致)、所望情報を検索する完全一致検索処理実行部分である。完全一致検索部104は、エンティティ属性データベース105にアクセスして、エンティティ検索キーと完全一致する上記の「エンティティ」に対応付けられている「値」の候補を抽出し(「エンティティ」一つに対する「値」の候補が複数の場合もある)、この「値」の候補から、属性検索キーに対応付けられている「値」を抽出することにより、完全一致検索処理を行う。完全一致検索部104は、検索結果を完全一致制御部103に渡す。また、完全一致検索部104は、完全一致制御部103から受けたエンティティ検索キー及び属性検索キーの組み合わせが複数存在する場合、各組み合わせについて順次、完全一致検索処理を行う。完全一致検索処理の検索結果が一件以上となった時点で当該検索結果を完全一致制御部103に出力する。

0042

なお、完全一致検索部104は、完全一致制御部103から受けたエンティティ検索キーを正規化処理することによって、エンティティ検索キーから派生した文字列である派生文字列を取得することが可能である。エンティティ検索キーの正規化処理とは、所定のルールに従ってエンティティ検索キーを変換することにより、検索語の入力時において検索語に加えられた「揺らぎ」(ユーザによって異なる可能性のある表記の違い)を排除する処理のことである。上記の正規化処理は、例えば、エンティティ検索キーにおける、「ー」(長音符)、「〜」(長音符)等の長音、「ッ」等の促音を除去する処理、全角及び半角カナを何れか一方(例えば、全角)に変換して揃える処理等である。例えば、完全一致検索部104は、完全一致制御部103から受けたエンティティ検索キーが「テリーポッター」である場合、このエンティティ検索キーを正規化処理することによって、派生文字列「テリポタ」を取得することが可能である。

0043

そして、完全一致検索部104は、取得した派生文字列と完全一致する「エンティティマッチング文字列」を、マッチング情報データベース106にアクセスして取得する。また、完全一致検索部104は、取得した「エンティティマッチング文字列」に対応付けて記憶される「エンティティ」を、マッチング情報データベース106にアクセスして取得する。更に、完全一致検索部104は、取得した「エンティティ」に対応付けられており且つ属性検索キーに対応付けられている「値」を、エンティティ属性データベース105にアクセスして抽出する。完全一致検索部104は、この抽出処理を上記の完全一致検索処理として行う。ここで、完全一致検索部104が、マッチング情報データベース106から取得した「エンティティ」と同一の「エンティティ」がエンティティ属性データベース105に存在しないことを検出することがあったとする。この場合、完全一致検索部104は、マッチング情報データベース106から取得した「エンティティ」と部分一致する「エンティティ」を、エンティティ属性データベース105から取得してもよい。そして、完全一致検索部104は、検索結果を完全一致制御部103に渡す。例えば、取得した派生文字列が「テリポタ」である場合、この「テリポタ」と完全一致する文字列が「エンティティマッチング文字列」としてマッチング情報データベース106から取得される。

0044

そして、取得された「エンティティマッチング文字列」と対応付けて記憶される「エンティティ」がマッチング情報データベース106から取得される。そして、完全一致検索部104は、取得した「エンティティ」に対応付けられており且つ属性検索キーに対応付けられている「値」を、エンティティ属性データベース105にアクセスして抽出する。完全一致検索部104は、この抽出処理を上記の完全一致検索処理として行う。

0045

前方一致制御部107は、前方一致検索部108による部分一致検索処理(第二の検索処理)を制御する制御部分である。以下では、部分一致検索処理の一例として前方一致検索処理が制御される構成について説明するが、部分一致検索処理であれば特に限定されず、前方一致検索処理の代わりが例えば後方一致検索処理であってもよい。前方一致制御部107は、完全一致制御部103から受けたエンティティ検索キー及び属性検索キーを、前方一致検索部108に渡して、前方一致検索処理を実行させるよう指示する。また、前方一致制御部107は、前方一致検索部108から受信した検索結果を入出力制御部101に渡す。なお、前方一致制御部107は、前方一致検索部108から受信した検索結果が一件以上となった時点で、当該検索結果を入出力制御部101に渡す。これにより、当該検索結果がユーザ端末20に出力される。

0046

前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キーと前方一致する上記の「エンティティ」に対応付けられている、所望情報を検索する前方一致検索処理実行部分である。なお、前方一致検索部108は、後述する予め定められた所定の文字数よりも、エンティティ検索キーの文字数の方が大きい場合に、前方一致検索処理を行う。前方一致検索部108は、エンティティ属性データベース105にアクセスして、エンティティ検索キーと前方一致する上記の「エンティティ」に対応付けられている「値」の候補を抽出し(「エンティティ」一つに対する「値」の候補が複数の場合もある)、この「値」の候補から、属性検索キーに対応付けられている「値」を抽出することにより、前方一致検索処理を行う。前方一致検索部108は、検索結果を入出力制御部101に渡す。なお、後述する予め定められた所定の文字数が、エンティティ検索キーの文字数以上である場合に、前方一致検索部108は、検索結果がゼロ件である旨を示す情報を入出力制御部101に渡す。また、前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キー及び属性検索キーの組み合わせが複数存在する場合、各組み合わせについて順次、前方一致検索処理を行う。前方一致検索処理の検索結果が一件以上となった時点で当該検索結果を前方一致制御部107に出力する。

0047

なお、前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キーを正規化処理することによって、エンティティ検索キーから派生した文字列である派生文字列を取得することが可能である。エンティティ検索キーの正規化処理の詳細については既に述べたのでここでは割愛する。例えば、前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キーが「テリーポッター」である場合、このエンティティ検索キーを正規化処理することによって、派生文字列「テリポタ」を取得することが可能である。

0048

そして、前方一致検索部108は、取得した派生文字列を先頭(前方)から全て含む(前方一致する)「エンティティマッチング文字列」を、マッチング情報データベース106にアクセスして取得する。また、前方一致検索部108は、取得した「エンティティマッチング文字列」に対応付けて記憶される「エンティティ」を、マッチング情報データベース106にアクセスして取得する。更に、前方一致検索部108は、取得した「エンティティ」に対応付けられており且つ属性検索キーに対応付けられている「値」を、エンティティ属性データベース105にアクセスして抽出する。前方一致検索部108は、この抽出処理を上記の前方一致検索処理として行う。ここで、前方一致検索部108が、マッチング情報データベース106から取得した「エンティティ」と同一の「エンティティ」がエンティティ属性データベース105に存在しないことを検出することがあったとする。この場合、前方一致検索部108は、マッチング情報データベース106から取得した「エンティティ」と部分一致する「エンティティ」を、エンティティ属性データベース105から取得してもよい。そして、前方一致検索部108は、検索結果を前方一致制御部107に渡す。例えば、取得した派生文字列が「テリポタ」である場合、この「テリポタ」を先頭(前方)から全て含む文字列である「テリポタ1作目」及び「テリポタ2作目」(他にも、「テリポタ」で始まるエンティティマッチング文字列の全て)が「エンティティマッチング文字列」としてマッチング情報データベース106から取得される。

0049

そして、「テリポタ1作目」と対応付けて記憶される「テリーポッターと秘密の部屋」及び「テリポタ2作目」と対応付けて記憶される「テリーポッターとアズガバン囚人」が「エンティティ」としてマッチング情報データベース106から取得される。次に、前方一致検索部108は、取得した「テリーポッターと秘密の部屋」に対応付けられており且つ属性検索キーに対応付けられている「値」を抽出する。前方一致検索部108は、この抽出処理を上記の前方一致検索処理として行い、更に、「テリーポッターとアズガバンの囚人」に対応付けられており且つ属性検索キーに対応付けられている「値」を抽出する。前方一致検索部108は、この抽出処理を上記の前方一致検索処理として行う。ここで、属性検索キーが「映画監督」である場合、図3に示されるように、「値」としての「AAAAAA」(すなわち、「テリーポッターと秘密の部屋」の映画監督の名前)及び「BBBBBBB」(すなわち、「テリーポッターとアズガバンの囚人」の映画監督の名前)が抽出される。

0050

なお、前方一致検索部108は、予め定められた所定の文字数を取得するために、まず、エンティティカテゴリ判定部109にアクセスして、前方一致制御部107から受けた属性検索キーと対応付けて記憶されるカテゴリ情報を属性エンティティカテゴリデータベース110から取得する。カテゴリ情報は、属性検索キーによって示される属性が何れのカテゴリ(分野)に分類されるかを示す情報である。そして、前方一致検索部108は、前方一致文字数判定部111にアクセスして、属性エンティティカテゴリデータベース110から取得したカテゴリ情報と対応付けて記憶される、後述する予め定められた所定の文字数を、前方一致最低文字数データベース112から取得する。

0051

属性エンティティカテゴリデータベース110は、属性検索キーに対応する「属性」と、所望情報に関連するエンティティ検索キーのカテゴリ(分野)を示すカテゴリ情報に対応する「エンティティカテゴリ」とを、対応付けて記憶するデータベースである。属性エンティティカテゴリデータベース110のテーブル構成図の一例が、図5に示されている。ここでは、「属性」としての「映画監督」と、「エンティティカテゴリ」としての「映画作品」とが、対応付けて記憶されている。属性エンティティカテゴリデータベース110は、MySQL(登録商標)、PostgreSQL(登録商標)等のデータベース管理システムを用いて構成され、SQL等の問い合わせ言語を受け付けるシステムであってもよいし、データベース検索装置10の内部メモリに記憶されたハッシュ等のデータであってもよい。

0052

前方一致最低文字数データベース112は、所望情報に関連するエンティティ検索キーのカテゴリ(分野)を示すカテゴリ情報に対応する「エンティティカテゴリ」と、後述する予め定められた所定の文字数に対応する「前方一致実施最低文字数」とを、対応付けて記憶するデータベースである。前方一致最低文字数データベース112のテーブル構成図の一例が、図6に示されている。ここでは、「エンティティカテゴリ」としての「映画作品」と、「前方一致実施最低文字数」としての「4」とが、対応付けて記憶されている。前方一致最低文字数データベース112は、MySQL(登録商標)、PostgreSQL(登録商標)等のデータベース管理システムを用いて構成され、SQL等の問い合わせ言語を受け付けるシステムであってもよいし、データベース検索装置10の内部メモリに記憶されたハッシュ等のデータであってもよい。なお、属性エンティティカテゴリデータベース110及び前方一致最低文字数データベース112は、図7に示されるように、「属性」をキーにして統合されてもよい。

0053

例えば、前方一致検索部108は、前方一致制御部107を介してエンティティカテゴリ判定部109にアクセスして、前方一致制御部107から受けた属性検索キー「映画監督」と対応付けて記憶されるカテゴリ情報「映画作品」を、属性エンティティカテゴリデータベース110から取得する。そして、前方一致検索部108は、前方一致制御部107を介して前方一致文字数判定部111にアクセスして、属性エンティティカテゴリデータベース110から取得したカテゴリ情報「映画作品」と対応付けて記憶される、予め定められた所定の文字数「4」を、前方一致最低文字数データベース112から取得する。

0054

また、前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キー及び属性検索キーの組み合わせが複数存在する場合、各組み合わせについて順次、前方一致検索処理を行う。前方一致検索処理の検索結果が一件以上となった時点で当該検索結果を前方一致制御部107に出力する。例えば、エンティティ検索キー及び属性検索キーの組み合わせが二つだけ存在し、一つ目の組み合わせのエンティティ検索キーが「テリーポッター」であって属性検索キーが「映画監督」であり、二つ目の組み合わせのエンティティ検索キーが「テリーポッター」であって属性検索キーが「サッカーチーム監督」であるとする。この場合、前方一致検索部108は、まず、上記のように、属性検索キー「映画監督」と対応付けて記憶されるカテゴリ情報「映画作品」を属性エンティティカテゴリデータベース110から取得し、カテゴリ情報「映画作品」と対応付けて記憶される予め定められた所定の文字数「4」を取得する。所定の文字数「4」よりも、エンティティ検索キー「テリーポッター」の文字数「7」の方が大きいため、前方一致検索処理が行われる。

0055

この前方一致検索処理の検索結果がゼロ件であった場合、二つ目の組み合わせについても同様に、前方一致検索処理の実行可否を判定する処理が行われる。すなわち、前方一致検索部108は、上記のように、属性検索キー「サッカーチーム監督」と対応付けて記憶されるカテゴリ情報「スポーツ関連人物」を属性エンティティカテゴリデータベース110から取得し、カテゴリ情報「スポーツ関連人物」と対応付けて記憶される予め定められた所定の文字数「2」を取得する。所定の文字数「2」よりも、エンティティ検索キー「テリーポッター」の文字数「7」の方が大きいため、前方一致検索処理が行われる。この前方一致検索処理の検索結果がゼロ件であった場合、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて前方一致検索処理が完了したと判定されて、前方一致検索部108が、検索結果がゼロ件である旨を示す情報を入出力制御部101に渡す。なお、前方一致検索部108は、前方一致検索処理を行う際に、上記の正規化処理によって得られた派生文字列に対しても、この派生文字列と所定の文字数との比較結果に基づく前方一致検索処理の実施判定を行ってもよい。

0056

エンティティカテゴリ判定部109は、前方一致制御部107から属性検索キーを受けると、属性エンティティカテゴリデータベース110から、属性検索キーと対応付けて記憶されるカテゴリ情報を取得して、前方一致制御部107を介して前方一致検索部108に渡す判定処理部分である。

0057

前方一致文字数判定部111は、前方一致制御部107からカテゴリ情報を受けると、前方一致最低文字数データベース112から、カテゴリ情報と対応付けて記憶される予め定められた所定の文字数を取得して、前方一致制御部107を介して前方一致検索部108に渡す判定処理部分である。

0058

ユーザ端末20は、図1に示されるように、主な機能的な構成要素として、送信部201(送信手段)及び取得部202(結果取得手段)を有している。

0059

送信部201は、データベース検索装置10との通信を行う通信処理部分である。例えば、送信部201は、上記の所望情報を検索するための検索語を含む検索情報を、データベース検索装置10に送信することが可能である。例えば、送信部201は、ユーザ端末20においてユーザにより入力された検索フレーズ(検索情報)を、データベース検索装置10に送信することが可能である。検索フレーズは、ユーザ端末20において入力された音声に対して音声認識処理が行われて得られた文字等の情報であってもよく、ユーザ端末20のキーボードやタッチパネルを用いて入力されたものであってもよい。

0060

取得部202は、データベース検索装置10との通信を行う通信処理部分である。例えば、取得部202は、データベース検索装置10における完全一致検索処理及び前方一致検索処理の検索結果を、データベース検索装置10から受信して取得することが可能である。取得部202が取得した検索結果は、ユーザ端末20のディスプレイ等に表示される。

0061

(2)データベース検索装置における検索処理の流れ
引き続き、データベース検索装置10における検索処理の流れ(情報検索方法)について、図8を用いて説明する。図8は、データベース検索装置10における検索処理の流れを説明するためのフローチャートである。図8のフローチャートに示される処理は、データベース検索装置10に検索フレーズ(検索ワード)が入力される度に実行開始され、入力された検索フレーズのそれぞれに関する後述する一連の処理の完了まで実行される。

0062

まず、入出力制御部101が、上記の所望情報を検索するための検索語を含む検索情報を、ユーザ端末20から受信して、受信した検索情報から検索語を取得する(ステップS01、検索語取得ステップ)。これにより、検索語の入力が受け付けられる。そして、入出力制御部101は、この検索語をキー候補検出部102に渡す。検索フレーズは、ユーザ端末20において入力された音声に対して音声認識処理が行われて得られた文字等の情報であってもよく、キーボードやタッチパネルを用いて入力されたものであってもよい。検索フレーズは、例えば、ある映画の監督を問い合わせるものから、歴史的な事実を尋ねるものまで、様々な分野について質問する型式で入力される。検索フレーズの一例として、「テリーポッター」という題名の映画が存在すると仮定した場合に、「テリーポッターの監督は誰」といった自然文の検索フレーズ、「テリーポッター 監督」といった二つの検索キーワードの組合せである検索フレーズ等がある。

0063

次に、キー候補検出部102が、入出力制御部101により取得された検索語から、所望情報に関連するエンティティ検索キーと、所望情報の属性を示す属性検索キーとを抽出して検出する(ステップS02、検出ステップ)。キー候補検出部102は、検出したエンティティ検索キー及び属性検索キーを完全一致制御部103に渡す。例えば、入出力制御部101により取得された検索語が二つの検索キーワードの組合せである場合、キー候補検出部102は、一つ目の検索キーワードがエンティティ検索キーであると判断してエンティティ検索キーを検出し、二つ目の検索キーワードが属性検索キーであると判断して属性検索キーを検出する。より詳しくは、例えば、入出力制御部101により取得された検索語が「テリーポッター監督」である場合、一つ目の検索キーワードである「テリーポッター」がエンティティ検索キーであるとして検出され、二つ目の検索キーワードである「監督」が属性検索キーであるとして検出される。

0064

また、エンティティ検索キー及び属性検索キーの組み合わせは、複数であってもよい。例えば、入出力制御部101により取得された検索語が「テリーポッター監督」である場合、「テリーポッター」がエンティティ検索キーであるとして検出され、「映画監督」が属性検索キーであるとして検出される組み合わせだけでなく、更に、「テリーポッター」がエンティティ検索キーであるとして検出され、「サッカーチーム監督」が属性検索キーであるとして検出される組み合わせが存在してもよい。また、入出力制御部101により取得された検索語が「テリーポッターの監督は誰」である場合、キー候補検出部102が上記のパターンに当てはまったと判定することにより、「テリーポッター」がエンティティ検索キーであるとして検出され、「監督」が属性検索キーであるとして検出される。

0065

次に、完全一致制御部103が、キー候補検出部102から受けたエンティティ検索キー及び属性検索キーを、完全一致検索部104に渡して、上記の完全一致検索処理を実行させるよう指示する(ステップS03、検索ステップ)。完全一致検索部104は、エンティティ属性データベース105にアクセスして、エンティティ検索キーと完全一致する上記の「エンティティ」に対応付けられている「値」の候補を抽出し(「エンティティ」一つに対する「値」の候補が複数の場合もある)、この「値」の候補から、属性検索キーに対応付けられている「値」を抽出することにより、完全一致検索処理を行う。

0066

次に、完全一致制御部103が、完全一致検索部104から受信した検索結果が一件以上であるか否かを判定する(ステップS04)。完全一致検索部104から受信した検索結果が一件以上であると判定された場合、後述のステップS05に移行する。一方、完全一致検索部104から受信した検索結果がゼロ件であると判定された場合、後述のステップS06に移行する。

0067

ステップS05では、完全一致制御部103又は前方一致制御部107が、完全一致検索部104又は前方一致検索部108から受信した検索結果を入出力制御部101に渡す。これにより、当該検索結果がユーザ端末20に出力される。そして、一連の処理は完了する。

0068

ステップS06では、完全一致制御部103が、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて完全一致検索処理が完了したか否かを判定する。エンティティ検索キーと属性検索キーのペア全てについて完全一致検索処理が完了していないと判定された場合、完全一致制御部103が、完全一致検索処理が完了していないエンティティ検索キー及び属性検索キーの組み合わせを、完全一致検索部104に渡して、前述のステップS03に移行する。一方、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて完全一致検索処理が完了したと判定された場合、完全一致制御部103が、キー候補検出部102から受けたエンティティ検索キー及び属性検索キーを、前方一致制御部107に渡す。前方一致制御部107は、完全一致制御部103から受けたエンティティ検索キー及び属性検索キーを、前方一致検索部108に渡して、前方一致検索処理を実行させるよう指示する。

0069

そして、前方一致検索部108が、エンティティカテゴリ判定部109にアクセスして、前方一致制御部107から受けた属性検索キーと対応付けて記憶されるカテゴリ情報を属性エンティティカテゴリデータベース110から取得する(ステップS07)。

0070

そして、前方一致検索部108が、前方一致文字数判定部111にアクセスして、属性エンティティカテゴリデータベース110から取得したカテゴリ情報と対応付けて記憶される、上記の予め定められた所定の文字数(前方一致実施最低文字数)を、前方一致最低文字数データベース112から取得する(ステップS08)。例えば、前方一致検索部108は、前方一致文字数判定部111にアクセスして、属性エンティティカテゴリデータベース110から取得したカテゴリ情報「映画作品」と対応付けて記憶される、予め定められた所定の文字数「4」を、前方一致最低文字数データベース112から取得する。

0071

そして、前方一致検索部108が、上記の予め定められた所定の文字数よりも、前方一致制御部107から受けたエンティティ検索キーの文字数の方が、大きいか否かを判定する(ステップS09)。上記の予め定められた所定の文字数よりも、前方一致制御部107から受けたエンティティ検索キーの文字数の方が、大きいと判定された場合、後述のステップS10に移行する。一方、前方一致制御部107から受けたエンティティ検索キーの文字数が、上記の予め定められた所定の文字数以下であると判定された場合、後述のステップS12に移行する。

0072

ステップS10では、前方一致検索部108が、エンティティ属性データベース105にアクセスして、エンティティ検索キーと前方一致する上記の「エンティティ」に対応付けられている所望情報の候補を抽出し(「エンティティ」一つに対する「値」の候補が複数の場合もある)、この所望情報の候補から、属性検索キーに対応付けられている所望情報を抽出することにより、前方一致検索処理を行う(検索ステップ)。前方一致検索部108は、検索結果を入出力制御部101に渡す。そして、ステップS11に移行する。

0073

より詳しくは、前方一致検索部108は、例えば、エンティティ検索キーが「テリーポッター」である場合、このエンティティ検索キーを正規化処理することによって、派生文字列「テリポタ」を取得する。そして、前方一致検索部108は、派生文字列「テリポタ」を先頭(前方)から全て含む「エンティティマッチング文字列」である「テリポタ1作目」及び「テリポタ2作目」を、マッチング情報データベース106にアクセスして取得する。そして、前方一致検索部108は、取得した「エンティティマッチング文字列」である「テリポタ1作目」に対応付けられて記憶されている「テリーポッターと秘密の部屋」を「エンティティ」として取得し、取得した「テリーポッターと秘密の部屋」に対応付けられており且つ属性検索キーに対応付けられている「値」をエンティティ属性データベース105から抽出することにより、上記の前方一致検索処理を行う。ここで、属性検索キーが「映画監督」である場合、図3に示されるように、「値」としての「AAAAAA」(すなわち、「テリーポッターと秘密の部屋」の映画監督の名前)が抽出される。更に、前方一致検索部108は、取得した「エンティティマッチング文字列」である「テリポタ2作目」に対応付けられて記憶されている「テリーポッターとアズガバンの囚人」を「エンティティとして取得し、取得した「テリーポッターとアズガバンの囚人」に対応付けられており且つ属性検索キーに対応付けられている「値」をエンティティ属性データベース105から抽出することにより、上記の前方一致検索処理を行う。ここで、属性検索キーが「映画監督」である場合、図3に示されるように、「値」としての「BBBBBBB」(すなわち、「テリーポッターとアズガバンの囚人」の映画監督の名前)が抽出される。

0074

ステップS11では、前方一致制御部107が、前方一致検索部108から受信した検索結果が一件以上であるか否かを判定する。前方一致検索部108から受信した検索結果が一件以上であると判定された場合、前述のステップS05に移行する。一方、前方一致検索部108から受信した検索結果がゼロ件であると判定された場合、後述のステップS12に移行する。

0075

ステップS12では、前方一致制御部107が、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて前方一致検索処理が完了したか否かを判定する。エンティティ検索キーと属性検索キーのペア全てについて前方一致検索処理が完了していないと判定された場合、前方一致制御部107が、前方一致検索処理が完了していないエンティティ検索キー及び属性検索キーの組み合わせを、前方一致検索部108に渡して、前述のステップS07に移行する。一方、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて前方一致検索処理が完了したと判定された場合、前方一致検索部108が、検索結果がゼロ件である旨を示す情報を入出力制御部101に渡す(ステップS13)。そして、前述のステップS05に移行する。

0076

(3)本発明による作用及び効果
データベース検索装置10によれば、検索語が取得され、取得された検索語から上記のエンティティ検索キー及び属性検索キーが検出される。そして、検出されたエンティティ検索キーと完全一致する「エンティティ」に対応付けられているとともに属性検索キーに対応付けられている所望情報を検索する完全一致検索処理が行われる。ここで、完全一致検索処理の検索結果がゼロ件の場合に、検出されたエンティティ検索キーと前方一致する「エンティティ」に対応付けられている所望情報を検索する前方一致検索処理が行われる。このように、上記の完全一致検索処理の検索結果がゼロ件の場合に、検出されたエンティティ検索キーと前方一致する「エンティティ」に対応付けられている所望情報を検索する前方一致検索処理が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。

0077

また、データベース検索装置10によれば、完全一致検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりもエンティティ検索キーの文字数の方が大きい場合に、前方一致検索処理が行われる。エンティティ検索キーの文字数の方が大きくなればなるほど、上記の完全一致検索処理の検索結果がゼロ件になる可能性も高くなる。このため、所定の文字数よりもエンティティ検索キーの文字数の方が大きいため前方一致検索処理を行う方がより適切な状態である場合に、前方一致検索処理を行うことが可能になる。また、完全一致検索処理と前方一致検索処理が組み合わせられているため、ユーザ端末20のユーザが適切な検索情報を入力することにより、入力された検索情報の文字数が前方一致検索処理の実行に繋がる文字数であるか否かに関わらず、検索結果の出力が担保される。

0078

また、データベース検索装置10によれば、検出された属性検索キーと対応付けて記憶されるカテゴリ情報が取得され、当該カテゴリ情報と対応付けて記憶される所定の文字数が取得される。検出された属性検索キーに適した所定の文字数が取得され、所定の文字数よりも関連ワードの文字数の方が大きいため前方一致検索処理を行う方がより適切な状態である場合に、前方一致検索処理を行うことが可能になる。また、カテゴリ情報が異なれば所定の文字数も異なるように変更設定が可能である。このため、短い文字数の文字列長で前方一致検索処理を行うことが適切な分野では、このような短い文字数の文字列長で検索することが可能になる。その結果、ユーザ端末20のユーザの期待する結果を表示しないようにする処理を必要以上に行わないようにすることができる。

0079

また、データベース検索装置10によれば、検出されたエンティティ検索キーから派生した文字列と完全一致する派生語に対応付けて記憶される「エンティティ」に対応付けられている「値」をエンティティ属性データベース105から検索する処理が完全一致検索処理として行われ、完全一致検索処理の検索結果がゼロ件の場合に、検出されたエンティティ検索キーから派生した文字列と部分一致する派生語に対応付けて記憶される「エンティティ」に対応付けられている「値」をエンティティ属性データベース105から検索する処理が前方一致検索処理として行われる。これにより、検出されたエンティティ検索キーが、エンティティ検索キーとして適切なものから派生したもの(例えば、揺らぎを有するもの)であっても、適切なエンティティ検索キーの取得及び検出が可能になる。

0080

また、データベース検索装置10によれば、検索語から、エンティティ検索キーと属性検索キーとの組が複数検出され、検出されたエンティティ検索キーと属性検索キーとの組を複数用いて完全一致検索処理を行って検索結果が一件以上となった時点で当該検索結果が出力されるとともに、完全一致検索処理の検索結果がゼロ件の場合に、検出されたエンティティ検索キーと属性検索キーとの組を複数用いて前方一致検索処理を行って検索結果が一件以上となった時点で当該検索結果が出力される。このように、検出されたエンティティ検索キーと属性検索キーとの組を複数用いて検索結果が一件以上となった時点で当該検索結果が出力されるため、検索処理に必要な時間を短縮することが可能になる。

0081

(4)変形例
上記の実施例では、図8に示されるように、完全一致制御部103が、完全一致検索部104から受信した検索結果が一件以上であるか否かを判定し(ステップS04)、完全一致検索部104から受信した検索結果が一件以上であると判定された場合、完全一致制御部103が、完全一致検索部104から受信した検索結果を入出力制御部101に渡す(ステップS05)。これにより、当該検索結果がユーザ端末20に出力される。

0082

ここで、ステップS02において、エンティティ検索キー及び属性検索キーの組み合わせの候補が複数検出された場合(例えば、エンティティ検索キー及び属性検索キーの組み合わせの候補C1,C2,C3が検出された場合)、ステップS04において、複数の候補のそれぞれについての検索結果の合計件数(候補C1の検索結果の件数と、候補C2の検索結果の件数と、候補C3の検索結果の件数の合計件数)が一件以上であるか否かを判定する構成としてもよい。

0083

この構成を採用する場合、ステップS05では、複数の候補のそれぞれについての検索結果の合計件数が一件以上であると判定された場合、完全一致制御部103は、この合計件数を示す検索結果を入出力制御部101に渡す。これにより、この合計件数を示す検索結果がユーザ端末20に出力されるようになる。

0084

このため、エンティティ検索キー及び属性検索キーの検出精度が低い場合でも、上記のようにエンティティ検索キー及び属性検索キーの組み合わせの複数の候補を利用して各候補についての検索結果を得ることにより、より適切な検索結果を得ることができる場面を増やすことが可能になる。

0085

なお、上述したように、上記の実施例では部分一致検索処理の一例として前方一致検索処理が制御される構成について説明したが、部分一致検索処理であれば特に限定されず、例えば後方一致検索処理であってもよい。

0086

本発明によれば、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置、情報検索システム、及び情報検索方法を提供することができる。

0087

1…情報検索システム、10…データベース検索装置、20…ユーザ端末、101…入出力制御部、102…キー候補検出部、103…完全一致制御部、104…完全一致検索部、105…エンティティ属性データベース、106…マッチング情報データベース、107…前方一致制御部、108…前方一致検索部、109…エンティティカテゴリ判定部、110…属性エンティティカテゴリデータベース、111…前方一致文字数判定部、112…前方一致最低文字数データベース、201…送信部、202…取得部、NW…通信ネットワーク。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社ソケッツの「 検索装置および方法」が 公開されました。( 2019/09/19)

    【課題】同一の感性ワードで加重的に絞り込み検索を行えるようにする。【解決手段】同一の感性ワードで加重的に絞り込み検索を行う場合、類似・関連ワード抽出部319が、感性ワードに類似・関連する別のワードを検... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】ユーザの移動の妨害に応じた適切な対応を可能にする。【解決手段】本願に係る情報処理装置は、取得部と、決定部とを有する。取得部は、ユーザの位置情報と、ユーザが位置するエリアにおいて発生する事象のう... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】類似のコンテンツを適切に抽出する。【解決手段】本願に係る情報処理装置は、取得部と、検索部とを有する。取得部は、複数のコンテンツの各々に対応する複数のノードが、複数のコンテンツの類似性に応じて連... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ