図面 (/)

技術 関連語提示装置及び関連語提示用プログラムを記録した媒体

出願人 富士ゼロックス株式会社
発明者 増市博
出願日 1997年5月27日 (22年3ヶ月経過) 出願番号 1997-137300
公開日 1998年12月18日 (20年9ヶ月経過) 公開番号 1998-334105
状態 特許登録済
技術分野 検索装置
主要キーワード 論理積演算子 重複回数 液体軸受 比較対 気体潤滑 絞り込み後 識別子数 検索結果表示用
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1998年12月18日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (15)

課題

検索条件を変更したことによって検索結果が受ける影響を容易に確認できるようにする。

解決手段

検索条件受取手段2は、ユーザがキーボード等の入力装置を用いて入力した複数の検索条件を受け取る。文書検索手段3は、検索条件受取手段2が受け取った各検索条件適合する文書集合を、文書格納手段1から取得する。関連度計算手段4は、まず、文書検索手段3が取得した文書集合中に存在する各単語を関連語候補とする。そして、検索条件受取手段2が受け取った検索条件と各関連語候補との間の関連度を、検索条件ごとに計算する。関連語計算手段5は、検索条件受取手段2が受け取った各検索条件に応じて関連度計算手段4により算出された各関連語候補の関連度を比較し、各関連語候補の関連度の値の変化に基づいて関連語を決定する。関連語表示手段6は、関連語計算手段5が決定した関連語を表示装置に表示する。

概要

背景

検索システムでは、一般にキーワードによる検索方法が用いられている。検索条件として任意のキーワード(検索語)を検索システムに入力すると、文書内容に検索語を含む全ての文書検索結果として得られる。ところが、このような検索システムで多量の文献情報を検索対象とする場合、必然的に検索結果も多量になり、その適合性を判断するために多大の労力を費やすことになる。この労力には、個人差はあるせよ、無益点と呼ばれる物理的/心理的限界がある。検索結果がその限界を超えてしまう場合は、適合性の判断に要する労力を軽減しようとして、検索結果を絞り込む行動をとりがちである。これは、適合する検索結果を得ることよりも、検索結果の量が無益点を下回ることの方を重視しがちであることを示している。そのため、検索対象を絞り込むための論理積演算子過度に使用することになり、結果として、本来なら検索できた有用な文献の検索漏れを生じさせることになる。大規模全文データベースの検索では、この傾向は特に顕著である。

そこで、「特開平2−297290号公報」において提案されているように、関連語辞書を用いることにより検索語の関連語をユーザに提示する方法が用いられている。ユーザは、検索式に含まれている検索語の関連語の中から適切な語を選択して論理積演算子で結合し、検索結果を絞り込むことによって、前述のような盲目的な絞り込みを避けることができる。

例えば、ユーザが入力した検索語が「軸受」の場合、関連語辞書から「軸受」の関連語として「玉軸受」「マイクロボール軸受」「液体軸受」「気体潤滑軸受」「磁気軸受」などを取得し、ユーザに提示する。ここで、ユーザが「磁気軸受」について知りたい場合、「磁気軸受」を新たな検索語とする(あるいは「軸受」に対して「磁気」を論理積演算子で結合する)ことによって、検索結果の絞り込みを適切に行うことができる。

すなわち、検索語の関連語として提示された語の中から検索意図に沿った語を選択し、論理積演算子で結合することによって、的確な検索結果の絞り込みを行うことが可能となる。

概要

検索条件を変更したことによって検索結果が受ける影響を容易に確認できるようにする。

検索条件受取手段2は、ユーザがキーボード等の入力装置を用いて入力した複数の検索条件を受け取る。文書検索手段3は、検索条件受取手段2が受け取った各検索条件に適合する文書集合を、文書格納手段1から取得する。関連度計算手段4は、まず、文書検索手段3が取得した文書集合中に存在する各単語を関連語候補とする。そして、検索条件受取手段2が受け取った検索条件と各関連語候補との間の関連度を、検索条件ごとに計算する。関連語計算手段5は、検索条件受取手段2が受け取った各検索条件に応じて関連度計算手段4により算出された各関連語候補の関連度を比較し、各関連語候補の関連度の値の変化に基づいて関連語を決定する。関連語表示手段6は、関連語計算手段5が決定した関連語を表示装置に表示する。

目的

本発明はこのような点に鑑みてなされたものであり、検索条件を変更したことによって検索結果が受ける影響を容易に確認できる関連語提示装置を提供することを目的とする。

また、本発明の他の目的は、検索条件を変更したことによって検索結果が受ける影響を容易に確認できるようにコンピュータを機能させるための関連語提示用プログラムを記録した媒体を提供することである。

効果

実績

技術文献被引用数
4件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

検索条件に関連する単語を提示する関連語提示装置において、複数の文書を格納する文書格納手段と、入力された複数の検索条件を受け取る検索条件受取手段と、前記検索条件受取手段が受け取った各検索条件適合する文書集合を前記文書格納手段から取得する文書検索手段と、前記文書検索手段が取得した文書集合中に存在する各単語を関連語候補とし、前記文書検索手段が取得した文書の数である第1の値と、前記文書検索手段が取得した文書集合の中で各関連語候補を含んでいる文書の数である関連語候補ごとの第2の値と、前記文書格納手段に格納されている文書の中で各関連語候補を含んでいる文書の数である関連語候補ごとの第3の値とを取得し、第1の値と第3の値との積あるいは和である第4の値を関連語候補ごとに計算し、第2の値と第4の値との比率に基づいて、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度を、検索条件ごとに計算する関連度計算手段と、前記検索条件受取手段が受け取った各検索条件に応じて前記関連度計算手段により算出された各関連語候補の関連度を比較し、各関連語候補の関連度の値の変化に基づいて関連語を決定する関連語計算手段と、前記関連語計算手段が決定した関連語を表示装置に表示する関連語表示手段と、を有することを特徴とする関連語提示装置。

請求項2

前記関連度計算手段は、前記文書格納手段に格納されている全ての文書の数をMとし、第1の値をα、関連語候補ごとの第2の値をβ、関連語候補ごとの第3の値をγとした場合に、以下の計算式拡張相互情報量=log2 {(Mβ)/(αγ)}で求められる拡張相互情報量の値を、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度とすることを特徴とする請求項1記載の関連語提示装置。

請求項3

前記関連度計算手段は、前記文書格納手段に格納されている全ての文書の数をMとし、第1の値をα、関連語候補ごとの第2の値をβ、関連語候補ごとの第3の値をγとした場合に、拡張TS(t-score) =M{( Mβ−αγ)/(αγ)}で求められる拡張TSの値を、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度とすることを特徴とする請求項1記載の関連語提示装置。

請求項4

前記関連度計算手段は、第1の値をα、関連語候補ごとの第2の値をβ、関連語候補ごとの第3の値をγとした場合に、以下の計算式、拡張DC(Dice-coefficent) =2β/( α+γ)で求められる拡張DCの値を、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度とすることを特徴とする請求項1記載の関連語提示装置。

請求項5

前記関連語計算手段は、文書検索の絞り込み前と絞り込み後との2つの検索条件に基づいて関連語を決定する場合、絞り込み前の検索条件との間の関連度よりも、絞り込み後の検索条件との間の関連度の方が大きい値である単語を関連度増加語とし、絞り込み前の検索条件との間の関連度よりも、絞り込み後の検索条件との間の関連度の方が小さい値である関連語候補を関連度減少語とし、関連度増加語と関連度減少語とを関連語とすることを特徴とする請求項1記載の関連語提示装置。

請求項6

検索条件に関連する単語を提示する関連語提示装置において、複数の文書を格納する文書格納手段と、文書検索の絞り込み前と絞り込み後との検索条件の対を受け取る検索条件受取手段と、前記検索条件受取手段が受け取った検索条件の一方の検索条件を満たし、他方の検索条件を満たさない文書集合を、前記文書格納手段から取得する文書検索手段と、前記文書検索手段が取得した文書集合中に存在する各単語を関連語候補とし、前記文書検索手段が取得した文書の数である第1の値と、前記文書検索手段が取得した文書集合の中に存在する各関連語候補を含んでいる文書の数である関連語候補ごとの第2の値と、前記文書格納手段に格納されている文書の中で、各関連語候補を含んでいる文書の数である関連語候補ごとの第3の値とを取得し、第1の値と第3の値との積あるいは和である第4の値を関連語候補ごとに計算し、第2の値と第4の値との比率に基づいて、前記検索条件受取手段が受け取った検索条件の対と各関連語候補との間の関連度を計算する関連度計算手段と、前記関連度計算手段から得られた関連度が一定の値以上となる関連語候補を関連語とする関連語計算手段と、前記関連語計算手段が決定した関連語を表示装置に表示する関連語表示手段と、を有することを特徴とする関連語提示装置。

請求項7

前記関連語計算手段は、絞り込み前の検索条件を満たし、絞り込み後の検索条件を満たさない文書集合に基づいて得られた関連度が、予め定められた値以上となる関連語候補を関連度減少語とし、絞り込み前の検索条件を満たさず、絞り込み後の検索条件を満たす文書集合に基づいて得られた関連度が、予め定められた値以上となる関連語候補を関連度増加語とし、関連度増加語と関連度減少語とを関連語とすることを特徴とする請求項6記載の関連語提示装置。

請求項8

前記関連度計算手段は、前記文書格納手段に格納されている全ての文書の数をMとし、第1の値をα、関連語候補ごとの第2の値をβ、関連語候補ごとの第3の値をγとした場合に、以下の計算式、拡張相互情報量=log2 {(Mβ)/(αγ)}で求められる拡張相互情報量の値を、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度とすることを特徴とする請求項6記載の関連語提示装置。

請求項9

前記関連度計算手段は、前記文書格納手段に格納されている全ての文書の数をMとし、第1の値をα、関連語候補ごとの第2の値をβ、関連語候補ごとの第3の値をγとした場合に、拡張TS(t-score) =M{( Mβ−αγ)/(αγ)}で求められる拡張TSの値を、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度とすることを特徴とする請求項6記載の関連語提示装置。

請求項10

前記関連度計算手段は、第1の値をα、関連語候補ごとの第2の値をβ、関連語候補ごとの第3の値をγとした場合に、以下の計算式、拡張DC(Dice-coefficent) =2β/( α+γ)で求められる拡張DCの値を、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度とすることを特徴とする請求項6記載の関連語提示装置。

請求項11

検索条件に関連する単語の提示をコンピュータに行わせるための関連語提示用プログラムを記録した媒体において、複数の文書を格納する文書格納手段、入力された複数の検索条件を受け取る検索条件受取手段、前記検索条件受取手段が受け取った各検索条件に適合する文書集合を前記文書格納手段から取得する文書検索手段、前記文書検索手段が取得した文書集合中に存在する各単語を関連語候補とし、前記文書検索手段が取得した文書の数である第1の値と、前記文書検索手段が取得した文書集合の中で各関連語候補を含んでいる文書の数である関連語候補ごとの第2の値と、前記文書格納手段に格納されている文書の中で各関連語候補を含んでいる文書の数である関連語候補ごとの第3の値とを取得し、第1の値と第3の値との積あるいは和である第4の値を関連語候補ごとに計算し、第2の値と第4の値との比率に基づいて、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度を、検索条件ごとに計算する関連度計算手段、前記検索条件受取手段が受け取った各検索条件に応じて前記関連度計算手段により算出された各関連語候補の関連度を比較し、各関連語候補の関連度の値の変化に基づいて関連語を決定する関連語計算手段、前記関連語計算手段が決定した関連語を表示装置に表示する関連語表示手段、としてコンピュータを機能させるための関連語提示用プログラムを記録した媒体。

請求項12

検索条件に関連する単語の提示をコンピュータに行わせるための関連語提示用プログラムを記録した媒体において、複数の文書を格納する文書格納手段、文書検索の絞り込み前と絞り込み後との検索条件の対を受け取る検索条件受取手段、前記検索条件受取手段が受け取った検索条件の一方の検索条件を満たし、他方の検索条件を満たさない文書集合を、前記文書格納手段から取得する文書検索手段、前記文書検索手段が取得した文書集合中に存在する各単語を関連語候補とし、前記文書検索手段が取得した文書の数である第1の値と、前記文書検索手段が取得した文書集合の中に存在する各関連語候補を含んでいる文書の数である関連語候補ごとの第2の値と、前記文書格納手段に格納されている文書の中で、各関連語候補を含んでいる文書の数である関連語候補ごとの第3の値とを取得し、第1の値と第3の値との積あるいは和である第4の値を関連語候補ごとに計算し、第2の値と第4の値との比率に基づいて、前記検索条件受取手段が受け取った検索条件の対と各関連語候補との間の関連度を計算する関連度計算手段、前記関連度計算手段から得られた関連度が一定の値以上となる関連語候補を関連語とする関連語計算手段、前記関連語計算手段が決定した関連語を表示装置に表示する関連語表示手段、としてコンピュータを機能させるための関連語提示用プログラムを記録した媒体。

技術分野

0001

本発明は関連語提示装置及び関連語提示用プログラムを記録した媒体に関し、特に検索条件に関連する単語を提示する関連語提示装置及び検索条件に関連する単語の提示をコンピュータに行わせるための関連語提示用プログラムを記録した媒体に関する。

背景技術

0002

検索システムでは、一般にキーワードによる検索方法が用いられている。検索条件として任意のキーワード(検索語)を検索システムに入力すると、文書内容に検索語を含む全ての文書検索結果として得られる。ところが、このような検索システムで多量の文献情報を検索対象とする場合、必然的に検索結果も多量になり、その適合性を判断するために多大の労力を費やすことになる。この労力には、個人差はあるせよ、無益点と呼ばれる物理的/心理的限界がある。検索結果がその限界を超えてしまう場合は、適合性の判断に要する労力を軽減しようとして、検索結果を絞り込む行動をとりがちである。これは、適合する検索結果を得ることよりも、検索結果の量が無益点を下回ることの方を重視しがちであることを示している。そのため、検索対象を絞り込むための論理積演算子過度に使用することになり、結果として、本来なら検索できた有用な文献の検索漏れを生じさせることになる。大規模全文データベースの検索では、この傾向は特に顕著である。

0003

そこで、「特開平2−297290号公報」において提案されているように、関連語辞書を用いることにより検索語の関連語をユーザに提示する方法が用いられている。ユーザは、検索式に含まれている検索語の関連語の中から適切な語を選択して論理積演算子で結合し、検索結果を絞り込むことによって、前述のような盲目的な絞り込みを避けることができる。

0004

例えば、ユーザが入力した検索語が「軸受」の場合、関連語辞書から「軸受」の関連語として「玉軸受」「マイクロボール軸受」「液体軸受」「気体潤滑軸受」「磁気軸受」などを取得し、ユーザに提示する。ここで、ユーザが「磁気軸受」について知りたい場合、「磁気軸受」を新たな検索語とする(あるいは「軸受」に対して「磁気」を論理積演算子で結合する)ことによって、検索結果の絞り込みを適切に行うことができる。

0005

すなわち、検索語の関連語として提示された語の中から検索意図に沿った語を選択し、論理積演算子で結合することによって、的確な検索結果の絞り込みを行うことが可能となる。

発明が解決しようとする課題

0006

しかし、通常のキーワード検索では検索語と完全一致する文書のみを検索結果とするため、検索結果が必要以上に絞り込まれてしまう場合が多いにもかかわらず、検索結果が必要以上に絞り込まれていないかどうかを、ユーザが簡単に知ることができないという問題点があった。

0007

絞り込みが過度なものでない(重要な検索結果が漏れしまっていない)ことをユーザが確認するためには、絞り込み前の検索結果と絞り込み後の検索結果との両者の内容を比較対比しなければならない。このような確認作業は、検索結果が大量であることから考えて実際には不可能である。そのため、上記の従来技術では、絞り込みによってどのような検索結果が得られたのか(絞り込みによって検索結果がどのように変化したのか)については何も知ることができない。したがって、絞り込みによって得られた検索結果が検索意図に沿わない(検索漏れが極めて多い)場合でも、その検索結果を最終結果として採用してしまうことになる。

0008

本発明はこのような点に鑑みてなされたものであり、検索条件を変更したことによって検索結果が受ける影響を容易に確認できる関連語提示装置を提供することを目的とする。

0009

また、本発明の他の目的は、検索条件を変更したことによって検索結果が受ける影響を容易に確認できるようにコンピュータを機能させるための関連語提示用プログラムを記録した媒体を提供することである。

課題を解決するための手段

0010

本発明では上記課題を解決するために、検索条件に関連する単語を提示する関連語提示装置において、複数の文書を格納する文書格納手段と、入力された複数の検索条件を受け取る検索条件受取手段と、前記検索条件受取手段が受け取った各検索条件に適合する文書集合を前記文書格納手段から取得する文書検索手段と、前記文書検索手段が取得した文書集合中に存在する各単語を関連語候補とし、前記文書検索手段が取得した文書の数である第1の値と、前記文書検索手段が取得した文書集合の中で各関連語候補を含んでいる文書の数である関連語候補ごとの第2の値と、前記文書格納手段に格納されている文書の中で各関連語候補を含んでいる文書の数である関連語候補ごとの第3の値とを取得し、第1の値と第3の値との積あるいは和である第4の値を関連語候補ごとに計算し、第2の値と第4の値との比率に基づいて、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度を、検索条件ごとに計算する関連度計算手段と、前記検索条件受取手段が受け取った各検索条件に応じて前記関連度計算手段により算出された各関連語候補の関連度を比較し、各関連語候補の関連度の値の変化に基づいて関連語を決定する関連語計算手段と、前記関連語計算手段が決定した関連語を表示装置に表示する関連語表示手段と、を有することを特徴とする関連語提示装置が提供される。

0011

この関連語提示装置によれば、入力された複数の検索条件が検索条件受取手段によって受け取られ、文書検索手段により、各検索条件に適合する文書集合が文書格納手段から取得される。次に、関連度計算手段によって、検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度が、検索条件ごとに計算される。すると、関連語計算手段により、検索条件受取手段が受け取った各検索条件に応じて関連度計算手段により算出された各関連語候補の関連度が比較され、各単語の関連度の値の変化に基づいて関連語が決定される。決定された関連語は、関連語表示手段によって表示装置に表示される。これにより、複数の検索条件のそれぞれから得られる検索結果の相違点を、その検索結果から抽出された単語の関連度の変化によって容易に確認することができる。

0012

また、検索条件に関連する単語の提示をコンピュータに行わせるための関連語提示用プログラムを記録した媒体において、複数の文書を格納する文書格納手段、入力された複数の検索条件を受け取る検索条件受取手段、前記検索条件受取手段が受け取った各検索条件に適合する文書集合を前記文書格納手段から取得する文書検索手段、前記文書検索手段が取得した文書集合中に存在する各単語を関連語候補とし、前記文書検索手段が取得した文書の数である第1の値と、前記文書検索手段が取得した文書集合の中で各関連語候補を含んでいる文書の数である関連語候補ごとの第2の値と、前記文書格納手段に格納されている文書の中で各関連語候補を含んでいる文書の数である関連語候補ごとの第3の値とを取得し、第1の値と第3の値との積あるいは和である第4の値を関連語候補ごとに計算し、第2の値と第4の値との比率に基づいて、前記検索条件受取手段が受け取った検索条件と各関連語候補との間の関連度を、検索条件ごとに計算する関連度計算手段、前記検索条件受取手段が受け取った各検索条件に応じて前記関連度計算手段により算出された各関連語候補の関連度を比較し、各関連語候補の関連度の値の変化に基づいて関連語を決定する関連語計算手段、前記関連語計算手段が決定した関連語を表示装置に表示する関連語表示手段、としてコンピュータを機能させるための関連語提示用プログラムを記録した媒体が提供される。

0013

この媒体に記録された関連語提示用プログラムをコンピュータで実行させれば、複数の文書を格納する文書格納手段と、入力された複数の検索条件を受け取る検索条件受取手段と、前記検索条件受取手段が受け取った各検索条件に適合する文書集合を前記文書格納手段から取得する文書検索手段と、前記文書検索手段が取得した文書の数である第1の値と、前記文書検索手段が取得した文書集合中に存在する単語のそれぞれを含んでいる文書の数である単語ごとの第2の値と、前記文書格納手段に格納されている文書の中で、各単語を含んでいる文書の数である単語ごとの第3の値とを取得し、第1の値と第3の値との積あるいは和である第4の値を単語ごとに計算し、第2の値と第4の値との比率に基づいて、前記検索条件受取手段が受け取った検索条件と各単語との間の関連度を、検索条件ごとに計算する関連度計算手段と、前記検索条件受取手段が受け取った各検索条件に応じて前記関連度計算手段により算出された各単語の関連度を比較し、各単語の関連度の値の変化に基づいて関連語を決定する関連語計算手段と、前記関連語計算手段が決定した関連語を表示装置に表示する関連語表示手段と、がコンピュータによって実現される。

発明を実施するための最良の形態

0014

以下、本発明の実施の形態を図面を参照して説明する。図1は、本発明の原理構成図である。文書格納手段1は、複数の文書を格納している。検索条件受取手段2は、ユーザがキーボード等の入力装置を用いて入力した複数の検索条件「Sd」「Sl」を受け取る。文書検索手段3は、検索条件受取手段2が受け取った各検索条件に適合する文書集合「Xd」「Xl」を、文書格納手段1から取得する。

0015

関連度計算手段4は、まず、文書検索手段3が取得した文書集合中に存在する各単語を関連語候補とする。そして、文書検索手段3が取得した文書の数である第1の値と、文書検索手段3が取得した文書集合中に存在する各関連語候補を含んでいる文書の数である関連語候補ごとの第2の値と、文書格納手段に格納されている文書の中で、各関連語候補を含んでいる文書の数である関連語候補ごとの第3の値とを取得し、第1の値と第3の値との積あるいは和である第4の値を関連語候補ごとに計算し、第2の値と第4の値との比率に基づいて、検索条件受取手段2が受け取った検索条件と各関連語候補との間の関連度を、検索条件ごとに計算する。例えば、後述する拡張相互情報量MI0 (Sd,Wdn)」「MI0 (Sl,Wln)」(「Wdn」は「Xd」に含まれる関連語候補の識別子であり、「Wln」は「Xl」に含まれる関連語候補の識別子である)を計算し、その値を関連度とする。拡張相互情報量は、値が大きいほど、検索条件と関連語候補との間の関連度が高いことを示す。

0016

関連語計算手段5は、検索条件受取手段2が受け取った各検索条件「Sd」「Sl」に応じて関連度計算手段4により算出された各関連語候補の関連度を比較し、各関連語候補の関連度の値の変化に基づいて関連語を決定する。例えば、関連度増加語の閾値「Tu」と、関連度減少語の閾値「Ti」を予め設定しておく。そして、「Wdn」と「Wln」とに含まれる全ての関連語候補に関し、一方の検索条件「Sl」との間の関連度から、他方の検索条件「Sd」との間の関連度を減算する。減算の結果が閾値「Tu」より大きければ関連度増加語とし、閾値「Ti」より小さければ関連度減少語とする。これらの、関連度増加語と関連度減少語とが関連語となる。

0017

関連語表示手段6は、関連語計算手段5が決定した関連語を表示装置に表示する。このような関連語提示装置によれば、ユーザが、検索過程における絞り込み前と絞り込み後のそれぞれの検索条件を入力すれば、それらの検索条件に対する各語の関連度が計算され、関連度の変化に応じて適当な関連語(例えば、関連度の変化の大きい単語)がユーザに提示される。これにより、検索結果として得られる文書集合を精読することなしに、検索式を変更したことによって検索結果集合の特徴がどのように変化したかを知ることが可能となる。具体的には、検索意図に合致する語の関連度が大きく減少した場合(あるいは、検索意図に沿わない語の関連度が大きく増加した場合)に、検索式の変更が適切でなかった(よって、適切な検索結果が得られるよう検索式を再修正すべきである)ことを知ることができ、ユーザの検索意図に沿わない誤った絞り込みを避けることが可能となる。さらに、表示された関連語を参照することにより、絞り込みを行うための検索式の再修正を効率的に行うことができる。

0018

なお、上記の各原理構成の構成要素の機能は、各処理機能命令記述されたプログラムをコンピュータで実行することにより実現できる。その場合、プログラムは、コンピュータで読み取り可能な記録媒体に格納しておく。記録媒体としては、半導体記憶装置や、磁気記録装置、あるいは光ディスク等を用いることができる。

0019

ところで、本発明の関連語計算手段では、本来単語間類似度として用いる統計量である相互情報量、Dice−coefficientおよびt−scoreを拡張することによって、検索式と単語の間の類似度を計算し、その類似度を関連度とすることができる。相互情報量、Dice−coefficientおよびt−scoreを単語間の類似度計算に用いた例として、「野,山崎:辞書と統計を用いた対訳アライメント情報処理学会自然言語処理研究会研究報告,96−NL−112,pp.23−30(1996)」、「大森,,中西統計情報を用いた対訳単語辞書の作成,言語処理学会第2回年次大会発表論文集,pp.49−52(1996)」等を挙げることができる。

0020

以下に、相互情報量などを本願発明に適用するための拡張方法について説明する。単語word1とword2の間の相互情報量(MI)は、

0021

0022

と定義される。ただし、全検索対象文書数をM、word1とword2を共に含む文書数をa、word1のみを含む文書数をb、word2のみを含む文書数をcとした場合、

0023

0024

0025

0026

である。これに対して本発明では、検索式Sと単語wordの間の相互情報量(MI0 )を、

0027

0028

と定義する。ただし、全検索対象文書数をM、wordを含みかつ検索式Sから得られる文書の数をa0 、検索式Sから得られる文書のうちwordを含まない文書の数をb0 、wordを含む文書のうち検索式Sから得られる文書を除いた文書の数をc0 とした場合、

0029

0030

0031

0032

である。ここで、「a0 +b0 」が図1の説明における「第1の値」に相当し、「a0 」が「第2の値」に相当し、「a0 +c0 」が「第3の値」に相当する。したがって、式(5)は、

0033

0034

とすることにより、全検索対象文書数M、「第1の値」、「第2の値」及び「第3の値」を変数とする計算式となる。相互情報量と同様に単語間の類似度を求める統計量として、Dice−coefficientおよびt−scoreを挙げることができる。Dice−coefficient(DC)およびt−score(TS)は、

0035

0036

0037

と定義される。これらについても、相互情報量と同様に、検索式と単語の間の類似度計算するために以下のような拡張を施すことが可能である。

0038

0039

0040

MI0 (S,word),DC0 (S,word),TS0 (S,word)のいずれも、その値が大きいほど検索式Sと単語wordの間に高い類似性があることを意味する。以後、MI0 (S,word)を「拡張相互情報量」、DC0 (S,word)を「拡張DC」、TS0 (S,word)を「拡張TS」と呼ぶこととする。なお、相互情報量と同様に、拡張DCと拡張TSとをそれぞれ、

0041

0042

0043

と表すことができる。式(14)から分かるように、拡張DCを求める際には、全検索対象文書数Mは不要である。次に、本発明の関連文書検索装置の実施の形態を具体的に説明する。

0044

図2は、本発明の実施の形態の構成を示すブロック図である。文書格納手段11は、電子化された検索対象文書の内容を形態素解析手段12によって付加される文書識別子と対にして格納する記憶装置である。

0045

形態素解析手段12は、文書格納手段11に格納されている各文書に文書識別子を付加した上で、各文書に形態素解析処理を施して自立語(キーワードとなるべき語)を抽出し、対応する文書識別子と対にして格納する。

0046

索引構造生成手段13は、形態素解析手段12での形態素解析処理結果を基に、索引構造として、単語−単語識別子リスト14a、単語識別子−文書識別子リスト14b、文書識別子−単語識別子リスト14cを作成する。

0047

索引構造格納手段14は、索引構造生成手段13によって作成された単語−単語識別子リスト14a、単語識別子−文書識別子リスト14b、文書識別子−単語識別子リスト14cを格納する記憶装置である。

0048

単語−単語識別子リスト14aは、単語文字列とその単語を特定するための単語識別子の対応関係を記述したリストである。単語識別子−文書識別子リスト14bは、各単語識別子について、その単語識別子で示される単語文字列を含む文書の文書識別子の集合を記述したリストである。

0049

文書識別子−単語識別子リスト14cは、各文書識別子について、その文書識別子で示される文書に含まれる単語の単語識別子の集合を記述したリストである。

0050

検索条件受取手段21は、単語を論理和演算子あるいは論理積演算子で接続することによって構成される検索条件(検索式)の入力を、キーボードなどの入力装置から複数回受け付けユーザインタフェースである。

0051

文書検索手段22は、検索条件受取手段21に入力された検索条件に適合する全ての文書の文書識別子を、単語−単語識別子リスト14a及び単語識別子−文書識別子リスト14bを参照して取得し、取得した文書識別子集合を保存する。また、関連度計算手段25に対しては、保存した文書識別子集合中の識別子数を渡すと共に、関連度計算手段25から与えられる単語識別子に対応する単語を含む文書の総数を渡す。

0052

文書内単語検索手段23は、文書検索手段22から得られる検索条件に適合する文書集合の各文書に含まれる単語の識別子集合を、文書識別子−単語識別子リスト14cを参照して取得し、それらを連接して1つの単語識別子集合とする。

0053

単語出現数計算手段24は、文書内単語検索手段23から得られた単語識別子集合中での各単語識別子の出現数を計算し、単語識別子と出現数との対をリストとして作成する。

0054

関連度計算手段25は、単語出現数計算手段24によって計算された各単語識別子の出現頻度と、文書検索手段22から得られた検索条件に適合する文書識別子の総数と、文書検索手段22から得られる単語識別子に対応する単語を含む文書数の3つの値を基に、検索条件受取手段21に入力された検索条件と各単語識別子に対応する単語との間の拡張相互情報量を計算する。

0055

関連度記憶手段26は、関連度計算手段25によって計算された各単語とその拡張相互情報量とを、対応する検索条件と共に格納する。検索条件指定手段27は、関連度記憶手段26に記憶されている検索条件(検索条件受取手段21に入力された検索条件)を表示し、その中から、検索条件受取手段21に最後に入力された検索条件との比較対象とすべき検索条件を指定することが可能なユーザインターフェースである。

0056

関連語計算手段28は、検索条件受取手段21に最後に入力された検索条件に対応する各語の拡張相互情報量と、検索条件受取手段21によって指定された検索条件に対応する各語の拡張相互情報量とを比較し、両者の値の差の絶対値を求める。そして、両者の相互情報量の絶対値の差が、予め設定された閾値を超える語を関連語として取得する。

0057

関連語表示手段29は、関連語計算手段28で計算された各関連語を出力するユーザインタフェースである。検索結果表示手段30は、文書検索手段22から得られる、検索条件受取手段21に入力された検索条件に適合する文書集合を、文書格納手段11を参照して出力するユーザインタフェースである。

0058

なお、上記の各構成要素の有している機能は、コンピュータが所定のプログラムモジュールを実行することによって実現される機能である。そして、これらを実現するためのコンピュータプログラムは、半導体メモリ磁気記録媒体などの記録媒体に記録されている。ただし、文書格納手段11と索引構造格納手段14とは、実際のHDDハードディスク装置)などの記憶装置を、所定のプログラムで制御することにより実現される。

0059

また、図2の関連語提示装置の各構成要素は、図1の構成要素に対して次のような関係にある。文書格納手段11及び索引構造格納手段14が文書格納手段1に対応する。検索条件受取手段21が検索条件受取手段2に対応する。文書検索手段22が文書検索手段3に対応する。文書内単語検索手段23、単語出現数計算手段24及び関連度計算手段25が関連度計算手段4に対応する。関連度記憶手段26及び関連語計算手段28が関連語計算手段5に対応する。関連語表示手段29が関連語表示手段6に対応する。

0060

ここで、本実施の形態では、関連文書検索を行う前に予め索引構造の生成処理を実行しておく必要がある。そこで、まず索引構造の生成処理について説明する。

0061

索引構造の生成処理の前提として、形態素解析結果リストが生成されていなければならない。図3は、形態素解析手段12に格納される形態素解析結果リスト12aの例を示す図である。形態素解析手段12は、文書格納手段11に格納されている各検索対象文書に識別子を割当てた上で、それぞれの文書に形態素解析処理を施して自立語を抽出し、対応する文書識別子と対にして格納する。ただし、同一文書中から同一の自立語が複数回抽出された場合は、2回目以降の抽出結果を無視し、一つの文書識別子に対応する自立語が重複することはないものとする。

0062

この形態素解析結果リスト12aを基に、索引構造生成手段13が各種索引構造を生成する。図4図6に索引構造生成手段13により作成され、索引構造格納手段14に格納される索引構造の例を示す。なお図4図6中のデータは、図3のデータに基づいて作成された例となっている。

0063

図4は、単語−単語識別子リストの例を示す図である。単語−単語識別子リスト14aには、抽出された単語と、その単語に割り当てられた識別子とが組となって格納されている。

0064

図5は、単語識別子−文書識別子リストの例を示す図である。単語識別子−文書識別子リスト14bには、単語識別子と、その単語識別子が割り当てられている単語を含む文書の識別子(文書識別子)が組となって格納されている。

0065

図6は、文書識別子−単語識別子リストの例を示す図である。文書識別子−単語識別子リスト14cには、文書識別子と、その文書識別子が割り当てられている文書に含まれる単語の単語識別子とが組となって格納されている。

0066

索引構造生成手段13による索引構造の生成アルゴリズムは以下の通りである。図7は、索引構造の生成アルゴリズムを示すフローチャートである。
[S1]単語−単語識別子リスト14aの生成処理
形態素解析手段12に格納されている形態素解析結果リスト中の全単語を、重複なく、かつ、単語文字列の持つ値の順にソートしたリストを作成する。各単語に対して、リストの先頭から順に1で始まる自然数を単語識別子として割当てる。
[S2]文書識別子−単語識別子リスト14cの生成処理
形態素解析手段12に格納されている形態素解析結果リスト中の各単語をステップS1で割当てた単語識別子で置き換え、各文書識別子ごとに対応する単語識別子を小さい値順にソートする。
[S3]単語識別子−文書識別子リスト14bの生成処理
単語識別子を1から順に並べ、各単語識別子に対応する単語が含まれる文書の文書識別子を、ステップS2で作成した文書識別子−単語識別子リスト14cを参照して抽出し、単語識別子と対にして格納する。

0067

以上のアルゴリズムにより、索引構造が生成される。索引構造の生成処理が行われた後、検索条件受取手段21対する検索式の入力が可能となる。そして、利用者がキーボードなどの入力装置を用いて所望の検索式を入力し、検索開始指令を行うと、関連語の提示処理が開始される。

0068

図8は、検索条件受取手段21に入力された検索式から関連度を求めるためのアルゴリズムを示すフローチャートである。以下、図8の各ステップについて説明する。なお、以下の説明において、単語−単語識別子リスト14aをL1、単語識別子−文書識別子リスト14bをL2、文書識別子−単語識別子リスト14cをL3と記述する。
[S11]検索条件受取手段21が、単語を論理積演算子あるいは論理和演算子で結合した検索式を受け取る。この検索式をSと呼ぶことにする。
[S12]文書検索手段22が、Sに適合する文書の文書識別子を、L1およびL2を参照して取得する。得られた文書識別子集合をXと呼び、集合Xの要素数をNとする。
[S13]ステップS12においてN=0であればステップS14へ進み、そうでなければステップS15へ進む。
[S14]文書検索手段22は、Sの関連文書がないものとして、処理を終了する。
[S15]文書内単語検索手段23が、Xに属する各文書識別子に対応する全ての単語識別子を、L3を参照して取得する。取得した単語識別子の集合をYとする。
[S16]単語出現数計算手段24が、Yに属する単語識別子の重複を取り除き、各単語識別子の重複回数を記録する。重複の取り除かれた単語識別子集合を新たにYとし、Yの要素Wn(n=1,2,・・・,P)の重複回数をR(Wn)とする。ただし、PはYの要素数とする。
[S17]文書検索手段22が、Yに属する全単語識別子Wn(n=1,2,・・・,P)に関して、Wnに対応する文書識別子の総数をL2から取得する。Yの要素Wnに対応する文書識別子数をF(Wn)とする。
[S18]関連度計算手段25が、Yに属する全単語識別子Wn(n=1,2,・・・,P)について、全検索対象文書数をMとして、

0069

0070

prob(Wn)=F(Wn)/M・・・・(17)
を計算し、これらの値をWnと組にしてリストとする。また、

0071

prob(S)=N/M・・・・(18)
を計算する。
[S19]関連度計算手段25が、Yに属する各単語識別子Wn(n=1,2,・・・,P)について、式(5)に従って、拡張相互情報量MI0 (S,Wn)を計算し、得られた値を関連度として関連度記憶手段26に格納して終了する。ただし、MI0 (S,Wn)が負の値になる語は、関連度記憶手段26には格納しないものとする。

0072

以上のステップにより、入力された検索式に対応して、その検索式によって得られる文書に含まれる各語の関連度を得ることが可能となる。つまり、関連度記憶手段26には、各検索式ごとに「検索式」「検索式によって得られる文書集合中に出現する語のリスト」「各語に対応する関連度(拡張相互情報量)のリスト」の3つの組が格納されることになる。

0073

関連度記憶手段26に複数の検索式に対応する情報が格納された状態で、ユーザは、検索条件指定手段27を用いて、検索結果の比較対照とすべき検索式を指定する。そして、関連語計算手段28によって関連語計算を行う。関連語計算手段28によって実行される関連語計算アルゴリズムは、以下の通りである。

0074

図9は、関連語計算アルゴリズムを示すフローチャートである。このフローチャートに示す処理は、全て関連語計算手段28によって実行される。なお、ここでの関連語とは、検索条件指定手段27によって指定された検索式と検索条件受取手段21に最後に入力された検索式の両検索式から得られる検索結果の差異を特徴的に示す語のことである。
[S21]検索条件指定手段27によって指定された検索式(Sd)に対応する各語(Wd1, Wd2, …,Wdn)とその関連度(MI0 (Sd,Wd1),MI0 (Sd,Wd2), …,MI0 (Sd,Wdn))および、検索条件受取手段21に最後に入力された検索式(Sl)に対応する各語(Wl1, Wl2,…,Wlm)とその関連度(MI0 (Sl,Wl1), MI0 (Sl,Wl2), …,MI0 (Sl,Wlm))を関連度記憶手段26から取得する。
[S22]検索式Sdに対応する各語(Wdi(1≦i≦n))について関連度差

0075

ID=000019HE=010 WI=073 LX=1135 LY=0800
を求め、得られた値が予め設定した閾値Tuよりも大きい場合Wdiを関連度差と共に関連度増加語リストに加え、得られた値が閾値Tl(<Tu)よりも小さい場合Wdiを関連度差と共に関連度減少語リストに加える。ここで、Wdiが(Wl1, Wl2,・・・,Wlm)に存在しない場合は、MI0 (Sl,Wdi)=0とする。
[S23]検索式Slに対応する各語(Wlj(1≦j≦m))について関連度差

0076

ID=000020HE=010 WI=077 LX=1115 LY=1450
を求め、得られた値が予め設定した閾値Tuよりも大きい場合Wljを関連度差と共に関連度増加語リストに加え、得られた値が閾値Tlよりも小さい場合Wljを関連度差と共に関連度減少語リストに加える。ここで、Wljが(Wd1,Wd2,・・・,Wdn)に存在しない場合は、MI0 (Sd,Wlj)=0とする。ただし、Wljが既にリスト中に存在する場合は再度リストに加えることはしない。
[S24]関連度増加語リスト中の各語を関連度差の大きい順にソートし、関連度減少語リスト中の各語を関連度差の小さい順にソートする。

0077

以上のようにして、関連語計算が行われ、関連度差の大きい順にソートされた関連度増加語リストと、関連度差の小さい順にソートされた関連度減少語リストとが生成される。そして、生成された各リストが、関連語表示手段29によって表示装置の画面に表示される。

0078

図10図11図12および図13に本実施例のユーザインタフェースを示す。図10は、関連語検索画面を示す図である。この関連語検索画面40は、4つのサブウィンドウ41〜44に別れている。

0079

サブウィンドウ41は、検索式入力用ウィンドウであり、テキスト入力フィールド41aと、検索ボタン41bとが設けられている。ユーザは、キーボードなどの入力装置を用いて、テキスト入力フィールド41aに検索式を入力し、検索ボタン41bを押下することにより、検索指令を入力できる。

0080

サブウィンドウ42は、検索式履歴表示用のウィンドウである。このサブウィンドウ42には、テキスト入力フィールド41aに過去に入力された検索式が、入力された順番に表示されている。ユーザが、このサブウィンドウ42に表示されている検索式の中の1つを指定することにより、最後に入力された検索式と比較すべき検索式が選択される。

0081

サブウィンドウ43は、関連語表示用のウィンドウである。このサブウィンドウ43には、関連度減少語表示フィールド43aと、関連度増加語表示フィールド43bとがある。関連度減少語表示フィールド43aには、ステップS24によって得られた関連度減少語リストが表示される。関連度増加語表示フィールド43bには、ステップS24によって得られた関連度増加語リストが表示される。

0082

サブウィンドウ44は、検索結果表示用のウィンドウである。このサブウィンドウ44には、テキスト入力フィールド41aに入力された検索式に適合する文書情報が表示される。

0083

なお、図10中のテキスト入力フィールド41aは検索条件受取手段21により提供されるユーザインタフェースであり、サブウィンドウ42は検索条件指定手段27により提供されるユーザインタフェースであり、サブウィンドウ43は関連語表示手段29により提供されるユーザインタフェースであり、サブウィンドウ44は検索結果表示手段30により提供されるユーザインタフェースである。

0084

ここで、例えば、ユーザの検索意図が「地震時に有効な耐震建造物について知りたい。」である場合を考える。この場合、ユーザは、サブウィンドウ42の中から検索式「地震or震災or震動」を指定する。そして、この検索式に対して、「耐震」を論理積演算子で結合して、新たな検索式とする。

0085

図11は、「(地震or震災or震動)and耐震」を検索式として入力した場合の表示画面を示す図である。ここでは、サブウィンドウ42中の選択されている検索式「地震or震災or震動」は、強調表示されている。ここで、検索ボタン41bを押下することにより、ステップS11〜S19(図8に示す)およびステップS21〜S24(図9に示す)の処理が実行され、得られた関連語がサブウィンドウ43に表示される。

0086

図12は、「(地震or震災or震動)and耐震」を検索式として入力した場合の関連語の表示結果を示す図である。図のように、サブウィンドウ43の関連度減少語表示フィールド43aと関連度増加語表示フィールド43bとのそれぞれに、関連度減少語リストの内容と、関連度増加語リストの内容とが表示されている。

0087

このようにして表示された関連語を参照することにより、ユーザは、検索式「地震or震災or震動」を「(地震or震災or震動)and耐震」に変更した結果生じる以下のような2つの問題点を発見することができる。
(1)「免震」「制震」といった「耐震」と類似する語についての情報が漏れてしまっている。
(2)「家具」「本棚」「箪笥」等の建造物でないものについての耐震方法についての検索結果が多く含まれてしまっている。

0088

ユーザは、上記の問題点を改善するために、例えば「(地震or震災or震動)and(耐震or免震or制震)and(not(家具or本棚or箪笥))」といった新たな検索式に変更する。

0089

図13は、「(地震or震災or震動)and(耐震or免震or制震)and(not(家具or本棚or箪笥))」を検索式として入力した場合の関連語の表示結果を示す図である。なお、サブウィンドウ42中では、検索式「地震or震災or震動」が選択されたままである。このような検索式を入力することにより、「(地震or震災or震動)and耐震」を検索式として入力した場合と比較すると、関連度減少語から「免震」「制震」がなくなり、関連度増加語リストから「家具」「本棚」「箪笥」がなくなっている。

0090

このようにして、関連度の減少語と増加語の内容を知ることにより、検索意図に沿った検索式を迅速に作成することが可能となる。なお、上記の実施の形態は、2つの検索条件それぞれに対して各語の関連度を求めた上で、関連度差を基に検索結果集合の変化の特徴を示す関連語を決定するものであるが、2つの検索条件から得られる文書集合の差を求め、一方の文書集合にのみ含まれる単語の関連度を求めることによって、関連語を決定することもできる。文書集合の差を求めた後に関連度を計算しても、上記の実施の形態と同様の効果が得られる。

0091

このような実施の形態を以下に説明する。なお、この実施の形態の図2に示した実施の形態と同様の構成のシステムで実現できるため、図2の各構成要素の符号を用いて説明する。ただし、検索条件指定手段27により指定された検索条件は、関連度記憶手段26ではなく、文書検索手段22に渡される。

0092

図14は、文書集合の差に基づいて関連語を決定するための手順を示すフローチャートである。
[S31]検索条件受取手段21が、単語を論理積演算子あるいは論理和演算子で結合した検索式を受け取る。
[S32]文書検索手段22が、検索条件指定手段27で指定されている検索条件に適合する文書の文書識別子を、L1(単語−単語識別子リスト)およびL2(単語識別子−文書識別子リスト)を参照して取得する。得られた文書識別子集合をAとする。文書検索手段22は、さらに検索条件受取手段21が受け取った検索条件に適合する文書の文書識別子を、L1およびL2を参照して取得する。得られた文書識別子集合をBとする。
[S33]文書集合「Aand(notB)」に対応する文書識別子集合を図8のステップS12におけるXとして、文書検索手段22、文書内単語検索手段23、単語出現数計算手段24及び関連度計算手段25が、ステップS12〜ステップS19(図8に示す)と同じ処理を実行する。これにより、文書集合「Aand(notB)」に含まれる各語の関連度が計算され、関連度記憶手段26に格納される。
[S34]関連語計算手段28が、ステップS33によって得られた関連度が予め設定された閾値Tよりも大きい語を関連度減少語リストに加え、関連度の大きい順にソートする。
[S35]文書集合「Band(notA)」に対応する文書識別子集合を図8のステップS12におけるXとして、文書検索手段22、文書内単語検索手段23、単語出現数計算手段24及び関連度計算手段25が、ステップS12〜ステップS19(図8に示す)と同じ処理を実行する。これにより、文書集合「Band(notA)」に含まれる各語の関連度が計算され、関連度記憶手段26に格納される。
[S36]関連語計算手段28が、ステップS35によって得られた関連度が予め設定された閾値Tよりも大きい語を関連度増加語リストに加え、関連度の大きい順にソートする。
[S37]関連語表示手段29が、関連語計算手段28によってソートされた関連度減少語リストと関連度増加語リストとの内容を、表示装置の画面に表示する。

0093

このようにして、関連度増加語と関連度減少語とをユーザに提示することができる。この実施の形態では、検索式を変更したことにより検索結果から漏れてしまった単語や、新たに登場した単語の中から関連語が提示される。

発明の効果

0094

以上説明したように本発明の関連語提示装置では、複数の検索条件に対する各関連語候補の関連度を計算し、関連度の変化に基づいて関連語を決定して、その関連語をユーザに提示するようにしたため、検索結果として得られる文書集合を精読することなしに、検索条件を変更したことによって検索結果集合の特徴がどのように変化したかを知ることが可能となる。

0095

また、本発明の関連語提示用プログラムを記録した媒体によれば、記録された関連語提示用プログラムをコンピュータで実行することにより、そのコンピュータは、複数の検索条件に対する各関連語候補の関連度を計算し、関連度の変化に基づいて関連語を決定して、その関連語をユーザに提示できるようになる。したがって、この媒体に記録された関連語提示用プログラムを用いれば、検索条件を変更したことによって検索結果集合の特徴がどのように変化したかを容易に知ることができるような関連語の提示を、コンピュータに行わせることが可能となる。

図面の簡単な説明

0096

図1本発明の原理構成図である。
図2本発明の実施の形態の構成を示すブロック図である。
図3形態素解析手段に格納される形態素解析結果リストの例を示す図である。
図4単語−単語識別子リストの例を示す図である。
図5単語識別子−文書識別子リストの例を示す図である。
図6文書識別子−単語識別子リストの例を示す図である。
図7索引構造の生成アルゴリズムを示すフローチャートである。
図8検索式受取手段に入力された検索式から関連度を求めるためのアルゴリズムを示すフローチャートである。
図9関連語計算アルゴリズムを示すフローチャートである。
図10関連語検索画面を示す図である。
図11「(地震or震災or震動)and耐震」を検索式として入力した場合の表示画面を示す図である。
図12「(地震or震災or震動)and耐震」を検索式として入力した場合の関連語の表示結果を示す図である。
図13「(地震or震災or震動)and(耐震or免震or制震)and(not(家具or本棚or箪笥))」を検索式として入力した場合の関連語の表示結果を示す図である。
図14文書集合の差に基づいて関連語を決定するための手順を示すフローチャートである。

--

0097

1文書格納手段
2検索条件受取手段
3文書検索手段
4関連度計算手段
5関連語計算手段
6 関連語表示手段

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • オムロン株式会社の「 マッチング処理装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】利活用対象のセンシングデータによる容易なセンサマッチングを行うマッチング処理部50が提供される。マッチング処理部50は、提供側端末11により入力された提供側センシングデータを取得する... 詳細

  • オムロン株式会社の「 検索用データ生成装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】センサの検索精度を向上させることができる検索用データ生成装置が提供される。検索用データ生成装置50は、入力された、センシングデバイス20に関連する検索条件301から検索用データを取得... 詳細

  • 三菱電機株式会社の「 情報処理装置および情報処理方法」が 公開されました。( 2019/08/08)

    【課題・解決手段】情報処理装置(10)は、時系列データである入力データを取得するデータ取得部(101)と、時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する学習部分列を... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ