図面 (/)

技術 オブジェクト分類装置及びプログラム

出願人 富士ゼロックス株式会社
発明者 鈴木星児鷹合基行岡本洋徳永奈実梅基宏永峯猛志
出願日 2015年6月24日 (4年8ヶ月経過) 出願番号 2015-126922
公開日 2017年1月12日 (3年2ヶ月経過) 公開番号 2017-010395
状態 特許登録済
技術分野 検索装置
主要キーワード 分布傾向 オブジェクト分類 再検索処理 上位下位 類似オブジェクト 候補キーワード 検索オブジェクト 平均位置
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年1月12日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

課題

概念的に繋がりのあるキーワードに従ってオブジェクト分類するオブジェクト分類装置を提供する。

解決手段

オブジェクト分類装置10は、1または複数のオブジェクトに対するキーワードを決定するキーワード決定部22と、複数の決定されたキーワードを、概念を階層的に示す概念階層構造に基づいて順序付けるキーワード順序付け部23と、順序付けられたキーワードに関連付けてオブジェクトを分類するオブジェクト分類部24と、を含む。

概要

背景

文書群から抽出された複数のキーワードを2次元マップ可視化する技術がある。特許文献1は、トピックが分散している場合であってもキーワード間関連度を適切に表現する方法について開示している。

概要

概念的に繋がりのあるキーワードに従ってオブジェクト分類するオブジェクト分類装置を提供する。オブジェクト分類装置10は、1または複数のオブジェクトに対するキーワードを決定するキーワード決定部22と、複数の決定されたキーワードを、概念を階層的に示す概念階層構造に基づいて順序付けるキーワード順序付け部23と、順序付けられたキーワードに関連付けてオブジェクトを分類するオブジェクト分類部24と、を含む。

目的

本発明の目的の一つは、概念的に繋がりのあるキーワードに従ってオブジェクトを分類するオブジェクト分類装置を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

1または複数のオブジェクトに対するキーワードを決定するキーワード決定手段と、複数の前記決定されたキーワードを、語句概念を階層的に示す構造である概念階層構造に基づいて順序付けるキーワード順序付け手段と、前記順序付けられた前記キーワードに関連付けて前記オブジェクトを分類する分類手段と、を含むことを特徴とするオブジェクト分類装置

請求項2

前記キーワード順序付け手段は、複数の前記語句が配置される前記概念階層構造における最上位階層から順に各階層において、語句毎に当該語句の下位概念として関連付けられる一群の語句を、当該一群の語句の1つ上位の階層に配置される複数の語句との関連性に基づいて並び替えられた前記概念階層構造に基づいて前記キーワードを順序付ける、ことを特徴とする請求項1に記載のオブジェクト分類装置。

請求項3

前記キーワード順序付け手段は、並び替えられた前記概念階層構造における前記複数のキーワードの並び順に対応させて、当該複数のキーワードを順序付ける、ことを特徴とする請求項2に記載のオブジェクト分類装置。

請求項4

前記キーワード決定手段は、前記1または複数のオブジェクトに対するキーワードの候補である複数の候補キーワードのうち、最も出現頻度が高い前記候補キーワードを前記キーワードとして決定する、ことを特徴とする請求項1から3のいずれか一項に記載のオブジェクト分類装置。

請求項5

前記キーワード決定手段は、前記1または複数のオブジェクトに対するキーワードの候補である複数の候補キーワードのうち、前記複数の候補キーワードの並び替えられた前記概念階層構造における位置と各候補キーワードの出現頻度とに基づく並び替えられた前記概念階層構造における平均位置に最も近い前記候補キーワードを前記キーワードとして決定する、ことを特徴とする請求項2に記載のオブジェクト分類装置。

請求項6

前記キーワード決定手段は、前記1または複数のオブジェクトに対するキーワードの候補である複数の候補キーワードのうち、並び替えられた前記概念階層構造において前記複数の候補キーワードに共通する上位概念を示す語句を前記キーワードとして決定する、ことを特徴とする請求項2に記載のオブジェクト分類装置。

請求項7

行列の一方に前記順序付けられた前記キーワードを配列し、前記キーワードに関連付けられて分類された前記オブジェクトを要素に配置した2次元表を表示部に表示させる表示手段と、をさらに含む、ことを特徴とする請求項1から6のいずれか一項に記載のオブジェクト分類装置。

請求項8

利用者の操作に応じて前記2次元表から1以上のオブジェクトを含む範囲を指定する範囲指定部、をさらに含み、前記分類手段は、前記範囲に含まれるオブジェクトと類似するオブジェクトを前記キーワードのいずれかに分類し、前記表示手段は、前記範囲に含まれるオブジェクトと、当該範囲に含まれるオブジェクトに類似する類似オブジェクトと、を要素に配置した前記2次元表を表示部に表示させる、ことを特徴とする請求項7に記載のオブジェクト分類装置。

請求項9

前記分類手段は、前記類似オブジェクトが分類される前記キーワードが、前記範囲より所定の閾値以上離れている場合に当該類似オブジェクトを分類しない、ことを特徴とする請求項8に記載のオブジェクト分類装置。

請求項10

前記2次元表は、前記行列の他方に前記オブジェクトのコンテクストが並び替えられた前記概念階層構造に基づく順序で配列される、ことを特徴とする請求項7から9のいずれか一項に記載のオブジェクト分類装置。

請求項11

1または複数のオブジェクトに対するキーワードを決定するキーワード決定手段、複数の前記決定されたキーワードを、概念を階層的に示す構造である概念階層構造に基づいて順序付けるキーワード順序付け手段、前記順序付けられた前記キーワードに関連付けて前記オブジェクトを分類する分類手段、としてコンピュータを機能させるプログラム

技術分野

0001

本発明は、オブジェクト分類装置及びプログラムに関する。

背景技術

0002

文書群から抽出された複数のキーワードを2次元マップ可視化する技術がある。特許文献1は、トピックが分散している場合であってもキーワード間関連度を適切に表現する方法について開示している。

先行技術

0003

特開2010−224625号公報

発明が解決しようとする課題

0004

しかし、特許文献1に開示されるような2次元マップにおいて隣接するキーワードに概念的な繋がりは考慮されていない。そこで、隣接するキーワードに概念的な繋がりがあれば、連続するキーワードの分布に意味を持たせることができる。

0005

本発明の目的の一つは、概念的に繋がりのあるキーワードに従ってオブジェクト分類するオブジェクト分類装置を提供することにある。

課題を解決するための手段

0006

請求項1に記載の発明は、オブジェクト分類装置であって、1または複数のオブジェクトに対するキーワードを決定するキーワード決定手段と、複数の前記決定されたキーワードを、語句の概念を階層的に示す構造である概念階層構造に基づいて順序付けるキーワード順序付け手段と、前記順序付けられた前記キーワードに関連付けて前記オブジェクトを分類する分類手段と、を含むことを特徴とする。

0007

請求項2に記載の発明は、請求項1に記載のオブジェクト分類装置であって、前記キーワード順序付け手段は、複数の前記語句が配置される前記概念階層構造における最上位階層から順に各階層において、語句毎に当該語句の下位概念として関連付けられる一群の語句を、当該一群の語句の1つ上位の階層に配置される複数の語句との関連性に基づいて並び替えられた前記概念階層構造に基づいて前記キーワードを順序付ける、ことを特徴とする。

0008

請求項3に記載の発明は、請求項2に記載のオブジェクト分類装置であって、前記キーワード順序付け手段は、並び替えられた前記概念階層構造における前記複数のキーワードの並び順に対応させて、当該複数のキーワードを順序づける、ことを特徴とする。

0009

請求項4に記載の発明は、請求項1から3のいずれか一項に記載のオブジェクト分類装置であって、前記キーワード決定手段は、前記1または複数のオブジェクトに対するキーワードの候補である複数の候補キーワードのうち、最も出現頻度が高い前記候補キーワードを前記キーワードとして決定する、ことを特徴とする。

0010

請求項5に記載の発明は、請求項2に記載のオブジェクト分類装置であって、前記キーワード決定手段は、前記1または複数のオブジェクトに対するキーワードの候補である複数の候補キーワードのうち、前記複数の候補キーワードの並び替えられた前記概念階層構造における位置と各候補キーワードの出現頻度とに基づく並び替えられた前記概念階層構造における平均位置に最も近い前記候補キーワードを前記キーワードとして決定する、ことを特徴とする。

0011

請求項6に記載の発明は、請求項2に記載のオブジェクト分類装置であって、前記キーワード決定手段は、前記1または複数のオブジェクトに対するキーワードの候補である複数の候補キーワードのうち、並び替えられた前記概念階層構造において前記複数の候補キーワードに共通する上位概念を示す語句を前記キーワードとして決定する、ことを特徴とする。

0012

請求項7に記載の発明は、請求項1から6のいずれか一項に記載のオブジェクト分類装置であって、行列の一方に前記順序付けられた前記キーワードを配列し、前記キーワードに関連付けられて分類された前記オブジェクトを要素に配置した2次元表を表示部に表示させる表示手段と、をさらに含む、ことを特徴とする。

0013

請求項8に記載の発明は、請求項7に記載のオブジェクト分類装置であって、利用者の操作に応じて前記2次元表から1以上のオブジェクトを含む範囲を指定する範囲指定部、をさらに含み、前記分類手段は、前記範囲に含まれるオブジェクトと類似するオブジェクトを前記キーワードのいずれかに分類し、前記表示手段は、前記範囲に含まれるオブジェクトと、当該範囲に含まれるオブジェクトに類似する類似オブジェクトと、を要素に配置した前記2次元表を表示部に表示させる、ことを特徴とする。

0014

請求項9に記載の発明は、請求項8に記載のオブジェクト分類装置であって、前記分類手段は、前記類似オブジェクトが分類される前記キーワードが、前記範囲より所定の閾値以上離れている場合に当該類似オブジェクトを分類しない、ことを特徴とする。

0015

請求項10に記載の発明は、請求項7から9のいずれか一項に記載のオブジェクト分類装置であって、前記2次元表は、前記行列の他方に前記オブジェクトのコンテクストが並び替えられた前記概念階層構造に基づく順序で配列される、ことを特徴とする。

0016

請求項11に記載の発明は、プログラムであって、1または複数のオブジェクトに対するキーワードを決定するキーワード決定手段、複数の前記決定されたキーワードを、概念を階層的に示す構造である概念階層構造に基づいて順序付けるキーワード順序付け手段、前記順序付けられた前記キーワードに関連付けて前記オブジェクトを分類する分類手段、としてコンピュータを機能させる。

発明の効果

0017

請求項1及び11に記載の発明によれば、概念的に繋がりのあるキーワードに従ってオブジェクトを分類することができる。

0018

請求項2及び3に記載の発明によれば、横方向に概念的な繋がりのある概念階層構造に基づいて、概念的な連続性を有するキーワードの順序付けができる。

0019

請求項4に記載の発明によれば、オブジェクトを代表するキーワードに基づいてオブジェクトを分類することができる。

0020

請求項5に記載の発明によれば、オブジェクトを代表するキーワードを、複数の候補からそれらの概念を加味して選択することができる。

0021

請求項6に記載の発明によれば、オブジェクトを代表するキーワードとして、複数の候補の概念を含むキーワードを選択することができる。

0022

請求項7に記載の発明によれば、概念的に繋がりのあるキーワードに従って分類されたオブジェクトを可視化することができる。

0023

請求項8に記載の発明によれば、概念的に繋がりのあるキーワードに従って分類されたオブジェクトを可視化した2次元表における指定された範囲に基づいて、類似オブジェクトを再検索することができる。

0024

請求項9に記載の発明によれば、概念的に繋がりのあるキーワードに従って分類されたオブジェクトを可視化した2次元表における指定された範囲の周辺の類似オブジェクトを再検索することができる。

0025

請求項10に記載の発明によれば、概念的に繋がりのあるキーワードと、概念的に繋がりのあるコンテクストと、が行列に配列された2次元表を表示することができる。

図面の簡単な説明

0026

本実施形態に係るオブジェクト分類装置のハードウェア構成の一例を示す図である。
本実施形態に係るオブジェクト分類装置が実現する機能の一例を示す機能ブロック図である。
一般的な概念階層構造の一例を示す図である。
一般的な概念階層構造を模式的に示す図である。
本実施形態に係る横方向に概念的な順序付けがなされた概念階層構造の一例である。
本実施形態に係るオブジェクト分類表の一例を示す図である。
本実施形態に係るオブジェクト分類装置が実行するオブジェクト分類処理の流れの一例を示すフロー図である。
本実施形態に係るオブジェクト分類装置が実行するオブジェクトの再検索処理の流れの一例を示すフロー図である。
本実施形態に係る再検索処理時のオブジェクト分類表の一例を示す図である。
本実施形態に係る再検索処理後のオブジェクト分類表の一例を示す図である。

実施例

0027

以下、本発明の一実施形態について、図面を参照しながら説明する。

0028

[ハードウェア構成]
本実施形態に係るオブジェクト分類装置10は、例えばパーソナルコンピュータ等の情報処理装置として実現でき、図1に、本実施形態に係るオブジェクト分類装置10のハードウェア構成の一例を示す。図1に示すように、本実施形態に係るオブジェクト分類装置は、制御部11、記憶部12、通信部13、表示部14、及び操作部15を含んで構成される。

0029

制御部11は、CPU等のプログラム制御デバイスを含み、記憶部12に記憶されたプログラムに従って各種の情報処理を実行する。

0030

記憶部12は、RAMやROM等のメモリ素子ハードディスク等を含み、制御部11が実行するプログラム等を記憶する。また、記憶部12は制御部11のワークメモリとしても機能する。

0031

通信部13は、LANカード等のネットワークインタフェースであって、LANや無線通信網などの通信手段を介して、他の情報処理装置との間で情報の送受信を行う。

0032

表示部14は、液晶ディスプレイ等の表示デバイスであって、制御部11から入力される指示に従って情報を表示する。

0033

操作部15は、マウスキーボードタッチパネル等であって、ユーザの操作を受け付けて操作信号を制御部11に出力する。

0034

[機能ブロック図]
図2は、本実施形態に係るオブジェクト分類装置10が実現する機能の一例を示す機能ブロック図である。図2に示すように、本実施形態に係るオブジェクト分類装置10は、オブジェクト取得部21、キーワード決定部22、キーワード順序付け部23、オブジェクト分類部24、及びグラフ表示部25を含んで構成される。これらの機能は、記憶部12に記憶されたプログラムを制御部11が実行することで実現される。このプログラムは、例えば光ディスク等のコンピュータ読み取り可能な各種の情報記憶媒体に格納されて提供されてもよいし、インターネット等の通信ネットワークを介してオブジェクト分類装置10に提供されてもよい。

0035

オブジェクト取得部21は、オブジェクトデータが格納されたハードディスク等の記憶装置からオブジェクトを取得する。ここで取得されるオブジェクトは、電子文書、図、表等であってよい。なお、オブジェクト取得部21は、ネットワークを介してオブジェクトをダウンロードして取得してもよいし、スキャナにより得られたオブジェクト画像OCR処理してオブジェクトを取得することとしてもよい。

0036

本実施形態においてオブジェクト取得部21が取得するオブジェクトには、特定の条件により検索されるオブジェクト(検索オブジェクトとする)と、検索オブジェクトと類似するオブジェクト(類似オブジェクトとする)と、が含まれることとする。検索オブジェクトは、例えば、ユーザが入力した検索条件に基づいて検索されるオブジェクトであり、本実施形態においてオブジェクト取得部21は、ユーザが入力した検索条件に属する1以上のオブジェクトを検索オブジェクトとして取得する。類似オブジェクトは、検索オブジェクトと類似するオブジェクトであり、本実施形態においてオブジェクト取得部21は、検索オブジェクト毎に当該検索オブジェクトと類似する1以上のオブジェクトを類似オブジェクトとして取得する。例えば、オブジェクト取得部21は、検索オブジェクトに含まれる語句等の要素に基づいて、検索オブジェクトと他のオブジェクトとの類似度を算出し、算出した類似度が所定の類似度レベルを超えるオブジェクトを類似オブジェクトとして取得する。ここで、類似度レベルは設定変更可能であり、類似度レベルが高く設定されれば、検索オブジェクトとより類似している限定された類似オブジェクトが取得され、類似度レベルが低く設定されれば、検索オブジェクトとある程度類似している幅広い類似オブジェクトが取得される。本実施形態では、オブジェクト取得部21が取得した、1以上の検索オブジェクトと1以上の類似オブジェクトと、が複数のオブジェクト群に分割されることとする。例えば、1つの検索オブジェクトと、当該検索オブジェクトと類似する1以上の類似オブジェクトと、の集合を1つのオブジェクト群と記すこととする。

0037

キーワード決定部22は、オブジェクト取得部21により取得されたオブジェクト群を代表する1つのキーワードを決定する。ここで、キーワード決定部22は、複数のオブジェクト群それぞれについて、オブジェクト群を代表する1つのキーワードを決定することとする。具体的には、キーワード決定部22は、取得されたオブジェクト群に含まれるオブジェクトにおいて出現頻度が高い語句を抽出してキーワードとして決定してもよいし、オブジェクトの構造や構文上の重要度をさらに加味してキーワードを決定することとしてもよい。

0038

また、キーワード決定部22が上述の手法によりキーワードを決定する際、オブジェクト群に含まれるオブジェクトにおいて出現頻度が高い複数の語句が抽出される場合もある。このようなキーワードの候補となる複数の語句(候補キーワードとする)が抽出される場合は、キーワード決定部22は、概念階層構造と複数の候補キーワードとに基づいてオブジェクト群を代表する1つのキーワードを決定することとする。キーワード決定部22によるオブジェクト群を代表するキーワードの決定処理については後述する。

0039

まず、概念階層構造は、語句の概念を階層的に示す構造である。図3は、一般的な概念階層構造の一例を示す図である。図3に示すように、一般的な概念階層構造は、例えば、最も上位概念の語句が配置される第1階層に「自然物」が配置されるとする。すると、第2階層には、「自然物」の下位概念として、例えば「地形」及び「動物」が関連付けられる。そして、第3階層には、「地形」の下位概念として、例えば「川」、「谷」及び「山」が関連付けられ、「動物」の下位概念として、例えば「人間」及び「家畜」が関連付けられる。このように一般的な概念階層構造は、第1階層に最も上位概念の語句が配置され、下層に行くほど下位概念の語句が配置されることとなる。なお、概念階層構造は、汎用辞書を用いて生成されてもよいし、例えば記憶装置に記憶されているオブジェクトに含まれる語句から概念階層構造が生成されることとしてもよい。

0040

図3に示す一般的な概念階層構造において、階層間の語句の関連付けは上位下位概念の繋がりを意味しているが、同一の語句の下位概念として関連付けられる一群の語句についてその階層内の並び順に概念的な繋がりは考慮されていない。例えば、図3に示す概念階層構造の第4階層に配置される「」、「」、「」及び「」は、上位概念の語句「家畜」に関連付けられる一群の語句である。しかし、これら一群の語句の第4階層内での並び順、つまりは横方向の並び順に概念的な繋がりは考慮されていない。

0041

そこで、本実施形態では、概念階層構造における同一階層の語句について概念的な順序付けを行うことで、概念階層構造における横方向の並び順に概念的な連続性を持たせることとする。

0042

概念階層構造における語句の横方向の順序付けについて、図4に示す一般的な概念階層構造を模式的に示した図を用いて説明する。図4に示す概念階層構造は、複数の語句が配置される一般的な概念階層構造であり、最上位階層(ここでは、第k−3階層とする)に最も上位概念の語句(ここでは、語句(W−3)とする)が配置され、下層に行くほど下位概念の語句が配置される。なお図4に示す概念階層構造は第k階層までを示しているが、第k+1階層以降が存在していてもよい。ここでは、第k階層の一群の語句Wn={W8、W9、W10、W11}について順序付けを行う場合について説明する。具体的には、語句Wnが配置される階層より1つ上位の階層(ここでは、第k−1階層)に配置される語句(W−1)m={(W−1)3、(W−1)4、(W−1)5、(W−1)6}の各語句と、語句Wn={W8、W9、W10、W11}の各語句と、の関連性を評価し、関連性が高い語句同士がより近くに位置するように横方向の順序付けを行う。つまり、語句(W−1)3との関連性が高い語句は、語句(W−1)3に近い左方向に配置され、語句(W−1)5や語句(W−1)6と関連性が高い語句は、語句(W−1)5や語句(W−1)6とに近い右方向に配置されるよう各語句が並び替えられる。なお、語句Wnの上位概念として関連付けられている語句(W−1)p(ここでは、語句(W−1)4)については関連性の評価の対象から除くこととする。

0043

語句(W−1)mと、語句Wnとの関連性の評価方法としては、例えば、記憶装置に記憶されているオブジェクトのうち語句Wnを含むオブジェクト群と、記憶装置に記憶されているオブジェクトのうち語句(W−1)mの下位概念として関連付けられる一群の語句を含むオブジェクト群と、の類似度を算出することで関連性を評価することができる。この場合、語句Wnを含むオブジェクト群の特徴ベクトルをdnとし、語句(W−1)mの下位概念として関連付けられる一群の語句を含むオブジェクト群の特徴ベクトルをdmとし、特徴ベクトルdnと特徴ベクトルdmとの内積を類似度として算出する。つまり、語句Wnと語句(W−1)mとの関連性は、類似度S(n、m)=dn・dmにより評価され、類似度S(n、m)が高いほど関連性が高く、類似度S(n、m)が低いほど関連性が低いと評価される。なお、特徴ベクトルdn、特徴ベクトルdnは、それぞれオブジェクト群に含まれる各オブジェクトの特徴ベクトルの和であってよい。ここで、オブジェクトの特徴ベクトルは、例えばオブジェクト数Nのオブジェクト群から要素数tからなるキーワードKi(i=1,2,....,t)が抽出されたとすると、オブジェクト群に含まれる各オブジェクトEj(j=1,2,3,....,N)について、Kiが含まれている場合「1」と、含まれていない場合「0」とすることにより、t次元ベクトル(0,1,1.....,0)tとして表現されることとする。

0044

このようにして算出された類似度S(n、m)と、概念階層構造における位置と、に応じて語句Wnとの関連性が高いと評価された語句(W−1)mの近くに語句Wnが位置するように語句Wn={W8、W9、W10、W11}の各語句を並び替えて順序付けを行う。このような手法により、最上位階層から順に各階層において語句の並び替えにより順序付けを行うことで、横方向の並び順に概念的な連続性を有する概念階層構造を構築することができる。図5に、本実施形態に係る横方向に概念的な順序付けがなされた概念階層構造の一例を示す。図5においては、図4に示した一般的な概念階層構造における第k階層の一群の語句Wn={W8、W9、W10、W11}の各語句が概念的な順序付けに従って並び替えられたことを示している。そして、図5に示すその他の語句についても、最上位階層から順に各階層において語句が並び替えられたことにより概念的な順序付けに従って横方向に並んでいることとする。また、横方向の概念的な連続性を距離として示すことで概念階層構造の各語句を座標平面上に表すこともできる。これにより、語句の概念的な順序付けだけでなく、その語句同士の概念的な近さも表現することができる。

0045

また、類似度S(n、m)の算出方法として、語句Wnの上位概念として関連付けられている語句(W−1)pと語句(W−1)mとの関連性を加味して類似度を算出することとしてもよい。例えば、類似度S(n、m)は、語句(W−1)pと語句(W−1)mとの関連性をRmとすると、類似度S(n、m)=Rm・dn・dmとして算出されることとする。ここで、関連性Rmは、語句(W−1)pと語句(W−1)mとの概念的な関連性を数値化したものとすればよい。例えば、関連性Rmを、語句(W−1)pから語句(W−1)mまでの概念階層構造における横方向のステップ数としてもよい。つまり、図4においては、語句(W−1)pから、語句(W−1)3及び語句(W−1)5までを1ステップとし、語句(W−1)pから語句(W−1)6までを2ステップとして、語句(W−1)pと語句(W−1)mとの概念的な関連性を数値化する。ここでは、上位階層から順に語句の順序付けを行っているので、第k−1階層においては既に概念的な順序付けに従って横方向に語句が並んでいる。したがって、第k−1階層においては横方向の位置が近いほど関連性が高く、横方向の位置が遠いほど関連性が低いといえる。これを利用することで、語句(W−1)pと語句(W−1)mとの概念的な関連性を、語句(W−1)pから語句(W−1)mまでのステップ数として簡易的に示すことができる。また、横方向の概念的な連続性を距離として示したものを利用すれば、語句(W−1)pと語句(W−1)mとの概念的な関連性Rmをその距離を用いて数値化することもできる。このような語句(W−1)pと語句(W−1)mとの概念的な関連性を距離で示すことで、語句同士の関連性をより詳細に示すことができる。

0046

そして、キーワード決定部22が、横方向に概念的な順序付けがなされた概念階層構造に基づいてオブジェクト群を代表する1つのキーワードを決定する手法の一例について説明する。例えば、図5に示す横方向に概念的な順序付けがなされた概念階層構造において、複数の候補キーワードがそれぞれ「W1」、「W6」、「W7」、「W10」に位置しているとする。図5に示す概念階層構造は概念的な順序付けに従って横方向に語句が並んでいるので、複数の候補キーワード(ここでは、「W1」、「W6」、「W7」、「W10」)の横方向の位置と、各候補キーワードの出現頻度と、により候補キーワードの概念的な分布傾向が示される。つまり、オブジェクト群を代表するキーワードは、概念階層構造における候補キーワードの分布の代表値とすることができる。そこで、キーワード決定部22は、各候補キーワードの出現頻度を重みとする概念階層構造における位置の加重平均を算出する。そして、キーワード決定部22は、算出された加重平均位置に最も近い候補キーワードを、オブジェクト群を代表するキーワードとして決定する。

0047

また、キーワード決定部22が、横方向に概念的な順序付けがなされた概念階層構造に基づいてオブジェクト群を代表する1つのキーワードを決定する他の手法について説明する。例えば、図5に示す横方向に概念的な順序付けがなされた概念階層構造において、複数の候補キーワードがそれぞれ「W8」、「W11」、「W12」に位置しているとする。このとき、キーワード決定部22は、複数の候補キーワード「W8」、「W11」、「W12」に共通する上位概念の語句である「(W−2)2」に位置する語句を、オブジェクト群を代表するキーワードとして決定する。なお、この手法を用いる場合は、複数のオブジェクト群において、各オブジェクト群を代表するキーワードが同一のものとなる可能性があるため、概念階層構造の階層が十分深く構築されていることが条件となる。

0048

キーワード順序付け部23は、キーワード決定部22が複数のオブジェクト群それぞれにおいて決定したキーワードを、概念階層構造に基づいて順序付けする。具体的には、キーワード順序付け部23は、各オブジェクト群を代表するキーワードを、上述した横方向に概念的な順序付けがなされた概念階層構造における位置に基づいて順序付けする。キーワード順序付け部23は、概念的な順序付けに従って横方向に語句が並んでいる概念階層構造における各キーワードの位置を取得しその横方向の並び順に対応させて順序付けすることで、各キーワードを、概念的に連続性を有する順に順序付けすることができる。

0049

オブジェクト分類部24は、オブジェクト取得部21が取得するオブジェクトを、キーワード決定部22が決定したいずれかのキーワードに関連付けて分類する。

0050

グラフ表示部25は、キーワード順序付け部23により順序付けされたキーワードをその順序で行列の一方に配列し、各キーワードに関連付けられて分類されたオブジェクトを要素に配置した2次元表を表示部14に表示させる。本実施形態では、グラフ表示部25は、表示部14に2次元表を表示させることとするが、この例に限定されず、例えば、座標平面、3次元表等を表示させてもよい。

0051

図6は、本実施形態に係るオブジェクト分類表の一例を示す図である。図6に示すように、本実施形態に係るオブジェクト分類表は、行方向にキーワード(ここでは、W3、W6、W11、W12、W14とする)が配列され、列方向にコンテクスト(ここでは、C1、C2、C3、C4、C5)が配列される2次元表であり、オブジェクト分類表の各要素に対応するオブジェクトが配置される。行方向のキーワードがキーワード順序付け部23により順序付けされた順に配列されることで、オブジェクト分類表の行方向の並び順に概念的な連続性が表現される。これにより、連続する複数行に含まれる要素の集合は、概念的に繋がりのある集合と見ることができる。また、列方向に配列されるコンテクストは、キーワードとは異なる、オブジェクトを分類する情報であり、例えばオブジェクトの作成者作成日時、といったオブジェクトの背景を示す情報である。なお、列方向のコンテクストについてもキーワードと同様に概念的な順序付けがなされてもよい。これにより、連続する複数列に含まれる要素の集合も、概念的な繋がりのある集合と見ることができる。そして、行列の両方について概念的な順序付けがなされていれば、複数行、複数列からなる範囲に含まれる要素の集合は概念的な繋がりのある集合と見ることができる。

0052

[オブジェクト分類処理]
ここで、本実施形態に係るオブジェクト分類装置が実行するオブジェクト分類処理の流れの一例を図7に示すフロー図を参照して説明する。

0053

まず、利用者が検索条件を入力することで、オブジェクト取得部21が、入力された検索条件に基づいて検索される検索オブジェクトを取得する(S101)。ここで、オブジェクト取得部21は、入力された検索条件に基づいて検索される複数の検索オブジェクトを取得することとする。

0054

そして、オブジェクト取得部21は、処理S101にて取得された複数の検索オブジェクトそれぞれについて、当該検索オブジェクトと類似する類似オブジェクトを取得する(S102)。ここで、オブジェクト取得部21は、検索オブジェクト毎に、所定の類似度レベルに応じて1以上の類似オブジェクトを取得することとする。そして、1つの検索オブジェクトと当該検索オブジェクトに類似する類似オブジェクトとの集合を1つのオブジェクト群とする。

0055

キーワード決定部22は、オブジェクト群毎に、当該オブジェクト群のオブジェクト(検索オブジェクト及び類似オブジェクト)に含まれる語句に基づいて、当該オブジェクト群を代表するキーワードを決定する(S103)。

0056

キーワード順序付け部23は、キーワード決定部22がオブジェクト群毎に決定したキーワードを概念階層構造に基づいて順序付けする(S104)。

0057

オブジェクト分類部24は、オブジェクト取得部21が取得したオブジェクト群に含まれる各オブジェクトを、いずれかのキーワードに関連付けて分類する(S105)。

0058

グラフ表示部25は、キーワード順序付け部23により順序付けされたキーワードがその順序で行列の一方に配列され、各要素にオブジェクト分類部24が分類したオブジェクトが配置されるオブジェクト分類表を表示部14に表示させ(S106)、オブジェクト分類処理が終了する。

0059

[オブジェクト分類表による再検索処理]
オブジェクト分類表を用いて実行されるオブジェクトの再検索処理について説明する。図6に示すオブジェクト分類表において、オブジェクト分類表のある範囲に含まれるオブジェクト群は概念的な繋がりのある1つの集合と捉えることができることを上述した。このように、オブジェクト分類表のある範囲を1つの集合と捉えた場合に、当該集合に関連する他のオブジェクトを再検索することが可能となる。例えば、オブジェクト分類表に分類された1以上のオブジェクトを含む範囲を指定して、当該範囲に含まれるオブジェクトに類似する他のオブジェクトを再検索したり、オブジェクト分類表に示されたキーワードのいずれかを指定して、当該キーワードに関連する他のオブジェクトを再検索したりすることが可能となる。ここで、再検索されるオブジェクトは、指定した範囲に含まれるオブジェクトと類似するオブジェクトであるため、指定した範囲の周辺に分類されやすい。つまり、利用者は、オブジェクト分類表の所望の範囲を指定することで当該範囲の周辺に位置するオブジェクトを取得することができる。

0060

ここで、本実施形態に係るオブジェクト分類装置が実行するオブジェクトの再検索処理の流れの一例を図8に示すフロー図を参照して説明する。

0061

まず、利用者のマウス操作等に応じてオブジェクト分類表から1以上のオブジェクトを含む範囲が指定される(S201)。ここで、利用者がオブジェクト分類表の所望の範囲を選択することで範囲が指定されてもよいし、利用者がキーワードを選択することで選択したキーワードの行が範囲として指定されてもよい。図9は、本実施形態に係る再検索処理時のオブジェクト分類表の一例を示す図である。図9は、図6に示したオブジェクト分類表を用いて利用者がオブジェクトE2,2及びオブジェクトE3,2を含む範囲Rを指定したことを示している。

0062

そして、オブジェクト取得部21が、処理S201で指定された範囲に含まれるオブジェクト毎に当該オブジェクトに類似する類似オブジェクトを取得する(S202)。具体的には、オブジェクト取得部21は、図9において指定された範囲Rに含まれるオブジェクトE2,2に類似する類似オブジェクトを取得する。そして、オブジェクト取得部21は、範囲Rに含まれるオブジェクトE3,2に類似する類似オブジェクトを取得する。ここで、オブジェクト取得部21が類似オブジェクトを取得するための類似度レベルとしては、オブジェクト分類処理における処理S102において類似オブジェクトを取得するための所定の類似度レベルとは異なる類似度レベルが設定されることとする。具体的には、再検索処理における類似度レベルは、オブジェクト分類処理における所定の類似度レベルより低いレベルに設定される。ここで類似度レベルを下げることにより、オブジェクト分類処理時より多くの類似オブジェクトを範囲Rの周辺に取得することができる。つまりは、図9のオブジェクト分類表における範囲R周辺の空要素にオブジェクトが分類されやすくなる。

0063

そして、オブジェクト分類部24は、処理S202で取得された類似オブジェクトをオブジェクト分類表に示されるキーワードのいずれかに関連付けて分類する(S203)。

0064

そして、グラフ表示部25は、処理S101で指定された範囲に含まれるオブジェクトと、処理S202で取得された類似オブジェクトと、が配置されたオブジェクト分類表を表示部14に表示させる(S204)。

0065

図10は、本実施形態に係る再検索処理後のオブジェクト分類表の一例を示す図である。図10に示すように、再検索されたオブジェクト(ここでは、E1,2、E2,3、E2,5、E3,3、E3,4、E3,5、E4,2とする)が対応する要素に表示され、特に範囲Rの周辺に集中的に分類されて表示される。これにより、利用者は指定した範囲Rが示す概念に近いオブジェクトを取得することができる。

0066

ここで、処理S202にてオブジェクト取得部21が類似度レベルを下げて類似オブジェクトを取得すると、範囲Rから離れた位置に分類され得る類似オブジェクトが取得される可能性がある。例えば、範囲Rに含まれるオブジェクトとは類似するが、範囲Rに対応するキーワードには関連付けられないオブジェクトが取得される場合がある。その場合、取得されたオブジェクトは、例えばキーワードW14等といった範囲Rから離れたキーワードに関連付けられて分類されてしまう。本来、範囲Rの周辺のオブジェクトを検索したい利用者にとって、範囲Rから離れた位置に分類されるオブジェクトが取得されるのは望ましくない。そこで、オブジェクト分類部24は、指定された範囲から所定の閾値以上離れたキーワードに関連付けられる類似オブジェクトを分類しないこととする。ここで、所定の閾値は、キーワードの概念的な連続性に応じた距離に応じて定められることとすればよい。なお、グラフ表示部25が、指定された範囲から所定の閾値以上離れた位置のキーワードに分類されているオブジェクトを表示しないこととしてもよい。これにより、再検索により利用者が所望するオブジェクトをオブジェクト分類表に表示することができる。

0067

10オブジェクト分類装置、11 制御部、12 記憶部、13通信部、14 表示部、15 操作部、21オブジェクト取得部、22キーワード決定部、23 キーワード順序付け部、24オブジェクト分類部、25グラフ表示部。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社ソケッツの「 検索装置および方法」が 公開されました。( 2019/09/19)

    【課題】同一の感性ワードで加重的に絞り込み検索を行えるようにする。【解決手段】同一の感性ワードで加重的に絞り込み検索を行う場合、類似・関連ワード抽出部319が、感性ワードに類似・関連する別のワードを検... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】ユーザの移動の妨害に応じた適切な対応を可能にする。【解決手段】本願に係る情報処理装置は、取得部と、決定部とを有する。取得部は、ユーザの位置情報と、ユーザが位置するエリアにおいて発生する事象のう... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】類似のコンテンツを適切に抽出する。【解決手段】本願に係る情報処理装置は、取得部と、検索部とを有する。取得部は、複数のコンテンツの各々に対応する複数のノードが、複数のコンテンツの類似性に応じて連... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ