図面 (/)

技術 情報処理装置及びプログラム

出願人 京セラドキュメントソリューションズ株式会社
発明者 三浦友博
出願日 2016年4月1日 (3年11ヶ月経過) 出願番号 2016-073971
公開日 2017年10月12日 (2年5ヶ月経過) 公開番号 2017-187828
状態 特許登録済
技術分野 検索装置
主要キーワード クラスタ抽出 クラスタ分類 関連語句 クラスタ解析 各関連語 リンク生成 エンドユーザー 検索対象文
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年10月12日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (5)

課題

クラスタリングの技術を利用して、初期値としての語句に対する関連語句を抽出する。

解決手段

情報処理装置は、1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出するクラスタ抽出部と、前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部とを備える。

概要

背景

一般的に、多数の語句等のデータをクラスタ(データの集合)に分類する技術(クラスタリング)が知られている。例えば、キーワードをその同義語等に変換してクラスタ分類を行う方法(例えば、特許文献1参照)や、概念検索を利用して検索対象文をクラスタに分類する方法が知られている(例えば、特許文献2参照)。

概要

クラスタリングの技術を利用して、初期値としての語句に対する関連語句を抽出する。情報処理装置は、1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出するクラスタ抽出部と、前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部とを備える。

目的

特開2008−293271号公報
特開2005−092442号公報






本開示の目的は、クラスタリングの技術を利用して、初期値としての語句に対する関連語句を抽出することにある

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出するクラスタ抽出部と、前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部とを具備する情報処理装置

請求項2

請求項1に記載の情報処理装置であって、前記クラスタ抽出部は、前記第1のクラスタと関連性を有する1以上のクラスタを、前記第2のクラスタとして抽出する情報処理装置。

請求項3

請求項1又は2に記載の情報処理装置であって、前記クラスタ抽出部は、前記初期値と関連性を有する1以上のクラスタを、前記第1のクラスタと関連性を有する前記第2のクラスタとして抽出する情報処理装置。

請求項4

請求項1乃至3の何れか一項に記載の情報処理装置であって、前記語句抽出部は、前記第1のクラスタと各前記第2のクラスタとの関連性に応じて、各前記第2のクラスタから抽出する関連語句の数を異ならせる情報処理装置。

請求項5

請求項1乃至4の何れか一項に記載の情報処理装置であって、前記抽出した各関連語情報資源所在情報が前記各関連語句に紐付けられたリンク情報を生成するリンク生成部をさらに具備する情報処理装置。

請求項6

請求項5に記載の情報処理装置であって、前記初期値と、前記リンク情報が紐付けられた各関連語句とを、表示部に出力する出力部をさらに具備する情報処理装置。

請求項7

請求項1乃至6の何れか一項に記載の情報処理装置であって、ユーザーにより前記初期値として選択された、前記表示部に表示された何れかの前記関連語句を検出し、前記選択された初期値としての関連語句を、前記クラスタ抽出部に入力する初期値入力部をさらに具備する情報処理装置。

請求項8

請求項1乃至7の何れか一項に記載の情報処理装置であって、前記語句抽出部は、複数の語句と、前記各語句が属するクラスタと、前記複数の語句同士の関連性を算出するための値とを互いに関連付けて登録したテーブルを参照し、前記1以上の第2のクラスタにそれぞれ属する、前記初期値と関連性の高い語句である関連語句を、前記テーブルから抽出する情報処理装置。

請求項9

請求項8に記載の情報処理装置であって、前記テーブルを生成するクラスタ解析部をさらに具備する情報処理装置。

請求項10

情報処理装置を、1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出するクラスタ抽出部と、前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部として機能させるプログラム

技術分野

0001

本開示は、初期値としての語句に対する関連語句を抽出することが可能な情報処理装置及びプログラムに関する。

背景技術

0002

一般的に、多数の語句等のデータをクラスタ(データの集合)に分類する技術(クラスタリング)が知られている。例えば、キーワードをその同義語等に変換してクラスタ分類を行う方法(例えば、特許文献1参照)や、概念検索を利用して検索対象文をクラスタに分類する方法が知られている(例えば、特許文献2参照)。

先行技術

0003

特開2008−293271号公報
特開2005−092442号公報

発明が解決しようとする課題

0004

本開示の目的は、クラスタリングの技術を利用して、初期値としての語句に対する関連語句を抽出することにある。

課題を解決するための手段

0005

上記目的を達成するため、本開示の一形態に係る情報処理装置は、
1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
クラスタ抽出部と、
前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部と
を備える。

0006

本形態によれば、クラスタ抽出部が第1のクラスタと異なる第2のクラスタを抽出し、語句抽出部が抽出された第2のクラスタから関連語句を抽出することにより、初期値である語句に対して異なる複数の分野から関連語句を抽出することができる。これにより、ユーザーは、初期値と関連性の高い語句でありながら、異なる分野から抽出された関連語句を学習することで、初期値について幅広く学習することができる。

0007

前記クラスタ抽出部は、前記第1のクラスタと関連性の高い1以上のクラスタを、前記第2のクラスタとして抽出する。

0008

本形態によれば、クラスタ抽出部が第1のクラスタと関連性の高いクラスタを抽出することにより、初期値である語句に対して当該語句の分野と関連性の高い分野の関連語句を抽出することができる。これにより、ユーザーは、初期値の分野と関連性の高い分野から抽出された関連語句を学習することで、初期値について幅広く、且つ、初期値の分野と関連性の高い内容を学習することができる。

0009

あるいは、
前記クラスタ抽出部は、前記初期値と関連性の高い1以上のクラスタを、前記第1のクラスタと関連性の高い前記第2のクラスタとして抽出する。

0010

本形態によれば、クラスタ抽出部が初期値と関連性の高いクラスタを抽出することにより、初期値である語句に対して当該語句と関連性の高い分野の関連語句を抽出することができる。これにより、ユーザーは、初期値と関連性の高い分野から抽出された関連語句を学習することで、初期値について幅広く、且つ、初期値と関連性の高い内容を学習することができる。

0011

前記語句抽出部は、前記第1のクラスタと各前記第2のクラスタとの関連性に応じて、各前記第2のクラスタから抽出する関連語句の数を異ならせる。

0012

本形態によれば、例えば、第1のクラスタと関連性の高い第2のクラスタから抽出する関連語句の数を増やすことで、初期値を含む第1のクラスタと関連性の比較的高い関連語句を多数抽出することができる。これにより、ユーザーは、初期値と関連性の比較的高い情報を多数知ることができ、初期値についてより深く学習することができる。あるいは、第1のクラスタと関連性の比較的低い第2のクラスタから抽出する関連語句の数を増やすことで、初期値を含む第1のクラスタと関連性の比較的低い関連語句を多数抽出することができる。これにより、ユーザーは、初期値から離れて広範な分野の語句を多数知ることができ、初期値についてより広く学習することができる。

0013

前記情報処理装置は、前記抽出した各関連語情報資源所在情報が前記各関連語句に紐付けられたリンク情報を生成するリンク生成部をさらに備える。

0014

本形態によれば、リンク情報に各関連語句の情報資源の所在情報がづけられているため、ユーザーは、容易に各関連語句の情報資源にアクセスすることができる。

0015

前記情報処理装置は、前記初期値と、前記リンク情報が紐付けられた各関連語句とを、表示部に出力する出力部をさらに備える。

0016

本形態によれば、リンク情報が紐付けられた各関連語句が表示部に表示されるため、ユーザーは、容易に各関連語句の情報資源にアクセスすることができる。

0017

前記情報処理装置は、
ユーザーにより前記初期値として選択された、前記表示部に表示された何れかの前記関連語句を検出し、
前記選択された初期値としての関連語句を、前記クラスタ抽出部に入力する
初期値入力部をさらに備える。

0018

本形態によれば、初期値入力部は、ユーザーにより選択された関連語句を初期値としてクラスタ抽出部に入力する。これにより、ユーザーは、初期値から関連語句、この関連語句から別の関連語句へと、連鎖的に学習を深めることができる。

0019

前記語句抽出部は、
複数の語句と、前記各語句が属するクラスタと、前記複数の語句同士の関連性を算出するための値とを互いに関連付けて登録したテーブルを参照し、
前記1以上の第2のクラスタにそれぞれ属する、前記初期値と関連性の高い語句である関連語句を、前記テーブルから抽出する。

0020

前記情報処理装置は、前記テーブルを生成するクラスタ解析部をさらに備える。

0021

上記目的を達成するため、本開示の一形態に係るプログラムは、
情報処理装置を、
1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
クラスタ抽出部と、
前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部
として機能させる。

発明の効果

0022

本開示によれば、クラスタリングの技術を利用して、初期値としての語句に対する関連語句を抽出することができる。

図面の簡単な説明

0023

情報処理装置のハードウェア構成を示すブロック図である。
情報処理装置の機能的構成を示すブロック図である。
情報処理装置の動作を示すフローチャートである。
各クラスタ、初期値及び各関連語句を模式的に示す図である。

実施例

0024

以下、図面を参照しながら、本開示の実施形態を説明する。

0025

(1.情報処理装置のハードウェア構成)
図1は、情報処理装置のハードウェア構成を示すブロック図である。情報処理装置10は、典型的には、PC(Personal Computer)であり、以下、「PC10」と記載する。
PC10は、制御部11と、制御部11とバス16を介して接続された表示部12、通信インターフェース13、操作部14及び記憶部15とを有する。

0026

制御部11は、CPU(Central Processing Unit)等を含む。制御部11は、RAM(Random Access Memory)にロードされたプログラムを実行する。

0027

表示部12は、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)ディスプレイ等を含む。表示部12は、制御部11から受け取った情報に基づいて演算処理を行い、生成した画像信号画面に表示する。典型的には、表示部12は外付け表示装置である。

0028

通信インターフェース13は、ネットワークNに接続するためのインターフェースである。

0029

操作部14は、キーボードマウス及び各種スイッチ等を含む。操作部14は、ユーザーからの操作を検出して制御部11に出力する。

0030

記憶部15は、ROM(Read Only Memory)と、RAMと、HDD(Hard Disk Drive)等の大容量の記憶装置とを含む。ROMは、制御部11が実行するプログラムやデータ等を固定的に格納する。RAMには、ROMに格納されたプログラムがロードされる。

0031

(2.情報処理装置の機能的構成)
図2は、情報処理装置の機能的構成を示すブロック図である。

0032

PC10は、情報処理プログラムを実行することにより、クラスタ解析部111と、初期値入力部112と、クラスタ抽出部113と、語句抽出部114と、リンク生成部115と、出力部116として機能する。

0033

クラスタ解析部111は、複数の語句と、各語句が属するクラスタと、複数の語句同士の関連性を算出するための値とを互いに関連付けて登録したテーブルを生成する。

0034

初期値入力部112は、ユーザーによる操作部14に対する特定の操作を、初期値である語句の入力要求として検出する。

0035

クラスタ抽出部113は、1以上の語句をそれぞれ含む複数のクラスタから、初期値を含む第1のクラスタを抽出する。また、クラスタ抽出部113は、複数のクラスタから、第1のクラスタと異なる1以上の第2のクラスタを抽出する。

0036

語句抽出部114は、1以上の第2のクラスタから、それぞれ、初期値と関連性の高い語句である関連語句を抽出する。

0037

リンク生成部115は、抽出した各関連語句の情報資源の所在情報が紐付けられたリンク情報を生成する。

0038

出力部116は、初期値と、リンク情報が紐付けられた各関連語句とを、表示部12に出力する。

0039

(3.情報処理装置の動作)
図3は、情報処理装置の動作を示すフローチャートである。図4は、各クラスタ、初期値及び各関連語句を模式的に示す図である。

0040

クラスタ解析部111は、テーブル15aを生成する(ステップS101)。具体的には、クラスタ解析部111は、図2に示すように、複数の語句151と、位置情報152と、クラスタ153とを、互いに関連付けてテーブル15aに登録する。例えば、まず、クラスタ解析部111は、記憶部15に記憶されたデータベース(図示せず)に蓄積された文書データ形態素解析により複数の語句に分割し、語句151としてテーブル15aに登録する。「文書データ」としては、例えば、書籍(例えば、教科書や各種資料等)の文章テキストデータが挙げられる。

0041

クラスタ解析部111は、テーブル15aに登録した語句151を複数のクラスタに分類する。具体的には、クラスタ解析部111は、語句151同士の関連性を算出するための値を決定する。「関連性を算出するための値」とは、例えば、各語句151の位置情報152である。「位置情報」は、例えば、公知のクラスタリング手法で用いられる多次元空間における座標や、書籍のページ番号又は行番号等である。

0042

本例では、以下、位置情報152として「座標」を用いるものとする。クラスタ解析部111は、ユークリッド距離等の座標間の距離に基づいて語句151を分類する。クラスタ解析部111は、ユークリッド距離d(f,g)を、以下の数1の式を用いて求める。式中、nは次元数、f及びgは座標のベクトルを表す。クラスタ解析部111は、求めた座標間の距離を用いて、座標間の距離が小さい複数の語句151を、関連性の高い語句の集合として、1つのクラスタにまとめる。

0043

図4Aの例では、クラスタ解析部111は、複数の語句を、関連性の高い語句の集合として、複数のクラスタA、B、C、D、E、F、Xに分類する。

0044

0045

初期値入力部112は、ユーザーによる操作部14に対する特定の操作を、初期値である語句の入力要求として検出する(ステップS102)。初期値入力部112は、検出した初期値xを、クラスタ抽出部113に入力する。

0046

クラスタ抽出部113は、初期値入力部112から取得した初期値xがテーブル15aに登録されているか否かを判断する(ステップS103)。初期値xがテーブル15aに登録されていない場合(ステップS103、No)、クラスタ抽出部113は、出力部116に、表示部12にエラーメッセージを表示させるための信号を出力してもよい。初期値入力部112は、新たな初期値を検出(ステップS102)するまで待機する。

0047

一方、初期値xがテーブル15aに登録されている場合(ステップS103、Yes)、クラスタ抽出部113は、複数のクラスタ153から、初期値xを含むクラスタである第1のクラスタ153aを抽出する。具体的には、クラスタ抽出部113は、初期値xである語句151に関連付けてテーブル15aに登録されたクラスタ153を、第1のクラスタ153aとして抽出する。

0048

図4Bの例では、クラスタ抽出部113は、複数のクラスタA、B、C、D、E、F、Xから、初期値x(図中の白点)が属するクラスタXを、第1のクラスタ153aとして抽出する。

0049

クラスタ抽出部113は、複数のクラスタ153から、第1のクラスタ153a(クラスタX)と異なる1以上のクラスタである第2のクラスタ153bを抽出する(ステップS104)。例えば、クラスタ抽出部113は、第1のクラスタ153a(クラスタX)と関連性を有する1以上のクラスタを、予め設定された数の第2のクラスタ153bとして抽出する。具体的には、クラスタ抽出部113は、第1のクラスタ153aの位置情報と他の各クラスタの位置情報とに基づいて、第2のクラスタ153bを抽出する。「クラスタの位置情報」とは、例えば、特定のクラスタに属するすべての語句の座標から求めたクラスタの重心である。より具体的には、クラスタ抽出部113は、特定のクラスタに属するすべての語句151のすべての座標(位置情報152)の和を、そのクラスタに属するすべての語句151の数で除算して得た値(座標)を、「クラスタの位置情報」として用いる。クラスタ抽出部113は、第1のクラスタ153aとの重心間の距離が短い(すなわち、第1のクラスタ153aとの関連性が高い)特定数のクラスタを、複数の第2のクラスタ153bとして抽出する。

0050

図4Cの例では、クラスタ抽出部113は、第2のクラスタ153bとして、第1のクラスタXとの重心の距離が短い特定数(本例では4個)のクラスタA、B、C及びDを抽出する。図4C中、各クラスタ中黒点は、クラスタの位置情報としての、クラスタの重心の座標を示す。

0051

語句抽出部114は、第2のクラスタ153bから、それぞれ、初期値xと関連性の高い語句である特定数の関連語句を抽出する(ステップS105)。具体的には、語句抽出部114は、第2のクラスタ153bそれぞれに属する、初期値xと関連性の最も高い語句151である関連語句を、テーブル15aから抽出する。具体的には、語句抽出部114は、テーブル15aに登録された、初期値xの位置情報152(座標)と、各第2のクラスタ153bに含まれる各語句151の位置情報152(座標)との距離を算出する。語句抽出部114は、初期値xの位置情報152(座標)との距離が短い(関連性が高い)位置情報152に関連付けられた語句151を、関連語句として抽出する。

0052

図4Dの例では、語句抽出部114は、第2のクラスタA、B、C及びDから、それぞれ、初期値xとの距離が短い特定数(本例では1個)の関連語句a1、b1、c1及びd1を抽出する。図4D中、各クラスタ中の白点は、語句の座標を示す。

0053

リンク生成部115は、抽出した各関連語句に対して、各関連語句の情報資源の所在情報が紐付けられたリンク情報を生成する(ステップS106)。「情報資源」とは、例えば、その関連語句が解説された文書データ等であり、インターネット等のネットワークNに接続されたサーバー装置(図示せず)やPC10の記憶部15に格納されている。「所在情報」とは、例えば、ネットワークNに格納された情報資源にアクセスするためのURL(Uniform Resource Locator)や、PC10の記憶部15に格納された情報資源にアクセスするためのアドレス情報である。

0054

出力部116は、初期値xと、リンク情報が紐付けられた各関連語句とを、表示部12に出力する(ステップS107)。典型的には、出力部116は、各関連語句にリンクハイパーリンク)を設定し、ユーザーが操作部14を用いて選択可能な形式で表示部12に出力する。

0055

初期値入力部112は、ユーザーによる操作部14に対する特定の操作を、表示部12に表示された何れかの関連語句の選択要求として検出する(ステップS108、Yes)。初期値入力部112は、選択された関連語句を、初期値としてクラスタ抽出部113に入力する(ステップS109)。PC10は、クラスタ抽出部113に入力された関連語句を初期値として、ステップS103以後の処理を繰り返す。

0056

(4.まとめ)
初期値としての語句に対する関連語句を抽出する技術においては、ユーザーの学習効果を深めるため、初期値と関連性が高い関連語句を抽出することが一般的である。

0057

これに対して、本実施形態によれば、クラスタ抽出部113が第1のクラスタ153aと異なる第2のクラスタ153bを抽出し、語句抽出部114が第2のクラスタ153bから関連語句を抽出する。これにより、初期値に対して異なる複数の分野から関連語句を抽出することができる。これにより、ユーザーは、初期値と関連性の高い語句でありながら、異なる分野から抽出された関連語句を学習することで、初期値について幅広く学習することができる。

0058

また、本実施形態によれば、クラスタ抽出部113は、第1のクラスタ153aと関連性の高い1以上のクラスタを、第2のクラスタ153bとして抽出することにより、初期値である語句に対して当該語句の分野と関連性の高い分野の関連語句を抽出することができる。これにより、ユーザーは、初期値の分野と関連性の高い分野から抽出された関連語句を学習することで、初期値について幅広く、且つ、初期値の分野と関連性の高い内容を学習することができる。

0059

(5.変形例)
(5−1.変形例1)
本実施形態では、クラスタ抽出部113は、テーブル15aに基づき第2のクラスタ153bを抽出した。これに替えて、記憶部15が予めクラスタ同士の関連性を示すテーブル(図示せず)を記憶し、クラスタ抽出部113はこのテーブルから第2のクラスタ153bを抽出してもよい。

0060

(5−2.変形例2)
本実施形態では、クラスタ抽出部113は、第1のクラスタ153aと関連性を有する(具体的には、関連性の高い)1以上のクラスタを、第2のクラスタ153bとして抽出した。これに替えて、クラスタ抽出部113は、初期値と関連性を有する(具体的には、関連性の高い)1以上のクラスタを、第2のクラスタ153bとして抽出してもよい。具体的には、クラスタ抽出部113は、初期値の位置情報とクラスタの位置情報とに基づいて、第2のクラスタ153bを抽出する。さらに具体的には、クラスタ抽出部113は、初期値の位置情報(座標)と位置情報(重心の座標)との距離が小さいクラスタを、第2のクラスタ153bとして抽出する。

0061

本形態によれば、クラスタ抽出部113が初期値と関連性の高いクラスタを抽出することにより、初期値である語句に対して当該語句と関連性の高い分野の関連語句を抽出することができる。これにより、ユーザーは、初期値と関連性の高い分野から抽出された関連語句を学習することで、初期値について幅広く、且つ、初期値と関連性の高い内容を学習することができる。

0062

(5−3.変形例3)
また、本実施形態では、語句抽出部114は、1以上の第2のクラスタ153bから、それぞれ、初期値xと関連性の高い語句である関連語句を同数(1個)ずつ抽出した。これに替えて、語句抽出部114は、第1のクラスタ153aと各第2のクラスタ153bとの関連性に応じて、各第2のクラスタ153bから抽出する関連語句の数を異ならせてもよい。

0063

例えば、第1のクラスタ153aと関連性の比較的高い第2のクラスタ153bから抽出する関連語句の数を増やすことで、初期値を含む第1のクラスタ153aと関連性の比較的高い関連語句を多数抽出することができる。これにより、ユーザーは、初期値と関連性の比較的高い情報を多数知ることができ、初期値についてより深く学習することができる。

0064

あるいは、第1のクラスタ153aと関連性の比較的低い第2のクラスタ153bから抽出する関連語句の数を増やすことで、初期値を含む第1のクラスタ153aと関連性の比較的低い関連語句を多数抽出することができる。これにより、ユーザーは、初期値と関連する語句でありながら、初期値から離れて広範な分野の語句を多数知ることができ、初期値についてより広く学習することができる。

0065

(5−4.変形例4)
本実施形態では、語句抽出部114は、1以上の第2のクラスタ153bから、それぞれ、初期値xと関連性の高い語句である関連語句を抽出した。これに加えて、第1のクラスタ153aからも初期値xと関連性の高い語句である関連語句を抽出してもよい。これにより、広範な関連語句に加えて、初期値xと特に関連性の高い関連語句をもユーザーに提供できる。なお、第1のクラスタ153aからも関連語句を抽出する場合、第2のクラスタ153bから抽出する関連語句の数を、第1のクラスタ153aから抽出する関連語句の数より増やすようにすれば、ユーザーは、広範な分野の語句を多数知ることができ、初期値についてより広く学習することができる。

0066

(5−5.変形例5)
本実施形態では、クラスタ抽出部113は、図4Dに示すように、第1のクラスタ153aと関連性の高い1以上のクラスタを、第2のクラスタ153bとして抽出した。また、変形例2では、クラスタ抽出部113は、図4Fに示すように、初期値xと関連性の高い1以上のクラスタを、第2のクラスタ153bとして抽出した。これに替えて、例えば、クラスタ抽出部113は、必ずしもすべての第2のクラスタ153bを、第1のクラスタ153a又は初期値xを基準として選択しなくても良い。

0067

例えば、クラスタ抽出部113は、まず、第1のクラスタと関連性の最も高い第2のクラスタを抽出し、次に、抽出した第2のクラスタと関連性の最も高い別の第2のクラスタを抽出し、それを繰り返して言わば連鎖的に複数の第2のクラスタ153bを抽出してもよい。これにより、ユーザーは、初期値と関連する語句でありながら、初期値から離れて連鎖的な分野の語句を多数知ることができ、初期値についてより広く学習することができる。

0068

(5−6.変形例6)
本実施形態では、1つの情報処理装置(PC10)が全ての動作を実行した。これに替えて、2以上の情報処理装置が動作を分担してもよい。例えば、外部の情報処理装置(例えば、ネットワーク上のサーバー装置(図示せず)が制御部11と記憶部15とを有し、エンドユーザーが利用する情報処理装置(図示せず)が表示部12と操作部14とを有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。

0069

(5−7.変形例7)
あるいは、サーバー装置が制御部11を有し、エンドユーザーが利用する情報処理装置が表示部12、操作部14及び記憶部15を有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。

0070

(5−8.変形例8)
あるいは、サーバー装置が制御部11を有し、エンドユーザーが利用する情報処理装置が表示部12及び操作部14を有し、ネットワーク上にあるさらに別の情報処理装置が記憶部15のデータベースを有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。

0071

10…PC
111…クラスタ解析部
112…初期値入力部
113…クラスタ抽出部
114…語句抽出部
115…リンク生成部
116…出力部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社ソケッツの「 検索装置および方法」が 公開されました。( 2019/09/19)

    【課題】同一の感性ワードで加重的に絞り込み検索を行えるようにする。【解決手段】同一の感性ワードで加重的に絞り込み検索を行う場合、類似・関連ワード抽出部319が、感性ワードに類似・関連する別のワードを検... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】ユーザの移動の妨害に応じた適切な対応を可能にする。【解決手段】本願に係る情報処理装置は、取得部と、決定部とを有する。取得部は、ユーザの位置情報と、ユーザが位置するエリアにおいて発生する事象のう... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】類似のコンテンツを適切に抽出する。【解決手段】本願に係る情報処理装置は、取得部と、検索部とを有する。取得部は、複数のコンテンツの各々に対応する複数のノードが、複数のコンテンツの類似性に応じて連... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ