図面 (/)

技術 オントロジー処理装置及びプログラム

出願人 沖電気工業株式会社
発明者 奥村晃弘
出願日 2016年3月28日 (4年7ヶ月経過) 出願番号 2016-063931
公開日 2017年10月5日 (3年1ヶ月経過) 公開番号 2017-182168
状態 特許登録済
技術分野 機械翻訳 検索装置
主要キーワード データ記述形式 結果ベクトル 座標回転 フィッティング結果 各固有値 累積寄与率 追加候補 フィッティング処理
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年10月5日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

課題

上位概念下位概念を持つオントロジーに対して、より適切な単語追加を支援する。

解決手段

本発明はオントロジー処理装置に関する。そして、本発明のオントロジー処理装置は、オントロジーから、指定された概念の下位概念に該当する単語をタネ単語として取得し、タネ単語のフィッティング処理の結果から求められた超平面と各単語ベクトルの単語との距離を計算し、計算した距離に基づいてオントロジーに追加登録する候補となる単語を抽出し、抽出した追加候補の単語の一部又は全部についてオントロジーに追加することを特徴とする。

概要

背景

従来、言語処理技術において、機械翻訳対話理解の研究が長年続けられているが、近年は単語の意味情報概念)を利用して高度な知識処埋に関する研究が盛んになっている。そうした技術の中にオントロジー技術がある。「オントロジー」とは、辞書一種で、単語の持つ概念(単語)を体系的に整理したものである。従来のオントロジーを生成する技術としては、例えば、特許文献1等の技術が開示されている。

また、従来、非特許文献1では、大量の文書を与えて自動学習することにより単語ベクトルを作成する手法が示されている。単語からベクトル表現を作り出す技術はそれ以前にもあったが、非特許文献1の記載技術では、複雑な概念の表現が可能となっている。例えば、作成されたベクトルで「フランス」−「パリ」+「東京」≒「日本」のような演算が可能となる。これは「フランス」−「パリ」が「その都市首都とする国」を表現している。このように、非特許文献1では、ベクトルの方向がなんらかの「意味」を持つようになる。

また、特許文献1では単語(ワード)の類似性を利用したオントロジーの自動生成について開示されている。

概要

上位概念・下位概念を持つオントロジーに対して、より適切な単語追加を支援する。 本発明はオントロジー処理装置に関する。そして、本発明のオントロジー処理装置は、オントロジーから、指定された概念の下位概念に該当する単語をタネ単語として取得し、タネ単語のフィッティング処理の結果から求められた超平面と各単語ベクトルの単語との距離を計算し、計算した距離に基づいてオントロジーに追加登録する候補となる単語を抽出し、抽出した追加候補の単語の一部又は全部についてオントロジーに追加することを特徴とする。

目的

以上のような問題に鑑みて、上位概念・下位概念を持つオントロジーに対して、より適切な単語追加を支援するオントロジー処理装置及びプログラムが望まれている

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

複数の単語ベクトルを保持する単語ベクトル保持手段と、オントロジーを記憶するオントロジー記憶手段と、前記オントロジー記憶手段の前記オントロジーから、指定された単語の下位概念に該当する単語をタネ単語として取得するタネ単語取得手段と、タネ単語のフィッティング処理の結果から求められた超平面と、前記単語ベクトル保持手段で保持された各単語ベクトルの単語との距離を計算する距離計算手段と、前記距離計算手段で計算した距離に基づいて、前記単語ベクトル保持手段で保持された単語から、前記オントロジー記憶手段の前記オントロジーに追加登録する候補となる単語を抽出する追加候補抽出手段と、前記追加候補抽出手段で抽出した追加候補の単語の一部又は全部について前記オントロジー記憶手段の前記オントロジーに追加するオントロジー編集手段とを有することを特徴とするオントロジー処理装置

請求項2

前記オントロジー編集手段は、前記追加候補抽出手段で抽出した追加候補の単語をユーザに提示し、前記オントロジーに追加する単語の指定を受付け、ユーザから前記オントロジーに追加する単語として指定された単語を、前記オントロジーに追加する処理を行うことを特徴とする請求項1に記載のオントロジー処理装置。

請求項3

前記距離計算手段は、タネ単語のフィッティング処理の結果に基づいて超平面の次元数M(Mは1以上の整数)を決定し、第1軸から第M軸が張る超平面と、前記単語ベクトル保持手段で保持された各単語ベクトルの示す点との距離を、前記単語ベクトル保持手段で保持された各単語ベクトルの単語に対応する距離として計算することを特徴とする請求項1又は2に記載のオントロジー処理装置。

請求項4

コンピュータを、複数の単語ベクトルを保持する単語ベクトル保持手段と、オントロジーを記憶するオントロジー記憶手段と、前記オントロジー記憶手段の前記オントロジーから、指定された単語の下位概念に該当する単語をタネ単語として取得するタネ単語取得手段と、タネ単語のフィッティング処理の結果から求められた超平面と、前記単語ベクトル保持手段で保持された各単語ベクトルの単語との距離を計算する距離計算手段と、前記距離計算手段で計算した距離に基づいて、前記単語ベクトル保持手段で保持された単語から、前記オントロジー記憶手段の前記オントロジーに追加登録する候補となる単語を抽出する追加候補抽出手段と、前記追加候補抽出手段で抽出した追加候補の単語の一部又は全部について前記オントロジー記憶手段の前記オントロジーに追加するオントロジー編集手段として機能させることを特徴とするオントロジー処理プログラム

技術分野

0001

本発明は、オントロジー処理装置及びプログラムに関し、例えば、オントロジーの作成を支援するオントロジー作成支援装置に適用し得る。

背景技術

0002

従来、言語処理技術において、機械翻訳対話理解の研究が長年続けられているが、近年は単語の意味情報概念)を利用して高度な知識処埋に関する研究が盛んになっている。そうした技術の中にオントロジー技術がある。「オントロジー」とは、辞書一種で、単語の持つ概念(単語)を体系的に整理したものである。従来のオントロジーを生成する技術としては、例えば、特許文献1等の技術が開示されている。

0003

また、従来、非特許文献1では、大量の文書を与えて自動学習することにより単語ベクトルを作成する手法が示されている。単語からベクトル表現を作り出す技術はそれ以前にもあったが、非特許文献1の記載技術では、複雑な概念の表現が可能となっている。例えば、作成されたベクトルで「フランス」−「パリ」+「東京」≒「日本」のような演算が可能となる。これは「フランス」−「パリ」が「その都市首都とする国」を表現している。このように、非特許文献1では、ベクトルの方向がなんらかの「意味」を持つようになる。

0004

また、特許文献1では単語(ワード)の類似性を利用したオントロジーの自動生成について開示されている。

0005

特開2009−110513号公報

先行技術

0006

”Distributed representations of wordsandphrases and their compositionality” Tomas Mikolov,Ilya Sutskever,Kai Chen,Greg S Corrado, Jeff Dean, 2013,NIPS

発明が解決しようとする課題

0007

しかしながら、特許文献1の技術で生成されるオントロジーは各単語が同列であり、上位概念・下位概念の関係を持つオントロジーを作成することができなかった。

0008

以上のような問題に鑑みて、上位概念・下位概念を持つオントロジーに対して、より適切な単語追加を支援するオントロジー処理装置及びプログラムが望まれている。

課題を解決するための手段

0009

第1の本発明のオントロジー処理装置は、(1)複数の単語ベクトルを保持する単語ベクトル保持手段と、(2)オントロジーを記憶するオントロジー記憶手段と、(3)前記オントロジー記憶手段の前記オントロジーから、指定された単語の下位概念に該当する単語をタネ単語として取得するタネ単語取得手段と、(4)タネ単語のフィッティング処理の結果から求められた超平面と、前記単語ベクトル保持手段で保持された各単語ベクトルの単語との距離を計算する距離計算手段と、(5)前記距離計算手段で計算した距離に基づいて、前記単語ベクトル保持手段で保持された単語から、前記オントロジー記憶手段の前記オントロジーに追加登録する候補となる単語を抽出する追加候補抽出手段と、(6)前記追加候補抽出手段で抽出した追加候補の単語の一部又は全部について前記オントロジー記憶手段の前記オントロジーに追加するオントロジー編集手段とを有することを特徴とする。

0010

第2の本発明のオントロジー処理プログラムは、コンピュータを、(1)複数の単語ベクトルを保持する単語ベクトル保持手段と、(2)オントロジーを記憶するオントロジー記憶手段と、(3)前記オントロジー記憶手段の前記オントロジーから、指定された単語の下位概念に該当する単語をタネ単語として取得するタネ単語取得手段と、(4)タネ単語のフィッティング処理の結果から求められた超平面と、前記単語ベクトル保持手段で保持された各単語ベクトルの単語との距離を計算する距離計算手段と、(5)前記距離計算手段で計算した距離に基づいて、前記単語ベクトル保持手段で保持された単語から、前記オントロジー記憶手段の前記オントロジーに追加登録する候補となる単語を抽出する追加候補抽出手段と、(6)前記追加候補抽出手段で抽出した追加候補の単語の一部又は全部について前記オントロジー記憶手段の前記オントロジーに追加するオントロジー編集手段として機能させることを特徴とする。

発明の効果

0011

本発明によれば、上位概念・下位概念を持つオントロジーに対して、より適切な単語追加を支援するオントロジー処理装置及びプログラムを提供することができる。

図面の簡単な説明

0012

実施形態に係るオントロジー作成支援装置の機能的構成について示したブロック図である。
実施形態に係るオントロジー作成支援装置の動作について示したフローチャートである。
実施形態に係るオントロジー作成支援装置により単語が追加される前のオントロジーの構成例について示した説明図(概念図)である。
実施形態に係るオントロジー作成支援装置により単語が追加された後のオントロジーの構成例について示した説明図(概念図)である。
実施形態に係る単語ベクトル作成部で作成されたタネ単語の単語ベクトルの構成例について示した説明図である。
実施形態に係る距離計算部で行われた寄与率算出の結果について示した説明図である。
実施形態に係る距離計算部で取得された各タネ単語の分布フィットするように回転するための変換係数について示した説明図である。
実施形態に係る単語ベクトル作成部で作成された単語ベクトルについて示した説明図である。
実施形態に係る単語ベクトル作成部で作成された単語ベクトルを座標回転させたパラメータについて示した説明図である。
実施形態に係るオントロジー編集部が表示する操作画面(ユーザに追加候補の単語を提示し、オントロジーに追加する単語を受け付けるための操作画面)の構成例について示した説明図である。

実施例

0013

(A)主たる実施形態
以下、本発明によるオントロジー処理装置及びプログラムの一実施形態を、図面を参照しながら詳述する。以下では、本発明のオントロジー処理装置及びプログラムを、オントロジー作成支援装置に適用した例について説明する。

0014

(A−1)実施形態の構成
図1は、この実施形態に係るオントロジー作成支援装置100の機能的構成について示したブロック図である。

0015

オントロジー作成支援装置100は、制御部1、単語ベクトル作成部2、入出力部3、オントロジー記憶部4、及び文書記憶部5を有している。

0016

オントロジー作成支援装置100は、一部又は全部をソフトウェア的に構成するようにしてもよい。例えば、オントロジー作成支援装置100は、コンピュータ(例えば、プロセッサ及びメモリを有するプログラムの実行構成)にプログラム(実施形態に係るオントロジー処理プログラムを含むプログラム)をインストールすることにより構成するようにしてもよい。例えば、図1において、制御部1、及び単語ベクトル作成部2を図示しないコンピュータ上のプログラム(実施形態に係るオントロジー処理プログラムを含むプログラム)として構成し、オントロジー記憶部4及び文書記憶部5を図示しないコンピュータ上のデータ記録媒体(例えば、ハードディスクドライブフラッシュメモリ等の記憶手段)で構成するようにしてもよい。

0017

オントロジー記憶手段としてのオントロジー記憶部4は、複数の単語(概念)により形成されるオン卜ロジーを記憶するための記憶手段である。オントロジー記憶部4が記憶するオントロジーは、単語(概念)間の上位概念及び下位概念の対応づけが可能な構成となっているものとする。なお、オントロジー記憶部4に記憶されるオントロジーは、上位概念及び下位概念の対応づけが可能であれば、その他の具体的なデータ記述形式については限定されないものであり、種々のオントロジーのデータ記述形式を適用することができる。

0018

文書記憶部5は、大量の文書データ(例えば、テキストデータ等の種々の形式の文書データのファイル)を記憶する記憶手段である。

0019

単語ベクトル保持手段としての単語ベクトル作成部2は、文書記憶部5の大量の文書データから単語ベクトル(文書データに含まれる単語に関する単語ベクトル)を作成し記憶する。単語ベクトル作成部2が文書記憶部5で保持された文書データから単語ベクトルを生成する具体的手法については限定されないものであるが、例えば、非特許文献1に記載された手法を適用することができる。なお、単語ベクトル作成部2は、文書を単語に分解する際に、単語ベクトル作成部2内部の図示しない単語辞書と共にオントロジー記憶部4に記憶された単語を参照するようにしてもよい。

0020

制御部1は、オントロジー作成支援装置100の各構成要素を制御する機能を担っており、処理対象選択部11、距離計算部12、及びオントロジー編集部13を有している。

0021

処理対象選択部11は、ユーザから、オントロジー記憶部4に記憶されるオントロジー上で追加候補を探索する位置(単語)の指定を受付ける処理を行う。

0022

距離計算部12は、処理対象選択部11で受付けた位置(単語)の下位概念に追加する候補となる単語を探索する処理を行う。具体的には、距離計算部12は、まず、オントロジー記憶部4から、指定された単語(概念)の下位概念に該当する単語を追加候補のタネ(シード)となる単語(以下、「タネ単語」と呼ぶ)として取得する処理(タネ単語取得手段としての処理)を行う。また、距離計算部12は、複数のタネ単語のフィッティング処理(例えば、主成分分析と同様の計算を利用いたフィッティング処理)の結果から求められた超平面と、単語ベクトル作成部2で保持された各単語ベクトルの単語との距離を計算する処理(距離計算手段としての処理)を行う。さらに、距離計算部12は、計算した距離に基づいて、単語ベクトル作成部2で保持された単語ベクトルに係る単語から、オントロジー記憶部4のオントロジーに追加登録する候補となる単語を抽出する処理(追加候補抽出手段としての処理)を行う。

0023

オントロジー編集手段としてのオントロジー編集部13は、ユーザから、追加候補の単語のうち、オントロジー記憶部4のオントロジーに追加する単語の指定を受付ける処理を行う。そして、オントロジー編集部13は、ユーザの指示(操作)に従って、追加候補の単語の一部又は全部について、オントロジー記憶部4のオントロジーに追加する処理を行う。

0024

入出力部3は、ユーザインタフェースの機能(入出力手段)を担っており、ユーザからの操作や情報入力を受付けるための入力部31と、ユーザへ情報出力するための出力部32を有している。入力部31としては、例えば、キーボードマウスなどの入力デバイスを適用することができる。また、出力部32としては、ディスプレイプリンタ等の出力デバイスを適用することができる。

0025

(A−2)実施形態の動作
次に、以上のような構成を有するこの実施形態のオントロジー作成支援装置100の動作について図2のフローチャートを用いて説明する。

0026

なお、図2のフローチャートでは、前提初期状態)として、単語ベクトル作成部2による単語ベクトルの作成(文書記憶部5の文書データを用いた単語ベクトルの作成)が完了し、作成した単語ベクトルのデータが保持されているものとする。単語ベクトル作成部2による単語ベクトルの作成処理については、上述の通り非特許文献1と同様の処理を適用することができるため、詳しい説明は省略する。

0027

また、図2のフローチャートでは、前提(初期状態)として、オントロジー記憶部4に、任意の数の単語(概念)で構成されるオントロジーが登録されているものとする。

0028

まず、処理対象選択部11がユーザから、オントロジー記憶部4のオントロジー上で、下位概念の単語を追加する位置(単語)の指定(選択)を受付けたものとする(S101)。

0029

例えば、処理対象選択部11は、入出力部3を介して、ユーザにオントロジー記憶部4のオントロジーに含まれる単語(概念)を提示(例えば、オントロジーを構成する単語のリストマップを表示)して、いずれかの単語(概念)の指定(選択)を受付けるようにしてもよい。

0030

次に、処理対象選択部11は、ステップS101で指定された概念(単語)に基づいて、追加候補の単語を抽出する際のタネとなるタネ単語を取得する。そして、処理対象選択部11は、ステップS101で取得したタネ単語の単語ベクトルを単語ベクトル作成部2から取得する(S102)。なお、単語ベクトル作成部2に該当する単語ベクトルが存在しないことも考えられるが、その場合、処理対象選択部11は、単語ベクトル作成部2に存在する分の単語ベクトルを取得するようにしてもよい。

0031

この実施形態では、処理対象選択部11は、オントロジー記憶部4に記憶されたオントロジーから、ステップS101でユーザに指定された概念の1つ下位の概念(単語)を取得する。但し、処理対象選択部11は、指定された概念の1つ下位の概念が中間概念だった場合は、当該中間概念のさらに1つ下位の概念を、下位概念として取得(参照)する。

0032

ここでは、オントロジー記憶部4に記憶された概念(単語)から、ユーザにより「プログラム言語」という概念(単語)が指定された場合の例について説明する。

0033

図3は、処理対象選択部11が、「プログラム言語」という概念からタネ単語を取得する例について示した説明図である。なお、図3の例では、プログラム言語の1つ下位の概念として「Java(登録商標)」、「C/C++」、「VB」、「Perl」という概念が存在している。なお、図3の例では、「C/C++」は中間概念であり、「C/C++」の1つ下位の概念として「C」と「C++」が存在する例について示している。したがって、処理対象選択部11は、「C/C++」という中間概念の1つ下位の「C」と「C++」を「プログラム言語」に対応するタネ単語の一部として取得することになる。したがって、図3の例では、処理対象選択部11は、「プログラム言語」という概念に対応するタネ単語として、「Java」、「C」「C++」、「VB」、「Perl」を取得することになる。そして、処理対象選択部11は、「プログラム言語」対する各タネ単語の単語ベクトルを、単語ベクトル作成部2から取得する。

0034

次に、距離計算部12が、ステップS102で取得された各単語ベクトル(抽出された各タネ単語に対応する単語ベクトル)の分布にフィットするように座標回転を行い、その結果を用いて各単語ベクトルに基づくM次元超平面を決定する(S103)。

0035

以下では、距離計算部12が各タネ単語に基づくM次元超平面を決定する処理の具体例について説明する。

0036

まず、単語ベクトル作成部2が、単語ベクトルとしてN次元(Nは1以上の整数)のベクトルを作成していたものとする。そうすると、処理対象選択部11が、選択したタネ単語に対応する単語ベクトルは、図5のようなマトリクス(テーブル)で表すことができる。図5のマトリクス(テーブル)では、それぞれの行にタネ単語を割当てている。図5では、1行目から順に「Java」、「C」「C++」、「VB」、「Perl」を割当てている。そして、図5のマトリクス(テーブル)では、1列目から順にX1、X2、X3、…、XNというパラメータを割当てている。

0037

このとき、図5のデータを(1)式のように行列で表す。この場合、距離計算部12は、(1)式の行列の分散共分散行列を求め、さらにその固有値固有ベクトルを求める。そして、距離計算部12は、固有値が大きい順に固有ベクトルを並べて回転行列とする(図7参照)。そして、距離計算部12は、各固有値を固有値の総和で割って寄与率を算出する。そして、距離計算部12は、固有値が最大のものの寄与率から順に寄与率を累積加算していき、累積寄与率を算出する。

0038

図6は、各タネ単語ベクトルを処理した結果得られた各成分(第1成分PC1、第2成分PC2、…第N成分PCN)の寄与率と、各成分の累積寄与率(第1成分から当該成分までの寄与率の累積値合計値))の例について示している。図7は、単語ベクトルを構成する各パラメータ(X1〜XN)と、各成分(PC1〜PCN)との各組合せに対応する変換係数について示したマトリクスである。以下では、パラメータXi(iは1〜Nのいずれか)と成分PCj(jは1〜Nのいずれか)との組み合わせに対応する変換係数をaijと図示している。例えば、X1とPC1との組み合わせに対応する変換係数をa11と図示し、XとPC2との組み合わせに対応する変換係数をa12と図示している。

0039

次に、距離計算部12は、フィッティング結果において、第1成分PC1から順に累積寄与率を参照し、初めて所定の累積寄与率Tを超えるときの次元数M(初めて閾値である累積寄与率Tを超えるときの成分の番号(順番))を取得する。ここでは、例として累積寄与率Tを80%(0.80)であるものとするが、累積寄与率Tの値は任意に設定することができる。

0040

例えば、図6に示すフィッティングの結果では、第1成分PC1から順に累積寄与率を参照すると、初めて累積寄与率が80%(0.80)を超えるのは第2成分PC2となる。したがって、距離計算部12は、次元数Mとして「2」を取得することになる。

0041

次に、距離計算部12は、第1軸(第1の成分の軸)から第M軸(第Mの成分の軸)が張る超平面を、求めるべきM次元超平面として決定する。ここでは、上述のようにM=2であるため、距離計算部12は、第1軸、第2軸が張る超平面を、求めるべきM次元超平面として決定することになる。

0042

以上のように、距離計算部12は、M次元超平面を決定する。

0043

次に、距離計算部12が、ステップS103で決定したM次元超平面と、単語ベクトル作成部2内の各単語ベクトルの示す点との距離を計算する(S104)。

0044

以下、距離計算部12が行うM次元超平面と各単語ベクトルとの距離計算処理の具体例について説明する。

0045

図8は、単語ベクトル作成部2内の各単語ベクトルの例について示した説明図である。

0046

図8では、「python」、「Linux(登録商標)」、「Ruby」、…、という各単語に対応する単語ベクトルの各パラメータ(X1〜XN)が図示されている。

0047

図8では、「python」という単語に対応する各パラメータX1〜XNの値をx11〜x1Nと図示している。また、図8では、「Linux」という単語に対応する各パラメータX1〜XNの値をx21〜x2Nと図示している。さらに、図8では、「Ruby」という単語に対応する各パラメータX1〜XNの値をx31〜x3Nと図示している。

0048

そして、図9は、図8に示す各単語ベクトルを座標回転した結果について示した説明図である。以下では、単語ベクトルを座標回転した結果を「回転結果ベクトル」と呼ぶものとする。

0049

図9では、「python」、「Linux」、「Ruby」、…、という各単語に対応する単語ベクトルが回転結果ベクトルのパラメータ(第1成分PC1〜第N成分PCN)で図示されている。

0050

図9では、「python」という単語に対応する第1成分PC1〜第N成分PCNの値をz11〜z1Nと図示している。また、図9では、「Linux」という単語に対応する第1成分PC1〜第N成分PCNの値をz21〜z2Nと図示している。さらに、図9では、「Ruby」という単語に対応する第1成分PC1〜第N成分PCNの値をz31〜z3Nと図示している。さらにまた、図9では、任意の単語に対応する第1成分PC1〜第N成分PCNの値をzi1〜ziN(iは1以上の整数)と図示している。なお、各単語に対応する第1成分PC1〜第N成分PCNの値(zi1〜ziN)については、以下の(2)式に示す行列演算によって求めることができる。なお、(2)式においてAは以下の(3)式の行列となる。また、(2)式において、Xは以下の(4)式の行列となる。さらに、(2)式においてZは以下の(5)式の行列となる。

0051

従って、距離計算部12は、M次元超平面と、任意の単語(単語ベクトル)との距離は、図9に示す回転結果ベクトルのパラメータの第M+1成分以降の2乗和より求めることができる。

0052

具体的には、距離計算部12は、M次元超平面と任意の単語(i番目の単語)との距離を(6)式により求めることができる。例えば、M=2の場合、図8図9に示す単語「Python」の距離D1は(7)式のように示すことができる。

0053

以上のように、距離計算部12は、M次元超平面と、単語ベクトル作成部2内の各単語ベクトル(タネ単語以外の単語ベクトル)との距離を求める。

0054

次に、オントロジー編集部13は、ステップS104で計算した各単語の距離に基づいて追加候補の単語を抽出し、抽出結果をユーザに提示(例えば、入出力部3を介してユーザに表示出力)する(S105)。

0055

次に、オントロジー編集部13は、ユーザから追加候補の単語について追加の要否を受付け(例えば、入出力部3を介して入力を受け付け)、追加する旨が入力された単語について、オントロジー記憶部4のオントロジーに追加登録する(S106)。

0056

オントロジー編集部13は、例えば、距離が所定の閾値よりも小さい(短い)単語を追加候補として抽出して、ユーザに提示するようにしてもよい。例えば、オントロジー編集部13は、入出力部3を介して図10のような操作画面(GUI画面)を表示してユーザに追加候補の単語を提示し、それぞれの追加候補の単語についてオントロジーへの追加の要否(「追加する」又は「追加しない」)を受け付けるようにしてもよい。また、オントロジー編集部13は、図10に示すように各追加候補の単語に計算した距離の情報を付してユーザに提示するようにしてもよい。

0057

図10の操作画面では、追加候補の単語ごとに、距離と、追加要否の選択を受付可能なラジオタン(「追加する」又は「追加しない」を選択可能なラジオボタン)が表示されたフィールドF101と、オントロジーに追加する単語を決定する決定ボタンB101とが配置されている。図10の操作画面では、決定ボタンB101が押下されると、オントロジー編集部13は、フィールドF101で「追加する」が選択された単語(ラジオボタンにより「追加する」が選択された単語)を、オントロジー記憶部4のオントロジーに追加登録(ユーザから指定された概念(単語)の下位概念として追加登録)する。また、図10では、フィールドF101に、距離の小さい(短い)順に単語が配置されている。フィールドF101において、距離に応じた順序で単語を配置(ソート)することでユーザは、指定された概念(ここでは「プログラム言語」)とより近い概念の単語を下位概念として選択することができる。

0058

図10の操作画面の状態では、「python」、「Linux」、「Ruby」という3つの単語が追加候補の単語として表示されている。そして、図10では、「python」、「Ruby」という2つの単語について「追加する」と選択(ラジオボタンにより選択)されている。したがって、図10の操作画面の状態で、決定ボタンB101が押下されると、オントロジー編集部13は、図4に示すように「python」、「Ruby」という2つの単語について、オントロジー記憶部4のオントロジーに追加登録する。

0059

図4に示すオントロジーでは、図3の状態から、「python」、「Ruby」という2つの単語がプログラム言語の下位概念として登録されている。

0060

次に、制御部1は、ユーザから処理の継続の要否を受付け(S107)、ユーザから処理を継続する旨の入力を受け付けた場合は上述のステップS101から動作し、ユーザから処理を継続しない旨の入力を受け付けた場合は処理を終了する。

0061

(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。

0062

この実施形態のオントロジー作成支援装置100では、オントロジー記憶部4のオントロジーにある程度の単語(概念)を登録しておけば、それらをタネ単語として追加候補の単語を自動的に抽出することができる。

0063

また、この実施形態のオントロジー作成支援装置100では、タネ単語の単語ベクトルをフィッティング処理した結果に基づいて決定したM次元超平面からの距離を算出し、算出した距離に基づいて追加候補となる単語を抽出している。これにより、この実施形態のオントロジー作成支援装置100では、全体としての類似度ではなく、ある観点での類似度に着目し、既存の上位概念、下位概念を持つオントロジーに新しく単語を追加することができる。

0064

さらに、この実施形態のオントロジー作成支援装置100では、抽出された追加候補は単語と共に距離値が表示(例えば、図10参照)されるため、最終的にユーザの操作に応じて、オントロジーに追加するかどうか決定することができる。

0065

(B)他の実施形態
本発明は、上記の実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。

0066

(B−1)上記の実施形態において、単語ベクトル保持手段として文書データから単語ベクトルを作成して保持する単語ベクトル作成部2を適用する例について説明したが、オントロジー作成支援装置100において、文書データに基づく単語ベクトルを保持する方式については限定されないものである。例えば、上記の実施形態において、単語ベクトル作成部2に替えて、外部で生成された単語ベクトルを保持する手段を適用するようにしてもよい。

0067

100…オントロジー作成支援装置、1…制御部、11…処理対象選択部、12…距離計算部、13…オントロジー編集部、2…単語ベクトル作成部、3…入出力部、31…入力部、32…出力部、4…オントロジー記憶部、5…文書記憶部。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 富士ゼロックス株式会社の「 データ管理システム」が 公開されました。( 2020/09/24)

    【課題】階層構造になっている管理システムにおいて、管理対象データの実体を最上位の装置が全て管理する場合と比較して、管理対象データがユーザの意図しない装置に提供されないシステムを提供する。【解決手段】管... 詳細

  • ソニー株式会社の「 情報処理装置、情報処理方法、およびプログラム」が 公開されました。( 2020/09/24)

    【課題・解決手段】本技術は、複数人のユーザが皆満足できる空間を提供することができるようにする情報処理装置、情報処理方法、およびプログラムに関する。分析部は、複数人のユーザが存在する環境におけるセンシン... 詳細

  • アルテリックス インコーポレイテッドの「 並列処理を使用したハッシュ結合の実行」が 公開されました。( 2020/09/24)

    【課題・解決手段】データレコードは、コンピュータを使用して結合される。第1の複数のデータレコードおよび第2の複数のデータレコード内のデータレコードがハッシュされる。第1の複数のデータレコードおよび第2... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ