図面 (/)
課題
解決手段
概要
背景
概要
指定された時間内に、バイアスを抑えて欠損値を補完できる欠損値補完装置、欠損値補完方法及び欠損値補完プログラムを提供する。収集したデータの欠損値を補完する欠損値補完装置1は、補完処理の所要時間をシミュレーションにより計測し、多重代入法により多重化されるデータの多重化数毎に当該所要時間を対応付ける補完処理部12と、補完処理の許容時間が指定されると、対応付けられた所要時間に基づいて、許容時間の間に補完処理が終了する多重化数を取得する多重化数取得部14と、取得された多重化数に応じて、補完処理の計算手法を決定する計算手法決定部15と、を備える。
目的
効果
実績
- 技術文献被引用数
- 0件
- 牽制数
- 0件
この技術が所属する分野
請求項1
収集したデータの欠損値を補完する欠損値補完装置であって、補完処理の所要時間をシミュレーションにより計測し、多重代入法により多重化されるデータの多重化数毎に当該所要時間を対応付ける計測部と、前記補完処理の許容時間が指定されると、対応付けられた前記所要時間に基づいて、前記許容時間の間に前記補完処理が終了する前記多重化数を取得する取得部と、取得された前記多重化数に応じて、前記補完処理の計算手法を決定する決定部と、を備える欠損値補完装置。
請求項2
請求項3
前記取得部は、前記許容時間の間に前記補完処理が終了する前記多重化数のうち、最大値を取得する請求項1又は請求項2に記載の欠損値補完装置。
請求項4
前記決定部は、欠損率及び前記多重化数に基づく効率性の指標が所定値を超える前記多重化数の最小値、又は前記取得部により取得された前記最大値のうち小さい方をパラメータとした多重代入法を、前記計算手法として決定する請求項3に記載の欠損値補完装置。
請求項5
前記決定部は、前記シミュレーションにおいて前記多重化数の増加に伴って、前記補完処理による推定値が指定の有効桁数の範囲で所定回数、連続して一致した場合に、当該連続の開始した前記多重化数、又は取得部により取得された前記最大値のうち小さい方をパラメータとした多重代入法を、前記計算手法として決定する請求項3に記載の欠損値補完装置。
請求項6
前記決定部は、前記取得部が前記多重化数を取得できない場合、前記多重代入法に代えて、所定の補完手法を前記計算手法として決定する請求項1から請求項5のいずれかに記載の欠損値補完装置。
請求項7
収集したデータの欠損値を補完する欠損値補完方法であって、補完処理の所要時間をシミュレーションにより計測し、多重代入法により多重化されるデータの多重化数毎に当該所要時間を対応付ける計測ステップと、前記補完処理の許容時間が指定されると、対応付けられた前記所要時間に基づいて、前記許容時間の間に前記補完処理が終了する前記多重化数を取得する取得ステップと、取得された前記多重化数に応じて、前記補完処理の計算手法を決定する決定ステップと、をコンピュータが実行する欠損値補完方法。
請求項8
請求項1から請求項6のいずれかに記載の欠損値補完装置としてコンピュータを機能させるための欠損値補完プログラム。
技術分野
背景技術
0002
従来、工作機械及びロボット等の産業機械から、例えばトルク、振動、電流の抵抗値等のデータを時系列に取得し、異常度を計算するシステム等が運用されている。ところが、このようなデータの発生源によっては、データの欠損が発生するため、システムへの入力が得られない場合がある。
0003
そこで、データの欠損値を補完する種々の手法が提案されている。特に、バイアスが少ない手法として、多重代入法が広く利用されている(例えば、非特許文献1参照)。例えば、特許文献1及び2等において、多重代入法による欠損値の補完技術を利用したシステムが提案されている。
先行技術
発明が解決しようとする課題
0006
しかしながら、多重代入法は、条件によっては計算量が多く時間が掛かるため、収集したデータをリアルタイムで利用したい場合、決められた時間内(例えば、数秒以内)に欠損値を補完することが難しかった。
課題を解決するための手段
0007
本開示の一態様である欠損値補完装置は、収集したデータの欠損値を補完するものであって、補完処理の所要時間をシミュレーションにより計測し、多重代入法により多重化されるデータの多重化数毎に当該所要時間を対応付ける計測部と、前記補完処理の許容時間が指定されると、対応付けられた前記所要時間に基づいて、前記許容時間の間に前記補完処理が終了する前記多重化数を取得する取得部と、取得された前記多重化数に応じて、前記補完処理の計算手法を決定する決定部と、を備える。
0008
本開示の一態様である欠損値補完方法は、収集したデータの欠損値を補完する方法であって、補完処理の所要時間をシミュレーションにより計測し、多重代入法により多重化されるデータの多重化数毎に当該所要時間を対応付ける計測ステップと、前記補完処理の許容時間が指定されると、対応付けられた前記所要時間に基づいて、前記許容時間の間に前記補完処理が終了する前記多重化数を取得する取得ステップと、取得された前記多重化数に応じて、前記補完処理の計算手法を決定する決定ステップと、をコンピュータが実行する。
0009
本開示の一態様である欠損値補完プログラムは、前記欠損値補完装置としてコンピュータを機能させるためのものである。
発明の効果
0010
一態様によれば、指定された時間内に、バイアスを抑えて欠損値を補完できる。
図面の簡単な説明
0011
一実施形態における多重代入法の概略を説明する図である。
一実施形態における欠損値補完装置の機能構成を示す図である。
一実施形態における多重化数を変えたときの欠損値の推定結果を例示する図である。
一実施形態における欠損値補完装置による、補完処理に用いる計算手法を決定する方法を示すフローチャートである。
実施例
0012
以下、本発明の実施形態の一例について説明する。
本実施形態の欠損値補完装置1は、産業機械の稼働管理ソフトウェア等において、取得したデータの欠損値を補完して出力する。
欠損値補完装置1は、欠損値を補完する手法として主に多重代入法を用い、取得したデータの利用状況に応じて、パラメータである後述の多重化数を調整する。
0013
図1は、本実施形態に係る多重代入法の概略を説明する図である。
多重代入法では、不完全データのうち観測されたデータを条件とした欠損値の事後分布から、M個(例えば、5個)のシミュレーション値を抽出し、補完済データセットが生成される。
これらのM個のデータセットを別々に統計分析し、結果を統合して最終結果としての推定値が算出される。
0014
このとき、多重化数Mを大きくするほど、バイアスが小さく精度の高い推定値が得られるが、計算量が増加し、グラフの描画等、データの利用が開始されるまでの時間に補完処理が終了しなくなってしまう。
したがって、欠損値補完装置1は、このような指定された時間内に計算が終了し、かつ、可能な限りバイアスが小さくなる多重化数Mを決定する。
0015
図2は、本実施形態に係る欠損値補完装置1の機能構成を示す図である。
欠損値補完装置1は、サーバ装置又はパーソナルコンピュータ等の情報処理装置(コンピュータ)であり、制御部10と、記憶部20とを備え、さらに、各種の入出力及び通信デバイスを備えていてよい。
0016
制御部10は、欠損値補完装置1の全体を制御する部分であり、記憶部20に記憶されたソフトウェア(欠損値補完プログラム)を読み出して実行することにより、本実施形態における各種機能を実現している。制御部10は、CPUであってよい。
また、制御部10は、データ収集部11と、補完処理部12(計測部)と、時間指定部13(指定部)と、多重化数取得部14(取得部)と、計算手法決定部15(決定部)とを備える。
0017
記憶部20は、ハードウェア群を欠損値補完装置1として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ROM、RAM、フラッシュメモリ又はハードディスクドライブ(HDD)等であってよい。
0019
補完処理部12は、データ収集中等、補完処理を行う実際の状況下で、補完処理の所要時間をシミュレーションにより計測する。具体的には、補完処理部12は、多重代入法により多重化されるデータセットの多重化数M毎にシミュレーションを行い、それぞれの所要時間を多重化数Mと対応付けて記憶部20に記憶する。
また、補完処理部12は、データ収集部11により収集されたデータに実際に欠損が生じた際に、計算手法決定部15により決定された計算手法により、欠損値の補完処理を実行する。
0020
時間指定部13は、データの収集時刻からデータの利用開始時刻までの時間を取得し、取得された時間を補完処理に掛けられる許容時間として指定する。利用開始時刻とは、例えば、収集したデータのグラフ描画が開始される時刻等であるが、描画の完了時刻又は完了時刻から推定される開始時刻等が用いられてもよい。
0021
多重化数取得部14は、補完処理の許容時間が指定されると、記憶部20に記憶された多重化数Mと所要時間との対応付けに基づいて、許容時間の間に補完処理が終了する多重化数Mを取得する。
具体的には、多重化数取得部14は、許容時間の間に補完処理が終了する多重化数Mのうち、最大値を決定する。
0022
計算手法決定部15は、多重化数取得部14により取得された多重化数Mに応じて、補完処理の計算手法を決定する。具体的には、計算手法決定部15は、例えば、取得された多重化数Mをパラメータとした多重代入法を、計算手法として決定する。
0023
このとき、計算手法決定部15は、欠損率及び多重化数Mに基づく効率性の指標が所定値を超える多重化数Mの最小値、又は多重化数取得部14により取得された最大値のうち小さい方をパラメータとした多重代入法を計算手法として決定してもよい。
例えば、前述の非特許文献1では、多重代入法の漸近的相対効率ARE(Asymptotic Relative Efficiency)が次のように定義されている。
ARE=(1+δ/M)−1/2×100
計算手法決定部15は、使用するデータセットからデータの欠損率δ(%)を計算し、MとAREとの関係を求める。そして、計算手法決定部15は、このAREが所定値(例えば、95%)を超えるMの最小値を、多重化数取得部14により取得された最大値と比較し、小さい方を多重代入法のパラメータとしてよい。
0024
また、計算手法決定部15は、補完処理のシミュレーションにおいて多重化数Mの増加に伴って、補完処理の推定値が指定の有効桁数の範囲で所定回数、連続して一致した場合に、連続の開始した多重化数Mを、多重化数取得部14により取得された最大値と比較し、小さい方を多重代入法のパラメータとして決定してもよい。
0025
図3は、本実施形態に係る多重化数Mを変えたときの欠損値の推定結果を例示する図である。
多重化数Mを増加させながら、欠損値を補完するための推定値を計算した場合、推定値は所定の値に収束していく。したがって、対象データの有効桁数が決まっている場合、多重化数Mがある数以上では、この有効桁数の範囲で推定値が一致する。
0026
例えば、小数点以下2桁までが有意である場合、12.750〜12.759等の所定の範囲に推定値が連続して(例えば4回)収まったとき、図のM1を多重化数Mの上限として、多重代入法が実行されてよい。なお、より安全に、M2又はM3等が上限として選択されてもよい。
0027
また、計算手法決定部15は、許容時間の間に補完処理を終了できる多重化数Mが存在しない等、多重化数取得部14が多重化数Mの最大値を取得できない場合、多重代入法に代えて、所定の補完手法を計算手法として決定する。
なお、所定の補完手法は限定されず、例えば、定数による補完、集計値(平均値、中央値等)による補完、欠損していないデータに基づく予測値による補完、時系列の関係による補完、最尤法等が利用可能である。
0028
図4は、本実施形態に係る欠損値補完装置1による、補完処理に用いる計算手法を決定する方法を示すフローチャートである。
0029
ステップS1において、時間指定部13は、ユーザからの入力に基づいて、又はデータの利用状況に応じて自動的に、データが収集されてから欠損値の補完を完了させるまでの許容時間Tを指定する。
0030
ステップS2において、補完処理部12は、実際に生じた欠損値を補完する際と同じ状況下で、多重代入法による補完処理を多重化数M=1,2,3,・・・のそれぞれについて実行し、補完処理が終了するまでの時間TMをシミュレーションにより計測する。
0031
ステップS3において、多重化数取得部14は、TM<T<TM+1を満たす多重化数Mを取得する。
0032
ステップS4において、計算手法決定部15は、ステップS3で多重化数Mが取得されたか否かを判定する。この判定がYESの場合、処理はステップS5に移り、判定がNOの場合、処理はステップS6に移る。
0033
ステップS5において、計算手法決定部15は、多重化数Mをパラメータとした多重代入法を、補完処理の計算手法として決定する。
0034
ステップS6において、計算手法決定部15は、多重代入法に代えて他の補完手法を、補完処理の計算手法として決定する。
0035
この一連の流れにより、欠損値補完装置1は、多重化数Mをパラメータとした多重代入法、又は他の補完手法を、補完処理における計算手法として適切に決定する。
この後、欠損値補完装置1の補完処理部12は、実際に収集されたデータに欠損が発生した際に、決定された計算手法により欠損値の補完処理を実行する。
0036
なお、処理ステップの実行順序はこれに限られない。例えば、ステップS1とS2とを入れ替え、補完処理部12が多重化数Mと処理時間TMとを対応付けたデータを予め記憶することで、許容時間Tが指定された際に、適切な多重化数Mが選択されてもよい。これにより、データ収集中に許容時間Tが変更された場合にも、多重化数取得部14は、即座に多重化数Mを取得できる。
また、ステップS5及びS6において決定される計算手法は、多重化数Mそれぞれについて予めデータベース等に登録されていてもよい。
0037
本実施形態によれば、例えば、以下の作用効果が得られる。
0038
(1)収集したデータの欠損値を補完する欠損値補完装置1は、補完処理の所要時間をシミュレーションにより計測し、多重代入法により多重化されるデータの多重化数毎に当該所要時間を対応付ける計測部(補完処理部12)と、前記補完処理の許容時間が指定されると、対応付けられた前記所要時間に基づいて、前記許容時間の間に前記補完処理が終了する前記多重化数を取得する取得部(多重化数取得部14)と、取得された前記多重化数に応じて、前記補完処理の計算手法を決定する決定部(計算手法決定部15)と、を備える。
これにより、欠損値補完装置1は、許容時間の間に補完処理が終了する多重化数を取得するので、指定された許容時間内に、多重代入法によりバイアスを抑えて欠損値を補完できる。
0039
(2) (1)に記載の欠損値補完装置1は、前記データの収集時刻から当該データの利用開始時刻までの時間を取得し、取得された時間を前記許容時間として指定する指定部(時間指定部13)を備えてもよい。
これにより、欠損値補完装置1は、許容時間を自動で取得できるので、効率良く適切な補完のための計算手法を決定できる。
0040
(3) (1)又は(2)に記載の欠損値補完装置1において、前記取得部(多重化数取得部14)は、前記許容時間の間に前記補完処理が終了する前記多重化数のうち、最大値を取得してもよい。
これにより、欠損値補完装置1は、許容時間の間に補完処理が終了するという条件で多重化数を最大化するので、可能な限りバイアスを小さくし、欠損値の推定精度を向上できる。
0041
(4) (3)に記載の欠損値補完装置1において、前記決定部(計算手法決定部15)は、欠損率及び前記多重化数に基づく効率性の指標が所定値を超える前記多重化数の最小値、又は前記取得部(多重化数取得部14)により取得された前記最大値のうち小さい方をパラメータとした多重代入法を、前記計算手法として決定してもよい。
これにより、欠損値補完装置1は、効率性の指標(ARE)に基づいて、十分な推定精度が得られる多重化数を上限とするので、処理負荷及び計算時間を削減できる。
0042
(5) (3)に記載の欠損値補完装置1において、前記決定部(計算手法決定部15)は、前記シミュレーションにおいて前記多重化数の増加に伴って、前記補完処理による推定値が指定の有効桁数の範囲で所定回数、連続して一致した場合に、当該連続の開始した前記多重化数、又は取得部(多重化数取得部14)により取得された前記最大値のうち小さい方をパラメータとした多重代入法を、前記計算手法として決定してもよい。
これにより、欠損値補完装置1は、必要とされるデータの有効桁数に応じて、十分な推定精度が得られる多重化数を上限とするので、処理負荷及び計算時間を削減できる。
0043
(6) (1)から(5)のいずれかに記載の欠損値補完装置1において、前記決定部(計算手法決定部15)は、前記取得部(多重化数取得部14)が前記多重化数を取得できない場合、前記多重代入法に代えて、所定の補完手法を前記計算手法として決定してもよい。
これにより、欠損値補完装置1は、多重代入法では許容時間の間に補完処理が終了しない場合に、他の計算手法を用いるので、欠損値が補完されない事態を抑制できる。
0044
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
0045
多重代入法における具体的なアルゴリズムは限定されない。例えば、予測手法としてpredictive mean matching等が、分析手法として線形回帰等が用いられてよい。また、多重化数に応じて異なる予測手法及び分析手法が用いられてもよい。
0046
欠損値補完装置1による欠損値補完方法は、ソフトウェアにより実現される。ソフトウェアによって実現される場合には、このソフトウェアを構成するプログラムが、コンピュータにインストールされる。また、これらのプログラムは、リムーバブルメディアに記録されてユーザに配布されてもよいし、ネットワークを介してユーザのコンピュータにダウンロードされることにより配布されてもよい。
0047
1欠損値補完装置
10 制御部
11データ収集部
12補完処理部(計測部)
13時間指定部(指定部)
14多重化数取得部(取得部)
15計算手法決定部(決定部)
20 記憶部