図面 (/)

技術 情報処理装置および情報処理方法

出願人 三菱電機株式会社
発明者 増崎隆彦中村隆顕那須督
出願日 2017年7月31日 (2年2ヶ月経過) 出願番号 2018-508255
公開日 2019年8月8日 (2ヶ月経過) 公開番号 WO2019-026134
状態 特許登録済
技術分野 検索装置
主要キーワード 試行データ 診断対象データ 最小インデックス 距離空間 最近傍探索 類似データ 平均偏差 閾値算出
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2019年8月8日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (18)

課題・解決手段

情報処理装置(10)は、時系列データである入力データを取得するデータ取得部(101)と、時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する学習部分列を統合して標本部分列を生成する際に、統合される複数の学習部分列の間の相違度の上限である標本誤差上限を、入力データから取出したデータを用いて算出する標本誤差上限算出部(102)と、標本誤差上限を用いて、学習データから標本部分列を生成する標本部分列生成部(103)と、を備えることを特徴とする。

概要

背景

正常なデータを予め定義して学習データとし、学習データの中に診断対象データと類似している波形が存在するか否かに基づいて、診断対象データが正常であるか否かを診断する方法がある。例えば、生産設備が正常に稼働しているときに取得されたセンサデータを学習データとして、稼働中の生産設備のセンサデータを診断対象データとすると、生産設備の異常を検知することができる。

学習データの中に診断対象データと類似している波形が存在するか否かは、学習データおよび診断対象データのそれぞれから抽出した部分列同士の相違度を用いて判断することができる。学習データから部分列を抽出する範囲を少しずつスライドして、全ての部分列と、診断対象データから抽出した部分列との相違度を計算して、最も低い相違度をその診断対象データから抽出した部分列の相違度とする。しかしながら、この方法では、診断対象データの部分列と、学習データの全ての部分列との全ての組み合わせについて相違度を計算する必要があるため、計算量が多く相違度の計算に時間がかかるという問題があった。

上記の方法に対して、特許文献1に記載の方法では、学習データの部分列をクラスタリングして、部分列間の相違度が予め定められた標本誤差上限以内の複数のクラスタを生成し、クラスタごとに部分列を統合して標本部分列を生成する。そして標本部分列と診断対象データの部分列とを比較することで、計算量を減らして相違度の計算にかかる時間を短縮することができる。

概要

情報処理装置(10)は、時系列データである入力データを取得するデータ取得部(101)と、時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する学習部分列を統合して標本部分列を生成する際に、統合される複数の学習部分列の間の相違度の上限である標本誤差上限を、入力データから取出したデータを用いて算出する標本誤差上限算出部(102)と、標本誤差上限を用いて、学習データから標本部分列を生成する標本部分列生成部(103)と、を備えることを特徴とする。

目的

本発明は、上記に鑑みてなされたものであって、適切な標本部分列を容易に生成することが可能な情報処理装置を得ることを目的とする

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

系列データである入力データを取得するデータ取得部と、前記時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する前記学習部分列を統合して標本部分列を生成する際に、統合される複数の前記学習部分列の間の相違度の上限である標本誤差上限を、前記入力データから取出したデータを用いて算出する標本誤差上限算出部と、前記標本誤差上限を用いて、前記学習データから前記標本部分列を生成する標本部分列生成部と、を備えることを特徴とする情報処理装置

請求項2

前記時系列データは、稼働中の生産設備から取得したデータであることを特徴とする請求項1に記載の情報処理装置。

請求項3

前記標本部分列を用いて、前記学習データの中に診断対象データと類似の波形が存在するか否かを診断するための閾値を算出する閾値算出部、をさらに備えることを特徴とする請求項1または2に記載の情報処理装置。

請求項4

前記標本部分列と前記閾値とを用いて、前記学習データの中に前記診断対象データと類似の波形が存在するか否かを診断する診断部、をさらに備えることを特徴とする請求項3に記載の情報処理装置。

請求項5

前記データ取得部は、前記入力データを分割して前記学習データと試行データとを生成し、前記標本誤差上限算出部は、前記試行データと前記学習データとの間の前記相違度に基づいて、前記標本誤差上限を算出することを特徴とする請求項1から4のいずれか1項に記載の情報処理装置。

請求項6

前記標本誤差上限算出部は、前記試行データと前記学習データとの間の前記相違度の統計値と、予め定められた計算式とを用いて、前記標本誤差上限を算出することを特徴とする請求項5に記載の情報処理装置。

請求項7

前記計算式は、前記標本誤差上限が、前記相違度の平均値と前記相違度の標準偏差の正の実数倍との和に正の実数を乗じたものであることを示していることを特徴とする請求項6に記載の情報処理装置。

請求項8

前記標本誤差上限算出部は、前記試行データと前記学習データとの間の前記相違度の統計値に基づいて前記標本誤差上限を算出し、前記標本誤差上限が、前記相違度の平均値と前記相違度の標準偏差の正の実数倍との和に正の実数を乗じたものであることを特徴とする請求項5に記載の情報処理装置。

請求項9

前記試行データと前記学習データとの間の前記相違度は、前記試行データから抽出された部分列である試行部分列のそれぞれに対応して求められ、複数の前記試行部分列のそれぞれに対応する前記相違度は、抽出範囲をずらしながら前記学習データから抽出された複数の部分列である学習部分列のそれぞれと前記試行部分列との間の前記相違度のうち最小の値であることを特徴とする請求項6または7に記載の情報処理装置。

請求項10

前記データ取得部は、前記診断部が前記学習データの中に類似の波形が存在しないと判定した前記診断対象データである非類似データを前記学習データに追加する指示を受け付けると、前記非類似データを前記学習データに追加することを特徴とする請求項4に記載の情報処理装置。

請求項11

前記時系列データは、設備の状態を検知するセンサデータであり、前記診断部は、前記学習データの中に前記診断対象データと類似の波形が存在しない場合、前記設備に異常が生じていると判断することを特徴とする請求項4に記載の情報処理装置。

請求項12

前記データ取得部は、前記診断部が前記設備に異常が生じていると判断したにも関わらず、前記設備に異常が生じていないことを示すメッセージを受け付けると、前記異常を検知した前記診断対象データである非類似データを前記学習データに追加することを特徴とする請求項11に記載の情報処理装置。

請求項13

情報処理装置が実行する方法であって、時系列データである入力データを取得するステップと、前記時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する前記学習部分列を統合して標本部分列を生成する際に、統合される複数の前記学習部分列の間の相違度の上限である標本誤差上限を、前記入力データを用いて算出するステップと、前記標本誤差上限を用いて、前記学習データから前記標本部分列を生成するステップと、を含むことを特徴とする情報処理方法

技術分野

0001

本発明は、予め定めたデータを用いて時系列データを診断する情報処理装置および情報処理方法に関する。

背景技術

0002

正常なデータを予め定義して学習データとし、学習データの中に診断対象データと類似している波形が存在するか否かに基づいて、診断対象データが正常であるか否かを診断する方法がある。例えば、生産設備が正常に稼働しているときに取得されたセンサデータを学習データとして、稼働中の生産設備のセンサデータを診断対象データとすると、生産設備の異常を検知することができる。

0003

学習データの中に診断対象データと類似している波形が存在するか否かは、学習データおよび診断対象データのそれぞれから抽出した部分列同士の相違度を用いて判断することができる。学習データから部分列を抽出する範囲を少しずつスライドして、全ての部分列と、診断対象データから抽出した部分列との相違度を計算して、最も低い相違度をその診断対象データから抽出した部分列の相違度とする。しかしながら、この方法では、診断対象データの部分列と、学習データの全ての部分列との全ての組み合わせについて相違度を計算する必要があるため、計算量が多く相違度の計算に時間がかかるという問題があった。

0004

上記の方法に対して、特許文献1に記載の方法では、学習データの部分列をクラスタリングして、部分列間の相違度が予め定められた標本誤差上限以内の複数のクラスタを生成し、クラスタごとに部分列を統合して標本部分列を生成する。そして標本部分列と診断対象データの部分列とを比較することで、計算量を減らして相違度の計算にかかる時間を短縮することができる。

先行技術

0005

国際公開第2016/117086号

発明が解決しようとする課題

0006

しかしながら、特許文献1には、統合する部分列の間の相違度の上限である標本誤差上限を算出する方法の詳細については記載がない。標本誤差上限が大きすぎると、診断対象データの診断精度が低下してしまい、標本誤差上限が小さすぎると、計算量が多く処理時間がかかってしまう。診断精度と処理時間のバランスがとれた適切な標本部分列を生成することが困難であるという問題があった。

0007

本発明は、上記に鑑みてなされたものであって、適切な標本部分列を容易に生成することが可能な情報処理装置を得ることを目的とする。

課題を解決するための手段

0008

上述した課題を解決し、目的を達成するために、本発明は、時系列データである入力データを取得するデータ取得部と、入力データから取出したデータを用いて標本誤差上限を算出する標本誤差上限算出部と、標本誤差上限を用いて、学習データから標本部分列を生成する標本部分列生成部とを備えることを特徴とする。標本誤差上限は、学習データから抽出した部分列である複数の学習部分列の中で類似する学習部分列を統合して標本部分列を生成する際に、統合される複数の学習部分列の間の相違度の上限である。

発明の効果

0009

本発明にかかる情報処理装置は、適切な標本部分列を容易に生成することが可能であるという効果を奏する。

図面の簡単な説明

0010

本発明の実施の形態にかかる情報処理装置の構成を示す図
図1に示す情報処理装置が行う学習データを用いた診断対象データの診断の概要を示す図
図2に示す学習データの中に診断対象データと類似の波形があるか否かを判断するために用いる最近傍探索の概要を説明するための図
図1に示す情報処理装置が生成する標本部分列と標本誤差上限との関係を示す図
図1に示すデータ取得部の機能を説明するための図
図1に示す情報処理装置が診断を行う前に行う処理の概要を示す図
図1に示す標本誤差上限算出部が用いる計算式妥当性を示す図
図1に示す標本部分列生成部が行う第1統合処理の概要を示す図
図1に示す標本部分列生成部が行う第2統合処理の概要を示す図
図1に示す情報処理装置が実行する処理の全体の流れを示すフローチャート
図10に示すステップS12の詳細な動作を示すフローチャート
図11に示すステップS121の詳細な動作を示すフローチャート
図10に示すステップS13の詳細な動作を示すフローチャート
図13に示すステップS132の第1統合処理の詳細を示すフローチャート
図13に示すステップS133の第2統合処理の詳細を示すフローチャート
図10に示すステップS14の詳細な動作を示すフローチャート
図16に示すステップS141の詳細な動作を示すフローチャート

実施例

0011

以下に、本発明の実施の形態にかかる情報処理装置および情報処理方法を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。

0012

実施の形態.
図1は、本発明の実施の形態にかかる情報処理装置10の構成を示す図である。情報処理装置10は、データ取得部101と、標本誤差上限算出部102と、標本部分列生成部103と、統計値算出部104と、記憶部105と、閾値算出部106と、診断部107とを有する。

0013

情報処理装置10は、診断対象データD1と類似している波形が、後述する学習データD2の中に存在するか否かに基づいて、診断対象データD1を診断する機能を有する。図2は、図1に示す情報処理装置10が行う学習データD2を用いた診断対象データD1の診断の概要を示す図である。診断対象データD1は、診断の対象とするデータである。学習データD2は、上記の診断の基準として用いられるデータであって予め正常なデータであると定義されたデータであり、例えばセンサデータなどの時系列データである。診断対象データD1は、学習データD2と同じ種類の時系列データであり、学習データD2が温度データである場合、診断対象データD1も温度データである。学習データD2の中に、診断対象データD1と類似の波形がある場合、情報処理装置10は、その診断対象データD1が正常であると判断する。学習データD2の中に、診断対象データD1と類似の波形がない場合、情報処理装置10は、その診断対象データD1が異常であると判断する。

0014

生産設備に異常が生じた場合には、生産設備が正常に稼働しているときに取得されたセンサデータと異なる波形を含むセンサデータが出力されることが多い。この場合、生産設備が正常に稼働しているときに取得されたセンサデータを学習データD2として、稼働中の生産設備のセンサデータを診断対象データD1とすると、生産設備の異常を検知することができる。情報処理装置10が稼働中の生産設備のセンサデータを取得する処理と、取得したセンサデータを診断対象データD1とする診断処理とをシーケンシャルに繰り返して行うことで、リアルタイムに生産設備の異常を検知することができる。

0015

図3は、図2に示す学習データD2の中に診断対象データD1と類似の波形があるか否かを判断するために用いる最近傍探索の概要を説明するための図である。学習データD2の中に診断対象データD1と類似の波形があるか否かは、部分列間の相違度を用いて判断される。部分列間の相違度は、部分列同士が相違している度合いを示す指標であり、相違度が低いほど部分列の波形の一致度が高い。部分列間の相違度は、例えば距離で表すことができ、部分列を距離空間における点で表した場合、点と点との間の距離である。最近傍探索は、距離空間における点の集合の中で特定の点に最も距離が近い点を探す方法であり、本実施の形態では、部分列を点と見なして、部分列の集合の中で特定の部分列に最も近い、すなわち最も相違度が低い部分列が探索される。学習データD2から抽出した部分列である学習部分列SS2は、予め定められた固定値の幅(以下、この幅の大きさをウインドウサイズと称する)を有する抽出範囲を少しずつスライドしながら抽出される。そして、診断対象データD1から学習部分列SS2の抽出範囲と同じウインドウサイズの抽出範囲で抽出した部分列である診断対象部分列SS1のそれぞれについて、最近傍探索が行われて学習データD2との相違度が算出される。

0016

診断対象部分列SS1と学習データD2との間の相違度は、学習データD2から抽出される複数の学習部分列SS2の中で対象の診断対象部分列SS1と最も類似する波形の学習部分列SS2との相違度で示される。相違度を部分列の間の距離で示す場合、抽出された全ての学習部分列SS2と診断対象部分列SS1との間の距離のうち、最短距離が診断対象部分列SS1の相違度となる。例えば、3つの学習部分列SS2が抽出された場合について考える。診断対象部分列SS1#01と学習部分列SS2#01との間の距離が30.1であり、診断対象部分列SS1#01と学習部分列SS2#02との間の距離が1.5であり、診断対象部分列SS1#01と学習部分列SS2#03との間の距離が15.2である場合、診断対象部分列SS1#01の相違度は1.5である。診断対象部分列SS1の相違度が閾値以下である場合、学習データD2の中に診断対象部分列SS1と類似の波形が含まれると判断される。

0017

ここで、全ての学習部分列SS2と全ての診断対象部分列SS1との組み合わせについて、相違度を算出する場合、計算量が増大して時間がかかってしまう。このため、本実施の形態では、類似した学習部分列SS2を統合して、後述する標本部分列SS3を生成し、標本部分列SS3を用いて最近傍探索を行う。これにより、相違度を算出するための計算量を減らすことができ、相違度の計算にかかる時間を短縮することができる。

0018

図4は、図1に示す情報処理装置10が生成する標本部分列SS3と標本誤差上限εとの関係を示す図である。情報処理装置10は、複数の学習部分列SS2をクラスタCLに分類して、クラスタCLごとに、代表的な部分列である標本部分列SS3を生成する。標本部分列SS3は、類似する複数の学習部分列SS2を統合した部分列であると言うこともできる。統合する複数の学習部分列SS2の間の相違度である距離dの上限は、標本誤差上限εと呼ばれる。標本誤差上限εは、同一のクラスタCLに分類される学習部分列SS2の間の相違度の上限と言うこともでき、複数の学習部分列SS2を類似する部分列であるか否かを判断するための判断基準として設定される。標本誤差上限εの大きさによって、統合する学習部分列SS2の範囲が変化する。標本誤差上限εが大きすぎると、標本部分列SS3を生成するために統合する学習部分列SS2間の相違度が高くなるため、診断対象データD1の診断精度が低下してしまう。標本誤差上限εが小さすぎると、診断を行う際に用いる標本部分列SS3の数が多くなり、計算量が多く処理時間がかかってしまう。このため、診断精度と処理時間とのバランスがとれた適切な標本誤差上限εを容易に取得する方法が求められている。

0019

図1の説明に戻る。情報処理装置10は、予め正常であると定義した時系列データである正常データD3に基づいて、適切な標本誤差上限εを算出する機能を有する。例えば、生産設備が正常に稼働しているときに取得されたデータを正常なデータと定義することができる。データ取得部101は、正常データD3を取得して、正常データD3から学習データD2と、診断の試行用のデータである試行データD4とを取得する。

0020

図5は、図1に示すデータ取得部101の機能を説明するための図である。データ取得部101は、正常データD3を取得すると、正常データD3をレコード数で2分の1ずつに分割して、一方を学習データD2とし、他方を試行データD4とする。データ取得部101は、取得した学習データD2を標本誤差上限算出部102と標本部分列生成部103とに入力し、取得した試行データD4を標本誤差上限算出部102、標本部分列生成部103および統計値算出部104に入力する。

0021

図6は、図1に示す情報処理装置10が診断を行う前に行う処理の概要を示す図である。データ取得部101が学習データD2および試行データD4を取得した後、情報処理装置10の標本誤差上限算出部102は、学習データD2から抽出した全ての学習部分列SS2と、試行データD4とを用いて最近傍探索を行い、標本誤差上限εを算出する。標本誤差上限εを算出した後、標本部分列生成部103は、算出された標本誤差上限εを用いて、標本部分列SS3を生成する。そして統計値算出部104は、生成された標本部分列SS3と試行データD4とを用いて最近傍探索を行い、学習データD2と試行データD4との間の相違度と、相違度の統計値とを算出する。統計値は、相違度の平均値mおよび相違度の標準偏差σを含む。閾値算出部106は、標本誤差上限εを用いて算出された相違度の統計値を用いて、診断部107が用いる閾値を算出する。以下、これらの処理の詳細について説明する。

0022

図1の説明に戻る。標本誤差上限算出部102は、入力データである学習データD2および試行データD4を用いて、標本誤差上限εを算出する。具体的には、標本誤差上限算出部102は、入力データから取出したデータである学習部分列SS2および試行部分列SS4を用いて、標本誤差上限εを算出する。標本誤差上限算出部102は、学習部分列SS2と試行部分列SS4との全ての組み合わせについて相違度を算出し、試行部分列SS4のそれぞれについて、最小の相違度をその試行部分列SS4の相違度とする。標本誤差上限算出部102は、それぞれの試行部分列SS4の相違度に基づいて、相違度の統計値を算出する。相違度の統計値は、具体的には相違度の平均値m_0および相違度の標準偏差σ_0である。試行部分列SS4の数をn、i番目の試行部分列SS4の相違度をa_iとした場合、全ての学習部分列SS2を用いて計算された相違度の平均値m_0は、下記の数式(1)で示され、相違度の標準偏差σ_0は、下記の数式(2)で示される。

0023

0024

0025

標本誤差上限算出部102は、これらの統計値と、予め定められた計算式とを用いて、標本誤差上限εを算出することができる。kを正の実数とした場合、予め定められた計算式は、下記の数式(3)である。

0026

ε=k(m_0+3σ_0) ・・・(3)

0027

数式(3)は、相違度の平均値m_0に、相違度の標準偏差σ_0の実数倍、例えば3倍を加算した値と、標本誤差上限εとの間に線形相関があることを示している。図7は、図1に示す標本誤差上限算出部102が用いる計算式の妥当性を示す図である。図7横軸は、「m_0+3σ_0」であり、縦軸は、最適な標本誤差上限εである。ここでは、最適な標本誤差上限εは、学習データD2から抽出された全ての学習部分列SS2を用いて算出した相違度と、標本部分列SS3を用いて算出した相違度との差が予め定められた割合以下となる値と定義している。学習データD2と試行データD4とを用いて、様々な条件で相違度を求めた結果、図7に示すように、「m_0+3σ_0」の値と、最適な標本誤差上限εの値との間には、線形の相関があることが確認できた。標本誤差上限算出部102は、算出した標本誤差上限εを標本部分列生成部103に入力し、記憶部105に記憶させる。

0028

標本部分列生成部103は、入力された標本誤差上限εと、学習データD2と、試行データD4とを用いて、標本部分列SS3を生成する。標本部分列SS3は、類似する学習部分列SS2を統合した部分列である。学習データD2の中で時間が近い学習部分列SS2は類似した部分列となる可能性が高く、類似した部分列は、繰り返して出現する可能性が高い。このため、標本部分列生成部103は、まず、学習データD2から時間が近い学習部分列SS2のうち相違度が予め定められた値以内の学習部分列SS2を同じクラスタCLに分類する第1統合処理を行う。そして、標本部分列生成部103は、クラスタCLの相違度に基づいて、複数のクラスタCLを統合する第2統合処理を行う。

0029

図8は、図1に示す標本部分列生成部103が行う第1統合処理の概要を示す図である。標本部分列生成部103は、時間が近い学習部分列SS2のうち相違度が予め定められた範囲内の学習部分列SS2を統合する。ここでは相違度は距離で示される。具体的には、標本部分列生成部103は、特定の学習部分列SS2、例えば学習部分列SS2#1と、学習部分列SS2#2との間の距離dを算出して、d≦ε/2の関係が成り立つ場合、学習部分列SS2#1と学習部分列SS2#2とを同じクラスタCL#1に分類する。同様に、標本部分列生成部103は、学習部分列SS2#1と学習部分列SS2#3との間の距離dを算出して、d≦ε/2の関係が成り立つ場合、学習部分列SS2#3をクラスタCL#1に分類する。学習部分列SS2#1と学習部分列SS2#4との間の距離dがd>ε/2となった場合、標本部分列生成部103は、学習部分列SS2#4を新たなクラスタCL#2に分類する。分類するクラスタCLが変わると、標本部分列生成部103は、新たなクラスタCL#2に分類された学習部分列SS2#4と、他の学習部分列SS2との間の距離dを、時間軸に沿って順に算出して、同様に学習部分列SS2をクラスタリングする。標本部分列生成部103は、第1統合処理の結果であるクラスタCLのリストを生成する。

0030

図9は、図1に示す標本部分列生成部103が行う第2統合処理の概要を示す図である。標本部分列生成部103は、第1統合処理の結果であるクラスタCLのリストに基づいて、それぞれのクラスタCLに分類された複数の学習部分列SS2を用いて、各クラスタCLの標本部分列SS3−1を生成する。具体的には、標本部分列生成部103は、それぞれのクラスタCLに分類された複数の学習部分列SS2の中で学習部分列SS2に含まれる値に対するインデックスが同一の複数の値の平均値を求めて、平均値の系列から構成される部分列を、各クラスタCLの標本部分列SS3−1とする。

0031

標本部分列生成部103は、標本部分列SS3−1のリストを標本部分列SS3−1に対する平均値でソートする。そして標本部分列生成部103は、並べ替えた標本部分列SS3−1のリストについて、第1統合処理と同様に部分列の間の距離dを求めて、標本部分列SS3−1の間の距離dがε/2以下のクラスタCLを統合する。標本部分列生成部103は、統合されたクラスタCLのそれぞれに分類された標本部分列SS3−1を用いて、標本部分列SS3を生成する。具体的には、標本部分列生成部103は、標本部分列SS3−1の中で標本部分列SS3−1に含まれる値に対するインデックスが同一の複数の値の平均値を求めて、平均値の系列から構成される部分列を標本部分列SS3とする。標本部分列生成部103は、標本部分列SS3−1を生成した各クラスタCLに含まれていた学習部分列SS2に含まれる値に対するインデックスが同一の値の平均値を求めて、平均値の系列から構成される部分列を標本部分列SS3としてもよい。標本部分列生成部103は、生成した標本部分列SS3を統計値算出部104に入力すると共に、記憶部105に記憶させる。また標本部分列生成部103は、各標本部分列SS3の平均値を求めて、生成した標本部分列SS3と共に記憶部105に記憶させてもよい。

0032

図1の説明に戻る。統計値算出部104は、生成された標本部分列SS3と、試行データD4とを用いて、学習データD2と試行データD4との間の相違度の統計値を算出する。統計値算出部104は、標本部分列SS3を使用して試行データD4で最近傍探索を実行し、相違度を求める。統計値算出部104は、相違度の平均値mおよび標準偏差σを算出して、記憶部105に記憶させる。

0033

閾値算出部106は、統計値算出部104が算出した、相違度の平均値mおよび標準偏差σを用いて、診断部107が学習データD2の中に診断対象データD1と類似の波形が存在するか否かを診断するための閾値Thを算出する。診断部107は、閾値算出部106が算出した閾値Thを用いて、学習データD2の中に診断対象データD1と類似の波形が存在するか否かを診断する。診断部107は、学習データD2の中に診断対象データD1と類似の波形が存在する場合、診断対象データD1は正常であると判断し、学習データD2の中に診断対象データD1と類似の波形が存在しない場合、診断対象データD1は異常であると判断する。

0034

図10は、図1に示す情報処理装置10が実行する処理の全体の流れを示すフローチャートである。情報処理装置10のデータ取得部101は、正常データD3から学習データD2と試行データD4とを取得する(ステップS11)。標本誤差上限算出部102は、データ取得部101によって取得された学習データD2と試行データD4とを用いて、標本誤差上限εを算出する(ステップS12)。標本誤差上限εの算出方法の詳細は、後述される。

0035

標本部分列生成部103は、算出された標本誤差上限εと、学習データD2とを用いて、標本部分列SS3を生成する(ステップS13)。標本部分列SS3の生成方法の詳細は、後述される。閾値算出部106は、生成された標本部分列SS3を用いて、診断対象データD1の診断のための閾値Thを算出する(ステップS14)。閾値Thの算出方法の詳細は、後述される。診断部107は、診断対象データD1の診断を行う(ステップS15)。

0036

図10に示した処理の流れは、必ずしも連続的に実行される必要はない。例えば、ステップS11からステップS13までの処理は、事前準備作業として実行されてもよい。また、ステップS14の閾値算出処理は、ステップS15の診断処理を実行する前に行われればよい。以下、図10に示した各ステップの詳細な動作について説明する。

0037

図11は、図10に示すステップS12の詳細な動作を示すフローチャートである。標本誤差上限算出部102は、学習データD2から抽出した全ての学習部分列SS2を用いて、試行データD4の最近傍探索処理を行って、相違度を算出する(ステップS121)。図12は、図11に示すステップS121の詳細な動作を示すフローチャートである。標本誤差上限算出部102は、試行データD4から試行部分列SS4を抽出する(ステップS201)。具体的には、標本誤差上限算出部102は、抽出領域を少しずつスライドさせながら、長さpの試行データD4から予め定められたウインドウサイズwの波形データを試行部分列SS4として抽出する。標本誤差上限算出部102は、距離の最小値min_iを初期値無限大に設定する(ステップS202)。

0038

標本誤差上限算出部102は、長さqの学習データD2からウインドウサイズwの波形データを学習部分列SS2として抽出する(ステップS203)。標本誤差上限算出部102は、試行部分列SS4と学習部分列SS2との間の距離d_ijを算出する(ステップS204)。距離d_ijは、試行部分列SS4の時系列データS[i:i+w−1](i=1,2,3,...,p−w+1)として、学習部分列SS2の時系列データT[j:j+w−1](j=1,2,3,...,q−w+1)とした場合、以下の数式(4)によって求めることができる。

0039

0040

標本誤差上限算出部102は、d_ij<min_iの関係が成り立つ場合、最小値min_iの値を距離d_ijの値に更新する(ステップS205)。標本誤差上限算出部102は、ステップS203において、抽出する学習部分列SS2の範囲を少しずつスライドしながら、ステップS203からステップS205の処理を、全ての学習部分列SS2の評価が完了するまで繰り返す。

0041

全ての学習部分列SS2を評価完了すると、標本誤差上限算出部102は、最小値min_iを、ここで対象としている試行部分列SS4の相違度とする(ステップS206)。標本誤差上限算出部102は、ステップS201で抽出する試行部分列SS4の範囲を少しずつスライドしながら、ステップS201からステップS206の処理を、全ての試行部分列SS4の評価が完了するまで繰り返す。ステップS121に示す処理により、標本誤差上限算出部102は、それぞれの試行部分列SS4の相違度を取得することができる。

0042

図11の説明に戻る。標本誤差上限算出部102は、それぞれの試行部分列SS4の相違度を取得すると、取得した相違度の統計値である相違度の平均値m_0および標準偏差σ_0を算出する(ステップS122)。標本誤差上限算出部102は、相違度の統計値と予め定められた計算式とを用いて、標本誤差上限εを算出する(ステップS123)。

0043

図13は、図10に示すステップS13の詳細な動作を示すフローチャートである。標本部分列生成部103は、学習データD2から複数の学習部分列SS2を抽出する(ステップS131)。標本部分列生成部103は、学習部分列SS2を時間の順にクラスタリングして、複数のクラスタCLに分類する(ステップS132)。その後、標本部分列生成部103は、クラスタCLを統合して、クラスタCLごとの標本部分列SS3を生成する(ステップS133)。

0044

図14は、図13に示すステップS132の第1統合処理の詳細を示すフローチャートである。まず標本部分列生成部103は、学習部分列SS2の順番を示す序数であるiおよびjをi=1,j=i+1に設定する(ステップS301)。標本部分列生成部103は、i番目の学習部分列SS2とj番目の学習部分列SS2との間の距離を算出する(ステップS302)。標本部分列生成部103は、算出した距離がε/2以下であるか否かを判断する(ステップS303)。距離がε/2以下である場合(ステップS303:Yes)、標本部分列生成部103は、j番目の学習部分列SS2をi番目の学習部分列SS2と同じクラスタCLに分類して、j=j+1とする(ステップS304)。

0045

距離がε/2を超える場合(ステップS303:No)、標本部分列生成部103は、クラスタCLを確定して、クラスタCLのリストに追加する。また標本部分列生成部103は、j番目の学習部分列SS2を新たなクラスタCLに分類する(ステップS305)。標本部分列生成部103は、i=j,j=j+1に設定する(ステップS306)。ステップS304の処理を行った後、またはステップS306の処理を行った後、標本部分列生成部103は、最後の学習部分列SS2であるか否かを判断する(ステップS307)。最後の学習部分列SS2でない場合(ステップS307:No)、標本部分列生成部103は、ステップS302から処理を繰り返す。最後の学習部分列SS2である場合(ステップS307:Yes)、標本部分列生成部103は、処理を終了する。図14に示す処理が実行されると、図8に示したように、時間が近い学習部分列SS2のうち距離がε/2以下の学習部分列SS2がクラスタCLに分類される。

0046

図15は、図13に示すステップS133の第2統合処理の詳細を示すフローチャートである。標本部分列生成部103は、ステップS132において生成された各クラスタCL内の学習部分列SS2から、各クラスタCLの標本部分列SS3−1を生成する(ステップS311)。標本部分列生成部103は、標本部分列SS3−1のリストを、標本部分列SS3−1の平均値でソートする(ステップS312)。標本部分列生成部103は、標本部分列SS3−1の順序を示す序数l=1、m=l+1に設定する(ステップS313)。

0047

標本部分列生成部103は、l番目の標本部分列SS3−1と、m番目の標本部分列SS3−1との間の距離dを算出する(ステップS314)。標本部分列生成部103は、算出した距離dがε/2以下であるか否かを判断する(ステップS315)。距離dがε/2以下である場合(ステップS315:Yes)、標本部分列生成部103は、クラスタCLを統合して、m番目の標本部分列SS3−1をリストから削除する(ステップS316)。距離dがε/2を超える場合(ステップS315:No)、標本部分列生成部103は、クラスタCLを確定して、統合したクラスタCLの標本部分列SS3を生成する(ステップS317)。標本部分列生成部103は、l番目の標本部分列SS3−1をリストから削除して、リスト中の最小インデックスをlに設定する(ステップS318)。ステップS316の処理またはステップS318の処理が終わると、標本部分列生成部103は、m=m+1に設定する(ステップS319)。

0048

標本部分列生成部103は、最後の標本部分列SS3−1であるか否かを判断する(ステップS320)。最後の標本部分列SS3−1でない場合(ステップS320:No)、標本部分列生成部103は、ステップS314から処理を繰り返す。最後の標本部分列SS3−1である場合(ステップS320:Yes)、標本部分列生成部103は、統合後の各クラスタCLの標本部分列SS3を生成する(ステップS321)。標本部分列生成部103は、標本部分列SS3の平均値を算出して、平均値でソートする(ステップS322)。上記の動作により、標本部分列SS3が生成される。

0049

図16は、図10に示すステップS14の詳細な動作を示すフローチャートである。統計値算出部104は、生成された標本部分列SS3を用いて、試行データD4の最近傍探索を行い、相違度を算出する(ステップS141)。統計値算出部104は、算出された相違度の統計値を算出する(ステップS142)。統計値は、平均値mおよび標準偏差σである。閾値算出部106は、算出された相違度の統計値に基づいて、閾値Thを算出する(ステップS143)。

0050

図17は、図16に示すステップS141の詳細な動作を示すフローチャートである。ここでは、下界計算を用いて、最近傍探索処理を高速化している。

0051

統計値算出部104は、試行データD4から試行部分列SS4を抽出する(ステップS401)。距離の最小値min_iを初期値の無限大に設定する(ステップS402)。統計値算出部104は、標本部分列SS3の中から未評価の標本部分列SS3を1つ選択する(ステップS403)。統計値算出部104は、抽出した試行部分列SS4と、選択した標本部分列SS3とを用いて、平均下界を求める(ステップS404)。平均下界は、ウインドウサイズをw、時系列データT,Sの平均値をそれぞれT,Sのそれぞれにバーを付したものとすると、以下の数式(5)で示すことができる。

0052

0053

統計値算出部104は、求めた平均下界が距離の最小値min_iよりも大きいか否かを判断する(ステップS405)。平均下界が距離の最小値min_iよりも大きい場合(ステップS405:Yes)、統計値算出部104は、以下の処理を省略して、距離の最小値min_iを相違度とする(ステップS410)。平均下界が距離の最小値min_i以下である場合(ステップS405:No)、統計値算出部104は、平均偏差下界を求める(ステップS406)。時系列データT,Sの標準偏差をそれぞれStd(T),Std(S)とすると、平均偏差下界は、以下の数式(6)で示すことができる。

0054

0055

統計値算出部104は、求めた平均偏差下界が距離の最小値min_iよりも大きいか否かを判断する(ステップS407)。平均偏差下界が距離の最小値min_iよりも大きい場合(ステップS407:Yes)、統計値算出部104は、対象の標本部分列SS3の処理を終了し、全標本部分列SS3の評価を完了していない場合、ステップS403の処理に戻る。平均偏差下界が距離の最小値min_i以下である場合(ステップS407:No)、統計値算出部104は、試行部分列SS4と標本部分列SS3との間の距離d_ijを算出する(ステップS408)。

0056

距離d_ijは、診断対象部分列をS,標本部分列をTjとした場合、以下の数式(7)で示すことができる。

0057

0058

算出した距離d_ijが距離の最小値min_iよりも小さい場合、統計値算出部104は、距離の最小値min_iを距離d_ijの値で更新する(ステップS409)。統計値算出部104は、全ての標本部分列SS3の評価が完了するまで、ステップS403からステップS409の処理を繰り返す。全ての標本部分列SS3の評価が完了すると、統計値算出部104は、距離の最小値min_iを相違度とする(ステップS410)。統計値算出部104は、全ての試行部分列SS4の評価が完了するまで、ステップS401からステップS410の処理を繰り返す。

0059

平均下界および平均偏差下界を用いることで、部分列間の距離を算出するまでもなく、部分列間の距離が距離の最小値min_iよりも大きくなると判断することができる場合には、部分列間の距離を算出する処理を省略することができる。平均下界および平均偏差下界の算出処理は、部分列間の距離を算出する処理よりも計算量が少ないため、最近傍探索処理を高速化することができる。なお、ステップS141に示す最近傍探索処理は、図17に示すような下界計算を用いるものに限らず、図12に示すように、下界計算を用いないものであってもよい。この場合、学習部分列SS2を標本部分列SS3に置き換えて、学習データD2から学習部分列SS2を抽出する処理を、標本部分列SS3から1つを選択する処理に置き換えればよい。

0060

なお、上記の情報処理装置10によれば、正常であると判断されるべき診断対象データD1であっても、学習データD2に類似した波形が存在せず、異常であると判断されることがある。この場合、異常であると判断された診断対象データD1を学習データD2に追加することが望ましい。このためデータ取得部101は、診断部107が学習データD2の中に類似の波形が存在しないと判定した診断対象データD1である非類似データを学習データD2に追加する指示を受け付けると、非類似データを学習データD2に追加する。

0061

正常であると判断されるべき診断対象データD1とは、診断対象データD1が生産設備の状態を検知するセンサデータである場合、生産設備に検出するべき異常が生じていないときに取得されたセンサデータである。この場合、非類似データを学習データD2に追加する指示は、診断部107が生産設備に異常が生じていると判断したにも関わらず、生産設備に異常が生じていないことを示すメッセージである。例えば、非類似データを学習データD2に追加する指示は、情報処理装置10の使用者入力操作によって情報処理装置10に入力されてもよい。或いは非類似データを学習データD2に追加する指示は、生産設備の異常を診断する他のシステムで生成されて、情報処理装置10に入力されてもよい。

0062

非類似データが学習データD2に追加されると、標本誤差上限算出部102は、非類似データを追加後の学習データD2を用いて標本誤差上限εを算出することになる。また標本部分列生成部103は、非類似データを追加後の学習データD2と、非類似データを追加後の学習データD2を用いて算出された標本誤差上限εとを用いて標本部分列SS3を生成することになる。さらに統計値算出部104は、非類似データを追加後の学習データD2を用いて生成された標本部分列SS3と試行データD4とを用いて最近傍探索を行い、学習データD2と試行データD4との間の相違度と、相違度の統計値とを算出する。閾値算出部106は、非類似データを追加後の学習データD2を用いて生成された標本部分列SS3を用いて、閾値Thを算出することになる。診断部107は、非類似データを追加後の学習データD2を用いて診断処理を行うことになる。したがって、正常であると判断されるべき診断対象データD1が異常であると判断されても、次回の診断処理以降では、追加した非類似データは正常であると判断されるようになる。

0063

以上説明したように、本発明の実施の形態によれば、学習データD2から抽出した部分列である複数の学習部分列SS2の中で類似する学習部分列を統合して標本部分列SS3を生成する際に、統合される複数の学習部分列SS2の間の相違度の上限である標本誤差上限εが、時系列データである入力データに基づいて算出される。そして算出された標本誤差上限εを用いて、学習データD2から標本部分列SS3が生成される。このため情報処理装置10を使用する使用者は、試行錯誤しなくても時系列データを入力するだけで、診断精度と処理時間のバランスがとれた適切な標本誤差上限εを容易に設定することが可能になり、適切な標本部分列SS3を容易に生成することが可能になる。また、適切な標本部分列SS3が生成されることで、診断精度を保ちつつ高速な診断処理を行うことが可能である。

0064

以上の実施の形態に示した構成は、本発明の内容の一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。

0065

10情報処理装置、101データ取得部、102標本誤差上限算出部、103標本部分列生成部、104統計値算出部、105 記憶部、106閾値算出部、107診断部、D1診断対象データ、D2 学習データ、D3 正常データ、D4試行データ、SS1診断対象部分列、SS2 学習部分列、SS3,SS3−1 標本部分列、SS4試行部分列、CLクラスタ、ε 標本誤差上限、d 距離、m,m_0平均値、σ,σ_0標準偏差。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • グーグルエルエルシーの「 メッセージ交換スレッドの拡張」が 公開されました。( 2019/08/29)

    【課題・解決手段】メッセージ交換スレッドを拡張するための方法、装置、システム、およびコンピュータ可読媒体が提供される。様々な実装形態では、2つ以上のメッセージ交換クライアントを操作している2人以上の参... 詳細

  • クオント株式会社の「 評価装置、評価方法及び評価プログラム」が 公開されました。( 2019/08/22)

    【課題】Webサイトを閲覧する質の高い高エンゲージメントユーザの数や割合に基づき、Webサイトを評価する評価装置、評価方法および評価プログラムを提供する。【解決手段】高エンゲージメントユーザの数や割合... 詳細

  • 株式会社エクサの「 類似度判定プログラム」が 公開されました。( 2019/08/22)

    【課題】任意のパラメータ列について、あらかじめ特徴量を設計して抽出する作業を実施することなく、類似するパラメータ列を探索する類似度判定プログラムを提供する。【解決手段】本発明の類似度判定プログラムは、... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ