図面 (/)

技術 生体信号データからの個体特徴分離による状態予測方法および装置

出願人 国立大学法人神戸大学
発明者 松原崇上原邦昭
出願日 2018年9月12日 (2年3ヶ月経過) 出願番号 2018-170121
公開日 2020年3月19日 (9ヶ月経過) 公開番号 2020-042598
状態 未査定
技術分野 診断用測定記録装置 学習型計算機
主要キーワード 状態予測装置 使用度合 精度比較 多変量ガウス分布 状態ラベル 比較項目 ケンドール 同時確率分布
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2020年3月19日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (12)

課題

被験体毎に追加の学習又は調整を行うことなく、被験体の生体信号データから個体差に関係する信号成分を抽出し分離して、被験体の疾患診断精度の向上と疾患関連信号の可視化を可能とする状態予測方法および装置を提供する。

解決手段

複数の被験体の生体信号を測定して得られた時系列の生体信号データを入力として、深層ニューラルネットワークによる深層生成モデルを用いて被験体の状態を予測する。一度の計測において変化しない状態ラベル、個体差を表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、生体信号データに関連付けして深層生成モデルを構築する。そして、複数の被験体の生体信号データを入力して深層生成モデルを学習する。そして、入力した生体信号データから、個体差を表現する特徴量と、上記の信号成分を抽出し、分離した後の信号成分を用いて被験体の状態予測を行う。

概要

背景

近年、精神疾患を含む様々な疾患をもつ人口は上昇しており、早期発見早期治療は、喫緊の課題となっている。生体信号データから疾患の進行度数値化できれば、早期発見のみならず、治療法の評価など様々な応用が可能である。そのため、多様な生体信号データの医用データ活用して、機械学習による疾患に関わるバイオマーカー発見が期待されている。このようなバイオマーカーの発見は、疾患の機序を明らかにするだけでなく、疾患の早期診断定量的評価を可能にし、患者クオリティオブライフにも貢献すると共に、治療の有効性評価も可能になる。しかし、医用データの蓄積が行われているが、データセットの大きさは一般画像認識などに比べて遥かに小さく、解析には特徴選択次元削減のような複雑な前処理と手続きが必要である。

また、生体信号データには、被験体年齢性別身体的特徴生活環境などの情報が信号成分として存在する。生体信号データから、疾患に由来するデータのみを抽出し分離することは困難である。また、生体信号データを計測する計測器毎に、分解能感度(S/N比)が異なるため、これら計測器の特性も不要な信号成分として生体信号データの中に存在する。生体信号データとして脳機能画像データを例に挙げると、頭部の形状や機能的脳地図個体差が存在する。

かかる状況下、脳機能画像データの解析に生成モデルの手法を用いた研究成果報告されている(例えば、非特許文献1〜3を参照)。例えば、隠れマルコフモデルを用いて、脳機能画像データの背後にある脳の大規模神経系のダイナミクスモデル化を試みた研究成果(非特許文献1)や、刺激への応答線形の生成モデルでモデル化することにより脳機能画像データから刺激を推定した研究成果(非特許文献2)などが報告されている。これらのモデル化では、全被験体に共通のモデルと各被験体の個体差を表現するモデルの組み合わせによるモデル化を行っているため、新しい被験体に適応するためには個体差を表現するモデル部分を新たに調整する必要がある。

一方、深層学習と呼ばれる深層ニューラルネットワークを用いて、与えられたデータから、目的に必要な高次の特徴を自動的に学習することにより、様々なタスクで高い性能結果が報告されている。深層学習には主に“教師あり”分類を行う多層パーセプトロンと、“教師なし”次元削減が可能な自己符号化器(オートエンコーダ)が存在し、以前から脳機能画像データの解析に用いられている。深層学習には、深層生成モデルと呼ばれる生成モデルを実装できる構造が存在する。

本発明者らは、この深層生成モデルを用いて、脳機能画像データに加え被験体の状態(疾患の有無)をモデル化し、高い精度で被験体の疾患を診断できることを既に示している(非特許文献3を参照)。分類に一般的に用いられる識別モデルに比べ、生成モデルはその構造が一種拘束条件として働くことから、想定した構造が真の構造に近ければ、少ないサンプル数のデータセットに対しても、高い精度で分類できることが知られている(非特許文献4を参照)。被験体の年齢や性別を既知の情報として与えることにより、関連する信号成分を除去するアプローチも知られている(非特許文献5を参照)。そのため、脳機能画像データの背後にある構造を深層生成モデル上で実現することにより、診断精度の向上とさらなる解析の可能性がある。

概要

被験体毎に追加の学習又は調整を行うことなく、被験体の生体信号データから個体差に関係する信号成分を抽出し分離して、被験体の疾患診断精度の向上と疾患関連信号の可視化を可能とする状態予測方法および装置を提供する。複数の被験体の生体信号を測定して得られた時系列の生体信号データを入力として、深層ニューラルネットワークによる深層生成モデルを用いて被験体の状態を予測する。一度の計測において変化しない状態ラベル、個体差を表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、生体信号データに関連付けして深層生成モデルを構築する。そして、複数の被験体の生体信号データを入力して深層生成モデルを学習する。そして、入力した生体信号データから、個体差を表現する特徴量と、上記の信号成分を抽出し、分離した後の信号成分を用いて被験体の状態予測を行う。

目的

本発明は、被験体毎に追加の学習又は調整を行うことなく、被験体の生体信号データから被験体の年齢,性別,身体的特徴や生活環境など個体差に関係する特徴量を抽出し分離して、被験体の疾患診断精度の向上と疾患関連信号の可視化を可能とする状態予測方法および装置を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

複数の被験体生体信号を測定して得られた時系列生体信号データを入力として、深層ニューラルネットワークによる深層生成モデルを用いて被験体の状態を予測する方法であって、1)一度の計測において変化しない状態ラベル個体差表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、前記生体信号データに関連付けして前記深層生成モデルを構築するステップと、2)複数の被験体の前記生体信号データを入力して深層生成モデルを学習するステップと、3)入力した前記生体信号データから、前記個体差を表現する特徴量と前記信号成分を抽出し、分離した後の信号成分を用いて被験体の状態予測を行うステップ、を備えたことを特徴とする状態予測方法

請求項2

前記深層生成モデルを構築するステップにおいて、更に測定環境差を表現する特徴量が、前記生体信号データに関連付けられ、状態ラベル、個体差を表現する特徴量、測定環境差を表現する特徴量、及び、状態ラベルと個体差と測定環境差とに依存しないが時間的に変化し得る信号成分を、前記生体信号データに関連付けして前記深層生成モデルが構築されることを特徴とする請求項1に記載の状態予測方法。

請求項3

前記深層生成モデルにおいて、同一の被験体の複数の生体信号データが、前記個体差を表現する特徴量を共有し、前記深層生成モデルが、VAE(Variational Auto-Encoder)で構成される場合には、前記個体差を表現する特徴量は、事前分布に従う潜在変数としてモデル化されることを特徴とする請求項1に記載の状態予測方法。

請求項4

前記深層生成モデルにおいて、同一の測定環境で計測された複数の生体信号データが、前記測定環境差を表現する特徴量を共有し、前記深層生成モデルが、VAE(Variational Auto-Encoder)で構成される場合には、前記測定環境差を表現する特徴量は、事前分布に従う潜在変数としてモデル化されることを特徴とする請求項2に記載の状態予測方法。

請求項5

前記深層学習するステップにおいて、前記個体差を表現する特徴量の推定には、1つの前記生体信号データとそれに関連付けされた状態ラベルを入力として活性値を出力する第1のニューラルネットワークと、前記生体信号データの集合から得られた活性値の平均を入力として、前記個体差を表現する特徴量を出力する第2のニューラルネットワークと、から構成される集団符号化器を用いることを特徴とする請求項1又は3に記載の状態予測方法。

請求項6

前記深層学習するステップにおいて、前記測定環境差を表現する特徴量の推定には、同一環境で測定された1つ以上の前記生体信号データとそれに関連付けされた状態ラベルを入力として活性値を出力する第1のニューラルネットワークと、前記生体信号データの集合から得られた活性値の平均を入力として、前記測定環境差を表現する特徴量を出力する第2のニューラルネットワークと、から構成される集団符号化器を用いることを特徴とする請求項2又は4に記載の状態予測方法。

請求項7

被験体の状態予測した結果を表示するステップを更に備えたことを特徴とする請求項1〜6の何れかに記載の状態予測方法。

請求項8

前記生体信号データは、fMRI(functional Magnetic Resonance Imaging)画像データ、MRI(Magnetic Resonance Imaging)画像データ、PET(Positron Emission Tomography)画像データ、超音波画像データ脳波データ心電図データ心拍数データ発汗量データ血中酸素濃度データ、又は、血糖値データの何れかであることを特徴とする請求項1〜7の何れかに記載の状態予測方法。

請求項9

前記深層生成モデルは、VAE(Variational Auto-Encoder)を含むAE(Auto-Encoder)、GAN(Generative Adversarial Nets)、GMM(Generative Moment Matching)、EP(Energy-based Probabilistic Model)、FG(Flow-based Generative Model)、AR(Auto-regressive Model)の何れかを用いたことを特徴とする請求項1〜8の何れかに記載の状態予測方法。

請求項10

複数の被験体の生体信号を測定して得られた時系列の生体信号データを入力として、深層ニューラルネットワークによる深層生成モデルを用いて被験体の状態を予測する装置であって、1)一度の計測において変化しない状態ラベル、個体差を表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、前記生体信号データに関連付けして前記深層生成モデルを構築する生成モデル構築部と、2)複数の被験体の前記生体信号データを入力して深層生成モデルを学習する学習部と、3)入力した前記生体信号データから、前記個体差を表現する特徴量と、前記信号成分を抽出し、分離した後の信号成分を用いて被験体の状態予測を行う状態予測部、を備えたことを特徴とする状態予測装置

請求項11

前記生成モデル構築部において、更に測定環境差を表現する特徴量が、前記生体信号データに関連付けられ、前記状態ラベル、前記個体差を表現する特徴量、前記測定環境差を表現する特徴量、及び、状態ラベルと個体差と測定環境とに依存しないが時間的に変化し得る信号成分を、前記生体信号データに関連付けして前記深層生成モデルが構築されることを特徴とする請求項10に記載の状態予測装置。

請求項12

前記深層生成モデルにおいて、同一の被験体の複数の生体信号データが、前記個体差を表現する特徴量を共有し、前記深層生成モデルが、VAE(Variational Auto-Encoder)で構成される場合には、前記個体差を表現する特徴量は、事前分布に従う潜在変数としてモデル化されることを特徴とする請求項10に記載の状態予測装置。

請求項13

前記深層生成モデルにおいて、同一の測定環境で計測された複数の生体信号データが、前記測定環境差を表現する特徴量を共有し、前記深層生成モデルが、VAE(Variational Auto-Encoder)で構成される場合には、前記測定環境差を表現する特徴量は、事前分布に従う潜在変数としてモデル化されることを特徴とする請求項11に記載の状態予測装置。

請求項14

前記学習部において、前記個体差を表現する特徴量の推定には、1つの前記生体信号データと状態ラベルを入力として活性値を出力する第1のニューラルネットワークと、前記生体信号データの集合から得られた活性値の平均を入力として、前記個体差を表現する特徴量を出力する第2のニューラルネットワークと、から構成される集団符号化器を用いることを特徴とする請求項10又は12に記載の状態予測装置。

請求項15

前記学習部において、前記測定環境差を表現する特徴量の推定には、同一環境で測定された1つ以上の前記生体信号データとそれに関連付けされた状態ラベルを入力として活性値を出力する第1のニューラルネットワークと、前記生体信号データの集合から得られた活性値の平均を入力として、前記測定環境差を表現する特徴量を出力する第2のニューラルネットワークと、から構成される集団符号化器を用いることを特徴とする請求項11又は13に記載の状態予測装置。

請求項16

被験体の状態予測した結果を表示する表示部を更に備えたことを特徴とする請求項10〜15の何れかに記載の状態予測装置。

請求項17

請求項1〜7の何れかの状態予測方法における各ステップを、コンピュータに実行させるための状態予測プログラム

請求項18

請求項10〜16の何れかの状態予測装置における前記生成モデル構築部、前記学習部、及び前記状態予測部として、コンピュータを機能させるための状態予測プログラム。

技術分野

0001

本発明は、脳機能画像データ,脳波心拍発汗データなどの生体信号データから、精神疾患を含む様々な疾患の状態を予測する技術に関するものである。

背景技術

0002

近年、精神疾患を含む様々な疾患をもつ人口は上昇しており、早期発見早期治療は、喫緊の課題となっている。生体信号データから疾患の進行度数値化できれば、早期発見のみならず、治療法の評価など様々な応用が可能である。そのため、多様な生体信号データの医用データ活用して、機械学習による疾患に関わるバイオマーカー発見が期待されている。このようなバイオマーカーの発見は、疾患の機序を明らかにするだけでなく、疾患の早期診断定量的評価を可能にし、患者クオリティオブライフにも貢献すると共に、治療の有効性評価も可能になる。しかし、医用データの蓄積が行われているが、データセットの大きさは一般画像認識などに比べて遥かに小さく、解析には特徴選択次元削減のような複雑な前処理と手続きが必要である。

0003

また、生体信号データには、被験体年齢性別身体的特徴生活環境などの情報が信号成分として存在する。生体信号データから、疾患に由来するデータのみを抽出し分離することは困難である。また、生体信号データを計測する計測器毎に、分解能感度(S/N比)が異なるため、これら計測器の特性も不要な信号成分として生体信号データの中に存在する。生体信号データとして脳機能画像データを例に挙げると、頭部の形状や機能的脳地図個体差が存在する。

0004

かかる状況下、脳機能画像データの解析に生成モデルの手法を用いた研究成果報告されている(例えば、非特許文献1〜3を参照)。例えば、隠れマルコフモデルを用いて、脳機能画像データの背後にある脳の大規模神経系のダイナミクスモデル化を試みた研究成果(非特許文献1)や、刺激への応答線形の生成モデルでモデル化することにより脳機能画像データから刺激を推定した研究成果(非特許文献2)などが報告されている。これらのモデル化では、全被験体に共通のモデルと各被験体の個体差を表現するモデルの組み合わせによるモデル化を行っているため、新しい被験体に適応するためには個体差を表現するモデル部分を新たに調整する必要がある。

0005

一方、深層学習と呼ばれる深層ニューラルネットワークを用いて、与えられたデータから、目的に必要な高次の特徴を自動的に学習することにより、様々なタスクで高い性能結果が報告されている。深層学習には主に“教師あり”分類を行う多層パーセプトロンと、“教師なし”次元削減が可能な自己符号化器(オートエンコーダ)が存在し、以前から脳機能画像データの解析に用いられている。深層学習には、深層生成モデルと呼ばれる生成モデルを実装できる構造が存在する。

0006

本発明者らは、この深層生成モデルを用いて、脳機能画像データに加え被験体の状態(疾患の有無)をモデル化し、高い精度で被験体の疾患を診断できることを既に示している(非特許文献3を参照)。分類に一般的に用いられる識別モデルに比べ、生成モデルはその構造が一種拘束条件として働くことから、想定した構造が真の構造に近ければ、少ないサンプル数のデータセットに対しても、高い精度で分類できることが知られている(非特許文献4を参照)。被験体の年齢や性別を既知の情報として与えることにより、関連する信号成分を除去するアプローチも知られている(非特許文献5を参照)。そのため、脳機能画像データの背後にある構造を深層生成モデル上で実現することにより、診断精度の向上とさらなる解析の可能性がある。

先行技術

0007

H. Suk et al., “State-space model with deep learning for functional dynamics estimation in resting-state fMRI”, NeuroImage, vol.129, pp.292-307, 2016.
P. Chen et al., “A Reduced-Dimension fMRI Shared Response Model”, Advances in Neural Information Processing Systems 28, 2015.
T. Matsubara et al., “Deep Neural Generative Model for fMRI Image Based Diagnosis of Mental Disorder Diagnosis”, arXiv: 1712.06260, 2017.
A. Prasad et al., “On Separability of Loss Functions, and Revisiting Discriminative Vs Generative Models”, in Advances in Neural Information Processing Systems (NIPS), pp.7053-7062, 2017.
N. Yahata et al., “A small number of abnormal brain connections predicts adult autism spectrum disorder”, Nature Communications, vol.7, no.7, pp.11254, 2016.

発明が解決しようとする課題

0008

上述の如く、本発明者らは、脳機能画像データの解析において、構造化深層生成モデルを用いて疾患診断精度の向上を図る研究を行っている(非特許文献3)。
しかしながら、非特許文献3に開示した方法では、個体差の信号成分を分離できておらず、疾患診断精度も限定的であるといった課題がある。被験体毎に機械学習を用いて個体差を分離するアプローチが知られているが(非特許文献2)、個々の被験体に対して膨大な計測データの追加の学習や調整が必要になるといった問題がある。また、被験体の年齢や性別を既知の情報として与えることにより、関連する信号成分を除去するアプローチが知られているが(非特許文献5)、生活環境や計測器の特性の違いなど数値化しにくい信号成分を除去することは困難であるといった問題がある。

0009

かかる状況に鑑みて、本発明は、被験体毎に追加の学習又は調整を行うことなく、被験体の生体信号データから被験体の年齢,性別,身体的特徴や生活環境など個体差に関係する特徴量を抽出し分離して、被験体の疾患診断精度の向上と疾患関連信号の可視化を可能とする状態予測方法および装置を提供することを目的とする。

課題を解決するための手段

0010

上記課題を解決すべく、本発明の状態予測方法は、複数の被験体の生体信号を測定して得られた時系列の生体信号データを入力として、深層ニューラルネットワークによる深層生成モデルを用いて被験体の状態を予測する方法であって、下記1)〜3)のステップを備える。
1)一度の計測において変化しない状態ラベル、個体差を表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、生体信号データに関連付けして深層生成モデルを構築するステップ。
2)複数の被験体の生体信号データを入力して深層生成モデルを学習するステップ。
3)入力した生体信号データから、個体差を表現する特徴量と、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し、分離した後の信号成分を用いて被験体の状態予測を行うステップ。

0011

本発明によれば、脳機能画像データなどの生体信号データの解析のために、個体差をモデル化した深層生成モデルを構築し、入力した生体信号データから、個体差を表現する特徴量と、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し、分離した後の信号成分を用いて被験体の状態予測を行い、被験体の疾患診断精度の向上と疾患関連信号の可視化を実現できる。
本発明の状態予測方法は、複数の生体信号データが直接観測不可の潜在変数(個体差を表現する特徴量)を共有しているとし、深層生成モデルを構築する。すなわち、同一被験体の複数の生体信号データであれば、個体差を表現する特徴量を共有しているとする。本明細書において被験体とは、生体信号データを測定するヒトや動物などの生体といった意味で用いる。

0012

状態ラベルは、状態の有無を示すラベルであり、一度の計測において変化しないものである。状態ラベルが疾患状態を示す場合は、疾患の有無の診断ラベルである。状態ラベルは、疾患の有無に限らず、有無以外に深刻度慢性痛などには等級が該当)を示すこともある。
個体差は、単一の被験体から得られた全ての生体信号データ(例えば、脳機能画像データ)が共有する潜在変数としてモデル化され、それらの生体信号データから推論することによって、未知の被験体に対しても汎化することが可能である。ここで、個体差を表現する特徴量とは、上記のとおり、生体信号データにおいて個体差を表現する直接観測不可の潜在変数である。

0013

深層生成モデルは、入力するデータを多次元同時確率分布で表現し、入力するデータに現われる特徴的な信号成分を効率よく表現できる生成モデルである。本発明では、一度の計測において変化しない状態ラベル、個体差を表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、生体信号データに関連付けして深層生成モデルを構築する。そして、複数の被験体の生体信号データを入力して深層生成モデルを学習して、入力した生体信号データから、個体差を表現する特徴量と、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し、分離した後の信号成分を用いて被験体の状態予測を行う。

0014

深層生成モデルにおいて、同一の被験体の複数の生体信号データが個体差を表現する特徴量を共有する。すなわち、一の生体信号データは同じ被験体から得られた別の生体信号データと個体差を表現する特徴量を共有する。
これを前提にすることにより、生体信号データを信号成分に分解して、再び元の生体信号データを再構築する際には、同じ個体差を表現する特徴量が同じ値を取るという拘束条件を与えることができる。

0015

本発明の状態予測方法における深層生成モデルを構築するステップにおいて、更に測定環境差を表現する特徴量が、生体信号データに関連付けられ、状態ラベル、個体差を表現する特徴量、測定環境差を表現する特徴量、及び、状態ラベルと個体差と測定環境差とに依存しないが時間的に変化し得る信号成分を、生体信号データに関連付けして深層生成モデルが構築されることが好ましい。

0016

ここで、測定環境差を表現する特徴量とは、生体信号データを測定する測定機器の特徴量、例えば、機器の分解能や感度(S/N比)などの特性によって変動する信号成分である。
生体信号データでは、個体差と環境差では共有されている範囲が異なる。そのため、同一被験体から得られた生体信号データは単一の特徴量(=個体差)を共有し、また、単一の測定環境で測定された複数の被験体から得られた生体信号データは単一の特徴量(=測定環境差)を共有している。すなわち、一の生体信号データは同じ被験体から得られた別の生体信号データと個体差を表現する特徴量を共有し、また、一の生体信号データは同じ測定環境から得られた別の生体信号データと測定環境差を表現する特徴量を共有している。
これを前提にすることにより、生体信号データを信号成分に分解して、再び元の生体信号データを再構築する際には、同じ個体差を表現する特徴量と測定環境差を表現する特徴量が同じ値を取るという拘束条件を与えることができる。

0017

上記の深層生成モデルにおいて、同一の被験体の複数の生体信号データが、個体差を表現する特徴量を共有する。特に、深層生成モデルが、VAE(Variational Auto-Encoder)で構成される場合には、個体差を表現する特徴量は、事前分布に従う潜在変数としてモデル化される。VAEは、深層学習を用いた生成モデルとして代表的なものであり、データに存在する潜在変数(特徴量)を高い精度で得られることがわかっている。
また、上記の深層生成モデルにおいて、同一の測定環境で計測された複数の生体信号データが、測定環境差を表現する特徴量を共有する。特に、深層生成モデルが、VAEで構成される場合には、測定環境差を表現する特徴量は、事前分布に従う潜在変数としてモデル化される。

0018

上述の深層学習するステップにおいて、個体差を表現する特徴量の推定には、1つの生体信号データとそれに関連付けされた状態ラベルを入力として活性値を出力する第1のニューラルネットワークと、生体信号データの集合から得られた活性値の平均を入力として個体差を表現する特徴量を出力する第2のニューラルネットワークと、から構成される集団符号化器を用いる。
第1のニューラルネットワークと第2のニューラルネットワークの2つのニューラルネットワークが重なった(階層化されていない)集団符号化器を用いて、個体差に依存する特徴量を推定、具体的には、事前分布に従う潜在変数に関する重みのパラメータを推定する。第1のニューラルネットワークは、状態ラベルを入力として活性値を出力する。そして、第2のニューラルネットワークでは、活性値の平均を入力として再パラメータ化を用いて個体差を表現する特徴量の事後分布を出力する。
同様に、深層学習するステップにおいて、測定環境差を表現する特徴量の推定には、同一環境で測定された1つ以上の生体信号データとそれに関連付けされた状態ラベルを入力として活性値を出力する第1のニューラルネットワークと、生体信号データの集合から得られた活性値の平均を入力として測定環境差を表現する特徴量を出力する第2のニューラルネットワークと、から構成される集団符号化器を用いる。
測定環境差を表現する特徴量の推定の場合、一つの被験体の生体信号データでは、個人差を表現する特徴量と区別がつかないことから、同一環境で測定された複数の被験体のデータを使うことが好ましい。

0019

本発明の状態予測方法は、被験体の状態予測した結果を表示するステップを更に備える。
本発明における生体信号データは、fMRI(functional Magnetic Resonance Imaging)画像データ、MRI(Magnetic Resonance Imaging)画像データ、PET(Positron Emission Tomography)画像データ、超音波画像データ脳波データ心電図データ心拍数データ発汗量データ血中酸素濃度データ、又は、血糖値データの何れかである。
ここで、fMRI画像データは時系列データである一方、MRI画像データは一般に時系列ではないが、時系列データではないMRI画像データであっても、経過観察などのために複数回撮影したMRI画像データは、時系列の生体信号データに準じて処理することが可能である。

0020

本発明における深層生成モデルは、VAE(Variational Auto-Encoder)を含むAE(Auto-Encoder)、GAN(Generative Adversarial Nets)、GMM(Generative Moment Matching)、EP(Energy-based Probabilistic Model)、FG(Flow-based Generative Model)、AR(Auto-regressive Model)の何れかを用いることが好ましい。なお、深層生成モデルとしてVAEを用いる場合のみ、再パラメータ化、すなわち、上述した集団符号化器の第2のニューラルネットワークにおける活性値の平均を入力として個体差に依存する特徴量の事後分布を表現するパラメータを出力することが可能である。

0021

次に、本発明の状態予測装置について説明する。
本発明の状態予測装置は、複数の被験体の生体信号を測定して得られた時系列の生体信号データを入力として、深層ニューラルネットワークによる深層生成モデルを用いて被験体の状態を予測する装置であって、下記1)〜3)を備える。
1)一度の計測において変化しない状態ラベル、個体差を表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、生体信号データに関連付けして深層生成モデルを構築する生成モデル構築部。
2)複数の被験体の生体信号データを入力して深層生成モデルを学習する学習部。
3)入力した生体信号データから、個体差を表現する特徴量と、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し、分離した後の信号成分を用いて被験体の状態予測を行う状態予測部。

0022

本発明の状態予測装置の生成モデル構築部において、更に測定環境差を表現する特徴量が、生体信号データに関連付けられ、状態ラベル、個体差を表現する特徴量、測定環境差を表現する特徴量、及び、状態ラベルと個体差と測定環境とに依存しないが時間的に変化し得る信号成分を、生体信号データに関連付けして深層生成モデルが構築されることが好ましい。

0023

本発明の状態予測装置の深層生成モデルにおいて、同一の被験体の複数の生体信号データが、個体差を表現する特徴量を共有し、特に、深層生成モデルが、VAEで構成される場合には、個体差を表現する特徴量は、事前分布に従う潜在変数としてモデル化される。
同様に、深層生成モデルにおいて、同一の測定環境で計測された複数の生体信号データが、測定環境差を表現する特徴量を共有し、特に、深層生成モデルが、VAEで構成される場合には、測定環境差を表現する特徴量は、事前分布に従う潜在変数としてモデル化される。

0024

また、本発明の状態予測装置における学習部では、個体差を表現する特徴量の推定に、1つの生体信号データと状態ラベルを入力として活性値を出力する第1のニューラルネットワークと、生体信号データの集合から得られた活性値の平均を入力として、個体差を表現する特徴量を出力する第2のニューラルネットワークとから構成される集団符号化器を用いる。
同様に、学習部では、測定環境差を表現する特徴量の推定に、1つの生体信号データと状態ラベルを入力として活性値を出力する第1のニューラルネットワークと、生体信号データの集合から得られた活性値の平均を入力として、測定環境差を表現する特徴量を出力する第2のニューラルネットワークとから構成される集団符号化器を用いる。
本発明の状態予測装置は、被験体の状態予測した結果を表示する表示部を更に備える。

0025

本発明の状態予測プログラムは、上述の本発明の状態予測方法における各ステップを、コンピュータに実行させるためのプログラムである。また、本発明の状態予測プログラムは、上述の本発明の状態予測装置における生成モデル構築部、学習部、及び状態予測部として、コンピュータを機能させるためのプログラムである。

発明の効果

0026

本発明によれば、被験体毎に追加の学習又は調整を行うことなく、被験体の生体信号データから個体差に関係する特徴量を抽出し分離して、疾患診断精度の向上と疾患関連信号の可視化を図れる効果がある。また測定環境差に関係する特徴量を抽出し分離して、更なる精度向上を図ることができる。

図面の簡単な説明

0027

状態予測方法のフロー
状態予測装置の機能ブロック
実施例1の深層生成モデルの構成模式図
深層ニューラルネットワークの概念
集団符号化器の構成模式図
集団符号化器の説明図
符号化器及び復号化器の構成模式図
符号化/復号化の概念図
時系列の脳機能画像データのデータ構造の一例
実施例2の深層生成モデルの構成模式図
実施例2の符号化/復号化の概念図

発明を実施するための最良の形態

0028

以下、本発明の実施形態の一例を、図面を参照しながら詳細に説明していく。なお、本発明の範囲は、以下の実施例や図示例に限定されるものではなく、幾多の変更及び変形が可能である。

0029

本発明の状態予測方法及び状態予測装置について、生体信号データとして磁気共鳴機能画像法(fMRI;functional Magnetic Resonance Imaging)の脳機能画像データを例に挙げて説明する。fMRIは、MRIを利用して人や動物の脳活動に関連する血流動態反応を視覚化するものであり、MRIが提供する構造情報の上に、脳の機能活動が生じた部位を画像化する。
本実施例の状態予測方法では、複数の被験体の脳機能画像を測定して得られた時系列の脳機能画像データを入力として、深層ニューラルネットワークによる深層生成モデルを用いて被験体の状態を予測する。先ず、一度の計測において変化しない状態ラベル、個体差を表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、脳機能画像データに関連付けして、深層生成モデルを構築する。次に、構築した深層生成モデルに対して、複数の被験体の時系列の脳機能画像データを入力して深層生成モデルを学習する。そして、入力した脳機能画像データから、個体差を表現する特徴量と、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し、抽出した特徴量と信号成分を分離した後の信号成分を用いて被験体の状態予測を行う。

0030

図1は、本発明の状態予測方法のフローの一実施形態を示している。図1のフローでは、個体差を表現する特徴量にフォーカスしてフローを示しているが、個体差を表現する特徴量以外に、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分も、個体差を表現する特徴量と同様に処理している。
図1に示すように、個体差を表現する特徴量と、状態ラベルと、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を、脳機能画像データに関連付けして、深層生成モデルを構築する(ステップS01)。構築した深層生成モデルの最適化のために、学習用の複数の被験体の脳機能画像データを入力し(ステップS02)、深層生成モデルを繰り返し学習する(ステップS03)。反復学習が完了すれば(ステップS04)、個体差を表現する特徴量、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し分離する(ステップS05)。予測対象の被験体の脳機能画像データを入力し(ステップS06)、入力した脳機能画像データから、個体差を表現する特徴量と、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し分離(ステップS07)した後の信号成分を用いて、被験体の状態予測を行う(ステップS08)。

0031

図2は、本発明の状態予測装置の一実施形態の機能ブロック図を示している。
状態予測装置1は、複数の被験体の脳機能画像を測定して得られた時系列の脳機能画像データを入力として、深層ニューラルネットワークによる深層生成モデルを用いて被験体の状態を予測する装置である。生成モデル構築部2では、入力した時系列の脳機能画像データに、状態ラベル、個体差を表現する特徴量、及び、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を関連付けして深層生成モデルを構築する。学習部3では、複数の被験体の脳機能画像データを入力して深層生成モデルを繰り返し学習する。そして、学習済の深層生成モデルを用い、入力した時系列の脳機能画像データから、個体差を表現する特徴量と、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し、分離した後の信号成分を用いて、被験体の状態予測を行い、状態の予測結果を表示パネルに表示する。

0032

(深層生成モデルについて)
次に、本実施例の深層生成モデルについて、図3に示す構成模式図を用いて説明する。
以下では、生体信号データとして脳機能画像データを例に挙げて、深層生成モデルを説明する。脳機能画像データのデータセットをD={xi,yi}Ni=1と表す。ここで、Nは被験体数、iはインデックス番号であり、xiは被験体iから得られた脳機能画像データの集合、yiは被験体iの疾患の状態ラベル(診断結果)である。状態ラベルyiにおいて、y=0が疾患無し、y=1が疾患有りの状態を意味する。被験体iからはTi枚の脳機能画像が得られているとし、xi={xi,t}Tit=1で表す。

0033

深層生成モデルにおいて、各被験体iには、疾患の有無とは別に個体差が存在すると仮定する。脳機能画像データにおける個体差とは、被験体によって脳の大きさや形状が異なること、抽象的な意味での脳の使い方や癖などが該当する。なお、脳の大きさや形状の個体差は、脳機能画像データの前処理によって除去が可能な要素であるが、完全に除去することは実際上困難である。ここで、脳機能画像データの前処理とは、磁場の安定を確保するために測定し始めの数枚の脳機能画像をデータから除外したり、撮像平面ごとのタイミングの補正体動の補正、観測点座標標準脳座標系、例えばMNI(Montreal. Neurological Institute)座標系に変換する(空間正規化を行う)ことなどの処理をいう。

0034

深層生成モデルは、この個体差が、事前分布p(s)に従う特徴量siで表現され、脳機能画像データxiを生成する直接観測不可の潜在変数としてモデル化される。図3に示すように、各脳機能画像データxi,tは、状態ラベルyi、個体差を表現する特徴量(以下、個体差という)si、そして状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分(以下、潜在変数という)zi,tに紐付けられる構成である。潜在変数zi,tは、事前分布p(z)に従い、脳機能画像ごとのばらつきを表現するものである。例えば、脳機能画像データの採取中に被験体が頭で考えていたことや、前処理で除去しきれなかった体動などが相当する。

0035

図4は、深層生成モデルを用いた深層ニューラルネットワークの概念図を示している。例えば、被験体iからTi枚の脳機能画像データ5を入力し、状態ラベルと個体差を考慮して、符号化(Encorder)プロセスによって次元数を減らし、潜在変数zi,tの事後分布を求め、入力した脳機能画像データ5から、復号化(Decorder)プロセスによって脳機能画像データ5´を復号する。被験体以外の学習用データの脳機能画像データ5とその状態の入力を繰返し、バックワード計算において、入力した脳機能画像データ5と出力した脳機能画像データ5´の差を減らすように重みパラメータを変更する。入力する脳機能画像データとその状態ラベルが繰り返し与えられることによって、重みパラメータは改善されていく。

0036

状態ラベルyiを条件とした脳機能画像データxiの生成モデルpθは、図3の模式図に示すように構築される。図3において、実線矢印a〜cは生成モデルによる復号化を示し、構築された生成モデルpθでは、状態ラベルyiと個体差siと潜在変数zi,tから、脳機能画像データxi,tが生成される(実線矢印a〜c)。VAEで構成される場合、生成モデルpθは、下記数式で表される。

0037

0038

深層生成モデルを単体で学習させることは非常な困難が伴うため、例えば、推論モデルあるいは符号化器と呼ばれる別の深層ニューラルネットワークを導入し、変分法を用いて学習する。ただし、VAEで構成されない場合、必ずしも推論モデルは必要ではない。
図3において、点線矢印d〜hは推論モデルによる符号化を示している。推論モデルを用いて脳機能画像データxi,tと状態ラベルyiからそれぞれ個体差siと潜在変数zi,tが推論され(点線矢印d〜g)、さらに、個体差siから潜在変数zi,tが推論される(点線矢印h)。推論モデルqφを用いた変分推論により、上記の生成モデルpθのモデルエビデンスlogp(xi|yi)の下界は、下記数式のように表される。

0039

0040

ここで、DKL(・||・)は、Kullback−Leibler divergenceであり、Lg(xi,yi)はモデルエビデンスの下界(ELBO:Evidence Lower BOund)である。ELBOは生成モデルpθと推論モデルqφの目的関数に相当する。モデルエビデンスlogp(xi|yi)の近似値として、ELBO Lg(xi,yi)を用いることにより、被験体iの状態ラベルyiの事後確率p(yi|xi)をベイズの定理を用いて下記数式のように表現できる。

0041

0042

ここで、状態ラベルyの事前確率p(y)は、例えば、p(y=0)=p(y=1)=0.5と仮定する。つまり、ELBO Lg(xi,y=1)が大きいほど、被験体iは対象となる状態である可能性が高いと言える。また状態ラベルyiの事前確率の対数logp(yi|xi)の近似値Ld(xi,yi)も目的関数になり得る。これにより、2つの状態ラベルを明確に識別するようにモデルを学習させることができる。なお、単なる識別モデルと化すことを防ぐため、重みパラメータω∈[0,1]を用いて、2つの目的関数を下記数式のように調整し、L(xi,yi)を最終的な目的関数としてもよい(この目的関数に関する詳細については非特許文献5を参照)。

0043

0044

(深層生成モデルの構築について)
ここでは、深層ニューラルネットワークを用いて、生成モデルpθと推論モデルqφを実装することにより、深層生成モデルを構築する方法について説明する。
例えば、脳機能画像データが前処理された後、得られた脳機能画像データxi,t、個体差si、潜在変数zi,tを、それぞれnx次元、ns次元、nz次元のベクトルとする。
例えば、時系列の脳機能画像データにおいて、116の領域(ROI;Regions-Of-Interest)に分割され、それぞれの領域で信号強度を平均化して116次元のベクトルが得られる場合には、脳機能画像データxi,tの次元数は116である(nx=116)。個体差として、年齢、性別、脳の大きさ、形状、脳の使い方、薬物の使用歴やその他の精神疾患の既往歴などが考えられる。それらが10次元のベクトルで表現される場合には、個体差siの次元数は10である(ns=10)。なお、個体差の特徴量において、1つの特徴量が必ずしも1次元であるとは限らず、例えば既往歴のように複雑な特徴量では、1つの特徴量が数次元で表現される。

0045

深層生成モデルが、VAEで構成される場合、多次元同時確率分布のパラメータである潜在変数zi,t,状態ラベルyi,個体差siを推定するために、潜在変数に事前分布を仮定して、深層ニューラルネットワークの出力に事後分布が現われるように、深層ニューラルネットワークで学習する。
一例として、生成モデルは、復号化器(decoder)と呼ばれる単一の深層ニューラルネットワークで構成され、脳機能画像データxi,tの事後分布pθ(xi,t|zi,t,yi,si)は、再パラメータ化の手法を用いて、対角行列分散共分散行列に持つnz次の多変量ガウス分布N(μxi,t,diag(σxi,t))で表現される。ここで、μxi,tは、脳機能画像データxi,tの事後分布の平均ベクトルであり、σxi,tは脳機能画像データxi,tの事後分布の分散ベクトルである。再パラメータ化の手法とは、データを点推定で出力するのではなく、データの事後分布のパラメータを出力する手法であり、再パラメータ化の手法を用いることにより、データの曖昧さやばらつきなどを含めて推定できる。

0046

推論モデルは、一例として、2×nx個の出力ユニットを持ち、そのうちnx個のユニットは恒等関数活性化関数として用いて、事後分布の平均ベクトルμxi,tを表現する。残るnx個のユニットは指数関数を活性化関数として用いて、事後分布の分散ベクトルσxi,tを表現する。
推論モデルのうち、状態ラベルと個体差に依存しないが時間的に変化し得る信号成分(潜在変数)zi,tを推論する部分に関しては、同じく符号化器(encoder)と呼ばれる単一の深層ニューラルネットワークによって実装され、復号化器と同様に、再パラメータ化によって事後分布qθ(zi,t|xi,t,yi,si)を表現する。

0047

一方、推論モデルのうち個体差siを推論する事後分布qθ(si|xi,yi)については調整が必要である。この推論モデルでは、被験体i毎に、長さの一定ではない脳機能画像データの集合xi={xi,t}Tit=1を入力として受け取る必要があるため、集団符号化器(collection-encoder)を用いて深層学習を行う。集団符号化器は、図5に示すように、個々の脳機能画像データxi,tとそれに関連付けされた状態ラベルyiを入力として活性値を出力する第1のニューラルネットワーク11と、脳機能画像データの集合から得られた活性値の平均化した値を入力として、個体差siを推論する事後分布qθ(si|xi,yi)を出力する第2のニューラルネットワーク12とから構成される。なお、図5において、信号処理のフローは下から上へとなっている。

0048

集団符号化器の第1のニューラルネットワーク11は、1枚の脳機能画像データxi,tと状態ラベルyiを入力し、活性値hi,tを出力する。集団符号化器の第2のニューラルネットワーク12は、脳機能画像データの集合xi={xi,t}Tit=1から得られた活性値hi={hi,t}Tit=1から求められた平均値(1/Ti×ΣTit=1{hi,t})を入力とし、再パラメータ化を用いて個体差siの事後分布qθ(si|xi,yi)を出力する。
具体例で説明すると、図6に示すように、第1のニューラルネットワーク11では、脳機能画像1において分割した116の領域(ROI)の信号強度に基づく116次元の信号データとそれに関連付けされた状態ラベルy1を入力する。同様に、脳機能画像2、脳機能画像3、・・・、脳機能画像TiのROIの信号強度に基づく116次元の信号データとそれに関連付けされた状態ラベルyTiを入力する。第2のニューラルネットワーク12では、脳機能画像データの集合から得られた活性値の平均化した値を入力として、個体差siを推論する事後分布qθ(si|xi,yi)を出力する。

0049

そして、被験体iの複数の脳機能画像データが直接観測できない個体差siの事後分布qθ(si|xi,yi)を共有しているとし、深層生成モデルを構築する。すなわち、同一被験体の複数の脳機能画像データであれば、個体差siの事後分布qθ(si|xi,yi)を共有しているとする。この深層生成モデルの構造は、脳機能画像データが持つ構造を模しており、適切な拘束条件として作用する。

0050

本実施例では、符号化器と復号化器にはそれぞれ3層の人工ニューラルネットワークを用いた。図7(1)は符号化器の構成、図7(2)は復号化器の構成を示している。また集団符号化器は、図5の構成模式図に示したとおり、第1のニューラルネットワーク11に2層の人工ニューラルネットワークを、第2のニューラルネットワーク12に1層の人工ニューラルネットワークを用いた。
具体例で説明すると、図8に示すように、符号化器では、時系列の脳機能画像データ(入力データ)の116の領域(ROI)の信号強度に基づく116次元の信号データとそれに関連付けされた状態ラベルyiと個体差siを入力する。各中間層隠れ層)では、それぞれ正規化が行われ、活性化関数としてReLUを用いる。符号化器の人工ニューラルネットワークは、脳機能画像データxi,tの事後分布の平均ベクトルμ、分散ベクトルσを算出し、潜在変数zi,tの事後分布qθ(zi,t|xi,t,yi,si)を表現する。

0051

上述の如く、状態ラベルyiの事前確率の対数logp(yi|xi)の近似値のELBO Lg(xi,yi)は、目的関数となり期待値の計算が必要である。そのため、深層学習の訓練時において、個体差siと潜在変数zi,tを訓練の反復毎に1回サンプルして近似させ、検証時にはそれぞれのMAP推定(事後分布を表現する平均ベクトルμzi,t)を用いた。
なお、人工ニューラルネットワークは、Adam optimization algorithmなどの最適化アルゴリズムを用いて訓練し、また、状態間の被験体数の不均衡は、オーバーサンプル法によって調整した。

0052

図9に、時系列の脳機能画像データのデータ構造の一例を示す。図9(1)のテーブルは、時系列の脳機能画像データ(入力データxi,t)の116の領域1〜116(ROI−1〜ROI−116)の信号強度に基づく116次元の信号データを示している。これらの信号データは、時系列の脳機能画像から得られ、時間的に変化するデータである。
一方、これらの116次元の信号データに関連付けされた状態ラベルyiと個体差siは、時系列の脳機能画像において時間的に変化しない(時不変)。状態ラベルyiは、一度の計測において状態は変化しないものであり、個体差siも計測中に被験体が入れ替わることはなく同一の被験体である限り、計測において変化しないものである。図9(2)のテーブルに示すように、例えば、個体差siが10次元で表現されるとする。なお、上述の如く、個体差の特徴量において、1つの特徴量が必ずしも1次元であるとは限らず、そのため特徴数と次元数は必ずしも一致しない。また、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分(潜在変数)zi,tも、116次元の信号データに関連付けされる。潜在変数zi,tは、状態ラベルyiと個体差siと異なり、時間的に変化するものである。図9の下のテーブルに示すように、例えば、状態ラベルと個体差とに依存しない信号成分(潜在変数)zi,tが1〜32存在し、次元数も32とする。
この場合、時系列の脳機能画像データ(入力データxi,t)である116次元の信号データは、状態ラベルyiと、個体差siと、潜在変数zi,tの次元数の合計43(=1+10+32)となり、推論される個体差siと潜在変数zi,tは、事後分布で表現されるのである。

0053

実験に用いた脳機能画像データについて)
脳機能画像データは、オープンデータベース(Open fMRI)から、統合失調症双極性障害のデータベースを入手し、以下に説明する前処理を行って使用した。前処理は、磁場の安定を確保するために各被験体の最初の10枚の脳機能画像を破棄し、時間方向の調整、体動の補正、そしてMNI座標系を用いた空間正規化を行った。AAL(Automated anatomical labeling)テンプレートにより、116の領域(ROI)に分割し、それぞれで信号強度を平均化し、116次元のベクトルxi,tを得た。データの洗浄として、1.5mmもしくは1.5°以上の体動が検出された瞬間から、以降の脳機能画像をすべて破棄した。
破棄した結果、脳機能画像が100枚未満しか残らなかった被験体は、被験体のデータ全てを破棄した。また撮像位置のずれなどにより、MNI座標系に変換できなかった被験体のデータも破棄した。結果的にコントロール群の被験体数は113、統合失調症の被験体数は44人、双極性障害の被験体数は45人のデータを得た。

0054

予測精度について)
実施例の状態予測方法による予測精度について説明する。予測精度の評価として、従来法(比較例1〜5)との精度比較を行い評価した。
比較例1としては、前処理済の脳機能画像において分割した116の領域(ROI)間のピアソン相関係数(PCC)を機能的結合して用いる方法により予測精度を求め、実施例の状態予測方法による予測精度と比較した。具体的には、比較例1では、ROI間のPCCの機能的結合からケンドールタウ係数(Kendallτcoefficient)を用いて、m個の特徴を選択し、局所線形埋め込み(LLE;Locally Linear Embedding)により、近傍パラメータkのもとでd次元の多様体に埋め込み、c-means法によりクラスタリングしたものである。

0055

比較例2として、前処理済みの脳機能画像を用い、サポートベクターマシンSVM;Support Vector Machine)を用いて状態予測した場合の予測精度と実施例の状態予測方法による予測精度を比較した。ここで、SVMは、脳機能画像を一枚ずつ受け取り、それぞれに対して二値分類の結果を返すものであり、被験体iの診断にはTi枚の脳機能画像に対する分類結果多数決を用いた。

0056

比較例3として、前処理済みの脳機能画像を用い、長期短期記憶(LSTM;Long Short Term Memory)を用いて状態予測した場合の予測精度と実施例の状態予測方法による予測精度を比較した。ここで、LSTMは、再帰構造を持ったニューラルネットワークであり、1の被験体から得られた脳機能画像データの集合xi={xi,t}Tit=1を順番に受け取り、状態の事後確率p(y|xi)を、ロジスティック関数を用いて出力する。

0057

比較例4として、前処理済みの脳機能画像を用い、自己符号化器(AE;Auto-encoder)と隠れマルコフモデルの組み合わせを用いて状態予測した場合の予測精度と実施例の状態予測方法による予測精度を比較した。比較例4では、AEを用いて脳機能画像をd次元に埋め込み、その上で2つの隠れマルコフモデルを学習させた。1つの隠れマルコフモデルは被験体用(pθ(xi,t|y=1))、もう1つはコントロール群用(pθ(xi,t|y=0))である。それぞれの隠れマルコフモデルはガウス分布でモデル化されており、実施例の深層生成モデルと同様にベイズ法則によって、状態の事後確率p(y|xi)を計算する。

0058

比較例5として、前処理済みの脳機能画像を用い、発明者らが提案している既知の深層生成モデル、すなわち、脳機能画像xi、状態ラベルyi、そして画像毎の差異zi,tを、符号化器q(zi,t|xi,t,yi)と復号化器p(xi,t|zi,t,yi)を用いて実装するが、被験体の個体差siはモデル化していない生成モデルを用いて状態予測した場合の予測精度と実施例の状態予測方法による予測精度を比較した。

0059

データセットが不均衡であり、予測精度の比較項目としては、感度(Sensitivity)=TP/(TP+FN)、特異度(Specicity)=TN/(TN+FP)、バランスした正解率(Balanced accuracy)=0.5×(感度+特異度)を用いている。ここで、TP,TN,FP,FNは、それぞれ、True Positive,True Negative,False Positive,False Negativeを表す。
予測精度の測定結果は、10分割交差検定の5回の平均で採取したものであり、下記表1に示す。表1から実施例の深層生成モデルの場合では、統合失調症のデータセットに対して、比較例1〜5の全ての比較手法より明らかに優れた結果を示し、また、双極性障害のデータセットに対して、ほぼ同等あるいは優れた結果を示すことが確認できた。特に、比較例5の発明者らが提案している既知の深層生成モデルよりも高い精度が得られたという点は、実施例の深層生成モデルに与えた個体差siという構造が適切な拘束条件となっていることを示唆しているといえる。

0060

0061

実施例2の深層生成モデルについて、図10に示す構成模式図を用いて説明する。実施例1と同様に、時系列の脳機能画像データを例に挙げて、深層生成モデルを説明する。図10において、実施例1の構成模式図の図3と同様に、脳機能画像データのデータセットはD={xi,yi}Ni=1、Nは被験体数、iはインデックス番号、xiは被験体iから得られた脳機能画像データの集合、yiは被験体iの疾患の状態ラベル(診断結果)である。状態ラベルyiにおいて、y=0が疾患無し、y=1が疾患有りの状態を意味し、被験体iからはTi枚の脳機能画像が得られているとする。実施例2の深層生成モデルでは、各被験体iには、疾患の有無とは別に個体差と測定環境差が存在すると仮定する。脳機能画像データにおける測定環境差とは、脳機能画像の測定に用いた測定機器の分解能や感度の違いなどが該当する。また、測定時の周辺ノイズの違いも該当する。測定環境差は、個人差と同様に、脳機能画像データの前処理によって除去が可能な要素であるが、完全に除去することは実際上困難である。

0062

本実施例の深層生成モデルは、個人差に加えて、測定環境差が、事前分布p(f)に従う特徴量fiで表現され、脳機能画像データxiを生成する直接観測不可の潜在変数としてモデル化される。図10に示すように、各脳機能画像データxi,tは、状態ラベルyi、個体差si、測定環境差を表現する特徴量(以下、測定環境差)fi、そして状態ラベルと個体差と測定環境差に依存しないが時間的に変化し得る信号成分(以下、潜在変数)zi,tに紐付けられる構成である。

0063

本実施例の深層生成モデルを用いた深層ニューラルネットワークでは、被験体から脳機能画像データを入力し、図11に示すように、状態ラベルyiと個体差siと測定環境差fiを考慮して、符号化プロセスによって次元数を減らし、潜在変数zi,tの事後分布を求め、入力した脳機能画像データから、復号化プロセスによって脳機能画像データを復号する。被験体以外の学習用データの脳機能画像データとその状態の入力を繰返し、バックワード計算において、入力した脳機能画像データと出力した脳機能画像データの差を減らすように重みパラメータを変更する。入力する脳機能画像データとその状態ラベルが繰り返し与えられることによって、重みパラメータは改善されていく。

0064

なお、図10において、実線矢印は生成モデルによる復号化を示し、状態ラベルyiと個体差siと測定環境差fiと潜在変数zi,tから、脳機能画像データxi,tが生成される。点線矢印は推論モデルによる符号化を示し、脳機能画像データxi,tと状態ラベルyiからそれぞれ個体差siと測定環境差fiと潜在変数zi,tが推論され、さらに、個体差siと測定環境差fiとから潜在変数zi,tが推論される。
上記の深層ニューラルネットワークを用いて、生成モデルpθと推論モデルqφを実装することにより、深層生成モデルを構築する方法についての説明は、実施例1と同様であり割愛する。

0065

(その他の実施例)
上述の実施例1では、生体信号データとしてfMRIの脳機能画像データを例に挙げて説明したが、本発明の状態予測方法及び状態予測装置は、発汗測定、心電図測定脳波測定など他の時系列の生体信号データに対しても適用できる。
(1)発汗測定の場合、例えば、ヒトの全身発汗部位(手のひら、足の裏、額、脇の下など)の測定ポイント(仮に25カ所の測定ポイント)が存在するならば、25次元の時系列の発汗信号データxi,tが取得できることになる。これに被験体の特徴、例えば、年齢、性別、生活習慣、1日の尿の回数、1日の水分補給量、緊張しやすさ、制汗剤使用度合、毛深さ、病歴などを考慮し、個体差を表現する特徴量siの次元数が決定される。脳機能画像データと同様に、特徴数と次元数は必ずしも一致しない。仮に、個体差を表現する特徴量siの次元数を8とし、発汗に関する疾病の状態ラベルの次元数を1とし、時間的に変化し得る信号成分の次元数を5とする。1人の被験者で1回の発汗測定を行うことにより得られる25次元の発汗信号データから、5次元の時間的に変化するパラメータと9次元(=8次元+1次元)の時不変のパラメータが得られる。個体差を表現する特徴量siは、計測中に不変であり、被験体の各々の個体差を表現する特徴量siに関して得られるデータは時間的に変化するデータではなく固定である。なお、状態ラベルと個人差を表現する特徴量に依存しないが時間的に変化し得る信号成分である潜在変数zi,tは、時間的に変化する時系列のデータである。
実施例1と同様に、発汗信号データを入力して深層生成モデルを学習し、被験体から入力した発汗信号データから、個体差を表現する特徴量と、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分を抽出し、分離した後の信号成分を用いて被験体の発汗に関する疾病の有無の予測を行うことができる。

0066

(2)心電図測定の場合、例えば12誘導心電図であれば、12種の時系列の波形データ、すなわち、12次元の時系列の心電信号データxi,tが得られ、被験体の特徴として、年齢、性別、病歴などを考慮し、個体差を表現する特徴量siの次元数が決定される。
(3)心拍測定の場合、時系列の心拍データが得られ、被験体の特徴として、年齢、性別、スポーツ関与する度合いなどを考慮し、個体差を表現する特徴量siの次元数が決定される。被験体が例えば“スポーツ選手などアスリートであれば常に心拍数が低め”といった情報は、個体差を表現する特徴量siとして扱われる。個体差によらず共通な情報、例えば、“現在運動中なので心拍数が高い”という一時的な情報であれば、状態ラベルと個体差とに依存しないが時間的に変化し得る信号成分(潜在変数)zi,tとして扱われる。
(4)脳波測定の場合、時系列の脳波データが得られ、被験体の特徴として、年齢、性別、病歴などを考慮し、個体差を表現する特徴量siの次元数が決定される。
(5)血中酸素濃度測定や血糖値測定の場合、時系列の血中酸素濃度データや血糖値データが得られ、被験体の特徴として、年齢、性別、体脂肪率肥満度、食生活などを考慮し、個体差を表現する特徴量siの次元数が決定される。

0067

(6)実施例2の場合には、測定環境差を表現する特徴量fiの次元数が決定され、取得する生体信号データの次元数に、個人差を表現する特徴量の次元数、状態ラベルの次元数と同様に、加算される。測定環境差を表現する特徴量fiは、同一の測定環境で計測された複数の生体信号データで共有される。

0068

本発明は、脳機能画像データ,脳波,心拍や発汗データなど多様な生体信号データを計測する生体信号データの計測器や疾患診断装置に有用である。

0069

1状態予測装置
2生成モデル構築部
3 学習部
4状態予測部
5,5´脳機能画像データ
11集団符号化器の第1のニューラルネットワーク
12 集団符号化器の第2のニューラルネットワーク

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ