図面 (/)

技術 自己進化型モジュラーネットワークを用いた情報処理装置、及び情報処理方法

出願人 国立大学法人九州工業大学
発明者 古川徹生徳永憲洋
出願日 2008年11月13日 (11年5ヶ月経過) 出願番号 2009-541172
公開日 2011年3月31日 (9年1ヶ月経過) 公開番号 WO2009-063951
状態 不明
技術分野
  • -
主要キーワード パターン認識器 関連付処理 減衰パラメータ モジュール相互間 バイタリティ 近傍関数 適応制御装置 特定位
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2011年3月31日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (18)

課題・解決手段

特定の機能を有するニューラルネットワークからなるモジュールで構成されるモジュラーネットワーク構築する情報処理装置1であって、入力データ500を前記全てのモジュールに対して入力し、入力データにおける前記モジュールごとの誤差を算出し、誤差の値が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定し、勝者モジュールの当該入力データにおける誤差の値及び予め設定された新たなモジュールを生成する閾値を比較し、比較した結果に基づいて、新たなモジュールを生成し、生成されたモジュールと勝者モジュールとの間、及び前記複数の勝者モジュール間で相互に関連付けを行い、関連付けられたモジュール間で、モジュールが学習すべき学習情報が相互に供給される。

概要

背景

ニューラルネットワーク一種として、KohonenのSOM(Self-Organization Map)(非特許文献1)が一般的に知られている。SOMは、WTA(Winner-Take-All)に基づくユニット間の競合的学習と近傍関数により、ベクトル空間内におけるデータベクトル遠近関係を出来る限り保ちつつ低次元空間自己組織的写像する技術である。このSOMを応用した技術として、非特許文献2、非特許文献3、及び特許文献1に示す技術が知られている。

非特許文献2では、ベクトル空間における通常型SOMを発展させた関数空間におけるSOMが提案されている。このSOMを実現するために、通常型のSOMにおける各ユニットを多層パーセプトロン(Multi-Layer Perceptron:MLP)に置き換えネットワーク、すなわちSOM全体としては多数のニューラルネットワークのモジュール並列に並んだモジュラーネット型SOM(Modular Network SOM:mnSOM)が提案されている。原理的には通常のSOMにおける各ユニットをMLPに置き換えたモジュラーネットワークである。このようなモジュラーネットワークにSOMと同じWTAによるモジュール間競合と近傍関数を導入し、各モジュールが実現する入出力関係平滑化を行う技術が示されている。

非特許文献3には、ユニットの増加とトポロジーの形成を動的に行うことにより入力の規模とトポロジーの変化に対応可能としたオンライン学習アルゴリズム(Evolving Self-Organizing Maps:ESOM)が示されている。ESOMはSOMの発展形であり、グラフの構造を持つネットワークを成長させることで観測データベクトルのトポロジーを表現する能力を持つ。

特許文献1に示される技術は、mnSOMを応用した装置に関する技術であり、装置内に複数存在するニューラルネットワークのモジュールからなるユニットのうち、最も次時刻制御対象予測状態を正しく予測した予測器を含むユニットに係る制御器制御信号を採用して制御対象を制御することで、即時性の高い制御を実現することができると共に、自己組織化マップを形成することができる技術である。
Kazuhiro Tokunaga and Tetsuo Furukawa、"Modular networkSOM:Theory,algorithm and applications"、Lecture Notes in Computer Science、Vol.4232、pp.958-967、2006
徳永憲洋,肝付謙二,古川徹生,安井湘三、“関数空間型SOM”、日本神経回路学会、Vol.12、No.1、pp.39−51、2005
Deng,D. and Kasabov,N. "Online pattern analysis by evolving self-organising maps," Neurocomputing, Vol.51(April), pp87-103, 2003
特開2007−164704号公報

概要

特定の機能を有するニューラルネットワークからなるモジュールで構成されるモジュラーネットワークを構築する情報処理装置1であって、入力データ500を前記全てのモジュールに対して入力し、入力データにおける前記モジュールごとの誤差を算出し、誤差の値が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定し、勝者モジュールの当該入力データにおける誤差の値及び予め設定された新たなモジュールを生成する閾値を比較し、比較した結果に基づいて、新たなモジュールを生成し、生成されたモジュールと勝者モジュールとの間、及び前記複数の勝者モジュール間で相互に関連付けを行い、関連付けられたモジュール間で、モジュールが学習すべき学習情報が相互に供給される。

目的

そこで、本発明は前記課題を解決するためになされたものであり、モジュラーネットワークの構成単位であるモジュールを自己進化的に増加または減少させると共に、モジュール間の関係を自己組織的に見出して、最適なモジュラーネットワークを構築する情報処理装置等を提供することを目的とする。

効果

実績

技術文献被引用数
- 件
牽制数
- 件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

該当するデータがありません

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

特定の機能を有するニューラルネットワークからなるモジュールで構成されるモジュラーネットワーク構築する情報処理装置であって、入力データを前記全てのモジュールに対して入力する入力手段と、前記入力手段が入力した入力データにおける前記モジュールごとの誤差を算出する誤差算出手段と、前記誤差算出手段が算出した誤差の値が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定する勝者モジュール決定手段と、前記勝者モジュール決定手段が決定した勝者モジュールの当該入力データにおける誤差の値及び予め設定された新たなモジュールを生成する閾値を比較する誤差比較手段と、前記誤差比較手段が比較した結果に基づいて、新たなモジュールを生成するモジュール生成手段と、前記生成された新たなモジュールと前記複数の勝者モジュールとの間、及び当該複数の勝者モジュール間で相互に関連付けを行う関連付手段とを備えることを特徴とする情報処理装置。

請求項2

請求項1に記載の情報処理装置において、前記関連付手段で関連付けられたモジュール間で、前記誤差算出手段にて算出された誤差が小さくなるように、当該モジュールが学習すべき学習情報を相互に供給して学習することを特徴とする情報処理装置。

請求項3

請求項2に記載の情報処理装置において、前記関連付手段で関連付けられたモジュール間で、相互に供給される前記学習情報の学習量が、当該関連付けられたモジュールの誤差に基づいて算出される活性度に応じて供給されることを特徴とする情報処理装置。

請求項4

請求項1ないし3のいずれかに記載の情報処理装置において、前記誤差比較手段が比較した結果に基づいて、新たなモジュールの生成を行わないと判定された場合に、前記全てのモジュールのうち所定のモジュールについて、当該入力データの誤差が小さくなるように、前記供給された学習情報に基づいて学習処理を行う学習手段を備えることを特徴とする情報処理装置。

請求項5

請求項1ないし4のいずれかに記載の情報処理装置において、前記勝者モジュール決定手段が、当該入力データにおける誤差の値が最も小さいモジュールを第1の勝者モジュールとして決定し、当該入力データにおける誤差の値が2番目に小さいモジュールを第2の勝者モジュールとして決定し、前記関連付手段が、前記モジュール決定手段にて決定された第1及び第2の勝者モジュールと前記モジュール生成手段にて生成されたモジュールとの間での関連付け、並びに前記第1及び第2の勝者モジュールの間で関連付けが行われていない場合は当該第1、及び第2の勝者モジュールの間での関連付けを行うことを特徴とする情報処理装置。

請求項6

請求項4または5に記載の情報処理装置において、前記学習手段が、前記全てのモジュールのうち前記勝者モジュール決定手段が決定した前記入力データとの誤差が最小となる勝者モジュール及び前記関連付手段により当該勝者モジュールと関連付けが行われたモジュールについて学習処理を行うことを特徴とする情報処理装置。

請求項7

請求項6に記載の情報処理装置において、前記学習手段が、前記入力データとの誤差が最小となる勝者モジュールと順次関連付けが行われたモジュールについて学習処理を行う場合に、順次関連付けられた複数のモジュール相互間の世代に応じて学習量を調整することを特徴とする情報処理装置。

請求項8

請求項1ないし7のいずれかに記載の情報処理装置において、前記モジュール間の関連付けの強度を示す関連付強度を算出する関連付強度算出手段を備え、当該関連付強度算出手段が算出した関連付強度に基づいて、関連付けの処理または関連付けの更新が行われることを特徴とする情報処理装置。

請求項9

請求項8に記載の情報処理装置において、前記関連付強度算出手段が、前記誤差算出手段にて算出された誤差に基づいて相互に関連付けられている各モジュールの活性度を算出し、当該活性度がいずれのモジュールにおいても高い場合に関連付強度を強くし、当該活性度が一方のモジュールおいてまたはいずれのモジュールにおいても低い場合に関連付強度を弱くすることを特徴とする情報処理装置。

請求項10

請求項8又は9に記載の情報処理装置において、相互に関連付けられている各モジュールのいずれもが、前記勝者モジュール決定手段により勝者モジュールとして決定された場合に、当該モジュール間の関連付強度を強くし、相互に関連付けられている各モジュールの一方のみが、前記勝者モジュール決定手段により勝者モジュールとして決定された場合に、当該モジュール間の関連付強度を弱くすることを特徴とする情報処理装置。

請求項11

請求項8ないし10のいずれかに記載の情報処理装置において、前記関連付強度が、当該関連付けの存続期間を示しており、関連付強度が弱くなるに連れて当該関連付けが減衰すると共に、最終的には消滅し、当該関連付強度が強くなると当該存続期間が初期値に戻ることを特徴とする情報処理装置。

請求項12

特定の機能を有するニューラルネットワークからなるモジュールで構成されるモジュラーネットワークを構築する情報処理方法であって、入力データを前記全てのモジュールに対して入力する入力ステップと、前記入力ステップで入力された入力データにおける前記モジュールごとの誤差を算出する誤差算出ステップと、前記誤差算出ステップで算出された誤差の値が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定する勝者モジュール決定ステップと、前記勝者モジュール決定ステップで決定された勝者モジュールの当該入力データにおける誤差の値及び予め設定された閾値を比較する誤差比較ステップと、前記誤差比較ステップで比較された結果に基づいて、新たなモジュールを生成するモジュール生成ステップと、前記生成された新たなモジュールと前記複数の勝者モジュールとの間、及び前記複数の勝者モジュール間で相互に関連付けを行う関連付ステップとを含むことを特徴とする情報処理方法。

請求項13

特定の機能を有するニューラルネットワークからなるモジュールで構成されるモジュラーネットワークを構築するようにコンピュータを実行させるための情報処理プログラムであって、入力データを前記全てのモジュールに対して入力する入力手順と、前記入力手順で入力された入力データにおける前記モジュールごとの誤差を算出する誤差算出手順と、前記誤差算出手順で算出された誤差の値が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定する勝者モジュール決定手順と、前記勝者モジュール決定手順で決定された勝者モジュールの当該入力データにおける誤差の値及び予め設定された閾値を比較する誤差比較手順と、前記誤差比較手順で比較された結果に基づいて、新たなモジュールを生成するモジュール生成手順と、前記生成された新たなモジュールと前記複数の勝者モジュールとの間、及び前記複数の勝者モジュール間で相互に関連付けを行う関連付手順とをコンピュータに実行させるための情報処理プログラム。

請求項14

請求項1ないし11のいずれかに記載の情報処理装置を用いた環境地図獲得装置であって、周囲の景色撮像し、画像データとして取得する画像取得手段と、当該画像データに基づいて形成されたモジュラーネットワークを環境地図として出力する環境地図出力手段とを備え、前記画像取得手段で取得された画像データを前記入力手段に入力データとして入力すると共に、前記モジュールが前記画像データに基づいて景色を学習するニューラルネットワークからなることを特徴とする環境地図獲得装置。

請求項15

請求項1ないし11のいずれかに記載の情報処理装置を用いた適応制御装置であって、前記モジュールが適応制御の対象となる制御対象を制御する制御器及び当該制御対象の次時刻状態予測する予測器として機能する構成とし、前記制御対象のパラメータデータを前記入力手段に入力データとして入力し、当該パラメータデータに適応する最適なモジュールを制御コントローラとして選択することを特徴とする適応制御装置。

請求項16

請求項1ないし11のいずれかに記載の情報処理装置を用いた並列処理装置であって、前記モジュールが、相互に通信可能な機能を有する端末であり、前記関連付手段が、前記端末間の関連付けを公衆回線を用いて行い、当該関連付けられた端末間で、当該端末が学習すべき学習情報、及び当該端末が行う処理情報が相互に提供されることを特徴とする並列処理装置。

技術分野

0001

本発明は、ニューラルネットワークモジュールからなるモジュラーネットワーク構築する情報処理装置に関し、特に、自己進化的にモジュラーネットワークを構築する情報処理装置等に関する。

背景技術

0002

ニューラルネットワークの一種として、KohonenのSOM(Self-Organization Map)(非特許文献1)が一般的に知られている。SOMは、WTA(Winner-Take-All)に基づくユニット間の競合的学習と近傍関数により、ベクトル空間内におけるデータベクトル遠近関係を出来る限り保ちつつ低次元空間自己組織的写像する技術である。このSOMを応用した技術として、非特許文献2、非特許文献3、及び特許文献1に示す技術が知られている。

0003

非特許文献2では、ベクトル空間における通常型SOMを発展させた関数空間におけるSOMが提案されている。このSOMを実現するために、通常型のSOMにおける各ユニットを多層パーセプトロン(Multi-Layer Perceptron:MLP)に置き換えたネットワーク、すなわちSOM全体としては多数のニューラルネットワークのモジュールが並列に並んだモジュラーネット型SOM(Modular Network SOM:mnSOM)が提案されている。原理的には通常のSOMにおける各ユニットをMLPに置き換えたモジュラーネットワークである。このようなモジュラーネットワークにSOMと同じWTAによるモジュール間競合と近傍関数を導入し、各モジュールが実現する入出力関係平滑化を行う技術が示されている。

0004

非特許文献3には、ユニットの増加とトポロジーの形成を動的に行うことにより入力の規模とトポロジーの変化に対応可能としたオンライン学習アルゴリズム(Evolving Self-Organizing Maps:ESOM)が示されている。ESOMはSOMの発展形であり、グラフの構造を持つネットワークを成長させることで観測データベクトルのトポロジーを表現する能力を持つ。

0005

特許文献1に示される技術は、mnSOMを応用した装置に関する技術であり、装置内に複数存在するニューラルネットワークのモジュールからなるユニットのうち、最も次時刻制御対象予測状態を正しく予測した予測器を含むユニットに係る制御器制御信号を採用して制御対象を制御することで、即時性の高い制御を実現することができると共に、自己組織化マップを形成することができる技術である。
Kazuhiro Tokunaga and Tetsuo Furukawa、"Modular networkSOM:Theory,algorithm and applications"、Lecture Notes in Computer Science、Vol.4232、pp.958-967、2006
徳永憲洋,肝付謙二,古川徹生,安井湘三、“関数空間型SOM”、日本神経回路学会、Vol.12、No.1、pp.39−51、2005
Deng,D. and Kasabov,N. "Online pattern analysis by evolving self-organising maps," Neurocomputing, Vol.51(April), pp87-103, 2003
特開2007−164704号公報

発明が解決しようとする課題

0006

しかしながら、非特許文献1、非特許文献2、及び特許文献1に示す技術は、予めモジュールの数を設計者が固定しなければならないため、設計者の負担が大きくなると共に、モジュールの数に制限があるため、ネットワークを拡大することができず、処理の対応ができなくなってしまうという課題を有する。

0007

また、モジュールの配置が並列的に固定されているため、例えば、環境地図を作成するような場合には環境が複雑になっていたり、入り組んだ場合には対応することができないという課題を有する。

0008

さらに、逐次的な学習機能が備わってないため、学習途中で環境が変化すると対応することができないという課題を有する。
さらにまた、全てのモジュールに対して学習の処理を行うため、計算量が増大し、処理に時間が掛かるという課題を有する。

0009

非特許文献3に示す技術は、ユニットの増加とトポロジーの形成を動的に行うことができるが、ベクトル空間における各ユニットは1つのコードブックベクトルを実現するため、適用できる対象が限られており、応用範囲が狭くなってしまうという課題を有する。

0010

そこで、本発明は前記課題を解決するためになされたものであり、モジュラーネットワークの構成単位であるモジュールを自己進化的に増加または減少させると共に、モジュール間の関係を自己組織的に見出して、最適なモジュラーネットワークを構築する情報処理装置等を提供することを目的とする。

課題を解決するための手段

0011

(1.モジュールの追加)
本発明に係る情報処理装置は、特定の機能を有するニューラルネットワークからなるモジュールで構成されるモジュラーネットワークを構築する情報処理装置であって、入力データを前記全てのモジュールに対して入力する入力手段と、前記入力手段が入力した入力データにおける前記モジュールごとの誤差を算出する誤差算出手段と、前記誤差算出手段が算出した誤差の値が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定する勝者モジュール決定手段と、前記勝者モジュール決定手段が決定した勝者モジュールの当該入力データにおける誤差の値及び予め設定された新たなモジュールを生成する閾値を比較する誤差比較手段と、前記誤差比較手段が比較した結果に基づいて、新たなモジュールを生成するモジュール生成手段と、前記生成された新たなモジュールと前記複数の勝者モジュールとの間、及び前記複数の勝者モジュール間で相互に関連付けを行う関連付手段とを備えることを特徴とするものである。

0012

このように、本発明においては、モジュラーネットワークに対して入力データが入力された場合に、そのデータに対して処理を行った場合の誤差(エラー)が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定し、勝者モジュールの誤差が所定の閾値以上であれば、新たなモジュールを生成するため、モジュラーネットワークにおけるモジュールを自己進化的に増加させることができ、設計者が予めモジュールの数を設定する必要がなくなるため、設計者の負担を軽減することができるという効果を奏する。

0013

また、処理の過程で環境が変化したような場合であっても、モジュールの数を必要な時に必要な数だけ追加することができるため、様々な環境やその変化に対応してモジュラーネットワークを構築することができるという効果を奏する。

0014

さらに、各モジュールは、特定の機能を有するニューラルネットワークからなるため、構築されるモジュラーネットワーク全体としては、多数のニューラルネットワークのモジュールが並列的に並んだネットワークとなり、1つのモジュールが1つの関数を実現し、未知の関数を学習ことができるため、適用できる対象が増大し、応用範囲を飛躍的に広げることができるという効果を奏する。

0015

さらにまた、モジュール生成手段が生成した新たなモジュールと勝者モジュール決定手段が決定した勝者モジュールとの間で相互に関連付けを行うことで、モジュール間の関係性を自己組織的に見出すことができるため、様々な処理に対応することができるという効果を奏する。例えば、関連付けを時間的な観点で行えば処理を行った順にモジュールを関連付けることができ、類似という観点で行えば類似しているモジュール同士を関連付けることができる。このようにモジュールの関連付けを自己組織的に行うことで、モジュラーネットワーク自体で環境地図を表現することができたり、ロボットの動作を制御する場合において、制御の受け渡しをモジュール間でスムーズに行うことができるようになる。

0016

なお、勝者モジュール間での関連付けは、当該勝者モジュール間で関連付けが行われていない場合のみ行われ、既に関連付けが行われている場合には、関連付けの強度が更新される(強度の更新については後述する)。

0017

(2.学習情報の供給)
本発明に係る情報処理装置は、前記関連付手段で関連付けられたモジュール間で、前記誤差算出手段にて算出された誤差が小さくなるように、当該モジュールが学習すべき学習情報を相互に供給して学習することを特徴とするものである。

0018

このように、本発明においては、関連付けが行われたモジュール間には、相互に学習情報が供給されて学習するため、勝者となったモジュールだけではなく、その周辺の関連付けられたモジュールも入力データに対して学習を行うことができ、与えられた課題(入力)に対して強くなることができる。

0019

また、関連付けにより学習情報が相互に供給されることで、困難な課題であっても、モジュール同士が相互に教え合いながら学習することができるため、学習効率を格段に高めることができるという効果を奏する。

0020

(3.学習量
本発明に係る情報処理装置は、前記関連付手段で関連付けられたモジュール間で、相互に供給される前記学習情報の学習量が、当該関連付けられたモジュールの誤差に基づいて算出される活性度に応じて供給されることを特徴とするものである。
このように、本発明においては、関連付けられたモジュール間で、相互に供給される前記学習情報の学習量が、当該関連付けられたモジュールの誤差に基づいて算出される活性度に応じて供給されるため、入力データに応じて、適切な量の学習情報が供給され、安定した学習を行うことができるという効果を奏する。

0021

(4.学習処理
本発明に係る情報処理装置は、前記誤差比較手段が比較した結果に基づいて、新たなモジュールの生成を行わないと判定された場合に、前記全てのモジュールのうち所定のモジュールについて、当該入力データの誤差が小さくなるように、前記供給された学習情報に基づいて学習処理を行う学習手段を備えることを特徴とするものである。
このように、本発明においては、新たなモジュールの生成を行わない場合に、所定のモジュールについて入力データの誤差が小さくなるように学習処理を行うため、最適なモジュラーネットワークの構築を行うことができるという効果を奏する。

0022

(5.第1の勝者モジュールと第2の勝者モジュール)
本発明に係る情報処理装置は、前記勝者モジュール決定手段が、当該入力データにおける誤差の値が最も小さいモジュールを第1の勝者モジュールとして決定し、当該入力データにおける誤差の値が2番目に小さいモジュールを第2の勝者モジュールとして決定し、前記関連付手段が、前記モジュール決定手段にて決定された第1及び第2の勝者モジュールと前記モジュール生成手段にて生成されたモジュールとの間での関連付け、並びに、前記第1及び第2の勝者モジュールの間で関連付けが行われていない場合は当該第1及び第2の勝者モジュールの間での関連付けを行うものである。

0023

このように、本発明においては、入力データにおける誤差の値が最も小さいモジュールを第1の勝者モジュールとして決定し、当該入力データにおける誤差の値が2番目に小さいモジュールを第2の勝者モジュールとして決定し、新たに生成されたモジュールと各勝者モジュールの関連付けが行われるため、上記と同様に、進化的な学習を安定して行うことができると共に、新たに生成されたモジュールの関連性をより正確に表現することができ、最適なモジュラーネットワークを構築することができるという効果を奏する。

0024

(6.関連付けられたモジュールの学習)
本発明に係る情報処理装置は、前記学習手段が、前記全てのモジュールのうち前記勝者モジュール決定手段が決定した前記入力データとの誤差が最小となる勝者モジュール及び前記関連付手段により当該勝者モジュールと関連付けが行われたモジュールについて学習処理を行うことを特徴とするものである。

0025

このように、本発明においては、全てのモジュールのうち勝者モジュール決定手段が決定した入力データとの誤差が最小となる勝者モジュール及び関連付処理部により当該勝者モジュールと関連付けが行われたモジュールについて学習処理を行うため、従来のように全てのモジュールについて学習処理を行わず、局所的に必要な学習が行われることで処理を軽減することができるという効果を奏する。

0026

(7.学習量の調整)
本発明に係る情報処理装置は、前記学習手段が、前記入力データとの誤差が最小となる勝者モジュールと順次関連付けが行われたモジュールについて学習処理を行う場合に、順次関連付けられた複数のモジュール相互間の世代に応じて学習量を調整することを特徴とするものである。

0027

このように、本発明においては、入力データとの誤差が最小となる勝者モジュールと順次関連付けが行われたモジュールについて学習処理を行う場合に、順次関連付けられた複数のモジュール相互間の世代に応じて学習量を調整するため、勝者モジュールとの関連性に応じた量の学習を行うことができ、最適なモジュラーネットワークを構築することができるという効果を奏する。

0028

(8.関連付強度の更新)
本発明に係る情報処理装置は、前記モジュール間の関連付けの強度を示す関連付強度を算出する関連付強度算出手段を備え、当該関連付強度算出手段が算出した関連付強度に基づいて、関連付けの処理または関連付けの更新が行われるものである。
このように、本発明においては、モジュール間の関連付けの強度を示す関連付強度を算出する関連付強度算出手段を備え、当該関連付強度算出手段が算出した関連付強度に基づいて、関連付けの処理及び関連付けの更新が行われるため、モジュール間の関連性が適正になり、最適なモジュラーネットワークを構築することができるという効果を奏する。

0029

(9.関連付強度の算出)
本発明に係る情報処理装置は、前記関連付強度算出手段が、前記誤差算出手段にて算出された誤差に基づいて相互に関連付けられている各モジュールの活性度を算出し、当該活性度がいずれのモジュールにおいても高い場合に関連付強度を強くし、当該活性度が一方のモジュールおいてまたはいずれのモジュールにおいても低い場合に関連付強度を弱くするものである。

0030

このように、本発明においては、誤差算出手段にて算出された誤差に基づいて相互に関連付けられている各モジュールの活性度を算出し、その活性度に応じて関連付強度を算出して更新するため、関連性が強いモジュール間のパス強化され、関連性が弱いモジュール間のパスは衰退消滅する。つまり、モジュール間の関連性が適切になり、最適なモジュラーネットワークを構築することができると共に、モジュール間の不要な関連性が消滅し、必要な関連性のみでネットワークを構築することができるという効果を奏する。

0031

(10.勝者モジュール間の関連付強度の算出)
本発明に係る情報処理装置は、相互に関連付けられている各モジュールのいずれもが、前記勝者モジュール決定手段により勝者モジュールとして決定された場合に、当該モジュール間の関連付強度を強くし、相互に関連付けられている各モジュールの一方のみが、前記勝者モジュール決定手段により勝者モジュールとして決定された場合に、当該モジュール間の関連付強度を弱くすることを特徴とするものである。

0032

このように、本発明においては、相互に関連付けられている各モジュールのいずれもが、前記勝者モジュール決定手段により勝者モジュールとして決定された場合に、当該モジュール間の関連付強度を強くし、相互に関連付けられている各モジュールの一方のみが、前記勝者モジュール決定手段により勝者モジュールとして決定された場合に、当該モジュール間の関連付強度を弱くするため、モジュール間の関連性が、必要に応じて強化、又は衰弱することで適切になり、最適なモジュラーネットワークを構築することができると共に、必要な関連性のみでネットワークを構築することができるという効果を奏する。

0033

(11.関連付けの存続期間
本発明に係る情報処理装置は、前記関連付強度が、当該関連付けの存続期間を示しており、関連付強度が弱くなるに連れて当該関連付けが減衰すると共に、最終的には消滅し、当該関連付強度が強くなると当該存続期間が初期値に戻ることを特徴とするものである。

0034

このように、本発明においては、関連付強度が、当該関連付けの存続期間を示しており、関連付強度が弱くなるに連れて当該関連付けが減衰すると共に、最終的には消滅し、当該関連付強度が強くなると当該存続期間が初期値に戻るため、不要な関連付けについては次第に減衰し、必要な関連付けのみが初期状態復活して存在することになり、モジュール間の関連性を適正にし、最適なモジュラーネットワークを構築することができるという効果を奏する。

0035

なお、上記存続期間はパスの寿命、活性度はモジュールのバイタリティとして捉えることができる。つまり、相互に関連付けられているモジュールのいずれのモジュールもバイタリティが高い場合には、その間の関連付けは若返り寿命が長くなる。しかし、一方のモジュールのバイタリティが低い場合には、次第にパスが衰退し、所定の期間(任意に設定可能とする)経過すると寿命が0になり消滅する。

0036

(12.環境地図獲得装置
本発明に係る環境地図獲得装置は、前記情報処理装置を用いた環境地図獲得装置であって、周囲の景色撮像し、画像データとして取得する画像取得手段と、当該画像データに基づいて形成されたモジュラーネットワークを環境地図として出力する環境地図出力手段とを備え、前記画像取得手段で取得された画像データを前記入力手段に入力データとして入力すると共に、前記モジュールが前記画像データに基づいて景色を学習するニューラルネットワークからなるものである。

0037

このように、本発明においては、前記情報処理装置を用いることで、入力された画像データから周囲の景色学習し、形成されたモジュラーネットワークを環境地図として出力するため、正確且つ容易に環境地図を取得することができると共に、対象となる環境が拡大した場合であってもモジュラーネットワークを併せて自己進化的に形成できるため、様々な環境の環境地図の作成を行うことができるという効果を奏する。

0038

(13.適応制御装置
本発明に係る適応制御装置は、前記情報処理装置を用いた適応制御装置であって、前記モジュールが適応制御の対象となる制御対象を制御する制御器及び当該制御対象の次時刻状態を予測する予測器として機能する構成とし、前記制御対象のパラメータデータを前記入力手段に入力データとして入力し、当該パラメータデータに適応する最適なモジュールを制御コントローラとして選択するものである。

0039

このように、本発明においては、前記情報処理装置を用いることで、入力された制御対象のパラメータデータから制御パラメータを学習し、制御器と予測器として機能するモジュールのモジュラーネットワークを構築して、制御対象に最適に適応するモジュールを制御コントローラとして選択するため、適応制御を正確且つ容易に行うことができると共に、制御対象が多様に変化したり、種類が増加してもモジュラーネットワークが自己進化的に形成されることで、様々な制御対象に対応することができるという効果を奏する。

0040

(14.並列処理装置
本発明に係る並列処理装置は、前記情報処理装置を用いた並列処理装置であって、前記モジュールが、相互に通信可能な機能を有する端末であり、前記関連付手段が、前記端末間の関連付けを公衆回線を用いて行い、当該関連付けられた端末間で、当該端末が学習すべき学習情報、及び当該端末が行う処理情報が相互に提供されることを特徴とするものである。

0041

このように、本発明においては、モジュールが、相互に通信可能な機能を有する端末であり、前記関連付手段が、前記端末間の関連付けを公衆回線を用いて行い、当該関連付けられた端末間で、当該端末が学習すべき学習情報、及び当該端末が行う処理情報が相互に提供されるため、関連付けられた端末間にのみ処理情報を提供することができ、公衆回線の通信量を最小限に抑えつつ、複数の端末で並列処理を行うことができるという効果を奏する。
また、モジュール間の関連付けが適切に行われることで、ネットワーク全体の機能を向上させて、処理を効率よく行うことができるという効果を奏する。

0042

さらに、ある任意の一の端末が故障した(又は動作しなくなった)場合であっても、当該一の端末に結合している他の端末で情報をやり取りすることができ、また、それでも処理できる端末が不足するような場合には、未結合の他の端末に接続することで柔軟に対応することができるという効果を奏する。

0043

これまで、本発明を装置として示したが、所謂当業者であれば明らかであるように本発明をシステム、方法、及び、プログラムとして捉えることもできる。これら前記の発明の概要は、本発明に必須となる特徴を列挙したものではなく、これら複数の特徴のサブコンビネーションも発明となり得る。

図面の簡単な説明

0044

モジュラーネットワークの概念を示す模式図である。
mnSOMの概念を示す模式図である。
ESOMの概念を示す模式図である。
SEEMの概念を示す模式図である。
第1の実施形態に係る情報処理装置のハードウェア構成図である。
第1の実施形態に係る情報処理装置のモジュール構成図である。
第1の実施形態に係る情報処理装置の動作を示すフローチャートである。
第2の実施形態に係る情報処理装置のモジュール構成図である。
第2の実施形態に係る情報処理装置の動作を示すフローチャートである。
自律移動ロボットにおける環境地図獲得の課題を示す図である。
適応制御の一例である倒立振子を示す図である。
SEEMの適応制御への応用を示す図である。
複数の端末で構成される並列処理システムの一例を示す図である。
シミュレーションを行った公園の模式図である。
図14の環境地図をロボットが獲得した結果を示す図である。
シミュレーションを行った環境の模式図である。
図16の環境地図をロボットが獲得した結果を示す図である。

符号の説明

0045

1情報処理装置
100モジュール
401 CPU
402 RAM
403 ROM
404フラッシュメモリ
405 HD
406LANカード
407マウス
408キーボード
409ビデオカード
409aディスプレイ
410サウンドカード
410aスピーカ
411ドライブ
500 入力データ
505入力処理
510誤差算出処理
515勝者モジュール決定処理
516 (第1)勝者モジュール決定処理部
517 第2勝者モジュール決定処理部
520誤差比較処理
525学習処理部
530 モジュール生成処理
535 関連付強度算出処理
540関連付処理部
541 第1勝者モジュール関連付処理部
542 第2勝者モジュール関連付処理部
543 勝者モジュール間関連付処理部
545 関連付強度更新処理
550モジュラーネットワーク
900 ロボット

発明を実施するための最良の形態

0046

以下、本発明の実施の形態を説明する。本発明は多くの異なる形態で実施可能である。従って、本実施形態の記載内容のみで本発明を解釈すべきではない。また、本実施形態の全体を通して同じ要素には同じ符号を付けている。

0047

本実施の形態では、主に装置について説明するが、所謂当業者であれば明らかな通り、本発明はシステム、方法、及び、コンピュータを動作させるためのプログラムとしても実施できる。また、本発明はハードウェアソフトウェア、または、ハードウェア及びソフトウェアの実施形態で実施可能である。プログラムは、ハードディスクCD−ROM、DVD−ROM、光記憶装置、または、磁気記憶装置等の任意のコンピュータ可読媒体に記録できる。さらに、プログラムはネットワークを介した他のコンピュータに記録することができる。
なお、以下の各実施形態において、パスとはモジュール間を接続するものであり、リンクとは、モジュールがパスにより接続された状態が形成されることを示す。

0048

(本発明の第1の実施形態)
(1.概要)
本実施形態に係る情報処理装置の概要について説明する。本実施形態に係る情報処理装置は、モジュラーネットワークの構成単位であるモジュールを自己進化的に増加または減少させてモジュラーネットワークを構築するものである。

0049

(1−1モジュラーネットワーク)
まず、モジュラーネットワークについて説明する。図1は、モジュラーネットワークの概念を示す模式図である。モジュラーネットワークは、ニューラルネットワークの一種であり、ネットワークの構成単位であるモジュールが複数集まって構成されている。1つのモジュールは単一の機能を持つニューラルネットワークで構成されており、モジュールの中身(ニューラルネットワーク)は設計者が行う処理に合わせて自由にデザインすることが可能である。例えば、物体を認識するモジュラーネットワークを構築したい場合は、100aが□(四角)を認識するニューラルネットワークのモジュール、100bが△(三角)を認識するニューラルネットワークのモジュールというように、単一の機能を持つニューラルネットワークを複数集めることで、全体として様々な形状の物体を認識することができるモジュラーネットワークを構築することができる。

0050

(1−2 mnSOM)
次に、上記モジュラーネットワークにSOMの概念を用いたmnSOMの概要を説明する。図2は、mnSOMの概念を示す模式図である。図に示すように、モジュールは格子状に配置されている。背景技術でも示したように、原理的には通常のSOMにおける各ユニットをMLPに置き換えたモジュラーネットワークである。このようなモジュラーネットワークにSOMと同じWTAによるモジュール間競合と近傍関数を導入し、各モジュールが実現する入出力関係の平滑化を行う。mnSOMにおいても、1つのモジュール100は単一の機能を持つニューラルネットワークで構成されており、モジュール100の中身(ニューラルネットワーク)は設計者が行う処理に合わせて自由にデザインすることが可能である。例えば、ロボットの環境認識を行うような場合には、ローカルエリアの環境を認識するニューラルネットワークを用い、制御処理を行うような場合には、制御器と予測器のペアをニューラルネットワークとして用い、パターン認識を行うような場合には、パターン認識器をニューラルネットワークとして用いることができる。

0051

(1−3ESOM)
次に、SOMの発展型であるESOMの概要を説明する。図3は、ESOMの概念を示す模式図である。ESOMはグラフの構造を持つネットワークを成長させることで観測データベクトルのトポロジーを表現することができる。これにより、入力の規模が未知であったり、トポロジーが変化しても対応することができる。また、オンライン学習のアルゴリズムであり観測データベクトルが入力される度に、ユニット(ノード)の追加あるいは学習、及びパスの構成が行われ、動的な環境における観測データベクトルの分類量子化が可能である。

0052

(1−4 SEEM)
本発明においては、上記ESOM、及びmnSOMをベースとしたSEEM(Self Evolving Modular Network)を提案する。図4は、SEEMの概念を示す模式図である。各モジュールはmnSOMのように格子状に配置されているわけではなく、モジュールの数を自己組織的に増やしたり減らしたりすることが可能である。また、類似(機能的な類似や時間的な類似)したモジュールはパスで結ばれ、当該モジュール間ではパスを伝って学習情報が相互に提供されるため、モジュール間の類似性や関連性を容易に見出すことができる。以下、SEEMを構築する情報処理装置の詳細について説明する。

0053

(2.構成)
(2−1ハードウェア構成)
図5は、本実施形態に係る情報処理装置のハードウェア構成図である。情報処理装置1は、CPU(Central Processing Unit)401、RAM(Random Access Memory)402、ROM(Read Only Memory)403、フラッシュメモリ(Flash memory)404、外部記憶装置であるHD(Hard disk)405、LAN(Local Area Network)カード406、マウス407、キーボード408、ビデオカード409、このビデオカード409と電気的に接続する表示装置であるディスプレイ409a、サウンドカード410、このサウンドカード410と電気的に接続する音出力装置であるスピーカ410a及びフレキシブルディスク、CD−ROM、DVD−ROM等の記憶媒体を読み書きするドライブ411からなる。
なお、上記ハードウェア構成はあくまで一例を示したものであり、構成要素の変更をすることができるのは当然である。

0054

(2−2モジュール構成及び機能)
図6は、本実施形態に係る情報処理装置のモジュール構成図である。情報処理装置1は、入力処理部505と、誤差算出処理部510と、勝者モジュール決定処理部515と、誤差比較処理部520と、学習処理部525と、モジュール生成処理部530と、関連付強度算出処理部535と、関連付処理部540と、関連付強度更新処理部545とを備える。

0055

入力処理部505は、入力データ500を、モジュラーネットワークを構築する全てのモジュール100に対して入力する処理を行う。各モジュール100は、入力されたデータに基づいて処理を行う。
誤差算出処理部510は、各モジュールで行われた入力データ500に対する処理の誤差(エラー)の値を算出する処理を行う。

0056

勝者モジュール決定処理部515は、誤差算出処理部510が算出した結果から、全てのモジュールの中で誤差が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定する処理を行う。

0057

誤差比較処理部520は、勝者モジュールの誤差の値と予め設定された閾値とを比較する処理を行う。このとき、勝者モジュールにおける誤差の中で、最小となる誤差の値と閾値とを比較する。

0058

学習処理部525は、誤差比較処理部520が比較した結果に基づいて(具体的には、勝者モジュールの誤差が予め設定された閾値以下の場合)、入力データ500に対する処理の誤差が小さくなるように各モジュールに対して学習の処理を行う。モジュール生成処理部530が新たに生成したモジュールについても、入力データ500に対応できるように十分な学習処理を行う。

0059

モジュール生成処理部530は、誤差比較処理部520が比較した結果に基づいて(具体的には、勝者モジュールの誤差が予め設定された閾値より大きい場合)、新たなモジュールを生成してモジュラーネットワークに追加する処理を行う。

0060

関連付強度算出処理部535は、モジュール間をリンクするパスの強度を算出する処理を行う。
関連付処理部540は、モジュール生成処理部530が生成した新たなモジュールと勝者モジュール決定処理部515が決定した勝者モジュールの間を、新たにパスでリンクする処理を行う。また、勝者モジュール間がパスでリンクされていなければ、当該モジュール間を新たにパスでリンクする処理を行う。

0061

関連付強度更新処理部545は、モジュール間をリンクするパスの強度を関連付強度算出処理部535が算出した強度の値に基づいて更新する処理を行う。
なお、上記関連付強度とは、パスの強さの度合いとして捉えてもよいが、ここでは、パスの寿命として捉える。パスの寿命とは、パスの存続期間であり、その存続期間を超えるとパスは消滅するが、存続期間内にパスが必要とされた場合には、存続期間が初期値に戻る(若返る)ようにしてもよい。

0062

(3.アルゴリズムと動作)
本実施形態に係るSEEMのアルゴリズムと情報処理装置の動作について説明する。図7は、本実施形態に係る情報処理装置の動作を示すフローチャートである。ここで、モジュールの数をKとし、閾値εに適当な値を設定しておく。学習の初期においてはK=1である。まず、全てのモジュールに対して入力Xを入力する(ステップS601)。入力Xに基づいて各モジュールが行った処理の誤差Ek(Ek:k番目のモジュールのエラー)を求める(ステップS602)。以下の式により、誤差Ekから勝者モジュールBMM(Best Matching Module)を決定する(ステップS603)。(1)式により、EKが最小となるk*が求められる。
なお、ここでは、勝者モジュール(BMM)として複数の勝者モジュール(BMM)が求められる。

0063

次式によりBMMの誤差が閾値εよりも大きいかどうかを判定し(ステップS604)、

0064

0065

BMMの誤差が閾値εよりも大きい場合は新たなモジュールを生成して追加する(ステップS605)。ここで追加するモジュールは入力データに対して十分に学習させたモジュールである。つまり、入力データに対して適切な処理を行うことができるモジュールを生成して追加する。そして、追加したモジュール(K+1番目のモジュール)とBMMとの間を新たにパスでリンクする(ステップS606)。リンクされたパスには学習情報(学習する権利と学習量)が流れ、追加したモジュールとBMM間で相互に学習情報が供給される。各モジュールは、供給された学習情報に基づいて学習処理を行う。つまり、入力されたデータについて、追加したモジュールだけではなく、BMMも学習を行うことで学習効率を高め、モジュール同士が相互に教え合いながら、困難な課題(入力データ)であっても学習することができる。また、パスは強度を持っており、パスの強度をSk,k+1とすると、Sk,k+1は以下の式で決定される。

0066

0067

式(3)において、βはパスの減衰パラメータである。βは設計者が任意に設定できる固定値であり、0.8程度の値を設定しておけばよい。akはk番目のモジュールの活性度を示しており、以下の式で求められる。

0068

0069

ここで活性度について説明する。式(4)より活性度は誤差Ekから算出され、Ekが0の時に活性度は1.0となる。Ekが大きくなればなるほど活性度は0に近い値となる。つまり、勝者モジュール(第1の勝者モジュール)は、全てのモジュールの中で最もEkが小さい値のモジュールであるため活性度は最も高い値となる。ここでは勝者モジュールにリンクされているモジュールについても同様に計算が行われる。また、Ekがεの範囲内にあるモジュールについては活性度が高めになり、Ekがεの範囲を超えるモジュールについては活性度が低めになる。

0070

フローチャートに戻って、モジュールを追加したのでK=K+1の計算をし、ステップS601に戻って、次の入力Xについて学習を行う。ステップS604においてBMMの誤差が閾値ε以下の場合は、BMM及びBMMにパスでリンクされているモジュールについて、入力Xに対して誤差が小さくなるように学習を行う(ステップS607)。ここでの学習も、上記と同様に、リンクしているモジュール間でパスを伝って学習情報が供給される。リンクしているモジュールは、供給された学習情報に基づいて学習処理を行う。つまり、入力されたデータについて、BMMだけではなく、BMMにパスでリンクされるモジュールについても学習を行うことで学習効率を高め、モジュール同士が相互に教え合いながら、困難な課題(入力データ)であっても学習することができる。

0071

なお、BMMにパスでリンクされているモジュール(第1リンクモジュールとする)にパスでリンクされているモジュール(第2リンクモジュールとする)についても、第1リンクモジュールに近づくように学習を行ってもよい。この場合の学習は近傍関数により行われ、BMMと直接的にパスでリンクされている第1リンクモジュールについては、学習量が多く、BMMからのパスの数が増えるにつれて学習量が減少するように、学習量が調整されてもよい。
モジュールについて学習が完了すると、BMMにリンクされているパスの強度を更新する(ステップS608)。パスの強度は次式により更新される。

0072

0073

ただし、kはBMMにリンクされているモジュールの番号に限る。ここでも式(4)と同様に減衰パラメータβと相互にパスでリンクされているそれぞれのモジュールの活性度からパスの強度を算出する。パスの強度が更新されたらステップS601に戻って、次の入力Xについて学習を行う。学習の回数を増やしていくと、モジュラーネットワーク550が構築される。

0074

入力データに対してモジュールの活性度が高い場合にはパスが強化されるが、モジュールの活性度が低い場合にはパスは減衰し、最終的には消滅する場合もある。全てのパスが消滅したモジュールについては、モジュール自体を消滅させてもよいし、残しておいてもよい。

0075

上述したように、ここでは、パスに寿命があるため、必要とされるパスについては存続し続けるが、不要であるパスについては消滅する。このとき、パスを流れる学習情報は、パスの強度には依存しない。つまり、パスが存続している間は、必要量の学習情報が必要に応じて供給され消滅した場合のみ一切の学習情報の供給が停止される。

0076

ここで、必要とされるパスとは、当該パスに接続される2つのモジュールの活性度の積により決まる。いずれのモジュールも活性度が高い、つまり入力データについての誤差が小さい場合は、必要なパスとしてパスの強度が更新されるため、存続期間がクリアされ(若返り)、パスが張られた初期状態に戻る。これは、例えば、パスに接続される2つのモジュールが、それぞれ誤差が最小である第1勝者モジュール、誤差が2番目に小さい第2勝者モジュールとして決定された場合等である。つまり、パスに接続されるそれぞれのモジュールにおける、入力データに対する誤差の大きさに基づいてパスの強度が更新される。

0077

なお、ステップS602で算出する誤差Ekは、モジュールの種別(環境認識、制御処理、パターン認識等)により算出方法が異なるが、いずれの場合であっても一般化した誤差Ekを算出することができる。

0078

また、本実施形態に係る情報処理装置において、図6の学習処理部525と、モジュール生成処理部530と、関連付強度算出処理部535と、関連付処理部540と、関連付強度更新処理部545は必須の構成要素ではなく、これらの構成要素または構成要素の組み合わせを任意に備えるようにしてもよい。同様に、図7のステップS606ないしステップS608の処理は必須の処理ではなく、装置の構成に対応して処理を行うようにしてもよい。

0079

このように、本実施形態に係る情報処理装置によれば、モジュラーネットワークに対して入力データが入力された場合に、そのデータに対して処理を行った場合の誤差が最小のモジュールから順次複数のモジュールを勝者モジュールとして決定し、勝者モジュールの誤差が所定の閾値以上であれば、新たなモジュールを生成するため、モジュラーネットワークにおけるモジュールを自己進化的に増加させることができ、設計者が予めモジュールの数を設定する必要がなくなるため、設計者の負担を軽減することができる。

0080

また、処理の過程で環境が変化したような場合であっても、モジュールの数を必要な時に必要な数だけ追加することができるため、様々な環境やその変化に対応してモジュラーネットワークを構築することができる。

0081

さらに、各モジュールは、特定の機能を有するニューラルネットワークからなるため、構築されるモジュラーネットワーク全体としては、多数のニューラルネットワークのモジュールが並列的に並んだネットワークとなり、1つのモジュールが1つの関数を実現し、未知の関数を学習ことができるため、適用できる対象が増大し、応用範囲を飛躍的に広げることができる。

0082

さらにまた、モジュール生成手段が生成した新たなモジュールと勝者モジュール決定手段が決定した勝者モジュールとの間で相互に関連付けを行うことで、モジュール間の関係性を自己組織的に見出すことができるため、様々な処理に対応することができる。例えば、関連付けを時間的な観点で行えば処理を行った順にモジュールを関連付けることができ、類似という観点で行えば類似しているモジュール同士を関連付けることができる。このようにモジュールの関連付けを自己組織的に行うことで、モジュラーネットワーク自体で環境地図を表現することができたり、ロボットの動作を制御する場合において、制御の受け渡しをモジュール間でスムーズに行うことができるようになる。

0083

さらにまた、関連付けが行われたモジュール間には、相互に学習情報が供給されて学習するため、勝者となったモジュールだけではなく、その周辺の関連付けられたモジュールも入力データに対して学習を行うことができ、与えられた課題(入力)に対して強くなることができる。

0084

さらにまた、関連付けにより学習情報が相互に供給されることで、困難な課題であっても、モジュール同士が相互に教え合いながら学習することができるため、学習効率を格段に高めることができる。

0085

さらにまた、関連付けられたモジュール間で、相互に供給される前記学習情報の学習量が、当該関連付けられたモジュールの誤差に基づいて算出される活性度に応じて供給されるため、入力データに応じて、適切な量の学習情報が供給され、安定した学習を行うことができる。

0086

さらにまた、新たなモジュールの生成を行わない場合に、所定のモジュールについて入力データの誤差が小さくなるように学習処理を行うため、最適なモジュラーネットワークの構築を行うことができる。

0087

さらにまた、全てのモジュールのうち勝者モジュールと関連付けが行われたモジュールについて学習処理を行うため、従来のように全てのモジュールについて学習処理を行わず、局所的に学習処理が行われることで処理を軽減することができる。

0088

さらにまた、入力データとの誤差が最小となる勝者モジュールと順次関連付けが行われたモジュールについて学習処理を行う場合に、順次関連付けられた複数のモジュール相互間の世代に応じて学習量を調整する場合は、勝者モジュールとの関連性に応じた量の学習を行うことができ、最適なモジュラーネットワークを構築することができる。

0089

さらにまた、モジュール間の関連付けの強度を示す関連付強度を算出し、算出された関連付強度に基づいて、関連付けの処理及び関連付けの更新が行われるため、モジュール間の関連性が適正になり、最適なモジュラーネットワークを構築することができる。

0090

さらにまた、算出された誤差に基づいて相互に関連付けられている各モジュールの活性度を算出し、その活性度に応じて関連付強度を算出して更新するため、関連性が強いモジュール間のパスは強化され、関連性が弱いモジュール間のパスは衰退し消滅する。つまり、モジュール間の関連性が適切になり、最適なモジュラーネットワークを構築することができると共に、モジュール間の不要な関連性が消滅し、必要な関連性のみでネットワークを構築することができる。

0091

さらにまた、相互に関連付けられている各モジュールのいずれもが、勝者モジュールとして決定された場合に、当該モジュール間の関連付強度を強くし、相互に関連付けられている各モジュールの一方のみが、勝者モジュールとして決定された場合に、当該モジュール間の関連付強度を弱くするため、モジュール間の関連性が、必要に応じて強化、又は衰弱することで適切になり、最適なモジュラーネットワークを構築することができると共に、必要な関連性のみでネットワークを構築することができる。

0092

さらにまた、関連付強度が、当該関連付けの存続期間を示しており、関連付強度が弱くなるに連れて当該関連付けが減衰すると共に、最終的には消滅し、当該関連付強度が強くなると当該存続期間が初期値に戻るため、不要な関連付けについては次第に減衰し、必要な関連付けのみが初期状態に復活して存在することになり、モジュール間の関連性を適正にし、最適なモジュラーネットワークを構築することができる。

0093

(本発明の第2の実施形態)
以下に、本実施形態に係る情報処理装置について説明するが、第1の実施形態と重複する説明については省略する。
(1.構成)
(1−1ハードウェア構成)
本実施形態に係る情報処理装置のハードウェア構成は第1の実施形態と同様であるため説明は省略する。

0094

(1−2モジュール構成及び機能)
図8は、本実施形態に係る情報処理装置のモジュール構成図である。第1の実施形態と異なる点は、勝者モジュール決定処理部515に、第1勝者モジュール決定処理部516と第2の勝者モジュール決定処理部517とを備え、関連付処理部540に、第1勝者モジュール関連付処理部541と第2勝者モジュール関連付処理部542と勝者モジュール間関連付処理部543とを備えている点である。

0095

第1勝者モジュール決定処理部516は、誤差が最小となるモジュールを第1勝者モジュールとして決定する処理を行う。
第2勝者モジュール決定処理部517は、第1勝者モジュール決定処理部516が決定した第1勝者モジュールに次いで誤差が小さいモジュールを第2勝者モジュールとして決定する処理を行う。

0096

第1勝者モジュール関連付処理部541は、モジュール生成処理部530で生成された新たなモジュールと第1勝者モジュール決定処理部516が決定した第1勝者モジュールをパスでリンクする処理を行う。

0097

第2勝者モジュール関連付処理部542は、モジュール生成処理部530で生成された新たなモジュールと第2勝者モジュール決定処理部517が決定した第2勝者モジュールをパスでリンクする処理を行う。

0098

勝者モジュール間関連付処理部543は、第1勝者モジュールと第2勝者モジュールがパスでリンクされていない場合に、新たにパスでリンクする処理を行う。
入力処理部505、誤差算出処理部510、誤差比較処理部520、学習処理部525、モジュール生成処理部530、関連付強度算出処理部535、関連付強度更新処理部545の機能は第1の実施形態と同様であるため説明は省略する。

0099

(2.アルゴリズムと動作)
本実施形態に係るSEEMのアルゴリズムと情報処理装置の動作について説明する。図9は、本実施形態に係る情報処理装置の動作を示すフローチャートである。ここで、モジュールの数をKとし、閾値εに適当な値を設定しておく。学習の初期においてはK=1である。ステップS601、ステップS602の処理は第1の実施形態と同様であるため説明は省略する。モジュールごとに誤差Ek(Ek:k番目のモジュールのエラー)が求められると、以下の式により、誤差Ekから第1勝者モジュールBMM1と第2勝者モジュールBMM2を決定する(ステップS603a)。

0100

0101

ステップS604、ステップS605の処理は第1の実施形態と同様であるため説明は省略する。新たなモジュールが追加されると、追加されたモジュール(K+1番目のモジュール)、BMM1及びBMM2の間を新たにパスでリンクする(ステップS606a)。ここでも、第1の実施形態の場合と同様に、リンクされたパスには学習情報が流れ、モジュール間で相互に学習情報が供給される。パスは強度を持っており、パスの強度をSk,k+1とすると、それぞれのパスの強度Sk,k+1は以下の式で決定される。

0102

0103

式(7)において、βはパスの減衰パラメータである。akはk番目のモジュールの活性度を示しており、式(4)で求められる。また、ここでは第1勝者モジュールBMM1と第2勝者モジュールBMM2の間がパスでリンクされていない場合は、BMM1とBMM2の間も新たなパスでリンクされる。K=K+1として、ステップS601に戻って、次の入力Xについて学習を行う。ここでの学習も、上記と同様に、リンクしているモジュール間で相互に学習情報が供給され、供給された学習情報に基づいて学習処理を行う。ステップS607、ステップS608の処理は第1の実施形態と同様であるため説明は省略する。

0104

また、第1の実施形態と同様に、入力データに対してモジュールの活性度が高い場合にはパスが強化されるが、モジュールの活性度が低い場合にはパスは減衰し、最終的には消滅する場合もある。全てのパスが消滅したモジュールについては、モジュール自体を消滅させてもよいし、残しておいてもよい。

0105

さらに第1の実施形態と同様に、パスに寿命があるため、必要とされるパスについては存続し続けるが、不要であるパスについては消滅する。このとき、パスを流れる学習情報は、パスの強度には依存しない。つまり、パスが存続している間は、必要量の学習情報が必要に応じて供給され消滅した場合のみ一切の学習情報の供給が停止される。

0106

ここで、必要とされるパスとは、当該パスに接続される2つのモジュールの活性度の積により決まる。いずれのモジュールも活性度が高い、つまり入力データについての誤差が小さい場合は、必要なパスとしてパスの強度が更新されるため、存続期間がクリアされ(若返り)、パスが張られた初期状態に戻る。これは、例えば、パスに接続される2つのモジュールが、それぞれ第1勝者モジュール、及び第2勝者モジュールとして決定された場合等である。つまり、パスに接続されるそれぞれのモジュールにおける、入力データに対する誤差の大きさに基づいてパスの強度が更新される。

0107

なお、第1の実施形態と同様にステップS602で算出する誤差Ekは、モジュールの種別(環境認識、制御処理、パターン認識等)により算出方法が異なるが、いずれの場合であっても一般化した誤差Ekを算出することができる。

0108

また、本実施形態に係る情報処理装置において、図8の学習処理部525と、モジュール生成処理部530と、関連付強度算出処理部535と、(第1勝者モジュール)関連付処理部540と、第2勝者モジュール関連付処理部541と、モジュール間関連付処理部542、関連付強度更新処理部545は必須の構成要素ではなく、これらの構成要素または構成要素の組み合わせを任意に備えるようにしてもよい。同様に、図9のステップS606ないしステップS608の処理は必須の処理ではなく、装置の構成に対応して処理を行うようにしてもよい。

0109

さらにまた、本実施形態においては第1勝者モジュールと第2勝者モジュールの決定を行ったが、第n勝者モジュールまで決定するようにしてもよい。その場合、nの値は設計者が任意に設定できるようにしてもよい。nの値を大きくすることで、モジュール間をリンクするパスがきめ細かくなり、ネットワークの構成を細かくして複雑な処理にも対応することができる。しかし、nの値を大きくしすぎることで、ネットワークの構成が複雑になりすぎる可能性があるため、望ましくはn=2がよい。

0110

このように、本実施形態に係る情報処理装置によれば、入力データにおける誤差の値が最も小さいモジュールを第1の勝者モジュールとして決定し、当該入力データにおける誤差の値が2番目に小さいモジュールを第2の勝者モジュールとして決定し、新たに生成されたモジュールと各勝者モジュールの関連付けが行われるため、新たに生成されたモジュールの関連性をより正確に表現することができ、最適なモジュラーネットワークを構築することができる。

0111

(その他の実施形態)
(1.応用例)
(1−1.環境地図の獲得)
本発明に係る情報処理装置は、例えば、自律移動ロボットにおける環境地図の獲得のような環境地図獲得装置として応用することができる。図10は、自律移動ロボットにおける環境地図獲得の課題を示す図である。図10(a)は、ロボット900と、そのロボット900が獲得する環境地図の環境(ここでは、公園の環境とする)である。ロボット900が公園内を動き回り、学習しながら環境地図を獲得する。環境地図を獲得することでロボットの自己推定位置経路計画障害物位置推定、他のロボットに位置推定などが可能となる。

0112

図10(b)は、獲得する地図の種類を示している。図10(b)の左の地図は、メトリック地図(定量的幾何学表現)であり、右の地図はトポロジカル地図位相幾何学表現)である。メトリック地図は、障害物の位置等が詳細に記述された地図であり、センサ情報から障害物やロボットの座標や方向を計算するためのモデルを設計者側で事前に用意する必要がある。一方、トポロジカル地図は、ノードとリンクで抽象化された地図であり、ノードは特定の場所(ランドマーク)を示し、リンクはノード間の移動情報を示す。この地図の場合は、定量的なセンサ情報や物理モデルを必要としないため、計算量や設計者側の労力を軽減することができる。

0113

SEEMにより、環境地図を獲得する場合は、モジュールにより特定位置の環境を想起し(方位、座標の推定)、パスによりモジュール間の位置情報、移動手段等を示すことで、視覚情報から自己組織的に地図獲得を行うことができる。ロボットは、移動しながら視覚情報を定期的に取得し、当該取得した視覚情報に基づいて風景が変化したと判断したら(入力された視覚情報における勝者モジュールの誤差が閾値εを超えたら)、新たなモジュールを生成して追加する。最初は1つのモジュールからスタートし、ロボットの移動動作に応じて、取得する視覚情報が増加し、風景が変化したと判断した場合にモジュールの数を増加させてモジュラーネットワークを構築する。追加された新たなモジュールは、勝者モジュールとパスで関連付けられ、パスを学習情報が伝わることで相互に学習することができる。つまり、1つのモジュールが局所的な景色情報を表現し、各モジュールがパスでリンクされることで、ネットワークが構築され、当該ネットワークで全体の景色情報を表現することができる。また、視覚情報のみからロボットの位置や向いている方向を割り出すことができ、モジュールの数を増減させることができるため、環境の変化にロバストである。例えば、公園の外まで環境を広げたい場合には、モジュールの数を増加させることで対応することができる。また、パスの設定により、一連のロボットの移動動作を環境に対応させてスムーズに行うことも可能となる。

0114

このように、本実施形態に係る環境地図獲得装置においては、前記各実施形態に係る情報処理装置を応用することで、入力された画像データから周囲の景色学習し、形成されたモジュラーネットワークを環境地図として出力するため、正確且つ容易に環境地図を取得することができると共に、対象となる環境が拡大した場合であってもモジュラーネットワークを併せて自己進化的に形成できるため、様々な環境の環境地図の作成を行うことができる。

0115

(1−2.適応制御)
本発明に係る情報処理装置は、例えば、適応制御装置として応用することができる。図11は、適応制御の一例である倒立振子を示す図である。図11(a)は、ロボット900が手の上でほうき倒立させており、図11(b)は、ロボット900が手の上でバットを倒立させており、図11(c)は、ロボット900が手の上でを倒立させている様子を示している。このように、振子の長さや重さといった制御対象のパラメータが変わっても適応的に制御させることができるように学習を行う。

0116

図12は、SEEMの適応制御への応用を示す図である。ロボット900は振子の振動を予測しながら最適なコントローラ(モジュール)を選択する。モジュラーネットワークにおける各モジュールは制御対象のパラメータに応じた制御器及び予測器のペアを学習により獲得し、予測器により振子の振動を予測する。全てのモジュールの中で最も予測誤差が小さい予測器とペアになっている制御器により振子の制御を行う。SEEMにより適応制御を行う場合は、まず、1つのモジュールからスタートし、ある一の振子を学習させる。モジュールはその振子に対応できるように学習する。そして新しい振子を学習させ、従来のモジュールで対応できなければ(予測誤差が閾値εを超える場合は)新たなモジュールを生成して追加し、そのモジュールは新しい振子に対応できるように学習する。つまり、従来のmnSOMでは、振子情報の規模を予め予測し、ユニット数とネットワークの幾何学的な構造(トポロジー)を適切に見積もらなければならなかったが、SEEMにおいては、未知の振子に対しても自己組織的に新たなモジュールを生成して学習を行うことで対応することができる。

0117

また、パスによりロボット制御の一連の動作をスムーズに行うことができるようになる。例えば、下向きに振子を持った状態から図11のように手の上に振子を倒立させる一連の動作では、振子を振る制御器、振子を上方へ回転する制御器、振子を倒立させる制御器というように一連の動作で瞬時に制御器を変更させる必要がある。このような場合に、一連の動作における制御器の関連付けを行うことで、スムーズな動作を実現させることが可能となる。

0118

このように、本実施形態に係る適応制御装置においては、前記各実施形態に係る情報処理装置を応用することで、入力された制御対象のパラメータデータから制御パラメータを学習し、制御器と予測器として機能するモジュールのモジュラーネットワークを構築して、制御対象に最適に適応するモジュールを制御コントローラとして選択するため、適応制御を正確且つ容易に行うことができると共に、制御対象が多様に変化したり、種類が増加してもモジュラーネットワークが自己進化的に形成されることで、様々な制御対象に対応することができる。

0119

(1−3.並列処理装置)
本発明に係る情報処理装置は、例えば、並列処理装置として応用することができる。図13は、複数の端末で構成される並列処理システムの一例を示す図である。各端末は、それぞれが分業して情報処理を行い、相互に公衆回線を通じて通信を行うことができる。各端末は、例えばPoint−to−Point ProtocolやPeer to Peerにより接続されている。

0120

上記各実施形態の場合と同様に、端末間はパス(公衆回線)でリンクされており、パスを伝って学習情報が流れる。未知の課題が生じた場合には、新たな端末を追加し、勝者モジュールとして選択された端末との関連付けが行われる。関連付けが行われた端末間は、相互に学習情報をやり取りすることで、機能を向上させ、効率よく処理を分業することができる。

0121

このように、本実施形態に係る並列処理装置によれば、ネットワークを構成するモジュールが、相互に通信可能な機能を有する端末であり、前記関連付手段が、前記端末間の関連付けを公衆回線を用いて行い、当該関連付けられた端末間で、当該端末が学習すべき学習情報、及び当該端末が行う処理情報が相互に提供されるため、関連付けられた端末間にのみ処理情報を提供することができ、公衆回線の通信量を最小限に抑えつつ、複数の端末で並列処理を行うことができる。また、モジュール間の関連付けが適切に行われることで、ネットワーク全体の機能を向上させて、処理を効率よく行うことができる。さらに、ある任意の一の端末が故障した(又は動作しなくなった)場合であっても、当該一の端末に
結合している他の端末で情報をやり取りすることができ、また、それでも処理できる端末が不足するような場合には、未結合の他の端末に接続することで柔軟に対応することができる。

0122

以上の前記各実施形態により本発明を説明したが、本発明の技術的範囲は実施形態に記載の範囲には限定されず、これら各実施形態に多様な変更又は改良を加えることが可能である。そして、かような変更又は改良を加えた実施の形態も本発明の技術的範囲に含まれる。このことは、特許請求の範囲及び課題を解決する手段からも明らかなことである。

0123

本発明に係る情報処理装置を用いて環境地図の獲得のシミュレーションを行った。
(1.条件)
地図獲得は公園環境下で行った。図14は、シミュレーションを行った公園の模式図である。図14中の曲線1200はロボットが動いたルートである。ロボットには前方向のカメラが取り付けられており、風景の撮像しながらその景色と方向を学習する。

0124

(2.結果)
図15は、図14の環境地図をロボットが獲得した結果を示す図である。図中の丸はモジュールで、モジュール間を結ぶ線がパスである。図15(a)は、時間空間で近いモジュール間(時間的に短いモジュール間)をパスで結んだ結果を示し、図15(b)は、データ空間で近いモジュール間(機能的に類似するモジュール間)をパスで結んだ結果を示している。モジュール21ないし27にはモジュールが密集している。これは、図14看板1210に描かれた文字により頻繁に景色が変わったと認識しているため、このようにモジュールが多く生成されている。ここで例えば、閾値εの値を少し大きく設定すれば、モジュールを生成する数を抑えることができる。逆にモジュール6ないし8は看板1210の裏側になり、景色の変化が少ないため新たなモジュールはあまり生成されていない。

0125

時間空間で近いモジュール間をパスで結ぶ場合は、ロボットが移動した経路に沿って時系列でパスが結ばれる。つまり、生成した新たなモジュールと時間的に短いモジュールとがパスで結ばれる。例えば、モジュール9ないし20については、モジュール番号順にパスで結ばれているが、これはロボットがモジュール順番通りに移動し、時間的に短いモジュール間がパスで結ばれるためである。

0126

データ空間で近いモジュール間をパスで結ぶ場合は、近い景色を持つモジュール間がパスで結ばれる。例えば、モジュール9と20や10と19などは、それぞれ異なる位置から景色を撮像しているが、図14からわかるようにそれぞれの位置において、同じような木製の壁や4つの球体が撮像され、景色が類似していると思われるモジュール間がパスで結ばれている。

0127

上記結果から、SEEMにより自己進化的にモジュールを増加して、環境地図を獲得することができることがわかる。また、モジュール間の関連性も自己組織的に構築することができ、状況に応じたモジュラーネットワークの構築が可能であることがわかる。さらに、入力された撮像データから、ロボットがどこで何れの方角を向いているのかを容易に算出することができる。

0128

実施例1と同様に環境地図の獲得のシミュレーションを行った。
(1.条件)
図16は、シミュレーションを行った環境の模式図である。図16中の曲線1400はロボットが動いたルートである。ロボットには前方向のカメラが取り付けられており、風景の撮像しながら学習を行う。ロボットが移動する領域は、六角形区画されており、それぞれの壁の色が「緑」、「青」、「黄」、「橙」、「水色」、及び「赤」となっている。

0129

(2.結果)
図17は、図16の環境地図をロボットが獲得した結果を示す図である。図中の丸はモジュールで、モジュール間を結ぶ線がパスである。図17(a)は、時間空間で近いモジュール間をパスで結んだ結果を示し、図17(b)は、データ空間で近いモジュール間をパスで結んだ結果を示している。

0130

図17(a)については、図15(a)の場合と同様に、ロボットが移動した経路に沿って時系列でパスが結ばれる。つまり、生成した新たなモジュールと時間的に短いモジュールとがパスで結ばれる。ここでは、内側に生成されているモジュールについては、パスで結ばれていない。これは、パスが時間の経過と共に強度が減少し、長らく通過していない経路についてはパスが消滅するためである。つまり、内側にあるモジュールにパスが結ばれていないのは、しばらくの間、ロボットが内側を移動せず通路の端を移動したためである。このように、パスには寿命があり、ある期間以上必要とされないパスについては、寿命が減り、最終的には消滅してしまう。

0131

なお、上述したように、パスで結ばれていないモジュールについては、消滅させても残存させてもよい。消滅させることで、装置の資源を節約することができる。また、残存させることで、再び学習処理を行うことで、ネットワークを構築しやすくなる。

0132

図17(b)については、図15(a)の場合と同様に、近い景色を持つモジュール間がパスで結ばれる。図16において、それぞれの壁の色が「緑」、「青」、「黄」、「橙」、「水色」、及び「赤」となっているため、同一色の壁を撮像している場合は、近い景色となりモジュール間がパスで結ばれる。例えば、モジュール34とモジュール49やモジュール33とモジュール48がパスで結ばれているように、撮像した場所や時間が離れていても景色が近いためパスで結ばれている。

0133

このように、実施例1と同様に、SEEMにより自己進化的にモジュールを増加して、環境地図を獲得することができることがわかる。また、モジュール間の関連性も自己組織的に構築することができ、状況に応じたモジュラーネットワークの構築が可能であることがわかる。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

該当するデータがありません

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

この 技術と関連性が強い技術

該当するデータがありません

この 技術と関連性が強い法人

該当するデータがありません

この 技術と関連性が強い人物

該当するデータがありません

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ