図面 (/)

技術 機械学習装置

出願人 株式会社メガチップス
発明者 西行健太藤吉弘亘
出願日 2015年3月30日 (6年1ヶ月経過) 出願番号 2015-070128
公開日 2016年11月10日 (4年6ヶ月経過) 公開番号 2016-191975
状態 特許登録済
技術分野 学習型計算機
主要キーワード 特徴抽出画像 評価結果データ 信頼度計算 サンプルグループ 競合値 like特徴 人物検出装置 事前学習
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年11月10日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

課題

事前ドメイン転移学習に有効であるかを精度よく判断することができる技術を提供することを課題とする。

解決手段

機械学習装置100において、取得部11は、目標ドメイン21と、転移学習の有効性判断対象として指定された事前ドメイン22とを記憶装置から取得する。目標ドメイン21は、各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む。事前ドメイン22は、所定の条件と異なる条件下における検出対象の特徴を有するデータを含む。試行転移学習部12は、取得部11により取得された目標ドメイン21及び事前ドメイン22を用いて転移学習を導入した機械学習を実行して、検出対象の検出に用いられる決定木を生成する。判断部14は、試行転移学習部12により生成された決定木を構成する全てのリーフノードを用いて、事前ドメイン22が転移学習に有効であるか否かを判断する。

概要

背景

画像データからの人物検出や、センサによる計測データの解析などに機械学習が用いられている。

例えば、監視カメラにより撮影された画像から人物を検出する場合、機械学習装置が、検出対象の人物を撮影した複数の学習サンプルの各々の特徴を学習し、学習した特徴を反映した識別用特徴データを生成する。人物検出装置は、機械学習装置により生成された識別用特徴データを用いて、監視カメラにより撮影された画像から人物を検出する。

監視カメラの設置環境が学習サンプルを収集する環境と異なる場合、監視カメラにより撮影される人物の見え方は、学習サンプルに含まれる人物の見え方と異なる。つまり、監視カメラにより撮影される人物の特徴が、学習サンプルに含まれる人物の特徴と異なる。従って、監視カメラにより生成された画像から人物を検出する際に、学習サンプルから生成された識別用特徴データを用いた場合、人物の検出精度が低下する。人物の検出精度を向上させる場合、カメラの設置環境に合わせて、膨大な数の学習サンプルを準備しなければならず、コストが増大する。

そこで、転移学習を導入した機械学習の手法が提案されている。転移学習は、学習サンプルの収集環境と異なる環境から得られた検出対象のサンプルを事前に学習し、事前学習により得られた検出対象の特徴を、学習サンプルの学習結果に適用(転移)させる手法である。また、学習サンプルの数を抑制することができるため、識別用特徴データを生成するためのコストを低減することができる。例えば、非特許文献1には、転移学習を導入した機械学習のアルゴリズムとして、転移学習を導入したランダムフォレストが開示されている。

特許文献1には、ニューラルネットワークに転移学習を適用した属性識別器が開示されている。特許文献1に係る属性識別器は、第1のクラスの属性を第2のクラスの属性として利用可能である場合、第1のクラスの属性を第2のクラスに転移させる。

概要

事前ドメインが転移学習に有効であるかを精度よく判断することができる技術を提供することを課題とする。機械学習装置100において、取得部11は、目標ドメイン21と、転移学習の有効性判断対象として指定された事前ドメイン22とを記憶装置から取得する。目標ドメイン21は、各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む。事前ドメイン22は、所定の条件と異なる条件下における検出対象の特徴を有するデータを含む。試行転移学習部12は、取得部11により取得された目標ドメイン21及び事前ドメイン22を用いて転移学習を導入した機械学習を実行して、検出対象の検出に用いられる決定木を生成する。判断部14は、試行転移学習部12により生成された決定木を構成する全てのリーフノードを用いて、事前ドメイン22が転移学習に有効であるか否かを判断する。

目的

本発明の目的は、事前ドメインが転移学習に有効であるかを精度よく判断することができる技術を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む目標ドメインと、前記所定の条件と異なる条件下における検出対象の特徴を有する学習候補データを含む事前ドメインとを取得する取得部と、前記取得部により取得された目標ドメイン及び事前ドメインを用いて転移学習を導入した機械学習を実行して、前記検出対象の検出に用いられる決定木を生成する試行転移学習部と、前記試行転移学習部により生成された決定木を構成する全てのリーフノードを用いて、前記取得部により取得された事前ドメインが転移学習に有効であるか否かを判断する判断部と、を備える機械学習装置

請求項2

請求項1に記載の機械学習装置であって、前記判断部は、前記試行転移学習部により生成された決定木を構成する各リーフノードの深さを積算することにより決定木の複雑度を計算し、計算した複雑度に基づいて前記事前ドメインを転移学習に用いるか否かを判断する複雑度計算部、を備える機械学習装置。

請求項3

請求項2に記載の機械学習装置であって、前記試行転移学習部は、第1決定木と前記第1の決定木と異なる第2決定木とを生成し、前記複雑度計算部は、前記第1決定木の複雑度と前記第2決定木の複雑度と計算し、計算した前記第1決定木の複雑度と前記第2決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する機械学習装置。

請求項4

請求項1ないし請求項3のいずれかに記載の機械学習装置であって、さらに、前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データ分類し、前記試行転移学習部により生成された決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、を備え、前記判断部は、前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とに基づいて、前記事前ドメインが有効であるか否かを判断する機械学習装置。

請求項5

請求項4に記載の機械学習装置であって、前記判断部は、学習用データが到達した前記決定木のリーフノードの確率分布と、各学習候補データが到達した前記決定木のリーフノードの確率分布との分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する分布相違度計算部、を備える機械学習装置。

請求項6

請求項5に記載の機械学習装置であって、前記試行転移学習部は、第1決定木と前記第1決定木と異なる第2決定木とを生成し、前記分布相違度計算部は、前記第1決定木を用いて第1分布相違度を計算し、前記第2決定木を用いて第2分布相違度を計算し、前記判断部は、前記分布相違度計算部により計算された第1分布相違度及び第2分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する機械学習装置。

請求項7

請求項2に記載の機械学習装置であって、前記試行転移学習部は、生成した前記決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、生成した前記決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、を含み、前記判断部は、前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とを比較し、比較結果と、前記決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する転移評価部、を備える機械学習装置。

請求項8

各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、を備える機械学習方法

請求項9

転移学習をコンピュータに実行させるプログラムであって、各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、を実行させるプログラム。

技術分野

0001

本発明は、転移学習を用いて検出対象パターンを学習する機械学習装置に関する。

背景技術

0002

画像データからの人物検出や、センサによる計測データの解析などに機械学習が用いられている。

0003

例えば、監視カメラにより撮影された画像から人物を検出する場合、機械学習装置が、検出対象の人物を撮影した複数の学習サンプルの各々の特徴を学習し、学習した特徴を反映した識別用特徴データを生成する。人物検出装置は、機械学習装置により生成された識別用特徴データを用いて、監視カメラにより撮影された画像から人物を検出する。

0004

監視カメラの設置環境が学習サンプルを収集する環境と異なる場合、監視カメラにより撮影される人物の見え方は、学習サンプルに含まれる人物の見え方と異なる。つまり、監視カメラにより撮影される人物の特徴が、学習サンプルに含まれる人物の特徴と異なる。従って、監視カメラにより生成された画像から人物を検出する際に、学習サンプルから生成された識別用特徴データを用いた場合、人物の検出精度が低下する。人物の検出精度を向上させる場合、カメラの設置環境に合わせて、膨大な数の学習サンプルを準備しなければならず、コストが増大する。

0005

そこで、転移学習を導入した機械学習の手法が提案されている。転移学習は、学習サンプルの収集環境と異なる環境から得られた検出対象のサンプルを事前に学習し、事前学習により得られた検出対象の特徴を、学習サンプルの学習結果に適用(転移)させる手法である。また、学習サンプルの数を抑制することができるため、識別用特徴データを生成するためのコストを低減することができる。例えば、非特許文献1には、転移学習を導入した機械学習のアルゴリズムとして、転移学習を導入したランダムフォレストが開示されている。

0006

特許文献1には、ニューラルネットワークに転移学習を適用した属性識別器が開示されている。特許文献1に係る属性識別器は、第1のクラスの属性を第2のクラスの属性として利用可能である場合、第1のクラスの属性を第2のクラスに転移させる。

0007

特開2012−84117号公報

先行技術

0008

”Boosted Random Forest and Transfer Learning”, [online], [平成27年3月26日検索],インターネット
Xiaoxiao Shi, Wei Fan, Jiangtao Ren, ”Actively Transfer Domain Knowledge”, [online], [平成27年3月1日検索],インターネットPAPERS/ecml08transfer.pdf>

発明が解決しようとする課題

0009

しかし、転移学習を用いた場合、負の転移と呼ばれる現象が起こることが知られている。負の転移とは、転移学習のために事前に学習する事前ドメインが、目標ドメインに含まれるデータと大きく異なるデータを含んでいることにより、学習の精度が低下する現象である。目標ドメインは、監視カメラにより撮影された画像から人物を検出する場合には、監視カメラの設置環境に合わせて生成された学習サンプルの集合である。事前ドメインは、監視カメラの設置環境と異なる環境で生成された学習サンプルの集合である。

0010

負の転移の発生を防止するためには、事前ドメインに含まれるサンプルの特徴が、目標ドメインに含まれる学習サンプルの特徴と大きく異なるか否かを判断すればよい。しかし、転移学習に用いられるデータの数は膨大であるため、事前ドメインに含まれるデータを1つずつ人間の手で確認することは困難である。

0011

特許文献1には、転移学習に用いるデータを事前ドメインに含めるか否かを判断する方法が開示されていない。

0012

非特許文献2には、事前ドメインが転移学習に有効であるか否かを判断する方法が開示されている。具体的には、非特許文献2に係る方法は、3つの基準より事前ドメインの信頼性を求めている。1つ目の基準は、事前ドメインのみを用いて学習した識別器(事前識別器)と、事前ドメインと目標ドメインとを用いた転移学習を行う識別器(転移識別器)とにサンプルデータをそれぞれ入力する。サンプルデータに対する事前識別器による識別結果が転移識別器による識別結果と同じである場合、この事前ドメインは、転移学習に有効であると判断される。2つ目の基準は、目標ドメインに含まれるデータの数である。目標ドメインに含まれるデータの数が予め設定された基準値よりも少ない場合、転移学習を実行してもその有効性が低いと判断される。3つ目の基準は、転移識別器から出力される確度である。転移識別器から出力される確度が、予め設定された確度の基準値よりも大きい場合、転移識別器の信頼性が高く、転移学習に有効であると判断される。

0013

しかし、非特許文献2に係る方法では、もともと信頼性が低い場合に専門家に判断を委ねることが前提となっている手法であり、事前ドメインの有効性を判断する精度は高くない。つまり、非特許文献2に係る方法は、転移学習に有効でない事前ドメインを誤って有効であると判断する可能性が高い。このため、事前ドメインの有効性を精度よく判断する技術が望まれている。

0014

従って、本発明の目的は、事前ドメインが転移学習に有効であるかを精度よく判断することができる技術を提供することである。

課題を解決するための手段

0015

上記課題を解決するため、請求項1記載の発明は、機械学習装置であって、各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む目標ドメインと、前記所定の条件と異なる条件下における検出対象の特徴を有する学習候補データを含む事前ドメインとを取得する取得部と、前記取得部により取得された目標ドメイン及び事前ドメインを用いて転移学習を導入した機械学習を実行して、前記検出対象の検出に用いられる決定木を生成する試行転移学習部と、前記試行転移学習部により生成された決定木を構成する全てのリーフノードを用いて、前記取得部により取得された事前ドメインが転移学習に有効であるか否かを判断する判断部と、を備える。

0016

請求項2記載の発明は、請求項1に記載の機械学習装置であって、前記判断部は、前記試行転移学習部により生成された決定木を構成する各リーフノードの深さを積算することにより決定木の複雑度を計算し、計算した複雑度に基づいて前記事前ドメインを転移学習に用いるか否かを判断する複雑度計算部、を備える。

0017

請求項3記載の発明は、請求項2に記載の機械学習装置であって、前記試行転移学習部は、第1決定木と前記第1の決定木と異なる第2決定木とを生成し、前記複雑度計算部は、前記第1決定木の複雑度と前記第2決定木の複雑度と計算し、計算した前記第1決定木の複雑度と前記第2決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する。

0018

請求項4記載の発明は、請求項1ないし請求項3のいずれかに記載の機械学習装置であって、さらに、前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データ分類し、前記試行転移学習部により生成された決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、を備え、前記判断部は、前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とに基づいて、前記事前ドメインが有効であるか否かを判断する。

0019

請求項5記載の発明は、請求項4に記載の機械学習装置であって、前記判断部は、学習用データが到達した前記決定木のリーフノードの確率分布と、各学習候補データが到達した前記決定木のリーフノードの確率分布との分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する分布相違度計算部、を備える。

0020

請求項6記載の発明は、請求項5に記載の機械学習装置であって、前記試行転移学習部は、第1決定木と前記第1決定木と異なる第2決定木とを生成し、前記分布相違度計算部は、前記第1決定木を用いて第1分布相違度を計算し、前記第2決定木を用いて第2分布相違度を計算し、判断部は、前記分布相違度計算部により計算された第1分布相違度及び第2分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する。

0021

請求項7記載の発明は、請求項2に記載の機械学習装置であって、さらに、前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、生成した決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、を備え、前記判断部は、前記分類部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とを比較し、比較結果と、前記決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する転移評価部、を備える。

0022

請求項8記載の発明は、機械学習方法であって、各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、を備える。

0023

請求項9記載の発明は、転移学習をコンピュータに実行させるプログラムであって、各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、を実行させる。

発明の効果

0024

本発明に係る機械学習装置において、試行転移学習部は、目標ドメイン及び事前ドメインを用いて、転移学習を導入した機械学習を実行する。これにより、検出対象の検出に用いられる決定木が生成される。判断部は、生成された決定木を構成する全てのリーフノードを用いて、事前ドメインが転移学習に有効であるか否かを判断する。事前ドメインにおけるデータの特徴と目標ドメインにおける学習用データの特徴との際に応じて、決定木の構造は、変化する。決定木を構成する全てのリーフノードを用いることにより、事前ドメインの転移学習における有効性を精度よく評価することができる。

図面の簡単な説明

0025

本発明の実施の形態に係る機械学習装置の構成を示す機能ブロック図である。
図1に示す目標ドメイン及び事前ドメインの各々に含まれる画像の一例を示す図である。
図1に示す機械学習装置の動作を示すフローチャートである。
図1に示す競合値算出部により算出される競合値の変化の一例を示す図である。
図1に示す信頼度算出部により算出される信頼度の変化の一例を示す図である。
図1に示す試行転移識別部を構成する決定木の一例を示す模式図である。
図1に示す試行転移識別部による目標ドメインの識別結果に基づいて作成されるヒストグラムの一例を示す図である。
図1に示す試行転移識別部による事前ドメインの識別結果に基づいて作成されるヒストグラムの一例を示す図である。
図1に示す分布相違度算出部により算出される分布相違度の変化の一例を示す図である。
図1に示す複雑度算出部により算出される複雑度の変化の一例を示す図である。

実施例

0026

以下、図面を参照しつつ、本発明の実施の形態を詳しく説明する。

0027

[1.機械学習装置の構成]
図1は、本発明の実施の形態に係る機械学習装置100の構成を示す機能ブロック図である。図1に示す機械学習装置100は、転移学習を導入した機械学習を実行して、識別用特徴データ50を生成する。機械学習装置100は、転移学習を導入した機械学習を実行する際に、目標ドメイン21と、事前ドメイン22〜24のうち転移学習に有効と判断された事前ドメインとを用いる。識別用特徴データ50は、人物検出装置(図示省略)がカメラにより生成された撮影画像から人物を検出するために用いられる。

0028

本実施の形態では、機械学習装置100が、俯角0°で撮影された画像から人物を検出するための識別用特徴データ50を生成する場合を例にして説明する。

0029

機械学習装置100は、識別用特徴データ50の生成前に、事前ドメイン22〜24の各々が転移学習に有効であるか否かを評価するための機械学習(試行学習)を実行する。試行学習は、転移学習を導入した機械学習であり、識別用特徴データ50を生成するための機械学習と一部の点で異なる。試行学習では、転移学習を導入した機械学習に用いられる事前ドメインが、事前ドメイン22〜24から1つずつ選択される。

0030

機械学習装置100は、試行学習の結果に基づいて、事前ドメイン22〜24の各々に対する転移学習の有効性を評価する。機械学習装置100は、目標ドメイン21と、転移学習に有効と判断された事前ドメインとを用いて、転移学習を導入した機械学習を実行して、識別用特徴データ50を生成する。

0031

目標ドメイン21は、所定の条件下における検出対象(人物)の特徴を有する複数の画像のグループである。事前ドメイン22〜24は、上記の所定の条件と異なる条件下における検出対象の特徴を有する複数の画像のグループである。事前ドメイン22〜24は、複数の画像を所定の規則で分類することにより生成される。目標ドメイン21及び事前ドメイン22〜24の詳細については、後述する。

0032

図1に示すように、機械学習装置100は、取得部11と、試行転移学習部12と、比較学習部13と、判断部14と、選択転移学習部15とを備える。

0033

取得部11は、記憶装置2に記憶された目標ドメイン21と、事前ドメイン22〜24とを取得する。取得部11は、事前ドメイン22〜24を一括して取得するのではなく、事前ドメイン22〜24のうち、試行転移学習部12及び比較学習部13において機械学習の対象となる1つの事前ドメインを取得する。

0034

試行転移学習部12は、取得部11により取得された目標ドメイン21と、取得部11により取得された1つの事前ドメイン(注目事前ドメイン)とを入力する。試行転移学習部12は、入力された目標ドメイン21及び注目事前ドメインを利用して、転移学習の有効性を評価するための機械学習(試行学習)を実行し、その結果、試行転移識別部32を生成する。試行転移識別部32は、事前ドメインごとに生成される。試行転移学習部12は、学習アルゴリズムとして、転移学習を導入したランダムフォレストを用いる。具体的には、試行転移学習部12により用いられるアルゴリズムは、トランスファーフォレスト(Transfer Forest)と呼ばれており、転移学習の際に、共変量を用いて事前ドメインに含まれるデータを重み付けする。従って、試行転移識別部32の実体は、複数の決定木により構成されるデータ群である。

0035

比較学習部13は、注目事前ドメインのみを利用して、比較用の機械学習(比較学習)を実行し、その結果、比較識別部33を生成する。比較識別部33は、事前ドメインごとに生成される。比較学習部13は、学習アルゴリズムとして、転移学習を導入しないランダムフォレストを用いる。従って、比較識別部33の実体は、試行転移識別部32を構成する複数の決定木と異なる複数の決定木により構成されるデータ群である。

0036

判断部14は、試行転移識別部32と比較識別部33とを用いて、注目事前ドメインが転移学習に有効であるか否かを判断する。判断部14は、競合値計算部141と、信頼度計算部142と、分布相違度計算部143と、複雑度計算部144と、転移評価部145とを備える。

0037

競合値計算部141は、比較識別部33によるサンプルデータの識別結果を試行転移識別部32によるサンプルデータの識別結果と比較する。サンプルデータは、目標ドメイン21に含まれる画像及び注目事前ドメインに含まれる画像である。競合値計算部141は、比較結果に基づいて、競合値141Aを計算する。競合値141Aは、比較識別部33による識別結果と、試行転移識別部32による識別結果とが一致しない度合いを示す。

0038

信頼度計算部142は、試行転移識別部32により生成されるサンプルデータの識別結果を用いて、信頼度142Aを計算する。信頼度142Aは、試行転移識別部32による識別結果の信頼性を示す。

0039

分布相違度計算部143は、試行転移識別部32による目標ドメイン21に含まれる画像の分類結果と、試行転移識別部32による注目事前ドメインに含まれる画像の分類結果とに基づいて、分布相違度143Aを計算する。画像の分類は、試行転移識別部32を構成する決定木により行われる。分布相違度143Aは、注目事前ドメインに含まれる画像の分類結果が目標ドメイン21に含まれる画像の分類結果とどの程度異なるかを示す。

0040

複雑度計算部144は、試行転移識別部32を構成する決定木の構造に基づいて、複雑度144Aを計算する。複雑度144Aは、試行転移識別部32を構成する決定木の複雑さを示す。

0041

転移評価部145は、競合値141Aと、信頼度142Aと、分布相違度143Aと、複雑度144Aとに基づいて、注目事前ドメインが転移学習に有効であるか否かを評価する。転移評価部145は、注目事前ドメインの評価結果を選択転移学習部15に通知する。

0042

選択転移学習部15は、転移評価部145から通知される事前ドメイン22〜24の各々の評価結果に基づいて、転移学習に用いる事前ドメインを特定する。選択転移学習部15は、取得部11を介して、目標ドメイン21と転移学習に用いる事前ドメインとを取得する。選択転移学習部15は、取得した目標ドメイン21と事前ドメインとを用いて、転移学習を導入した機械学習を実行して、識別用特徴データ50を生成する。選択転移学習部15は、試行転移学習部12が用いる学習アルゴリズム(転移学習を導入したランダムフォレスト)を用いる。

0043

[2.目標ドメイン及び事前ドメイン]
以下、目標ドメイン21と事前ドメイン22〜24について説明する。また、機械学習装置100が識別用特徴データ50を生成する前に、事前ドメイン22〜24が転移学習に有効であるか否かを判断する理由を説明する。

0044

図2は、図1に示す記憶装置2に記憶される目標ドメイン21又は事前ドメイン22〜24に属する画像の一例を示す図である。

0045

識別用特徴データ50を利用する人物検出装置(図示省略)は、上述のように、俯角0°で撮影された画像から人物を検出することを想定している。この場合、目標ドメイン21は、図2に示すように、俯角0°で人物を撮影した画像21A〜21Cを含む。実際には、目標ドメイン21は、画像21A〜21Cだけでなく、俯角0°で人物を撮影した他の複数の画像を含む。

0046

つまり、目標ドメイン21は、所定の条件下における検出対象の特徴を有する複数の学習用データを含む。本実施の形態では、検出対象は人物である。所定の条件は、検出対象(人物)が俯角0°で撮影された画像に含まれていることである。目標ドメイン21は、事前ドメイン22〜24の各々に対する判断結果に関係なく、識別用特徴データ50の生成に用いられる。

0047

事前ドメイン22〜24は、それぞれ、0°よりも大きい俯角で人物を撮影した複数の画像を含む。図2に示すように、事前ドメイン22は、俯角20°で人物を撮影した画像22A〜22Cを含む。事前ドメイン23は、俯角30°で人物を撮影した画像23A〜23Cを含む。事前ドメイン24は、俯角50°で人物を撮影した画像24A〜24Cを含む。実際には、事前ドメイン22〜24の各々は、図2に示す画像だけでなく、それぞれの俯角で撮影した他の画像を含むが、図2では、他の画像の表示を省略している。

0048

事前ドメイン22〜24は、0°よりも大きい俯角で人物を撮影した複数の画像を、撮影時の俯角に応じて分類することにより生成される。すなわち、事前ドメイン22〜24は、所定の条件と異なる条件下における検出対象の特徴を有するデータの集合である。

0049

事前ドメイン22〜24に対する転移学習の有効性の評価は、以下の理由によって行われる。事前ドメイン22〜24に含まれる画像が、目標ドメイン21に含まれる画像21A〜21Cの特徴と同様の特徴を有する場合がある。転移学習は、事前ドメインに含まれる画像のうち、目標ドメイン21に含まれる画像と同様の特徴を有する画像を特定し、特定した画像が有する特徴を目標ドメイン21に含まれる画像の学習に適用する。

0050

しかし、ある事前ドメインが、目標ドメイン21に含まれる画像の特徴と大きく異なる特徴を有する画像の集合である場合、負の転移が発生する。この理由は、この事前ドメインに含まれる画像の特徴が、転移学習により識別用特徴データ50に反映されるためである。機械学習装置100は、負の転移を引き起こす可能性の高い事前ドメインを、識別用特徴データ50の生成から除外するために、事前ドメイン22〜24が転移学習に有効であるか否かを評価する。

0051

[3.機械学習装置100の動作]
図3は、機械学習装置100の動作を示すフローチャートである。機械学習装置100が図3に示す処理を開始する際に、試行転移識別部32が試行転移学習部12内に生成されておらず、比較識別部33が比較学習部13内に生成されていない。

0052

{3.1.ドメインの取得}
最初に、機械学習装置100において、取得部11は、記憶装置2から目標ドメイン21を取得する(ステップS11)。取得部11は、記憶装置2に記憶されている事前ドメイン22〜24のうち、転移学習の有効性が評価されていない事前ドメインを取得する(ステップS12)。具体的には、取得部11は、事前ドメイン22〜24のうち、最初に事前ドメイン22を取得する。

0053

{3.2.比較学習及び試行学習}
比較学習部13は、取得部11により取得された事前ドメイン22を入力する。比較学習部13は、入力した事前ドメイン22を学習する(ステップS13)。比較学習部13の学習アルゴリズムは、転移学習が導入されていないランダムフォレストである。比較学習部13は、ステップS13を実行することにより、事前ドメイン22の学習結果を反映した比較識別部33を生成する。比較識別部33は、複数の決定木により構成される。

0054

試行転移学習部12は、取得部11により取得された目標ドメイン21及び事前ドメイン22を入力する。試行転移学習部12は、入力した目標ドメイン21及び事前ドメイン22を用いて、転移学習を導入した機械学習を行う(ステップS14)。試行転移学習部12の学習アルゴリズムは、転移学習を導入したランダムフォレストである。試行転移学習部12は、ステップS14を実行することにより、目標ドメイン21及び事前ドメイン22の学習結果を反映した試行転移識別部32を生成する。試行転移識別部32は、複数の決定木により構成される。試行転移学習部12において用いられる学習アルゴリズム及びドメインが比較学習部13のものと異なるため、試行転移識別部32の構成は、比較識別部33の構成と異なる。

0055

なお、ステップS13及びステップS14において、目標ドメイン21に含まれる画像21A〜21Cと、事前ドメイン22に含まれる画像22A〜22Cとをそのまま学習する例を説明した。しかし、実際には、これらの画像から所定の特徴量を抽出した特徴抽出画像が学習に用いられる。抽出される特徴量は、たとえば、画像内の単位領域内におけるエッジの方向をヒストグラム化したHOG(Histograms of Oriented Gradients)特徴量や、画像内の複数の領域における明暗差を示すHaar−like特徴量などを用いることができる。

0056

{3.3.転移学習の評価(ステップS15)}
判断部14は、試行転移学習部12により生成された試行転移識別部32と比較学習部13により生成された比較識別部33とを用いて、事前ドメイン22が転移学習に有効であるか否かを判断する(ステップS15)。

0057

判断部14は、転移学習の有効性を判断するために、競合値141A、信頼度142A、分布相違度143A、複雑度144Aの4種類のパラメータを計算する。

0058

判断部14は、信頼度142A、分布相違度143A、及び複雑度144Aを計算する場合、サンプルグループに含まれる各画像の試行転移識別部32による識別結果を利用する。ここで、サンプルグループとは、目標ドメイン21と、転移学習の有効性の評価対象である事前ドメイン22とを合わせた集合に含まれる画像である。判断部14は、競合値141Aを計算する場合、試行転移識別部32による識別結果に加えて、サンプルグループに含まれる各画像の比較識別部33による識別結果を利用する。

0059

以下、それぞれのパラメータの詳細及び計算方法についてそれぞれ説明する。

0060

{3.3.1.競合値141Aの計算}
競合値計算部141は、試行転移識別部32により生成される各画像のラベルと、比較識別部33により生成される各画像のラベルとの比較結果に基づいて、競合値141Aを計算する。

0061

試行転移識別部32は、サンプルグループに含まれる画像のうち、いずれか1つ(サンプル画像)を入力する。試行転移識別部32は、サンプル画像に対して人物の識別処理を行い、サンプル画像の識別結果を示すラベル32Aを生成する。ラベル32Aの値は、例えば、0又は1である。ラベル32Aが0である場合、ラベル32Aは、サンプル画像が人物を含まないことを示す。ラベル32Aが1である場合、ラベル32Aは、サンプル画像が人物を含むことを示す。試行転移識別部32は、生成したラベル32Aを競合値計算部141に出力する。

0062

なお、試行転移識別部32は、サンプル画像の識別結果として、ラベル32Aだけでなく、ラベル32Aの確からしさを示す確度32Bを計算する。確度32Bは、後述する信頼度142Aの計算に用いられる。

0063

比較識別部33は、試行転移識別部32に入力されたサンプル画像と同じ画像を入力する。比較識別部33は、サンプル画像に対して人物の識別処理を行い、サンプル画像の識別結果を示すラベル33Aを生成する。ラベル33Aの値は、ラベル32Aと同様に、0又は1である。ラベル33Aが0である場合、ラベル33Aは、サンプル画像が人物を含まないことを示す。ラベル33Aが1である場合、ラベル33Aは、サンプル画像が人物を含むことを示す。比較識別部33は、生成したラベル33Aを競合値計算部141に出力する。

0064

競合値計算部141は、サンプル画像から生成されるラベル32A及び33Aを用いて、競合値141Aを計算する。競合値141Aは、下記式(1)により計算される。

0065

0066

式(1)において、Ec1は、競合値141Aを示す。Xは、サンプルグループを示す。xは、サンプルグループを構成する要素(サンプル画像)を示す。M(x)は、要素xから生成されたラベル33Aを示す。T(x)は、要素xから生成されたラベル32Aを示す。[M(x)≠T(x)]は、ラベル33Aとラベル32Aとが一致しなかったサンプル画像の数を示す。|X|は、サンプルグループXを構成する要素の数である。

0067

式(1)により計算される競合値141Aは、同一のサンプル画像から生成されるラベル32A及びラベル33Aが一致する確率を示す。競合値141Aは、0以上1以下の数値である。競合値141Aが0に近づくほど、競合値141Aは、転移学習における事前ドメイン22の有効性が高いことを示す。一方、競合値141Aが1に近づくほど。転移学習における事前ドメイン22の有効性が低いことを示す。

0068

俯角が大きくなるにつれて、事前ドメインに含まれる画像の特徴と目標ドメインに含まれる画像の特徴との相違点の数が増加する。従って、俯角が大きくなるにつれて、事前ドメインの競合値141Aは、増加すると想定される。

0069

図4は、競合値141Aの変化の一例を示すグラフである。図4に示すグラフは、以下のようにして作成される。

0070

俯角5°から俯角80°まで5°おきに俯角を設定し、設定された俯角に基づいて画像を分類することにより、複数の事前ドメインを作成した。目標ドメイン21は、上記と同様に、俯角0°で人物を撮影した画像の集合である。各俯角に対応する試行転移識別部32及び比較識別部33を生成して、各俯角に対応する競合値141Aを上記の手順で計算した。

0071

図4に示すように、競合値141Aは、俯角の増加に合わせて増加する傾向がある。従って、転移学習における事前ドメインの有効性を判断するパラメータとして競合値141Aを利用できることがわかる。しかし、競合値141Aは、上下に振動しながら増加している。このことは、競合値141Aの誤差が比較的大きいことを示している。

0072

従って、競合値141Aのみを用いて、転移学習に対する事前ドメインの有効性を判断した場合、負の転移を引き起こす事前ドメインを誤って有効であると判断するおそれがある。このため、競合値141Aを用いて事前ドメインの有効性を判断する場合、他のパラメータ(信頼度142A等)を合わせて用いることが望ましい。

0073

{3.3.2.信頼度の計算}
信頼度計算部142は、試行転移識別部32により生成される各画像のラベル32A及び確度32Bに基づいて、信頼度142Aを計算する。信頼度142Aの計算に当たり、比較識別部33によるサンプル画像の識別結果は使用されない。

0074

試行転移識別部32は、上述のように、サンプル画像に対する人物の識別結果を示すラベル32Aと、ラベル32Aの確からしさを示す確度32Bを生成する。確度32Bは、0以上1以下の値であり、確度32Bが1に近づくほど、ラベル32Aが誤りである可能性が小さくなる。

0075

信頼度計算部142は、試行転移識別部32から各サンプル画像のラベル32A及び確度32Bを入力する。信頼度計算部142は、入力した各サンプル画像のラベル32A及び確度32Bを用いて、下記式(2)を計算することにより信頼度142Aを計算する。

0076

0077

上記式(2)において、Ec2は、信頼度142Aを示す。xは、上記式(1)と同様に、サンプルグループXを構成する要素(サンプル画像)を示す。|X|は、サンプルグループXの要素数である。PT(x)は、要素xの確度32Bを示す。T(x)は、要素xのラベル32Aを示す。yは、人物の存在を示すラベル(y=1)である。つまり、信頼度142Aは、ラベル32Aがラベルyと一致する場合に算出された確度32Bの合計値を、サンプルグループXの要素数で除算した値である。信頼度142Aは、0以上1以下の値であり、1に近いほど、転移学習における事前ドメイン22の有効性が高いことを示す。

0078

図5は、信頼度142Aの変化の一例を示すグラフである。図4と同様に、俯角が5°おきに設定された複数の事前ドメインの各々から試行転移識別部32を生成して、各事前ドメインに対応する信頼度142Aを計算することにより、図5に示すグラフを作成した。

0079

信頼度142Aは、図5に示すように、全体的な傾向として、俯角の増加に合わせて減少していく。つまり、事前ドメインの有効性が高くなるにつれて、信頼度142Aは1に近づく。以下、その理由を説明する。事前ドメイン22に含まれるデータが、目標ドメイン21に含まれるデータの特徴量と類似する特徴量を有している場合、試行転移学習部12は、試行転移学習により、事前ドメイン22の学習結果を目標ドメイン21の学習結果に転移させる。試行転移識別部32には、目標ドメイン21及び事前ドメイン22の両者の学習結果が反映されている。試行転移識別部32がサンプルグループに含まれる各画像に対して識別処理を行った場合、ラベル32Aは1となり、その確度32Bも1に近づくと考えられる。従って、事前ドメイン22に含まれるデータと目標ドメイン21に含まれるデータとが類似している場合(事前ドメイン22が転移学習において有効である場合)、信頼度142Aは、1に近づく。

0080

図5に示すように、信頼度142Aは、上下に振動しながら増加する。これは、競合値141Aと同様に、信頼度142Aの誤差が比較的大きいことを示している。このため、信頼度142Aのみを用いて、転移学習に対する事前ドメインの有効性を判断した場合、負の転移を引き起こす事前ドメインを誤って有効であると判断するおそれがある。このため、信頼度142Aを用いて事前ドメインの有効性を判断する場合、他のパラメータ(分布相違度143A等)を合わせて用いることが望ましい。

0081

{3.3.3.分布相違度}
分布相違度計算部143は、試行転移識別部32によるサンプル画像の識別結果のみを利用して、分布相違度143Aを計算する。分布相違度計算部143は、試行転移識別部32を構成する各決定木のリーフノードに到達した目標ドメイン21の画像の分布と事前ドメイン22の画像の分布との差に基づいて、分布相違度143Aを計算する。

0082

試行転移識別部32は、学習アルゴリズムとして転移学習を導入したランダムフォレストを用いるため、複数の決定木により構成される。しかし、分布相違度143Aの計算の説明を簡略化するために、試行転移識別部32を構成する決定木が1つである場合を最初に説明する。

0083

図6は、試行転移識別部32を構成する決定木40の一例を示す模式図である。図7は、目標ドメイン21の画像の識別結果に基づいて作成されるヒストグラム51の一例を示す図である。図8は、事前ドメイン22の画像の識別結果に基づいて作成されるヒストグラム52の一例を示す図である。ヒストグラム51及び52は、試行転移識別部32による識別結果に基づいて作成される。

0084

ヒストグラム51は、以下のようにして作成される。試行転移識別部32は、目標ドメイン21に含まれる各画像を決定木40のルートノード40Rに入力する。入力された画像は、分岐ノードを経由して、リーフノード40A〜40Gのいずれかに到達する。

0085

例えば、試行転移識別部32は、画像21A(図2参照)の特徴量をルートノード40Rで用いられるしきい値と比較し、比較結果に基づいて、画像21Aの遷移先を分岐ノード41A及び41Bのいずれかに決定する。画像21Aが分岐ノード41Aに遷移した場合、試行転移識別部32は、画像21A(図2参照)の特徴量を分岐ノード41Aで用いられるしきい値と比較し、遷移先のノードをリーフノード40A又は分岐ノード41Cに決定する。画像21Aがリーフノード40Aに遷移することにより、画像21Aの到達先が、リーフノード40Aに決定される。分岐ノード41Aで用いられる画像21Aの特徴量は、ルートノード40Rで用いられる画像21Aの特徴量と同じであっても異なっていてもよい。同じである場合、分岐ノード41Aで用いられるしきい値は、ルートノード40Rで用いられるしきい値と異なる。

0086

試行転移識別部32は、目標ドメイン21に含まれる各画像が到達したリーフノードを特定する到達先データ32Cを分布相違度計算部143に出力する。分布相違度計算部143は、到達先データ32Cを参照して、リーフノード40A〜40Gの各々に到達した画像の数をカウントする。この結果、リーフノードに到達した目標ドメイン21の画像の分布を示すヒストグラム51が作成される。

0087

試行転移識別部32は、事前ドメイン22に含まれる画像の各々が到達したリーフノードを特定する到達先データ32Dを生成する。分布相違度計算部143は、到達先データ32Dに基づいて、リーフノードに到達した事前ドメイン22の画像の分布を示すヒストグラム52を作成する。

0088

分布相違度143Aは、下記式(3)を用いて計算される。具体的には、分布相違度143Aは、ヒストグラム51及び52を正規化した後、それらのBhattacharyya距離を算出することによりにより得られる。Bhattacharyya距離は、2つの確率分布の類似性を示す。

0089

0090

式(3)において、Ec3は、分布相違度143Aを示す。iは、図6に示す各リーフノードの番号である。p(i)は、リーフノードに到達した目標ドメイン21の画像の確率分布である。q(i)は、リーフノードに到達した事前ドメイン22の画像の確率分布である。確率分布p(i)は、ヒストグラム51から作成され、確率分布q(i)は、ヒストグラム52から作成される。Xは、サンプルグループを構成する要素(画像)の数である。

0091

分布相違度143Aは、0以上1以下の数値であり、ヒストグラム51における画像の分布と、ヒストグラム52における画像の分布との類似性が低いほど1に近づく。つまり、分布相違度143Aが1に近づくほど、事前ドメイン22が転移学習に有効でないことを示す。

0092

図9は、分布相違度143Aの変化の一例を示すグラフである。図4と同様に、俯角が5°おきに設定された複数の事前ドメインの各々に対応する試行転移識別部32を作成して、各事前ドメインに対応する分布相違度143Aを計算した。

0093

図9に示すように、分布相違度143Aは、俯角の増加に合わせて増加する。これは、以下の理由による。俯角が増加するにつれて、目標ドメイン21に含まれる画像の特徴と事前ドメイン22に含まれる画像の特徴との差が大きくなる。この場合、事前ドメイン22に含まれる画像が決定木40内を遷移するルートが、目標ドメイン21に含まれる画像が決定木40内を遷移するルートから大きく外れ頻度が増加する。目標ドメイン21に含まれる画像の分布と、事前ドメイン22に含まれる画像の分布との差が大きくなり、俯角の増加に合わせて分布相違度143Aが増加する。

0094

例えば、図7に示すヒストグラム51では、ピークノード番号3のノード40Dに表れている。一方、図8に示すヒストグラム52では、ピークがノード番号6のノード40Gに表れている。つまり、ヒストグラム51及び52は、ヒストグラムの形状が互いに大きく異なる。この場合、分布相違度143Aは、1に近い値となるため、転移学習における事前ドメイン22の有効性は低いと考えられる。

0095

また、図9に示すように、競合値141A及び信頼度142Aに比べて、分布相違度143Aは、上下に振動しない。これは、分布相違度143Aの誤差が小さく、転移学習における事前ドメインの有効性を精度よく判断できることを示している。

0096

次に、試行転移識別部32が複数の決定木により構成される場合における、分布相違度143Aの計算について説明する。分布相違度計算部143は、式(3)を用いて、決定木ごとの分布相違度143Aを計算する。そして、分布相違度計算部143は、各決定木の分布相違度143Aの平均を、事前ドメイン22の分布相違度143Aとして算出する。

0097

{3.3.4.木の複雑度}
複雑度計算部144は、試行転移識別部32を構成する決定木の構造に基づいて複雑度144Aを計算する。複雑度144Aは、試行転移識別部32を構成する決定木のリーフノードの深さに基づいて計算される。

0098

複雑度144Aの計算方法について、分布相違度143Aの説明と同様に、試行転移識別部32を構成する決定木が1つである場合を最初に説明する。複雑度計算部144は、決定木を構成する各リーフノードの深さを記録したリーフノードデータ32Eを試行転移識別部32から取得する。複雑度計算部144は、下記式(4)を用いて、複雑度144Aを計算する。

0099

0100

上記式(4)において、Ec4は、複雑度144Aを示す。dkは、決定木におけるk番目のリーフノードの深さを示す。nは、決定木におけるリーフノードの数である。dmaxは、決定木におけるリーフノードの最大深さを示し、式(4)の分子(リーフノードの深さの合計値)を正規化するために用いられる。リーフノードの深さは、リーフノードからルートノード40Rに到達するまでに通過するエッジ(枝)の数によって定義される。例えば、図4に示す決定木において、リーフノード40Aの深さは、2である。

0101

一般的に、リーフノードの数又はリーフノードの深さが増加するにつれて、決定木の構造は複雑となる。目標ドメイン21の各画像の特徴と事前ドメイン22の各画像の特徴との差が大きくなるにつれて、決定木は複雑な構造を有する。以下、その理由について説明する。

0102

目標ドメイン21の各画像の特徴と事前ドメイン22の各画像の特徴との差が大きい場合、試行転移学習部12は、決定木を作成する際に、目標ドメイン21の各画像の特徴に応じた分岐条件と、事前ドメイン22の各画像の特徴に応じた分岐条件とを別々に作成する。この結果、目標ドメインの各画像に対応する部分木と、事前ドメイン22の各画像の特徴を識別するための部分木とが、別々に作成される。この結果、決定木を構成するリーフノードの数が増加し、決定木の構造は複雑となる。従って、式(4)により計算される複雑度144Aを用いることにより、転移学習における事前ドメイン22の有効性を判断することができる。

0103

図10は、複雑度144Aの変化の一例を示すグラフである。図4と同様に、俯角が5°おきに設定された複数の事前ドメインを作成し、各事前ドメインに対応する複雑度144Aを計算することにより、図10に示すグラフを作成した。

0104

図10に示すように、複雑度144Aは、俯角の増加に合わせて増加する。これは、上述のように、事前ドメインに含まれる画像の特徴と、目標ドメインに含まれる画像の特徴との差が大きくなるにつれて、決定木の構造が複雑となるためである。なお、分布相違度143Aと同様に、複雑度144Aは、上下に振動しない。従って、複雑度144Aを用いることにより、転移学習における事前ドメイン22の有効性を精度よく判断することができる。

0105

複数の決定木が試行転移識別部32を構成する場合の複雑度144Aの計算方法について説明する。決定木ごとの複雑度144Aが、式(4)により計算される。決定木ごとに計算された複雑度144Aを平均することにより、複数の決定木が試行転移識別部32を構成する場合における複雑度144Aが得られる。

0106

{3.3.5.転移評価部145による事前ドメインの評価}
転移評価部145は、競合値141A、信頼度142A、分布相違度143A、及び複雑度144Aを入力する。転移評価部145は、入力した競合値141A、信頼度142A、分布相違度143A、及び複雑度144Aに基づいて、転移学習における事前ドメイン22の有効性を評価する。

0107

転移評価部145は、下記の式(5)を用いて、総合評価値を計算する。

0108

0109

式(5)において、Eは、競合値141A、信頼度142A、分布相違度143A、及び複雑度144Aから得られる総合評価値である。事前ドメインの転移学習における有効性が低下するにつれて、競合値141A、分布相違度143A、及び複雑度144Aは増加する。一方、信頼度142Aは、逆に低下する。信頼度142Aの傾向を他の3つの評価値の傾向に合わせるために、1から信頼度142Aを減算した値を、総合評価値の計算に使用している。

0110

上記式(5)により計算された総合評価値は、0以上の値であり、転移学習の有効性が高くなるにつれて0に近づく。転移評価部145は、計算された総合評価値が予め設定されたしきい値よりも小さい場合、事前ドメイン22が転移学習において有効であると判断する。転移評価部145は、転移学習の有効性の判断対象であった事前ドメイン22の評価結果を示す評価結果データ145Aを選択転移学習部15に出力する。

0111

{3.4.次の事前ドメインの指定}
事前ドメイン22の有効性の評価(ステップS15)が終了した後に、事前ドメイン22の有効性の評価に用いられた試行転移識別部32及び比較識別部33が削除される(ステップS16)。事前ドメイン22に対応する試行転移識別部32及び比較識別部33は、転移学習における他の事前ドメインの有効性の評価で使用されないためである。

0112

取得部11は、記憶装置2に記憶されている全ての事前ドメインの評価が終了したか否かを判断する(ステップS17)。全ての事前ドメインの評価が終了していない場合(ステップS17においてNo)、機械学習装置100は、転移学習の有効性が評価されていない事前ドメインを取得するために、ステップS12に戻る。

0113

これにより、転移学習における事前ドメイン23及び24の有効性が評価される。転移評価部145は、事前ドメイン23及び24の各々の評価結果を示す評価結果データ145Aを、選択転移学習部15に出力する。

0114

{3.5.識別用特徴データ50の生成}
全ての事前ドメインの評価が終了した場合(ステップS17においてYes)、選択転移学習部15は、事前ドメイン22〜24の各々の評価結果データ145Aに基づいて、転移学習に有効であると判断された事前ドメインを特定する。転移学習に有効と判断される事前ドメインの数は、特に限定されない。

0115

選択転移学習部15は、目標ドメイン21及び特定した事前ドメインを、取得部11を介して記憶装置2から取得する。選択転移学習部15は、取得した目標ドメイン21及び事前ドメインを用いて、転移学習を導入したランダムフォレストに基づく機械学習を実行する(ステップS18)。この結果、識別用特徴データ50が生成される。生成された識別用特徴データ50は、人物検出装置(図示省略)により利用される。

0116

以上説明したように、機械学習装置100は、事前ドメイン22〜24の各々の転移学習における有効性を評価し、目標ドメイン21と転移学習に有効と判断された事前ドメインとを用いて転移学習を導入した機械学習を実行する。事前ドメインが、目標ドメインに含まれる画像の特徴と大きく異なる特徴を有する画像により構成される場合、この事前ドメインが識別用特徴データ50の生成に用いられることが防止される。この結果、負の転移が発生することを防止することができ、検出対象の検出精度を高めることができる。

0117

なお、上記実施の形態において、試行転移学習部12及び選択転移学習部15が、学習アルゴリズムとしてランダムフォレストを用いる場合を例に説明したが、これに限られない。学習アルゴリズムは、決定木を生成するアルゴリズムであれば、特に限定されない。例えば、学習アルゴリズムとして、ID3(Iterative Dichotomiser 3)や、ブースティングを用いることが可能である。いずれの学習アルゴズムを用いる場合であっても、試行転移学習部12は、転移学習を導入した機械学習を実行し、比較学習部13は、転移学習を導入しない機械学習を実行すればよい。

0118

上記実施の形態において、事前ドメイン22〜24が、0°よりも大きい俯角で人物を撮影された画像を含む例を説明したが、これに限られない。機械学習装置100は、0°よりも大きい仰角で人物を撮影した画像を含む事前ドメインを用いてもよい。あるいは、目標ドメイン21に含まれる画像の明るさと異なる明るさを有する画像を含む事前ドメインを用いてもよい。また、目標ドメイン21が人物を撮影した画像である場合を例にして説明したが、検出対象に応じて目標ドメイン21に含まれるデータが設定されることは言うまでもない。

0119

上記実施の形態において、転移評価部145が、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aを用いて、転移学習における事前ドメインの有効性を評価する例を説明したが、これに限られない。転移評価部145は、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aの少なくとも1つを用いて、事前ドメインの有効性を評価すればよい。

0120

なお、分布相違度143A及び複雑度144Aは、競合値141A及び信頼度142Aに比べて、誤差が小さい。このため、転移評価部145は、少なくとも、分布相違度143A及び複雑度144Aをいずれかを用いることが望ましい。転移評価部145が、事前ドメインの評価に競合値141A及び信頼度142Aを用いない場合、機械学習装置100は、比較学習部13を備えなくてもよい。

0121

上記実施の形態において、分布相違度計算部143は、試行転移識別部32が複数の決定木により構成される場合、各決定木から計算される分布相違度を合計することにより分布相違度143Aを計算する例を説明したが、これに限られない。分布相違度計算部143は、試行転移識別部32を構成する決定木のうち、少なくとも一本の決定木を用いて分布相違度143Aを計算すればよい。複雑度計算部144も、同様に、試行転移識別部32を構成する決定木のうち、少なくとも一本の決定木を用いて複雑度144Aを計算すればよい。すなわち、判断部14は、試行転移識別部32を構成する複数の決定木のうち、少なくとも1つの決定木を構成する全てのリーフノードを用いて、転移学習における事前ドメインの有効性を評価すればよい。

0122

上記実施の形態において、転移評価部145は、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aを乗算することにより、総合評価値を計算する例を説明したが、これに限られない。たとえば、転移評価部145は、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aの合計を総合評価値として計算してもよい。また、精度の高い分布相違度143A及び複雑度144Aの重みを大きくした上で、総合評価値を計算してもよい。つまり、転移評価部145は、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aを用いて、総合評価値を計算すればよい。

0123

上記実施の形態において、機械学習装置100が、人物を検出するための識別用特徴データ50を生成する例を例にしたが、これに限られない。学習の対象は、センサにより計測された測定データであってもよい。センサの種類は、特に限定されず、加速度センサ光センサなどの様々な測定データを使用することができる。例えば、自動車自動運転を行うために、これらのセンサの測定データを用いるために機械学習を実行してもよい。

0124

上記実施の形態の機械学習装置100の一部または全部は、集積回路(例えば、LSI、システムLSI等)として実現されるものであってもよい。

0125

上記実施の形態の各機能ブロックの処理の一部または全部は、プログラムにより実現されるものであってもよい。そして、上記実施形態の各機能ブロックの処理の一部または全部は、コンピュータにおいて、中央演算装置(CPU)により行われる。また、それぞれの処理を行うためのプログラムは、ハードディスク、ROMなどの記憶装置に格納されており、ROMにおいて、あるいはRAMに読み出されて実行される。

0126

また、上記実施形態の各処理をハードウェアにより実現してもよいし、ソフトウェア(OS(オペレーティングシステム)、ミドルウェア、あるいは、所定のライブラリとともに実現される場合を含む。)により実現してもよい。さらに、ソフトウェアおよびハードウェアの混在処理により実現しても良い。なお、上記実施の形態に係る機械学習装置100をハードウェアにより実現する場合、各処理を行うためのタイミング調整を行う必要があるのは言うまでもない。上記実施形態においては、説明便宜のため、実際のハードウェア設計で生じる各種信号のタイミング調整の詳細については省略している。

0127

また、上記実施形態における処理方法実行順序は、必ずしも、上記実施形態の記載に制限されるものではなく、発明の要旨を逸脱しない範囲で、実行順序を入れ替えることができるものである。

0128

前述した方法をコンピュータに実行させるコンピュータプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体は、本発明の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、大容量DVD、次世代DVD、半導体メモリを挙げることができる。

0129

上記コンピュータプログラムは、上記記録媒体に記録されたものに限られず、電気通信回線無線又は有線通信回線、インターネットを代表とするネットワーク等を経由して伝送されるものであってもよい。

0130

100機械学習装置
2記憶装置
11 取得部
12試行転移学習部
13比較学習部
14 判断部
15 選択転移学習部
141競合値計算部
142信頼度計算部
143分布相違度計算部
144複雑度計算部
145 転移評価部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ