図面 (/)

技術 特性理解装置、方法、及びプログラム

出願人 日本電信電話株式会社
発明者 西村拓哉西田京介戸田浩之
出願日 2016年5月20日 (3年10ヶ月経過) 出願番号 2016-101881
公開日 2017年11月24日 (2年4ヶ月経過) 公開番号 2017-208045
状態 特許登録済
技術分野 航行(Navigation) 検索装置 教示用装置
主要キーワード 関係構造 位置特性 構造関係 座標点データ 適合度算出 移動軌跡情報 ガス排出量 トピック数
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年11月24日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (15)

課題

スポット道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定する。

解決手段

関係構造化部30が、道路ネットワークと、スポットの位置情報とに基づいて、道路の各々に対しスポットを割り当てると共に、道路の各々について、道路網構造関係を考慮した道路間の関係を生成する。特性推定部32が、スポット毎に紐付けられた単語情報を含むデータ集合と、関係構造化部30によって得られた、道路の各々に対して割り当てられたスポット及び道路間の関係とに基づいて、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定する。

概要

背景

経路探索などの各種サービス実現のために道路の特性を理解したいというニーズがある。例えば、どの道がにぎやかか、明るいかといった特性を理解し、それらの道路を優先的に探索することで、にぎやかな道を通りたい、明るい道を通りたいといったユーザのニーズに応えた経路探索を実現できる。

実世界において地理的に分布する多様な特性を理解するための、いくつかの既存の取り組みがある。

一つの取り組みは、人手で、各道路にその特性の情報を付与することに取り組むものである(非特許文献1)。これらの取り組みは、クラウドソーシングなどを用いてあらかじめ指定された特徴が各道路にあてはまるかを人手で評価し、その結果を道路ネットワーク上の各道路に付与して経路探索などに用いるものである。ここでいう道路ネットワークとは、交差点ノード、道路をエッジとして道路網グラフ形式表現したデータ形式のことであり、経路探索などに一般に用いられるものである。

もう一つの取り組みは統計情報から各道路の特性を推定するものである(非特許文献2)。政府公開しているオープンデータや車などの移動軌跡情報を基に、各道路の安全度グリーンガス排出量などを推定する取り組みである。

またもう一つの取り組みは、ソーシャルメディアなどのWeb上の情報を用いて地域の情報を理解しようとする取り組みである(非特許文献3)。これらの取り組みは、緯度経度紐付いたテキストデータを元に、POI(Point of Interest)単位ないし円状やセル上のエリア単位でどのように特性が分布しているかを理解しようとするものである。ここでいうPOIとは、店舗観光地など人が興味を持って訪問するスポットのことである。

概要

スポットと道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定する。関係構造化部30が、道路ネットワークと、スポットの位置情報とに基づいて、道路の各々に対しスポットを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成する。特性推定部32が、スポット毎に紐付けられた単語情報を含むデータ集合と、関係構造化部30によって得られた、道路の各々に対して割り当てられたスポット及び道路間の関係とに基づいて、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定する。

目的

本発明は、上記の事情に鑑みてなされたもので、スポットと道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定することができる特性理解装置、方法、及びプログラムを提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

道路エッジとし各交差点ノードとして道路網グラフ形式表現し、かつ前記道路の情報が前記グラフに付与されている道路ネットワークと、スポット位置情報とに基づいて、前記道路の各々に対し前記スポットを割り当てると共に、前記道路の各々について、前記道路網の構造関係を考慮した前記道路間の関係を生成する関係構造化部と、前記スポット毎に紐付けられた単語情報を含むデータ集合と、前記関係構造化部によって得られた、前記道路の各々に対して割り当てられた前記スポット及び前記道路間の関係とに基づいて、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定する特性推定部と、を含む特性理解装置

請求項2

前記目的関数は、前記スポット毎に紐付けられた前記データ集合の単語情報が表す各単語が出現する回数と、前記データ集合の単語情報に含まれる各単語の特性、各スポットの特性、及び各道路の特性を用いて表される、前記道路に割り当てられた前記スポットにおいて各単語が生成される生成確率とを用いて算出される各スポットの前記データ集合の尤度と、前記道路間の関係から得られる接続された道路間の前記道路の特性の類似度を用いて表される各道路の特性に関する制約とを含む請求項1に記載の特性理解装置。

請求項3

前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各スポットの特性を記憶した位置特性記憶部と、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換する単語前処理部と、前記位置特性記憶部に記憶された各スポットの特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記スポットの各々との適合度を算出する適合度算出部と、を更に含む請求項1又は請求項2に記載の特性理解装置。

請求項4

前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各道路の特性を記憶した道路特性記憶部と、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換する単語前処理部と、前記道路特性記憶部に記憶された各道路の特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記道路の各々との適合度を算出する適合度算出部と、を更に含む請求項1又は請求項2に記載の特性理解装置。

請求項5

関係構造化部及び特性推定部を含む特性理解装置における特性理解方法であって、前記関係構造化部が、各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ前記道路の情報が前記グラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、前記道路の各々に対し前記スポットを割り当てると共に、前記道路の各々について、前記道路網の構造関係を考慮した前記道路間の関係を生成するステップと、前記特性推定部が、前記スポット毎に紐付けられた単語情報を含むデータ集合と、前記関係構造化部によって得られた、前記道路の各々に対して割り当てられた前記スポット及び前記道路間の関係とに基づいて、前記データ集合の単語情報に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定するステップと、を含む特性理解方法。

請求項6

前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各スポットの特性を記憶した位置特性記憶部と、単語前処理部と、適合度算出部とを更に含み、前記単語前処理部が、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換するステップと、前記適合度算出部が、前記位置特性記憶部に記憶された各スポットの特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記スポットの各々との適合度を算出するステップと、を含む請求項5に記載の特性理解方法。

請求項7

前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各道路の特性を記憶した道路特性記憶部と、単語前処理部と、適合度算出部とを更に含み、前記単語前処理部が、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換するステップと、前記適合度算出部が、前記道路特性記憶部に記憶された各道路の特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記道路の各々との適合度を算出するステップと、を含む請求項5に記載の特性理解方法。

請求項8

コンピュータを、請求項1〜請求項4の何れか1項に記載の特性理解装置を構成する各部として機能させるためのプログラム

技術分野

0001

本発明は、特性理解装置、方法、及びプログラムに関する。

背景技術

0002

経路探索などの各種サービス実現のために道路の特性を理解したいというニーズがある。例えば、どの道がにぎやかか、明るいかといった特性を理解し、それらの道路を優先的に探索することで、にぎやかな道を通りたい、明るい道を通りたいといったユーザのニーズに応えた経路探索を実現できる。

0003

実世界において地理的に分布する多様な特性を理解するための、いくつかの既存の取り組みがある。

0004

一つの取り組みは、人手で、各道路にその特性の情報を付与することに取り組むものである(非特許文献1)。これらの取り組みは、クラウドソーシングなどを用いてあらかじめ指定された特徴が各道路にあてはまるかを人手で評価し、その結果を道路ネットワーク上の各道路に付与して経路探索などに用いるものである。ここでいう道路ネットワークとは、交差点ノード、道路をエッジとして道路網グラフ形式表現したデータ形式のことであり、経路探索などに一般に用いられるものである。

0005

もう一つの取り組みは統計情報から各道路の特性を推定するものである(非特許文献2)。政府公開しているオープンデータや車などの移動軌跡情報を基に、各道路の安全度グリーンガス排出量などを推定する取り組みである。

0006

またもう一つの取り組みは、ソーシャルメディアなどのWeb上の情報を用いて地域の情報を理解しようとする取り組みである(非特許文献3)。これらの取り組みは、緯度経度紐付いたテキストデータを元に、POI(Point of Interest)単位ないし円状やセル上のエリア単位でどのように特性が分布しているかを理解しようとするものである。ここでいうPOIとは、店舗観光地など人が興味を持って訪問するスポットのことである。

先行技術

0007

Daniele Quercia, Rossano Schifanella and Luca Maria Aiello “The shortest path to happiness: recommending beautiful, quiet, and happy routes in the city”, in Proc. of Hypertext,2014.
B. Yang et al, “Using incomplete information for complete weight annotation of road networks”, inIEEE Transactions on Knowledge and Data Engineering,2011.
Zhijun Yin et al, “Geographical topic discovery and comparison”, in Proc. of WWW,2011.

発明が解決しようとする課題

0008

しかしながら、上記の非特許文献に係る従来技術においても以下の問題がある。

0009

一つ目の問題は、人手での情報付与や指定した情報を抽出する手法はコストが大きく、広範なエリアや様々な情報の取得に適用することが出来ないという点である。

0010

二つ目の問題は、統計情報から特性を推定する取り組みでは収集可能な情報の種類が限定的であり、人の主観に関する特性などを推定することは出来ないという点である。

0011

三つ目の問題は、ソーシャルメディアなどのWeb上の情報を用いた地域の情報理解の取り組みではPOI単位やエリア単位での特性理解への取り組みは存在し、その結果を道路に割り当てる取り組みも存在するが、それらは道路とPOIやエリアとの関係性を考慮していないという点である。

0012

POI単位の特性理解を利用して道路の特性を理解する手法の一つとしては、POIの情報を近隣の道路に付与する手法が考えられる。図13に模式図を示す。図13に示す手法では、各POIの特性を最近傍の道路に割り当てる。しかし、この手法では道路とPOIとの関係性を正しく考慮しておらず、正しく特性を推定することは出来ない。

0013

POIの特性は、そのPOI接する道路から影響を受ける部分と、POI独自の部分との組み合わせになっていると考えられる。例えばにぎやかな道の近くにある飲食店はにぎやかな雰囲気だと考えられるが、どういった料理が出るか、といった特性は道路とは無関係である。

0014

また、POIが道路から影響を受けるような特性は、同一の道路に接する他のPOIにも影響していると考えられる。これらを考慮しなければ道路自体の特性を推定することは出来ない。また道路の構造関係を考慮して推定することも同時に行う必要がある。なぜなら上記図13に示すように特性についてのデータが得られない道路も存在するためである。

0015

また、エリア単位の特性理解を利用して道路の特性を理解する手法としてはそのエリア内の道路にその特性を付与する手法も考えられる。図14に模式図を示す。しかしこの手法ではそのエリア内の道路の特性は一律になってしまい、例えば経路探索においてはそのエリアにある道路のうちどれがユーザのニーズに合致したものであるか分からないという問題がある。

0016

本発明は、上記の事情に鑑みてなされたもので、スポットと道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定することができる特性理解装置、方法、及びプログラムを提供することを目的とする。

課題を解決するための手段

0017

上記目的を達成するために、第1の発明に係る特性理解装置は、各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ前記道路の情報が前記グラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、前記道路の各々に対し前記スポットを割り当てると共に、前記道路の各々について、前記道路網の構造関係を考慮した前記道路間の関係を生成する関係構造化部と、前記スポット毎に紐付けられた単語情報を含むデータ集合と、前記関係構造化部によって得られた、前記道路の各々に対して割り当てられた前記スポット及び前記道路間の関係とに基づいて、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定する特性推定部と、を含んで構成されている。

0018

第2の発明に係る特性理解方法は、関係構造化部及び特性推定部を含む特性理解装置における特性理解方法であって、前記関係構造化部が、各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ前記道路の情報が前記グラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、前記道路の各々に対し前記スポットを割り当てると共に、前記道路の各々について、前記道路網の構造関係を考慮した前記道路間の関係を生成するステップと、前記特性推定部が、前記スポット毎に紐付けられた単語情報を含むデータ集合と、前記関係構造化部によって得られた、前記道路の各々に対して割り当てられた前記スポット及び前記道路間の関係とに基づいて、前記データ集合の単語情報に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定するステップと、を含む。

0019

第1及び第2の発明によれば、関係構造化部が、各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ道路の情報がグラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、道路の各々に対しスポットを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成する。

0020

そして、特性推定部が、スポット毎に紐付けられた単語情報を含むデータ集合と、関係構造化部によって得られた、道路の各々に対して割り当てられたスポット及び道路間の関係とに基づいて、データ集合の単語情報に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定する。

0021

このように、道路ネットワークと、スポットの位置情報とに基づいて、道路の各々に対しスポットを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成し、スポット毎に紐付けられた単語情報を含むデータ集合と、道路の各々に対して割り当てられたスポット及び道路間の関係とに基づいて、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、各単語の特性と、各スポットの特性と、各道路の特性とを推定することにより、スポットと道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定することができる。

0022

本発明の前記目的関数は、前記スポット毎に紐付けられた前記データ集合の単語情報が表す各単語が出現する回数と、前記データ集合の単語情報に含まれる各単語の特性、各スポットの特性、及び各道路の特性を用いて表される、前記道路に割り当てられた前記スポットにおいて各単語が生成される生成確率とを用いて算出される各スポットの前記データ集合の尤度と、前記道路間の関係から得られる接続された道路間の前記道路の特性の類似度を用いて表される各道路の特性に関する制約とを含むようにすることができる。

0023

また、本発明は、前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各スポットの特性を記憶した位置特性記憶部と、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換する単語前処理部と、前記位置特性記憶部に記憶された各スポットの特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記スポットの各々との適合度を算出する適合度算出部と、を更に含むようにすることができる。

0024

また、本発明は、前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各道路の特性を記憶した道路特性記憶部と、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換する単語前処理部と、前記道路特性記憶部に記憶された各道路の特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記道路の各々との適合度を算出する適合度算出部と、を更に含むようにすることができる。

0025

また、本発明のプログラムは、コンピュータを、上記特性理解装置を構成する各部として機能させるためのプログラムである。

発明の効果

0026

以上説明したように、本発明の特性理解装置、方法、及びプログラムによれば、道路ネットワークと、スポットの位置情報とに基づいて、道路の各々に対しスポットを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成し、スポット毎に紐付けられた単語情報を含むデータ集合と、道路の各々に対して割り当てられたスポット及び道路間の関係とに基づいて、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、各単語の特性と、各スポットの特性と、各道路の特性とを推定することにより、スポットと道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定することができる、という効果が得られる。

図面の簡単な説明

0027

本実施の形態の概要を説明するための図である。
本実施の形態に係る特性理解装置の機能的構成を示すブロック図である。
POIデータの一例を示す図である。
POIデータの形式を変換した一例を示す図である。
POIの緯度経度情報の一例を示す図である。
道路ネットワークの一例を示す図である。
道路ネットワークの一例を示す図である。
単語の特性、POIの特性、及び道路の特性の一例を示す図である。
単語前処理部の処理の一例を示す図である。
適合度の算出の処理の一例を示す図である。
本実施形態に係る特性理解装置における特性推定処理ルーチンの処理を表すフローチャートである。
本実施形態に係る特性理解装置における適合度算出処理ルーチンの処理を表すフローチャートである。
従来技術の一例を示す図である。
従来技術の一例を示す図である。

実施例

0028

以下、図面を参照して、本発明の実施の形態を詳細に説明する。

0029

<本発明の実施の形態の概要>

0030

まず、本発明の実施の形態の概要について説明する。本発明の実施の形態は、ソーシャルメディアなどのWeb上の情報を基に、実世界の状況を理解する手法に関する。本実施の形態においては、データ集合の単位として、スポットの一例であるPOI(Point of Interest)を用いる。POIとは、店舗や観光地など人が興味を持って訪問するスポットのことである。

0031

本発明の実施の形態では、POIと道路との関係性と、道路同士の構造関係とを考慮しながら道路の特性を推定し、同時にPOIの特性も推定する。また、所望の特性を持つPOIや道路を人間が探し出すためには、POIの特性又は道路の特性と照合可能な形の単語の特性も必要になるため、単語の特性も同時に推定する。

0032

図1に、本実施の形態を説明するための図を示す。

0033

まず、POIと道路との関係性をどのように考慮するかについて説明する。上記図1に示すように、POIの特性は、そのPOIが接する道路から影響を受ける部分と、POI独自の部分との組み合わせになっていると考え、本実施の形態では、それらを同時に推定することができる仕組みを考える。

0034

次に、道路同士の構造関係について説明する。上記図1に示すように、道路の特性は、接続した道路は似た特性を持つ、接続しているがその規模が大きく異なる道路では特性の類似度が下がる、などの特徴を持つことが考えられる。

0035

例えば、二つの道路の規模が類似していてまっすぐつながっている場合には、雰囲気などが近く、特性も類似すると考えられる。一方、まっすぐではなく90度に接続されている場合には、特性の類似度は下がると考えられる。

0036

上記の二点を考慮することで、POIが多い道路ではその共通している部分を道路の特性として抽出する、POIのデータが不足している道路については接続された道路の特性を用いることで推定するといったことが可能になり、道路の特性を高精度に推定することができる。

0037

また、上記の推定の結果得られた単語・POI・道路の特性を組み合わせて用いることで、与えられたキーワードに対して、各POIと各道路とが、そのキーワードにどれほど当てはまっているかを示す数値である適合度が算出可能になる。これを用いれば、様々なキーワードを指定しての経路探索や、キーワードに適したPOIの前を通る経路探索などが行えるようになる。

0038

<本発明の実施形態に係る特性理解装置の構成>
次に、本発明の実施形態に係る特性理解装置の構成について説明する。図2に示すように、本発明の実施形態に係る特性理解装置100は、CPUと、RAMと、後述する特性推定処理ルーチン、及び適合度算出処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この特性理解装置100は、機能的には図2に示すように入力部10と、演算部20と、出力部50と、を含んで構成されている。なお、本実施の形態に係る特性理解装置は、POIについてのデータと道路ネットワークとを用いて、各単語の特性、各POIの特性、及び各道路の特性を推定する。また、本実施の形態に係る特性理解装置は、各単語の特性、各POIの特性、及び各道路の特性に関する出力結果を利用して、外部から与えられた単語と各道路との適合度及び単語と各POIとの適合度を出力する。

0039

入力部10は、外部から単語を入力として受け付ける。

0040

演算部20は、POIデータ記憶部22と、POIデータ前処理部24と、POI緯度経度記憶部26と、道路ネットワーク記憶部28と、道路POI関係構造化部30と、特性推定部32と、単語特性記憶部40と、位置特性記憶部42と、道路特性記憶部44と、単語前処理部46と、適合度算出部48とを含んで構成されている。

0041

POIデータ記憶部22には、POIの各々に対し、テキストデータが記憶されている。具体的には、POIデータ記憶部22には、ソーシャルメディアなどのWeb上の情報から収集したデータなど、各POIに関するデータ(以後、POIデータとする)が記憶されている。POIデータの例としては、例えば、POI毎に投稿されたテキストデータである。図3にPOIデータの一例を示す。

0042

POIデータ前処理部24は、POIデータ記憶部22に記憶されているPOIデータの各々について、後述する特性推定部32の処理に適した形式にデータを処理し、POIと単語情報を含むデータ集合とが紐付いたスポット情報を出力する。例えば、POIデータ前処理部24は、POIデータのテキストから、テキスト中に各単語が何回出現したかのカウントをまとめたデータ形式であり、単語情報を含むデータ集合の一例であるBag of Wordsを生成する。図4にPOIデータ前処理部24によってPOIデータの形式が変更された例を示す。なお、図4の例においては、入力されるPOIデータは、図3のPOIデータが入力されたものとする。また、POIデータ前処理部24によって、POIデータの形式が変更された情報を以後、スポット情報とする。図4の例に示すように、スポット情報は、POIと、単語情報を含むデータ集合とが紐付けたものである。

0043

POI緯度経度記憶部26には、POIの各々についての緯度経度情報(以後、POIの位置情報)が記憶されている。図5にPOIの位置情報の例を示す。

0044

道路ネットワーク記憶部28には、道路ネットワークが記憶されている。道路ネットワークとは、各道路をエッジ、各交差点をノードとして道路網をグラフの形式で表現し、さらに道路の規模などのメタデータを表す道路の情報が当該グラフに付与されている形式のデータのことである。

0045

具体的なデータ形式の一例としては、各道路が複数の緯度経度を持つ座標点データリストとして表現されているものが考えられる。この場合、各道路の始点と終点座標点が道路ネットワークにおけるノードとなり、共通のノードを始点もしくは終点として持つ道路同士が接続されていることになる。また、道路の規模などのメタデータが各道路について保存されている。道路ネットワークの一例を図6に示す。

0046

関係構造化部30は、道路ネットワーク記憶部28に記憶されている道路ネットワークと、POI緯度経度記憶部26に記憶されているPOIの位置情報の各々とに基づいて、道路の各々に対しPOIを割り当てる。また、関係構造化部30は、道路ネットワーク記憶部28に記憶されている道路ネットワークに基づいて、道路の各々について、道路網の構造関係を考慮した道路間の関係としてのグラフを生成する。

0047

具体的には、関係構造化部30は、POI緯度経度記憶部26及び道路ネットワーク記憶部28からデータを読み取り、二つのテーブルを出力する。一つ目は、各POIを最近傍の道路に割り当てたテーブルである。二つ目は、道路ネットワークから作成したグラフを表すテーブルである。このグラフは、道路をノードとして、接続された道路の間にエッジを張り、道路間の関係性に応じて重みを設定したものである。この重みは、道路間でどれほど特性が類似すると考えられるかを表すものとする。例えば以下に示す(1)〜(4)のような実現方法が考えられる。

0048

(1)道路が接続されている場合、道路間の重みの初期値を1とする。
(2)規模が異なっていれば0.3をかける。
(3)同じ交差点により規模の大きい道路が存在する場合は0.3をかける。
(4)道路間の角度が180度の場合を1、90度の場合を0.3として、道路間の角度に応じて連続的に変化させた値をかける。

0049

関係構造化部30における入出力例を図7に示す。関係構造化部30に対して実際に入力されるデータは、上記図5及び上記図6に示すデータであるが、それぞれの道路とPOIとを緯度経度座標上に可視化したものを図7の入力例に示している。

0050

図7に示す入力例では、POI1とPOI2とは道路1を最近傍としている。そのため、出力のうち道路とPOIとの関係性テーブルで、道路1とPOI1、POI2が紐付けられることになる。また、道路1は道路2と道路3とが接続されているため、道路1‐道路2と道路1‐道路3にそれぞれエッジが設定され、道路ネットワークを反映したグラフを表すテーブルのように出力される。

0051

また、道路1と道路2とは、まっすぐつながっているために特性の類似度が高いと考えられるため、重みが大きい。一方、道路1と道路3とはまっすぐではないために特性の類似度は低いと考えられるため、重みが小さくなっている。

0052

特性推定部32は、POIデータ前処理部24によって得られた、POI毎の単語情報を含むデータ集合と、関係構造化部30によって得られた、道路の各々に対して割り当てられたPOI及びグラフとに基づいて、データ集合の単語情報に含まれる各単語の特性と、各POIの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、データ集合の単語情報に含まれる各単語の特性と、各POIの特性と、各道路の特性とを推定する。特性推定部32は、単語特性推定部34と、POI特性推定部36と、道路特性推定部38とを備える。

0053

特性推定部32は、POIデータ前処理部24及び道路POI関係構造化部30の出力を受け取り、単語とPOIと道路との特性を同時に推定する。その際、POIと道路の関係性と、道路の構造関係を考慮する。

0054

この機能を実現する方法として、グラフ制約と階層構造を考慮したpLSA(Probabilistic Latent Semantic Analysis)(例えば、参考文献(T. Hofmann. “Probabilistic latent semantic indexing.” in Proc. of SIGIR, 1999)を参照)を利用することなどが考えられる。pLSAはテキストデータから各文書のBag of Wordsを入力として、各単語と各文書に対してその意味を表現するようなベクトルを出力する技術である。pLSAを処理手法として用いる場合は、各POIのテキストを文書とみなし、道路とその近傍POIの階層構造と、道路ネットワークの構造を考慮するように拡張することで実現できる。

0055

階層構造を考慮する場合には、例えば、Sparse Additive Generative Model(例えば、参考文献(J.Eisenstein et al, “Sparse additive generative models of text” in Proc. of ICML, 2011)を参照)などを用いることで実現できる。

0056

次に、テキストを情報として用いる場合についての、具体的な式を示す。全てのテキストデータの集合をC、各道路rの集合をノード集合R、接続された道路同士の間にエッジを張りその集合をEと定義し、GをG=(R,E)とあらわされるグラフとしたとき、全体の目的関数を以下の式(1)のように定義し、これを最小化するように単語・POI・道路の特性を推定する。

0057

(1)

0058

ここでL(C,G)は各単語の生成確率から計算される各POIのデータ集合についての尤度を表す。また、R(G)はグラフ構造に基づく各道路の特性に関する制約を表す。λはこの二項に関する重み項である。

0059

道路rの近傍にあるPOIの集合をPr、各POIpに紐付けられたデータ集合の単語情報が表す単語wが出現した回数をc(w,p)、道路rの近傍のPOIpで単語wが生成される生成確率をp(w|r,p)としたとき、L(C,G)は以下のように定義される。

0060

(2)

0061

また、p(w|r,p)は以下のように定義される。

0062

(3)

0063

上記式(3)に示すように、道路rに割り当てられたPOIpにおいて各単語wが生成される生成確率p(w|r,p)は、テキストデータに含まれる各単語の特性、各POIの特性、及び各道路の特性を用いて表される。

0064

ここで、ψは各道路の持つ特性を表すベクトル、θは各POIの持つ特性を表すベクトル、φは各トピックの持つ単語分布を表す。ψrzは道路rの特性を表すベクトルのz次元目の大きさを表し、θpzはPOIpの特性を表すベクトルのz次元目の大きさを表す。φzwはトピックzにおける単語wの生成確率を表す。また、Kはトピック数を表し、Vは全テキスト中に出てきた語彙の集合を表す。

0065

上記式について詳しく説明する。各単語の生成確率は、あるトピックzのそのPOIにおける生成確率に、トピックzにおけるその単語の生成確率をかけることを全てのトピックについて行い、その和を取ることで算出される。また、あるPOIpにおけるトピックの生成確率は、そのPOIが隣接する道路rにおけるトピックzの生成しやすさを示すパラメータであるψrzに、POIpと道路の差分を足し合わせた値から算出される。この式を用いてp(w|r,p)を計算することで、ある道路rの近傍POIで共通して生成されやすい単語があり、またそれぞれのPOIで個別に生成されやすい単語もあることが表現できる。

0066

また、上記式(1)のR(G)は以下のように定義される。

0067

(4)

0068

ここで、w(r,r’)は道路rとr’の特性の類似度の強さを表す。詳細は後述する。diff(ψr,ψr’)は特性ψの一致度を算出する関数であり、内積などによって実現できる。この式の最大化を図ることで、特性の類似度が高いと考えられる道路において、それぞれの特性の推定結果の値が近くなるようにできる。

0069

w(r,r’)について説明する。w(r,r’)は道路間の特性の類似度を表し、道路POI関係構造化部30から出力された重みである。これを用いると、道路の構造関係から来る特性の類似度を考慮しながらψを求めることができる。
従って、上記式(1)のR(G)は、関係構造化部30から出力されたグラフから得られる、接続された道路間の道路の特性の類似度diff(ψr,ψr’)を用いて表される。

0070

以上を考慮しながら、φ,ψ,θを最適化することで単語・POI・道路の特性を推定する。最適化する方法としては、Gibbs Samplingを用いることができる。本実施の形態では、Gibbs Samplingを用いてφ,ψ,θを推定する場合を例に説明する。

0071

具体的には、まず、φ,ψ,θを適当に初期化する。

0072

次に、単語特性推定部34は、初期化された、又は前回推定されたψ,θを固定して、上記式(1)についてφを最適化する。

0073

POI特性推定部36は、初期化された、又は前回推定されたθと、単語特性推定部34によって推定されたφとを固定して、上記式(1)についてψを最適化する。

0074

道路特性推定部38は、単語特性推定部34によって推定されたφと、POI特性推定部36によって推定されたψとを固定して、上記式(1)についてθを最適化する。

0075

そして、予め定められた条件を満たすまで、単語特性推定部34、POI特性推定部36、及び道路特性推定部38の推定処理を繰り返すことで、上記式(1)の目的関数の最適化が実現できる。

0076

単語特性推定部34、POI特性推定部36、及び道路特性推定部38における最適化は、Projected Scaled Sub-Gradient(例えば、参考文献(M. Schmidt, A. Niculescu-Mizil, and K. Murphy, “Learning graphical model structure using l1-regularization paths”, in Proc. of AAAI, 2007.)を参照)などで実現することができる。図8に、出力の例を示す。

0077

単語特性記憶部40には、特性推定部32によって推定された各単語の特性が記憶されている。

0078

位置特性記憶部42には、特性推定部32によって推定された各POIの特性が記憶されている。

0079

道路特性記憶部44には、特性推定部32において推定された各道路の特性が記憶されている。

0080

図8に、単語特性記憶部40に記憶される単語の特性の例、位置特性記憶部42に記憶されるPOIの特性の例、道路特性記憶部44に記憶される道路の特性の例を示す。

0081

単語前処理部46は、単語特性記憶部40に記憶された各単語の特性に基づいて、入力部10から入力された単語を、単語の特性に変換する。具体的には、単語前処理部46は、入力部10において受け付けた単語について、単語特性記憶部40に記憶されている各単語の特性のうち、単語が一致する単語の特性を、当該受け付けた単語の特性として取得する。図9に、受け付けた単語が「喫茶店」である場合において、取得される単語特性の例を示す。

0082

適合度算出部48は、位置特性記憶部42に記憶された各POIの特性と、単語前処理部46により変換された単語の特性とに基づいて、入力された単語とPOIの各々との適合度を算出し、結果を出力部50から出力する。

0083

また、適合度算出部48は、道路特性記憶部44に記憶された各道路の特性と、単語前処理部46により変換された単語の特性とに基づいて、入力された単語と道路の各々との適合度を算出し、結果を出力部50から出力する。

0084

なお、本実施形態においては、各単語の特性、各POIの特性、及び各道路の特性をベクトル表現しているため、単語とPOIとの適合度及び単語と道路との適合度は、各々の特性のベクトルの内積で計算する。図10に、適合度算出部48における入力と出力とのデータの例を示す。

0085

出力部50は、適合度算出部48の出力を受け取り外部へと出力する。

0086

<本発明の実施形態に係る特性理解装置の作用>
次に、本発明の実施形態に係る特性理解装置100の作用について説明する。本発明の実施の形態では、処理プロセスとして、図11に示すように各特性を推定し蓄積する処理フローと、図12に示すように入力された単語と各特性との適合度を算出する処理フローとがある。

0087

まず、特性理解装置100は、POIデータ記憶部22からPOIデータの各々を読み込むと、図11に示す特性推定処理ルーチンを実行する。

0088

まず、ステップS100において、POIデータ前処理部24は、読み込んだPOIデータの各々について後述するステップS102の処理に適した形式にデータを処理し、POIと単語情報を含むデータ集合とが紐付いたスポット情報を取得する。

0089

次に、ステップS102において、関係構造化部30は、道路ネットワーク記憶部28に記憶されている道路ネットワークと、POI緯度経度記憶部26に記憶されているPOIの位置情報の各々とに基づいて、道路の各々に対しPOIを割り当てる。

0090

ステップS104において、特性推定部32は、上記ステップS100で得られた、POI毎の単語情報を含むデータ集合と、上記ステップS102で得られた、道路の各々に対して割り当てられたPOI及びグラフとに基づいて、上記式(1)に示す目的関数を最適化するように、データ集合に含まれる各単語の特性と、各POIの特性と、各道路の特性とを推定する。

0091

そして、ステップS106において、特性推定部32は、上記ステップS104で推定した、各単語の特性を単語特性記憶部40に記憶させ、各POIの特性を位置特性記憶部42に記憶させ、各道路の特性を道路特性記憶部44に記憶させ、特性推定処理ルーチンを終了する。

0092

次に、特性理解装置100は、入力部10において単語を受け付けると、図12に示す適合度算出処理ルーチンを実行する。

0093

まず、ステップS200では、単語特性記憶部40に記憶されている各単語の特性と、位置特性記憶部42に記憶されている各POIの特性と、道路特性記憶部44に記憶されている各道路の特性とを読み込む。

0094

次に、ステップS202では、単語前処理部46は、ステップS200において取得した各単語の特性に基づいて、入力部10において受け付けた単語の特性を取得する。

0095

次に、ステップS204では、適合度算出部48は、ステップS200において取得した各POIの特性と、ステップS202において取得した入力部10において受け付けた単語の特性とに基づいて、当該単語と各POIとの適合度の各々を算出する。また、適合度算出部48は、ステップS200において取得した各道路の特性と、ステップS202において取得した入力部10において受け付けた単語の特性とに基づいて、当該単語と各道路との適合度の各々を算出する。

0096

次に、ステップS206では、ステップS204において取得した入力部10において受け付けた単語と各POIとの適合度の各々、及び入力部10において受け付けた単語と各道路との適合度の各々を、出力部50から出力して、適合度算出処理ルーチンを終了する。

0097

以上説明したように、本発明の実施形態に係る特性理解装置によれば、道路ネットワークと、POIの位置情報とに基づいて、道路の各々に対しPOIを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成し、POI毎に紐付けられた単語情報を含むデータ集合と、道路の各々に対して割り当てられたPOI及び道路間の関係とに基づいて、データ集合に含まれる各単語の特性と、各POIの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、各単語の特性と、各POIの特性と、各道路の特性とを推定することにより、POIと道路との関係及び道路間の関係を考慮して、POIの特性及び道路の特性を精度よく推定することができる。

0098

また、記憶された各単語の特性に基づいて、入力された単語を特性に変換し、記憶された各POIの特性及び各道路の特性と、変換された入力された単語の特性とに基づいて、入力された単語とPOIの各々との適合度及び入力された単語と道路の各々との適合度を算出することにより、POIと道路との関係及び道路間の関係を考慮して、単語とPOIの各々との適合度及び単語と道路の各々との適合度を算出することができる。

0099

また、Web上に存在する情報を用いて、道路及びPOIの関係性と、道路同士の関係性とを考慮しながら、各POIと道路とについて、様々なキーワードとの適合度を高精度に算出する仕組みを構築することができる。これにより、人の主観に関するものなど様々なキーワードについて、そのキーワードと適合するPOI又は道路を重視した経路探索などのサービスが実現できる。

0100

また、ソーシャルメディアなどのWeb上の情報を基に、実世界の情報を理解することができる。

0101

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

0102

例えば、本実施形態においては、入力された単語とPOIの各々との適合度及び入力された単語と道路の各々との適合度を算出する場合を例に説明したが、これに限定されるものではなく、単語とPOIの各々との適合度及び単語と道路の各々との適合度の何れか一方のみを算出してもよい。

0103

また、本実施形態においてはPOIに関するデータをテキストデータとする場合について説明したが、これに限定されるものではなく、POIに関するデータとして、画像データにメタデータとして単語集合が付加されているものを用いてもよい。この場合、POI毎の1画像データを1テキストとみなして、当該画像データに含まれる単語の集合を上述の1テキストとみなして本実施形態に係る特性理解装置の各処理を行えばよい。

0104

また、本実施形態においては、単語の特性、POIの特性、及び道路の特性を推定する場合に、pLSIを用いる場合について説明したが、これに限定されるものではなく、他の手法を用いてもよい。

0105

また、本実施形態においては、POIデータと、POIの位置情報とが別々に記憶されている場合について説明したが、これに限定されるものではない。例えば、POIデータと、POIの位置情報とを合わせてPOIデータとして記憶していてもよい。当該場合、本実施形態においては、POIの位置情報は、POIデータ記憶部22から取得されることとなる。

0106

また、データ集合の単位を、POIとした場合を例に説明したが、これに限定されるものではない。例えば、POI以外の地点や地域を、データ集合の単位としてもよい。

0107

また、上述の特性理解装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。

0108

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体、例えばCD−ROMメモリーカード等に格納して提供することも可能である。

0109

10 入力部
20演算部
22データ記憶
24POIデータ前処理部
26緯度経度記憶部
28道路ネットワーク記憶部
30関係構造化部
32 特性推定部
34 単語特性推定部
36 特性推定部
38道路特性推定部
40 単語特性記憶部
42位置特性記憶部
44 道路特性記憶部
46 単語前処理部
48適合度算出部
50 出力部
100 特性理解装置

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社ソケッツの「 検索装置および方法」が 公開されました。( 2019/09/19)

    【課題】同一の感性ワードで加重的に絞り込み検索を行えるようにする。【解決手段】同一の感性ワードで加重的に絞り込み検索を行う場合、類似・関連ワード抽出部319が、感性ワードに類似・関連する別のワードを検... 詳細

  • 有限会社金鹿哲学承継塾の「 自律航行型海洋ブイとこれを用いた海洋情報システム」が 公開されました。( 2019/09/19)

    【課題】自律航行型海洋ブイであり、遭難信号受信時には自律的に遭難者の救助に向かい、また海上の通信基地局として機能するとともに、海洋情報システムを提供する。【解決手段】GPS信号と内部センサーの情報と海... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】ユーザの移動の妨害に応じた適切な対応を可能にする。【解決手段】本願に係る情報処理装置は、取得部と、決定部とを有する。取得部は、ユーザの位置情報と、ユーザが位置するエリアにおいて発生する事象のう... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ