図面 (/)

技術 情報分析システムおよび情報分析方法に関する。

出願人 ビッグローブ株式会社
発明者 林健一縄手真人松村憲和
出願日 2018年3月1日 (2年0ヶ月経過) 出願番号 2018-036389
公開日 2019年9月12日 (6ヶ月経過) 公開番号 2019-152959
状態 未査定
技術分野 検索装置 計算機間の情報転送
主要キーワード 分析対象情報 類似語句 エントロピー関数 突出度合い 対象ターゲット 分析区分 比較サイト 既定回数
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2019年9月12日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

課題

ターゲットの特徴を容易に把握することが可能な情報分析システムを提供する。

解決手段

蓄積部412は、ターゲットに関するターゲット情報をターゲットごとに蓄積する。制御部423は、各ターゲットについて、そのターゲットである対象ターゲットに関するターゲット情報において特定語句出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する。提供部433は、ターゲット情報、特定語句および補正度数に応じた表示データを生成する。

概要

背景

近年、旅行先、宿泊施設飲食店購入商品および利用サービスなどのターゲットを選択する際に、インターネット上の比較サイトなどに記載されたターゲットに関するターゲット情報閲覧にすることが多くなっている。特に、ターゲット情報として、利用者視点によるターゲットの評価を示すクチコミ情報が注目されている。

しかしながら、クチコミ情報のようなインターネット上で発信されている数多いターゲット情報を確認して、適切なターゲットを選択することは容易ではない。

これに対して特許文献1には、クチコミ情報などのターゲット情報から出現頻度の高い語句を抽出して、ターゲットを特定するキーワードとして設定する技術が開示されている。この技術では、キーワードを確認することで、ターゲットの特徴を把握することが可能になるため、所望のターゲットを容易に選択することができる。

概要

ターゲットの特徴を容易に把握することが可能な情報分析システムを提供する。蓄積部412は、ターゲットに関するターゲット情報をターゲットごとに蓄積する。制御部423は、各ターゲットについて、そのターゲットである対象ターゲットに関するターゲット情報において特定語句出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する。提供部433は、ターゲット情報、特定語句および補正度数に応じた表示データを生成する。

目的

本発明は、情報を分析する情報分析システムおよび情報分析方法に関し、特には、クチコミ情報を分析して提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部と、各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出する制御部と、前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成する生成部と、を有する、情報分析システム

請求項2

前記ターゲット情報は、複数の分析対象情報を含み、前記制御部は、前記特定語句を含む前記分析対象情報の数を前記出現度数として算出する、請求項1に記載の情報分析システム。

請求項3

前記分析対象情報は、前記ターゲットに対する評価を示す評価情報である、請求項2に記載の情報分析システム。

請求項4

前記比較ターゲット情報は、前記ターゲット情報の全てである、請求項1ないし3のいずれか1項に記載の情報分析システム。

請求項5

前記蓄積部は、前記ターゲット情報と前記ターゲットの分析区分を示す区分情報とを前記ターゲットごとに蓄積し、前記比較ターゲット情報は、前記対象ターゲットと前記分析区分が同じターゲットに関するターゲット情報である、請求項1ないし3のいずれか1項に記載の情報分析システム。

請求項6

前記制御部は、前記比較度数に対する前記出現度数の突出度合いを示す特徴度を算出し、前記特徴度に基づいて前記出現度数を補正する、請求項1ないし5のいずれか1項に記載の情報分析システム。

請求項7

前記制御部は、前記特定語句のうち、所定数以上の各ターゲットに関するターゲット情報に共通した共通語句の出現度数を補正する、請求項1ないし6のいずれか1項に記載の情報分析システム。

請求項8

前記生成部は、前記ターゲット情報と、当該ターゲット情報に含まれる前記特定語句のうち前記補正度数が所定の表示条件を満たす語句とを対応付けたデータを前記表示データとして生成する、請求項1ないし9のいずれか1項に記載の情報分析システム。

請求項9

前記生成部は、前記表示データを利用者端末に提供し、当該利用者端末による前記表示データに対する操作に応じて、前記補正度数および前記表示データの少なくとも一方を調整する、請求項8に記載の情報分析システム。

請求項10

ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部を有する情報分析システムによる情報分析方法であって、各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出するステップと、前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成するステップと、を含む情報分析方法。

技術分野

0001

本発明は、情報を分析する情報分析システムおよび情報分析方法に関し、特には、クチコミ情報を分析して提供する情報分析システムおよび情報分析方法に関する。

背景技術

0002

近年、旅行先、宿泊施設飲食店購入商品および利用サービスなどのターゲットを選択する際に、インターネット上の比較サイトなどに記載されたターゲットに関するターゲット情報閲覧にすることが多くなっている。特に、ターゲット情報として、利用者視点によるターゲットの評価を示すクチコミ情報が注目されている。

0003

しかしながら、クチコミ情報のようなインターネット上で発信されている数多いターゲット情報を確認して、適切なターゲットを選択することは容易ではない。

0004

これに対して特許文献1には、クチコミ情報などのターゲット情報から出現頻度の高い語句を抽出して、ターゲットを特定するキーワードとして設定する技術が開示されている。この技術では、キーワードを確認することで、ターゲットの特徴を把握することが可能になるため、所望のターゲットを容易に選択することができる。

先行技術

0005

特開2014−191550公報

発明が解決しようとする課題

0006

しかしながら、特許文献1に記載の技術では、多くの異なるターゲットに対して同じ語句がキーワードとして設定されてしまい、各ターゲットの特徴を把握することが難しくなることがある。例えば、旅行先の宿泊施設を選ぶ場合、旅行先が温泉地であれば、多くの宿泊施設に関するターゲット情報から「温泉」という語句が抽出されてしまい、その結果、多くの宿泊施設に「温泉」というキーワードが設定されてしまう。このような場合、各宿泊施設の特徴を把握することが難しく、適切なターゲットを選択することは容易ではない。

0007

本発明は、上記の問題を鑑みてなされたものであり、ターゲットの特徴を容易に把握することが可能な情報分析装置および情報分析方法を提供することを目的とする。

課題を解決するための手段

0008

本発明による情報分析システムは、ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部と、各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出する制御部と、前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成する生成部と、を有する。

0009

本発明による情報分析方法は、ターゲットに関するターゲット情報を前記ターゲットごとに蓄積する蓄積部を有する情報分析システムによる情報分析方法であって、各ターゲットについて、当該ターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較ターゲット情報において前記特定語句が出現する比較度数に基づいて補正した補正度数を算出するステップと、前記ターゲット情報、前記特定語句および前記補正度数に応じた表示データを生成するステップと、を含む情報分析方法。

発明の効果

0010

本発明によれば、ターゲットの特徴を容易に把握することが可能になる。

図面の簡単な説明

0011

本発明の第1の実施形態の情報提供システムを示す図である。
本発明の第1の実施形態の分析システムを示す図である。
表示データの一例を示す図である。
表示データの他の例を示す図である。
表示データの他の例を示す図である。
表示データの他の例を示す図である。
表示データの他の例を示す図である。
本発明の第1の実施形態の情報提供システムの動作を説明するためのシーケンス図である。

実施例

0012

以下、本発明の実施形態について図面を参照して説明する。なお、各図面において同じ機能を有するものには同じ符号を付け、その説明を省略する場合がある。

0013

(第1の実施形態)
図1は、本発明の第1の実施形態の情報提供システムを示す図である。図1に示す情報提供システム1は、Webサーバ10と、ターゲット情報格納装置20と、利用者端末30と、分析システム40とを有する。Webサーバ10、ターゲット情報格納装置20、利用者端末30および分析システム40は、ネットワーク100を介して通信可能に接続されている。Webサーバ10および利用者端末30は、図1では、それぞれ3つずつ示されているが、Webサーバ10および利用者端末30の数は、3つに限らず、適宜変更可能である。

0014

Webサーバ10は、特定のターゲットに関するターゲット情報を含むWeb情報を提供するサーバである。ターゲットは、企業などの提供者が提供する提供物である。提供物としては、宿泊施設、商店(飲食店やコンビニなど)、塾、物件賃貸物件分譲物件)、商品およびサービスなどが挙げられる。Web情報は、ターゲットを提供する提供者にて管理される。

0015

ターゲット情報は、例えば、ターゲットに対する評価を示す評価情報を含む。評価情報は、例えば、利用者の視点によるターゲットの評価であるクチコミを示すクチコミ情報である。また、ターゲット情報には、当該ターゲットの名称、説明などが含まれている。ただし、ターゲットの名称、説明などの情報は、ターゲット情報とは別のターゲット説明情報としても良い。なお、Webサーバ10が提供するWeb情報には、利用者が利用者端末30を介して、ターゲットに対する注文処理を行うための注文機能が含まれてもよい。注文処理は、例えば、ターゲットに対する購入注文を行う購入処理や、ターゲットに対する予約注文を行う予約処理などである。注文機能は、例えば、購入フォーム予約フォームなどである。

0016

ターゲット情報格納装置20は、そのターゲットに関するターゲット情報をターゲットを識別するターゲット識別情報ごとに示すDB(Database:データベース)を格納する格納装置である。例えば、ターゲット識別情報は、ユニークな管理IDまたはターゲットの名称などである。ターゲット情報格納装置20は、例えば、ターゲットに対応するWebサーバ10が存在しない場合や、ターゲットの提供者とは別に、利用者からターゲット情報を収集する場合などに使用される。ターゲット情報格納装置20が格納するターゲット情報は、クチコミ情報のような特定の情報だけでもよい。なお、ターゲット情報は、アンケートフォーム電子メールなどを用いて利用者から直接投稿されたものでもよいし、アンケート用紙などに記載された情報を管理者がターゲット情報格納装置20に登録したものでもよい。

0017

利用者端末30は、情報提供システム1の利用者にて使用される端末装置である。利用者端末30は、例えば、PC(personal computer)、スマートフォンスマートTVまたはゲーム機などである。

0018

利用者端末30は、ユーザからの指示に従って、ターゲット情報の取得を要求する取得要求を分析システム40に送信する。また、利用者端末30は、分析システム40から、取得要求の応答としてターゲット情報を含む表示データを受信し、その表示データを表示する。なお、取得要求は、キーワードのような取得対象となるターゲットを検索する検索条件や、利用者の属性を示す属性情報などを含む。表示データのより詳細な説明は後述する。

0019

分析システム40は、ネットワーク100上のターゲット情報の収集および分析を行い、その分析結果に応じた表示データを利用者端末30に提供する情報分析システムである。

0020

図2は、分析システム40の構成を示す図である。図2に示すように分析システム40は、収集装置41と、分析装置42と、提供装置43とを有する。

0021

収集装置41は、ネットワーク100上からターゲット情報を収集して蓄積する。具体的には、収集装置41は、伝送部411と、蓄積部412と、収集部413とを有する。

0022

伝送部411は、ネットワーク100上の各装置と接続される。蓄積部412は、種々の情報を蓄積する。

0023

収集部413は、Webサーバ10およびターゲット情報格納装置20のうちの少なくとも1つからターゲット情報を収集し、その収集したターゲット情報をターゲットごとに蓄積部412に蓄積する。より具体的には、収集部413は、ターゲット情報と、ターゲットの分析区分を示す区分情報とを、ターゲットを識別する識別情報であるターゲット識別情報ごと対応付け収集情報を蓄積する。また、収集部413は、Webサーバ10からターゲット説明情報を収集し、ターゲット情報格納装置20からターゲット情報を収集し、ターゲット説明情報をターゲット識別情報に対応付けて収集情報に含めて蓄積部412に蓄積してもよい。

0024

本実施形態では、特に断りのない限り、ターゲットは宿泊施設であり、分析区分は宿泊施設が設けられた場所の地理的な区分である場合を例に説明する。地理的な区分は、例えば、市区などの行政区分などでもよいし、地表を所定の形状(例えば、メッシュ状)で区切った各領域などでもよい。収集部413は、例えば、ターゲット情報を分析してターゲットである宿泊施設の住所を抽出し、その住所に基づいて区分情報を生成することができる。

0025

分析装置42は、収集装置41が収集したターゲット情報を分析する。具体的には、分析装置42は、接続部421と、記憶部422と、制御部423とを有する。

0026

接続部421は、収集装置41と接続する。記憶部422は、種々の情報を記憶する。

0027

制御部423は、接続部421を介して収集装置41の蓄積部412から収集情報を取得し、その収集情報を分析する。制御部423は、その分析結果を示す結果情報を提供装置43に送信する。

0028

具体的には、先ず、制御部423は、収集情報内の各ターゲット情報から特定語句を抽出する。このとき、制御部423は、ターゲット情報内の全情報から特定語句を抽出してもよいし、ターゲット情報内の特定の分析対象情報から特定語句を抽出してもよい。分析対象情報は、例えば、クチコミ情報である。本実施形態では、制御部423は、ターゲット情報内の複数のクチコミ情報のそれぞれから特定語句を抽出する。

0029

特定語句の抽出処理では、例えば、制御部423は、クチコミ情報内の各語句の品詞を特定し、それらの語句のうち予め定められた品詞(例えば、名詞形容詞)の語句を特定語句として抽出する。また、制御部423は、記憶部422に予め記憶した対象語句とクチコミ情報内の各語句のマッチング処理を行い、クチコミ情報から対象語句と同じ語句を特定語句として抽出してもよい。

0030

特定語句を抽出すると、制御部423は、収集情報内の各ターゲット識別情報にて識別される各ターゲットについて、特定語句ごとに、そのターゲットである対象ターゲットに関するクチコミ情報において特定語句が出現する出現度数を算出する。出現度数は、本実施形態では、特定語句を含むクチコミ情報の数である。このため、例えば、同一のクチコミ情報に特定語句が複数回出現しても、出現度数は1となる。なお、出現度数は、特定語句が出現した回数でもよい。

0031

また、制御部423は、互いに類似する複数の類似語句の代表となる代表語句を特定語句として抽出してもよい。例えば、複数の類似語句と代表語句との対応関係を示す語句対応情報を記憶部422に予め記憶させておく。特定語句の抽出処理において、クチコミ情報内の類似語句が出現すると、制御部423は、記憶部422に記憶された語句対応情報において、出現した類似語句に対応する代表語句を、特定語句として抽出する。この場合、特定語句の出現度数は、代表語句に対応する各類似語句の出現度数の和となる。なお、類似語句は、例えば、「ラーメン」、「中華ソバ」および「拉麺」などであり、代表語句は、例えば、「ラーメン」である。この例において、対象ターゲットの各クチコミ情報から「ラーメン」2件、「中華ソバ」2件、「拉麺」1件が抽出された場合、代表語句「ラーメン」がその和の5件出現したことになる。また、代表語句は、類似語句のいずれかであってもよいし、類似語句とは別の語句でもよい。

0032

また、制御部423は、特定語句の前後の文脈解析して特定語句の使用状況を特定し、その使用状況を示す状況情報ごとに特定語句の出現度数を算出してもよい。制御部423は、例えば、使用状況を、特定語句が好意的な文脈で使用されている好意的状況と、特定語句が否定的な文脈で使用されている否定的状況のいずれかに特定する。また、制御部423は、使用状況を、好意的状況、否定的状況、および、特定語句が使用された文脈が不明な不明状況のいずれかに特定してもよい。

0033

また、制御部423は、出現度数の算出を所定の時間間隔で繰り返し行い、同じ特定語句に対して、最新の出現度数の過去の出現度数に対する割合が所定割合以上増加した場合、その割合に応じて出現頻度を調整(例えば、増加)させてもよい。なお、過去の出現度数は、例えば、前回算出した出現度数である。

0034

対象ターゲット情報の特定語句の出現度数が算出されると、他のターゲット情報についても、各々同様に、ターゲット情報の特定語句の出現度数を算出する。各ターゲット情報の特定語句の出現度数を算出すると、制御部423は、各ターゲットについて、特定語句ごとに、その特定語句の出現度数を、他のターゲットに関するクチコミ情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する。比較クチコミ情報は、対象ターゲット情報の特定語句の出現度数を比較する比較対象となるターゲット情報が有するクチコミ情報の集合であり、比較対象となるターゲット情報の集合を比較ターゲット情報と呼ぶ。比較クチコミ情報は、クチコミ情報全体でもよいし、対象ターゲットと分析区分が同じターゲットのクチコミ情報でもよい。なお、比較クチコミ情報は、対象ターゲットに関するクチコミ情報を含んでも含まなくてもよいが、本実施形態では、対象ターゲットに関するクチコミ情報を含む。

0035

補正度数の算出処理では、制御部423は、具体的には、比較度数に対する出現度数の突出度合いを示す特徴度を算出し、その特徴度に基づいて出現度数を補正する。このとき、制御部423は、突出度合いが既定値よりも高い場合、出現度数を特徴度に応じて大きくし、突出度合いが既定値よりも低い場合、出現度数を特徴度に応じて小さくする。また、制御部423は、突出度合いが既定値よりも高い場合、出現度数の補正を行わず、突出度合いが既定値よりも低い場合、出現度数を特徴度に応じて小さくしてもよい。また、制御部423は、特定語句のうち、所定数以上の各ターゲットに関するターゲット情報に共通した共通語句の出現度数だけを補正してもよい。所定数は、予め定められていてもよいし、ターゲットの数に予め定められた比率掛けた値でもよい。

0036

特徴度は、例えば、確率的コンプレキシティを用いて算出される。具体的には、特徴度ΔIは、計算式ΔI=I(D)−(I(E)+I(F))から算出される。ここでI(D)は、比較クチコミ情報に対応する確率的コンプレキシティであり、I(E)は特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティであり、I(F)は特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティである。

0037

確率的コンプレキシティは、



から算出される。ここで、mは、確率的コンプレキシティに対応する比較クチコミ情報に含まれるクチコミ情報の数であり、m1は、確率的コンプレキシティに対応する比較クチコミ情報内の対象ターゲットに関するクチコミ情報の数である。また、H(p)は、エントロピー関数であり、具体的には、



である。logは自然対数である。

0038

特徴度ΔIの計算式において、I(E)+I(F)は、情報量基準と呼ばれ、情報量基準が小さいほど、特定語句がターゲットの特徴的な語句を表す。

0039

以下、特徴度ΔIの具体例について説明する。
(特徴度ΔIの第1の具体例)
比較クチコミ情報の数を10,000件、比較クチコミ情報における語句Aを含むクチコミ情報の数(比較度数)を1,000件とする。

0040

このとき、対象ターゲットであるターゲットXに対するクチコミ情報の数が100件、語句Aを含むターゲットXに対するクチコミ情報の数(対象ターゲットにおける語句Aの出現度数)が30件であったとする。

0041

この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=30、m=1,000となり、I(E)=約138.42となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=100−30=70、m=10,000−1,000=9,000となり、I(F)=約414.46となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約11.97となる。

0042

また、対象ターゲットであるターゲットYに対するクチコミ情報の数が200件、語句Aを含むターゲットYに対するクチコミ情報の数(対象ターゲットにおける語句Aの出現度数)が40件であったとする。

0043

この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=200、m=10,000となり、I(D)=約985.22となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=40、m=1,000となり、I(E)=約171.62となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=200−40=160、m=10,000−1,000=9,000となり、I(F)=約808.12となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約5.48となる。

0044

この例では、ターゲットYにおける語句Aを含むクチコミ情報の数はターゲットXにおける語句Aを含むクチコミ情報の数よりも多いが、ターゲットXにおける語句Aの出現頻度がターゲットYにおける語句Aの出現頻度よりも高く、その結果、ターゲットXの特徴度ΔIがターゲットYの特徴度ΔIよりも高くなっている。

0045

(特徴度ΔIの第2の具体例)
比較クチコミ情報の数を10,000件、語句Bを含むクチコミ情報の数(比較度数)を3,000件であるとする。

0046

このとき、対象ターゲットであるターゲットXに対するクチコミ情報の数が100件、語句Bを含むターゲットXに対するクチコミ情報の数(対象ターゲットにおける語句Bの出現度数)が40件であったとする。

0047

この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=40、m=3,000となり、I(E)=約216.66となる。特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)では、m1=100−40=60、m=10,000−3,000=7,000となり、I(F)=約349.95となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約−1.77となる。

0048

また、対象ターゲットであるターゲットZに対するクチコミ情報の数が100件、語句Bを含むターゲットZに対するクチコミ情報の数(対象ターゲットにおける語句Bの出現度数)が50件であったとする。

0049

この場合、比較クチコミ情報に対応する確率的コンプレキシティI(D)では、m1=100、m=10,000となり、I(D)=約564.85となる。特定語句を含む比較クチコミ情報に対応する確率的コンプレキシティI(E)では、m1=50、m=3,000となり、I(E)=約258.53となる。I(F)では、m1=100−50=50、m=10,000−3,000=7,000となり、特定語句を含まない比較クチコミ情報に対応する確率的コンプレキシティI(F)=約301.56となる。したがって、特徴度ΔI=I(D)−(I(E)+I(F))=約4.76となる。

0050

この例では、語句Bのようにクチコミ情報に頻繁に出現する語句であっても、特定のターゲット(ターゲットZ)での出現度数が高いと、突出度合いを示す特徴度ΔIが高くなることが示されている。

0051

なお、上記の確率的コンプレキシティを用いた特徴度は、特徴度の単なる一例であって、これに限るものではない。特徴度は、例えば、比較クチコミ情報内の特定語句に対するターゲットごとの出現頻度の統計値を比較度数とした際の、比較度数に対する出現度数の割合などでもよい。統計値としては、平均値中央値などが挙げられる。

0052

例えば、第1のターゲット情報の各クチコミ情報から抽出された第1の特定語句の出現度数を65とし、第1〜s(sはターゲット情報の数)のターゲット情報の各々のクチコミ情報から抽出された第1の特定語句の出現度数の平均値(比較度数)が50とし、標準偏差を10とした場合、偏差値が65であり、既定値としての閾値を平均値+標準偏差の60とする。この場合、第1のターゲット情報から抽出された第1の特定語句の出現度数の特徴度を「(偏差値−閾値)*|偏差値−閾値|」で算出すると、特徴度は25となり、補正度数は出現度数+特徴度で90となる。仮に上記の例で、第1の特定語句の出現度数が50であった場合は、偏差値は50となり、特徴度は−100となり、補正度数は−50となる。第1のターゲット情報から抽出された第1の特定語句の出現度数が比較度数よりも大きければ特徴度が高くなり、反対に出現度数が比較度数よりも小さければ特徴度が低くなる。

0053

このように第1のターゲット情報から抽出された第1〜t1(t1は第1のターゲット情報の特定語句の数)の特定語句の出現度数に対する特徴度を各々算出し、更に、第2〜sのターゲット情報についても、各々のクチコミ情報から抽出された特定語句の出現度数に対する特徴度を各々算出する。そして、出現度数を特徴度で補正し補正度数を算出する。

0054

出現度数を補正した補正度数を算出すると、制御部423は、ターゲット識別情報ごとに、ターゲット情報と特定語句と補正度数とを対応付けた結果情報を生成して提供装置43に出力する。このとき、制御部423は、結果情報を記憶部422に記憶してもよい。

0055

提供装置43は、利用者端末30からの取得要求に応じた表示データを提供する。具体的には、提供装置43は、通信部431と、格納部432と、提供部433とを有する。

0056

通信部431は、ネットワーク100上の各装置と接続される。通信部431は、例えば、利用者端末30からターゲット情報の取得を要求する取得要求を受信し、分析装置42から結果情報を受信する。格納部432は、種々の情報を格納する。

0057

提供部433は、通信部431が受信した結果情報に基づいて表示データを生成する生成部である。具体的には、提供部433は、通信部431が受信した結果情報を格納部432に格納する。提供部433は、通信部431が取得要求を受信すると、格納部432に格納した結果情報に基づいて、取得要求に応じた表示データを生成して利用者端末30に送信する。

0058

具体的には、提供部433は、格納部432から、取得要求内の検索条件に合致するターゲット情報(ターゲット説明情報がターゲット情報とは別の情報として存在する場合は、ターゲット説明情報を検索範囲に含めてもよい)と、そのターゲット情報に対応する特定語句および補正度数を取得し、取得したターゲット情報、特定語句および補正度数に基づいて表示データを生成する。

0059

例えば、提供部433は、ターゲット情報に対応するターゲットの名称と、そのターゲット情報に対応する特定語句のうち補正度数が所定の表示条件を満たす特定語句とを対応付けたデータを表示データとして生成する。所定の表示条件を満たす特定語句は、具体的には、補正度数が高い特定語句である高頻出語である。高頻出語句は、補正度数が高い方から既定数分の特定語句でもよいし、補正度数が既定度数以上の特定語句でもよい。また、特定の使用状況(例えば、好意的状況)に対応する補正度数が高い特定語句を高頻出語句としてもよい。なお、ターゲット情報と高頻出語句との対応付けは、同じ表示データ内にターゲット情報と高頻出語句との対応付けたものでもよいし、複数の表示データにおいて互いにリンクを介して対応づけられたものでもよい。

0060

また、提供部433は、利用者端末30による表示データに対する操作に応じて、特定語句の補正度数および表示データの少なくとも一方を調整してもよい。

0061

また、提供部433は、利用者端末30に送信する利用者向けの表示データとは別に、ターゲットを提供する提供者向けの表示データを生成してもよい。この場合、提供部433は、例えば、所定の生成タイミングで表示データを生成して、提供者が使用する提供者端末(図示せず)に提供する。生成タイミングは、一定の時間間隔ごとでもよいし、分析システム40の管理者や提供者端末などから指示があったタイミングなどでもよい。

0062

以下、表示データの具体例について説明する。

0063

(表示データの第1の具体例)
図3は、表示データが利用者端末30に表示された際の第1の具体例を示す図である。図3の例の場合、提供部433は、先ず、図3(a)に示す表示データ500を生成して利用者端末30に送信する。表示データ500は、提供部433が取得したターゲット情報の一覧を示す一覧情報501を含む。一覧情報501内の各ターゲット情報502a〜502cは、宿泊施設に関する宿情報(ここでは、宿の名称、宿の説明を含む)であり、そのターゲット情報内のクチコミ情報において補正度数が高い高頻出語句503が対応付けられている。

0064

高頻出語句503のそれぞれには、対応するターゲット情報内のクチコミ情報のうち、その高頻出語句503を含むクチコミ情報へのリンクが張られている。利用者端末30にて高頻出語句503(リンク)が選択された場合、提供部433は、図3(b)に示す表示データ510を生成して利用者端末30に送信する。表示データ510は、選択された高頻出語句のリンク先のクチコミ情報511を含む。図3(b)は、ターゲット情報502cにおける高頻出語句503「ラーメン」が選択され、ターゲット情報502cに対応する宿のクチコミ情報のうち、高頻出語句503「ラーメン」が含まれるクチコミ情報が利用者端末30に送信され、利用者端末30にて表示された例が示されている。

0065

表示データ510の各クチコミ情報511には、選択された高頻出語句512が含まれる。クチコミ情報511では、選択された高頻出語句512を強調表示する処理が提供部433にて施されている。図の例では、高頻出語句512を太字表示することで強調しているが、強調方法は、この例に限らず、例えば、拡大表示網掛け表示などの他の方法でもよい。なお、選択された高頻出語句512に加えて、他の高頻出語句が強調されてもよい。その際、選択された高頻出語句512と他の高頻出語句の強調方法を変えることで、選択された高頻出語句512を判別可能にしてもよい。

0066

(表示データの第2の具体例)
図4は、表示データが利用者端末30に表示された際の第2の具体例を示す図である。図4に示す表示データ500aは、図3(a)に示す表示データ500と比べて、高頻出語句503の表示方法が異なっている。

0067

提供部433は、表示データ500aにおけるターゲット情報502bの高頻出語句503に、高頻出語句503の使用状況を示す状況情報504を対応付けしている。図4の例では、表示データ500aが利用者端末30に送信され、利用者端末30により、状況情報504が、高頻出語句503に使用状況に応じた網で示されて、利用者端末30にて表示される。具体的には、高頻出語句503を抽出する際に、制御部423にて、好意的状況と否定的状況とに区別されて出現度数が算出され、補正度数が算出されており、高頻出語句503が示されている枠内における網がかかっている領域の大きさと網がかかっていない領域の大きさの比が好意的状況の補正度数と否定的状況の補正度数の比となるように、表示データ500aは提供部433にて作成されている。また。状況情報504は、例えば、使用状況を濃淡で表してもよい。なお、第2の具体例の場合、制御部423は、特定語句の好意的状況と否定的状況との各出現度数からそれぞれ補正度数を算出し、算出後の好意的状況と否定的状況との各補正度数の割合から補正度数の比を算出してもよいが、特定語句の好意的状況と否定的状況との出現度数の割合を記憶しておき、好意的状況と否定的状況の出現度数の合計した値を基に、補正度数を算出し、当該出現度数の割合を補正度数の比としてもよい。

0068

(表示データの第3の具体例)
図5は、表示データが利用者端末30に表示された際の第3の具体例を示す図である。図5の例の場合、提供部433は、先ず、図5(a)に示す表示データ600を生成して利用者端末30に送信する。表示データ600は、比較クチコミ情報内の各ターゲット情報に含まれる高頻出語句601が、提供部433により抽出され、抽出された高頻出語句601の一覧を示す語句一覧情報602を含めて作成される。提供部433は、高頻出語句601に、その高頻出語句601を含むクチコミ情報を有するターゲット情報へのリンクを張る。高頻出語句601(リンク)が利用者端末30にて選択された場合、提供部433は、図5(b)に示す表示データ610を生成して利用者端末30に送信する。図5(b)は、高頻出語句601「ラーメン」が選択され、各ターゲット情報に対応する宿のクチコミ情報のうち、語句「ラーメン」が高頻出語句として抽出されたクチコミ情報を有するターゲット情報の一覧が提供部433により作成され、その一覧が利用者端末30に送信されて表示された例が示されている。

0069

表示データ610は、選択された高頻出語句601を含むクチコミ情報を有するターゲット情報の一覧を示す一覧情報611を含む。一覧情報611内の各ターゲット情報612は、図3に示したターゲット情報502a〜502cと同様に、高頻出語句613を含み、高頻出語句613には、その高頻出語句613を含むクチコミ情報へのリンクが張られている。

0070

(表示データの第4の具体例)
第4の具体例では、提供部433は、表示データとして図5(a)に示す表示データ600を生成する際に、語句一覧情報602に含ませる高頻出語句601を、利用者の属性情報に応じて決定する。属性情報は、利用者端末30からの取得要求に含まれる。属性情報は、例えば、宿泊施設の利用者の年齢、人数、種別大人または子供など)および性別などを示す。

0071

具体的には、クチコミ情報に対して予めカテゴリ情報を対応付けておき、分析装置42の制御部423が結果情報を生成する際に、抽出した特定語句に、その特定語句を抽出したクチコミ情報のカテゴリ情報を対応付ける。カテゴリ情報は、例えば、ファミリーカップル男子旅、子旅、一人旅または団体旅行などを示す。なお、カテゴリ情報はターゲットの種類に応じて変更される。例えば、ターゲットが物件の場合、カテゴリ情報は、ファミリー、一人暮らし一戸建てまたはマンションなどとなる。

0072

提供部433は、高頻出語句から、利用者の属性情報に合致したカテゴリ情報が対応付けられた語句を選択し、その選択した語句を示す語句一覧情報602を含む表示データ600を生成する。このとき、属性情報とカテゴリ情報との対応関係を示す情報を格納部432に予め格納しておき、提供部433は、属性情報に対応するカテゴリ情報を、属性情報に合致したカテゴリ情報と判断する。例えば、提供部433は、属性情報が「大人二人、子供三人」のように「大人」と「子供」の両方を含んでいる場合、カテゴリ情報として「ファミリー」を選択する。さらに提供部433は、カテゴリ情報「ファミリー」に対応付けられた語句「アイスクリーム」、「ラーメン」などを選択し、その選択された「アイスクリーム」、「ラーメン」などの語句一覧情報602を生成して利用者端末30に送信する。語句一覧情報602内の語句が利用者端末30にて選択された場合の処理は、第3の具体例と同様である。

0073

(表示データの第5の具体例)
第5の具体例は、提供部433が利用者端末30の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する例である。

0074

例えば、提供部433は、表示データとして、ターゲットに対する注文処理を行うことが可能なWebサイトである注文サイトへのリンクを含むデータを生成する。このような表示データとしては、例えば、図3(a)に示した表示データ500の各ターゲット情報502a〜502cに、そのターゲット情報に対応するターゲットに対する予約処理を行うことが可能な注文サイトへのリンクを張ったものである。

0075

提供部433は、利用者端末30による表示データに対する操作を監視して、利用者端末30による表示データの表示履歴を示す履歴情報を取得する。そして利用者端末30の表示データから注文サイトへの移動を検知すると、提供部433は、履歴情報に基づいて、表示データおよび補正度数の少なくとも一方を調整する。

0076

例えば、提供部433は、履歴情報として、表示データの表示中にどの高頻出語句が選択されたかの選択履歴を取得し、表示データから注文サイトへの移動を検知すると、その利用者端末30の選択履歴にて、直前に選択された高頻出語句をカウントし、一定期間中に、注文サイトへの移動直前に選択された高頻出語句の選択回数の積に応じて、高頻出語句の補正度数を調整したり、表示データに含まれる高頻出語句の強調方法を調整したりする。例えば、各利用者端末30にて注文サイトへの移動する10分前に選択された高頻出語句をカウントし、1週間の間に、選択回数が既定回数以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。また、提供部433は、履歴情報として、高頻出語句を含む表示データの表示時間を取得してもよい。この場合、例えば、各利用者端末30にて高頻出語句の表示された表示時間をカウントし、表示時間の積が既定時間以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。

0077

(表示データの第6の具体例)
第6の具体例は、第5の具体例と同様に、提供部433が利用者端末30の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する例である。具体的には、提供部433は、表示データに含まれる高頻出語句に対する利用者端末30による所定の操作を検出し、その所定の操作に応じて特定語句の補正度数および表示データの少なくとも一方を調整する

0078

図6は、表示データの第6の具体例を示す図である。図6(a)に示す注文サイト700のように、ターゲットの注文時に、その注文の参考にした高頻出語句を選択する選択機能701が備わっている場合、提供部433は、注文サイト700において利用者端末30が高頻出語句を選択する操作を所定の操作として検出し、その所定の操作にて選択された高頻出語句に基づいて、表示データおよび補正度数の少なくとも一方を調整する。

0079

例えば、提供部433は、各利用者端末30の所定の操作において高頻出語句が選択された選択回数を一定期間カウントし、その選択回数に基づいて、高頻出語句の補正度数を調整する。例えば、各利用者端末30にて選択された高頻出語句の選択回数を1カ月間カウントし、選択回数が既定回数以上になった高頻出語句が発生した場合、提供部433は、その高頻出語句の補正度数を高くするか、または、その高頻出語句を他の語句よりも目立つように強調して表示する。また、提供部433は、図6(b)に示す表示データ710ように、表示データ710内の高頻出語句711に対して、その高頻出語句が選択された選択回数712を対応付けてもよい。

0080

(表示データの第7の具体例)
図7は、提供部433が作成した表示データが表示された際の第7の具体例を示す図である。図7に示す表示データ800は、提供者向けの表示データの一例である。

0081

提供部433は、表示データ800を、特定の提供者が提供するターゲットである提供ターゲットに関する自社情報800aと、提供ターゲットと分析区分が同じ他のターゲットに関する競合他社情報800bとを含めて作成する。自社情報は、提供部433により、提供ターゲットにおいて抽出した高頻出語句801と、その高頻出語句801を含む提供ターゲットに関するクチコミ情報802とを有して作成される情報である。競合他社情報800bは、提供部433により、提供ターゲットと分析区分が同じ他のターゲットにおける高頻出語句803がターゲットごとに抽出され、抽出された高頻出語句803が各々のターゲットごとに対応付けられて表示される情報である。提供部433は作成した表示データを、所定のタイミングで提供者が使用する提供者端末(図示せず)に提供する。

0082

次に動作を説明する。

0083

図8は、情報提供システム1の動作を説明するためのシーケンス図である。

0084

先ず、収集装置41の収集部413は、所定の収集タイミングになると、伝送部411を介してWebサーバ10とターゲット情報格納装置20との少なくとも1つと接続し、接続したWebサーバ10または、ターゲット情報格納装置20からターゲット情報を収集する(ステップS101)。収集タイミングは、一定の時間間隔ごとでもよいし、分析システム40の管理者から指示があったタイミングでもよい。

0085

収集部413は、収集した各ターゲット情報に対して区分情報とターゲット識別情報とを生成し、ターゲット情報と区分情報とをターゲット識別情報ごと対応付けた収集情報を蓄積部412に蓄積する(ステップS102)。

0086

その後、分析装置42の制御部423は、接続部421を介して収集装置41と接続して、収集装置41に蓄積された収集情報を取得し(ステップS103)、その収集情報内の各ターゲット情報から特定語句を抽出する(ステップS104)。制御部423は、収集情報内の各ターゲット識別情報が識別する各ターゲットについて、特定語句ごとに、そのターゲットである対象ターゲットに関するクチコミ情報において特定語句が出現する出現度数を算出する(ステップS105)。制御部423は、各ターゲットについて、特定語句ごとに、その特定語句の出現度数を比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する(ステップS106)。

0087

制御部423は、ターゲット識別情報ごとに、ターゲット情報と特定語句と補正度数とを対応付けた結果情報を生成して、接続部421を介して提供装置43に出力する(ステップS107)。提供装置43の通信部431が結果情報を受信すると、提供部433は、その結果情報を格納部432に格納する(ステップS108)。

0088

その後、通信部431が利用者端末30から取得要求を受信すると(ステップS109)、提供部433は、格納部432に格納した結果情報に基づいて、取得要求に応じた表示データを生成して利用者端末30に送信する。利用者端末30は、表示データを受信すると、その表示データを表示する(ステップS110)。

0089

以上説明したように本実施形態によれば、蓄積部412は、ターゲットに関するターゲット情報をターゲットごとに蓄積する。制御部423は、各ターゲットについて、そのターゲットである対象ターゲットに関するターゲット情報において特定語句が出現する出現度数を、他のターゲットに関するターゲット情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正した補正度数を算出する。提供部433は、ターゲット情報、特定語句および補正度数に応じた表示データを生成する。

0090

したがって、ターゲット情報において特定語句が出現する出現度数が、他のターゲットに関するターゲット情報を含む比較クチコミ情報において特定語句が出現する比較度数に基づいて補正され、ターゲット情報、特定語句および補正度数に応じた表示データが生成される。このため、複数のターゲットに対して同じ特定語句が出現する場合でも、ターゲット間の特定語句の出現頻度の違いなどに応じた表示データを生成することが可能になる。したがって、ターゲットの特徴を表す表示データを生成することが可能になるため、ターゲットの特徴を容易に把握することが可能になる。

0091

また、本実施形態では、制御部423は、特定語句の出現度数として、特定語句を含むクチコミ情報の数を算出する。このため、表示データに利用者によるターゲットの評価をターゲットの特徴として反映しやすくすることが可能になり、ターゲットの特徴をより容易に把握することが可能になる。

0092

また、本実施形態では、比較クチコミ情報は、対象ターゲットと分析区分が同じターゲットに関するターゲット情報である。このため、比較対象を適切に選択することが可能になるため、出現度数の補正にターゲットの特徴をより適切に反映させることが可能になる。したがって、ターゲットの特徴をより容易に把握することが可能になる。

0093

また、本実施形態では、制御部423は、比較度数に対する出現度数の突出度合いを示す特徴度を算出し、特徴度に基づいて出現度数を補正する。このため、特定語句の出現度数の突出度合いは特定語句の特徴を表すため、出現度数の補正にターゲットの特徴をより適切に反映させることが可能になる。したがって、ターゲットの特徴をより容易に把握することが可能になる。

0094

また、本実施形態では、提供部433は、ターゲット情報と、そのターゲット情報に対応する特定語句のうち補正度数が所定の表示条件を満たす特定語句とを対応付けたデータを表示データとして生成する。このため、特定語句のうち補正度数が高い高頻出語句のようなターゲットの特徴を反映した語句をターゲット情報に対応づけて表示することが可能になるため、ターゲットの特徴をより容易に把握することが可能になる。

0095

また、本実施形態では、提供部433は、利用者端末30による表示データに対する操作に応じて、特定語句の補正度数および表示データの少なくとも一方を調整する。このため、他の利用者が興味を持った特定語句などを表示データに反映させることが可能になるため、ターゲットの特徴をより容易に把握することが可能になる。

0096

以上説明した各実施形態において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。

0097

例えば、ターゲットとして主に宿泊施設を用いて説明したが、ターゲットは宿泊施設に限らない。また、分析システム40は、複数種類のターゲット(例えば、宿泊施設と飲食店など)に関するターゲット情報を分析してもよい。この場合、区分情報に、ターゲットの種類を示す種類情報を加えることで、種類ごとに適切な分析を行うことができる。

0098

また、分析システム40の構成は適宜変更可能である。例えば、蓄積部412、記憶部422および格納部432は、同一の記憶装置にて実現されてもよい。収集情報は、分析システム40の管理者などから収集装置41に直接登録されてもよい。

0099

また、情報提供システム1の各装置の機能は、その機能を実現するためのプログラムを、コンピュータにて読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ実行させることで、実現されてもよい。

0100

1情報提供システム
10Webサーバ
20ターゲット情報格納装置
30利用者端末
40分析システム
41収集装置
42分析装置
43提供装置
411伝送部
412蓄積部
413収集部
421 接続部
422 記憶部
423 制御部
431通信部
432 格納部
433 提供部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ