図面 (/)

技術 対話方法、対話プログラム及び情報処理装置

出願人 富士通株式会社
発明者 高橋哲朗
出願日 2018年8月29日 (2年4ヶ月経過) 出願番号 2018-160641
公開日 2020年3月5日 (9ヶ月経過) 公開番号 2020-034694
状態 未査定
技術分野 音声認識 音声の分析・合成
主要キーワード 関連情報群 任意範囲 スロットテーブル スコア取得 回答抽出 各関連情報 関連情報テーブル 同行者
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2020年3月5日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

課題

ユーザとの自然な対話を継続させることを目的としている。

解決手段

コンピュータによる対話方法であって、前記コンピュータが、ユーザの発話情報を取得し、取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、抽出した関連情報を出力する。

概要

背景

近年では、ユーザとシステムとがテキストデータによって対話を行う対話システムが普及しつつある。この対話システムの1つとして、スロットフィリング形式の対話を行うものが知られている。

スロットフィリング形式の対話を行う対話システムでは、予め用意された項目について、各項目の値を埋めるための質問文順番にユーザに提示し、ユーザが回答を入力すると、この回答を項目の値として取得し、特定の処理を実行する。また、この対話システムでは、ユーザに対し、自身の回答の内容を提示することで、対話システムに回答が伝わったか否かを確認させるものもある。

概要

ユーザとの自然な対話を継続させることを目的としている。コンピュータによる対話方法であって、前記コンピュータが、ユーザの発話情報を取得し、取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、抽出した関連情報を出力する。

目的

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

コンピュータによる対話方法であって、前記コンピュータが、ユーザの発話情報を取得し、取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、抽出した関連情報を出力する、対話方法。

請求項2

前記関連情報を含む相槌文を示す応答情報を生成し、前記応答情報を、前記発話情報と対応付けて出力する、請求項1記載の対話方法。

請求項3

文書集合に含まれる文脈情報を学習データとした固有表現抽出モデルを生成し、前記複数の関連情報を前記固有表現抽出モデルの入力として、前記複数の関連情報毎に、関連情報が前記回答の属性を示す関連情報である確率を示すスコアを取得し、前記スコアが最も大きい関連情報を、前記回答の属性を示す関連情報として抽出する、請求項1又は2記載の対話方法。

請求項4

コンピュータによる対話方法であって、前記コンピュータが、ユーザに対する質問文端末装置に表示させ、前記質問文に対する回答を含む発話文の入力を受け付けて、前記回答を含み且つ前記回答と関連する関連情報を含む相槌文を前記発話文と対応付けて前記端末装置に表示させる、対話方法。

請求項5

ユーザの発話情報を取得し、取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、抽出した関連情報を出力する、処理をコンピュータに実行させる対話プログラム

請求項6

ユーザの発話情報を取得する発話受付部と、取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得する関連情報取得部と、前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出する抽出部と、抽出した関連情報を出力する出力部と、を有する情報処理装置

技術分野

0001

本発明は、対話方法対話プログラム及び情報処理装置に関する。

背景技術

0002

近年では、ユーザとシステムとがテキストデータによって対話を行う対話システムが普及しつつある。この対話システムの1つとして、スロットフィリング形式の対話を行うものが知られている。

0003

スロットフィリング形式の対話を行う対話システムでは、予め用意された項目について、各項目の値を埋めるための質問文順番にユーザに提示し、ユーザが回答を入力すると、この回答を項目の値として取得し、特定の処理を実行する。また、この対話システムでは、ユーザに対し、自身の回答の内容を提示することで、対話システムに回答が伝わったか否かを確認させるものもある。

先行技術

0004

特開2016−71050号公報

発明が解決しようとする課題

0005

上述した対話システムでは、入力された回答を繰り返し提示する機械的な手法で、対話システムに回答が伝わったか否かをユーザに確認させる。このため、上述した対話システムでは、ユーザが回答する回数が増えるにつれて、ユーザに違和感や不自然さを感じさせることになり、自然な対話の継続に支障をきたす可能性がある。

0006

1つの側面では、本発明は、ユーザとの自然な対話を継続させることを目的としている。

課題を解決するための手段

0007

一つ態様では、コンピュータによる対話方法であって、前記コンピュータが、ユーザの発話情報を取得し、取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、抽出した関連情報を出力する。

0008

上記各手順は、上記各手順を実現する機能部、各手順を実現する処理としても良く、各処理をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体とすることもできる。

発明の効果

0009

ユーザとの自然な対話を継続させることができる。

図面の簡単な説明

0010

対話システムの概要を説明する図である。
対話システムのシステム構成の一例を説明する図である。
対話装置ハードウェア構成の一例を示す図である。
テーブル記憶部に保持されたスロットテーブルの一例を示す図である。
対話処理部の機能について説明する図である。
関連情報テーブルの一例を示す図である。
固有表現抽出学習部の処理を説明するフローチャートである。
対話処理部の処理を説明する第一のフローチャートである。
対話処理部の処理を説明する第二のフローチャートである。
対話処理部の処理を説明する第三のフローチャートである。

実施例

0011

以下に、図面を参照して、本実施形態について説明する。図1は、対話システムの概要を説明する図である。

0012

本実施形態の対話システム100は、対話装置200と、端末装置300とを含み、対話装置200と端末装置300とは、ネットワークを介して接続される。

0013

本実施形態の対話システム100において、対話装置200は、特定の目的を持った対話を実現するアルゴリズムの一つである、スロットフィリング形式の対話を行う対話装置である。

0014

具体的には、対話装置200は、端末装置300に対して、予め用意された項目の値を入力させる質問文を出力する(ステップS1)。そして、対話装置200は、端末装置300において、質問文に対する回答が入力され、端末装置300から回答を示す情報を受信すると、この回答を示す情報を、質問文に含まれる項目の値として取得し、特定の目的に応じた処理を実行する(ステップS2)。

0015

また、本実施形態の対話装置200は、回答を示す情報を受信すると、回答と関連する関連情報を取得する。そして、対話装置200は、取得した関連情報の中から、回答の属性を示す関連情報を選択し、回答に対する応答として、端末装置300に表示させる(ステップS3)。以下の説明では、回答に対する応答を、回答に対する相槌、回答に対する相槌文等と表現する場合がある。

0016

図1の例では、対話装置200は、「行き先目的地)と人数に応じた移動ルートを提示する」という目的を持った対話を実現するものである。

0017

本実施形態の対話装置200は、端末装置300のユーザPに対して、予め用意された項目の1つである「行き先」の回答を入力させるための質問文Q1を生成し、端末装置300の画面301に表示させる。

0018

尚、画面301は、端末装置300において、対話装置200との対話の開始を指示する操作が行われると、端末装置300に表示される画面の一例である。

0019

本実施形態の端末装置300は、画面301において、入力欄302に回答文発話文)A1が入力されると、回答文A1を質問文Q1と対応付けて表示させ、回答文A1を示す情報を対話装置200に送信する。

0020

以下の説明では、質問文を示す情報を質問情報と呼び、回答文(発話文)を示す情報を、発話情報と呼ぶ場合がある。また、以下の説明では、発話情報に含まれる文字列であって、質問文に含まれる項目の値となる文字列を、回答、又は、回答となる文字列と呼ぶ場合がある。

0021

本実施形態の対話装置200は、端末装置300から回答文A1を示す発話情報を受信すると、発話情報から、項目「行き先」の値を示す文字列を、回答として抽出する。図1の例では、項目「行き先」の値となる文字列(回答)は、「シカゴ」であるため、文字列「シカゴ」が、回答として抽出される。

0022

本実施形態の対話装置200は、発話情報から回答を抽出すると、外部の情報源検索して回答の関連情報を取得し、取得した回答情報の中から、回答の属性を示す関連情報を選択する。

0023

そして、対話装置200は、選択した関連情報を含む相槌文を、端末装置300に表示させる。

0024

また、対話装置200は、相槌文を表示させた後に、次の項目の値を入力させるための質問文を端末装置300に表示させる。

0025

図1の例では、質問文Q1に含まれる項目は「行き先」であり、この項目の属性は、「場所」である。したがって、項目「行き先」の値である回答の属性も、「場所」である。

0026

よって、対話装置200は、回答「シカゴ」に基づき取得した関連情報の中から、「シカゴ」が「場所」を示している関連情報R1を選択し、関連情報R1を含む相槌文H1を生成して、端末装置300の画面301に表示させる。

0027

図1の例では、相槌文H1として、「シカゴは、ボブ・○○さん出身地で有名です。」というテキストデータが表示されており、この中に含まれる関連情報R1である「シカゴは、ボブ・デービッドソンの出身地で有名」は、「シカゴ」という場所を示していることがわかる。また、相槌文H1において、関連情報R1には、回答となる文字列「シカゴ」が含まれることがわかる。

0028

また、相槌文H1は、回答文A1を受けた応答として表示されており、相槌文H1が回答文A1と対応付けられていることがわかる。

0029

本実施形態では、対話装置200は、相槌文H1を画面301に表示させると、次に、項目「同行者」の値を入力させるための質問文Q2を端末装置300の画面301に表示させる。

0030

このように、本実施形態の対話装置200は、回答に関連する関連情報の中から、回答の属性を示す関連情報を選択し、選択された関連情報を、回答を受け付けたことを確認させる相槌文として、端末装置300に表示させる。

0031

言い換えれば、対話装置200は、ユーザに対する質問文を表示させ、質問文に対する回答を含む発話文の入力を受け付けると、回答と、回答と関連する関連情報と、を含む応答文(相槌文)を生成し、発話文と対応付けて表示させる。以下の説明では、応答文(相槌文)を示す情報を応答情報と表現する場合がある。

0032

したがって、本実施形態によれば、対話装置200から出力される相槌文は、回答の属性に応じて異なるものとなり、ユーザの回答に対して、変化に富んだ相槌文を出力することができる。

0033

また、本実施形態によれば、相槌文に、回答と、回答の属性に基づき選択された関連情報とを含めるため、ユーザに対し、対話装置200による回答の内容の理解の度合いを提示することができる。したがって、本実施形態では、ユーザに対し、対話装置200が回答を正しく理解しているか否かを確認させることができる。

0034

これらのことから、本実施形態によれば、ユーザとの自然な対話を継続させることに貢献できる。

0035

以下に、本実施形態の対話システム100について、さらに説明する。図2は、対話システムのシステム構成の一例を説明する図である。

0036

本実施形態の対話システム100の対話装置200は、対話処理部210、固有表現抽出学習部220、モデル記憶部230、テーブル記憶部240を有する。

0037

また、本実施形態の対話装置200は、端末装置300以外に、例えば、情報源400と、固有表現タグ付きコーパス500と、ネットワークを介して接続される。

0038

情報源400は、例えば、ネットワーク上に構築されたデータベース群であり、様々な情報が格納されている。情報源400は、対話処理部210により参照される。

0039

固有表現タグ付きコーパス500は、人名、場所、組織名、製品名等の固有名詞に対して、その範囲を示す構造が予めメタデータとして付与されている文書集合である。

0040

尚、図2の例では、情報源400と固有表現タグ付きコーパス500は、対話システム100の外部に設けられるものとしたが、これに限定されない。情報源400と固有表現タグ付きコーパス500は、対話システム100に含まれていても良い。また、情報源400と固有表現タグ付きコーパス500は、それぞれが対話装置200に設けられていても良い。

0041

本実施形態の対話処理部210は、端末装置300のユーザとの対話を実現するための対話処理を実行する。具体的には、対話処理部210は、テーブル記憶部240が保持しているスロットテーブル241を参照して、質問情報を生成する。

0042

また、本実施形態の対話処理部210は、モデル記憶部230が保持している固有表現抽出モデル231に、回答に関連する関連情報を入力して得られた結果に基づき、関連情報の中から、回答の属性を示す関連情報を選択し、応答情報を生成する。対話処理部210の詳細は後述する。

0043

固有表現抽出学習部220は、対話処理部210による対話処理を実行する前の事前処理として、固有表現タグ付きコーパス500を用いて固有表現抽出モデル231を生成し、モデル記憶部230に格納する。固有表現抽出モデル231は、対話処理部210による応答情報の生成の際に用いられる。

0044

本実施形態の固有表現抽出学習部220は、固有表現タグ付きコーパス500に含まれる文脈情報のみの学習によって、固有表現抽出モデル231を生成する。

0045

本実施形態の固有表現抽出モデル231は、関連情報が入力されると、関連情報の文脈に基づき、関連情報が回答の属性を示す確率を示すスコアを出力する。固有表現抽出学習部220の処理の詳細は後述する。

0046

モデル記憶部230は、固有表現抽出モデル231を保持するための記憶領域である。テーブル記憶部240は、対話処理部210により参照されるスロットテーブル241を保持するための記憶領域である。

0047

次に、図3を参照して、本実施形態の対話装置200のハードウェア構成について説明する。図3は、対話装置のハードウェア構成の一例を示す図である。

0048

本実施形態の対話装置200は、それぞれバスBで相互に接続されている入力装置21、出力装置22、ドライブ装置23、補助記憶装置24、メモリ装置25、演算処理装置26及びインターフェース装置27を含む情報処理装置である。

0049

入力装置21は、各種の情報の入力を行うための装置であり、例えばキーボードポインティングデバイス等により実現される。出力装置22は、各種の情報の出力を行うためものであり、例えばディスプレイ等により実現される。インターフェース装置27は、LANカード等を含み、ネットワークに接続する為に用いられる。

0050

本実施形態の対話処理部210、固有表現抽出学習部220を実現する対話プログラムは、対話装置200を制御する各種プログラムの少なくとも一部である。対話プログラムは例えば記憶媒体28の配布やネットワークからのダウンロード等によって提供される。対話プログラムを記録した記憶媒体28は、CD−ROMフレキシブルディスク光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。

0051

また、対話プログラムは、対話プログラムを記録した記憶媒体28がドライブ装置23にセットされると、記憶媒体28からドライブ装置23を介して補助記憶装置24にインストールされる。ネットワークからダウンロードされた対話プログラムは、インターフェース装置27を介して補助記憶装置24にインストールされる。

0052

補助記憶装置24は、インストールされた対話プログラムを格納すると共に、上述した固有表現抽出モデル231やスロットテーブル241等の必要なファイル、データ等を格納する。メモリ装置25は、対話装置200の起動時に補助記憶装置24から対話プログラムを読み出して格納する。そして、演算処理装置26はメモリ装置25に格納された対話プログラムに従って、後述するような各種処理を実現している。

0053

次に、図4を参照して、本実施形態のスロットテーブル241について説明する。図4は、テーブル記憶部に保持されたスロットテーブルの一例を示す図である。

0054

本実施形態のスロットテーブル241は、対話システム100毎に予め用意されて、テーブル記憶部240に保持されている。

0055

本実施形態のスロットテーブル241は、情報の項目として、スロット名と、タイプと、スロット値とを有する。

0056

項目「スロット名」の値は、対話装置200から端末装置300に送信される質問情報に含まれる項目の名称を示す。言い換えれば、項目「スロット名」の値は、端末装置300に表示される質問文に含まれる項目であり、端末装置300のユーザに値を入力させる項目である。

0057

項目「タイプ」の値は、対応するスロット名の属性を示す。言い換えれば、項目「タイプ」の値は、質問文に含まれる項目の属性(発話文に含まれる回答の属性)を示す。

0058

項目「スロット値」の値は、発話情報から抽出された、質問情報に含まれる項目の値を示す。言い換えれば、項目「スロット値」の値は、質問文に対する発話文に含まれる回答である。

0059

図4の例では、スロット名「行き先」と、タイプ「場所」とが対応付けられている。したがって、質問文に含まれる項目が「行き先」である場合、質問文の回答となるスロット値「シカゴ」の属性は「場所」であり、スロット値「シカゴ」は、場所を示す文字列として扱われる。

0060

また、図4の例では、スロット名「期間」と、タイプ「日付」とが対応付けられている。したがって、質問文に含まれる項目が「期間」である場合、質問文の回答となるスロット値は、日付を示す文字列として扱われる。

0061

次に、図5を参照して、本実施形態の対話処理部210の機能について説明する。図5は、対話処理部の機能について説明する図である。

0062

本実施形態の対話処理部210は、質問文生成部211、発話受付部212、回答抽出部213、回答登録部214、相槌文生成部215、出力部216を有する。

0063

質問文生成部211は、端末装置300から、対話の開始の指示を受け付けると、スロットテーブル241の項目「スロット値」の値を初期化し、項目「スロット名」の値を、回答させる項目として含む質問文を生成する。言い換えれば、質問文生成部211は、スロットテーブル241の項目「スロット名」の値を含む質問情報を生成する。

0064

発話受付部212は、端末装置300から受信した発話情報の入力を受け付ける。回答抽出部213は、発話受付部212が受け付けた発話情報から、質問に対する回答を抽出する。言い換えれば、回答抽出部213は、発話情報が示す発話文から、スロット値を抽出する。具体的には、回答抽出部213は、発話情報を解析し、発話情報に含まれる単語から、スロット値と対応付けられたタイプ(属性)の単語を、スロット値として抽出する。

0065

回答登録部214は、回答抽出部213が抽出したスロット値をスロットテーブル241に格納する。

0066

相槌文生成部215は、発話受付部212が受け付けた発話情報と、情報源400とから、回答に対する相槌文を示す応答情報を生成する。相槌文生成部215の詳細は後述する。

0067

出力部216は、質問文生成部211が生成した質問情報や、相槌文生成部215が生成した応答情報を端末装置300に出力する。

0068

以下に、相槌文生成部215について説明する。本実施形態の相槌文生成部215は、関連情報取得部251、スコア取得部252、相槌文選択部253を有する。

0069

関連情報取得部251は、発話情報に含まれる回答と関連する関連情報を取得する。尚、本実施形態の関連情報とは、回答と関連する様々な情報を含む。

0070

具体的には、関連情報取得部251は、回答抽出部213により抽出されたスロット値(回答)により、情報源400を検索する。そして、関連情報取得部251は、検索結果として抽出された情報を、回答と関連する関連情報として、関連情報テーブル254に保持する。つまり、本実施形態の関連情報テーブル254は、応答情報(相槌文)を生成する度に作成される。

0071

本実施形態では、関連情報テーブル254に格納された関連情報は、相槌文の一部となり得る相槌候補となる。また、関連情報テーブル254に格納される関連情報には、スロット値(回答)と同一の文字列が含まれる。以下の説明では、関連情報に含まれる、スロット値と同一の文字列を、関連情報における同一文字列と表現する場合がある。関連情報テーブル254の詳細は後述する。

0072

スコア取得部252は、関連情報テーブル254に格納された関連情報を固有表現抽出モデル231に適用した結果と、スロット値のタイプとに基づき、関連情報と対応付けられるスコアを取得する。

0073

スコア取得部252が取得するスコアとは、関連情報における同一文字列が、スロット値と同じタイプの文字列として扱われている確率を示す値である。スコア取得部252によって、関連情報毎に取得されたスコアは、関連情報テーブル254において、関連情報と対応付けられて保持される。

0074

相槌文選択部253は、スコア取得部252によって取得されたスコアが最も大きい関連情報を、相槌文に含める関連情報に選択し、相槌文を示す応答情報を生成する。

0075

以下に、図6を参照して、本実施形態の関連情報テーブル254について説明する。図6は、関連情報テーブルの一例を示す図である。

0076

本実施形態の関連情報テーブル254では、関連情報と、スコアとが対応付けられている。以下の説明では、関連情報テーブル254において、関連情報とスコアとを対応付けた情報をスコア付き関連情報と呼ぶ。

0077

図6の例では、質問文に含まれるスロット名(項目)が「行き先」であり、発話文に含まれるスロット値(回答)が「シカゴ」であり、スロット名と対応付けられたタイプ(属性)が「場所」である場合に、生成された関連情報テーブル254の例を示している。

0078

関連情報テーブル254において、スコア付き関連情報61では、「シカゴの曲最高」という関連情報に対して、スコア「0.07」が対応付けられている。

0079

つまり、スコア付き関連情報61に含まれる関連情報では、この関連情報における同一文字列「シカゴ」が、スロット値「シカゴ」と同じ属性である「場所」として扱われている確率が、7%であることを示している。

0080

同様に、スコア付き関連情報62では、関連情報に対して、スコア「0.75」が対応付けられており、スコア付き関連情報63では、関連情報に対して、スコア「0.91」が対応付けられている。

0081

したがって、関連情報テーブル254に格納された関連情報のうち、関連情報「シカゴは、ボブ・○○さんの出身地で有名」は、同一文字列「シカゴ」を、回答の属性である「場所」を示す文字列として扱っている確率が最も高いことがわかる。

0082

次に、図7を参照して、本実施形態の固有表現抽出学習部220の処理について説明する。図7は、固有表現抽出学習部の処理を説明するフローチャートである。図7の処理は、対話処理部210による処理の事前処理として行われる。

0083

本実施形態の固有表現抽出学習部220は、固有表現タグ付きコーパス500から、文脈情報を学習し、固有表現抽出モデル231を生成し(ステップS701)、モデル記憶部230に、固有表現抽出モデル231を格納して(ステップS702)、処理を終了する。

0084

ここで、固有表現抽出モデル231の生成について説明する。

0085

本実施形態の固有表現抽出学習部220は、予めタグが付与された文書集合である固有表現タグ付きコーパス500に含まれる文書データの文脈情報を学習データに用いた機械学習によって、固有表現抽出モデル231を生成する。

0086

文脈情報とは、各単語がどのような文脈で使用されたかを示す情報であり、単語前後の任意範囲の文字列や、単語間共起関係等を示す情報である。

0087

以下に、文脈情報について具体的に説明する。例えば、固有表現タグ付きコーパス500に含まれる学習データとして、「今日は<地名>川崎</地名>に行く」という文書データと、「<人名>川崎</人名>君から本を借りた」という文書データが存在したとする。

0088

この学習データの文脈情報は、「「に行く」の前に出る語は地名になりやすい」、「「君」の前に出る語は人名になりやすい」である。

0089

本実施形態の固有表現抽出学習部220は、このような文脈情報のみを特徴量として用いて学習することで、固有表現抽出モデル231を生成する。

0090

本実施形態では、このようにして固有表現抽出モデル231を生成することで、固有表現抽出モデル231に関連情報を適用した場合に、対象となる語(回答)が、例えば、地名である確率、人名である確率等が、スコアとして出力させることができる。

0091

次に、図8乃至図10を参照して、本実施形態の対話処理部210の処理を説明する。図8は、対話処理部の処理を説明する第一のフローチャートである。

0092

図8では、端末装置300のユーザとの対話を開始する際の対話処理部210の初期動作を示している。

0093

本実施形態の対話処理部210は、端末装置300から、対話の開始指示を受け付けると、質問文生成部211により、スロットテーブル241スロット値を初期化する(ステップS801)。具体的には、質問文生成部211は、スロットテーブル241の項目「スロット値」の値を空にする。

0094

続いて、対話処理部210は、質問文生成部211は、スロットテーブル241を参照し、値が空となっているスロット値と対応するスロット名を含む質問文を生成する(ステップS802)。

0095

続いて、対話処理部210は、出力部216により、質問文を出力し、端末装置300に表示させ(ステップS803)、初期動作を終了する。

0096

図9は、対話処理部の処理を説明する第二のフローチャートである。図9では、ユーザの回答に対して応答する処理を示している。

0097

本実施形態の対話処理部210は、発話受付部212により、発話情報の入力を受け付けると(ステップS901)、回答抽出部213により、発話情報から、スロット値(回答)を抽出する(ステップS902)。

0098

続いて、対話処理部210は、回答登録部214により、発話情報からスロット値が抽出されているか否かを判定する(ステップS903)。言い換えれば、回答登録部214は、発話情報に、テーブル記憶部240のスロットテーブル241に登録される対象となる回答が含まれるか否かを判定している。

0099

ステップS903において、スロット値が抽出されていない場合、後述するステップS906へ進む。

0100

尚、スロット値が抽出されていない場合とは、例えば、質問文について、ユーザが回答を入力しなかった場合である。具体的には、例えば、質問文が「同行者は誰ですか?」であった場合に、発話文が「まだ決まっていない」という内容であった場合等である。

0101

ステップS903において、スロット値が抽出されていた場合、対話処理部210は、回答登録部214により、抽出されたスロット値をスロットテーブル241に登録する(ステップS904)。

0102

続いて、対話処理部210は、相槌文生成部215により、相槌を生成する(ステップS905)。ステップS905の詳細は後述する。

0103

続いて、対話処理部210は、質問文生成部211により、値が空となっているスロット値と対応するスロット名を含む質問文を生成する(ステップS906)。

0104

続いて、対話処理部210は、出力部216により、生成した相槌文と質問文とを、端末装置300へ出力し(ステップS907)、処理を終了する。

0105

尚、図9の例では、回答に対する相槌文と次の質問文のそれぞれを生成してから、相槌文と次の質問文とを共に出力するものとしたが、これに限定されない。

0106

相槌文と次の質問文とは、それぞれが別々に出力されても良い。具体的には、例えば、相槌文が生成された後に、相槌文のみが端末装置300に出力され、相槌文が出力された後に、次の質問文が生成されて端末装置300に出力されても良い。

0107

この場合、端末装置300では、画面301に示すように(図1参照)、相槌文H1と次の質問文Q2とが、一つの吹き出しの中に表示されなくても良く、相槌文H1と質問文Q2とが、それぞれ独立した吹き出しの中に表示されても良い。

0108

また、本実施形態では、相槌文と質問文とを続けて出力させるものとしたが、これに限定されない。本実施形態では、例えば、相槌文を出力した後に、端末装置300のユーザから、回答の内容を確認したことを示す返答を受けてから、次の質問文を生成して出力しても良い。

0109

図10は、対話処理部の処理を説明する第三のフローチャートである。図10では、ステップS915における相槌文生成部215の処理の詳細を示している。

0110

本実施形態の相槌文生成部215は、関連情報取得部251により、回答の関連情報を取得する(ステップS1001)。具体的には、相槌文生成部215は、スロットテーブル241に登録されたスロット値を検索キーとして、情報源400の検索を行い、検索結果を関連情報群として取得し、関連情報テーブル254に各関連情報を格納する。

0111

続いて、相槌文生成部215は、スコア取得部252により、関連情報テーブル254に格納された各関連情報に固有表現抽出モデル231を適用し、関連情報毎のスコアを取得する(ステップS1002)。

0112

以下に、スコア取得部252による関連情報毎のスコアの取得について説明する。以下では、図6に示す関連情報テーブル254に格納された各関連情報のスコアを取得する場合について説明する。

0113

図6の関連情報テーブル254では、抽出されたスロット値「シカゴ」を検索キーとして取得した関連情報「シカゴの曲最高」、「シカゴと言えば、ボブ・○○さん」、「シカゴは、ボブ・○○さんの出身地で有名」が格納されている。

0114

関連情報「シカゴの曲最高」を固有表現抽出モデル231の入力とした場合、固有表現抽出モデル231は、同一文字列「シカゴ」が人名として扱われている確率を示すスコアと、同一文字列「シカゴ」が場所として扱われている確率を示すスコアと、を出力する。

0115

言い換えれば、固有表現抽出モデル231は、関連情報「シカゴの曲最高」において、同一文字列「シカゴ」の属性が「人名」である確率を示すスコアと、同一文字列「シカゴ」の属性が「場所」である確率を示すスコアとを出力する。

0116

ここでは、同一文字列「シカゴ」の属性が「人名」である確率を示すスコアが0.82であり、同一文字列「シカゴ」の属性が「場所」である確率を示すスコアが0.07であったとする。

0117

また、固有表現抽出モデル231は、関連情報「シカゴと言えば、ボブ・○○さん」が入力されると、同一文字列「シカゴ」の属性が「人名」である確率を示すスコア0.32と、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア0.75を出力する。また、固有表現抽出モデル231は、文字列「ボブ・○○」の属性が「場所」である確率を示すスコア0.48を出力する。

0118

また、固有表現抽出モデル231は、関連情報「シカゴと言えば、ボブ・○○さん」、「シカゴは、ボブ・○○さんの出身地で有名」が入力されると、同一文字列「シカゴ」の属性が「人名」である確率を示すスコア0.09と、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア0.91を出力する。

0119

このように、本実施形態の固有表現抽出モデル231は、関連情報に含まれる単語について、ある属性の単語として扱われている確率を示すスコアを出力する。

0120

本実施形態のスコア取得部252は、各関連情報について、同一文字列の属性毎のスコアが出力されると、各関連情報について、スロット値「シカゴ」の属性「場所」と対応するスコアを、関連情報に対応付けられるスコアとして取得する。

0121

具体的には、スコア取得部252は、関連情報「シカゴの曲最高」に対応付けられるスコアとして、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア「0.07」を取得し、関連情報テーブル254に、関連情報「シカゴの曲最高」と対応付けて格納する。

0122

また、スコア取得部252は、関連情報「シカゴと言えば、ボブ・○○さん」に対応付けられるスコアとして、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア「0.75」を取得する。

0123

尚、文字列「ボブ・○○」は、属性が「場所」であるが、文字列「ボブ・○○」が同一文字列ではないため、除外される。

0124

同様に、スコア取得部252は、関連情報「シカゴは、ボブ・○○さんの出身地で有名」と対応付けられるスコアとして、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア「0.91」を取得する。

0125

ステップS1002のスコア取得部252の処理に続いて、相槌文生成部215は、相槌文選択部253により、ステップS1002で取得されたスコアが最も大きい関連情報を選択する(ステップS1003)。つまり、本実施形態の相槌文選択部253は、関連情報取得部251により取得された複数の関連情報から、回答の属性を示す関連情報を抽出する抽出部の一例となる。

0126

ここでは、スコア0.91と対応付けられた関連情報「シカゴは、ボブ・○○さんの出身地で有名」が選択される。

0127

続いて、相槌文生成部215は、選択された関連情報を含む相槌文を生成し(ステップS1004)、処理を終了する。

0128

本実施形態では、以上の処理により、ユーザの回答に対して、回答が意味しているカテゴリの関連情報を相槌文として提示することができる。このため、本実施形態によれば、ユーザに対して、ユーザの発話の意味をシステムが理解していることを示すことができ、対話における不自然さを軽減させることができる。

0129

開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
コンピュータによる対話方法であって、前記コンピュータが、
ユーザの発話情報を取得し、
取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、
前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、
抽出した関連情報を出力する、対話方法。
(付記2)
前記関連情報を含む相槌文を示す応答情報を生成し、
前記応答情報を、前記発話情報と対応付けて出力する、付記1記載の対話方法。
(付記3)
文書集合に含まれる文脈情報を学習データとした固有表現抽出モデルを生成し、
前記複数の関連情報を前記固有表現抽出モデルの入力として、前記複数の関連情報毎に、関連情報が前記回答の属性を示す関連情報である確率を示すスコアを取得し、
前記スコアが最も大きい関連情報を、前記回答の属性を示す関連情報として抽出する、付記1又は2記載の対話方法。
(付記4)
前記関連情報は、前記回答を示す文字列と同様の文字列を含む、付記1乃至3の何れか一項に記載の対話方法。
(付記5)
コンピュータによる対話方法であって、前記コンピュータが、
ユーザに対する質問文を端末装置に表示させ、
前記質問文に対する回答を含む発話文の入力を受け付けて、前記回答を含み且つ前記回答と関連する関連情報を含む相槌文を前記発話文と対応付けて前記端末装置に表示させる、対話方法。
(付記6)
ユーザの発話情報を取得し、
取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、
前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、
抽出した関連情報を出力する、処理をコンピュータに実行させる対話プログラム。
(付記7)
ユーザの発話情報を取得する発話受付部と、
取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得する関連情報取得部と、
前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出する抽出部と、
抽出した関連情報を出力する出力部と、を有する情報処理装置。

0130

本発明は、具体的に開示された実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

0131

100対話システム
200対話装置
210対話処理部
211質問文生成部
212発話受付部
213回答抽出部
214回答登録部
215相槌文生成部
216 出力部
220固有表現抽出学習部
230モデル記憶部
231固有表現抽出モデル
240 テーブル記憶部
241スロットテーブル
251関連情報取得部
252スコア取得部
253 相槌文選択部
300端末装置
400情報源
500固有表現タグ付きコーパス

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ