図面 (/)

技術 質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトの作成方法

出願人 日本電信電話株式会社
発明者 北井幹雄西宏之荒井和博本間茂
出願日 1993年4月23日 (27年7ヶ月経過) 出願番号 1993-097575
公開日 1994年11月4日 (26年0ヶ月経過) 公開番号 1994-308996
状態 未査定
技術分野 音声の分析・合成 音声認識
主要キーワード 同一確認 告知文 プロンプト情報 確認音声 確認文 認識確度 質問応答装置 ビットパタン
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1994年11月4日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (2)

目的

質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプト汎用的な枠組に従って設計して、操作者入力内容の認識が不確実な分野への質問応答型の対話装置の適用を容易にする方法を提供する。

構成

要求文を認識の難易度確定した単語の単語種別に応じて記憶し、また、確認文を認識の難易度、確定した単語の単語種別、認識候補の単語種別に対応して記憶し、更に、認識候補の単語種別と確定した単語の単語種別から確認を行なうべきか否かを判断する質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトの作成方法

概要

背景

ここで、質問応答型の対話装置操作者との間の関係は、対話装置は操作者に対してコマンドの要求をすると共にコマンドの認識結果を確認する質問者として動作する一方、操作者は対話装置の要求および確認に応答する回答者として行動するという関係にある。この種の質問応答型の対話装置は周知であり、慣用されている。

従来の質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプト作成方法は、具体的には、対象とするタスク特殊性を考慮して特殊性に対応する最適なものとすべく個別に作成するという方法を採用しており、汎用的な枠組に従って作成するというものは見当たらない。特に、操作者の入力内容の認識が不確実な分野を対象とする場合に、プロンプトの提示仕方を変更することができるプロンプトの作成方法を実現することは質問応答型の対話装置を好適に実用化する観点から重要なことであり、この発明はこの様なニーズに対応するものである。

また、実際の質問応答装置と操作者との間の対話において、認識結果が得られた時にいずれの時点で確認動作に入るかを指定することができることは、質問応答装置の動作の自然性および操作時間の短縮の観点から重要なことであるが、この点に関しても従来は対象とするタスクの特殊性を考慮して個別に作成するという設計方法を採用しており、汎用的な枠組に従って作成するということはなされていない。

概要

質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトを汎用的な枠組に従って設計して、操作者の入力内容の認識が不確実な分野への質問応答型の対話装置の適用を容易にする方法を提供する。

要求文を認識の難易度確定した単語の単語種別に応じて記憶し、また、確認文を認識の難易度、確定した単語の単語種別、認識候補の単語種別に対応して記憶し、更に、認識候補の単語種別と確定した単語の単語種別から確認を行なうべきか否かを判断する質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトの作成方法。

目的

質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトの作成方法の従来例は、上述した通り、対象とするタスクの特殊性を考慮して対応する最適なものとすべく個別に作成するというものであったが、この発明はこれを汎用的な枠組に従って設計し、操作者の入力内容の認識が不確実な分野への質問応答型の対話装置の適用を容易にすることができる、質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトの作成方法を提供するものである。

効果

実績

技術文献被引用数
0件
牽制数
5件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

操作者に1個或は複数個の単語の入力を要求し、要求に応じて操作者から入力された1個或は複数個の単語を認識し、認識確度が高くない場合は認識結果の正誤の確認を行なって操作者が入力した1個或は複数個の単語の確定を行ない、確定した単語に対応した処理を行なう質問応答型の対話装置において、単語種別の確定の是非および確定した単語の内容を記憶し、操作者の音声を認識した結果の内の未確認の単語候補について各単語候補毎に単語種別および認識確度の情報を記憶し、操作者に提示する要求文と要求文を操作者に提示する際に認識対象とする単語種別と同一要求文の繰り返し許容回数とを、確定した単語の単語種別と未確認の単語候補の単語種別と認識の難易度とに対応して記憶し、同一要求文の繰り返し回数カウントし、出力された要求文が変わる度毎に、新たな単語が確定する度毎に、および要求プロンプト難易度記憶手段の難易度が変わる度毎に、要求プロンプト出力回数カウント手段の繰り返し回数を0にクリアし、新たな単語が確定する度毎に、および出力される要求文が変わる度毎に難易度をその初期値に設定し直し、要求プロンプト出力回数カウント手段のカウント数が要求プロンプト情報記憶手段に記憶されているプロンプトの繰り返し許容回数を超えた場合に現在の難易度が予め設定された最低難易度より高く且つ要求プロンプト情報記憶手段に1段階低い難易度のプロンプト情報が存在するならば難易度を1だけ下げ確定単語情報記憶手段に記憶されている確定した単語の単語種別と未確認候補情報記憶手段に記憶される未確認の単語候補の単語種別と要求プロンプト難易度記憶手段に記憶される難易度とから、使用対象となる要求文の型と認識対象とする単語種別とを要求プロンプト情報記憶手段から求め、要求文に確定した単語の埋め込み、および要求文から未確認の単語候補に対応する単語の提示部分の削除を行なって操作者に提示する要求文の作成、認識対象単語の設定を行う、ことを特徴とする質問応答型の対話装置におけるコマンドの要求のためのプロンプトの作成方法

請求項2

操作者に1個或は複数個の単語の入力を要求し、要求に応じて操作者から入力された1個或は複数個の単語を認識し、認識確度が高くない場合は認識結果の正誤の確認を行なって操作者が入力した1個或は複数個の単語の確定を行ない、確定した単語に対応した処理を行なう質問応答型の対話装置において、単語種別の確定の是非および確定した単語の内容を記憶し、操作者により入力された単語の認識結果を、連結した単語の組および単語種別毎に、認識確度が予め決められた値以上のものを予め決められた有限個以内記憶し、認識結果記憶手段に記憶されている結果の正誤の確認に必要な単語種別を、確定した単語の単語種別に対応して記憶し、操作者に認識結果の正誤を確認する確認文と確認の際に認識対象とする単語と同一の確認文の繰り返し許容回数とを、既に確定した単語の単語種別と確認する単語候補の単語種別と認識の難易度とに対応して記憶し、確認した候補の正誤を同定する度毎に、および同一確認プロンプトの出力回数が繰り返し許容回数を超える度毎に、確認プロンプト出力回数カウント手段をゼロクリアし、確認プロンプト出力回数カウント手段のカウント数が確認プロンプト情報記憶手段に記憶されるプロンプトの繰り返し許容回数を超えた場合に、現在の難易度が予め設定した最低難易度より高く且つ確認プロンプト情報記憶手段に現在の難易度より1段階低い難易度のプロンプト情報が存在するならば難易度を1だけ下げ、確定単語記憶手段に記憶されている単語の単語種別により認識結果確認イミング記憶手段から確認に必要な単語種別を求め、当該単語種別と認識結果記憶手段に記憶されている単語種別とが一致する場合に認識結果記憶手段に記憶されている未確認の認識結果を取り出し、当該認識候補の単語種別と確認プロンプト難易度記憶手段に記憶された難易度とにより、確認プロンプト情報記憶手段から操作者に認識結果の正誤を確認する確認文と確認の際の認識対象単語とを求めて確認文に認識候補の単語の埋め込みを行ない、操作者に提示する確認文の作成、認識対象単語の設定を行う、ことを特徴とする質問応答型の対話装置におけるコマンドの認識結果の確認のためのプロンプトの作成方法。

技術分野

0001

この発明は、質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプト作成方法に関する。

背景技術

0002

ここで、質問応答型の対話装置と操作者との間の関係は、対話装置は操作者に対してコマンドの要求をすると共にコマンドの認識結果を確認する質問者として動作する一方、操作者は対話装置の要求および確認に応答する回答者として行動するという関係にある。この種の質問応答型の対話装置は周知であり、慣用されている。

0003

従来の質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトの作成方法は、具体的には、対象とするタスク特殊性を考慮して特殊性に対応する最適なものとすべく個別に作成するという方法を採用しており、汎用的な枠組に従って作成するというものは見当たらない。特に、操作者の入力内容の認識が不確実な分野を対象とする場合に、プロンプトの提示仕方を変更することができるプロンプトの作成方法を実現することは質問応答型の対話装置を好適に実用化する観点から重要なことであり、この発明はこの様なニーズに対応するものである。

0004

また、実際の質問応答装置と操作者との間の対話において、認識結果が得られた時にいずれの時点で確認動作に入るかを指定することができることは、質問応答装置の動作の自然性および操作時間の短縮の観点から重要なことであるが、この点に関しても従来は対象とするタスクの特殊性を考慮して個別に作成するという設計方法を採用しており、汎用的な枠組に従って作成するということはなされていない。

発明が解決しようとする課題

0005

質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトの作成方法の従来例は、上述した通り、対象とするタスクの特殊性を考慮して対応する最適なものとすべく個別に作成するというものであったが、この発明はこれを汎用的な枠組に従って設計し、操作者の入力内容の認識が不確実な分野への質問応答型の対話装置の適用を容易にすることができる、質問応答型の対話装置におけるコマンドの要求およびコマンドの認識結果の確認のためのプロンプトの作成方法を提供するものである。

課題を解決するための手段

0006

操作者に1個或は複数個の単語の入力を要求し、要求に応じて操作者から入力された1個或は複数個の単語を認識し、認識確度が高くない場合は認識結果の正誤の確認を行なって操作者が入力した1個或は複数個の単語の確定を行ない、確定した単語に対応した処理を行なう質問応答型の対話装置において、確定単語情報記憶手段1を具備して、単語種別の確定の是非および確定した単語の内容を記憶し、未確認候補情報記憶手段2を具備して操作者の音声を認識した結果の内の未確認の単語候補について各単語候補毎に単語種別および認識確度の情報を記憶し、要求プロンプト情報記憶手段3を具備して、操作者に提示する要求文と要求文を操作者に提示する際に認識対象とする単語種別と同一要求文の繰り返し許容回数とを、確定した単語の単語種別と未確認の単語候補の単語種別と認識の難易度とに対応して記憶し、要求プロンプト出力回数カウント手段4を具備して、同一要求文の繰り返し回数をカウントし、出力された要求文が変わる度毎に、新たな単語が確定する度毎に、および要求プロンプト難易度記憶手段5の難易度が変わる度毎に、その繰り返し回数を0にクリアし、要求プロンプトの難易度を設定、記憶する要求プロンプト難易度記憶手段5を具備して、新たな単語が確定する度毎に、および出力される要求文が変わる度毎に難易度の初期値に設定し直され、要求プロンプト出力回数カウント手段4のカウント数が要求プロンプト情報記憶手段3に記憶されているプロンプトの繰り返し許容回数を超えた場合に現在の難易度が予め設定された最低難易度より高く且つ要求プロンプト情報記憶手段3に1段階低い難易度のプロンプト情報が存在するならば難易度を1だけ下げ、要求プロンプト作成手段6を具備して、確定単語情報記憶手段1に記憶される確定した単語の単語種別と未確認候補情報記憶手段2に記憶される未確認の単語候補の単語種別と要求プロンプト難易度記憶手段5に記憶される難易度とから、使用対象となる要求文の型と認識対象とする単語種別とを要求プロンプト情報記憶手段3から求め、要求文に確定した単語の埋め込み、および要求文から未確認の単語候補に対応する単語の提示部分の削除を行なって操作者に提示する要求文の作成、認識対象単語の設定を行う、質問応答型の対話装置におけるコマンドの要求のためのプロンプトの作成方法を構成した。

0007

そして、操作者に1個或は複数個の単語の入力を要求し、要求に応じて操作者から入力された1個或は複数個の単語を認識し、認識確度が高くない場合は認識結果の正誤の確認を行なって操作者が入力した1個或は複数個の単語の確定を行ない、確定した単語に対応した処理を行なう質問応答型の対話装置において、確定単語情報記憶手段1を具備して、単語種別の確定の是非および確定した単語の内容を記憶し、認識結果記憶手段2を具備して、操作者により入力された単語の認識結果を、連結した単語の組および単語種別毎に、認識確度が予め決められた値以上のものを予め決められた有限個以内記憶し、認識結果確認イミング記憶手段3を具備して、認識結果記憶手段2に記憶されている結果の正誤の確認に必要な単語種別を、確定した単語の単語種別に対応して記憶し、確認プロンプト情報記憶手段4を具備して、操作者に認識結果の正誤を確認する確認文と確認の際に認識対象とする単語と同一の確認文の繰り返し許容回数とを、既に確定した単語の単語種別と確認する単語候補の単語種別と認識の難易度とに対応して記憶し、確認プロンプト出力回数カウント手段5を具備して、これを確認した候補の正誤を同定する度毎に、および同一確認プロンプトの出力回数が繰り返し許容回数を超える度毎に、ゼロクリアし、確認プロンプトの難易度を設定、記憶する確認プロンプト難易度記憶手段6を具備して、確認プロンプト出力回数カウント手段5のカウント数が確認プロンプト情報記憶手段4に記憶されるプロンプトの繰り返し許容回数を超えた場合に現在の難易度が予め設定した最低難易度より高く且つ確認プロンプト情報記憶手段4に現在の難易度より1段階低い難易度のプロンプト情報が存在するならば難易度を1だけ下げ、確認プロンプト作成手段7を具備して、確定単語記憶手段1に記憶されている単語の単語種別により認識結果確認タイミング記憶手段3から確認に必要な単語種別を求め、当該単語種別と認識結果記憶手段2に記憶されている単語種別とが一致する場合に認識結果記憶手段2に記憶されている未確認の認識結果を取り出し、当該認識候補の単語種別と確認プロンプト難易度記憶手段6に記憶された難易度とにより、確認プロンプト情報記憶手段4から操作者に認識結果の正誤を確認する確認文と確認の際の認識対象単語とを求めて確認文に認識候補の単語の埋め込みを行ない、操作者に提示する確認文の作成、認識対象単語の設定を行う、質問応答型の対話装置におけるコマンドの認識結果の確認のためのプロンプトの作成方法を構成した。

0008

質問応答型の対話装置におけるコマンドの要求のためのプロンプトの作成方法の実施例を図1を参照して説明する。実際の質問応答型の対話装置においては、確定単語情報記憶手段1および未確認候補情報記憶手段2への入力は、対話装置の操作者と対話装置との間の対話の進行(操作者による入力内容の同定のための要求プロンプトの出力とそれに対する操作者の応答の認識、更にこの認識結果の正誤の確認のための確認プロンプトの出力とそれに対する操作者の応答の認識)に対応して実行され、これら記憶手段の記憶内容が変化する。当該記憶内容が変化する度に、要求プロンプト出力回数カウント手段4のカウンタは0に初期化され、また要求プロンプト難易度記憶手段5の難易度も初期値に設定し直され、これらの諸パラメータの変化を反映した要求プロンプトが要求プロンプト作成手段6において作成されることになる。

0009

ここで、質問応答型の対話装置としての全体の処理の流れの説明は省略し、この発明に直接関係のある図1に示される各手段の機能と処理について時刻を指定する場合を例として説明する。時刻の表現の仕方としては、12時間制の表現の仕方および24時間制の表現の仕方の2通りの表現の仕方が一般的である。以下、操作者に1分単位で任意の時刻を指定してもらう場合について考慮する。

0010

12時間制の表現の仕方においては「午前/午後」、「何時」および「何分」の3種類の単語グループの入力が必要であり、「午前/午後」については午前或は午後の指定が必要であり、「何時」については0時から11時に到るいずれかの指定が必要であり、そして「何分」については0分から59分に到るいずれかの指定をする必要がある。

0011

一方、24時間制の表現の仕方においては「何時」および「何分」の2種類の単語グループの入力が必要であり、「何時」については0時から24時に到るいずれかの指定が必要であり、「何分」については0分から59分に到るいずれかの指定が必要である。ここで、12時間制の3種類の単語グループ「午前/午後」、「何時」および「何分」と、24時間制の2種類の単語グループ「何時」および「何分」について、共通する部分を一種類の単語グループとして表1の4種類の単語グループ(この発明はこれを単語種別と呼んでいる。以下、単語種別、と称する)を用意する。

0012

ID=000002HE=055 WI=098 LX=0560 LY=1700
以上の説明と表1をも参照して図1の記憶手段の記憶内容および図1全体の動作の説明をする。確定単語情報記憶手段1には、表1の4種類の単語種別の確定の是非および確定している場合はその単語の内容が記憶されている。確定単語情報記憶手段1の記憶内容のイメージの例を表2および表3に示す。

0013

0014

ID=000004HE=060 WI=090 LX=0600 LY=0950
表2は単語が何も確定していない場合の記憶例であり、表3は単語種別「午前/午後」の単語「午前」が確定した場合の記憶例である。単語が確定していない場合は、単語の欄に“NULL”という文字が書いてある。未確認候補情報記憶手段2には、操作者により入力された内容の認識結果の内の正誤を評価していない結果の単語種別および認識確度が記憶される。未確認候補情報記憶手段2の記憶内容のイメージは表4および表5に示される。

0015

0016

ID=000006HE=050 WI=130 LX=0400 LY=2300
表4は単語が何も確定していない場合の記憶例であり、表5は単語種別「何分」の単語「40分」、「30分」が未確認の場合の記憶例である。候補を構成する単語種別の情報が“NULL”の場合は、その候補にはその単語種別の単語が含まれていないことを示している。

0017

或る単語種別の認識候補のみにより認識結果の正誤を確認すると操作者が不自然感じたり、或は操作時間が長引くと判断される場合に、この未確認候補情報記憶手段2の記憶内容は有効である。例えば、未だ確定単語がない場合に質問応答型の対話装置が「何時何分ですか」と操作者に入力要求した場合に、操作者は「10時30分」と発声したにもかかわらず、対話装置が「10時」を認識することができずに「30分」のみしか認識結果が得られない場合に、対話装置が単純に「30分ですか」と操作者に確認すると、操作者はどう答えてよいのか返答に窮する場合がある。この様な場合、「30分」の認識結果を未確認候補情報記憶手段2に一時蓄積しておいて「何時台ですか」と操作者に要求し直して、「何時」であるかを確認してから「?時30分ですか」と再確認した方が操作者には自然に感じられるし、2回目に「10時」を正しく認識することができれば操作時間の短縮にもつながる。この未確認候補情報記憶手段2は上述された通りの自然感を与え、操作時間を短縮するために設けられたものである。

0018

要求プロンプト情報記憶手段3は、操作者に対して時刻の指定の要求をするに際して提示する文と、この要求文を操作者に提示する際に認識対象とする単語種別と、同一要求文の繰り返し許容回数とを、確定した単語の単語種別と、未確認の単語候補の単語種別と、認識の難易度とに応じて記憶する手段であり、記憶内容のイメージ例は表6に示される。

0019

ID=000007HE=195 WI=116 LX=0470 LY=0300
表6の記憶内容は、質問応答型の対話装置の設計者がタスクに依存した知識を使用して操作者と対話装置との間の質問応答がスムーズになされる様に、特に応答が良好に認識されない場合であっても難易度を下げて認識することができる様に設定する必要がある。

0020

表6においては、表1の各単語種別の有無を4ビットの0(なし)および1(あり)のパタンにより表現している。左から1ビット目が単語種別「午前/午後」を示し、左から2ビット目が単語種別「何時11迄」を示し、左から3ビット目が単語種別「何時12〜」を示し、左から4ビット目が単語種別「何分」を示す。

0021

4個のビットパタンの種類は16種あるが、表6には時刻の単語の要求に必要な部分のみを書いた。これは、上述した通り時刻には12時間制と24時間制の表現方法があり、前者は単語種別「午前/午後」と「何時11迄」と「何分」の組合せにより表現し、後者は「何時12〜」と「何分」の組み合わせにより表現し、すべてが未定の場合と「何分」は共通であるので、2の3乗通りプラス2の2乗通りマイナス2、即ち10通りだけ考えれば良いからである。

0022

また、表6は最低難易度を1とし、難易度の初期値は2としている。この場合の各難易度におけるプロンプト情報には3個の情報が記憶されており、表6においては、簡単のために〔1〕に要求文、〔2〕に要求文を操作者に提示する場合に認識対象とする単語種別のビットパタン、〔3〕にこの要求文の繰り返し許容回数を書いている。

0023

要求文中のWD1、WD2、WD3、WD4は確定した単語の埋め込みの要求を意味しており、“+”は記号間および記号と他の文章区切りを意味する。認識対象とする単語種別のビットパタンは、単語種別の有無のビットパタンと同じ意味表現で、ビットが立っている単語種別を認識対象にするという意味である。

0024

要求文の繰り返し回数については、現在より1段階低い難易度のプロンプト情報がある場合は自然数が書かれ、ない場合は0が書かれる。各単語種別の有無のビットパタンについて、各難易度におけるプロンプト情報の有無は文がNULLか否かにより判断することができ、NULLであれば無いことを意味する。また、文がNULLではないのに認識対象とする単語種別のビットパタンが0となっている場合があるが、これは時刻の同定に必要なキーワードがすべて確定したことを意味し、この場合の要求文は時刻を同定することができたことを操作者に知らせる告知文となる。

0025

要求プロンプト出力回数カウント手段4は、同じ要求文の繰り返し回数をカウントする手段であり、初期値として0を有し、出力される要求文が変わる度毎に、新たな単語が確定する度毎に、および難易度が変わる度毎にカウンタを0にするものである。今回の例はこのカウンタは0であるものとしている。要求プロンプト難易度記憶手段5は、要求プロンプトの難易度を設定、記憶する手段であり、今回の例は初期値2を有し、新たな単語が確定する度毎に、および出力される要求文が変わる度毎に初期値に設定し直され、要求プロンプト出力回数カウント手段4のカウント数が要求プロンプト情報記憶手段3に記憶されているプロンプトの繰り返し許容回数を超えた場合、現在の難易度(現在の難易度は2であるものとする)が予め設定された最低難易度(今回の例は1)より高く且つ要求プロンプト情報記録手段3に1段階低い難易度のプロンプト情報が存在するならば難易度を1下げるものである。。

0026

要求プロンプト作成手段6は、確定単語情報記憶手段1に記憶される確定した単語の単語種別と、未確認候補情報記憶手段2に記憶される未確認の単語候補の単語種別と、要求プロンプト難易度記憶手段5に記憶される難易度とから、使用対象となる要求文と、認識対象とする単語種別とを要求プロンプト情報記憶手段3から求め、要求文として確定した単語の埋め込み、および要求文から未確認の単語候補に対応する単語の提示部分の削除を行なって、操作者に提示する要求文の作成および認識対象単語の設定を行うものである。

0027

ここで、確定単語情報記憶手段1の記憶内容は表2、未確認候補情報記憶手段2の記憶内容は表4、要求プロンプト情報記憶手段3の記憶内容は表6、要求プロンプト難易度記憶手段5に記憶されている難易度は2であるものとした場合に作成される要求文は以下の如くになる。単語は何も確定しておらず難易度は初期値2であるので、要求文は「何時からですか」となる。12時間制による入力を想定する場合、この文は例えば「午前または午後の何時何分ですか」が良いが、24時間制で指定したいと考える操作者もいると思われるので「何時何分ですか」としており、但し、12時間制による入力も受け付けられる様に、すべての単語種別を認識対象としている。この要求文を2回出力した後においても、どの単語種別も確定しなければ、難易度が1下げられて要求文は「午前または午後のいずれですか」となり、認識対象は単語種別「午前/午後」のみとなり認識しやすくなる。

0028

また、確定単語情報記憶手段1の記憶内容は表3、未確認候補情報記憶手段2の記憶内容は表5、要求プロンプト情報記憶手段3の記憶内容は表6、要求プロンプト難易度記憶手段5に記憶されている難易度は2である場合、要求文を説明のために作成してみると、単語「午前」が確定し、単語種別「何分」の単語「40分」と「30分」が未確認となるので、要求文は表6より「午前何時台ですか」となり、単語種別「何時11迄」が認識対象となる。

0029

次に、質問応答型の対話装置におけるコマンドの認識結果の確認のためのプロンプトの作成方法の実施例を図2を参照して説明する。実際の質問応答型の対話装置においては、確定単語情報記憶手段1および認識結果記憶部2への入力は、対話装置の操作者との間の対話の進行(操作者による入力内容の同定のための要求プロンプトの出力とそれに対する操作者の応答の認識、更にこの認識結果の正誤の確認のための確認プロンプトの出力とそれに対する操作者の応答の認識)に対応して実行され、これら記憶手段の記憶内容が変化する。そして、認識結果記憶手段2に記憶されている候補単語の単語種別が確定単語情報記憶手段1に記憶されている確定単語の単語種別の下において認識結果確認タイミング記憶手段3に記憶されている確認に必要な単語種別の条件を満足する場合、認識結果記憶手段2に記憶されている認識結果が操作者に確認されることになる。条件を満足しない場合は、先の実施例の様な方法により新たに操作者に単語の入力を要求することになる。

0030

以下、時刻を指定する場合を例として説明する。確定単語情報記憶手段1は、上述の実施例の確定単語情報記憶手段1と同じ機能を有する。即ち、その記憶内容は表1の4種類の単語種別の確定の是非および確定している場合は単語の内容である。従って、確定単語情報記憶手段1の記憶内容のイメージの例も同じく表2および表3に示される通りである。

0031

認識結果記憶手段20の記憶内容例は表7および表8に示される通りであり、操作者により入力された単語の認識結果を、連結した単語の組および単語種別毎に、認識確度が予め決められた値以上であるものを予め決められた有限個以内分記憶する。

0032

0033

ID=000009HE=045 WI=122 LX=0440 LY=1100
表7は単語種別「何時」の単語および「何分」の単語が組として認識された場合の例を示し、表8は単語種別「何時」の単語のみが認識された場合の例を示している。表7に示される如く、「何時」および「何分」の単語が組として認識された場合、「何時」の単語および「何分」の単語の個々についての認識結果も、認識の確度や候補確定までに必要と想定される発話回数などを評価関数として、同時に候補として取り上げることになる。

0034

認識結果確認タイミング記憶手段3は、認識結果記憶手段2に記憶されている結果の正誤の確認に必要な単語種別を、確定した単語の単語種別に対応して記憶したものであり、表9にその記憶例を示す。

0035

ID=000010HE=090 WI=096 LX=0570 LY=0300
単語種別のビットパタンは先の実施例について説明した通りである。表9の読みとり方について、例えば確定単語がない、即ち、確定単語種別のビットパタンが0000の時は、単語種別「午前/午後」の候補(ビットパタン0001)、単語種別「何時11迄」の候補(ビットパタン0010)、単語種別「何時12〜」の候補(ビットパタン0100)、単語種別「午前/午後」の単語種別「何時11迄」の候補(ビットパタン0011)、単語種別「何時11迄」と単語種別「何分」の組の候補(ビットパタン1010)、単語種別「何時12〜」と単語種別「何分」の組の候補(ビットパタン1100)、および単語種別「午前/午後」と単語種別「何時11迄」と単語種別「何分」の組の候補(ビットパタン1011)ならば正誤を確認するということであり、そうでない場合は確認せずに先の実施例の様な要求処理を行なうという意味である。

0036

或る単語種別の認識候補のみにより認識結果の正誤を確認すると操作者に不自然感を与え或は操作時間を長引かせることがあることは先の実施例の未確認候補情報記憶手段2について説明した通りであり、そのために上述の如く確認の是非を判断することは有効なことなのである。確認プロンプト情報記憶手段4は、操作者に認識結果の正誤を確認する確認文と、確認の際に認識対象とする単語と、同一の確認文の繰り返し許容回数とを、既に確定した単語の単語種別と、確認する単語候補の単語種別と、認識の難易度とに対応して記憶する手段である。記憶内容のイメージ例を表10に示す。

0037

ID=000011HE=190 WI=130 LX=0400 LY=0300
表10の記憶内容は、システム設計者がタスクに依存した知識を使用して操作者との間の質問応答がスムーズになされる様に、特に確認音声の認識が明瞭になされない場合であっても難易度を下げることにより認識することができる様に設定する必要がある。

0038

表10の候補単語の単語種別のビットパタンは表6のそれと同じ意味である。なお、表10には表9より使われる候補の単語種別のビットパタンである8通りの場合のみを示した。また、表10は最低難易度を1に、難易度の初期値を2としている。この時の各難易度におけるプロンプト情報には、3個の情報が記憶されており、表10においては、それぞれ簡単のために〔1〕に確認文、〔2〕に確認文を操作者に提示する場合に認識対象とする確認語、〔3〕にこの確認文の繰り返し許容回数を書いている。

0039

表10の確認文中のWD1、WD2、WD3、WD4は候補単語の埋め込みの要求を意味しており、“+”は記号間および記号と他の文章の区切りを意味している。また、表10においては許容繰り返し回数を個々に書いているが、実際は認識難易度に対して共通の値を持つことになる。更に、表10においては難易度2の場合の認識対象語を「種々の確認語」としているが、これは例えば表11に示される様な認識候補の正誤を確認する場合に想定される確認用の単語を意味している。

0040

ID=000012HE=030 WI=067 LX=0265 LY=0450
なお、表10の場合の確認文は「WD1+WD2+WD3+WD4+ですか」型の文に依っても表現することができ、その意味では今回の例は候補単語の単語種別のビットパタン毎に確認文を有していなくとも、この型だけを記憶していれば確認文を作成することができるのであるが、操作者が「10時30分」と入力した場合にシステムが「10時」しか認識できなかった場合は「10時ですか」と聞くよりは「10時台ですか」と聞いた方が、前者の言い方の持つ「10時ちょうどですか」と「10時台ですか」という曖昧さをなくすことができるし、時刻だけでなく、他の内容例えば時間の長さ或は月日の指定その他への適用範囲も広がるところから、表10の様に候補の単語種別パタン毎に確認文を有することにした。

0041

確認文の繰り返し回数は、現在より1段階低い難易度のプロンプト情報がある場合は自然数が書かれ、ない場合は0が書かれる。確認プロンプト出力回数カウント手段5は、同じ確認文の繰り返し回数をカウントする手段であり、初期値として0を有し、出力される確認文が変わる度に、新たな単語が確定する度に、そして難易度が変わる度にカウンタを0にするものである。今回の例はこのカウンタは0であるものとする。

0042

確認プロンプト難易度記憶手段6は、確認プロンプトの難易度を設定、記憶する手段であって、今回の例は初期値2を有し、確認プロンプト出力回数カウント手段5のカウント数が確認プロンプト情報記憶手段4に記憶されているプロンプトの繰り返し許容回数を超えた場合に現在の難易度(現在の難易度は2)が予め設定した最低難易度(今回の例は1)より高く且つ確認プロンプト情報記憶手段4に1段階低い難易度のプロンプト情報が存在するならば難易度を1下げるものである。

0043

確認プロンプト作成手段7は、確定単語記憶手段1に記憶されている単語の単語種別により認識結果確認タイミング記憶手段3から確認に必要な単語種別を求め、当該単語種別と認識結果記憶手段2に記憶されている単語種別が一致する場合に認識結果記憶手段2に記憶されている未確認の認識結果を取り出し、当該認識候補の単語種別と確認プロンプト難易度記憶手段6に記憶された難易度とにより、確認プロンプト情報記憶手段4から操作者に認識結果の正誤を確認する確認文と確認の際の認識対象単語とを求めて確認文に認識候補の単語の埋め込みを行なって、操作者に提示する要求文の作成、認識対象単語の設定を行う。

0044

ここで、確定単語情報記憶手段1の記憶内容が表2であって認識結果記憶手段2の記憶内容が表7である場合、確定単語種別のビットパタンは0000、表7の第1番目の認識結果の候補の単語種別ビットパタンは1010であるから、表9よりこの候補は確認され、確認文は表10より「10時40分ですか」となり、表11の認識語彙が認識対象となる。今、操作者が入力した内容が「10時30分」であるとすると、この候補は操作者により否定されることになる。表10より、難易度2の繰り返し許容回数は2であるから、確認文「10時40分ですか」を2度繰り返しても正誤が確認されない場合は、確認文は「はい、またはいいえでお答え下さい。10時40分ですか」となり、確認語としては「はい」と「いいえ」のみが認識対象となる。この場合、認識の複雑度が減少するので、より認識しやすくなる。なお、ここで難易度が1になった場合でも「はい、またはいいえでお答え下さい」の文を毎回出すことは、文字で確認する場合は問題ないと思われるが、音声で確認する場合は操作者にとっては冗長と感じられるので初回のみ発声する様にする仕組みを併用することが必要であると思われる。

0045

表7の第1番目の候補が否定されると、表7の2番目の候補が対象となるが、この場合、確定単語種別のビットパタンは0000、表7の第2番目の認識結果の候補の単語種別ビットパタンは0010であるから、表9よりこの候補は確認され、確認文は表10より「10時台ですか」となり、これは正解であるから操作者により肯定されることになる。

0046

表7の第2番目の候補が肯定されると、表7の3番目の候補が対象となるが、この場合、確定単語種別のビットパタンは0010と変化し、表7の第2番目の認識結果の候補の単語種別ビットパタンは1000であるから、表9よりこの候補は確認され、確認文は表10より「40分ですか」となる。認識結果が表7の場合は、この様に処理が進むことになる。

0047

この発明は、認識が明瞭になされない場合に変更するテンプレート情報の選択は設計者に委ねられているが、認識性能を反映したコストの概念(統計的にどの様な要求をした場合に確定までに行なう操作者の操作回数が少ないかというデータを有し、これによりコストを決定する)を導入して自動的に選択する方法との間の適合性が良いので、両者を併用することにより更に好適なプロンプトの設計が可能になる。

発明の効果

0048

以上の通りであって、質問応答型の対話装置の設計者は実施例に示される様な要求/確認プロンプト情報を記述することにより、汎用性があり且つ認識の不確実さを考慮した要求プロンプトの設計が可能となる。この発明は操作者の入力内容の認識が確実でない場合、即ち操作者の入力手段が音声や画像、手書き文字であった場合に、有効となる要求プロンプトの作成方法であって、システム作成者の経験的なノウハウ、認識結果に対する統計的な評価が採り入れ易いものにもなっている。

図面の簡単な説明

0049

図1この発明の実施例を説明する図。
図2この発明の実施例を説明する図。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ