図面 (/)

技術 質問応答(Q&A)データベースを拡張するためのシステム、方法、およびコンピュータ・プログラム(質問応答データベースの拡張)

出願人 インターナショナル・ビジネス・マシーンズ・コーポレーション
発明者 長野徹鈴木雅之吉田一星壁屋佳典
出願日 2016年11月25日 (4年6ヶ月経過) 出願番号 2016-229006
公開日 2017年6月8日 (4年0ヶ月経過) 公開番号 2017-102921
状態 特許登録済
技術分野 検索装置
主要キーワード 表現様式 機械依存 ブレード型サーバ 対応担当者 命令実行装置 パラフレーズ JIT 特許証
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2017年6月8日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (16)

課題

質問応答(Q&A)データベース拡張するためのシステムおよび方法を提供する。

解決手段

方法は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における対応担当者の発話音声認識結果とを準備するステップであって、セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの識別子と共通の識別子を有する、準備するステップと、対応担当者の発話の音声認識結果から抽出された1つまたは複数の繰り返し部分を、セット内の対応するQ&Aドキュメントに追加するステップと、を含む。

概要

背景

企業のコンタクトセンタでは、コスト削減および顧客満足度向上のために、顧客からの様々な質問に対して、迅速に回答する必要がある。電話対応サポート・システムでは、音声認識システムを使用して電話オペレータと顧客との会話録音し、該当および類似する質問と応答ペアデータベースから検索し、電話オペレータに発見したペアを示すことができる。

キーワード検索を使用する、Google検索などのQ&A検索の場合、Q&Aシステムが、全てのQ&Aの類似度スコア(similarity score)を計算し、最高の類似度スコアを有する、最も該当するQ&Aを返す。

例えば、検索するキーワードが「住所」および「変更」であるとき、Q&Aシステムは、Q&Aドキュメントのセットの中の、最も該当するQ&Aを検索する。Q&Aドキュメントのセットが以下のQ&Aドキュメントを含むと仮定してみる。
「Q&A XXXX住所変更名前変更:WEB IDをお持ちでしたら・・・お客様ウェブで変更できます、あるいは、IDを控えてご来店下さい」
「Q&A YYYYオンラインID変更:フリーダイアルXXXX−XXXXにお電話ください。電話される方はアカウントが必要です。アカウント番号ヒントを準備してください」識別番号Q&A XXXXを有するQ&Aは、「住所変更」および「名前変更」という語句を含む。したがって、Q&Aシステムが、識別番号Q&A XXXXを有するQ&Aを、最も該当するQ&Aとして返す。

音声認識結果を利用してQ&Aを検索する際は、音声認識結果が入力として利用されて、最も該当するQ&Aが、Q&Aドキュメントのセットの中から検索される。しかし、音声認識結果の語彙と、Q&Aドキュメントのセットの内容との間には差がある。これは、話し言葉書き言葉が、常に重なるとは限らないからである。

例えば、音声認識結果は、「お嬢様のアカウントを開設しますか?」、「8の子のアカウントの開設は・・・」である。Q&Aドキュメントのセットの内容は、「Q&AZZZZ 18歳未満のアカウントの開設」である。上記で例では、子供についての表現様式が互いに異なるため、音声認識結果が、Q&Aドキュメントのセットの内容と一致しない。

したがって、キーワード検索に比べてQ&A検索の精度が低い。

音声認識結果は、新しい問い合わせの検索に使用され、音声認識結果を既存のQ&Aに分類することにより設定された既存のQ&Aには含まれない(特開2012−0038704参照)。

クエリ拡張は、一般に、キーワードがQ&Aドキュメントのセットの内容と一致しないときに検索漏れを防ぐための方法として知られている。

概要

質問応答(Q&A)データベースを拡張するためのシステムおよび方法を提供する。方法は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における対応担当者の発話の音声認識結果とを準備するステップであって、セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの識別子と共通の識別子を有する、準備するステップと、対応担当者の発話の音声認識結果から抽出された1つまたは複数の繰り返し部分を、セット内の対応するQ&Aドキュメントに追加するステップと、を含む。

目的

本発明の課題は、質問応答(Q&A)データベースを拡張するためのシステム、方法、およびコンピュータプログラムを提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

質問応答(Q&A)データベース拡張するためのコンピュータ実装される方法であって、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における少なくとも対応担当者の発話音声認識結果とを準備するステップであって、前記セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの前記識別子と共通の識別子を有する、前記準備するステップと、プロセッサを使用して、前記対応担当者の発話の前記音声認識結果から抽出された1つまたは複数の繰り返し部分を、前記セット内の対応するQ&Aドキュメントに追加して、拡張されたQ&Aドキュメントのセットを生成するステップと、を含む方法。

請求項2

前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話を検索するステップと、前記1つまたは複数の発見した発話を、前記対応するQ&Aドキュメントに追加するステップと、をさらに含む、請求項1に記載の方法。

請求項3

前記検索するステップが、前記準備された音声認識結果から、1つまたは複数の抽出された繰り返し部分のそれぞれについて所定の閾値以上の類似度を有する1つまたは複数の発話を検索するステップと、前記1つまたは複数の抽出された繰り返し部分のそれぞれの前記識別子と共通の識別子を有する1つまたは複数の発話を、前記所定の閾値以上の類似度を有する前記1つまたは複数の発見した発話から抽出するステップと、を含む、請求項2に記載の方法。

請求項4

前記検索するステップが、前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれの前記識別子と共通の識別子を有する1つまたは複数の発話を抽出するステップと、前記1つまたは複数の抽出された繰り返し部分のそれぞれについて所定の閾値以上の類似度を有する1つまたは複数の発話を検索するステップと、を含む、請求項2に記載の方法。

請求項5

前記音声認識結果を準備するステップが、前記対応担当者および前記顧客のそれぞれの発話の前記音声認識結果を準備するステップを含み、前記1つまたは複数の発話を検索探索するステップが、前記対応担当者および前記顧客のそれぞれの発話の前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話を検索するステップを含む、請求項2に記載の方法。

請求項6

前記対応するQ&Aドキュメントが、前記抽出された繰り返し部分の前記識別子と共通の識別子、または、前記抽出された繰り返し部分の識別子と関連付けられた識別子と共通の識別子を含む、請求項1に記載の方法。

請求項7

前記1つまたは複数の繰り返し部分を抽出するための1つまたは複数の規則に基づき、前記準備された音声認識結果から、前記対応担当者の前記1つまたは複数の繰り返し部分を抽出するステップ、をさらに含む、請求項1に記載の方法。

請求項8

前記該当するQ&Aドキュメントが、前記音声認識結果を入力として使用することにより得られる検索結果である、請求項1に記載の方法。

請求項9

ステムであって、プログラムを記憶するメモリを含み、前記プログラムが、プロセッサ上で実行されると、質問応答(Q&A)データベースを拡張するための方法を実行し、前記方法が、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における少なくとも対応担当者の発話の音声認識結果とを準備するステップであって、前記セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの前記識別子と共通の識別子を有する、前記準備するステップと、前記プロセッサを使用して、前記対応担当者の発話の前記音声認識結果から抽出された1つまたは複数の繰り返し部分を、前記セット内の対応するQ&Aドキュメントに追加して、拡張されたQ&Aドキュメントのセットを生成するステップと、を含む、システム。

請求項10

前記方法が、前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話を検索するステップと、前記1つまたは複数の発見した発話を、前記対応するQ&Aドキュメントに追加するステップと、をさらに含む、請求項9に記載のシステム。

請求項11

前記検索するステップが、前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれについて所定の閾値以上の類似度を有する1つまたは複数の発話を検索するステップと、前記1つまたは複数の抽出された繰り返し部分のそれぞれの前記識別子と共通の識別子を有する1つまたは複数の発話を、前記所定の閾値以上の類似度を有する前記1つまたは複数の発見した発話から抽出するステップと、を含む、請求項10に記載のシステム。

請求項12

前記検索するステップが、前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれの前記識別子と共通の識別子を有する1つまたは複数の発話を抽出するステップと、前記1つまたは複数の抽出された繰り返し部分のそれぞれについて所定の閾値以上の類似度を有する1つまたは複数の発話を検索するステップと、を含む、請求項10に記載のシステム。

請求項13

前記音声認識結果を準備するステップが、前記対応担当者および前記顧客のそれぞれの発話の前記音声認識結果を準備するステップを含み、前記1つまたは複数の発話を検索するステップが、前記対応担当者および前記顧客のそれぞれの発話の前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話を検索するステップを含む、請求項10に記載のシステム。

請求項14

前記対応するQ&Aドキュメントが、前記抽出された繰り返し部分の前記識別子と共通の識別子、または、前記抽出された繰り返し部分の識別子と関連付けられた識別子と共通の識別子を含む、請求項9に記載のシステム。

請求項15

前記方法が、前記1つまたは複数の繰り返し部分を抽出するための1つまたは複数の規則に基づき、前記準備された音声認識結果から、前記対応担当者の前記1つまたは複数の繰り返し部分を抽出するステップ、をさらに含む、請求項9に記載のシステム。

請求項16

前記該当するQ&Aドキュメントが、前記音声認識結果を入力として使用することにより得られる検索結果である、請求項9に記載のシステム。

請求項17

質問応答(Q&A)データベースを拡張するためのコンピュータ・プログラム製品であって、プログラム命令具現化したコンピュータ使用可能記媒体を備え、前記コンピュータ可読記憶媒体は、一時的な信号そのものではなく、前記プログラム命令は、コンピュータにより実行可能であり、前記コンピュータに、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における少なくとも対応担当者の発話の音声認識結果とを準備するステップであって、前記セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの前記識別子と共通の識別子を有する、前記準備するステップと、プロセッサを使用して、前記対応担当者の発話の前記音声認識結果から抽出された1つまたは複数の繰り返し部分を、前記セット内の対応するQ&Aドキュメントに追加して、拡張されたQ&Aドキュメントのセットを生成するステップと、を含む方法を実行させる、コンピュータ・プログラム製品。

請求項18

前記方法が、前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話を検索するステップと、前記1つまたは複数の発見した発話を、前記対応するQ&Aドキュメントに追加するステップと、をさらに含む、請求項17に記載のコンピュータ・プログラム製品。

請求項19

前記検索するステップが、前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれについて所定の閾値以上の類似度を有する1つまたは複数の発話を検索するステップと、前記1つまたは複数の抽出された繰り返し部分のそれぞれの前記識別子と共通の識別子を有する1つまたは複数の発話を、前記所定の閾値以上の類似度を有する前記1つまたは複数の発見した発話から抽出するステップと、を含む、請求項18に記載のコンピュータ・プログラム製品。

請求項20

前記検索するステップが、前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれの前記識別子と共通の識別子を有する1つまたは複数の発話を抽出するステップと、前記1つまたは複数の抽出された繰り返し部分のそれぞれについて所定の閾値以上の類似度を有する1つまたは複数の発話を検索するステップと、を含む、請求項18に記載のコンピュータ・プログラム製品。

請求項21

前記音声認識結果を準備するステップが、前記対応担当者および前記顧客のそれぞれの発話の前記音声認識結果を準備するステップを含み、前記1つまたは複数の発話を検索するステップが、前記対応担当者および前記顧客のそれぞれの発話の前記準備された音声認識結果から、前記1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話を検索するステップを含む、請求項18に記載のコンピュータ・プログラム製品。

請求項22

前記対応するQ&Aドキュメントが、前記抽出された繰り返し部分の前記識別子と共通の識別子、または、前記抽出された繰り返し部分の識別子と関連付けられた識別子と共通の識別子を含む、請求項17に記載のコンピュータ・プログラム製品。

請求項23

前記方法が、前記1つまたは複数の繰り返し部分を抽出するための1つまたは複数の規則に基づき、前記準備された音声認識結果から、前記対応担当者の前記1つまたは複数の繰り返し部分を抽出するステップ、をさらに含む、請求項17に記載のコンピュータ・プログラム製品。

請求項24

対応担当者と顧客との間の会話に基づき、前記顧客の、前記顧客の質問への応答を検索するためのコンピュータで実装される方法であって、前記会話から、前記顧客の質問または対応担当者の返答の音声認識結果を、入力として受け取るステップと、請求項1に従って拡張される質問応答(Q&A)データベースから、プロセッサを使用して、前記顧客の質問または前記対応担当者の返答に対するQ&Aドキュメントを抽出するステップと、前記抽出されたQ&Aドキュメントを、前記対応担当者に対して表示するステップと、を含む方法。

請求項25

質問応答(Q&A)データベースを拡張するためのコンピュータで実装される方法であって、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における対応担当者の発話の音声認識結果とを準備するステップであって、前記セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの前記識別子と共通の識別子を有する、前記準備するステップと、プロセッサを使用して、前記対応担当者の発話の前記音声認識結果を、前記セット内の対応するQ&Aドキュメントに追加して、拡張されたQ&Aドキュメントのセットを生成するステップと、を含む方法。

技術分野

0001

本発明は、質問応答(Q&A)データベースQADB)に関し、より詳細には、QADBの拡張に関する。

背景技術

0002

企業のコンタクトセンタでは、コスト削減および顧客満足度向上のために、顧客からの様々な質問に対して、迅速に回答する必要がある。電話対応サポート・システムでは、音声認識システムを使用して電話オペレータと顧客との会話録音し、該当および類似する質問と応答ペアをデータベースから検索し、電話オペレータに発見したペアを示すことができる。

0003

キーワード検索を使用する、Google検索などのQ&A検索の場合、Q&Aシステムが、全てのQ&Aの類似度スコア(similarity score)を計算し、最高の類似度スコアを有する、最も該当するQ&Aを返す。

0004

例えば、検索するキーワードが「住所」および「変更」であるとき、Q&Aシステムは、Q&Aドキュメントのセットの中の、最も該当するQ&Aを検索する。Q&Aドキュメントのセットが以下のQ&Aドキュメントを含むと仮定してみる。
「Q&A XXXX住所変更名前変更:WEB IDをお持ちでしたら・・・お客様ウェブで変更できます、あるいは、IDを控えてご来店下さい」
「Q&A YYYYオンラインID変更:フリーダイアルXXXX−XXXXにお電話ください。電話される方はアカウントが必要です。アカウント番号ヒントを準備してください」識別番号Q&A XXXXを有するQ&Aは、「住所変更」および「名前変更」という語句を含む。したがって、Q&Aシステムが、識別番号Q&A XXXXを有するQ&Aを、最も該当するQ&Aとして返す。

0005

音声認識結果を利用してQ&Aを検索する際は、音声認識結果が入力として利用されて、最も該当するQ&Aが、Q&Aドキュメントのセットの中から検索される。しかし、音声認識結果の語彙と、Q&Aドキュメントのセットの内容との間には差がある。これは、話し言葉書き言葉が、常に重なるとは限らないからである。

0006

例えば、音声認識結果は、「お嬢様のアカウントを開設しますか?」、「8の子のアカウントの開設は・・・」である。Q&Aドキュメントのセットの内容は、「Q&AZZZZ 18歳未満のアカウントの開設」である。上記で例では、子供についての表現様式が互いに異なるため、音声認識結果が、Q&Aドキュメントのセットの内容と一致しない。

0007

したがって、キーワード検索に比べてQ&A検索の精度が低い。

0008

音声認識結果は、新しい問い合わせの検索に使用され、音声認識結果を既存のQ&Aに分類することにより設定された既存のQ&Aには含まれない(特開2012−0038704参照)。

0009

クエリ拡張は、一般に、キーワードがQ&Aドキュメントのセットの内容と一致しないときに検索漏れを防ぐための方法として知られている。

先行技術

0010

特開2012−003704

発明が解決しようとする課題

0011

本発明の課題は、質問応答(Q&A)データベースを拡張するためのシステム、方法、およびコンピュータプログラムを提供することである。

課題を解決するための手段

0012

本発明の一態様によると、本原理の一実施形態は、QADBを拡張するためのコンピュータで実装される方法を提供する。方法は、Q&Aドキュメントのセットと、対応担当者(agent)と顧客との間の会話における少なくとも対応担当者の発話の音声認識結果とを準備するステップであって、セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの識別子と共通の識別子を有する、準備するステップと、対応担当者の発話の音声認識結果から抽出された1つまたは複数の繰り返し部分を、セット内の対応するQ&Aドキュメントに追加するステップと、を含む。

0013

本発明の別の態様によると、本原理の一実施形態は、コンピュータにより実行可能な、本明細書に記載される1つまたは複数の方法を実行する、命令のプログラムを記憶する、コンピュータ可読記憶媒体を備えるコンピュータを提供する。システムは、プロセッサ上で実行されると、QADBを拡張するための方法を実行するプログラム、を記憶するメモリを備える。方法は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における少なくとも対応担当者の発話の音声認識結果とを準備するステップであって、セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの識別子と共通の識別子を有する、準備するステップと、対応担当者の発話の音声認識結果から抽出された1つまたは複数の繰り返し部分を、セット内の対応するQ&Aドキュメントに追加するステップと、を含む。

0014

本発明の別の態様によると、本原理の一実施形態は、コンピュータ・システムにより実行可能な、本明細書に記載される1つまたは複数の方法を実行する、命令のプログラムを記憶する、コンピュータ可読記憶媒体を備えるコンピュータ・プログラム製品を提供する。方法は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における少なくとも対応担当者の発話の音声認識結果とを準備するステップであって、セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの識別子と共通の識別子を有する、準備するステップと、対応担当者の発話の音声認識結果から抽出された1つまたは複数の繰り返し部分を、セット内の対応するQ&Aドキュメントに追加するステップと、を含む。

0015

本発明の別の態様によると、本原理の一実施形態は、対応担当者と顧客との間の会話に基づき、顧客の質問に対する応答を検索するための、コンピュータで実装される方法を提供する。方法は、会話から、顧客の質問または対応担当者の返答の音声認識結果を、入力として受け取るステップと、上述の方法に従って拡張されるQADBから、顧客の質問または対応担当者の返答に対するQ&Aドキュメントを抽出するステップと、抽出されたQ&Aドキュメントを、対応担当者に対して表示するステップと、を含む。

0016

本発明の別の態様によると、本原理の一実施形態は、QADBを拡張するためのコンピュータで実装される方法を提供する。方法は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における対応担当者の発話の音声認識結果とを準備するステップであって、セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの識別子と共通の識別子を有する、準備するステップと、対応担当者の発話の音声認識結果を、セット内の対応するQ&Aドキュメントに追加するステップと、を含む。

0017

本発明の別の態様によると、本原理の一実施形態は、コンピュータにより実行可能な、本明細書に記載される1つまたは複数の方法を実行する、命令のプログラムを記憶する、コンピュータ可読記憶媒体を備えるコンピュータを提供する。システムは、プロセッサ上で実行されると、QADBを拡張するための方法を実行するプログラム、を記憶するメモリを備える。方法は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における対応担当者の発話の音声認識結果とを準備するステップであって、セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの識別子と共通の識別子を有する、準備するステップと、対応担当者の発話の音声認識結果を、セット内の対応するQ&Aドキュメントに追加するステップと、を含む。

0018

本発明の別の態様によると、本原理の一実施形態は、コンピュータ・システムにより実行可能な、本明細書に記載される1つまたは複数の方法を実行する、命令のプログラムを記憶する、コンピュータ可読記憶媒体を備えるコンピュータ・プログラム製品を提供する。方法は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における対応担当者の発話の音声認識結果とを準備するステップであって、セット内の各Q&Aドキュメントが識別子を有し、各音声認識結果が、該当するQ&Aドキュメントの識別子と共通の識別子を有する、準備するステップと、対応担当者の発話の音声認識結果を、セット内の対応するQ&Aドキュメントに追加するステップと、を含む。

0019

本発明の一実施形態によると、拡張されたQ&Aドキュメントのセットにより、対応担当者と顧客との間の会話を検索することによって、検索処理において、向上した検索結果が提供される。

図面の簡単な説明

0020

本発明の一実施形態において使用されるコンピュータ・ハードウェアの、例示の基本ブロック図である。
QADBを拡張するための方法の全体フローチャートの一実施形態を示す図である。
セット内のQ&Aドキュメントに繰り返し部分を追加するための方法のフローチャートの一実施形態を示す図である。
繰り返し部分に類似する発話を検索するための方法のフローチャートの一実施形態を示す図である。
QADBを拡張するための方法の全体フローチャートの別の実施形態を示す図である。
顧客の質問への応答を検索するための方法のフローチャートの一実施形態を示す図である。
QADBの一実施形態を示す図である。
コールログの一実施形態を示す図である。
Q&Aドキュメントの関連付けされた識別子の一実施形態を示す図である。
音声認識結果から繰り返し部分を抽出するための規則の一実施形態を示す図である。
元のQADBと、図2にて説明されるフローチャートの一実施形態に従って拡張されたQADBと、の一実施形態を示す図である。
元のQADBと、図5にて説明されるフローチャートの一実施形態に従って拡張されたQADBと、の一実施形態を示す図である。
類似度検索インデックスを使用することにより、Q&Aドキュメントとの類似度を計算する一実施形態を示す図である。
図2にて説明されるフローチャートの一実施形態に従って使用される、コンピュータ・システム・ハードウェアの、全体機能ブロック図の一実施形態を示す図である。
図5にて説明されるフローチャートの一実施形態に従って使用される、コンピュータ・システム・ハードウェアの、全体機能ブロック図の一実施形態を示す図である。

実施例

0021

本発明の種々の実施形態についての説明が、例示の目的で提示されたが、網羅することは意図されておらず、開示される実施形態に限定されることも意図されていない。多くの変更および変形が、記載される実施形態の範囲および主旨から逸脱することなく、当業者に対して明らかにされるであろう。本明細書において使用される用語は、実施形態の原理、実際の用途、または市場に見られる技術における技術の向上、を最良に説明するため、または、他の当業者が本明細書に開示される実施形態を理解できるようにするために、選択された。

0022

本明細書において使用される用語をより明確に定義するために、以下の例示の定義が提供されるが、用語の意味は、本原理が関連する技術分野において広く知られているものと解釈されるべきである。

0023

用語、質問応答(Q&A)とは、リストアップされる質問と応答を指す。Q&Aは、通常は、絶えずねられている特定の質問の結果である情報を編集したものである。Q&Aの一実施形態は、よくある質問(Frequently Asked Questions(FAQ))である。

0024

用語、質問応答(Q&A)データベース(QADB)は、Q&Aを格納するデータベースを指す。QADBには、Q&Aドキュメントのセットが含まれる。QADBの一実施形態は、よくある質問(FAQ)データベース(FAQDB)である。

0025

用語、「対応担当者」とは、顧客からの質問への応答を提供する人を指す。対応担当者、例えば、電話オペレータ、コールセンタオペレータ、システム・サポート・オペレータ、または顧客サポート・オペレータ、であってよいがこれに限定されない。

0026

用語「顧客」とは、自分の質問に対する応答を要求する人を指す。顧客は、上記で定義した対応担当者の顧客であってもよい。

0027

用語「会話」とは、対応担当者と顧客との間の対話型または自発的なコミュニケーションを指す。会話は、典型的には、電話のコミュニケーション、ウェブでのコミュニケーション、または対面でのコミュニケーションを介して行われるものであってもよい。

0028

ここで図1を参照すると、図1は、本原理の一実施形態において使用されるコンピュータ・ハードウェアの、例示の基本ブロック図を示す。

0029

コンピュータ(101)は、例えば、デスクトップラップトップノートブックタブレット、またはサーバ・コンピュータとすることができるが、これに限定されない。サーバ・コンピュータは、例えば、ワークステーションラックマウント型サーバ、ブレード型サーバ、または、メインフレーム・サーバとすることができるが、これに限定されず、例えば、1つまたは複数の仮想マシンを作成および稼働させるためのハイパーバイザを稼働させることができる。コンピュータ(101)は、1つまたは複数のCPU(102)と、バス(104)に接続されるメインメモリ(103)と、を備えてもよい。CPU(102)は、好ましくは、32ビットまたは64ビットのアーキテクチャに基づくものとすることができる。CPU(102)は、例えば、IBM社のPower(R)シリーズインテル社のCorei(TM)シリーズ、Core2(TM)シリーズ、Atom(TM)シリーズ、Xeon(TM)シリーズ、Pentium(R)シリーズ、もしくはCeleron(R)シリーズ、または、Advanced Micro Devices,Inc.社のPhenom(TM)シリーズ、Athlon(TM)シリーズ、Turion(TM)シリーズ、もしくはSempron(TM)とすることができるが、これに限定されない(「Power」は、米国、他の国またはその両方のIBM社の登録商標であり、「Core i」、「Core2」、「Atom」、および「Xeon」は米国、他の国またはその両方のインテル社の商標であり、「Pentium」および「Celeron」は同社の登録商標であり、「Phenom」、「Athlon」、「Turion」、および「Sempron」は、米国、他の国またはその両方のAdvanced Micro Devices,Inc.社の商標である)。

0030

液晶ディスプレイ(LCD)などのディスプレイ(106)は、ディスプレイ・コントローラ(105)を介してバス(104)と接続されてもよい。ディスプレイ(106)は、コンピュータの管理のために、通信回線を介してネットワークと接続されるコンピュータの情報、および適切なグラフィックスインターフェースを使用してコンピュータ上で稼働するソフトウェアの情報、の表示に使用されてもよい。ハードディスクまたはソリッドステートドライブSSD)などのディスク(108)、および、CD、DVDまたはブルーレイディスク(BD)ドライブなどのドライブ(109)は、SATAまたはIDEコントローラ(107)を介してバス(104)と接続されてもよい。さらに、キーボード(111)およびマウス(112)が、キーボード−マウス・コントローラ(110)またはUSBバス(図示せず)を介して、バス(104)と接続されてもよい。

0031

オペレーティング・システム、Windows(R)、UNIX(R)、Mac OS(R)、Linux(R)またはJava(R)処理環境、Java(R)アプリケーション、Java(R)仮想マシン(VM)、および、J2EE(R)などのJava(R)just−in−time(JITコンパイラを提供するプログラム、他のプログラム、ならびに任意のデータは、メインメモリにロード可能にディスク(108)に格納することができる。(「Windows」は、米国、他の国またはその両方のマイクロソフト社の登録商標であり、「UNIX」は、米国、他の国またはその両方のオープングループの登録商標であり、「Mac OS」は、米国、他の国またはその両方のアップル社の登録商標であり、「Linux」は、米国、他の国またはその両方のLinus Torvaldsの登録商標であり、「Java」および「J2EE」は、米国、他の国またはその両方のOracle America,Inc.社の登録商標である。)

0032

ドライブ(109)を使用して、本原理の一実施形態のコンピュータ・プログラムなどの、CD−ROM、DVD−ROMもしくはBDから、ディスク(108)に読み出し可能なプログラムをインストールすること、または、必要に応じて、CD−ROM、DVD−ROMもしくはBDから、メインメモリ(103)もしくはディスク(108)に読み出し可能な任意のデータをロードすることができる。

0033

通信インターフェース(114)は、例えば、イーサネット(R)プロトコルに基づくものとすることができるが、これに限定されない。通信インターフェース(114)は、通信コントローラ(113)を介してバス(104)と接続されてもよく、コンピュータ(101)を通信回線(115)に物理的に接続し、ネットワーク・インターフェース層を、コンピュータ(101)のオペレーティング・システムの通信機能のTCP/IP通信プロトコルに提供することができる。この場合、通信回線(115)は、有線LAN環境、または、例えばIEEE(R)802.11a/b/g/nなどが含まれるがこれに限定されない、無線LAN接続規格に基づく無線LAN環境、とすることができる(「IEEE」は、米国、他の国またはその両方のInstitute of Electrical and Electronics Engineers,Inc.の登録商標である)。

0034

図2から4は、QADBを拡張するための方法のフローチャートの一実施形態を示す。

0035

ここで図2を参照すると、図2は、QADBを拡張するための方法の全体フローチャートの一実施形態を示す。

0036

ステップ201にて、コンピュータ(101)が上述の方法を開始する。

0037

ステップ202にて、コンピュータ(101)が、Q&Aドキュメントのセットを、例えば、QADBを読み取ることにより準備する。QADBは、Q&Aドキュメントのうちの1つまたは複数、または、Q&Aドキュメントのセット、F、(291)、を備える。Q&Aドキュメントのセットは、以下のように表すことができる。F[x]:1<=x<=Nf、ここで、Nfは、Q&Aドキュメントのセット内のQ&Aドキュメントの総数である。

0038

セット内の各Q&Aドキュメントは、Q&A ID(すなわち、Q&A識別子)を有する。

0039

Q&Aドキュメントのセットは、ステップ201での開始より前に、予め準備されてもよい。QADBまたはQ&Aドキュメントのセットの一実施形態が、図7に示され以下でさらに詳細に説明される。

0040

ステップ202にて、コンピュータ(101)は、対応担当者と顧客との間の会話における少なくとも対応担当者の発話の音声認識結果を、例えば、1つまたは複数のコール・ログCsを読み取ることにより、さらに準備する。コール・ログCsは、以下のように表すことができる。Cs[i]:1<=i<=Ns、ここで、Nsは、コール・ログCsの総数である。音声認識結果または発話は、以下のように表すことができる。Cs[i][j]:1<=j<=Ncs[i]、ここで、Ncs[i]は、コール・ログ[i]内の発話の総数である。

0041

コール・ログには2種類ある。1つは、対応担当者の会話の音声認識結果であり、もう1つは、顧客の会話の音声認識結果である。例えば、コールセンタにおいて、対応担当者の発話と顧客の発話が、例えば、2チャンネル、すなわち、右チャンネルおよび左チャンネルの入力を使用して、それぞれのチャンネルに別々に記録される。したがって、対応担当者の発話と顧客の発話とを別々に収集して、各発話の音声認識を実行することは簡単である。従来技術において既知のいずれの音声認識方法も、対応担当者の発話および顧客の発話の準備に使用することができる。

0042

各コール・ログ(すなわち、各音声認識結果)は、該当するQ&AドキュメントのQ&A IDと共通の識別子を有する。該当するQ&Aドキュメントは、音声認識結果を入力として使用することにより取得される検索結果であってもよい。

0043

コール・ログは、ステップ201での開始より前に、予め準備されてもよい。コール・ログの一実施形態が、図8に示され以下でさらに詳細に説明される。

0044

最初に準備されたコール・ログは、2つのセットに分割することができ、一方のセットCsは、ステップ203に示すように、1つまたは複数の繰り返し部分を抽出するためのセットであり、もう一方のセットCpは、ステップ204に示されるように、1つまたは複数の発話を検索するためのセットである。コンピュータ(101)は、コール・ログを各コール・ログの識別子iに従って、分割することができる。例えば、コンピュータは、コール・ログを2セットに分割してもよい。C[0]からC[x−1]をCsに、C[x]からC[y]をCpに分割、ここで、0<x<yである。

0045

ステップ203にて、コンピュータ(101)は、対応担当者の発話の音声認識結果から抽出された1つまたは複数の繰り返し部分を、セット内の対応するQ&Aドキュメントに追加して、Q&Aドキュメントの拡張されたセット、F1、(292)を生成する。

0046

Q&Aドキュメントの拡張されたセット、F1、(292)は、以下のように表すことができる。F1[x]:1<=x<=Nf1、ここで、Nf1は、Q&Aドキュメントの拡張されたセット、F1(292)内のQ&Aドキュメントの総数である。

0047

対応するQ&Aドキュメントは、抽出された繰り返し部分を抽出したコール・ログの識別子と共通のQ&A ID、または、抽出された繰り返し部分を抽出したコール・ログの識別子と関連付けられた識別子と共通のQ&A ID、を有する。以下では、「抽出された繰り返し部分を抽出したコール・ログの識別子」を、「抽出された繰り返し部分の識別子」と呼ぶこともある。

0048

対応するQ&Aドキュメントが、抽出された繰り返し部分の識別子と共通のQ&A IDを有するとき、抽出された繰り返し部分の識別子は、繰り返し部分が抽出されたコール・ログの識別子と同じである。

0049

対応するQ&Aドキュメントが、抽出された繰り返し部分の識別子と関連付けられた識別子と共通のQ&A IDを有するとき、抽出された繰り返し部分の識別子と関連付けられた識別子は、Q&Aドキュメントのセット、F、(291)から検索されるQ&Aドキュメントの識別子、または、抽出された繰り返し部分の識別子をキーとして使用することにより、コール・ログから検索されるコール・ログの識別子と同じである。前者の場合、抽出された繰り返し部分の識別子は、抽出された繰り返し部分の表現の類似度の観点から、Q&Aドキュメントの識別子と関連付けられてもよい。後者の場合、抽出された繰り返し部分の識別子は、抽出された繰り返し部分の表現の類似度の観点から、コール・ログの識別子と関連付けられてもよい。

0050

対応するQ&Aドキュメントは、抽出された繰り返し部分の識別子と共通のQ&A IDにより、または、例えば、セット内のQ&Aドキュメントの関連付けされた識別子用のテーブルを使用して、抽出された繰り返し部分の識別子と関連付けられた識別子と共通のQ&A ID、により特定される。テーブルの一実施形態が、図9に示され以下でさらに詳細に説明される。

0051

1つまたは複数の繰り返し部分の抽出は、手動または自動で行うことができる。繰り返し部分には、顧客の発話の繰り返しである対応担当者の発話、すなわち、顧客の質問、のコール・ログが含まれてもよい。対応担当者の発話は、顧客の質問の同じまたは異なる言い回しであることがある。

0052

1つまたは複数の繰り返し部分を手動で抽出するための方法は、対応担当側の担当者の命令に従って、コンピュータによって実行されてもよい。一実施形態において、対応担当者は、安全のためにユーザの質問の内容を繰り返す。したがって、対応担当側の担当者は、対応担当者の発話から繰り返し部分を認識することができる。手動で抽出した繰り返し部分は、セット内の対応するQ&Aドキュメントに追加される。

0053

1つまたは複数の繰り返し部分を自動で抽出するための方法は、コンピュータ(101)、またはコンピュータ(101)とは異なる別のコンピュータにより実行される。1つまたは複数の繰り返し部分を自動で抽出することについての詳細な説明は、以下で検討する図3にて説明される。

0054

上述の追加の後、コンピュータ(101)は、拡張されたQ&Aドキュメントのセット、F1、(292)を、記憶装置、例えば、ディスク(109)に格納する。拡張されたQ&Aドキュメントのセット、F1、の一実施形態が図11に示され以下でさらに詳細に説明される。

0055

拡張されたQ&Aドキュメントのセット、F1、(292)は、以下でさらに詳細に検討される図6にて説明される検索処理に使用されてもよい。したがって、対応担当者の繰り返し部分を追加することにより、検索処理における対応担当者または顧客の発話が、Q&Aドキュメントのセット内のキーワードと類似しない場合、検索処理における対応担当者または顧客の発話は、拡張されたQ&Aドキュメントのセット内の追加された繰り返し部分と類似する可能性があるかもしれない。

0056

対応担当者の発話が、顧客の質問の異なる言い回しであるとき、対応担当者の発話は、顧客の質問に比べて、対応担当者と顧客との間の会話における顧客の質問に関するQ&Aドキュメントを検索するための、より正確なキーワードを含むことがある。例えば、顧客の質問が、「8歳の男の子のアカウントを開設したいのです」または「下ののアカウントを開設する必要があります」というものであるとき、対応担当者の発話の繰り返し部分は、「18歳未満の個人のお客様のアカウントを開設なさりたいのですね?」となる。繰り返し部分はキーワード「18歳未満」を含み、したがって、繰り返し部分は、「8歳の男の子」または「下の娘」を含む顧客の質問に比べて、対応担当者と顧客との間の会話における顧客の質問に関するQ&Aドキュメントを検索するためには、より適切である。

0057

したがって、検索処理において検索結果を向上させるために、拡張されたQ&Aドキュメントのセット、F1、(292)を利用することは有用である。対応担当者の発話の音声認識結果から抽出された1つまたは複数の繰り返し部分を、セット内の対応するQ&Aドキュメントに追加することにより、顧客の発話における発話が、Q&Aドキュメントセットに類似しない場合でも、その顧客の発話が、対応担当者の発話における繰り返し部分に類似する。したがって、顧客の質問に対する応答の検索を、拡張されたQ&Aデータベースを使用して行う際、より適切なQ&Aドキュメントを抽出することができる。

0058

任意的なステップ204にて、コンピュータ(101)は、準備された音声認識結果から、1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話を検索する。1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話の検索の詳細な説明については、以下でさらに詳細に検討される図4にて説明される。

0059

任意的なステップ205にて、コンピュータ(101)は、1つまたは複数の発見した発話を、拡張されたQ&Aドキュメントのセット、F1、(292)内の対応するQ&Aドキュメントにさらに追加して、拡張されたQ&Aドキュメントのセット、F2、(293)を生成する。対応するQ&Aドキュメントは、抽出された発話の識別子、または抽出された発話の識別子と関連付けられた識別子、と共通のQ&A IDを有する。

0060

拡張されたQ&Aドキュメントのセット、F2、(293)は、以下でさらに詳細に検討されるように、図6にて説明される検索方法に使用されてもよい。発見した発話は、抽出された繰り返し部分に対応する類似ドキュメントであり、検索処理における顧客の要求の表現を拡張してもよく、多数のパラフレーズを含んでもよい。したがって、検索処理において検索結果を向上させるために、拡張されたQ&Aドキュメントのセット、F2、(293)を利用することは有用である。

0061

上述の追加の後、コンピュータ(101)は、拡張されたQ&Aドキュメントのセット、F2、(293)を、記憶装置、例えば、ディスク(109)に格納する。拡張されたQ&Aドキュメントのセット、F2、の例示的な一実施形態が図11に示され以下でさらに詳細に説明される。

0062

1つまたは複数の発見した発話を、拡張されたQ&Aドキュメントのセット内の対応するQ&Aドキュメントに追加することにより、顧客の要求の表現を拡張することができ、拡張されたQ&Aドキュメントのセットが、多数のパラフレーズを含むことになる。したがって、顧客の質問に対する応答の検索を、拡張されたQ&Aデータベースを使用して行う際、より適切なQ&Aドキュメントを抽出することができる。

0063

ステップ206にて、コンピュータ(101)は上述の方法を終了する。

0064

ここで図3を参照すると、図3は、セット内のQ&Aドキュメントに繰り返し部分を追加するための方法のフローチャートの一実施形態を示す。

0065

ステップ211にて、コンピュータ(101)が、上述の方法を開始する。

0066

ステップ212にて、コンピュータ(101)は、Csのセット内の対応担当者の発話のうちの1つのコール・ログCs[i]を読み取る。なお、Csのセット、すなわち、対応担当者の発話、は繰り返し部分をセット内のQ&Aドキュメントに追加するための方法において使用される。

0067

ステップ213にて、コンピュータ(101)は、ステップ212で読み取ったコール・ログCs[i]から、1つの発話Cs[i][j]を読み込む。

0068

ステップ214にて、コンピュータ(101)は、繰り返し部分を抽出するための1つまたは複数の規則を選択する。この規則は、以下のように表すことができる。R[k]:1<=k<=Nr、ここで、Nrは、規則の総数である。規則の一実施形態が、図10に示され以下でさらに詳細に説明される。

0069

ステップ215にて、コンピュータ(101)は、1つまたは複数の繰り返し部分を抽出するための1つまたは複数の規則に基づき、発話Cs[i][j]から、対応担当者の1つまたは複数の繰り返し部分を抽出する。

0070

ステップ216にて、コンピュータ(101)は、発話の全てが処理されたか否かを判定する。判定結果が肯定であれば、コンピュータ(101)は、ステップ216に進み、判定結果が否定であれば、コンピュータ(101)はステップ213に戻り、ステップ213から216の方法を繰り返す。

0071

ステップ217にて、コンピュータ(101)は、コール・ログの全てが処理されたか否かを判定する。判定結果が肯定であれば、コンピュータ(101)は、ステップ218に進み、判定結果が否定であれば、コンピュータ(101)はステップ212に戻り、ステップ212から217の方法を繰り返す。

0072

コンピュータ(101)は、抽出結果p0を得る。抽出結果p0は、以下のように表すことができる。p0=list{C[i][j],Q&A ID}例えば、抽出結果p0は、Cs[1][5],Q&A_AAAAである。

0073

ステップ218にて、コンピュータ(101)は、1つまたは複数の抽出された繰り返し部分を、セット内の同じQ&A IDを持つ対応するQ&Aドキュメントに追加して、拡張されたQ&Aドキュメントのセット、F1、(292)を生成する。

0074

ステップ219にて、コンピュータ(101)は上述の方法を終了する。

0075

ここで、図4を参照すると、図4は、繰り返し部分に類似する発話を検索するための方法のフローチャートの一実施形態を示す。

0076

ステップ221にて、コンピュータ(101)が、上述の方法を開始する。

0077

ステップ222にて、コンピュータ(101)は、対応担当者と顧客との間の会話における、対応担当者の発話、または、対応担当者および顧客の発話、のコール・ログCpを読み取る。コール・ログCpは、以下のように表すことができる。Cp[i]:1<=m<=Np、ここで、Npは、コール・ログCpの総数である。

0078

ステップ223にて、コンピュータ(101)は、類似度検索インデックス・ビルダにより、類似度検索インデックスを生成する。類似度検索インデックスの生成では、各ログCp[i][j]が、ベクトル表示、例えば、Vec[x]、に変換される。変換は、例えば、ログCp[i][j]内の単語の頻度、Term Frequency-Inverse Document Frequency (tf-idf)、Latent Semantics Index (LSI)またはword2vec(以下のURLを参照のこと:)、を使用して実行することができるが、これに限定されない。

0079

ステップ224にて、コンピュータ(101)は、拡張されたセットF1、(292)内の1つのQ&Aドキュメントを読み取る。Q&Aドキュメントはまた、ステップ223で説明した同じ方法を使用して、ベクトル表現に変換される。

0080

ステップ225にて、コンピュータ(101)は、類似度検索エンジンを使用して、入力としてQ&Aドキュメントを入力し、出力として類似のリストを準備する。出力の一実施形態は、以下のように表すことができる。出力:{類似度,Cp[m][n],Q&A ID}出力の例は、以下の通りでもよい。{0.832,Cp[497[23],Q&A_AAAA;0.734,Cp[498][12],Q&A_AAAA;0.722,Cp[499][8],Q&A_ZZZZ; 0.655,Cp[500][15],Q&A_AAAA;0.200, Cp[202][13],Q&A_AAAA}

0081

類似度は、ステップ223にて生成されたベクトルと、ステップ224にて生成されたベクトルとの間の距離を計測することにより判定されてもよい。距離は、例えば、コサイン類似度により計算されてもよいが、これに限定されない。コサイン類似度は、2つのベクトル間の類似度を計測するための方法である。

0082

ステップ226にて、コンピュータ(101)は、出力の類似度が、所定の閾値以上であるかどうか、出力のQ&A IDが、抽出された繰り返し部分の識別子と共通かどうか、を判定する。

0083

以下の2つの方法のいずれかを、判定に使用することができる。

0084

一方の方法では、最初に、準備された音声認識結果から、1つまたは複数の抽出された繰り返し部分ごとの所定の閾値以上の類似度を有する1つまたは複数の発話を検索し、次に、所定の閾値以上の類似度を有する1つまたは複数の発見した発話から、1つまたは複数の抽出された繰り返し部分のそれぞれの識別子と共通の識別子を有する1つまたは複数の発話を抽出する。

0085

もう1つの方法では、最初に、準備された音声認識結果から、1つまたは複数の抽出された繰り返し部分のそれぞれの識別子と共通の識別子を有する1つまたは複数の発話を抽出し、次に、1つまたは複数の抽出された繰り返し部分のそれぞれについて所定の閾値以上の類似度を有する1つまたは複数の発話を検索する。

0086

判定結果が肯定であれば、コンピュータ(101)は、ステップ227に進み、判定結果が否定であれば、コンピュータ(101)はステップ224に戻り、ステップ224から226の方法を繰り返す。

0087

肯定の判定が得られるとき、ステップ226の出力の例は、以下の通りでもよい。所定の閾値が0.600に設定されて、抽出された繰り返し部分の識別子がQ&A_AAAAである場合、{0.832,Cp[497][23],Q&A_AAAA;0.734,Cp[498][12],Q&A_AAAA;0.655,Cp[500][15],Q&A_AAAA}となる。

0088

ステップ227にて、コンピュータ(101)は上述の方法を終了する。

0089

類似度検索インデックスを使用することによる、Q&Aドキュメントとの類似度を計算する一実施形態が、図13に示され以下でさらに詳細に説明される。

0090

図4にて説明される方法を通じて、コンピュータ(101)は1つまたは複数の発見した発話を取得する。図2にて説明された、ステップ205で説明されるように、コンピュータ(101)は、1つまたは複数の発見した発話を、拡張されたQ&Aドキュメントのセット、F1、(292)内の対応するQ&Aドキュメントにさらに追加して、拡張されたQ&Aドキュメントのセット、F2、(293)を生成する。拡張されたQ&Aドキュメントのセット、F2、(293)は、以下のように表すことができる。F2[x]:1<=x<=Nf2、ここで、Nf2は、拡張されたQ&Aドキュメントのセット、F2、(293)内のQ&Aドキュメントの総数である。

0091

図5は、QADBを拡張するための方法の全体フローチャートの別の実施形態を示す。

0092

ステップ301にて、コンピュータ(101)が、上述の方法を開始する。

0093

ステップ302にて、コンピュータ(101)が、Q&Aドキュメントのセットを、例えば、QADBを読み取ることにより。準備する。QADBは、Q&Aドキュメントのうちの1つまたは複数、または、Q&Aドキュメントのセットを備える。

0094

Q&Aドキュメントのセットは、ステップ301での開始より前に、予め準備されてもよい。QADBまたはQ&Aドキュメントのセットの一実施形態が、図7にて以下でさらに詳細に示される。

0095

ステップ302にて、コンピュータ(101)は、対応担当者と顧客との間の会話における対応担当者の発話の音声認識結果を、例えば、1つまたは複数のコール・ログを読み取ることにより、さらに準備する。なお、対応担当者の発話は、図5にて説明される方法において使用される。

0096

コール・ログは、ステップ301での開始より前に、予め準備されてもよい。コール・ログの一実施形態が、図8に示され以下でさらに詳細に説明される。

0097

ステップ303にて、コンピュータ(101)は、対応担当者の発話の音声認識結果の全てまたはほぼ全てを、セット内の対応するQ&Aドキュメントに追加して、拡張されたQ&Aドキュメントのセットを生成する。対応担当者の発話の音声認識結果の全てまたはほぼ全てを、セット内の対応するQ&Aドキュメントに追加することにより、拡張されたQ&Aドキュメントのセットは、対応担当者の発話に含まれるより適切なキーワードを、有することができる。したがって、顧客の質問に対する応答の検索を、拡張されたQ&Aデータベースを使用して行う際、より適切なQ&Aドキュメントを抽出することができる。

0098

ステップ304にて、コンピュータ(101)は上述の方法を終了する。

0099

図6は、拡張されたQ&Aドキュメントのセット、F1、(292)、または拡張されたQ&Aドキュメントのセット、F2、(293)を使用した、顧客の質問に対する応答を検索するための方法のフローチャートの一実施形態を示す。

0100

ステップ401にて、コンピュータ(101)が、上述の方法を開始する。

0101

ステップ402にて、コンピュータ(101)は、会話から、顧客の質問または対応担当者の返答または繰り返し部分の音声認識結果を、入力として受け取る。音声認識結果は、実行時に取得することができる。

0102

ステップ403にて、コンピュータ(101)は、拡張されたQ&Aドキュメントのセット、F1、(292)、または拡張されたQ&Aドキュメントのセット、F2、(293)を使用して、QADBから、顧客の質問または対応担当者の返答に対するQ&Aドキュメントを抽出する。

0103

ステップ404にて、コンピュータ(101)は、抽出されたQ&Aドキュメントを、対応担当者に示す。

0104

それに従って、対応担当者は、顧客の質問についてのQ&Aドキュメントを素早く取得することができる。一実施形態において、会話における対応担当者の返答、または会話における顧客の質問開始時には、拡張されたQ&Aドキュメントのセット、F1、(292)、または拡張されたQ&Aドキュメントのセット、F2、(293)を使用した、検索方法の入力として、数百個の単語、例えば、100から300個の単語、または150から250個の単語、または、ほぼ200個の単語が使用されて、結果、すなわち、顧客の質問に対応するQ&Aドキュメントを取得することができる。

0105

ステップ405にて、コンピュータ(101)は上述の方法を終了する。

0106

図7から11は、フローチャートで使用されるデータ、またはフローチャートの一実施形態に従って生成されるデータの実施形態を示す。

0107

ここで図7を参照すると、図7は、QADB(501)の一実施形態を示す。

0108

QADB(501)は、複数のQ&Aドキュメントのセットを備える。各Q&Aドキュメントは、F[x]、Q&A ID、および記述を有する。F[x]を使用して、各Q&Aドキュメントの番号を指定することができる。Q&A IDを使用して、予め定義した分類または予め定義したカテゴリに従って、Q&Aドキュメントを分類することができる。記述には、Q&Aドキュメントのタイトル、質問、および質問に対応する応答、を含むものとすることができる。記述は、XML、HTML、またはXHTMLとして記述されてもよい。

0109

ここで、図8を参照すると、図8は、コール・ログ(511)の一実施形態を示す。

0110

コール・ログ(511)のそれぞれが、Cs[i][j]、Q&A ID、および音声認識結果または1つまたは複数の発話、を有する。Cs[i][j]を使用して、各ログの番号を指定することができる。Q&A IDは、該当するQ&Aドキュメントの識別子と共通でもよい。各コール・ログのQ&A IDは、例えば、顧客と対応担当者との間の会話が終了した後に、対応担当者により、手動で割り当てられてもよい。例えば、対応担当者は、会話に使用されたQ&Aドキュメントを組み合わせること、または、会話に使用されたQ&AドキュメントのQ&A IDを入力すること、により識別子を各コール・ログに割り当てることができる。Q&Aドキュメントの識別子と共通の識別子を各コール・ログに割り当てることにより、コール・ログがQ&Aドキュメントに関連付けられる。

0111

例えば、コール・ログが500個であるとき、Cs[i][j]からCs[100][j]は、Cs(512)として使用されてもよく、Cs[101][j]からCs[500][j]は、Cp(513)として使用されてもよい。

0112

図9は、Q&Aドキュメントの中の関連識別子の一実施形態を示す。

0113

QADB(521)は、複数のQ&Aドキュメントを備える。

0114

ID番号201、202および203を持つQ&Aドキュメントは、電信送金に関する関連付けられたQ&Aドキュメントである。

0115

ID番号211、212、および213を持つQ&Aドキュメントは、納税に関する関連付けられたQ&Aドキュメントである。

0116

関連情報は、例えば、テーブル(525)に格納されてもよい。

0117

図10は、音声認識結果から繰り返し部分を抽出するための規則の一実施形態を示す。

0118

規則R[k]は、テーブル(531)にリストアップされる。テーブル(531)には、規則R[l]からR[n]が含まれる。規則の例は、以下で説明する。

0119

規則R[1]は、「承知しました(.*)NTENCE>」である。規則R[1]は、コール・ログCsから、語句「承知しました」を含む繰り返し部分を選択するために使用される。

0120

規則R[2]は、「確認させてください(.*)NTENCE>」である。規則R[2]は、コール・ログCsから、語句「確認させてください」を含む繰り返し部分を選択するために使用される。

0121

規則R[3]は、「なさりたいのですね(.*)NTENCE>」である。規則R[3]は、コール・ログCsから、語句「なさりたいのですね」を含む繰り返し部分を選択するために使用される。

0122

規則R[4]は、「お客様がおっしゃったのは(.* WHEN.*)NTENCE>」である。規則R[4]は、コール・ログCsから、語句「お客様がおっしゃったのは」を含む繰り返し部分を選択するために使用される。

0123

図11は、元のQ&Aデータベースと、図2にて説明されるフローチャートの一実施形態に従って拡張されたQ&Aデータベースと、の一実施形態を示す。

0124

Q&Aドキュメント(541)は、元のQ&Aドキュメント、Fを示す。

0125

Q&Aドキュメント(542)は、元のQ&Aドキュメント、F(541)に加えて、「承知しました。はい。お客様はすでに新しいご住所にお引越しされていらっしゃいますね。はい。お客様は新しいご住所に近い新しい店舗をお知りになりたいのですね。お客様はパスワードをお忘れになり、パスワードの再発行をご希望ですね。」という、対応担当者の発話の音声認識結果から抽出された繰り返し部分を備える拡張されたQ&Aドキュメント、F1、を示す。

0126

Q&Aドキュメント(543)は、拡張されたQ&Aドキュメント、F1(542)に加えて、「承知しました。お客様はクレジットカード紛失されたのですね。お客様はクレジットカードを紛失されたのかもしれないのですね。この手続きで、お客様のカードが見つかるまで安全のためにカードを停止することができます。もしご希望でしたら、お客様のカードを今無効にして、新しいカードの再発行をいたします。」、「承知しました。お客様がカードの再認証をご希望ということは、私共が停止させたカードが見つかったのですね。お客様にはなによりございました。お客様はカードをお申し込みになりました。ですが、お客様はカードをお受け取りになれません。お客様は引っ越しされました。ですが、お客様のカードは戻ってきていません。手続きの履歴をお調べいたします。」および「私共がカードを受け取っております。お客様はカードを見つけることはできません。お客様はカードのサービスを停止させたいのですね。では、お客様のカードの停止の手続きを始めます。停止するまでには1時間ほどかかります。」という、対応担当者の発話の音声認識結果から抽出された繰り返し部分を備える拡張されたQ&Aドキュメント、F2を示す。

0127

図12は、元のQ&Aデータベースと、図5にて説明されるフローチャートの別の実施形態に従って拡張されたQ&Aデータベースと、の一実施形態を示す。

0128

Q&Aドキュメント(601)は、元のQ&Aドキュメントを示す。

0129

Q&Aドキュメント(602)は、元のQ&Aドキュメント(601)に加えて、図8に見られる、対応担当者の発話の音声認識結果の全てを備える、拡張されたQ&Aドキュメントを示す。

0130

図13は、類似度検索インデックスを使用することにより、Q&Aドキュメントとの類似度を計算する一実施形態を示す。

0131

Q&Aドキュメント、F1[295](701)について検討する。F1[295](701)の内容が、テーブル(702)に示されており、Q&Aドキュメント(542)に対応する。

0132

テーブル(721)は、コール・ログCp[1][1]−Cp[Np][・・・]から生成される類似度検索インデックスを示す。

0133

テーブル(711)は、拡張されたセットF1内の、Q&Aドキュメント、F1[295](701)から生成されるベクトルを示す。

0134

テーブル(741)は、テーブル(711)に示されるベクトルと、テーブル(721)に示される各ログのベクトルとの間の、F1[295]との類似度を示す。

0135

所定の閾値が0.200に設定されているとき、ログCp[203][13]およびCp[497][23]が出力として抽出される。

0136

図14は、図2にて説明されるフローチャートの一実施形態に従って使用される、コンピュータ・システム・ハードウェアの、全体機能ブロック図の一実施形態を示す。

0137

コンピュータ(801)は、コンピュータ(101)に相当し得る。

0138

コンピュータ(801)は、読み取り部(811)および追加部(812)を備える。さらに、コンピュータ(801)は、選択的に、繰り返し部分の抽出部(813)、検索部(814)、またはこれらの組合せを備えてもよい。

0139

読み取り部(811)は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における、少なくとも対応担当者の発話の音声認識結果と、を準備することができる。

0140

読み取り部(811)は、図2にて説明されるステップ202、図4にて説明されるステップ222、図5にて説明されるステップ302、を実行することができる。

0141

追加部(812)は、対応担当者の発話の音声認識結果から抽出された1つまたは複数の繰り返し部分を、セット内の対応するQ&Aドキュメントに追加することができる。追加部(812)は、1つまたは複数の発見した発話を、対応するQ&Aドキュメントにさらに追加することができる。

0142

追加部(812)は、図2にて説明されるステップ203および205、図3にて説明されるステップ218、図5にて説明されるステップ303、を実行することができる。

0143

繰り返し部分の抽出部(813)は、1つまたは複数の繰り返し部分を抽出するための1つまたは複数の規則に基づき、準備された音声認識結果から、対応担当者の1つまたは複数の繰り返し部分を抽出することができる。

0144

繰り返し部分の抽出部(813)は、図3にて説明されるステップ212から217を実行することができる。

0145

検索部(814)は、準備された音声認識結果から、1つまたは複数の抽出された繰り返し部分のそれぞれに類似する1つまたは複数の発話を検索することができる。

0146

検索部(814)は、図4にて説明されるステップ223から226を実行することができる。

0147

図15は、図5にて説明されるフローチャートの一実施形態に従って使用される、コンピュータ・システム・ハードウェアの、全体機能ブロック図の一実施形態を示す図である。

0148

コンピュータ(901)は、コンピュータ(101)に相当し得る。

0149

コンピュータ(901)は、読み取り部(911)および追加部(912)を備える。

0150

読み取り部(911)は、Q&Aドキュメントのセットと、対応担当者と顧客との間の会話における、対応担当者の発話の音声認識結果と、を準備することができる。

0151

読み取り部(911)は、図5にて説明されるステップ302を実行することができる。

0152

追加部(912)は、対応担当者の発話の音声認識結果を、セット内の対応するQ&Aドキュメントに追加することができる。

0153

追加部(912)は、図5にて説明されるステップ303を実行することができる。

0154

本発明は、方法、システム、またはコンピュータ・プログラム製品あるいはこれらの組合せ、とすることができる。コンピュータ・プログラム製品には、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有する、コンピュータ可読記憶媒体(単数または複数)が含まれてもよい。

0155

コンピュータ可読記憶媒体は、命令実行装置が使用するための命令を保持かつ記憶することができる、有形な装置とすることができる。コンピュータ可読記憶媒体は、例えば、電子記憶装置磁気記憶装置光学式記憶装置電磁記憶装置、半導体記憶装置、または、上記の任意の適切な組合せ、とすることができるが、これに限定されない。コンピュータ可読記憶媒体のより具体的な例の、非包括的なリストに含まれるものには、携帯可能なコンピュータ・ディスケット、ハードディスク、ランダムアクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可プログラム可能な読み出し専用メモリ(EPROM)またはフラッシュメモリスタティック・ランダム・アクセス・メモリ(SRAM)、携帯可能なコンパクト・ディスク読み出し専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)、メモリ・スティックフロッピー(R)ディスク、パンチカードや、溝に命令が記録された隆起構造体などの機械的に符号化されたデバイス、および、上記の任意の適切な組合せ、がある。コンピュータ可読記憶媒体は、本明細書において使用されるとき、電波もしくは他の自由に伝播する電磁波、導波管もしくは他の伝送媒体を介して伝播する電磁波(例えば、光ファイバケーブルを通る光パルス)、またはワイヤを介して伝送される電気信号、などの一時的な信号そのものであると解釈されるべきではない。

0156

本明細書に記載されるコンピュータ可読プログラム命令のダウンロードは、コンピュータ可読記憶媒体から、それぞれのコンピューティング装置処理装置へ、または、ネットワーク、例えば、インターネットローカルエリア・ネットワーク、ワイド・エリア・ネットワーク、もしくは無線ネットワークあるいはこれらの組合せ、を介して、外部コンピュータもしくは外部記憶装置へ、行うことができる。ネットワークは、銅の伝送ケーブル光伝送ファイバ無線伝送ルータファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバあるいはこれらの組合せ、を備えることができる。各コンピューティング装置/処理装置におけるネットワーク・アダプタ・カードまたはネットワーク・インターフェースが、ネットワークからコンピュータ可読プログラム命令を受信し、このコンピュータ可読プログラム命令を、それぞれのコンピューティング装置/処理装置のコンピュータ可読記憶媒体への記憶のために転送する。

0157

本発明の操作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令インストラクション・セット・アーキテクチャ(ISA)命令、機械語命令機械依存命令、マイクロコードファームウェア命令、状態設定データ、または、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、もしくは、「C」プログラミング言語もしくは同様のプログラミング言語などの従来の手続き型プログラミング言語、を含む1つまたは複数のプログラミング言語の任意の組合せにより書かれるソース・コードもしくはオブジェクト・コード、とすることができる。コンピュータ可読プログラム命令の実行は、全体としてユーザのコンピュータ上で、スタンドアロン型のソフトウェア・パッケージとして部分的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、かつ部分的にリモート・コンピュータ上で、または、全体としてリモートのコンピュータもしくはサーバ上で、行うことができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)もしくはワイド・エリア・ネットワーク(WAN)を含む任意のタイプのネットワークを介して、ユーザのコンピュータと接続されてもよく、または、接続は、外部コンピュータと行ってもよい(例えば、インターネットを介してインターネット・サービス・プロバイダを使用して)。いくつかの実施形態において、例えば、プログラム可能論理回路フィールドプログラマブルゲートアレイFPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによりコンピュータ可読プログラム命令を実行して、本発明の態様を実行するために電子回路をパーソナライズすることができる。

0158

本発明の態様は、本発明の実施形態に係る方法、装置(システム)、およびコンピュータ・プログラム製品の、フローチャート説明図またはブロック図あるいはその両方を参照して、本明細書において記載される。フローチャート説明図またはブロック図あるいはその両方の各ブロック、および、フローチャート説明図またはブロック図あるいはその両方におけるブロックの組合せが、コンピュータ可読プログラム命令により実装可能であることは理解されるであろう。

0159

これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックにおいて指定される機能/動作を実装するための手段を作成するように、汎用コンピュータ、専用コンピュータ、または他のプログラム可能データ処理装置のプロセッサに提供されて、マシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令はまた、命令を記憶しているコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックにおいて指定される機能/動作の態様を実装する命令を含む製造品を備えるように、コンピュータ可読記憶媒体に記憶され、コンピュータ、プログラム可能データ処理装置、または他の装置あるいはこれらの組合せに、特定の様式で機能するように指示することができるものであってもよい。

0160

コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能装置、または他の装置上で実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックにおいて指定される機能/動作を実装するように、コンピュータで実装される処理を製作するべく、コンピュータ、他のプログラム可能データ処理装置、または他の装置にロードされ、コンピュータ、他のプログラム可能装置、または他の装置上で一連動作ステップを実行させるものであってもよい。

0161

図面におけるフローチャートおよびブロック図は、本発明の種々の実施形態に係るシステム、方法、およびコンピュータ・プログラム製品の、可能な実装のアーキテクチャ、機能性、および操作を示す。これに関して、フローチャートまたはブロック図における各ブロックは、指定される論理機能を実装するための1つまたは複数の実行可能命令を備える、命令のモジュールセグメント、または部分を表すことができる。いくつかの代替の実装において、ブロックに記載される機能は、図面に記載される順番とは異なって発生することもある。例えば、連続して示される2つのブロックが、実際は、実質的に同時に実行されてもよく、または、これらのブロックは、付随する機能性に応じて、逆の順番で実行されることがあってもよい。また、ブロック図またはフローチャート説明図あるいはその両方の各ブロック、および、ブロック図またはフローチャート説明図あるいはその両方におけるブロックの組合せが、特定の機能または動作を実行するか、または、専用のハードウェアおよびコンピュータ命令の組合せを実行する、専用ハードウェアベースのシステムによって実装可能であることも、留意されたい。

0162

「1つを備える/備えている」という表現から、「少なくとも1つを備える/備えている」として理解されるべきである。

0163

「備える/備えている」という表現から、「少なくとも備える/備えている」として理解されるべきである。

0164

「/」という表現から、「前者または後者あるいはその両方」として理解されるべきである。

0165

質問応答(Q&A)データベースを拡張するためのシステムおよび方法の好ましい実施形態について説明したが(限定的ではなく例示的であることが意図されている)、上述の技術に照らして、当業者により変更および変形が可能であることに留意されたい。したがって、添付の請求項により概括されるような本発明の範囲内にある、開示された特定の実施形態において、変形がなされてもよいことは理解されるべきである。本発明の態様について、特許法により要件とされる詳細および特殊性と共に説明したが、請求し、かつ特許証による保護を希望するものについて、添付の請求項において記載する。

0166

101コンピュータ
102 CPU
103メインメモリ
104バス
105ディスプレイ・コントローラ
106 ディスプレイ
107 コントローラ
108ディスク
109ドライブ
110キーボード−マウス・コントローラ
111 キーボード
112 マウス
113通信コントローラ
114 通信インターフェース

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ