図面 (/)

技術 無線情報デバイスに音声メールを提供する方法

出願人 スピンヴォックスリミテッド
発明者 ドルトン,ダニエル,マイケル
出願日 2004年4月22日 (15年2ヶ月経過) 出願番号 2006-506190
公開日 2006年10月26日 (12年8ヶ月経過) 公開番号 2006-524451
状態 特許登録済
技術分野 他装置と結合した電話通信 電話通信サービス
主要キーワード 転送セット ドロップライン 通報器 VOX メッセージングフォーマット プロセスフローチャート 卓上電話 ナビゲーションオプション
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2006年10月26日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (18)

課題・解決手段

音声メールで音声メールが受信され、オーディオファイル形式に変換され、次いで、ワイドエリアネットワークを通じて、コンピュータネットワークからなる音声テキスト文字表記ステムに送信またはストリーミングされる。ネットワーク化されたコンピュータの1つが音声メッセージオペレータに対して再生し、オペレータは対応するテキストメッセージ(実際には、機械的な単語対単語の変換ではなく、元の音声メッセージを簡潔にしたバージョン)をコンピュータに入力して文字表記されたテキストメッセージを生成することにより、元の音声メッセージから実際のメッセージをインテリジェントに文字表記する。そして、文字表記されたテキストメッセージがコンピュータから無線情報デバイスに送信される。機械による文字表記の代わりに人間のオペレータが使用されるので、音声メールが、正確、インテリジェント、適切、かつ簡潔にテキストメッセージ(SSM/MMS)に変換される。

概要

背景

音声メールは、その他の方法では連絡がつかないような場合に、ユーザの電話機電話している者からの音声メッセージを記憶しておき、都合のよい時にそのメッセージをユーザに中継するという単一の目的を有する。しかし、今日の音声メールシステムは、特に携帯電話などの無線情報デバイスの場合には、これをインテリジェントに行うことができない。主な理由は、ユーザの無線情報デバイスから遠隔音声メールサーバへのインタフェース性質にある。即ち、一般的に、携帯電話ユーザは、ネットワーク事業者によって管理される音声メールサーバを呼び出す(又は音声メールサーバによって呼び出される)。音声メールサーバは、ユーザにメッセージ数通知する合成音声を生成し、次いでメッセージを再生する合成音声を生成する。そして、「再生するには1を押してください」、「削除するには2を押してください」、「繰り返すには3を押してください」等の種々の選択項目が合成音声によって話される。このような音声メールの形態は、いくつかの問題をユーザに呈する。まず、第1に、ユーザは、重要な情報を書き留めるためのペンと紙を持ち合わせていない場合がある。第2に、ユーザは、選択項目を忘れてしまう、或は聞き取ることができず、従って、音声メールシステムを効果的に操作できない場合がある。

この不十分で分かりにくいインタフェースのために、音声メールは、携帯電話ユーザの少なくとも45%のユーザには使用されていない。又、音声メールを使用するユーザの中において、音声メールは、それらユーザの通話時間使用額(spend)の30%を占める。このように驚くほど高いレベルの理由の1つとして、インタフェースが分かりにくいために、ユーザが1回で詳細を得られなかった主要なメッセージを聞くためだけに、頻繁に再度ダイヤルすることが挙げられる。

音声メールの取り出しを容易にするいくつかの試みがなされている。例えば、Breveon Inc.による米国特許第6507643号(特許文献1)が挙げられる。この特許では、音声認識コンピュータを使用することにより、音声メールをテキストメッセージに自動的に変換する。テキストメッセージは、電子メールメッセージとしての送信や、PCやラップトップコンピュータなどのテキスト表示装置での閲覧に適している。また、書かれたメッセージを読むことは、音声メールによる音声を聞くより時間がかからないし、既に文字によって記述されているので、ユーザがメッセージから重要な情報を書き留める必要もない。しかし、自動化された音声メールシステムの性能や精度はかなり限られており、又、人間の発話にある普通のためらい(「えーと」、「うーん」、「あー」等)も、盲目的に文字として表記してしまう。人間の会話を聞いているときには、そうした音を容易に除去し、本質的な伝達内容に集中することができる。しかしながら、電子メールにおいて機械的に文字化された、そうした「ためらい」を目にすると、送信者が明晰でないように感じられることがある。

音声からテキストへの自動変換は、理論上は、携帯電話自体の中に配置することもできる。Nokia Short Voice Messaging system(欧州特許第1248486号(特許文献2))を参照されたい。このシステムでは、ユーザは、自分の携帯電話にメッセージを話すと、その携帯電話が自動化音声認識エンジンを使用してその場でそのメッセージをテキストに変換し、次いでそのテキストをパッケージし、SMSメッセージとして送信する。

音声テキスト変換システムの分野においては、自動化音声認識ソフトウェアの精度を改良することに多大な注力がなされている。現在の生成ソフトウェアは、特定の者によって話された単語を認識するように更にトレーニングされる必要があるか、或は、非常に限られた語彙の認識に制限されており、文脈の認識に関しては大きな課題を残している。音声認識ソフトウエアのトレーニングにおいては、ユーザがかなり広範囲試験用文章を読み上げ、装置による文字化で生じた文字化エラー修正することが必要となる。これは、時間がかかり、努力を要する作業である。上記システムは、携帯電話の小さなキーを使用してテキストメッセージを入力する必要はなくすが、一般的な自動化音声認識ソフトウェアにつきものの不正確さと不適当な文字化に対処するものではない。
米国特許第6507643号
欧州特許第1248486号

概要

音声メールで音声メールが受信され、オーディオファイル形式に変換され、次いで、ワイドエリアネットワークを通じて、コンピュータのネットワークからなる音声/テキスト文字表記システムに送信またはストリーミングされる。ネットワーク化されたコンピュータの1つが音声メッセージをオペレータに対して再生し、オペレータは対応するテキストメッセージ(実際には、機械的な単語対単語の変換ではなく、元の音声メッセージを簡潔にしたバージョン)をコンピュータに入力して文字表記されたテキストメッセージを生成することにより、元の音声メッセージから実際のメッセージをインテリジェントに文字表記する。そして、文字表記されたテキストメッセージがコンピュータから無線情報デバイスに送信される。機械による文字表記の代わりに人間のオペレータが使用されるので、音声メールが、正確、インテリジェント、適切、かつ簡潔にテキストメッセージ(SSM/MMS)に変換される。

目的

・メッセージを開き、読む前に、メッセージの実際の送信者を認識でき、受信された音声メールの「受信箱ビューをユーザに提供する

効果

実績

技術文献被引用数
3件
牽制数
3件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

無線情報デバイス音声メールを提供する方法であって、(a)音声メールサーバ音声メッセージを受信するステップと、(b)前記音声メッセージをオーディオファイル形式に変換するステップと、(c)前記オーディオファイルを、ワイドエリアネットワークを通じて、コンピュータネットワークからなる音声/テキスト文字表記化システムに送信またはストリーミングするステップとを備え、前記方法は、(i)前記ネットワーク化されたコンピュータの1つが前記音声メッセージをオペレータに対して再生するステップと、(ii)前記オペレータが前記コンピュータにおいて前記元の音声メッセージをインテリジェント文字表記化することにより、文字表記されたテキストメッセージを生成するステップと、(iii)前記オペレータが前記文字表記されたテキストメッセージを前記コンピュータから前記無線情報デバイスに送信させるステップとを備えることを特徴とすることを特徴とする方法。

請求項2

前記文字表記されたテキストメッセージは、前記音声メールサーバに保持された前記音声メッセージに前記テキストメッセージをリンクする一意識別を含み、これにより、前記文字表記化されたテキストメッセージに関連する前記デバイス上で表示されるオプションエンドユーザが選択することによって、その音声メッセージを無線情報デバイスで再生できるようにすることを特徴とする請求項1に記載の方法。

請求項3

前記文字表記されたテキストメッセージには、前記音声メッセージが最初に前記音声メールサーバで受信された時刻と日付が加えられることを特徴とする請求項1又は2に記載の方法。

請求項4

前記音声メッセージは、携帯電話または固定電話から発信されることを特徴とする請求項1乃至3のいずれかに記載の方法。

請求項5

前記文字表記されたテキストメッセージには、電話番号や発呼者名前のような発呼者識別データが追加されていることを特徴とする請求項1乃至4のいずれかに記載の方法。

請求項6

前記文字表記されたテキストメッセージは、前記音声メッセージの発信者から直接送信されたかのように前記デバイスに表示されることを特徴とする請求項5に記載の方法。

請求項7

前記コンピュータは、前記無線情報デバイスに関連付けられた電話番号をオペレータに表示しないことを特徴とする請求項3に記載の方法。

請求項8

前記コンピュータは、言語、方言、または文化に関する理由から、前記音声メッセージを文字表記化するのにより適した別のオペレータのコンピュータに前記オーディオファイルを再転送する選択肢をオペレータに表示することを特徴とする請求項1乃至7のいずれかに記載の方法。

請求項9

前記コンピュータは、前記オペレータに、文化的な言葉、定期的な出来事スポーツイベントメディアイベント、他の種の報道価値のある出来事に関連する、専門用語検索可能リストを提供して、前記オペレータがそれらの専門用語を正確に文字表記化することを助けることを特徴とする請求項1乃至8のいずれかに記載の方法。

請求項10

前記オペレータは、文字による記述または顔文字(emoticon)を使用して、前記文字表記されたテキストメッセージに、前記音声メッセージを残す発呼者の気分を表現することを特徴とする請求項1乃至9のいずれかに記載の方法。

請求項11

前記オペレータは、前記音声メッセージを簡潔に要約することを特徴とする請求項1乃至10のいずれかに記載の方法。

請求項12

前記オペレータは、SMSの制限である160文字に収まるように前記音声メッセージを要約するか、複数のテキストメッセージを連結することを特徴とする請求項10に記載の方法。

請求項13

前記オペレータは、前記音声メッセージにあるためらい、アーチファクト、または繰り返しを、前記文字表記されたテキストメッセージから除去することを特徴とする請求項1乃至12のいずれかに記載の方法。

請求項14

前記テキストメッセージは、前記デバイスのユーザによって適切なものとしてあらかじめ指定されたフォーマットで前記無線情報デバイスに送信されることを特徴とする請求項1乃至13のいずれかに記載の方法。

請求項15

前記テキストメッセージは、SMS、MMS電子メール、またはファックスとして送信されることを特徴とする請求項1乃至14のいずれかに記載の方法。

請求項16

前記文字表記されたテキストメッセージを構文解析し、前記無線情報デバイスで実行されるアプリケーションで前記構文解析されたデータを使用するステップを更に備えることを特徴とする請求項1乃至15のいずれかに記載の方法。

請求項17

データを構文解析し、前記構文解析されたデータを使用することは、(a)話された電話番号を抽出して、その番号を使用(電話をかける)、保存、編集、または電話帳に追加できるようにすること、(b)電子メールアドレスを抽出し、それを使用、保存、編集、またはアドレス帳に追加できるようにすること、(c)物理的な住所を抽出し、それを使用、保存、編集、または住所録に追加できるようにすること、(d)ウェブアドレスハイパーリンク)を抽出し、それを使用、編集、保存、またはアドレス帳あるいはブラウザの「お気に入り」に追加できるようにすること、(e)会合の時刻を抽出し、それを使用、保存、編集、および予定表に一項目として追加できるようにすること、(f)番号を抽出し、それをデバイスアプリケーションの1つに保存すること、(g)固有名詞を抽出し、それをウェブ(WAPまたはフルブラウザ)で検索する、または調べること、の少なくともいずれかを含むことを特徴とする請求項16に記載の方法。

請求項18

音声メッセージの録音時間が、ユーザが設定した最大時間より短い場合は、前記メッセージが文字表記化され、そうでない場合は、前記メッセージは文字表記化されず、代わりに、聞くべき新しい音声メールがあることを知らせる標準的な通知が前記ユーザに送信されることを特徴とする請求項1乃至17のいずれかに記載の方法。

請求項19

人間の文字表記者が前記音声メッセージを聞き、メッセージの受信者に送信される通話の主題を非常に短い表現に書きまとめることを特徴とする請求項18に記載の方法。

請求項20

ある量のテキストより少ないテキストしかサポートしないデバイスについては、初めにデータベースでテキストの制限が調べられ、次いで、適切な最大録音時間が自動的に提示されることを特徴とする請求項18に記載の方法。

請求項21

請求項1乃至20のいずれかに記載の方法を使用して、音声メールから文字表記され、無線情報デバイスに提供されることを特徴とするテキストメッセージ。

技術分野

0001

本発明は、無線情報デバイス音声メールを提供する方法に関する。尚、本特許出願で使用される用語「無線情報デバイス」は、双方向の無線情報機能を有する任意種のデバイス包含するものと広く解釈すべきものである。「無線情報デバイス」としては、例えば、無線電話スマートフォン通報器無線メッセージング端末パーソナルコンピュータコンピュータ、および特定用途デバイスが挙げられるが、これらに限定されるものではない。無線情報デバイスは、GSMまたはUMTS、CDMA及びWCDMA移動無線、Bluetooth、IrDA等の任意の種類のネットワークを通じて任意の方式で通信が可能なデバイスを含む。

背景技術

0002

音声メールは、その他の方法では連絡がつかないような場合に、ユーザの電話機電話している者からの音声メッセージを記憶しておき、都合のよい時にそのメッセージをユーザに中継するという単一の目的を有する。しかし、今日の音声メールシステムは、特に携帯電話などの無線情報デバイスの場合には、これをインテリジェントに行うことができない。主な理由は、ユーザの無線情報デバイスから遠隔音声メールサーバへのインタフェース性質にある。即ち、一般的に、携帯電話ユーザは、ネットワーク事業者によって管理される音声メールサーバを呼び出す(又は音声メールサーバによって呼び出される)。音声メールサーバは、ユーザにメッセージ数通知する合成音声を生成し、次いでメッセージを再生する合成音声を生成する。そして、「再生するには1を押してください」、「削除するには2を押してください」、「繰り返すには3を押してください」等の種々の選択項目が合成音声によって話される。このような音声メールの形態は、いくつかの問題をユーザに呈する。まず、第1に、ユーザは、重要な情報を書き留めるためのペンと紙を持ち合わせていない場合がある。第2に、ユーザは、選択項目を忘れてしまう、或は聞き取ることができず、従って、音声メールシステムを効果的に操作できない場合がある。

0003

この不十分で分かりにくいインタフェースのために、音声メールは、携帯電話ユーザの少なくとも45%のユーザには使用されていない。又、音声メールを使用するユーザの中において、音声メールは、それらユーザの通話時間使用額(spend)の30%を占める。このように驚くほど高いレベルの理由の1つとして、インタフェースが分かりにくいために、ユーザが1回で詳細を得られなかった主要なメッセージを聞くためだけに、頻繁に再度ダイヤルすることが挙げられる。

0004

音声メールの取り出しを容易にするいくつかの試みがなされている。例えば、Breveon Inc.による米国特許第6507643号(特許文献1)が挙げられる。この特許では、音声認識コンピュータを使用することにより、音声メールをテキストメッセージに自動的に変換する。テキストメッセージは、電子メールメッセージとしての送信や、PCやラップトップコンピュータなどのテキスト表示装置での閲覧に適している。また、書かれたメッセージを読むことは、音声メールによる音声を聞くより時間がかからないし、既に文字によって記述されているので、ユーザがメッセージから重要な情報を書き留める必要もない。しかし、自動化された音声メールシステムの性能や精度はかなり限られており、又、人間の発話にある普通のためらい(「えーと」、「うーん」、「あー」等)も、盲目的に文字として表記してしまう。人間の会話を聞いているときには、そうした音を容易に除去し、本質的な伝達内容に集中することができる。しかしながら、電子メールにおいて機械的に文字化された、そうした「ためらい」を目にすると、送信者が明晰でないように感じられることがある。

0005

音声からテキストへの自動変換は、理論上は、携帯電話自体の中に配置することもできる。Nokia Short Voice Messaging system(欧州特許第1248486号(特許文献2))を参照されたい。このシステムでは、ユーザは、自分の携帯電話にメッセージを話すと、その携帯電話が自動化音声認識エンジンを使用してその場でそのメッセージをテキストに変換し、次いでそのテキストをパッケージし、SMSメッセージとして送信する。

0006

音声テキスト変換システムの分野においては、自動化音声認識ソフトウェアの精度を改良することに多大な注力がなされている。現在の生成ソフトウェアは、特定の者によって話された単語を認識するように更にトレーニングされる必要があるか、或は、非常に限られた語彙の認識に制限されており、文脈の認識に関しては大きな課題を残している。音声認識ソフトウエアのトレーニングにおいては、ユーザがかなり広範囲試験用文章を読み上げ、装置による文字化で生じた文字化エラー修正することが必要となる。これは、時間がかかり、努力を要する作業である。上記システムは、携帯電話の小さなキーを使用してテキストメッセージを入力する必要はなくすが、一般的な自動化音声認識ソフトウェアにつきものの不正確さと不適当な文字化に対処するものではない。
米国特許第6507643号
欧州特許第1248486号

発明が解決しようとする課題

0007

任意の者によって通常の速度で話される任意の主題に関する自然な発話を確実かつ正確に認識することができる音声認識ソフトウェアを構築する作業は、なお非常に困難な作業である。それでも、音声テキスト変換システムの分野では、これは、乗り越えるべき重要な目標であり続けている。本発明は、このような通説に挑むものである。

課題を解決するための手段

0008

第1の態様で、無線情報デバイスに音声メールを提供する方法が提供され、この方法は次のステップを備える。
無線情報デバイスに音声メールを提供する方法であって、
(a)音声メールサーバで音声メッセージを受信するステップと、
(b)前記音声メッセージをオーディオファイル形式に変換するステップと、
(c)前記オーディオファイルを、ワイドエリアネットワークを通じて、コンピュータのネットワークからなる音声/テキスト文字表記化システムに送信またはストリーミングするステップとを備え、
前記方法は、
(i)前記ネットワーク化されたコンピュータの1つが前記音声メッセージをオペレータに対して再生するステップと、
(ii)前記オペレータが前記コンピュータにおいて前記元の音声メッセージをインテリジェントに文字表記化することにより、文字表記されたテキストメッセージを生成するステップと、
(iii)前記オペレータが前記文字表記されたテキストメッセージを前記コンピュータから前記無線情報デバイスに送信させるステップとを備える。

0009

機械の代わりに人間のオペレータによる文字化が採用されるので、音声メールが正確、インテリジェント、適切、かつ簡潔にテキストメッセージ(SMS/MMSなど)に変換される。
この方式を使用して音声メールを提供することには、以下に示されるように多くの利点がある。

0010

A.ユーザのために書かれる
・メッセージを取得するためのダイヤル操作が不要である。代わりに、メッセージはすでに正確かつインテリジェントに(ためらいや繰り返しを省くなど)メッセージフォーマットに文字表記されている。
・メッセージを開き、読む前に、メッセージの実際の送信者を認識でき、受信された音声メールの「受信箱ビューをユーザに提供する。また、保存、転送、削除、返信などに際して、ユーザが読むメッセージに対するコントロールをユーザに提供する。変換された音声メールは、標準的なテキストメッセージとは異なるアイコンを有する。発呼者ID(Caller ID)が入手できる場合は、発呼者IDが使用され、その番号がテキストメッセージのヘッダに埋め込まれる。これにより、そのメッセージが直接その発呼者から来たように見える。或は、その番号を公表しないようにする場合には、送信者として「SpinVox Voicemail」が受信者側に表示される。
・主要な情報が手元に届けられる。仮に「移動中」の場合であっても、ペンや紙を探す必要がない。
■大半の新しい電話機、特にスマートフォンは、テキストを解析し、その有用な部分を電話機とそのアプリケーション内で自動的に使用するために提供することができ、ユーザによるコピーの手間を省く。例えば、電話番号を直ちに格納したり使用するために利用すること、アドレスハイパーリンクさせて連絡先に追加すること、或は、住所を使用して地図ソフトウェアでその住所を自動的に見つけること等が可能である。

0011

B.煩わしさがなく、利便である
・忙しい時に音声メールから迷惑な電話がかかってこない。代わりに、ユーザは、ミーティング中に到着する音声メッセージを見て、自身の裁量でメッセージを読むことができる。

0012

C.メッセージがいつでも届く
・SMSの記憶及び転送能力は、ユーザの電話機に再度電源が入れられる、又はユーザの電話機が受信可能範囲に入ると直ちに高速の配信を保証する。
・SMS、電子メール、ファックス等、都合のよい配信方法を選択できる。

0013

D.例えばオフィスの電話機(卓上電話)のような、呼の転送をサポートする他の電話機をテキスト変換サービスへ接続する
・卓上電話及びモバイルの音声メールをユーザの携帯電話にテキストとして配信することができる。すべてがまとめて、利便に手元に配信される。
・音声メールの元の音声ファイルは、どの電話機からのパスワードでもアクセス可能サーバに記憶される。このため、携帯電話からも固定電話からも音声メールにアクセスすることができる。

0014

E.海外ローミングしている際に安価に音声メッセージが配信される
・ユーザはどこにいてもテキスト形態で音声メッセージを受信することができる。
・ユーザは電子メールとして音声メッセージを受信することもできる。そのため世界中で、携帯電話の受信範囲にいない時にも、メッセージを得ることができる。
・ローミング料金や、メッセージを取り出すための高額のかけ直しが不要である。

0015

課金ビリング)]
前払いと後払いの2つの選択肢がある。後払いは、ユーザの電話代請求書でのマイクロ課金か、クレジットデビットカードによる直接の引き落とし月払いのいずれかを介して行われる。実際には、現在、第3者の商業サービス提供者を介してどのような支払い方法でも利用することができ、そのため、主として米国における現象であるPayPalも欧州で有効な支払い方法として利用できるようになりつつある。

0016

[クレジット/デビットカード]
ユーザは、Direct Debit(英国)及び米国のPayPalを含めて、自動的な月払いのためにクレジット/デビットカードで手続きすることができる。

0017

[マイクロビリング]
ユーザは、ユーザに新しい貸付を確認する、1つのリバースビリングされる(reverse billed)SMSを介してSpinVoxの貸付(10ポンド相当)を購入することができる。通例、これは、プリペイド市場アピールする。これは、サービスを使用する毎の多数の個々のマイクロトランザクション(小額決済)の比較的高額のコスト(60%+)をうまく回避し、ユーザからのサービスの利用をいくらか促進する。そうでない場合、そのサービスは非常に高価なものとなってしまう。

発明を実施するための最良の形態

0018

本発明は、携帯電話製品一式の一部として、英国ロンドンのSpinVox Limitedによって実施される。

0019

1.VoicemailView(登録商標):音声メール/テキスト変換システム− このシステムは、元の音声メールを携帯電話で聞く選択肢とともに、音声メールをテキスト(SMS/MMSまたは同等のメッセージングフォーマット)に変換して携帯電話に配信させる選択肢を利用者に与える。用語「SMS」は、携帯電話にプレーンテキストメッセージを送信するショートメッセージサービスを意味する。「MMS」は、携帯電話と他の形態の無線情報デバイスとの間でマルチメディア通信を送信するための、3GPP(第3世代パートナーシッププロジェクト)によって開発されたマルチメディアメッセージングサービスを意味する。これらの用語は、仲介技術(EMS(Enhanced Message Service)等)や、Premium SMS等の改良、及び今後強化或は開発されるサービスも包含するものである。

0020

2.VoicemailManager(登録商標):新規の音声メール管理アプリケーション− このアプリケーションは、携帯電話にGUIグラフィカルユーザインタフェース)を追加する。これは、携帯電話(Cellular Phone)音声メールシステムで提供される既存の音声メニューシステム(UI)を補うもの(或は既存の音声メニューシステムに置き換えられるもの)である。これは、電話機の通話転送機能グリーティングコントロール、および他の関連するコントロールを統合して、音声メール管理のための1つの環境(アプリケーション)を携帯電話に提供する。

0021

3.VoiceMessenger(登録商標):音声/テキスト変換システム− これは、ユーザによって携帯電話に話されたテキストメッセージを遠隔地でテキストに変換し、利用に骨の折れる英数文字電話パッド入力システムを用いることなく、テキストメッセージを送信することを可能にする。

0022

音声メッセージからテキストフォーマットへの正確な文字表記化(VoicemailView及びVoiceMessengerで配備される)の鍵となるのは、自動化された音声認識システムではなく、人間のオペレータを使用してメッセージ抽出することによりインテリジェントに実際の文字表記化を行う(冗長/逐語的な文字表記化ではない)ことである。このシステムの効率的な運用の鍵となるのは、オペレータに音声ファイルを迅速に送信し、オペレータがそれらのメッセージを迅速に聞き、効率的に文字表記を生成し、文字表記化したメッセージをテキストメッセージとして送信できるようにするITアーキテクチャである。

0023

A. VoicemailView(商標)音声メール/テキスト変換システム
音声メール/テキスト変換システムを実現(deliver)する3つのソリューションについて説明する。
1.Inside the Network Operator(ネットワーク事業者内型)−システムが、事業者ネットワークサービス図1参照)の中に統合される。
2.Outside the Network Operator(ネットワーク事業者外型)−サービス会社が固定電話を介してネットワーク事業者の音声メールシステムにアクセスし、外部サービスエンドユーザに直接提供する(図2参照)。或は、サービス会社が専用の音声メールシステムを収容し、完全にネットワーク事業者のサービスの外側でサービスを配信する。従って、ネットワーク事業者と電話機に依存しない(図3参照)。

0024

A.1 VoicemailView:Inside the Operator(事業社内型)
図1を参照すると、このプロセスは次のように展開される。
1.PSTNまたは携帯電話網からの発呼者が音声メールを委ねる。
2.音声メールは、音声文字表記サービスによってSMSまたはMMSに変換される。この変換は、自動的な音声認識システムではなく、人間のオペレータによって行われる。人間のオペレータは、自動化された音声認識システムに比べてはるかに正確で柔軟性があり、メッセージをインテリジェントに解釈することができ、不必要なためらいと繰返しを除去して、短く、簡潔で明快なメッセージを生成する。付録IIに、効果的で簡潔な文字表記のための要件を定義する。オペレータは、現在160文字のSMSテキストメッセージの上限内に収まるようにメッセージを大幅に短くする(或は、標準的な連結を介して長いメッセージを複数のSMSメッセージに収める)ようにしてもよい。なお、MMSではそのような上限はない。
・元の音声メールファイルへのリンク一意のID)が生成される。このIDは、単に日付/時刻および発呼者の番号のハッシュでよい。
・音声メールの時刻および日付がSMS/MMSファイルのヘッダに追加される。
・発呼者の電話番号がSMS/MMSファイルのヘッダに追加される。
3.メッセージファイルが格納のためにSMS又はMMSサーバに送信される。
4.SMS又はMMSゲートウェイを介してメッセージが無線端末に送信される。
5.ユーザは、SMS又はMMSアプリケーション内において、或はプラットフォームに依存するメッセージングアプリケーション内において、「テキスト」化された音声メールを閲覧および管理する。
6.ユーザは、端末で実行される新規のVoicemailManagerアプリケーション(全ての音声メール機能のためのGUIインタフェースを提供する。B.2参照)を通じて元の音声メールを聞くことを要求できる:再生、早送り、巻き戻し、次メッセージ、消去、保存、転送、メッセージの時刻/日付、電話のかけ直し(及び音声プロンプトメニューを通じて利用可能な他の既存の音声メールコントロール)。
7.能動的なSMS/MMSの配信は、メッセージを「既読」として、SMS/MMSの格納状態と音声メールの格納状態とを同期させる。

0025

A.2 Outside the Operator(事業者外型);サービス会社が事業者に音声/テキスト変換のオペレータのためのインフラストラクチャを提供する形態
図2を参照すると、このプロセスは次のように展開される。
1.新規利用者は、電話番号、音声メール受信箱の暗証番号、および他の詳細事項をサービス会社に提供する。これにより、音声メール取得格納サーバは、利用者の音声メール受信箱への定期的なポーリングによって、音声メール受信箱と通信し、メッセージを取得する。或は、事業者内部の音声メールシステムが新しい音声メールの通知を送信することにより、音声メール取得格納サーバはメッセージを取り出す。ユーザへの課金には2つの選択肢(前払いまたは後払い)がある。
1.リバーステキストビリング(マイクロビリング)
2. 月ごとのクレジット/デビットカードによるビリング(課金)
2.PSTNネットワークまたは携帯電話網からの発呼者が音声メールを委ねる。
3.サービス会社の音声メール取得格納サーバが、利用者の音声メール受信箱を呼び出し、メッセージを聴く。
・標準のDTMFトーンを使用してメッセージを再生し、通話時刻、発呼者の番号、及び他のデータを取り出して、テキスト配信に必要なデータを構築する。
・一意のIDを作成する。IDは単に時刻/日付および発呼者の番号のハッシュでよい。
・将来の再生のために音声メールを記憶する。
4.音声メールのオーディオファイルが、人間のオペレータを利用する音声文字表記システムに送られ、SMSまたはMMSファイルに変換され、配信のためにサードパーティのSMS/MMSゲートウェイに送信される。
・元の音声メールファイルへのリンク(一意のID)が生成され、ユーザに隠された情報としてSMS/MMSファイルに埋め込まれる。
・SMS/MMSファイルのヘッダに音声メールの時刻および日付が加えられる。
・発呼者の番号がSMS/MMSファイルのヘッダに加えられる。
・MMSファイルは、ローカルな再生のために埋め込まれた元のオーディオファイルを含むことができる。
5.SMSまたはMMSメッセージが利用者のネットワーク事業者を介して配信される。
・メッセージはSMS又はMMSゲートウェイを介して無線端末に送信される。
・ユーザは、SMS又はMMSアプリケーション内で、或はプラットフォームに依存したメッセージングアプリケーション内で、「テキスト」化された音声メールを閲覧し、管理する。
6.ユーザは、端末上の新規の音声メール管理アプリケーション(これがGUIを提供する。B.2参照)を使用して、ネットワーク上の自分の音声メールにダイヤルすることができる。音声プロンプト/メニューを通じて、再生、早送り、巻き戻し、次のメッセージ、消去、保存、転送、メッセージの時刻/日付、電話のかけ直し、および他の既存の音声メール用のコントロールを利用することができる。
7.元の音声メールを聴く際には、ユーザは、サービス会社の音声メール格納サーバに接続される。一意のID(SMS/MMSメッセージ中ではユーザに隠されている)が、再生すべき正しいファイルを取り出す。

0026

A.3 Outside the Operator(事業者外型):音声メールが完全にサービス会社によって提供される形態
図3を参照すると、このプロセスは次のように展開される。
1.新規利用者が自分の電話番号と課金の詳細をサービス会社に提供する。ユーザは、そのサービス会社を音声メールプロバイダとして使用している。
2つのオプションがある。
1.利用者は、自分の電話への通話を手動でサービス会社の音声メールゲートウェイ番号に転送する
2. サービス会社は、振る舞いを変更するための無線による(over the air)アップグレードを提供する。
課金には2つの選択肢(前払いまたは後払い)がある。
3.リバーステキストビリング(マイクロビリング)。
4. 月単位のクレジット/デビットカードビリング(課金)。
2.任意の電話、通例はPSTNまたは携帯電話網からの発呼者が音声メールを委ねる。
3.サービス会社の音声メールが全ての音声メール機能を提供する。
1. 将来の再生のための音声メールの格納。
2.一意のIDの作成。IDは、時刻/日付および発呼者番号のハッシュでよい。
4.音声メールのオーディオファイルが、人間を利用する音声文字表記システムに送られ、人間のオペレータによってSMSまたはMMSファイルに変換され、配信のためにサードパーティーのSMS/MMSゲートウェイに送信される。
・元の音声メールファイルへのリンク(一意のID)が生成され、ユーザに隠された情報としてSMS/MMSファイルに埋め込まれる
・SMS/MMSファイルのヘッダに音声メールの時刻と日付が加えられる。
・SMS/MMSファイルのヘッダに発呼者の番号が加えられる。
・MMSファイルはローカルに再生するために埋め込まれた元のオーディオファイルを含むことができる。
5.SMSまたはMMSメッセージが利用者のネットワーク事業者を介して配信される。
・メッセージはSMSまたはMMSゲートウェイを介して無線端末に送信される。
・ユーザは、SMSまたはMMSアプリケーション、あるいはプラットフォームに依存するメッセージングアプリケーションにより「テキスト」化された音声メールを閲覧し、管理する。
6.ユーザは、端末の標準的なIVRコントロールまたは新規の音声メール管理アプリケーション(GUIを提供する。B.2参照)を使用して、ネットワーク上の自分の音声メールにダイヤルすることができる。音声プロンプト/メニューを通じて、再生、早送り、巻き戻し、次のメール、消去、保存、転送、メッセージの時刻/日付、電話のかけ直し、および他の既存の音声メール用のコントロールを利用することができる。
7.元の音声メールを聞く際には、ユーザは、サービス会社の音声メール格納サーバに接続される。一意のID(SMS/MMSメッセージ中ではユーザから隠される)が、再生すべき正しいファイルを取り出す。

0027

B.携帯電話ソフトウェア
上記のどの形態においても、携帯電話(または何らかの性質を持った他の無線情報デバイス)は、無線(over the air)または他の方式で以下のようにアップグレートされる必要がある。

0028

B.1音声メール(テキストメッセージ)の閲覧
2つの選択肢がある。
1. 既存の電話GUIを変更しない。文字表記化された音声メールであるSMSは別のメッセージとして扱う。
2. 以下に示す新しい機能を組み込むようにGUIに変更を加える。

0029

図4に、メッセージ受信箱音声メールメッセージがあることを知らせるために、SMSメッセージの隣に使用することができる電話機アイコンを示す。テキストとして文字表記された音声メールがデバイスのメッセージ受信箱にある。このメールは、Homer Simpsonから送信されたものである。図5に、現在のSMSテキストアイコン外見を示す。別の方法としては、音声メールを表す「V:」などの何か論理的なものを各ヘッダの前につけることがあげられる。この場合、例えば、「V:Homer Simpson」は、Homer Simpsonからの文字表記化されたSMS音声メールを意味する。また、図6に示すように、音声メールメッセージのテキストファイル中には、音声メールの時刻と日付が加えられるべきである(すべてのゲートウェイ送信メッセージに正しくタイムスタンプするとは限らないため)。図7に、携帯電話において上記を実現した様子を示す。ユーザは、反転表示された(Daniel Daviesからの)文字表記された音声メールについて「読む」の選択肢を選択しており、デバイスは、通常の方式でSMSを表示している。但し、日付と時刻が加えられている。単に所与のキー(同図では「1」のキー)を押したままにすることにより、通常の音声形式の音声メール再生機能起動することも可能である。

0030

標準的なSMSメッセージを開くと、一般には、「消去」、「再生」、「編集」等の更なる機能に容易にアクセスすることができる(例えばNokia製の携帯電話ではオプションメニューを介して)。この標準的な「オプション」メニュー、またはそれに相当するものに付属して、本実施では、図8に示すように3つの新しい機能を追加する。
・元のメッセージを聞く(Hear Orignal)。
・電話をかけ直す(Call back)。
・連絡先に追加する(Add to Contacts)。
下記でこれらの新しい機能について詳しく述べる。

0031

[元のメッセージを聞く]: これは、ユーザが元の音声メールを聞くことを可能にするもので、SMS/MMSメッセージの中に符号化された一意のIDを使用して、正しく元の音声ファイルに接続する。
3つの選択肢がある。
(i) ユーザは、標準の音声メールシステムに行き、既存の音声プロンプトに従ってメッセージを聞く。
(ii) ユーザは、下記のB.2で述べる新規の音声メール管理アプリケーションに行く。
いずれの場合も、音声メールへの通話を終了すると、ユーザは、メッセージングアプリケーションにおける同じ地点に戻されて、テキスト/オーディオバージョンで何を行うかを決定する。
(iii)ユーザは、端末でローカルに再生するために、元の音声ファイルをMMSメッセージ(または電子メールなどの相当のもの)に埋め込む。

0032

[電話をかけ直す]
メッセージとともに記録された発呼者の番号を使用して発呼者に電話をかけ直す。

0033

[連絡先に追加する]
発呼者の番号を取り出し、新しい連絡先/アドレスのエントリに自動的に追加し、ユーザが名前などで完成させる。
これは、音声から変換されたテキストを解析し、そのテキストをインテリジェントに使用することができる携帯電話ソフトウェアの具体例である。その他の使用例としては以下が挙げられる。
(a) 話された電話番号を抽出して、その番号を使用(電話をかける)、保存、編集、または電話帳に追加できるようにする。
(b)電子メールアドレスを抽出し、そのアドレスを、使用、保存、編集、またはアドレス帳に追加できるようにする。
(c)物理的な住所を抽出し、それを使用、保存、編集、またはアドレス帳に追加できるようにする。
(d)ウェブアドレス(ハイパーリンク)を抽出し、それを使用、編集、保存、またはアドレス帳またはブラウザの「お気に入り」に追加できるようにする。
(e)面会の時刻を抽出し、それを使用、保存、編集、および予定表に一項目として追加できるようにする。
(f) 番号を抽出し、それをデバイスアプリケーションの1つに保存する。
(g)固有名詞を抽出し、それをウェブ上(WAPまたはフルブラウザ)で検索する、または調べるオプションを提供する。

0034

テキストをどの程度まで利用できるかは、利用者の電話機のインテリジェンス(基本的には電話機の構文解析能力、他のアプリケーションとの相互動作性、他のアプリケーションで使用するためにこのデータが通常記憶される共通のクリップボード)に応じて決まる。今日では、ほぼすべての電話機が、テキストメッセージからの電話番号、電子メールアドレス、およびウェブアドレスの抽出をサポートしている。これは、通常、(ハイパーリンクまたはそれに相当するものとして)下線が引かれたコンテンツにより、ユーザがメッセージを読んでいる時に利用可能にされる。そして、ユーザは単に「オプション」(Nokia製電話機の場合。または別の製造者の電話機ではそれに相当するもの)と「使用する」(Nokia製電話機の場合。別の電話機ではそれに相当するもの)を選択し、コンテンツのタイプに応じて、さらに状況に応じたオプション(例えば住所の場合は、調べる、ナビゲートする、アドレス帳に保存する等)を選択する。

0035

B.2 VoicemailManager(商標):音声メール管理アプリケーション
このアプリケーションは、独立して、または、上記のB.1で述べたVoicemailView音声SMS/MMS変換システム(またはそれに相当するテキスト配信システム)の一部分として使用することができる。

0036

この音声メール管理アプリケーションは、通常のオーディオ音声メールへのアクセスおよびその管理をする際に受信するために使用される標準的な音声プロンプトに加えて、GUI(グラフィカルユーザインタフェース)をユーザに与える。利用者が携帯電話を使用して自分のオーディオ音声メールに電話をかける(図9a)と、利用者はまず「音声メール受信箱」に導かれ、そして図9B〜Dに示すコントロールが提示される。

0037

プログラミング上の目的で、それらのコントロールのほぼすべてが、ユーザが電話機のキーパッドのキーを押した時のシステムへの入力として、音声メールシステムによって使用される標準的なDTMFトーンを用いている。

0038

図9Aに、ユーザが音声メール(Voicemail)に電話をかける様子を示す。図9Bに、新しい管理アプリケーションが起動され、初めにすべての音声メールの受信箱の内容(ここでは3つの新しい(New)オーディオ通話と2つの保存された(Stored)オーディオ通話)を表示した様子を示す。オプションのメニューは以下のように動作する。

0039

0040

図9Cを参照すると、ユーザが、聞きたいオーディオ音声メールのカテゴリ(すなわち新規メールまたは保存されたメールのいずれか)を選択すると、ユーザには、そのカテゴリのオーディオ音声メールのメニューリストが示される。各メールは、可能であれば送信者名識別され、送信者名による識別が不可能な場合は発呼者の番号で識別される。理想的には、文字表記されたテキストメッセージは、文字表記サービスによって発呼者名を付随している。これは、ユーザがVoicemailViewで音声/テキスト変換をオフにする(すなわち通常の音声メールを希望する)場合の通知を含む。そのため、ユーザは、自分に音声メールを残した者の名前を見てから、そのメールにダイヤルしてメールを聞くかどうかを決定することができる。ユーザは、容易に、自分が聞きたいオーディオメッセージに移動し、選択することができる。メッセージが選択されると、図9Cに示すように、新しい音声メールコントロールが画面に表示される。それらコントロールの機能は以下の通りである。

0041

0042

このプロセス中、ユーザには常に、画面に表示される内容と同期された音声による(aural)ナビゲーションオプションが提供される。そのためユーザは、両者の最良の部分を得ることができる。単純なコマンドに基づく音声認識の使用により、ユーザは単に自分が実行したいコマンドを言えばよい。例えば、新しいメッセージを再生したい場合、ユーザは単に「再生」と言えばよい。するとVoicemailManagerエンジンがそのコマンドを認識し、メッセージの再生を行う。

0043

注:厳密な番号(キーパッドの番号)とそれに関連付けられた機能は、既存の音声メールシステムに依存するものであり、そのためネットワーク事業者/音声メールシステムごとに異なる。

0044

B.3 VoiceMessenger(登録商標):音声/テキスト(SMS/MMS)変換サービス
例えば受信者の邪魔とならないようにメッセージを受信者に届けたい場合など、ユーザが音声ではなくテキスト形式でメッセージを送信することが好ましい場合がある。しかし、小さな英数文字キーパッドでテキストを親指でタイプすることは多くのユーザにとって困難である。また、歩行中など移動している場合や、車中にいる場合、あるいは片手しか利用できない場合、あるいは運転中などタイプ入力できない場合もある。VoiceMessenger(商標)音声/テキスト変換サービスはこの必要性に対処する。

0045

ユーザは、自分の携帯電話で実行されるメッセージング/テキストアプリケーションに行き、単に電話のアドレス帳からメッセージの受信者を選択するか、受信者の電話番号をタイプ入力し、次いで、「2」のキーを押したままにすることにより、図10に示すように新しいVoiceMessengerのオプションを選択する。ユーザがまずサービスに接続されることによって開始するように構成することもできる。この場合、サービスに接続された後で、単に番号または名前をローカルの音声認識エンジン(携帯電話)またはリモートの音声認識エンジンに言うと、認識エンジンがユーザをプロセスに導く。

0046

リモートのVoiceMessengerエンジンに接続されると、ユーザは単にメッセージを話し、リモートのVoiceMessengerエンジンがそのメッセージを録音し、人間のオペレータを利用する音声文字表記システムを使用してテキストに変換するためにオーディオファイルを送信する。テキスト形式のメッセージは次いでSMS/MMS(電子メールまたは他の適当なメッセージングシステム)としてパッケージされ、SMS/MMS等のゲートウェイを通じて送信される。ユーザには、入力を制御し、メッセージを変換、送信するための音声プロンプトが与えられる。

0047

C.拡張
C.1MMSボイスノートからテキストへの変換
MMS対応の電話機を有するユーザは、MMSを介してボイスノートを送信することができ、そのノートを、人間のオペレータを利用する音声文字表記サービスが文字表記化し、要求される宛先に送信する。ユーザは、その方がよい場合は音声メールをMMSフォーマットに変換し、ユーザの電話器に送信させることもできる。

0048

C.2 自動化された音声認識
これは、着信する音声ファイルの処理を高速化し、運営コストを低減する。主要な機能は、話された電話番号を自動検出し、言語を検出して、適切な人間のオペレータが配置された文字表記部署にオーディオファイルを回すことである。また、この自動化された音声認識は、ユーザのオンライン電話帳(下記参照)から名前、話された電話番号及びアドレスの検出、VoicemailManagerのコントロールのコマンド検出にも使用できる。

0049

C.3オンラインアドレス帳
ユーザがSpin Voxサービスに接続された時に、単に話したい相手の名前を言うだけで使用することができるオンラインアドレス帳には2つの形態がある。
》Spin Voxオンライン電話帳− ユーザは、ユーザウェブログインを介して、自分のSpin Voxオンラインアドレス帳に入れたい人々の名前と番号を追加することができる。
》Microsoft Outlook(Expressまたはフルバージョン)又は他の電子メール/PIMアドレス帳クライアントとの同期。 − これは、ユーザがすべての連絡先をオンラインで所有することを可能にし、受信者の名前を言うことができるだけでなく、SMS、MMS、電子メール、ファックスなど、送信したいメッセージのタイプを決定することも可能にする。
》ネットワーク事業者と連携して、SIMバックアップ機能を提供し、名前で電話をかけるためのSIM電話帳を提供することができる。

0050

C.4現在利用可能なサービス(存在)
現在利用可能なサーバを使用して、ユーザは、通信を受信する際の希望のモードを定義することができる。例えば、「会合中」は、通信の前に、連絡を取りたい相手が会合中であり、例えばSMS/MMSまたはVoiceViewのテキストメッセージを受け付けることをユーザに知らせる。会合から出て来ると、ユーザは、連絡ステータスを「連絡可能」に変更し、通話による連絡を可能にできる。

0051

付録1
1.SpinVox音声メールIVR(自動音声応答)構造
IVRを有する標準的な音声メールサーバシステムが基礎となる。IVRは、図11フローチャートに示すようにプログラムされる。

0052

2.VoicemailView
ユーザの電話機は、(下記で述べる技術プロビジョニングの際に)「1」のキー(標準的な音声メールアクセスキー)を、自動的にSpinVox音声メールサーバを呼び出し、ユーザを自動的にログインさせる(一意の電話番号+暗証番号)ようにプログラムし直す。これにより、ユーザはIVRツリーの一番上に導かれる。

0053

いずれかの時点でユーザが電話を切ると、セッションが終了し、関連する結果が生じる。別の携帯発呼者からのドロップライン(dropped line)を含めて、録音中にこれが生じると、それが録音の終了であるとみなされ、システムは、文字表記化段階に進む。

0054

文字表記化された各音声メールは、例えば「4」で始まる一意の番号(最終的なIVRツリーの構成に依存する)を含んでおり、そのため、ユーザが「1」を押したままにしてSpinVoxの音声メールサーバに接続した場合、ユーザが単に一意のメッセージID、例えば403を押すと、ユーザは、待ち行列にある3番目のメッセージに導かれる。

0055

2.1固定電話または他の携帯電話からのアクセス
図11に示すように、IVRツリーは、ユーザが、自身の一意の転送番号(音声メール番号)を使用してダイヤルすることを可能にし、その後ユーザは暗証番号を入力するように促される。

0056

2.2スピードダイヤル
IVRシステムは、自身の一意のSpinVox番号+暗証番号をダイヤルすることを可能にするスピードダイヤルにおけるユーザプログラミングを受け付ける。そして、ユーザは、上記のすべての機能にアクセスすることができる。

0057

2.3音声メールを残す
ユーザの電話機は、下記に定義する条件下でSpinVoxの音声メールに転送するように構成され、発呼者は、次のいずれかを聞く。
デフォルトのSpinVoxの挨拶;「SpinVox音声メールにようこそ。トーンの後にはっきりとメッセージを話して下さい。」[トーン]
ユーザ自身による挨拶(録音されたユーザによる挨拶)[トーン]
次いで、
1. システムが、デフォルトの長さ(30秒)、またはユーザが定義した長さ(10秒〜2分。またはSpinVoxが設定するパラメータ)にわたり発呼者の音声メールを録音する。
2. 録音が終わると、発呼者は、次のプロンプトを介して標準的なIVRオプションを聞く。即ち、
「メッセージを聞くには1を、
メッセージを削除し、もう一度録音するには2を、
メッセージを再度録音するには3を、
終了するには#を押すか、単に電話をお切り下さい」。
3. ユーザが録音時間を超えた場合は、次のように指示される。
「申し訳ありませんが利用できる録音時間を超えています、
トーンの後にもう一度お試し下さい。」
a.新しいメッセージを録音せずにユーザが電話を切った場合、メッセージは、文字表記化のために送信される。
b.別の変形は、ユーザが「高性能文字表記オプション」を選択した場合に生じる。これは次のように動作する。即ち、メッセージの録音時間が、ユーザが設定した最大時間より短い場合は、メッセージは文字表記される。そうでない場合は、メッセージは文字表記されず、代わりに、聞くべき新しい音声メールがあることを知らせる標準的な通知が下記の4cで示すフォーマットでユーザに送信される。これは、ユーザは時に、読むより聞いた方が都合のよい長い音声メールを送るという事実に対処する。しかしながら、そうした長いメッセージの場合に、人間の文字表記者が音声メッセージを手短に聞き、その通話の主題の非常に短い表示を書きまとめ、その表示がメッセージの受信者に送信されるようにしてもよい。また、ある量のテキストより少ないテキストしかサポートしない電話機(通例は旧来の電話機)の場合、システムは、初めにユーザの電話機における制限を電話機データベース(SpinVoxによって供給される)で調べ、次いで適切な録音時間をユーザに提供する。例えば、連結をサポートせず、最高で4件のテキストメッセージしかサポートしない古いSiemens製電話機の場合、システムは、大半のメッセージが電話に収まるように例えば30秒以内に録音時間を維持すべきこととその理由をユーザに知らせる。同様に、そうした電話機のデフォルトの録音時間は、システムによって電話機に適切な長さに設定される必要がある場合がある。
4. メッセージが、該当する文字表記待ち行列に送られる。
a.発呼者のCLID(発呼者回線識別)が取り込まれる場合は、「送信者」フィールドを自動的に埋める。そうでない場合は、「SpinVox VoicemailView」を送信者として挿入する。
b.文字表記化することが可能な場合は、テキストバージョンのメッセージがユーザに送信される。
c.文字表記化することができない場合は、特定のフィールドが自動的に埋められた次のテンプレートテキストメッセージがユーザに送信される。
「[入手可能な場合はCLIからの]新しい音声メールがあります。
電話機の「1」を押して音声メールに接続し、
このメッセージを聞くには4xxを押して下さい。
ご利用ありがとうございます。SpinVox。」
「送信者」フィールドは、「SpinVox VoicemailView」になる。
d.送信されたSMSの数に応じて課金する。
5. テキストメッセージがユーザに送信され、ユーザは、電話機で利用できる標準的なオプションに従って次に行う事柄を選択することができる。

0058

3.VoiceMessenger
上記のIVR図は、ユーザが、携帯電話から直接、または別の電話機を介して、VoiceMessengerにアクセスする方式を示す。

0059

3.1スピードダイヤル
IVRシステムは、一意のSpinVox番号+暗証番号+「3」をダイヤルすることを可能にするスピードダイヤルをユーザがプログラムすることを受け付ける。

0060

携帯電話からの場合は、下記の技術プロビジョニングで、ダイヤルし、ユーザを直接VoiceMessengerオプションにログインさせる(音声メール番号+暗証番号+3)ためのスピードダイヤル(デフォルトではキー「2」)が設定されている。

0061

そして、ユーザは、標準的なプロンプトを聞く。
「SpinVoxのVoiceMessengerにようこそ。
トーンが鳴ったら、宛先番号を言うか、タイプ入力し、
送信したいメッセージを話して下さい。
新しいメッセージを送信するには電話を切るか#を押して下さい。」[トーン]

0062

そして、
1.DTMFトーンが検出できない場合、または混乱している場合(国際通話に*または+を使用するなど)は、新しい番号の入力を促す。
「申し訳ありませんが、お客様がタイプ入力した番号を検出することができませんでした。もう一度お試しになり、国際番号の場合は、+ではなく始めに00を押すことをお忘れのないように」[トーンが鳴って再入力を促す]
2. システムが、デフォルトの長さ(30秒)またはユーザが定義した長さ(10秒〜2分)にわたり録音する
3. 録音の最後に、ユーザは、以下のプロンプトを介して標準的なIVRオプションを聞く。
「録音したメッセージを聞くには4を、
録音したメッセージを削除し、再度録音するには5を、
メッセージを再度録音する場合は6を、
新しいメッセージを送信するには#を押すか単に電話を切ってください」
4. ユーザが録音時間を超えた場合は、次のように指示される。
「申し訳ありませんがご利用になれる録音時間を超えています。
トーンの後に再度お試し下さい。」
a.ユーザが新しいメッセージを録音せずに電話を切った場合は、文字表記のためにメッセージが送信される。
5. 「送信者」フィールドが自動的に埋められた状態でメッセージが文字表記待ち行列に送られる(SpinVoxでクライアントが誰であるかが分かるため)。
a.文字表記できる場合は、テキストバージョンのメッセージがユーザに送信される。
b.文字表記が不可能な場合は、特定のフィールドが自動的に埋められたテンプレートテキストメッセージがユーザに送信される。
「申し訳ありませんが、お客様が[時刻/日付に][検出される場合は番号に]話したメッセージを変換することができませんでした。静かな場所でもう一度お試しになり、はっきりと話して下さい。ご利用ありがとうございます。SpinVox。」
この「送信者」フィールドは「SpinVox VoiceMessenger」になる。
c.送信されたSMSまたはMMSのサイズ(KB)に応じて課金する。
6. テキストメッセージが受信者に送信され、受信者は、電話機で利用できる標準的なオプションに従って次に行うことを選択することができる。

0063

4.技術プロビジョニング
技術プロビジョニングの際に、ユーザデータ(電話機、ネットワーク等)が再使用されて、ユーザの選択した事項がユーザに確認される。

0064

鍵となるのは、ユーザの電話機のコンフィグレーション(VoiceMessengerのドライバとV.Card)と正常なセットアップの確認を一部自動化するために、SMSメッセージをユーザに送信するシステムである。コンフィグレーションSMSが到着するのを待つ間、ユーザ/販売員が「待ち状態」のままにならないようにするために、上記メッセージはすべて、高優先度として送信される。
ステップは以下の通りである。

0065

ステップ1:プロビジョニング画面のドロップダウンリストからの電話機の選択(通常は販売時)。

0066

ステップ2:Voicemail Viewのセットアップ:
〈次のように文字列を作成する:「+国コード_ユーザの一意の音声メール番号_p_暗証番号_#」〉〉〉〉これはSPINVOX音声メール番号と呼ばれ、各ユーザに一意である!〉

0067

ステップ3:呼の転送選択。これは、(以下のすべての条件下で)ユーザの音声メールを転送するように携帯電話が通常セットアップされる方式を説明する。ユーザは、自分自身の音声メールではなく、明確に別の者または番号に転送したい場合は、これを変更することができる。
〈高優先度のSMSとして送信するために電話機を設定するために使用される上記の選択に基づいて作成されるUSSD文字列...(数字の行)。ユーザが返信する/動作のために必要とする4xUSSD文字列を伴う〉。

0068

ステップ4:SMSを介して呼の転送がセットアップされる。たった今SMSが送信されたので、それを受信したらプロビジョニング画面の特定のボタンクリックすべきことを顧客に通知する(または3分以内に受信されない場合は別の「受信しない」ボタン)。

0069

ステップ5:呼の転送セットアップ:SMS。プロビジョニング画面がユーザに、設定用SMSを受信している場合は、次を行うように指示する。
1.SMSメッセージを開く。
2. 「オプション」を選択する(各電話機の機能の名前を有するデータベース)。
3.スクロールして「使用番号」を選択する。
4. 4つの番号が表示されるので、最初の番号を選択し、「送信する」を押す。すると、その番号にダイヤルされ、携帯電話の画面に「要求中」が表示される。確認メッセージを受信したら、このステップを残る3つの番号のために繰り返す。

0070

ステップ5:呼の転送ステップ:携帯電話。プロビジョニング画面がユーザに次のように通知する。
携帯電話で、
1. 「メニュー」2を選択する。
〈特定の電話機についてのデータベースからの音声メールビューデータインポートする。行うべき動作を指示する/「+国コード_ユーザの一意の音声メール番号_p_暗証番号_#」〉

0071

ステップ6:配信方法の選択。プロビジョニング画面で、ユーザは、テキストに変換された音声メールの受信方法を選択することができる(典型的なオプションは、SMS、MMS、オーディオファイルが添付されたMMS、電子メール、オーディオファイルが添付された電子メール)。そして、システムが、ユーザの携帯電話に適切なvCardを送信する。

0072

ステップ7:VoiceMessengerのセットアップ。プロビジョニング画面がユーザに次のように指示する。
次のようにして下さい。
ただ今お客様にSMSVCardを送信しました。受信したら次の事を行って下さい。
1. VCardを受け取り、変更を加えずに携帯電話に保存する。ステップ2へ。
5分以内にこのメッセージを受信しなかった場合、またはVCardを保存することができない場合は、次のようにして下さい。
次の番号を有する、「VoiceMessenger」と呼ばれる新しい「連絡先」を作成する:
国番号_ユーザの一意の音声メール番号_p_暗証番号_#,1
新しい「連絡先」の追加の仕方が分からない場合は、ここをクリックする(データベースから取り出された情報を伴う「ハウツー」ページへ行く。何をすべきか教えてくれる)。
2. 〈特定の電話機についてのデータベースからのVoiceMessengerスピードダイヤルの設定データをインポートする。行うべき事を指示する〉

0073

ステップ8:設定画面
SpinVoxサービスをお選びいただきありがとうございます。
*お客様は今後音声メールをテキストとして受信しますが、単に電話機の「1」キーを押したままにしてお客様のSpinVox音声メールアカウントに接続することにより、いつでも元のメールを聞くことができます。
*テキストメッセージを話すには、「2」(またはお客様がVoicemailViewに指定したキー)を押したままにしてください。直ちにVoiceMessengerに接続されます。お客様の番号とメッセージをはっきりと話して下さい。お客様がメッセージを話すと、当社でテキストに変換します。
*「1」キーを押したままにし、プロンプトに従うことによりいつでもVoiceMessengerにアクセスすることができます。
*携帯電話の番号と暗証番号を使用して、www.SpinVox.comでアカウントの設定を確認し、明細を確認し、SpinVoxのアカウントを管理することができます。
暗証番号をすでに印刷していない場合、あるいは記録していない場合は、こちらに再度暗証番号をお知らせします。
1234

0074

5.文字表記化のアシスタント
人間のオペレータ文字表記者が各自のアカウントにログインした場合に、人間のオペレータ文字表記者に提供されるアシスタントである。オペレータが必要とするのは、ウェブブラウザ音声カードメディアファイルまたはストリーミングプロトコルを再生し、再生を制御することができるメディアプレーヤ、および高速のインターネットアクセスである。図12に、文字表記のプロセスフローチャートを示す。各文字表記者は、ログインし、文字表記すべきVoicemailView(オペレータが文字表記したメッセージを入力し、メッセージを送信させる画面については図13を参照のこと)、またはVoiceMessengerのオーディオファイルの受信を1度に1件ずつ開始する(図14参照)。ログインしている間は、メッセージが現在文字表記化されている最中と、一時停止中の2つのみの状態がある。

0075

5.1文字表記者のコントロールパネルボタン(図13参照)
》文字表記化が完了
》文字表記化において聞き取れない場合は上記の2および3に従う
・VoicemailViewの場合は、埋めることができるフィールドが自動的に埋められて、以下のテキストで自動的なSMSがユーザに送信される。
「[入手可能な場合はCLIからの]新しい音声メールがあります。電話機の「1」を押して音声メールに接続し、その特定のメッセージを聞くには4xxを押して下さい。ご利用ありがとうございます。SpinVox」
「送信者」フィールドは「SpinVox VoicemailView」になる。
・VoiceMessengerの場合は、埋めることが可能なフィールドが自動的に埋められて、次のテキストで自動的なSMSがユーザに送信される。
「申し訳ありませんが、お客様の[時刻/日付に(入手できる場合は)「電話番号」に]話したメッセージを変換することができませんでした。もう一度静かな場所でお試しになり、はっきりと話して下さい。ご利用ありがとうございます。SpinVox」
・「送信者」フィールドは「SpinVox VoiceMessenger」になる。
》一時停止し、現在のメッセージを再度待ち行列に入れる。
》現在のメッセージを別の言語部署に再度回し、メニューで言語または「不明」を選択する。文字表記者は待ち行列に戻されて新しいメッセージを受信する。

0076

5.2電話番号
》VoicemailViewの場合、「送信者」フィールドは、発呼者がメッセージを残した時に取り込まれたCLID(メッセージヘッダに挿入される)か、または「SpinVox VoicemailView」で自動的に埋められる。
》VoiceMessengerの場合、「送信者」フィールドは、ユーザがDTMFを使用した場合は文字表記者によって自動的に埋められる。DTMFを使用しなかった場合、文字表記アシスタントは、文字表記者がタイプ入力するフィールドを提供する。
注:ユーザデータを保護する理由から、文字表記者が、自動的に埋められた電話フィールド(または他のユーザデータフィールド)を見ることは決してない。そのためシステムは、文字表記者が宛先番号をタイプ入力する必要がある場合以外は、それらのフィールドを公開することはない。

0077

5.3スペルチェッカ
文字表記者が「送信する」を押すと、システムは自動的にメッセージのスペルチェックを行い、誤りがある場合はそれを修正し、「確定し、送信する」のプロンプトとともにその修正を文字表記者に表示する、或は、文字表記者が手作業で修正できるようにする(文字表記者が要求する特定の綴りがある場合があるため)。

0078

これを正しく行うために、スペルチェックプロセスは、地理的な地域とユーザの文化に関連する固有名詞辞書を含む。したがって、例えば、英国では、固有名詞辞書は、英語の名前だけでなく、地名、目印となる建物、通りの名前、チェーン店(establishment)の名前(パブ、バー、レストランなど)も含む。

0079

一致するものがない場合、文字表記者は単に、下線が引かれた単語をダブルクリックし、すると最も近く一致するものが提示される。必要な場合は、文字表記者は、巻き戻し、メッセージのその部分をもう一度聞いて、適当な選択を行うことができる。

0080

5.4文字表記部署マネージャ
文字表記者は、自分の下に所有するすべての文字表記者アカウントの統計を見ることができる。文字表記者は、次を閲覧し、分析することができる。
》時間、日、週、月、年単位の、タイプ(サインアップ、サポート)別の文字表記の数
》時間、日、週、月、年単位の、タイプ別の送信されたSMSの数
》時間、日、週、月、年単位の待ち行列の時間
》時間、日、週、月、年単位の、タイプ別の平均メッセージ長
》時間、日、週、月、年単位の、文字表記の時間/レー
》時間、日、週、月、年単位の、タイプ別の文字表記の時間/レートの変動
》文字表記者アカウント別の上記事項すべて
》日、週、月、年単位の、タイプ別の文字表記不可能なメッセージの数と割合
》日、週、月、年単位の、文字表記のために別の部署に送られたメッセージの数と割合
毎日ランダムサンプルを取り出し、オリジナルとCCAからのトラブルチケットについてフィードバックに照らして精度を測定する(CCAマネージャがこれを行い、結果をシステムに入力する)ことによって行われる文字表記の精度。この2つの数字の悪い方が精度になる。

0081

付録II:文字表記サービスの要件
VoicemailViewおよびVoiceMessengerの両サービスに使用される文字表記サービスには必要条件がある。

0082

要件
主要な要件は、話され、メッセージに残されることが多い冗長な情報すべてを配信するのではなく、実際のメッセージを配信することである。

0083

0084

0085

0086

0087

0088

0089

図面の簡単な説明

0090

本発明による、音声メールの発生から始まり、音声メールの処理、音声メールの配信を含む音声メールプロセス全体の概略図である。
本発明による、音声メールの発生から始まり、音声メールの処理、音声メールの配信を含む音声メールプロセス全体の概略図である。
本発明による、音声メールの発生から始まり、音声メールの処理、音声メールの配信を含む音声メールプロセス全体の概略図である。
本発明を使用して文字表記された音声メールのメッセージ通知(携帯電話のメッセージ受信箱に表示される)のフォーマットの図である。
従来のテキストメッセージ通知の図である。
本発明を使用して文字表記された音声メールが携帯電話に表示されたテキストメッセージとして現れる様子を示す図である。
メッセージ受信箱にあるテキストメッセージの一覧を表示する携帯電話を表す図である。文字表記された音声メールが一覧にあり、そのメールが選択された場合にどのように表示されるかを呼び出しが示す。
文字表記された音声メールに関連するオプションとして利用することができる3つの新機能のメニュー一覧を表す図である。
従来のオーディオ音声メールを管理する、GUIに基づく音声メール管理アプリケーションを表す図である。
従来のオーディオ音声メールを管理する、GUIに基づく音声メール管理アプリケーションを表す図である。
従来のオーディオ音声メールを管理する、GUIに基づく音声メール管理アプリケーションを表す図である。
従来のオーディオ音声メールを管理する、GUIに基づく音声メール管理アプリケーションを表す図である。
ユーザが携帯電話にメッセージを話し、そのメッセージをリモートからテキストメッセージに変換できるようにするアプリケーションの動作を表す図である。
ユーザ入力によって指示される動作を示す、音声メールサーバでの動作の全フローを示す図である。
音声メッセージの文字表記者によって行われる動作の全フローを示す図である。
音声メッセージの文字表記者によって使用されるウェブベースのインタフェースの画面例の図である。
音声メッセージの文字表記者によって使用されるウェブベースのインタフェースの画面例の図である。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ