図面 (/)

技術 移動通信端末装置、音声認識方法、およびそのプログラムを記録した記録媒体

出願人 日本電気株式会社
発明者 長島由寿
出願日 2000年12月25日 (17年11ヶ月経過) 出願番号 2000-393709
公開日 2002年7月12日 (16年5ヶ月経過) 公開番号 2002-199085
状態 特許登録済
技術分野 音声入出力 検索装置 計算機間の情報転送 音声認識 電話機の回路等 電話番号の送出、表示 電話機の機能
主要キーワード 音声パタン データ対応テーブル 誤検索 確率パラメータ 音声波形信号 登録音声 発生音 音声呼び出し
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2002年7月12日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (6)

課題

認識率を低下させずに容易に電話番号検索メールアドレス検索等が可能な移動通信端末装置音声認識方法、およびそのプログラムを記録した記録媒体を提供する。

解決手段

音声入力手段1により入力された名前等の音声は、音声認識手段2で読み取られる。当該音声データは、音声パタン51と比較され、登録されている最も近い音声パタンが検索される。音声パタン51の検索に成功した場合、音声・データ対応テーブルを参照して、登録されている電話帳55をメモリ検索処理部3で検索する。当該検索処理は、予め機能を割り当てられたボタン操作を行うことにより、同一電話帳55に登録されている、電話番号52、メールアドレス53、URL54のいずれかのデータを呼び出す

概要

背景

近年、携帯電話やPHSといった移動通信端末装置は、音声認識技術を利用した電話番号検索電話番号発信機能呼び出し等ができる。例えば、相手名前受話器またはこれに代替する機器マイクロホン外部接続機器等)に向けて発声した言葉を基に、目的の電話帳または電話番号が検索でき、手入力によるキー操作の煩わしさが改善されている。

上記音声認識機能に関する従来技術例を図5に示す。図5は、従来の移動通信端末装置の音声認識による電話番号検索の構成を示すブロック図である。図5において、受話器またはこれに代替する機器(マイクロホン、外部接続機器等)である音声入力手段1より入力された名前等の音声は、音声認識手段2で読み取られる。

音声認識手段2により認識された音声データは、音声パタン51と比較され、端末内に登録されている最も近い音声パタンが検索される。音声パタン51の検索に成功した場合、音声・データ対応テーブル50が参照され、端末内に登録されている電話番号52がメモリ検索処理部3で検索される。その結果を表示部4に表示することができる。その後検索した電話番号で、通信制御部6、送受信部7、アンテナ8を介して相手に電話をかけることが可能となる。

概要

認識率を低下させずに容易に電話番号検索、メールアドレス検索等が可能な移動通信端末装置、音声認識方法、およびそのプログラムを記録した記録媒体を提供する。

音声入力手段1により入力された名前等の音声は、音声認識手段2で読み取られる。当該音声データは、音声パタン51と比較され、登録されている最も近い音声パタンが検索される。音声パタン51の検索に成功した場合、音声・データ対応テーブルを参照して、登録されている電話帳55をメモリ検索処理部3で検索する。当該検索処理は、予め機能を割り当てられたボタン操作を行うことにより、同一電話帳55に登録されている、電話番号52、メールアドレス53、URL54のいずれかのデータを呼び出す

目的

本発明は、上記問題点に鑑みなされたものであり、認識率を低下させずに容易に電話番号検索、メールアドレス検索等が可能な移動通信端末装置、音声認識方法、およびそのプログラムを記録した記録媒体を提供することを目的とする。

効果

実績

技術文献被引用数
0件
牽制数
2件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

ユーザの発した音声が入力され、音声信号として出力する音声入力手段と、該音声入力手段から出力された音声信号を解読し、該解読した音声信号の音声パタンと、予め登録されている登録音声パタンとを比較する音声認識手段と、該音声認識手段により検索された音声パタンに対応する複数種のデータを管理している電話帳呼び出すメモリ検索処理手段と、を有し、前記メモリ検索処理手段は、前記音声認識手段による比較の結果検索された前記音声信号の音声パタンと最も近似する前記登録音声パタンに対応する電話帳を呼び出すことを特徴とする移動通信端末装置

請求項2

前記電話帳は、少なくとも、電話番号、メールアドレス、およびURLを含むことを特徴とする請求項1記載の移動通信端末装置。

請求項3

前記複数種のデータを管理している電話帳から呼び出すデータ種を指定する操作手段をさらに有することを特徴とする請求項1または2記載の移動通信端末装置。

請求項4

前記メモリ検索処理手段は、アプリケーション起動状態に基づいて、前記複数種のデータを管理している電話帳から呼び出すデータ種を特定することを特徴とする請求項1または2記載の移動通信端末装置。

請求項5

前記メモリ検索処理手段により呼び出されたデータを表示する表示手段をさらに有することを特徴とする請求項1から4のいずれか1項に記載の移動通信端末装置。

請求項6

ユーザの発した音声が入力され、音声信号として出力する音声入力手段と、該音声入力手段から出力された音声信号を解読し、該解読した音声信号の音声パタンと、予めデータ種ごとに独立に登録されている登録音声パタンとを比較する音声認識手段と、該音声認識手段により検索された音声パタンに対応するデータを呼び出すメモリ検索処理手段と、を有し、前記メモリ検索処理手段は、前記音声認識手段による比較の結果検索された前記音声信号の音声パタンと最も近似する前記登録音声パタンに対応するデータを呼び出すことを特徴とする移動通信端末装置。

請求項7

前記登録音声パタンは、少なくとも、電話番号検索用音声パタン、メールアドレス検索用音声パタン、およびURL検索用音声パタンが各々独立して登録されていることを特徴とする請求項6記載の移動通信端末装置。

請求項8

前記メモリ検索処理手段により呼び出されるデータのデータ種を指定する操作手段をさらに有することを特徴とする請求項6または7記載の移動通信端末装置。

請求項9

前記メモリ検索処理手段は、アプリケーションの起動状態に基づいて、前記データ種を特定することを特徴とする請求項6または7記載の移動通信端末装置。

請求項10

前記メモリ検索処理手段により呼び出されたデータを表示する表示手段をさらに有することを特徴とする請求項6から9のいずれか1項に記載の移動通信端末装置。

請求項11

ユーザの発した音声が入力され、音声信号として出力する音声入力工程と、該音声入力工程により出力された音声信号を解読し、該解読した音声信号の音声パタンと、予め登録されている登録音声パタンとを比較する音声認識工程と、該音声認識工程により検索された音声パタンに対応する複数種のデータを管理している電話帳を呼び出すメモリ検索工程と、を有し、前記メモリ検索工程は、前記音声認識工程による比較の結果検索された前記音声信号の音声パタンと最も近似する前記登録音声パタンに対応する電話帳を呼び出すことを特徴とする音声認識方法

請求項12

前記電話帳は、少なくとも、電話番号、メールアドレス、およびURLを含むことを特徴とする請求項11記載の音声認識方法。

請求項13

前記複数種のデータを管理している電話帳から呼び出すデータ種を指定する操作工程をさらに有することを特徴とする請求項11または12記載の音声認識方法。

請求項14

前記メモリ検索工程は、アプリケーションの起動状態に基づいて、前記複数種のデータを管理している電話帳から呼び出すデータ種を特定することを特徴とする請求項11または12記載の音声認識方法。

請求項15

前記メモリ検索工程により呼び出されたデータを表示する表示工程をさらに有することを特徴とする請求項11から14のいずれか1項に記載の音声認識方法。

請求項16

ユーザの発した音声が入力され、音声信号として出力する音声入力工程と、該音声入力工程により出力された音声信号を解読し、該解読した音声信号の音声パタンと、予めデータ種ごとに独立に登録されている登録音声パタンとを比較する音声認識工程と、該音声認識工程により検索された音声パタンに対応するデータを呼び出すメモリ検索工程と、を有し、前記メモリ検索工程は、前記音声認識工程による比較の結果検索された前記音声信号の音声パタンと最も近似する前記登録音声パタンに対応するデータを呼び出すことを特徴とする音声認識方法。

請求項17

前記登録音声パタンは、少なくとも、電話番号検索用音声パタン、メールアドレス検索用音声パタン、およびURL検索用音声パタンが各々独立して登録されていることを特徴とする請求項16記載の音声認識方法。

請求項18

前記メモリ検索工程により呼び出されるデータのデータ種を指定する操作工程をさらに有することを特徴とする請求項16または17記載の音声認識方法。

請求項19

前記メモリ検索工程は、アプリケーションの起動状態に基づいて、前記データ種を特定することを特徴とする請求項16または17記載の音声認識方法。

請求項20

前記メモリ検索工程により呼び出されたデータを表示する表示工程をさらに有することを特徴とする請求項16から19のいずれか1項に記載の音声認識方法。

請求項21

ユーザの発した音声が入力され、音声信号として出力する音声入力処理と、該音声入力処理により出力された音声信号を解読し、該解読した音声信号の音声パタンと、予め登録されている登録音声パタンとを比較する音声認識処理と、該音声認識処理により検索された音声パタンに対応する複数種のデータを管理している電話帳を呼び出すメモリ検索処理と、を実行し、前記メモリ検索処理は、前記音声認識処理による比較の結果検索された前記音声信号の音声パタンと最も近似する前記登録音声パタンに対応する電話帳を呼び出すことを特徴とするプログラムを記録した記録媒体

請求項22

前記電話帳は、少なくとも、電話番号、メールアドレス、およびURLを含むことを特徴とする請求項21記載のプログラムを記録した記録媒体。

請求項23

前記複数種のデータを管理している電話帳から呼び出すデータ種を指定する操作処理をさらに実行することを特徴とする請求項21または22記載のプログラムを記録した記録媒体。

請求項24

前記メモリ検索処理は、アプリケーションの起動状態に基づいて、前記複数種のデータを管理している電話帳から呼び出すデータ種を特定することを特徴とする請求項21または22記載のプログラムを記録した記録媒体。

請求項25

前記メモリ検索処理により呼び出されたデータを表示する表示処理をさらに実行することを特徴とする請求項21から24のいずれか1項に記載のプログラムを記録した記録媒体。

請求項26

ユーザの発した音声が入力され、音声信号として出力する音声入力処理と、該音声入力処理により出力された音声信号を解読し、該解読した音声信号の音声パタンと、予めデータ種ごとに独立に登録されている登録音声パタンとを比較する音声認識処理と、該音声認識処理により検索された音声パタンに対応するデータを呼び出すメモリ検索処理と、実行し、前記メモリ検索処理は、前記音声認識処理による比較の結果検索された前記音声信号の音声パタンと最も近似する前記登録音声パタンに対応するデータを呼び出すことを特徴とするプログラムを記録した記録媒体。

請求項27

前記登録音声パタンは、少なくとも、電話番号検索用音声パタン、メールアドレス検索用音声パタン、およびURL検索用音声パタンが各々独立して登録されていることを特徴とする請求項26記載のプログラムを記録した記録媒体。

請求項28

前記メモリ検索処理により呼び出されるデータのデータ種を指定する操作処理をさらに実行することを特徴とする請求項26または27記載のプログラムを記録した記録媒体。

請求項29

前記メモリ検索処理は、アプリケーションの起動状態に基づいて、前記データ種を特定することを特徴とする請求項26または27記載のプログラムを記録した記録媒体。

請求項30

前記メモリ検索処理により呼び出されたデータを表示する表示処理をさらに実行することを特徴とする請求項26から29のいずれか1項に記載のプログラムを記録した記録媒体。

技術分野

0001

本発明は、操作性を向上させるために利用されている音声認識技術を用いて、認識率を低下させずに容易に電話番号検索メールアドレス検索等が可能な移動通信端末装置音声認識方法、およびそのプログラムを記録した記録媒体に関する。

背景技術

0002

近年、携帯電話やPHSといった移動通信端末装置は、音声認識技術を利用した電話番号検索や電話番号発信機能呼び出し等ができる。例えば、相手名前受話器またはこれに代替する機器マイクロホン外部接続機器等)に向けて発声した言葉を基に、目的の電話帳または電話番号が検索でき、手入力によるキー操作の煩わしさが改善されている。

0003

上記音声認識機能に関する従来技術例を図5に示す。図5は、従来の移動通信端末装置の音声認識による電話番号検索の構成を示すブロック図である。図5において、受話器またはこれに代替する機器(マイクロホン、外部接続機器等)である音声入力手段1より入力された名前等の音声は、音声認識手段2で読み取られる。

0004

音声認識手段2により認識された音声データは、音声パタン51と比較され、端末内に登録されている最も近い音声パタンが検索される。音声パタン51の検索に成功した場合、音声・データ対応テーブル50が参照され、端末内に登録されている電話番号52がメモリ検索処理部3で検索される。その結果を表示部4に表示することができる。その後検索した電話番号で、通信制御部6、送受信部7、アンテナ8を介して相手に電話をかけることが可能となる。

発明が解決しようとする課題

0005

しかしながら、上記従来技術には、次のような問題点があった。第1の問題点は、端末内に登録されている音声パタンが多くなると、音声認識の認識率が低くなることである。その理由は、多数の音声パタンから、発声した音声と同じものを1件検索しようとした場合、似たような音声パタンをもつデータを誤検索する確率が高くなるためである。このため、音声パタンの数にある一定の制限を設ける必要がある。

0006

第2の問題点は、移動通信端末装置の利用形態多様化により、電話だけではなくメールやインターネットの利用が多くなることで、その操作等の煩わしさを改善する手段が求められていることである。これらに対応するために、メールやインターネットへの接続を電話番号と同様の音声パタンテーブルで一元管理した場合、更に多くの音声パタンが必要となる。その結果、第1の問題点同様、音声認識の認識率が下がることになる。あるいは、認識率を一定に保つためには、登録できる音声パタンの数を減らす必要がある。

0007

第3の問題点は、音声パタンは同一の語を登録することができないことである。その理由は、同一の音声パタンに複数の機能を持たせると、それらの機能が競合する不具合を生じるためである。

0008

本発明は、上記問題点に鑑みなされたものであり、認識率を低下させずに容易に電話番号検索、メールアドレス検索等が可能な移動通信端末装置、音声認識方法、およびそのプログラムを記録した記録媒体を提供することを目的とする。

課題を解決するための手段

0009

かかる目的を達成するために、請求項1記載の発明は、ユーザの発した音声が入力され、音声信号として出力する音声入力手段と、音声入力手段から出力された音声信号を解読し、解読した音声信号の音声パタンと、予め登録されている登録音声パタンとを比較する音声認識手段と、音声認識手段により検索された音声パタンに対応する複数種のデータを管理している電話帳を呼び出すメモリ検索処理手段と、を有し、メモリ検索処理手段は、音声認識手段による比較の結果検索された音声信号の音声パタンと最も近似する登録音声パタンに対応する電話帳を呼び出すことを特徴とする。

0010

請求項2記載の発明は、請求項1記載の発明において、電話帳は、少なくとも、電話番号、メールアドレス、およびURLを含むことを特徴とする。

0011

請求項3記載の発明は、請求項1または2記載の発明において、複数種のデータを管理している電話帳から呼び出すデータ種を指定する操作手段をさらに有することを特徴とする。

0012

請求項4記載の発明は、請求項1または2記載の発明において、メモリ検索処理手段は、アプリケーション起動状態に基づいて、複数種のデータを管理している電話帳から呼び出すデータ種を特定することを特徴とする。

0013

請求項5記載の発明は、請求項1から4のいずれか1項に記載の発明において、メモリ検索処理手段により呼び出されたデータを表示する表示手段をさらに有することを特徴とする。

0014

請求項6記載の発明は、ユーザの発した音声が入力され、音声信号として出力する音声入力手段と、音声入力手段から出力された音声信号を解読し、解読した音声信号の音声パタンと、予めデータ種ごとに独立に登録されている登録音声パタンとを比較する音声認識手段と、音声認識手段により検索された音声パタンに対応するデータを呼び出すメモリ検索処理手段と、を有し、メモリ検索処理手段は、音声認識手段による比較の結果検索された音声信号の音声パタンと最も近似する登録音声パタンに対応するデータを呼び出すことを特徴とする。

0015

請求項7記載の発明は、請求項6記載の発明において、登録音声パタンは、少なくとも、電話番号検索用音声パタン、メールアドレス検索用音声パタン、およびURL検索用音声パタンが各々独立して登録されていることを特徴とする。

0016

請求項8記載の発明は、請求項6または7記載の発明において、メモリ検索処理手段により呼び出されるデータのデータ種を指定する操作手段をさらに有することを特徴とする。

0017

請求項9記載の発明は、請求項6または7記載の発明において、メモリ検索処理手段は、アプリケーションの起動状態に基づいて、データ種を特定することを特徴とする。

0018

請求項10記載の発明は、請求項6から9のいずれか1項に記載の発明において、メモリ検索処理手段により呼び出されたデータを表示する表示手段をさらに有することを特徴とする。

0019

請求項11記載の発明は、ユーザの発した音声が入力され、音声信号として出力する音声入力工程と、音声入力工程により出力された音声信号を解読し、解読した音声信号の音声パタンと、予め登録されている登録音声パタンとを比較する音声認識工程と、音声認識工程により検索された音声パタンに対応する複数種のデータを管理している電話帳を呼び出すメモリ検索工程と、を有し、メモリ検索工程は、音声認識工程による比較の結果検索された音声信号の音声パタンと最も近似する登録音声パタンに対応する電話帳を呼び出すことを特徴とする。

0020

請求項12記載の発明は、請求項11記載の発明において、電話帳は、少なくとも、電話番号、メールアドレス、およびURLを含むことを特徴とする。

0021

請求項13記載の発明は、請求項11または12記載の発明において、複数種のデータを管理している電話帳から呼び出すデータ種を指定する操作工程をさらに有することを特徴とする。

0022

請求項14記載の発明は、請求項11または12記載の発明において、メモリ検索工程は、アプリケーションの起動状態に基づいて、複数種のデータを管理している電話帳から呼び出すデータ種を特定することを特徴とする。

0023

請求項15記載の発明は、請求項11から14のいずれか1項に記載の発明において、メモリ検索工程により呼び出されたデータを表示する表示工程をさらに有することを特徴とする。

0024

請求項16記載の発明は、ユーザの発した音声が入力され、音声信号として出力する音声入力工程と、音声入力工程により出力された音声信号を解読し、解読した音声信号の音声パタンと、予めデータ種ごとに独立に登録されている登録音声パタンとを比較する音声認識工程と、音声認識工程により検索された音声パタンに対応するデータを呼び出すメモリ検索工程と、を有し、メモリ検索工程は、音声認識工程による比較の結果検索された音声信号の音声パタンと最も近似する登録音声パタンに対応するデータを呼び出すことを特徴とする。

0025

請求項17記載の発明は、請求項16記載の発明において、登録音声パタンは、少なくとも、電話番号検索用音声パタン、メールアドレス検索用音声パタン、およびURL検索用音声パタンが各々独立して登録されていることを特徴とする。

0026

請求項18記載の発明は、請求項16または17記載の発明において、メモリ検索工程により呼び出されるデータのデータ種を指定する操作工程をさらに有することを特徴とする。

0027

請求項19記載の発明は、請求項16または17記載の発明において、メモリ検索工程は、アプリケーションの起動状態に基づいて、データ種を特定することを特徴とする。

0028

請求項20記載の発明は、請求項16から19のいずれか1項に記載の発明において、メモリ検索工程により呼び出されたデータを表示する表示工程をさらに有することを特徴とする。

0029

請求項21記載の発明は、ユーザの発した音声が入力され、音声信号として出力する音声入力処理と、音声入力処理により出力された音声信号を解読し、解読した音声信号の音声パタンと、予め登録されている登録音声パタンとを比較する音声認識処理と、音声認識処理により検索された音声パタンに対応する複数種のデータを管理している電話帳を呼び出すメモリ検索処理と、を実行し、メモリ検索処理は、音声認識処理による比較の結果検索された音声信号の音声パタンと最も近似する登録音声パタンに対応する電話帳を呼び出すことを特徴とする。

0030

請求項22記載の発明は、請求項21記載の発明において、電話帳は、少なくとも、電話番号、メールアドレス、およびURLを含むことを特徴とする。

0031

請求項23記載の発明は、請求項21または22記載の発明において、複数種のデータを管理している電話帳から呼び出すデータ種を指定する操作処理をさらに実行することを特徴とする。

0032

請求項24記載の発明は、請求項21または22記載の発明において、メモリ検索処理は、アプリケーションの起動状態に基づいて、複数種のデータを管理している電話帳から呼び出すデータ種を特定することを特徴とする。

0033

請求項25記載の発明は、請求項21から24のいずれか1項に記載の発明において、メモリ検索処理により呼び出されたデータを表示する表示処理をさらに実行することを特徴とする。

0034

請求項26記載の発明は、ユーザの発した音声が入力され、音声信号として出力する音声入力処理と、音声入力処理により出力された音声信号を解読し、解読した音声信号の音声パタンと、予めデータ種ごとに独立に登録されている登録音声パタンとを比較する音声認識処理と、音声認識処理により検索された音声パタンに対応するデータを呼び出すメモリ検索処理と、実行し、メモリ検索処理は、音声認識処理による比較の結果検索された音声信号の音声パタンと最も近似する登録音声パタンに対応するデータを呼び出すことを特徴とする。

0035

請求項27記載の発明は、請求項26記載の発明において、登録音声パタンは、少なくとも、電話番号検索用音声パタン、メールアドレス検索用音声パタン、およびURL検索用音声パタンが各々独立して登録されていることを特徴とする。

0036

請求項28記載の発明は、請求項26または27記載の発明において、メモリ検索処理により呼び出されるデータのデータ種を指定する操作処理をさらに実行することを特徴とする。

0037

請求項29記載の発明は、請求項26または27記載の発明において、メモリ検索処理は、アプリケーションの起動状態に基づいて、データ種を特定することを特徴とする。

0038

請求項30記載の発明は、請求項26から29のいずれか1項に記載の発明において、メモリ検索処理により呼び出されたデータを表示する表示処理をさらに実行することを特徴とする。

発明を実施するための最良の形態

0039

以下、本発明の実施の形態を添付図面を参照しながら詳細に説明する。

0040

図1は、本発明の第1の実施の形態における移動通信端末装置の構成を示すブロック図である。本実施の形態にかかる移動通信端末装置は、音声入力手段1、音声認識手段2、メモリ機能処理部3、表示部4、音声検索処理部5、通信制御部6、送受信部7、アンテナ8、およびボタン操作部9を有する。

0041

音声入力手段1は、受話器やマイクロホン、または外部接続音声入力装置であり、ユーザが発声した音声信号を音声認識手段2に伝達する機能を有する。音声認識手段2は、音声入力手段1より送信された音声データを解読し、解読した音声パタンと、音声検索処理部5内にあらかじめ登録してある1つ以上の音声パタン51との比較を行う。

0042

メモリ検索処理部3は、音声検索処理部5内に登録されている電話帳55の検索を行う。電話帳55の中には個々人のデータ、つまり電話番号52、メールアドレス53、URL54等のデータが登録されている。

0043

電話帳55は、個人へのコミュニケーション手段が多様化してきたことに対応するためのものである。即ち、従来、個人へのコミュニケーション手段は、電話、郵便等に限られていた。この点、インタネット爆発的普及により、電子メールや個人のホームページに情報を掲載するといったコミュニケーション手段が一般化してきた。したがって、メモリに1人の連絡先を登録するのに、連絡先として、複数の情報を登録しなければならない。したがって、上記従来技術のように、電話番号52に直接音声パタンを51を対応させると、登録限度数を超えてしまうことになる。この点、電話帳55を設けると、1つの音声パタン51に1人を対応させることができることになる。

0044

音声検索処理部5は、後述する音声パタン51と電話帳55との1対1の音声・データ対応テーブルを記憶している。また、後述するボタン操作部9からの操作による電話帳55の各種データ、つまり電話番号52、メールアドレス53、URL54等の呼び出し対応テーブルも記憶している。音声認識手段2で検索された音声パタン51に対応した電話帳55の検索結果の可否は、メモリ検索処理部3を介して、表示部4に表示される。

0045

ボタン操作部9は、「電話」ボタン92、「メール」ボタン93、「インターネット」ボタン94を有する。当該ボタンのON/OFF状態や、ボタン押下による端末状態の変化を音声検索処理部5に通知する。これらの操作により、どの種類のデータを呼び出すかを指示することができる。尚、ボタンの割り当てに関しては、上記3種類のボタン操作方法が独立であれば、どのボタンに割り当てても構わない。

0046

また、ボタン操作9による手段ではなく、アプリケーションの起動状態の検知を音声検索処理部5に通知してもよい。即ち、移動通信端末装置が通常モードのときには、自動的に電話番号52を、メールソフト起動されたときには、自動的にメールアドレス53を、ブラウザを起動しているときには、URL54を呼び出す。検索した結果を基に、通信制御部6、送受信部7、アンテナ8を利用して外部との発呼メール送信インターネット接続等を可能とする。

0047

次に、図1及び図2を参照して、本実施の形態にかかる移動通信端末装置を利用した音声認識方法について説明する。図2は、本実施の形態における音声・データ対応テーブルを示す図である。

0048

まず、受話器やマイクロホン等で構成される音声入力手段1に向かって、ユーザは、電話をかけたい人の名前等を発声する。発声された音声データは、音声認識手段2に伝達される。音声認識手段2は、当該音声データの解読を行い、当該解読した音声データのパタンと、あらかじめ端末内に登録されている少なくとも1つ以上の音声パタン51と比較する。

0049

具体的には、音声認識手段2は、FFT高速フーリエ変換)やLPC(線形予測分析)に基づくデジタル信号処理により、音声波形信号から音声の特徴を抽出する。該抽出した特徴と、あらかじめ用意された音声パタン51とを確率・統計的手法により比較する。

0050

音声パタン51は、一般的にカナアルファベット等に対する標準音声パタンである。標準音声パタンは、多数話者発生音サンプルからHMM(隠れマルコフモデル)の確率パラメータ推定して生成する。

0051

ユーザは、例えば「サトウ」等の文字情報を登録しておく。ここで、発声する言葉、登録されている音声パタン51は、必ずしも名前である必要はなく、ニックネームや他の名称等でもよい。音声パタン51の編集機能を持たせれば、その変更は容易に可能である。同姓等の場合に対応するためである。

0052

ユーザが発声した音声データと、音声検索処理部5内に登録されている音声パタン51とが近似、または一致した場合は、図2の音声・データ対応テーブル50を参照する。参照の結果、検索した音声パタン51に対応した電話帳55が呼び出される。電話帳55の呼び出し動作は、メモリ検索処理部3が行う。検索結果は、表示部4に表示される。尚、各音声パタン51と電話帳55とは、1対1で対応しており、複数の電話帳55が呼び出されることはない。

0053

音声パタン51から各種データを呼び出す方法について、図2を参照して説明する。本実施の形態においては、音声パタン51は、電話帳55の名前と対応している。音声・データ対応テーブル50を参照して検索した電話帳55には電話番号52、メールアドレス53、URL54が個人データとして登録されている。

0054

上記各種データを呼び出す方法に関して、一例としてボタン操作部9から「電話」ボタン92を押下した場合について説明する。ユーザは、ボタン操作部9から「電話」ボタン92を押下し、音声入力手段1から音声を入力すると、電話番号52のみのデータの呼び出しが可能となる。

0055

音声として「サトウ」を発声した場合は、電話帳55の「佐」を検索し、電話番号52「XXX−XXX−XXXX」が呼び出される。それ以外の個人データであるメールアドレス53やURL54は呼び出されない。仮に、検索した電話帳55の中に電話番号52が登録されていない場合は、表示部4にその旨を表示する。「メール」ボタン93を押下、「インターネット」ボタン94を押下した場合も同様に、その機能が有するデータのみ呼び出すことができる。

0056

「電話」92、「メール」93、「インターネット」94のボタン名や種類に関しては、特に制限はなく、ボタン操作も単にON/OFF状態だけではなく、上記3種類のボタン操作方法が独立であれば、どのボタンに割り当てても構わない。また、ボタン操作ではなく、アプリケーション起動状態によって、呼び出すデータの種類を変えることも可能である。例えば、ブラウザを立ち上げている時は、URL54のみを呼び出す等の区別が可能であり、ボタン操作は不要となる。

0057

呼び出されたデータは、表示部4に表示することが可能であり、通信制御部6、送受信部7、アンテナ8等、通信手段を用いて、電話番号の発呼、メールの送信、URLの接続が可能となる。

0058

次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。図3は、本発明の第2の実施の形態における移動通信端末装置の構成を示すブロック図である。図3を参照すると、音声検索処理部5が第1の実施の形態と異なる。その他の構成・機能に関しては、第1の実施の形態と同様であるため、説明を省略する。

0059

本実施の形態における音声検索処理部5の音声パタンは、機能により3種類のテーブルに分かれている。つまり、電話番号52呼び出し用の音声パタン1のテーブル512、メールアドレス53呼び出し用の音声パタン2のテーブル513、およびURL54呼び出し用の音声パタン3のテーブル514が存在する。各音声パタン512、513、514の同一テーブルに同じ音声パタンは登録できない。別テーブルに対しては、同じ音声パタンの登録が可能である。

0060

図4は、本発明の第2の実施の形態における音声・データ対応テーブルを示す図である。図4の音声・データ対応テーブル50を参照すると、ボタン操作部9からの操作により、各音声パタン512、513、514のテーブルを選択することができ、それぞれ目的の電話番号52、メールアドレス53、URL54を呼び出すことができる。本実施の形態は、第1の実施の形態のように、音声パタン51のテーブルが1つではなく、電話番号52、メールアドレス53等のジャンルに対応したテーブル数となる。そして、検索は、各テーブル単位ごとに行われるため、音声認識率を維持することができる。

0061

一例として「メール」ボタン93押下によるメールアドレス呼び出しについて説明する。図4を参照すると、「メール」ボタン93押下により、音声パタン2のテーブル513が有効になる。この時に、音声入力手段1に、「スズキ」と発声した場合は、メールアドレス「suzuki@yy.ne.jp」を呼び出すことができる。尚、ボタン操作9でなくとも、アプリケーションの起動状態によって、音声パタン512、513、514を選択する方法でもよい。例えば、メールソフトを立ち上げているときは、音声パターン2のテーブル513が有効になるようにする。

0062

第1の実施の形態においては、電話帳55毎に呼び出すため、呼び出された電話帳55内に一部データが登録されていない場合、例えば、図2の電話帳「鈴木」のようにURL54が含まれていない場合は、データを呼び出すことは不可能である。この点、本実施の形態においては、データの種類により音声パタンを分けているため、音声パタンが識別できれば、それに対応するデータは必ず呼び出すことができる。したがって、より多くのデータが音声呼び出しの対象となるという新たな効果が生じる。

0063

また、本実施の形態においては、音声パタンの登録数は、音声パタンのテーブルを複数で管理しているため、端末全体で見た場合、第1の実施の形態よりも多くなる。また、本実施の形態においても、第1の実施の形態の同様に、音声認識率の精度を維持しながら、多くのデータを管理することができ、操作性がよい。

0064

なお、本発明の音声認識方法をプログラムにより実行可能である。当該プログラムは、磁気記録媒体光記録媒体、または半導体記録媒体に記録されて提供されるか、またはネットワークを介して、FTPファイル転送プロトコル)により移動通信端末装置にダウンロードされる。

0065

なお、上述した実施の形態は、本発明の好適な実施の形態の一例であり、本発明はそれに限定されることなく、その要旨を逸脱しない範囲内において種々変形実施が可能である。

0066

例えば、上記の説明において、電話帳55の項目として、電話番号52、メールアドレス53、およびURL54の3項目の例を説明した。この点に関し、携帯電話やPHS等の移動通信端末と、自宅に設置されている加入電話の両方を所有している人が増えている。これに鑑み、電話番号を携帯電話等の電話番号と、加入電話の電話番号とに分けて、4項目としてもよい。

0067

また、音声検索処理部5の電話番号52の項目に携帯電話の番号と加入電話の番号とを両方登録しておき、電話ボタン92が押下されると、両方の電話番号を呼び出してもよい。この場合、表示部4に2つの電話番号が表示された状態で、ユーザは、どちらかの番号を任意に選択し発呼する。当該発呼に対し応答がない場合、ユーザは、もう一方の電話番号にすぐ発呼することができる。また、応答がない場合、自動的にもう一方の電話番号に発呼する構成としてもい。

発明の効果

0068

以上の説明から明らかなように、本発明の第1の効果は、同一の音声パタンで複数のデータを呼び出すことができることにある。その理由は、ボタン操作との併用で、各種のデータ(電話番号、メールアドレス、URL等)を独立して呼び出すことができるためである。その結果、多様化する移動通信端末装置の操作性の煩わしさが改善できる。

0069

第2の効果は、音声パタンと電話帳とを1対1にすることにより、従来、主であった音声パタンと電話番号(あるいはメールアドレス等)の1対1の関係を、1元管理する必要がなくなったことである。その結果、音声パタンを少なくでき、データ量が増えても音声認識率の低下を防ぐことができる。

図面の簡単な説明

0070

図1本発明の第1の実施の形態における移動通信端末装置の構成を示すブロック図である。
図2本発明の第1の実施の形態における音声・データ対応テーブルを示す図である。
図3本発明の第2の実施の形態における移動通信端末の装置の構成を示すブロック図である。
図4本発明の第2の実施の形態における音声・データ対応テーブルを示す図である。
図5従来技術における移動通信端末装置の構成を示すブロック図である。

--

0071

1音声入力手段
2音声認識手段
3メモリ検索処理部
4 表示部
5音声検索処理部
6通信制御部
7送受信部
8アンテナ
9 ボタン操作部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

新着 最近 公開された関連が強い 技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する挑戦したい社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ