図面 (/)

この項目の情報は公開日時点(2009年10月29日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (13)

課題

音声命令の意味を認識し、その認識された音声命令に基づいて移動端末機を制御する方法、及びその移動端末機を提供する。

解決手段

移動端末機は、移動端末機の音声認識機能アクティブにする入力を受信する入力部と、移動端末機で行われる動作に関する情報を保存するメモリと、音声認識機能をアクティブにする入力が受信されると音声認識機能をアクティブにし、移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、入力された音声命令の意味を判断し、移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、また、判断された入力音声命令の意味と移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、判断された入力音声命令の意味に関する動作を提供する制御部とを含む。

概要

背景

移動端末機は、基本的な電話サービス以外にも、多くのさらなるサービスを提供する。例えば、使用者は移動端末機を用いてインターネットアクセス、ゲーム、ビデオ鑑賞音楽鑑賞画像撮影音声ファイル記録などを行うことができる。また、移動端末機が放送番組を提供することによって、使用者はテレビ番組スポーツ番組、ビデオなどを見ることができる。

従って、移動端末機は、使用者が端末機上で様々な機能にアクセスできるように、非常に複雑なグラフィックユーザインタフェースGUI)を含む。例えば、使用者は、メインメニューにアクセスした後、電子メールサメニュー、通話履歴サブメニュー、インターネットアクセスサブメニュー、写真サブメニューなどの様々なサブメニューからいずれか1つを選択することができる。使用者が特定サブメニューを選択すると、移動端末機は、サブメニュー又はオプションの他のリストを提供することにより、使用者が所望の機能を実行するために選択できるようにする。

概要

音声命令の意味を認識し、その認識された音声命令に基づいて移動端末機を制御する方法、及びその移動端末機を提供する。移動端末機は、移動端末機の音声認識機能アクティブにする入力を受信する入力部と、移動端末機で行われる動作に関する情報を保存するメモリと、音声認識機能をアクティブにする入力が受信されると音声認識機能をアクティブにし、移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、入力された音声命令の意味を判断し、移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、また、判断された入力音声命令の意味と移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、判断された入力音声命令の意味に関する動作を提供する制御部とを含む。

目的

本発明は、上記問題及びその他の問題を解決するためになされたもので、音声命令の意味を認識し、その認識された音声命令に基づいて移動端末機を制御する方法、及びその移動端末機を提供することを目的とする。

効果

実績

技術文献被引用数
3件
牽制数
5件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

移動端末機音声認識機能アクティブにする入力を受信する入力部と、前記移動端末機で行われる動作に関する情報を保存するメモリと、前記音声認識機能をアクティブにする入力が受信されると前記音声認識機能をアクティブにし、前記移動端末機で行われる少なくとも1つの事前動作音声命令に含まれる言語に基づいて、入力された前記音声命令の意味を判断し、前記移動端末機で行われる少なくとも1つの事前動作と前記音声命令に含まれる言語に基づいて、また、前記判断された入力音声命令の意味と前記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、前記判断された入力音声命令の意味に関する動作を提供する制御部とを含むことを特徴とする移動端末機。

請求項2

前記制御部は、特定動作に関する前記音声命令が入力されると、中間動作の選択を要求することなく、直ちに前記特定動作に対応する機能を実行することを特徴とする請求項1に記載の移動端末機。

請求項3

前記判断された入力音声命令の意味に関して提供される動作は、所定の閾値より大きい確率を有する全ての動作を含むことを特徴とする請求項1に記載の移動端末機。

請求項4

前記所定の閾値は、前記移動端末機のメーカ又は前記移動端末機の使用者により設定されることを特徴とする請求項3に記載の移動端末機。

請求項5

前記所定の閾値は、判断された動作の数に基づいて自動的に選択されることを特徴とする請求項3に記載の移動端末機。

請求項6

前記制御部は、前記移動端末機の動作状態に基づいて、前記入力された音声命令の意味を判断するように構成されることを特徴とする請求項1に記載の移動端末機。

請求項7

前記判断された入力音声命令の意味に関して提供される動作は、前記判断された入力音声命令の意味に対応する少なくとも1つのメニューオプションを含むことを特徴とする請求項1に記載の移動端末機。

請求項8

前記制御部は、所定の閾値より高い確率を有する、前記判断された入力音声命令の意味に対応する全てのメニューオプションを出力するように構成されることを特徴とする請求項7に記載の移動端末機。

請求項9

前記制御部は、最も高い確率を有する、前記判断された入力音声命令の意味に対応するメニューオプションを、他のメニューと差別化して表示するように構成されることを特徴とする請求項8に記載の移動端末機。

請求項10

前記制御部は、前記最も高い確率を有するメニューオプションのサイズ、表示位置、色、明暗、及びハイライト情報の少なくとも1つが異なるように制御することにより、前記最も高い確率を有する、前記判断された入力音声命令の意味に対応するメニューオプションを差別化して表示することを特徴とする請求項9に記載の移動端末機。

請求項11

前記入力部は、1)前記音声認識機能をアクティブにするためにタッチするタッチソフトボタン、2)前記音声認識機能をアクティブにするために押圧又は操作するハードボタン、3)前記音声認識機能をアクティブにするためにタッチする、前記入力部に含まれるタッチスクリーンの任意の位置、4)前記音声認識機能をアクティブにするために入力される衝撃音、5)近距離無線信号又は遠距離無線信号、6)使用者からの身体情報信号の少なくとも1つを含むことを特徴とする請求項1に記載の移動端末機。

請求項12

前記音声命令を認識する制御部により使用される音声又は発音情報を保存する第1データベースと、前記音声命令を認識する制御部により使用される単語、キーワード、又は文章情報を保存する第2データベースと、前記移動端末機の機能又はメニューに関する情報を保存する第3データベースと、前記制御部が前記認識された音声命令の意味の判断を試みていることを使用者に通知するために出力されるヘルプ情報を保存する第4データベースとをさらに含むことを特徴とする請求項1に記載の移動端末機。

請求項13

前記制御部は、前記音声認識機能がアクティブ状態にあることを示すオーディオ情報又はビデオ情報を出力するように構成されることを特徴とする請求項1に記載の移動端末機。

請求項14

移動端末機の音声認識機能をアクティブにする入力を受信する段階と、前記音声認識機能をアクティブにする入力が受信されると前記音声認識機能をアクティブにする段階と、前記移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、また、判断された前記入力音声命令の意味と前記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、前記判断された入力音声命令の意味に関する動作を提供する段階とを含むことを特徴とする移動端末機の制御方法

請求項15

前記制御部は、特定動作に関する前記音声命令が入力されると、中間動作の選択を要求することなく、直ちに前記特定動作に対応する機能を実行することを特徴とする請求項14に記載の移動端末機の制御方法。

請求項16

前記判断された入力音声命令の意味に関して提供される動作は、所定の閾値より大きい確率を有する全ての動作を含むことを特徴とする請求項14に記載の移動端末機の制御方法。

請求項17

前記所定の閾値は、前記移動端末機のメーカ又は前記移動端末機の使用者により設定されることを特徴とする請求項16に記載の移動端末機の制御方法。

請求項18

前記所定の閾値は、判断された動作の数に基づいて自動的に選択されることを特徴とする請求項16に記載の移動端末機の制御方法。

請求項19

前記移動端末機で行われる少なくとも1つの事前動作と前記入力音声命令に含まれる言語に基づいて、前記入力音声命令の意味を判断する段階をさらに含むことを特徴とする請求項14に記載の移動端末機の制御方法。

請求項20

前記移動端末機の動作状態に基づいて、前記入力音声命令の意味を判断する段階をさらに含むことを特徴とする請求項19に記載の移動端末機の制御方法。

請求項21

前記判断された入力音声命令の意味に関して提供される動作は、前記判断された入力音声命令の意味に対応する少なくとも1つのメニューオプションを含むことを特徴とする請求項20に記載の移動端末機の制御方法。

請求項22

所定の閾値より高い確率を有する、前記判断された入力音声命令の意味に対応する全てのメニューオプションを出力する段階をさらに含むことを特徴とする請求項21に記載の移動端末機の制御方法。

請求項23

最も高い確率を有する、前記判断された入力音声命令の意味に対応するメニューオプションを、他のメニューと差別化して表示する段階をさらに含むことを特徴とする請求項22に記載の移動端末機の制御方法。

請求項24

前記表示する段階においては、前記最も高い確率を有するメニューオプションのサイズ、表示位置、色、明暗、及びハイライト情報の少なくとも1つが異なるように制御することにより、前記最も高い確率を有する、前記判断された入力音声命令の意味に対応するメニューオプションを差別化して表示することを特徴とする請求項23に記載の移動端末機の制御方法。

請求項25

前記入力を受信する段階においては、1)前記音声認識機能をアクティブにするためにタッチするタッチソフトボタン、2)前記音声認識機能をアクティブにするために押圧又は操作するハードボタン、3)前記音声認識機能をアクティブにするためにタッチする、前記入力部に含まれるタッチスクリーンの任意の位置、4)前記音声認識機能をアクティブにするために入力される衝撃音、5)近距離無線信号又は遠距離無線信号、6)使用者からの身体情報信号の少なくとも1つを使用することを特徴とする請求項14に記載の移動端末機の制御方法。

請求項26

前記音声認識機能がアクティブ状態にあることを示すオーディオ情報又はビデオ情報を出力する段階をさらに含むことを特徴とする請求項14に記載の移動端末機の制御方法。

技術分野

0001

本発明は、音声命令及び移動端末機で行われる事前動作に基づいて前記移動端末機で動作を行う方法、並びにその移動端末機に関する。

背景技術

0002

移動端末機は、基本的な電話サービス以外にも、多くのさらなるサービスを提供する。例えば、使用者は移動端末機を用いてインターネットアクセス、ゲーム、ビデオ鑑賞音楽鑑賞画像撮影音声ファイル記録などを行うことができる。また、移動端末機が放送番組を提供することによって、使用者はテレビ番組スポーツ番組、ビデオなどを見ることができる。

0003

従って、移動端末機は、使用者が端末機上で様々な機能にアクセスできるように、非常に複雑なグラフィックユーザインタフェースGUI)を含む。例えば、使用者は、メインメニューにアクセスした後、電子メールサメニュー、通話履歴サブメニュー、インターネットアクセスサブメニュー、写真サブメニューなどの様々なサブメニューからいずれか1つを選択することができる。使用者が特定サブメニューを選択すると、移動端末機は、サブメニュー又はオプションの他のリストを提供することにより、使用者が所望の機能を実行するために選択できるようにする。

発明が解決しようとする課題

0004

しかしながら、このようなメニューシステムは、樹形図のような構造を有するので、使用者が最終的に所望の機能を選択するためには、いくつかの中間機能を実行しなければならない。また、移動端末機のサイズが小さいため、メニューオプションも小さくて見にくい。さらに、タッチスクリーンディスプレイを含む移動端末機の場合、特定メニューオプションをタッチする際、(メニューアイテムが隣接して表示されるため)隣接したメニューアイテムを同時にタッチしたり、間違ったメニューアイテムをタッチすることがある。

0005

本発明は、上記問題及びその他の問題を解決するためになされたもので、音声命令の意味を認識し、その認識された音声命令に基づいて移動端末機を制御する方法、及びその移動端末機を提供することを目的とする。

0006

本発明の他の目的は、前記認識された音声命令に基づいて前記移動端末機の様々な機能を実行するためのメニューを提供する方法、及びその移動端末機を提供することにある。

課題を解決するための手段

0007

上記の目的を達成するために、本発明の一態様は、移動端末機の音声認識機能アクティブにする入力を受信する入力部と、前記移動端末機で行われる動作に関する情報を保存するメモリと、前記音声認識機能をアクティブにする入力が受信されると前記音声認識機能をアクティブにし、前記移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、入力された前記音声命令の意味を判断し、前記移動端末機で行われる少なくとも1つの事前動作と前記音声命令に含まれる言語に基づいて、また、前記判断された入力音声命令の意味と前記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、前記判断された入力音声命令の意味に関する動作を提供する制御部とを含む、移動端末機を提供する。

0008

本発明の他の態様は、移動端末機の音声認識機能をアクティブにする入力を受信する段階と、前記音声認識機能をアクティブにする入力が受信されると前記音声認識機能をアクティブにする段階と、前記移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、また、判断された前記入力音声命令の意味と前記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、前記判断された入力音声命令の意味に関する動作を提供する段階とを含む、移動端末機の制御方法を提供する。

0009

上記目的を達成するために、本発明は、例えば、以下の手段を提供する。
項目1)
移動端末機の音声認識機能をアクティブにする入力を受信する入力部と、
上記移動端末機で行われる動作に関する情報を保存するメモリと、
上記音声認識機能をアクティブにする入力が受信されると上記音声認識機能をアクティブにし、上記移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、入力された上記音声命令の意味を判断し、上記移動端末機で行われる少なくとも1つの事前動作と上記音声命令に含まれる言語に基づいて、また、上記判断された入力音声命令の意味と上記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、上記判断された入力音声命令の意味に関する動作を提供する制御部と
を含むことを特徴とする移動端末機。
(項目2)
上記制御部は、特定動作に関する上記音声命令が入力されると、中間動作の選択を要求することなく、直ちに上記特定動作に対応する機能を実行することを特徴とする項目1に記載の移動端末機。
(項目3)
上記判断された入力音声命令の意味に関して提供される動作は、所定の閾値より大きい確率を有する全ての動作を含むことを特徴とする項目1に記載の移動端末機。
(項目4)
上記所定の閾値は、上記移動端末機のメーカ又は上記移動端末機の使用者により設定されることを特徴とする項目3に記載の移動端末機。
(項目5)
上記所定の閾値は、判断された動作の数に基づいて自動的に選択されることを特徴とする項目3に記載の移動端末機。
(項目6)
上記制御部は、上記移動端末機の動作状態に基づいて、上記入力された音声命令の意味を判断するように構成されることを特徴とする項目1に記載の移動端末機。
(項目7)
上記判断された入力音声命令の意味に関して提供される動作は、上記判断された入力音声命令の意味に対応する少なくとも1つのメニューオプションを含むことを特徴とする項目1に記載の移動端末機。
(項目8)
上記制御部は、所定の閾値より高い確率を有する、上記判断された入力音声命令の意味に対応する全てのメニューオプションを出力するように構成されることを特徴とする項目7に記載の移動端末機。
(項目9)
上記制御部は、最も高い確率を有する、上記判断された入力音声命令の意味に対応するメニューオプションを、他のメニューと差別化して表示するように構成されることを特徴とする項目8に記載の移動端末機。
(項目10)
上記制御部は、上記最も高い確率を有するメニューオプションのサイズ、表示位置、色、明暗、及びハイライト情報の少なくとも1つが異なるように制御することにより、上記最も高い確率を有する、上記判断された入力音声命令の意味に対応するメニューオプションを差別化して表示することを特徴とする項目9に記載の移動端末機。
(項目11)
上記入力部は、
1)上記音声認識機能をアクティブにするためにタッチするタッチソフトボタン
2)上記音声認識機能をアクティブにするために押圧又は操作するハードボタン
3)上記音声認識機能をアクティブにするためにタッチする、上記入力部に含まれるタッチスクリーンの任意の位置、
4)上記音声認識機能をアクティブにするために入力される衝撃音
5)近距離無線信号又は遠距離無線信号、
6)使用者からの身体情報信号
の少なくとも1つを含むことを特徴とする項目1に記載の移動端末機。
(項目12)
上記音声命令を認識する制御部により使用される音声又は発音情報を保存する第1データベースと、
上記音声命令を認識する制御部により使用される単語、キーワード、又は文章情報を保存する第2データベースと、
上記移動端末機の機能又はメニューに関する情報を保存する第3データベースと、
上記制御部が上記認識された音声命令の意味の判断を試みていることを使用者に通知するために出力されるヘルプ情報を保存する第4データベースと
をさらに含むことを特徴とする項目1に記載の移動端末機。
(項目13)
上記制御部は、上記音声認識機能がアクティブ状態にあることを示すオーディオ情報又はビデオ情報を出力するように構成されることを特徴とする項目1に記載の移動端末機。
(項目14)
移動端末機の音声認識機能をアクティブにする入力を受信する段階と、
上記音声認識機能をアクティブにする入力が受信されると上記音声認識機能をアクティブにする段階と、
上記移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、また、判断された上記入力音声命令の意味と上記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、上記判断された入力音声命令の意味に関する動作を提供する段階と
を含むことを特徴とする移動端末機の制御方法。
(項目15)
上記制御部は、特定動作に関する上記音声命令が入力されると、中間動作の選択を要求することなく、直ちに上記特定動作に対応する機能を実行することを特徴とする項目14に記載の移動端末機の制御方法。
(項目16)
上記判断された入力音声命令の意味に関して提供される動作は、所定の閾値より大きい確率を有する全ての動作を含むことを特徴とする項目14に記載の移動端末機の制御方法。
(項目17)
上記所定の閾値は、上記移動端末機のメーカ又は上記移動端末機の使用者により設定されることを特徴とする項目16に記載の移動端末機の制御方法。
(項目18)
上記所定の閾値は、判断された動作の数に基づいて自動的に選択されることを特徴とする項目16に記載の移動端末機の制御方法。
(項目19)
上記移動端末機で行われる少なくとも1つの事前動作と上記入力音声命令に含まれる言語に基づいて、上記入力音声命令の意味を判断する段階をさらに含むことを特徴とする項目14に記載の移動端末機の制御方法。
(項目20)
上記移動端末機の動作状態に基づいて、上記入力音声命令の意味を判断する段階をさらに含むことを特徴とする項目19に記載の移動端末機の制御方法。
(項目21)
上記判断された入力音声命令の意味に関して提供される動作は、上記判断された入力音声命令の意味に対応する少なくとも1つのメニューオプションを含むことを特徴とする項目20に記載の移動端末機の制御方法。
(項目22)
所定の閾値より高い確率を有する、上記判断された入力音声命令の意味に対応する全てのメニューオプションを出力する段階をさらに含むことを特徴とする項目21に記載の移動端末機の制御方法。
(項目23)
最も高い確率を有する、上記判断された入力音声命令の意味に対応するメニューオプションを、他のメニューと差別化して表示する段階をさらに含むことを特徴とする項目22に記載の移動端末機の制御方法。
(項目24)
上記表示する段階においては、
上記最も高い確率を有するメニューオプションのサイズ、表示位置、色、明暗、及びハイライト情報の少なくとも1つが異なるように制御することにより、上記最も高い確率を有する、上記判断された入力音声命令の意味に対応するメニューオプションを差別化して表示することを特徴とする項目23に記載の移動端末機の制御方法。
(項目25)
上記入力を受信する段階においては、
1)上記音声認識機能をアクティブにするためにタッチするタッチソフトボタン、
2)上記音声認識機能をアクティブにするために押圧又は操作するハードボタン、
3)上記音声認識機能をアクティブにするためにタッチする、上記入力部に含まれるタッチスクリーンの任意の位置、
4)上記音声認識機能をアクティブにするために入力される衝撃音、
5)近距離無線信号又は遠距離無線信号、
6)使用者からの身体情報信号
の少なくとも1つを使用することを特徴とする項目14に記載の移動端末機の制御方法。
(項目26)
上記音声認識機能がアクティブ状態にあることを示すオーディオ情報又はビデオ情報を出力する段階をさらに含むことを特徴とする項目14に記載の移動端末機の制御方法。

0010

音声命令の意味を認識し、その認識された音声命令に基づいて移動端末機を制御する方法、及びその移動端末機を提供する。

0011

移動端末機は、移動端末機の音声認識機能をアクティブにする入力を受信する入力部と、移動端末機で行われる動作に関する情報を保存するメモリと、音声認識機能をアクティブにする入力が受信されると音声認識機能をアクティブにし、移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、入力された音声命令の意味を判断し、移動端末機で行われる少なくとも1つの事前動作と音声命令に含まれる言語に基づいて、また、判断された入力音声命令の意味と移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、判断された入力音声命令の意味に関する動作を提供する制御部とを含む。

発明を実施するための最良の形態

0012

以下、本発明の好ましい実施形態について添付図面を参照して詳細に説明する。

0013

図1は、本発明の一実施形態による移動端末機100のブロック図である。

0014

移動端末機100は、移動端末機100と無線通信システム間無線通信、又は移動端末機100と移動端末機100が位置するネットワーク間の無線通信を可能にする1つ以上の構成要素を有する無線通信部110を含む。

0015

例えば、無線通信部110は、放送チャネルで外部の放送管理エンティティから放送信号及び/又は放送関連情報を受信する放送受信モジュール111を含む。前記放送チャネルは、衛星チャネル及び地上波チャネルを含む。

0016

さらに、前記放送管理エンティティは、一般的に放送信号及び/又は放送関連情報を送信するシステムを意味する。前記放送関連情報は、放送チャネル、放送番組又は放送サービス提供者に関する情報を含む。例えば、放送関連情報は、DMB(Digital Multimedia Broadcasting)のEPG(Electronic Program Guide)又はDVB−H(DigitalVideo Broadcast−Handheld)のESG(Electronic Service Guide)を含むことができる。

0017

また、前記放送信号は、TV放送信号ラジオ放送信号、及びデータ放送信号だけでなく、TV放送信号又はラジオ放送信号と結合した放送信号も含む。

0018

放送受信モジュール111は、多様な放送システムから伝送される放送信号を受信する。例えば、前記放送システムは、DMB−T(Digital Multimedia Broadcasting−Terrestrial)、DMB−S(DigitalMultimedia Broadcasting−Satellite)、MediaFLO(Media Forward Link Only)、DVB−H(DigitalVideo Broadcast−Handheld)、ISDB−T(Integrated Services Digital Broadcast−Terrestrial)などを含む。放送受信モジュール111は、マルチキャスト信号も受信できる。放送受信モジュール111により受信されたデータは、メモリ160のような適切な装置内に保存される。

0019

無線通信部110は、1つ又は多数のネットワークエンティティ(例えば、基地局、NodeB)と無線信号送受信する移動通信モジュール112も含む。ここで、前記無線信号は、音声、画像、マルチメディア制御シグナリング、及びデータなどを示す。

0020

移動端末機100のインターネット接続サポートするための無線インターネットモジュール113も含まれる。無線インターネットモジュール113は、移動端末機100に内蔵又は外付けされる。

0021

無線通信部110は、近距離通信のための近距離通信モジュール114も含む。近距離通信技術としては、ブルートゥースRFID(Radio Frequency Identification)、赤外線通信(IrDA, infrared DataAssociation)、UWB(Ultra Wideband)、ZigBeeなどが利用できる。

0022

無線通信部110は、移動端末機100の位置を確認又は取得するための位置情報モジュール115も含む。位置情報モジュール115は、関連衛星、ネットワーク構成要素、及びこれらの組み合わせと連動するGPS(Global Positioning System)構成要素を利用して実現される。

0023

さらに、図1に示すように、移動端末機100は、移動端末機100にオーディオ又はビデオ信号を提供するA/V(Audio/Video)入力部120も含む。図に示すように、A/V入力部120は、カメラ121及びマイク122を含む。カメラ121は、静止画像又は動画像などの画像フレームを受信及び処理する。また、マイク122は、前記端末機が通話モード録音モード、及び音声認識モードのような特定モードにあるとき、外部の音響信号を受信した後、処理してデジタルデータに変換する。移動端末機100、特に、A/V入力部120は、前記外部の音響信号を受信する過程で発生する雑音を除去するための多様な雑音除去アルゴリズムを含む。また、A/V入力部120により生成されたデータは、メモリ160内に保存され、出力部150により活用されるか、無線通信部110の1つ又は複数のモジュールを介して伝送される。必要に応じて、2つ又はそれ以上のマイク及び/又はカメラが利用される。

0024

移動端末機100は、関連入力装置の使用者操作に対応する入力データを発生させるユーザ入力部130も含む。ユーザ入力部130は、キーパッドドームスイッチタッチパッド静圧静電)、ジョグホイール、及びジョグスイッチを含む。以下、ユーザ入力部130がタッチスクリーンディスプレイと連動するタッチパッドとして実現される場合の例について説明する。

0025

センシング部140も移動端末機100内に含まれて移動端末機100の多様な状態測定を提供する。例えば、センシング部140は、移動端末機100の開閉状態、移動端末機100の構成要素(例えば、ディスプレイ及びキーボード)の相対的位置、移動端末機100の構成要素又は移動端末機100の位置の変化、移動端末機100への使用者の接触の有無、移動端末機100の方位又は加速減速などを検出する。

0026

例えば、移動端末機100がスライド型である場合、センシング部140は、移動端末機100の摺動部が開状態であるか閉状態であるかを感知できる。他の例として、センシング部140は、電源供給部190による電源供給の有無、インタフェース部170と外部装置間の結合又は接続の有無などを感知する。

0027

また、インタフェース部170は、移動端末機100を外部装置に結合する役割を果たす。前記外部装置は、有/無線ヘッドホン外部充電器電源供給器、データ(例えば、オーディオ、ビデオ、写真など)を保存するための保存装置イヤホン、及びマイクなどを含む。さらに、インタフェース部170は、有/無線データポートカードソケット(例えば、メモリカードSIM(Subscriber Identity Module)カード、UIM(User Identity Module)カード、RUIM(RemovableUser Identity Module)カードなど)、オーディオ入/出力ポート及びビデオ入/出力ポートを使用して構成される。

0028

出力部150は、一般的に移動端末機100の出力要件をサポートする多様な構成要素を含む。移動端末機100は、移動端末機100に関する情報を視覚的に表示するディスプレイモジュール151を含む。例えば、移動端末機100が通話モードである場合、ディスプレイモジュール151は、一般的に発信、通話、及び終了に関する情報を含むユーザインタフェース、又はグラフィックユーザインタフェースを提供する。他の例として、移動端末機100がビデオ通話モード又は撮影モードである場合、ディスプレイモジュール151は、前記モードに関連する映像を付加的に又は選択的に表示する。

0029

さらに、ディスプレイモジュール151は、好ましくはタッチパッドのような入力装置と連動するタッチスクリーンも含む。このような構成によりディスプレイモジュール151が入力装置及び出力装置として作動できる。また、ディスプレイモジュール151は、液晶ディスプレイ(LCD)、薄膜トランジスタ液晶ディスプレイ(TFT−LCD)、有機発光ダイオード(OLED)、フレキシブルディスプレイ、及び3次元ディスプレイを含むディスプレイ技術を利用して実現される。

0030

移動端末機100は、ディスプレイモジュール151を2つ以上備えることもできる。2つのディスプレイが備えられた例として、1つは、内部ディスプレイ(移動端末機が開状態にあるときに見える)であり、他の1つは、外部ディスプレイ(移動端末機が開状態及び閉状態にあるときに見える)である。

0031

図1は、移動端末機100の音響出力要件をサポートする音響出力モジュール152を備える出力部150を示す。音響出力モジュール152は、1つ又は複数のスピーカーブザー、他の音響生成装置、及びこれらの組み合わせを利用して実現される。さらに、音響出力モジュール152は、呼受信モード、呼発信モード、録音モード、音声認識モード、及び放送受信モードを含む多様なモードで動作する。音響出力モジュール152は、特定機能(例えば、呼受信、メッセージ受信、及びエラー)に関連する音響を出力する。また、出力部150は、移動端末機100に関連する特定イベントの発生を通知するための信号を出力するアラーム部153を備える。前記アラームイベントの例としては、呼受信、メッセージ受信、ユーザ入力の受信がある。前記出力の例として、使用者に提供される振動のような触感がある。例えば、アラーム部153は、呼又はメッセージを受信する移動端末機100に反応して振動するように構成される。

0032

他の例として、移動端末機100におけるユーザ入力の受信に反応してアラーム部153が振動を発生することにより、触感フィードバックメカニズムを提供する。さらに、出力部150の構成要素により提供される前記多様な出力は、個別に行われるか、又は前記構成要素の任意の組み合わせを利用して行われる。

0033

メモリ160は、移動端末機100の処理、制御、及び保存要件をサポートするための多様なデータを保存するために使用される。前記データの例として、移動端末機100で動作するアプリケーションのためのプログラム指示、通話履歴(call history)、接触データ電話帳データ、メッセージ、静止画像、動画像などがある。

0034

図1に示すメモリ160は、RAM(Random Access Memory)、SRAM(Static Random Access Memory)、ROM(Read−OnlyMemory)、EEPROM(Electrically Erasable Programmable Read−Only Memory)、EPROM(ErasableProgrammable Read−Only Memory)、PROM(Programmable Read−Only Memory)、磁気メモリフラッシュメモリ磁気もしくは光ディスクカード型メモリ、又はその他の同様のメモリもしくはデータ記憶装置を含む適切な揮発性及び不揮発性メモリもしくは記憶装置のいずれか又は組み合わせを利用して実現される。

0035

移動端末機100は、移動端末機100の全般的な動作を典型的に制御する制御部180も含む。例えば、制御部180は、音声通話データ通信インスタントメッセージ通信、ビデオ通話、カメラ機能、及び録音機能に関連する制御及び処理を行う。図1に示すように、制御部180は、マルチメディア再生のためのマルチメディアモジュール181を備える。マルチメディアモジュール181は、制御部180の一部として構成されるか、制御部180と別途に実現される。

0036

電源供給部190は、移動端末機100の多様な構成要素により利用される電源を供給する。前記電源としては、外部の電源、内部の電源、又はこれらの組み合わせが利用できる。

0037

図2は、本発明の一実施形態による移動端末機100の前面斜視図である。図2に示すように、移動端末機100は、第1ボディー200と、第1ボディー200に対して摺動可能に構成された第2ボディー205とを含む。図1に示すユーザ入力部130は、ファンクションキー210のような第1入力部、キーパッド215のような第2入力部、及びサイドキー245のような第3入力部を含む。

0038

ファンクションキー210は、第1ボディー200に関連し、キーパッド215は、第2ボディー205に関連する。キーパッド215は、使用者が電話をかけること、テキスト又はマルチメディアメッセージを準備すること、移動端末機100を動作させることなどを可能にする多様なキー(例えば、数字文字、及びシンボル)を含む。第1ボディー200は、第2ボディー205に対して摺動して開位置又は閉位置となる。閉状態において、第1ボディー200は、キーパッド215が第1ボディー200により完全に隠れるように第2ボディー205の上部に位置する。開状態において、使用者は、ディスプレイモジュール151及びファンクションキー210だけでなく、キーパッド215にアクセスできる。ファンクションキー210は、使用者による開始、停止、及びスクロールのような命令の入力を容易にする。

0039

移動端末機100は、待ち受けモード(例えば、呼又はメッセージ受信、ネットワーク制御シグナリングの受信及び応答ができるモード)、又は通話モードで動作する。移動端末機100は、閉状態のときは主に待ち受けモードであり、開状態のときは主に通話モードであるが、使用者の希望により他のモードに変更できる。

0040

第1ボディー200は、第1ケース220と第2ケース225とからなり、第2ボディー205は、第1ケース230と第2ケース235とからなる。第1ケース220、230及び第2ケース225、235は、合成樹脂射出して形成することもでき、ステンレススチールSTS)又はチタン(Ti)などの金属材質で形成することもできる。

0041

第1ボディー200と第2ボディー205の一方又は両方の第1ケース及び第2ケース間には、1つ又は複数の中間ケースを配置することもできる。第1ボディー200及び第2ボディー205は、移動端末機100の動作をサポートするために利用される電子部品を内蔵できるサイズに形成される。

0042

第1ボディー200は、カメラ121と、スピーカーとして実現され、ディスプレイモジュール151と相対的に位置する音響出力モジュール152とを含む。カメラ121は、第1ボディー200に対して選択的に配置できるように(例えば、回転、スイベルなど)構成できる。

0043

ファンクションキー210は、ディスプレイモジュール151の下側に隣接して位置する。前述したように、ディスプレイモジュール151は、LCD又はOLEDで実現できる。ディスプレイモジュール151は、タッチパッドがレイヤ構造で重なったタッチスクリーンにより実現されて、使用者の前記タッチスクリーンとの接触(例えば、指、スタイラスなど)に反応して信号を生成する。

0044

第2ボディー205は、キーパッド215に隣接したマイク122と、第2ボディー205の側面に沿って位置し、ユーザ入力部の一種類であるサイドキー245と含む。サイドキー245は、ホットキーとして実現され、移動端末機100の特定機能と連係する。図2に示すように、インタフェース部170は、サイドキー245に隣接し、バッテリー形態の電源供給部190は、第2ボディー205の下部に位置する。

0045

図3は、図2に示す移動端末機100の後面斜視図である。図3を参照すると、第2ボディー205は、カメラ121と、カメラ121に関連するフラッシュ250及びミラー255とを含む。フラッシュ250は、第2ボディー205のカメラ121と連動して動作し、ミラー255は、使用者がカメラ121を利用してセルフ撮影をするとき、使用者の顔などを映してカメラ121の位置づけを容易にする。第2ボディー205のカメラ121は、図2に示すように、第1ボディー200のカメラ121とは反対方向に向ける。

0046

第1ボディー200及び第2ボディー205の各カメラ121は、同一又は異なる容量を有する。例えば、第1ボディー200のカメラ121は、第2ボディー205のカメラ121より低い解像度で動作する。このような構成は、例えば、逆方向リンク周波数容量が限定されるビデオ会議通話時に効果的である。第2ボディー205のカメラ121の高い解像度は、後に高画質の写真を得るのに有用である。

0047

第2ボディー205は、スピーカーとして実現され、第2ボディー205の上部に位置する音響出力モジュール152も含む。第1ボディー200及び第2ボディー205の前記音響出力モジュールは、連動してステレオ出力を提供する。前記音響出力モジュールの1つ又は2つは、スピーカーフォンとして動作するように構成できる。

0048

移動端末機100は、第2ボディー205の上端に位置する放送信号受信用アンテナ260を含む。アンテナ260は、放送受信モジュール111(図1)と連動して機能する。必要に応じて、アンテナ260は、固定されるか、第2ボディー205の内部に収まるように構成される。第1ボディー200の後面は第2ボディー205の前面に位置する該当スライドモジュールと摺動可能に結合するスライドモジュール265を含む。

0049

図示された第1ボディー200及び第2ボディー205の多様な構成要素の配置は必要に応じて変更できる。1つのボディーの一部又は全ての構成要素を他のボディーに実現することもできる。前記構成要素の位置及び相対的位置決めは、図示した位置とは異なってもよい。

0050

図1図3に示す移動端末機100は、有無線通信システム及び衛星通信システムを含み、フレーム又はパケットでデータを伝送する通信システムで動作するように構成される。このような通信システムは、他の無線インタフェース及び/又は物理層を活用する。

0051

例えば、通信システムにより利用可能な無線インタフェースとしては、周波数分割多元接続(Frequency Division Multiple Access:FDMA)、時分割多元接続(Time DivisionMultiple Access:TDMA)、符号分割多元接続(Code Division Multiple Access:CDMA:)、ユニバーサルモバイルテレコミュニケーションシステム(UniversalMobile Telecommunications Systems:UMTS)(特に、LTE(Long Term Evolution)、移動通信用グローバルシステム(GlobalSystem for Mobile Communications:GSM)などが用いられる。以下、説明の便宜のために、CDMAに限定して説明する。しかしながら、本発明は、CDMA無線通信システムを含む全ての通信システムに適用できる。

0052

図4に示すように、CDMA無線通信システムは、複数の移動端末機100、複数の基地局(BS)270、基地局制御部(Base Station Controllers:BSCs)275、及び移動スイッチングセンター(Mobile SwitchingCenter:MSC)280を含む。

0053

MSC280は、公衆交換電話網(Public Switched Telephone Network:PSTN)290とインタフェースで接続されるように構成され、BSCs275ともインタフェースで接続されるように構成される。BSCs275は、バックホールライン(backhaulline)で基地局270と接続される。前記バックホールラインは、例えば、E1/T1、ATM、IP、PPP、Frame Relay、HDSL、ADSL又はxDSLなどのインタフェースの少なくとも1つによって構成される。さらに、図4に示す前記システムは、複数のBSCs275を含む。

0054

それぞれの基地局270は、少なくとも1つのセクターを含み、各セクターは、全方向性アンテナ又は基地局270から放射状の特定方向を指すアンテナを含む。また、各セクターは、ダイバーシティ受信のために2つのアンテナを含む。それぞれの基地局270は、複数の周波数割り当てをサポートするように構成され、各周波数割り当ては、特定スペクトル(例えば、1.25MHz、5MHz)を有する。

0055

セクターと周波数割り当ての交差は、CDMAチャネルと言われる。基地局270は、基地局送受信サブシステム(Base Station Transceiver Subsystem:BTSs)とも言われる。場合によっては、「基地局」という用語は、1つのBSC275及び少なくとも1つの基地局270を合わせたものを意味する。

0056

基地局270はまた、「セルサイト」を示すこともできる。又は、特定基地局270のそれぞれのセクターをセルサイトという。地上波DMB(digital multimedia broadcasting)送信部295は、システム内で動作する移動端末機100に放送する。

0057

移動端末機100の放送用モジュール111(図1を参照)は、DMB送信部295により伝送される放送信号を受信するために備えられる。前述したように、同様の配置が他のタイプのブロードキャスト及びマルチキャストシグナリングのために実現できる。

0058

さらに、図4は、複数のGPS衛星300を示す。衛星300は、複数の移動端末機100の一部又は全ての位置把握を容易にする。図4においては2つの衛星を示すが、位置情報は、それより多数の衛星によっても、それより少数の衛星によっても取得できる。

0059

移動端末機100の位置情報モジュール115(図1を参照)は、所望の位置情報を取得するために衛星300と連動する。しかしながら、GPS追跡技術に加えて又はGPS追跡技術の代わりに利用される追跡技術のような他のタイプの位置検出技術が代案として実現されてもよい。GPS衛星300の一部又は全ては、選択的に又は追加的に衛星DMB伝送を提供するように構成される。

0060

さらに、無線通信システムが一般的に動作する過程で、基地局270は、多様な移動端末機100から逆方向リンク信号のセットを受信する。ここで、移動端末機100は、呼接続中であるか、メッセージ送受信中であるか、又は他の通信動作を実行中である。

0061

特定基地局270により受信された逆方向リンク信号のそれぞれは、特定基地局270内で処理され、前記処理の結果として生成されたデータは、関連BSC275に送信される。BSC275は、基地局270間のソフトハンドオフを含む呼リソース割り当て機能及び移動性管理機能を提供する。

0062

また、BSC275は、前記受信したデータをMSC280に送信し、MSC280は、PSTN290とのインタフェース接続のために追加的なルーティングサービスを提供する。PSTN290は、MSC280にインタフェース接続し、MSC280は、BSC275にインタフェース接続する。BSC275は、移動端末機100に順方向リンク信号のセットを伝送するようにBS270を制御する。

0063

以下の説明において、前述したように構成された移動端末機100に適用可能な制御方法について様々な実施形態に基づいて説明する。しかしながら、下記の実施形態は、独立して又は互いに組み合わせて実現することができる。さらに、以下の説明において、ディスプレイモジュール151は、タッチスクリーンを含む。また、前記タッチスクリーン又は前記ディスプレイのスクリーンは、参照番号「400」で示される。

0064

図5は、本発明の一実施形態による移動端末機の制御方法を示すフローチャートである。以下の説明においては図1も参照する。図に示すように、制御部180は、移動端末機の音声認識機能がアクティブになったか否かを判断する(S101)。前記音声認識機能がアクティブになると(S101でYes)、制御部180は、使用者による音声命令の入力(以下「音声命令」という)を受信する(S102)。その後、使用者により入力された音声命令が認識されると(S102でYes)、制御部180は、その認識された音声命令の意味を判断する(S103)。

0065

本発明による移動端末機の音声認識機能をアクティブにするために、使用者は、前記移動端末機の特定ボタンを選択するか、又はタッチスクリーンの特定部分をタッチする。使用者による音声認識機能の物理的アクティブ化は、使用者が前記移動端末機を制御するために音声命令を使用しようとすることをより意識できるので、より有利である。すなわち、使用者は、まず前記移動端末機の物理的操作を行わなければならないため、前記移動端末機に音声命令を入力しようとすることを直感的に認識するので、より明瞭に又はゆっくり発話することにより特定機能をアクティブにすることができる。

0066

従って、使用者がより明瞭に又はゆっくり発話するため、例えば、前記音声命令を正確に認識する確率が高くなる。すなわち、前記音声認識機能のアクティブ化は、前記移動端末機に対する発話により行われるのではなく、前記移動端末機のボタンの物理的操作により行われる。

0067

また、制御部180は、使用者が前記特定ボタン又は前記タッチスクリーンの特定部分をタッチした回数、使用者が前記特定ボタン又は前記タッチスクリーンの特定部分をタッチしていた時間などに基づいて、前記音声認識機能のアクティブ化を開始又は終了する。使用者は、本発明により提供される適切なメニューオプションを利用して、制御部180が前記音声認識機能をアクティブにする方法を設定することもできる。例えば、使用者は、1)前記音声アクティブ化ボタンが選択された回数(X)に基づく音声認識機能のアクティブ化の設定、2)前記音声アクティブ化ボタンが選択されていた時間(X)に基づく音声認識機能のアクティブ化の設定、3)前記ボタン(X、Y)が選択されたときの音声認識機能のアクティブ化の設定などを含む前記移動端末機のメニューオプションを選択することができる。次に、使用者は、制御部180が前記音声認識機能のアクティブ化を判断する方法を可変的に設定するために、前記X及びYの値を入力することができる。従って、本発明の一実施形態によれば、使用者が移動端末機の音声認識機能に積極的に関与できるようにすることにより、制御部180が使用者の音声命令に対応する機能を正確に判断する確率を高め、使用者の必要に応じて前記音声認識機能を調節できるようにする。

0068

制御部180は、指定された前記ボタンがタッチ又は選択されている間、前記音声認識機能のアクティブ状態を維持し、指定された前記ボタンが解除されると、前記音声認識機能を停止する。また、制御部180は、指定された前記ボタンがタッチ又は選択されてから所定時間の間、前記音声認識機能のアクティブ化を維持し、前記所定時間が経過すると、前記音声認識機能を停止又は終了することができる。他の実施形態において、制御部180は、前記音声認識機能のアクティブ状態が維持されている間、受信された音声命令をメモリ160に保存することができる。

0069

制御部180は、前記音声認識機能が終了するや否や前記音声命令の意味を判断することもでき、使用者による音声命令の入力と同時に前記音声命令の意味を判断することもできる。また、制御部180は、前記音声命令の意味を判断するために、前記入力された音声命令で使用された単語、キーワード、文章構造などを分析し、前記音声命令の内容又は意味を判断することができる。

0070

さらに、制御部180は、前記音声命令の意味を判断するために、前記移動端末機で提供される機能、サービス、又はメニューなどに関する情報を、メモリ160のデータベースに保存することができる。さらに、使用者の音声命令を正確に感知する確率を高めるために、学習又は人工知能方法を用いて前記データベースに保存された情報をアップデートすることができる。前記移動端末機で行われる事前動作も前記データベースに保存することができる。例えば、使用者は、前記移動端末機を開いて他の動作を行う前に電子メールを確認することができる。

0071

従って、制御部180は、使用者の音声命令の意味を判断する確率を高めるために、このような事前動作を利用することができる。また、使用者は、移動端末機を最初にターンオンするか又は開くとき、同一の音声命令を入力することがある。このような事前動作は、前記入力された音声命令と共に保存し、制御部180が入力命令の意味を判断するために利用することができる。

0072

従って、前記移動端末機で行われる事前動作は、前記移動端末機のアクティブ状態(例えば、待機モード時、通話時、テレビ電話時、電子メールセッション時、インスタントメッセージセッション時、端末機を閉じるときなど)を含み、また使用者により入力される事前命令をも含む。例えば、音楽を聞くために、使用者は、移動端末機を予め閉じ、その後に「play my music」という命令を入力する。制御部180は、使用者により入力された音声命令の判断の助けになるように、移動端末機の状態(すなわち、閉じた状態)を利用することができる。

0073

ここで、図5の説明に戻る。制御部180は、前記データベースの情報を利用して前記音声命令の意味を判断すると、対応する結果値を出力する(S104)。すなわち、前記結果値は、認識された前記音声命令に対応する機能を実行するか、又は特定構成要素を制御するための制御信号を含むことができる。また、前記結果値は、認識された前記音声命令に関するメニューを表示するためのデータ情報に該当するものであってもよい。

0074

また、使用者は、特定メニュー(例えば、image capturing、voice call、message transmissionなど)を正確に示す音声命令を入力するか、又は自然言語(例えば、showme photo、save batteryなど)を使用して音声命令を入力することができる。前記自然言語命令は、特定メニューの正確な指示を含んでもよく含んでいなくてもよい。

0075

また、前記自然言語は、(人工的に作られた)人工言語とは異なり、日常生活で人々が一般的に使用する言語であって、自然言語処理アルゴリズムを用いて処理できる。

0076

その後、制御部180は、図5に示すように、使用者により入力された音声命令を認識できるか否かを判断する(S105)。

0077

例えば、制御部180は、特定閾値(例えば、80%)以上の確率で音声命令を認識できるか否かを判断することができる。前記特定閾値を満たす音声命令の意味を判断できない場合、制御部180は、付加的なエラー処理を行い(S107)、ステップS103〜S105を繰り返す。

0078

前記特定閾値(例えば、80%又はそれ以上の特定認識率より大きい値)を満たす音声命令を認識できる場合、制御部180は、前記特定閾値を満たす複数のメニューを表示する(S106)。使用者は、表示されたメニューを視覚的に見ることができ、その表示されたメニューのいずれか1つを選択することができる。

0079

このような特徴は、使用者が前記音声認識機能に積極的に関与できるようにするため、特別な利点となる。より詳細には、制御部180は、使用者に音声命令の意味を正確に判断できないことを通知するメッセージを表示又は出力するのではなく、特定閾値(例えば、80%)より高い、正確性のある確率を有する複数のメニューを出力する。例えば、使用者が「save battery」という音声命令を入力したが、(例えば、背景雑音受信障害などにより)制御部180が「save」という音声命令のみ判断できた場合、制御部180は前記キーワード「save」に関する特定メニュー又はオプションを表示できる。すなわち、制御部180は写真メニュー、バッテリメニュー、電子メールメニューなどを表示できるが、これはこれらメニューが「save」の特徴を含んでいるからである。従って、使用者は表示された複数のメニューから適切なメニューを選択することができる。

0080

また、前述したように、制御部180は、入力された音声命令の意味の判断において、移動端末機の事前動作を利用することができる。制御部180は、前記入力された音声命令の意味の判断の助けになるように、前記移動端末機の物理的状態を利用することができる。例えば、制御部180は、前記入力された音声命令の意味を決定するとき、バッテリの状態(例えば、低バッテリ状態)に関する情報を有益に利用することができる。

0081

また、使用者の確認(ACK)の受信タイプとしては、メッセージ、音声、又はメニューの表示位置若しくは形態(形状或いはサイズ)などを使用することができ、その応答タイプとしては、使用者音声、特定ボタン、又はタッチ入力などがある。さらに、前述したように、前記入力された音声命令の認識率が特定閾値より低い場合、制御部180はエラー処理動作を行うことができる(S107)。

0082

また、前記エラー処理動作時、制御部180は、使用者から音声命令をさらに受信するか、又は前述したように、所定の認識率若しくは確率以上の複数のメニューを表示することができる。さらに、制御部180は、所定の認識率以上の認識された機能又はメニューの数を判断する。所定の認識率以上の認識された機能又はメニューが特定数より少ない場合(例えば、1つの機能又は1つのメニューしかない場合)、制御部180は前記1つの機能又はメニューを自動的に実行する。

0083

次に、図6(a)〜(c)は、本発明の一実施形態による移動端末機の音声認識機能のアクティブ化方法を説明するための表示画面を示す図である。前述したように、本発明は、前記音声認識機能が使用者の物理的操作により開始されるタイミングを使用者が判断できるようにする。従って、使用者は、使用者の周辺環境(例えば、使用者が静かな環境で発話しているか否かなど)、使用者の音声のトーン及びレベル使用者自身が使用する自然言語又はその他のタイプの言語などをより意識する。その結果、使用者は音声命令を入力するときにさらに気をつけるようになり、制御部180が前記音声命令の意味を正確に判断する確率を高めることができる。

0084

また、使用者が移動端末機のボタンをタッチ又は選択することにより行われる音声認識機能の手動アクティブ化は、バッテリの電力消費を低減するという利点がある。すなわち、前記音声認識機能は、移動端末機の様々なリソース消費するが、前記音声認識機能のアクティブ状態が待機状態(又はアイドル状態)で持続的に動作すると、移動端末機の全体的な電力も持続的に消費される。

0085

より詳細には、制御部180が、(使用者の特定ボタンの選択ではなく、)使用者の移動端末機に対する発話により、前記音声認識機能をアクティブにするアクティブ信号を受信するように構成された場合、制御部180は、アクティブ状態で前記音声認識機能を持続的に動作させ、使用者の(前記音声認識の開始を意味する)発話を待たなければならない。前記音声認識機能をアクティブにするための使用者の音声入力を持続的に待つこのような動作は、移動端末機の利用可能な電力を持続的に減少させる。

0086

従って、移動端末機の電力消費及びリソース消費を抑えるために、制御部180は、前記音声認識機能の開始及び終了を制御することが好ましい。例えば、図6(a)に示すように、移動端末機のユーザ入力部130は、使用者が前記音声認識機能を開始又は停止するためにタッチできるように、ディスプレイモジュール151上にソフトボタン350を含むことができる。ここで、ソフトボタン350は、ボタン形状でもよく、特定形状アイコンでもよい。さらに、ソフトボタン350は、例えば図6(a)に示すように、移動端末機の側部に配設されたハードボタン351で代替することもできる。

0087

他の例として、図6(b)に示すように、ディスプレイモジュール151上にボタン又はアイコンを表示するのではなく、ディスプレイモジュール151の任意の部分を前記音声認識機能のアクティブ化及び非アクティブ化のために使用することができる。さらに他の例として、図6(c)に示すように、特定サウンドを移動端末機のマイク122から入力し、前記音声認識機能のアクティブ化及び終了を制御することができる。

0088

より詳細には、前記特定サウンドは、使用者の拍手音などの特定レベル以上の衝撃音でもよい。制御部180は、マイク122から入力されたサウンドのレベルを判断するためのアルゴリズム又は回路を用いて、前記衝撃音を検出する。すなわち、前記衝撃音を検出するためのアルゴリズム又は回路は、前記音声認識機能に比べて前記移動端末機のリソース又は電力の消費が少なく、かつ予め設定されている特定レベル以上のサウンドを検出するように構成される。

0089

使用者は、前記音声認識機能をアクティブにするために使用される特定衝撃音を設定することができる。例えば、使用者は、本発明の移動端末機により提供される適切なメニューオプションを選択した後、2回又は3回拍手し、その拍手音が前記音声認識機能のアクティブ化のために使用されることを制御部180に通知することができる。また、使用者は、前記音声認識機能をアクティブにするためのサウンドとして、その他のサウンドを設定することもできる。

0090

さらに、制御部180は、前記音声認識機能を複数のモードで駆動することができる。例えば、制御部180は、特定レベル以上のサウンドが前記音声認識機能をアクティブにする第1モードと、音声命令が入力されてその内容又は意味が判断される第2モードとに区分して、前記音声認識機能を駆動する。すなわち、制御部180は、第1モードで特定レベル以上のサウンドが検出されると、第2モードを実行して前記音声認識機能をアクティブにする。

0091

また、他の実施形態によれば、制御部180は、使用者から身体情報を受信し、音声認識機能のアクティブ化を開始する。より詳細には、前記身体情報は、使用者の手信号又はジェスチャを含む。前記使用者の身体情報を検出するためには、センシング部140を使用することができる。さらに他の実施形態によれば、制御部180は、無線装置により近距離又は遠距離(remote area)の無線信号を受信し、音声認識機能のアクティブ化を開始する。

0092

また、制御部180は、無線通信部110により無線信号を受信し、センシング部140により使用者の手信号又はジェスチャを受信することができる。このような実施形態においては、前記音声認識機能をアクティブにするための信号を受信する無線通信部110、ユーザ入力部130、及びセンシング部140をまとめて、アクティブ信号入力部ともいう。

0093

さらに、前述したように、移動端末機の電力消費及びリソース消費を低減するために、制御部180は、使用者から終了信号を受信して所定時間が経過すると、前記音声認識機能を終了又は停止する。このために、前記終了信号は、前記音声認識機能のアクティブ化を開始する方式と同一又は類似の方式で、ボタンのタッチ若しくは押圧、タッチスクリーンの特定部分のタッチ、衝撃音、無線信号、又は使用者からの身体情報に対応する。

0094

より詳細には、制御部180は、前記音声認識機能のアクティブ化を開始し、特定期間では前記音声認識機能のアクティブ状態を維持し、前記特定期間が経過すると前記音声認識機能のアクティブ状態を自動的に終了することができる。また、制御部180は、ボタン又はタッチが持続的に入力されている間、前記音声認識機能のアクティブ状態を維持し、前記入力が解除されると、前記音声認識機能のアクティブ状態を終了することができる。他の実施形態によれば、制御部180は、特定期間が経過しても使用者が前記端末機に対して発話しないと、前記音声認識機能を終了することができる。

0095

次に、図7Aは、本発明の一実施形態による移動端末機の音声認識方法を示すフローチャートである。以下の説明においては図1も参照する。図7Aに示すように、音声認識機能が入力されると(S201)、制御部180は、入力された音声命令をメモリ160に保存し(S202)、その音声命令を特定音声認識アルゴリズムにより処理する(S203)。

0096

前記音声認識アルゴリズムにより、制御部180は、前記入力された音声命令をテキスト情報に変換し、その変換されたテキスト情報をメモリ160の任意の領域に保存する(S204)。その後、制御部180は、前記テキスト情報を処理してその音声命令の意味を判断する。

0097

前記音声命令の意味の判断は、前記音声命令の入力と同時に行うことが好ましいが、これに限定されるものではなく、前述したように、前記音声命令の入力が終わった後に行ってもよい。例えば、使用者が予め設定されている特定期間に音声命令を入力しないと、制御部180は、使用者が前記音声命令の入力を完了したと判断し、前記音声命令の意味を判断する過程を開始することができる。

0098

次に、図7Aに示すように、制御部180は、前記音声命令の意味を判断するために、前記テキスト情報に含まれる特定単語又はキーワードを検出し(S205)、前記検出された単語又はキーワードと前記移動端末機の特定データベースに保存されている各種機能及びメニューに関する情報とを比較する(S206)。前記データベースに同一又は類似の単語又はキーワードが保存されていると、その対応する単語又はキーワードの数により前記音声命令の認識率を判断する(S207)。

0099

ここで、前記認識率を判断するための情報は、前記音声命令に含まれる単語又はキーワードの数に関する情報に限定されるものではない。すなわち、キーワード毎に認識率を判断するための値が異なるように設定することにより、単語又はキーワードの数が少なくても認識率の高いキーワードにより認識率が変化することがある。

0100

前記音声認識率は、前記認識された音声命令の意味が正確か否かを示す情報である。より詳細には、特定メニューの名称が正確に入力された場合、100%の認識率が得られるが、音声命令が自然言語で入力された場合は、その音声命令に意味のない単語が含まれたり、同じ単語の発音使用者毎に異なったりするため、事実上100%の認識率を得ることは難しい。

0101

従って、本発明の一実施形態においては、認識率が特定値(例えば、80%)以上であると正確であると判断する。類似の認識率と判断された意味が複数である場合(すなわち、認識率は類似しているが、音声命令を異なる意味に解釈できる場合)、制御部180は、所定の閾値以上の認識率に対応する実行可能な複数のメニューを表示し、使用者がその表示されたメニューのいずれか1つを選択できるようにする(S208)。

0102

また、制御部180は、前記メニューの表示において、認識率が高い順に前記メニューを表示することができる。例えば、図7Bに示すように、最も高い認識率を有するメニューアイコンを表示画面410の中心に表示することもでき、最も高い認識率を有するメニューアイコンをより大きく、より濃く、又は強調して表示画面420に表示することもできる。さらに、前記最も高い認識率を有するメニューは点滅させて表示することもできる。

0103

認識率を高めるために、制御部180は、使用者により頻繁に選択されるメニューの場合、その選択回数を学習又は記憶し、その学習した情報を特定メニューの認識率を変更するために使用することができる。従って、その後に同一又は類似の発音又は内容で入力される音声命令に対する認識率が変化することがある。

0104

図7Cは、本発明の一実施形態による移動端末機の音声認識方法を説明するための表示画面の一例を示す図である。例えば、使用者が自然言語で「I want to see my pictures」という音声命令を入力すると、制御部180は、前記音声命令を構成する文章から意味のある単語又はキーワード(例えば、see、picture)を検出し、前記移動端末機のデータベースに保存されている情報と比較する。

0105

前記検出された単語又はキーワードが意味のある単語であるか否かは、発話の部分により判断することもでき、予め設定されているキーワードのみを意味のある単語として検出することもできる。また、制御部180は、前記意味のある単語又はキーワードに対応する情報を前記データベースから検索することができる。

0106

前記データベースは、前記移動端末機の各種メニュー又は機能に関する複数のキーワード情報を保存することができる。例えば、「photo album」に対応するキーワード情報として、正確な「photo album」に加えて、カメラメニュー下位メニューなどの複数のキーワード情報である「photopicture」「video」「album」などを保存することができる。

0107

図7Cの表示画面510に示すように、音声命令と一致するメニュー又は機能に関する情報がない場合、制御部180は、特定値より高い認識率を有する複数のメニューを表示する。このとき、制御部180は、前述したように、最も高い認識率を有するメニューアイコン521を他の表示アイテムよりも大きく又は濃く表示することができる。

0108

また、図7Cの表示画面520は、特定値より高い認識率を有するメニューが1つしかない場合、制御部180がその特定値より高い認識率を有する該当メニュー機能を自動的に実行することを示している。このとき、制御部180は、意味が判断された前記音声命令を、テキスト若しくはその他のタイプのメッセージ、又は音声メッセージとして出力することができる。

0109

図7Dは、本発明の一実施形態による移動端末機の音声認識方法を説明するための表示画面の他の例を示す図である。本実施形態においては、使用者が表示画面610をタッチすることにより音声認識機能をアクティブにした後、表示画面620に示すように自然言語で「Enable battery saving」という音声命令を入力する。次に、制御部180は、前記音声命令を構成する文章から意味のある単語又はキーワード(例えば、battery、saving)を検出し、前記データベースに保存されている情報と比較してその意味を判断する。

0110

しかしながら、本例においては、前記音声命令に正確に対応するメニューが存在しないため、制御部180は、表示画面630に示すように、バッテリの電力消費を低減する機能に関する複数のメニュー(例えば、backlight、standby screen、background imageなど)を表示する。

0111

前述したように、認識率が高い順に複数のメニューをサイズ、位置、色、及び明暗の少なくとも1つを変えて表示するか、又は強調して表示することができる。例えば、使用者選択度の高いメニューの認識率を他のメニューと差別化して表示することができる。

0112

図8は、本発明の一実施形態による移動端末機の音声認識方法に使用されるデータベースシステムを示すブロック図である。前記データベースは音声命令の意味を判断するための情報を保存するものであり、各情報の特性によって複数のデータベースを構成することができる。前記各情報の特性に応じて構成された各データベースは、制御部180の制御下で持続的な学習過程によりアップデートすることができる。

0113

前記データベースの学習過程とは、使用者により発音された音声をそれに該当する単語と対応させることをいう。例えば、使用者は「fifteen」と発音したが制御部180が「fifty」と認識した場合、使用者が「fifty」を「fifteen」に修正することにより、その後は制御部180が同発音を「fifteen」と認識できるようにする。

0114

従って、前記学習過程により、複数の音声情報を前記データベースの各情報に対応させることができる。例えば、前記データベースは、マイクから入力された使用者の音声がフォーマット音節、又は形態素単位で認識されるようにする音声情報を保存する第1データベース161と、制御部180が前記認識された音声情報に基づいて音声命令の全体的な意味を判断するようにする情報(例えば、文法、発音の正確度、文章構造など)を保存する第2データベース162と、前記移動端末機の機能又はサービスを実行するためのメニューに関する情報を保存する第3データベース163と、使用者が前記判断された音声命令の意味を確認できるように前記移動端末機が出力するメッセージ又は音声情報を保存する第4データベース164とを含む。

0115

前記各データベースには、音声(発音)情報、その音声(発音)情報に対応するフォーマット、音節、形態素、単語、キーワード、又は文章情報などが保存される。従って、制御部180は、複数のデータベース161〜164の少なくとも1つを利用して、音声認識動作と音声命令の意味を判断する動作を行い、その判断された音声命令の意味に該当する機能又はサービスに関するメニューを実行することができる。

0116

図9は、本発明の一実施形態による移動端末機で認識された音声命令が行われていることを使用者に通知するための情報を表示する表示画面を示す図である。制御部180は、音声命令が認識されるか、又は音声命令の意味が判断されると、その結果値を出力する。前記結果値は、前記移動端末機の特定機能を実行するための制御信号でもよく、前記認識された命令に関するメニュー情報でもよく、前記機能の実行時に出力されるデータ情報でもよい。図9によれば、制御部180は、情報(例えば、インジケータ)500を出力して、前記入力された音声命令が認識されたことを使用者に通知する。

0117

また、前述した実施形態は、使用者の音声命令の認識に関するものであるが、本発明は、前記音声命令が認識されている間に使用者がさらなる入力機能を実行できるように適用することもできる。例えば、音声認識とタッチ入力、音声認識とボタン入力、又は音声認識とタッチ/ボタン入力を同時に行うことができる。

0118

また、制御部180は、特定モード、メニュー、又は特定動作状態で音声認識機能が実行されないようにすることができる。また、音声認識機能が適用されていることを示すオーディオ情報(例えば、音声告知若しくは案内情報)又はビデオ情報(例えば、図9の情報500)を、音声認識モード、メニュー、又は動作状態で表示することができる。さらに、ヘルプ情報を出力することにより、音声認識機能が適用されていることを使用者に通知することもできる。

0119

また、前述した多様な実施形態は、例えば、コンピュータソフトウェアハードウェア、又はこれらの組み合わせを利用したコンピュータ可読媒体で実現される。ハードウェア的な実現によれば、前述した実施形態は、ASICs(application specific integrated circuits)、DSPs(digital signalprocessors)、DSPDs(digital signal processing devices)、PLDs(programmable logicdevices)、FPGAs(field programmable gate arrays)、プロセッサ、制御部、マイクロ制御部、マイクロプロセッサ、ここに説明された前記機能を実行するように設計された他の電気的ユニット、又はこれらの選択的な組み合わせの少なくとも1つを利用して実現される。

0120

ソフトウェア的な実現によれば、ここに説明された前記実施形態は、前述した機能又は動作のうちの1つ又は複数を行う各手順又は機能のような別個ソフトウェアモジュールと共に実現される。ソフトウェアコードは、適切なプログラム言語で作成されたソフトウェアアプリケーションにより実現される。また、ソフトウェアコードは、メモリ(例えば、メモリ160)に保存され、制御部又はプロセッサ(例えば、制御部180)により実行される。

0121

さらに、移動端末機100は、多様な異なる構造で実現される。前記構造の例としては、折り畳み型、スライド型、ストレート型回転型スイング型、及びこれらの組み合わせがある。

0122

本発明の精神や範囲から外れない限り本発明の多様な変更及び変形ができることは、当業者には明らかである。従って、本発明の請求の範囲内で行われるあらゆる変更及び変形、並びに請求の範囲の均等物は本発明の請求の範囲に含まれる。

0123

以上のように、本発明の好ましい実施形態を用いて本発明を例示してきたが、本発明は、この実施形態に限定して解釈されるべきものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。

図面の簡単な説明

0124

本発明の一実施形態による移動端末機のブロック図である。
本発明の一実施形態による移動端末機の前面斜視図である。
図2の移動端末機の後面斜視図である。
本発明の一実施形態による図1図3の移動端末機が動作可能な無線通信システムを示す図である。
本発明の一実施形態による移動端末機の制御方法を示すフローチャートである。
本発明の一実施形態による移動端末機の音声認識機能のアクティブ化方法を説明するための表示画面を示す図である。
本発明の一実施形態による移動端末機の音声認識方法を示すフローチャートである。
本発明の一実施形態による移動端末機の音声認識率に基づいて表示されたメニューを含む表示画面の例を示す図である。
本発明の一実施形態による移動端末機の音声認識方法を説明するための表示画面の一例を示す図である。
本発明の一実施形態による移動端末機の音声認識方法を説明するための表示画面の他の例を示す図である。
本発明の一実施形態による移動端末機の音声認識方法に使用されるデータベースシステムを示すブロック図である。
本発明の一実施形態による移動端末機で音声命令が行われていることを使用者に通知するメッセージを表示する表示画面を示す図である。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 東芝テック株式会社の「 電子機器及び出力装置」が 公開されました。( 2020/04/09)

    【課題】情報出力に利便性を向上させることが可能な電子機器及び出力装置を提供する。【解決手段】外部の出力装置との間で無線通信を行う通信手段と、前記通信手段とのペアリングが完了したペアリング装置の識別子と... 詳細

  • パナソニックIPマネジメント株式会社の「 翻訳装置、その制御方法およびプログラム」が 公開されました。( 2020/04/09)

    【課題】ユーザが適宜に加工した定型文を登録することができ、さらに、登録した定型文を再度加工した上で音声出力を行うことができるようにする。【解決手段】予め登録された複数の定型文が表示されている状態で、ユ... 詳細

  • 株式会社コロプラの「 プログラム、方法および情報処理装置」が 公開されました。( 2020/04/09)

    【課題】ユーザの仮想体験を改善することができるプログラム、方法及び情報処理装置を提供する。【解決手段】プロセッサに、仮想空間を定義するステップと、仮想空間に仮想視点とコリジョン領域と操作オブジェクトと... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ