図面 (/)

技術 テキスト入力処理装置及び同装置におけるモード制御方法

出願人 株式会社東芝
発明者 桃崎浩平
出願日 1998年5月29日 (22年8ヶ月経過) 出願番号 1998-149205
公開日 1999年12月10日 (21年2ヶ月経過) 公開番号 1999-338669
状態 未査定
技術分野 文書処理装置 キーボード等からの入力 音声入出力 文書処理装置
主要キーワード 情報システム装置 番地部分 モード切り替え指令 コマンド音声 連続数字 動作ルール Shiftキー モード切り替え処理
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1999年12月10日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (8)

課題

複数の入力手段の間のモードの整合性が自動的に保たれ、ユーザが各々の入力手段に対してモードの切り替えを行わなくて済むようにする。

解決手段

キー入力処理部11及び音声入力処理部12を備えたテキスト入力処理装置10において、キー入力処理部11内のキー入力制御部63と音声入力処理部12内の音声入力制御部76との間で制御情報の授受が可能な統合制御部15を設け、キー入力制御部63または音声入力制御部76が自身のモードの切り替え必要とする場合、または自身のモードの切り替え行った場合に出力される制御情報(モード指令またはモード通知)を統合制御部15で受け取って、当該制御情報をもとに入力制御部63,76を通して入力処理部11,12のモードを、または制御情報の出力元以外の入力制御部を通して対応する入力処理部のモードを制御する。

概要

背景

近時、キーボードマウスペンなどを使用して文章を入力する手段を持つ装置に関して、言語的な知識を用いて入力の前処理を行うための様々な方法やシステム構成考案され実用化されている。

この種の装置では、言語的な入力を無効化し前処理を行わないで入力させるモードとの切り替えや、対象となる言語の切り替えの機能が提供されることが多い。例えば、日本語仮名漢字変換を用いたキーボード入力では、日本語入力のON/OFFキー操作で切り替えたり、漢字変換をしないで固定入力するモードを選択したりすることができる。

一方、音声を使用して文章を入力する手段を持つ装置においても、同様に少なくとも1つの入力言語を予め選択し、言語処理を用いた入力が行われる。従来、これら複数種入力手段を備えた装置においては、それぞれの入力手段が独立して提供され、適切な制御が行われていなかった。

概要

複数の入力手段の間のモードの整合性が自動的に保たれ、ユーザが各々の入力手段に対してモードの切り替えを行わなくて済むようにする。

キー入力処理部11及び音声入力処理部12を備えたテキスト入力処理装置10において、キー入力処理部11内のキー入力制御部63と音声入力処理部12内の音声入力制御部76との間で制御情報の授受が可能な統合制御部15を設け、キー入力制御部63または音声入力制御部76が自身のモードの切り替え必要とする場合、または自身のモードの切り替え行った場合に出力される制御情報(モード指令またはモード通知)を統合制御部15で受け取って、当該制御情報をもとに入力制御部63,76を通して入力処理部11,12のモードを、または制御情報の出力元以外の入力制御部を通して対応する入力処理部のモードを制御する。

目的

本発明は上記事情を考慮してなされたものでその目的は、複数の入力手段の間のモードの整合性が自動的に保たれ、ユーザが各々の入力手段に対してモードの切り替えを行わなくて済むテキスト入力処理装置及び同装置におけるモード制御方法を提供することにある。

効果

実績

技術文献被引用数
1件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

音声認識機能を有する入力手段を含む、言語処理を用いた複数の入力手段を備えたテキスト入力処理装置において、前記各入力手段のモードの制御を、他の入力手段と連動して行う統合制御手段を具備することを特徴とするテキスト入力処理装置。

請求項2

音声認識機能を有する入力手段を含む、言語処理を用いた複数の入力手段を備えたテキスト入力処理装置において、前記各入力手段の有効化及び無効化に関するモード、前記各入力手段における言語処理による文章入力機能の有効化及び無効化に関するモード、前記各入力手段によって得られる処理結果の文字種切り替えに関するモード、前記各入力手段における言語処理の対象とする言語の選択に関するモード、及び前記各入力手段における言語処理または結果出力変換処理に用いる状況情報の選択に関するモードの少なくとも1つのモードの制御を、他の入力手段と連動して行う統合制御手段を具備することを特徴とするテキスト入力処理装置。

請求項3

前記各入力手段は、自身のモードの切り替えを必要とする場合、または自身のモードの切り替え行った場合に、その旨の制御情報を出力する入力制御手段を備えており、前記統合制御手段は、前記制御情報をもとに前記各入力手段、または当該制御情報の出力元入力手段を除く入力手段のモードを制御することを特徴とする請求項1または請求項2記載のテキスト入力処理装置。

請求項4

前記モードの制御に関する制御情報の入力が可能な非言語処理を用いた入力手段を更に具備し、前記言語処理を用いた各入力手段は、自身のモードの切り替えを必要とする場合、または自身のモードの切り替え行った場合に、その旨の制御情報を出力する入力制御手段を備えており、前記統合制御手段は、前記非言語処理を用いた入力手段により前記制御情報が入力された場合には、当該制御情報をもとに前記言語処理を用いた各入力手段のモードを制御し、前記非言語処理を用いた入力手段の入力制御手段から前記制御情報が出力された場合には、前記言語処理を用いた各入力手段、または当該制御情報の出力元入力手段を除く入力手段のモードを制御することを特徴とする請求項1または請求項2記載のテキスト入力処理装置。

請求項5

音声認識機能を有する入力手段を含む、言語処理を用いた複数の入力手段、及び前記各入力手段のモードの制御を、他の入力手段と連動して行う統合制御手段を備えたテキスト入力処理装置と、前記テキスト入力処理装置の処理結果を受け取って利用する情報処理装置であって、入力開始時に必要な入力の種類に応じたモード切り替えを要求する制御情報を前記統合制御手段に出力する情報処理装置とを具備し前記統合制御手段は、前記情報処理装置から前記制御情報が出力された場合には、当該制御情報をもとに前記各入力手段のモードを制御することを特徴とする情報システム装置

請求項6

音声認識機能を有する入力手段を含む、言語処理を用いた複数の入力手段を備えたテキスト入力処理装置におけるモード制御方法であって、前記各入力手段のモードの制御を、他の入力手段と連動して行うようにしたことを特徴とするモード制御方法。

請求項7

音声認識機能を有する入力手段を含む、言語処理を用いた複数の入力手段により実現されるテキスト入力処理のためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記各入力手段のモードの制御を、他の入力手段と連動して行う処理をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。

技術分野

0001

本発明は、音声認識機能を有する入力手段を含む、言語処理を用いた複数の入力手段を備えたテキスト入力処理装置及び同装置におけるモード制御方法に関する。

背景技術

0002

近時、キーボードマウスペンなどを使用して文章を入力する手段を持つ装置に関して、言語的な知識を用いて入力の前処理を行うための様々な方法やシステム構成考案され実用化されている。

0003

この種の装置では、言語的な入力を無効化し前処理を行わないで入力させるモードとの切り替えや、対象となる言語の切り替えの機能が提供されることが多い。例えば、日本語仮名漢字変換を用いたキーボード入力では、日本語入力のON/OFFキー操作で切り替えたり、漢字変換をしないで固定入力するモードを選択したりすることができる。

0004

一方、音声を使用して文章を入力する手段を持つ装置においても、同様に少なくとも1つの入力言語を予め選択し、言語処理を用いた入力が行われる。従来、これら複数種の入力手段を備えた装置においては、それぞれの入力手段が独立して提供され、適切な制御が行われていなかった。

発明が解決しようとする課題

0005

上記したように、複数種の文章入力手段を有する従来の装置では、各々の入力手段が独立して提供され、各々の入力手段に対して個別にモードの切り替えを行うため、入力手段間のモードの整合がとれなくなったり、操作が煩わしいという問題があった。

0006

本発明は上記事情を考慮してなされたものでその目的は、複数の入力手段の間のモードの整合性が自動的に保たれ、ユーザが各々の入力手段に対してモードの切り替えを行わなくて済むテキスト入力処理装置及び同装置におけるモード制御方法を提供することにある。

課題を解決するための手段

0007

本発明は、音声認識機能を有する入力手段を含む、言語処理を用いた複数の入力手段を備えたテキスト入力処理装置において、上記各入力手段のモードの制御を、他の入力手段と連動して行う統合制御手段を備えたことを特徴とする。

0008

このような構成においては、複数の入力手段の間のモードの整合性が自動的に保たれるため、ユーザが各々の入力手段に対してモードの切り替えを行う必要がない。また、切り替え操作を行うための入力手段を自由に選択できる。

0009

また本発明は、上記モードの制御として、上記各入力手段の有効化及び無効化の制御、上記各入力手段における言語処理による文章入力機能の有効化及び無効化の制御、上記各入力手段によって得られる処理結果の文字種の切り替えの制御、上記各入力手段における言語処理の対象とする言語の選択の制御、及び上記各入力手段における言語処理または結果出力変換処理に用いる状況情報の選択の制御の少なくとも1つを対象としたことをも特徴とする。

0010

各入力手段の有効化及び無効化の制御をモード制御の対象とした場合、各入力手段の間の有効/無効の整合性が自動的に保たれる。入力手段の有効化/無効化の制御モードの例としては、日本語キー入力及び英語キー入力が可能なキー入力手段(キーボード入力を扱う入力手段)であれば、(日本語キー入力を有効とする)日本語キー入力ON状態または(英語キー入力を有効とする)英語キー入力ON状態(入力手段有効)と、日本語キー入力OFF状態で且つ英語キー入力OFF状態(入力手段無効)がある。また、日本語キー入力及び英語キー入力が可能な音声入力手段であれば、(日本語テキスト音声入力を有効とする)日本語テキスト音声入力ON状態または(英語テキスト音声入力を有効とする)英語テキスト音声入力ON状態(入力手段有効)と、日本語テキスト音声入力OFF状態で且つ英語テキスト音声入力OFF状態(入力手段無効)がある。

0011

同様に、各入力手段における言語処理による文章入力機能の有効化及び無効化の制御をモード制御の対象とした場合、各入力手段の間の言語処理による文章入力機能の有効/無効の整合性が自動的に保たれる。入力手段における言語処理による文章入力機能の有効化/無効化の制御モードの例としては、日本語キー入力及び英語キー入力が可能なキー入力手段であれば、日本語キー入力ON/OFF状態、英語キー入力ON/OFF状態があり、日本語テキスト音声入力及び英語テキスト音声入力が可能な音声入力手段であれば、日本語テキスト音声入力ON/OFF状態、英語テキスト音声入力ON/OFF状態がある。

0012

同様に、各入力手段によって得られる処理結果の文字種の切り替えの制御をモード制御の対象とした場合、処理結果の文字種を入力手段によらず一致させることができる。同様に、各入力手段における言語処理の対象とする言語の選択の制御をモード制御の対象とした場合、各入力手段の間の言語の整合性が自動的に保たれる。同様に、各入力手段における言語処理または結果出力の変換処理に用いる状況情報の選択をモード制御の対象とした場合、各入力手段が共通の状況情報を得ることができるので、異なる入力手段の処理結果の整合性が保たれる。

0013

また、上記文字種の切り替えは、言語処理が日本語を対象とする場合には、平仮名、片仮名、ローマ字アルファベットのうち複数の文字種の中から行うとよい。ここで文字種の切り替えとして、片仮名、ローマ字、アルファベット、数字のうちの少なくとも1つの文字種に関する、全角半角の切り替えを行うとよい。

0014

ここでは、複数の入力手段の間のモードの整合性が自動的に保たれ、処理結果の文字種を入力手段によらず一致させることができる他、キーボードにおけるShiftやCapsLockのような簡便な切り替え手段を他の入力手段でも利用することができる。

0015

また、上記文字種の切り替えは、言語処理が中国語を対象とする場合には、漢字ピンイン、注音符号のうち複数の文字種の中から行うとよい。ここで文字種の切り替えとして、アルファベット、ローマ字、ピンインのうちの少なくとも1つの文字種に関する、大文字小文字の切り替えを行うとよい。

0016

また、上記状況情報の選択は、氏名、郵便番号、地名・住所電話番号、日付・時刻、数字のうち複数の中から行うとよい。また本発明は、上記各入力手段に、自身のモードの切り替え必要とする場合、または自身のモードの切り替え行った場合に、その旨の制御情報を出力する入力制御手段を設け、上記統合制御手段が、上記入力手段内の入力制御手段からの制御情報をもとに各入力手段、または当該制御情報の出力元入力手段を除く他の入力手段のモードを制御するようにしたことをも特徴とする。

0017

このような構成においては、切り替え操作を行うための入力手段によらずに、複数の入力手段の間のモードの整合性を自動的に保つための制御が簡単に実現できる。

0018

また本発明は、上記言語処理を用いた入力手段とは別に、上記モードの制御に関する制御情報の入力が可能な非言語処理を用いた入力手段を設け、この非言語処理を用いた入力手段により制御情報が入力された場合には、当該制御情報をもとに上記言語処理を用いた各入力手段のモードを制御するようにしたことをも特徴とする。

0019

このような構成においては、言語処理を用いた複数の入力手段の切り替え操作を外部から別の手段で行うことが可能になる。ここで、上記言語処理を用いた各入力手段内の入力制御手段から出力される制御情報として、予め設定された動作ルールに基づいて変換された制御情報を用いるならば、複数の入力手段の間のモードの種類が完全に一致しない場合にも対応できる。このような例としては、キー入力手段における日本語キー入力ON状態(日本語キー入力を有効とするモード)と、音声入力手段における日本語テキスト音声入力ON状態(日本語テキスト音声入力を有効とするモード)とがある。

0020

また上記制御情報が、予め設定された制御用コマンド発声音声認識して生成されるものであってもよい。この場合、音声コマンドにより、複数の入力手段のモードを適切に切り替えることができる。

0021

また、上記複数の入力手段の1つとして、キーボードから入力された文字情報を漢字に変換する、日本語の仮名漢字変換機能を持つ入力手段を用いた構成とするならば、キーボードと音声入力のモードを適切に切り替えることで、これらを併用した入力が円滑に行える。

0022

また、上記複数の入力手段の1つとして、ペン、マウスまたはタッチパネルから入力された手書き文字データを認識する文字認識機能を持つ入力手段を用いた構成とするならば、携帯情報機器等の手書き文字入力を備えた情報処理装置において、手書き文字入力と音声入力のモードを適切に切り替えることにより、これらを併用した入力が円滑に行える。

0023

また本発明は、上記のテキスト入力処理装置と、当該入力処理装置の処理結果を受け取って利用する情報処理装置とにより情報処理システム装置を構成し、上記情報処理装置には、入力開始時に必要な入力の種類に応じたモード切り替えを要求する制御情報をテキスト入力処理装置内の上記統合制御手段に出力する機能を持たせることで、情報処理装置から統合制御手段に制御情報が出力された場合には、当該制御情報をもとに統合制御手段が上記各入力手段のモードを制御するようにしたことをも特徴とする。ここでのモード制御は、画面上で情報を入力するための領域(入力フィールド)毎に予め設定されたモード情報と、現在の入力領域の識別情報とにより、入力領域が変更された(切り替えられた)ときに行われるようにするとよい。

0024

このような構成においては、複数の入力手段の間のモードの整合性を保ちながら、情報処理装置において必要な入力情報に応じてモードが自動的に切り替えられる。

発明を実施するための最良の形態

0025

以下、本発明の実施の形態につき図面を参照して説明する。図1は本発明の一実施形態に係るテキスト入力処理装置を備えた情報システム装置の構成を示すブロック図である。

0026

図1において10はテキスト入力処理装置である。このテキスト入力処理装置10は、キーボードKBからの入力を処理するキー入力処理部11と、マイクロホンMCからの音声による入力を処理する音声入力処理部12と、キー入力処理部11におけるキー入力処理結果と音声入力処理部12における音声入力処理結果を統合出力する統合出力部13と、グラフィック表示ポインティング入力機能を備えた制御入力処理部14と、全体の制御を行う統合制御部15とから構成される。

0027

キー入力処理部11は、ローマ字や仮名によるキーボード入力を用いて日本語キー入力を行う仮名漢字変換機能を実現するもので、キーボードKBからの入力(キーボード入力)を行うキー入力部61と、キー入力部61によるキーボード入力に対して日本語の仮名漢字変換を行うキー変換部62と、上記キーボード入力に従ってキー変換部62の制御を行うキー入力制御部63とから構成される。

0028

音声入力処理部12は、音声認識により日本語文章を入力するディクテーション機能を実現するもので、マイクロホンMCから音声を入力する音声入力部71と、音声入力部71による音声入力をコマンドとして認識処理するコマンド音声認識部72と、上記音声入力を日本語として認識処理する日本語音声認識部73と、上記音声入力を外国語、例えば英語として処理する英語音声認識部74と、上記各音声認識部72〜74の音声認識結果を対象としてモードに応じた文字種変換等(カタカナ、ローマ字等への変換、全角半角変換、大文字小文字変換等)を行う認識結果変換部75と、上記音声入力部71、各音声認識部72〜74及び認識結果変換部75の制御を行う音声入力制御部76とから構成される。

0029

テキスト入力処理装置10には、当該テキスト入力処理装置10の処理結果を入力として受ける情報処理装置20が接続されている。このテキスト入力処理装置10及び情報処理装置20により情報システム装置が構成されている。

0030

次に、図1の構成の動作を、図2乃至図7フローチャートを適宜参照して説明する。なお、図2はキー入力処理部11の動作を説明するためのフローチャート、図3は音声入力処理部12の動作を説明するためのフローチャート、図4は統合制御部15の動作を説明するためのフローチャート、図5図3中のステップS32の処理手順を説明するためのフローチャート、図6図3中のステップS42の処理手順を説明するためのフローチャート、図7図3中のステップS43の処理手順を説明するためのフローチャートである。

0031

まずキー入力処理部11は、初期状態においては日本語キー入力OFFのモードに設定される(ステップS20)。キー入力処理部11では、統合制御部15によるモード切り替えにより、或いはユーザによるキーボードKBのモードキー操作により、日本語テキスト入力のON/OFFの他、幾つかの入力モードの切り替えを行うことができるようになっている。

0032

キー入力処理部11(のキー入力制御部63)に対して統合制御部15からモード切り替え(モード設定)のための指令モード指令)が与えられていない場合(ステップS21)、ユーザによるキーボードKBの操作が有効となり、キー入力部61により入力されたキー入力データがキー入力制御部63に渡される(ステップS22)。

0033

キー入力部61によるキー入力データには、文字データの他に、モードの切り替えを行うためのデータがある。このため、キーボード入力によりキー入力処理部11のモードを設定することもできる。

0034

キー入力制御部63は、キー入力部61からキー入力データが渡された場合、当該キー入力部61から渡されたキー入力データがモードの切り替えを行うためのデータであるか否かを判定する(ステップS23)。

0035

もし、キー入力データがモード切り替えを行うデータでない場合、つまり文字データの場合、この例のように日本語キー入力OFFのモードでは、当該文字データは(キー変換部62による仮名漢字変換の対象とならずに)そのまま統合出力部63に渡され、情報処理装置20に出力される(ステップS26,S27,S29)。

0036

これに対し、キー入力データがモードキー操作に従うモード切り替えデータの場合には、後述するようにキー入力制御部63から統合制御部15に対して当該データの示すモードへの切り替えを行うことを通知し、自身のモードを当該モードに切り替える(ステップS24,S25)。

0037

一方、音声入力処理部12は、初期状態においてはテキスト音声入力OFF、コマンド音声認識のみONのモードに設定される(ステップS30)。音声入力処理部12では、統合制御部15によるモード切り替えにより、或いはユーザによるコマンド音声入力より、日本語テキスト音声入力のON/OFFの他、幾つかの入力モードの切り替えを行うことができるようになっている。

0038

音声入力処理部12(の音声入力制御部76)に対して統合制御部15からモード指令が与えられていない場合(ステップS31)、ユーザによるマイクロホンMCからの音声入力が有効となり、音声入力部71により入力された音声データが音声入力制御部76に渡される(ステップS33)。

0039

この例のようにコマンド認識のみONの状態では(ステップS34)、音声入力部71により入力された音声データは音声入力制御部76からコマンド音声認識部72に渡され、コマンドの発声のみが認識される(ステップS35)。ここでは音声によるテキスト入力は行われない。

0040

もし、音声認識部72によりコマンド(モード切り替えのコマンド)が認識されたなら、後述するように音声入力制御部76から統合制御部15に対して当該コマンドの示すモードへの切り替えを要求するモード指令を送る(ステップS37)。

0041

モード統合制御部15は、(図2中のステップS24により)キー入力制御部63からのモード切り替え通知があると(ステップS51)、キー入力処理部11をモード指令対象から除外した後(ステップS52)、当該通知に基づいて音声入力処理部12のモードを決定し(ステップS54)、音声入力制御部76ヘモード切り替え指令を送る(ステップS55)。

0042

また、統合制御部15は、(図3中のステップS37により)音声入力制御部76からのモード切り替え指令があると、或いは制御入力処理部14からのモード切り替え指令があると(ステップS53)、当該指令に基づいてキー入力処理部11及び音声入力処理部12のモードを決定し(ステップS54)、キー入力制御部63及び音声入力制御部76ヘモード切り替え指令を送る(ステップS55)。

0043

前記したように、キー入力制御部63、音声入力制御部76及び統合制御部15では、日本語テキスト入力(日本語キー入力、日本語テキスト音声入力)のON/OFFの他、幾つかの入力モードの切り替えを行うことができる。

0044

扱うことのできる入力モードとして、通常の漢字仮名混じり入力モードの他に、固定入力モード(平仮名、片仮名、英数)がある。また、全角半角入力の切り替え、アルファベットの大文字小文字の切り替えも扱うことができる。

0045

ここで、キー入力部61に「漢字」キー等の日本語キー入力ONにするデータが入力されたとする(ステップS22)。キー入力制御部63では、キー入力部61から渡されたデータがモード切り替えを行うためのデータであることを判定し(ステップS23)、統合制御部15に対して日本語テキスト入力ON状態にする旨のモード通知を行う(ステップS24)。またキー入力制御部63は、キー入力処理部11を日本語キー入力ON状態にする(ステップS25)。

0046

統合制御部15は、キー入力制御部63からのモード通知に従い、音声入力制御部76に日本語テキスト音声入力ON指令を送る(ステップS51,S52,S54,S55)。これを受けて音声入力制御部76は、音声入力処理部12を日本語テキスト音声入力ON状態にする(ステップS31,S32,S81,S82,S86,S94)。

0047

次に、音声入力部71に「音声入力開始」等のコマンドの発声が入力されたものとする。この場合、入力された音声データは音声入力制御部76からコマンド音声認識部72に渡されて、当該音声データがモード切り替えを行うためのコマンドであることが認識される(ステップS31,S33〜S36)。これにより音声入力制御部76は、統合制御部15に対して日本語テキスト入力ON指令を送る(ステップS37)。

0048

統合制御部15は、音声入力制御部76から日本語テキスト入力ON指令(モード指令)を受け取ると、キー入力制御部63に日本語キー入力ON指令を、音声入力制御部76に日本語テキスト音声入力ON指令を、それぞれ送る(ステップS51,S53〜S55)。

0049

キー入力制御部63は統合制御部15から日本語キー入力ON指令を受け取ると、キー入力処理部11を日本語キー入力ON状態にする(ステップS21,S25)。一方、音声入力制御部76は統合制御部15から日本語テキスト音声入力ON指令を受け取ると、音声入力処理部12を日本語テキスト音声入力ON状態にする(ステップS31,S32)。

0050

次に、制御入力処理部14のグラフィック表示上に表示された、日本語テキスト入力ONにするボタンが、ポインティング入力により指定されたものとする。この場合、制御入力処理部14から統合制御部15に日本語テキスト入力ON指令が送られる。これを受けて統合制御部15は、上記した「音声入力開始」等のコマンドの発声が入力されて音声入力制御部76から日本語テキスト入力ON指令が送られた場合と同様に、キー入力制御部63に日本語キー入力ON指令を、音声入力制御部76に日本語テキスト音声入力ON指令を、それぞれ送る(ステップS51,S53〜S55)。

0051

すると、この統合制御部15から送られる指令により、キー入力処理部11が日本語キー入力ON状態になり(ステップS21,S25)、音声入力処理部12が日本語テキスト音声入力ON状態になる(ステップS31,S32)。

0052

さて、キー入力処理部11が日本語キー入力ON状態にあるときに、キー入力部61に文字データが入力されたものとする。キー入力制御部63は入力された文字データをキー変換部62に渡す(ステップS22,S23,S26,S27)。キー変換部62はキー入力された文字データに対する仮名漢字変換処理を行う(ステップS28)。キー変換部62の処理結果データはキー入力制御部63から統合出力部13に渡されて(ステップS29)、情報処理装置20に出力される。

0053

また、音声入力処理部12が日本語テキスト音声入力ON状態にあるときに音声入力部71により音声データが入力された場合、当該音声データは日本語音声認識部73に渡されて、認識される(ステップS33,S34,S38,S39)、この日本語音声認識部73の音声認識結果データは音声入力制御部76を通して認識結果変換部75に渡され、音声入力処理部12のモードに応じて変換される(ステップS42,S43)。認識結果変換部75の処理結果データは音声入力制御部76から統合出力部13に渡されて(ステップS44)、情報処理装置20に出力される。

0054

次に、キー入力処理部11及び音声入力処理部12におけるモードの切り替えと、認識結果変換部75におけるモードに応じた変換処理について説明する。まず、キー入力部61に、平仮名固定入力モードに切り替えを行うためのデータが入力されたものとする。この場合、先の日本語キー入力ON状態への切り替えと同様にして、キー入力処理部11は平仮名固定入力モードとなると共に、当該モードが統合制御部15に通知される(ステップS24,S25)。

0055

すると、統合制御部15から音声入力制御部76に平仮名入力モードを指定するモード指令が送られて(ステップS51,S53〜S55)、音声入力処理部12が当該モード指令で指定されたモードに設定される(ステップS32)。ここでは、文字種が平仮名の入力モード(平仮名入力モード)に設定される(ステップS81,S82,S86,S94〜S96)。

0056

音声入力処理部12が平仮名入力モードに設定されている状態では、「イロハのイ」と発声して平仮名の「い」1文字を出力したり(いろはモード)、認識結果が「日本語」で読みが「にほんご」の場合に読みを平仮名で「にほんご」などとして出力したりすることができる(ステップS121、S122,S126〜S129)。

0057

以上は、音声入力部71に「平仮名入力」等のコマンドの発声が入力された場合も同様である。この場合、音声入力処理部12が平仮名入力モードとなり、統合制御部15を介してキー入力処理部11も平仮名固定入力モードに設定される。

0058

また、制御入力処理部14のグラフィック表示上に表示された、平仮名固定入力モードにするボタンが、ポインティング入力により指定された場合も同様に、統合制御部15を介して、キー入力処理部11が平仮名固定入力モードに、音声入力処理部12が平仮名入力モードに、それぞれ設定される、同様にして、例えばキー入力処理部11が片仮名固定入力モードになると、音声入力処理部12も片仮名入力モードに設定され(ステップS95,S96)、音声認識結果の読みが片仮名で出力される(ステップS128,S130)。

0059

また、キー入力処理部11と音声入力処理部12が半角入力モードになると、音声認識結果の読みが例えば「にほんご」の場合であればと、半角片仮名に変換されて半角の「ニホンゴ」のように出力される(ステップS130〜S132)。

0060

また、キー入力処理部11と音声入力処理部12が英数人力モードになると、音声認識結果の読みが例えば「にほんご」の場合であれば、ローマ字に変換されて「nihongo」のように出力される(ステップS126,S133,S134)。このモードでは、音声認識結果が「ABC」(読みが「えーびーしー」)であれば、つまり設定されている入力モードの文字種に一致する英数字であれば、単に全角半角変換のみが行われて「ABC 」のように出力される(ステップS123)。

0061

ローマ字変換を行う際のローマ字綴りの方式(訓令式、ヘボン式長音の扱い等)は、予め環境設定することにより選択するか、入力時に変換候補表示を行ってユーザに選択させることができる。例えば、音声認識結果の読みが「ふちゅう」のときの「hutyuu」「fuchuu」「fuchu」等を選択できる。

0062

また本実施形態では、CapsLockキーShiftキーによりキー入力処理部11が大文字モードになると、音声入力処理部12も大文字モードとなり、音声認識結果の出力が大文宇に変換される(ステップS124またはS135)。

0063

キー入力処理部11が日本語キー入力OFF状態に戻されると、統合制御部15を介して音声入力処理部12も日本語テキスト音声入力OFF状態にされる(ステップS81,S82,S83,S84,S85)。

0064

次に、本発明に直接関係するテキスト入力処理装置10と、その処理結果を入力として受け取る情報処理装置20とを組み合わせた情報システム装置の動作について説明する。

0065

以下の説明では、煩雑さを避けるために、統合制御部15からキー入力処理部11(内のキー入力制御部63)及び音声入力処理部12(内の音声入力制御部76)に送られるモード指令と、キー入力処理部11及び音声入力処理部12のモードの各々について、必要に応じて同一の用語を使用する。例えばキー入力制御部63に対する日本語キー入力ON指令と、音声入力制御部76に対する日本語テキスト音声入力ON指令は、日本語テキストON指令と表現し、キー入力処理部11における日本語キー入力ON状態と、音声入力処理部12における日本語テキスト音声入力ON状態は、日本語テキストON状態と表現する。

0066

情報処理装置20は、入力開始時に、要求する入力の種類に応じて、統合制御部15ヘモード切り替え指令を送る。ここでは、画面上で情報を入力するための領域(入力フィールド)毎に予め設定されたモード情報と、現在の入力領域の識別情報とにより、入力領域が変更された(切り替えられた)ときに、情報処理装置20から統合制御部15ヘモード切り替え指令が送られる。

0067

例えば要求する入力がテキストでない場合は、情報処理装置20は統合制御部15へテキスト入力OFF指令を送る。これを受けて統合制御部15からキー入力制御部63及び音声入力制御部76に対応するモード指令(テキスト入力OFF指令)が送られる(ステップS51,S53〜S55)。これにより、キー入力処理部11はキー入力OFF状態に、音声入力処理部12はテキスト音声入力OFF状態にされる(ステップS21,S22、ステップS31,S32)。

0068

次に、要求する人力が英語のテキストの場合は、情報処理装置20から統合制御部15に英語テキストON指令が送られ、統合制御部15からキー入力制御部63及び音声入力制御部76に対応するモード指令が送られる(ステップS51,S53〜S55)。これによりキー入力処理部11は英語キー入力ON状態、日本語キー入力OFF状態にされる(ステップS21,S22)。一方、音声入力処理部12では、予めユーザが環境設定することにより言語とモードが選択される(ステップS86,S87,S90,S91)。

0069

ユーザが日本語による音声認識を選択し設定した場合には、音声入力処理部12は日本語テキスト入力ON状態で半角英数人力モードにされる(ステップS87〜S89,S92)。

0070

同様に英語に設定した場合には、音声入力処理部12は英語テキスト入力ON状態にされる(ステップS87,S88,S90〜S92)。この状態では、音声入力部71により入力された音声データは、英語音声認識部74に渡される(ステップS33,S34,S38,S40,S41)。

0071

日本語も英語も選択されていない場合は、テキスト入力OFF状態にされる(ステップS88,S90,S93)。次に、日本語のふりがなを入力するときなど、要求する入力が片仮名の場合は、情報処理装置20から統合制御部15に日本語テキスト入力ON指令と片仮名入力モード指令が送られ、当該統合制御部15を介してキー入力処理部11と音声入力処理部12が日本語テキスト入力ON状態で片仮名入力モードにされる。

0072

同様に、要求する入力が氏名の場合は、情報処理装置20から統合制御部15に日本語テキスト入力ON指令と氏名入力モード指令が送られ、当該統合制御部15を介してキー入力処理部11と音声入力処理部12が日本語テキスト入力ON状態で氏名入力モードにされる。この氏名入力モードなど、言語、文字種とは関係しない入力モードは、例えば音声入力処理部12では、キー入力処理部11及び音声入力処理部12での言語処理または結果出力の変換処理に用いる状況情報としての、氏名、郵便番号、地名・住所、電話番号、日付・時刻、数字のうち、情報処理装置20の要求に応じて統合制御部15により指定される状況情報を選択することにより設定される(ステップS97,S98)。これはキー入力処理部11においても同様である。

0073

氏名入力モードが設定されている場合、キー入力処理部11のキー変換部62では氏名を優先した仮名漢字変換が行われ、音声入力処理部12の日本語音声認識部73では氏名入力用の言語処理が行われる(ステップS114,S115)。

0074

同様に地名・住所入力モードの場合、音声入力処理部12の日本語音声認識部73では、地名や住所に対応した音声認識が行われる。例えば、「はんのうし」の発声に対して「反応し」ではなく「飯能市」が出力される(ステップS101,S102,S103)。また、番地部分については、「の」の発声を「−」(ハイフン)に置き換える処理も行われる(ステップS102,S107,S108)。このことは、キー入力処理部11のキー変換部62における漢字変換でも同様である。

0075

次に、要求する入力が日本の7桁郵便番号で半角の場合は、情報処理装置20から統合制御部15に英語テキスト入力ON指令と郵便番号入力モード指令が送られる。この場合、統合制御部15を介してキー入力処理部11は英語テキスト入力ON状態にされる。また音声入力処理部12では、環境設定により音声認識の言語として日本語が選択されている場合、日本語テキスト入力ON状態で半角英数人力モードに設定され、更に郵便番号入力モードに設定される。

0076

音声入力処理部12が日本語テキスト入力ON状態で郵便番号入力モードに設定されている場合、日本語音声認識部73では郵便番号入力用の言語処理が行われる。これにより、例えば「イチレイゴノ、ハチレイレイイチ」の発声を、「105−8001」として出力することができる(ステップS104,S106〜S108)。

0077

一方、要求する入力が上記と同様に日本の7桁郵便番号で半角の場合でも、音声入力処理部12において環境設定により音声認識の言語として英語が選択されている場合には、音声入力処理部12は英語テキスト入力ON状態にされ、更に郵便番号入力モードにされる、音声入力処理部12が英語テキスト入力ON状態で郵便番号入力モードに設定されている場合、英語音声認識部74により郵便番号入力用の言語処理が行われる。これにより、例えば「one−oh−five,eiqht−zero−zero−one」の発声を「105−8001」として出力することができる。

0078

同様に、要求する入力が電話番号の場合、音声入力処理部12では環境設定で選ばれた言語で電話番号に適した音声認識が行われ、認識結果が変換出力される(ステップS105〜S108)。

0079

また、要求する入力が日付・時刻の場合には、音声入力処理部12の(日本語音声認識部73または英語音声認識部74での)音声認識結果について日付・時刻としての数字の範囲の検定が行われ(ステップS109,S110)、しかる後に認識結果の変換出力処理が行われる(ステップS111,S112)。

0080

その他、一般の数字の場合には、音声入力処理部12では連続数字用の音声認識が行われ、認識結果が変換出力される(ステップS113,S108)。これらの処理結果は統合出力部13を通して情報処理装置20に送られる。る。

0081

以上に述べたように本実施形態におけるテキスト入力処理装置10では、複数の入力手段、即ちキー入力処理部11及び音声入力処理部12の間の様々なモード(ON/OFF及び言語の切り替えを含む)の整合性が自動的に保たれるため、ユーザが各々の入力手段に対して個々にモードの切り替えを行う必要がない。また、テキスト入力処理結果を入力として受け取る情報処理装置20においても、個々の入力手段に対してモードの切り替えのための制御を行うことなく、効率的な入力要求が可能となる。

0082

また、従来音声認識機能を持つ入力手段(音声入力処理部12)では利用しにくかった、平仮名、片仮名、ローマ字等の固定入力モードが、他の入力手段(キー入力処理部11)と同様に提供されるようになる。また、文字情報としては言語依存度の低い数字等の入力を目的とする場合であっても、音声入力と併用する場合には言語の選択を行うことが望ましく、その他のモードについても同様に適用することが可能である。

0083

以上のキー入力処理部11、音声入力処理部12、統合出力部13、制御入力処理部14及び統合制御部15の処理、特に入力処理部11,12のモードの制御を、統合制御部15が入力処理部11,12内の入力制御部63,76との間で制御情報(モード指令、モード通知)を授受することにより、モード切り替えが発生する、或いは発生した他の入力処理部12,11と連動して行う処理は、当該処理をコンピュータに実行させるためのプログラムを記録した、CD−ROMフロッピーディスクメモリカード等の記録媒体を当該コンピュータに装着して、当該記録媒体に記録されているプログラムをコンピュータで読み取り実行させることによっても実現される。また、プログラムを記録した記録媒体の内容が、通信回線等を介してコンピュータにダウンロードされるものであっても構わない。

0084

なお、前記実施形態では、キー入力処理部11(内のキー入力制御部63)は内部的にモード切り替えを行うと共に統合制御部15に対してモード切り替え通知を行う場合(この場合、キー入力処理部11は統合制御部15によるモード指令の対象外となる)について説明したが、音声入力処理部12と同様にモード切り替え指令の送出のみを行い、統合制御部15からの指令に基づいてモード切り替え処理を行う構成としてもよい。一方、音声入力処理部12については、キー入力処理部11と同様に内部的にモード切り替えを行うと共に、統合制御部15に対してモード切り替え通知を行うように構成してもよい。

0085

また、前記実施形態では、キーボードと音声の2つの入力手段を組み合わせた場合について説明したが、ペンによる手書き入力その他と音声の入力手段の組み合わせでもよい、また、3つ以上の入力手段を組み合わせて構成してもよい。

0086

また、音声認識は単語を認識の最小単位とする場合について説明したが、音韻を単位とする認識であっても構わない。また、複数の入力手段が各々個別の言語処理を行う場合について説明したが、複数の入力手段を統合した言語処理を行うようにしておき、各々の入力手段に応じて同様の制御を行うようにしてもよい。

0087

また、日本語の仮名漢字変換と日本語の音声認識について説明したが、対象とする言語は日本語に限らない。例えば、中国語のピンインや五字形等を用いた中文漢字入力と中国語の音声認識であっても構わない。中国語における固定入力モードでは、音声認識結果をピンインや注音符号による発音表記で出力されるようにし、ピンインの場合は大文字・小文字等の選択ができるようにしてもよい。

0088

本発明は、情報処理装置におけるテキスト入力のための手段の構成方法として有効であり、パーソナルコンピュータソフトウェアワードプロセッサ装置、携帯情報機器等に幅広利用可能である。

発明の効果

0089

以上詳述したように本発明によれば、各入力手段のモードの制御を、他の入力手段と連動して行うようにしたので、複数の入力手段の間のモードの整合性が自動的に保たれ、ユーザが各々の入力手段に対してモードの切り替えを行わなくて済む。

図面の簡単な説明

0090

図1本発明の一実施形態に係るテキスト入力処理装置を備えた情報システム装置の構成を示すブロック図。
図2同実施形態におけるキー入力処理部11の動作を説明するためのフローチャート。
図3同実施形態における音声入力処理部12の動作を説明するためのフローチャート。
図4同実施形態における統合出力部13の動作を説明するためのフローチャート。
図5図3中のステップS32の音声入力モード設定処理を説明するためのフローチャート。
図6図3中のステップS42の音声認識結果変換処理を説明するためのフローチャート。
図7図3中のステップS43の文字種変換処理を説明するためのフローチャート。

--

0091

10…テキスト入力処理装置
11…キー入力処理部
12…音声入力処理部
13…統合出力部
14…制御入力処理部
15…統合制御部
20…情報処理装置
61…キー入力部
62…キー変換部
63…キー入力制御部
71…音声入力部
72…コマンド音声認識部7
73…日本語音声認識部
74…英語音声認識部
75…認識結果変換部
76…音声入力制御部
KB…キーボード
MC…マイクロホン

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ