図面 (/)

技術 データ入力装置、データ入力方法、プログラム及び車載機

出願人 パナソニックIPマネジメント株式会社
発明者 柏本和俊
出願日 2014年2月24日 (6年0ヶ月経過) 出願番号 2014-032688
公開日 2015年9月3日 (4年6ヶ月経過) 公開番号 2015-158563
状態 特許登録済
技術分野 航行(Navigation) 音声認識
主要キーワード キー入力デバイス 文字列入力装置 音声入力モード 辞書生成 入力切替 表示画 認識対象語 生成過程
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2015年9月3日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (5)

課題

入力済み語句発話を不要とし、認識対象語絞り込むことにより音声認識の精度を向上させたデータ入力装置を提供することを目的とする。

解決手段

動的音声認識辞書生成部1006は、音声認識辞書1009に格納された語句から文字列入力部1001から入力された文字列と先頭が一致する語句を抽出し、抽出した語句から複数の語句に共通する共通語句を除いた差分語句を格納した動的音声認識辞書1010を生成する。音声認識部1007は、ユーザの発話を動的音声認識辞書1010を用いて認識する。入力文字列確定部1004は、認識した差分語句を含む入力文字列候補を入力文字列として確定する。

概要

背景

従来の手入力による文字列入力装置音声認識機能を併用したデータ入力装置としては、手入力により入力された文字から入力される文字列候補予測し、予測した文字列候補に認識対象語を絞って音声認識を行うものが知られている(例えば特許文献1参照)。

概要

入力済み語句発話を不要とし、認識対象語を絞り込むことにより音声認識の精度を向上させたデータ入力装置を提供することを目的とする。動的音声認識辞書生成部1006は、音声認識辞書1009に格納された語句から文字列入力部1001から入力された文字列と先頭が一致する語句を抽出し、抽出した語句から複数の語句に共通する共通語句を除いた差分語句を格納した動的音声認識辞書1010を生成する。音声認識部1007は、ユーザの発話を動的音声認識辞書1010を用いて認識する。入力文字列確定部1004は、認識した差分語句を含む入力文字列候補を入力文字列として確定する。

目的

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

文字列を入力する文字列入力部と、音声を入力する音声入力部の二つの入力部と、文字列を表示する表示部と、音声認識辞書とを備えるデータ入力装置であって、前記音声認識辞書に格納された語句から前記文字列入力部から入力された文字列と先頭が一致する語句を抽出し、抽出した語句から複数の語句に共通する共通語句を除いた差分語句を格納した動的音声認識辞書を生成する動的音声認識辞書生成部と、前記文字列入力部から入力された文字列と先頭が一致する語句を差分語句を強調して前記表示部に表示する表示制御部と、前記音声入力部により入力された音声を前記動的音声認識辞書生成部が生成した動的音声認識辞書を用いて音声認識を行う音声認識部と、前記音声認識部の認識結果である語句を含む前記表示部に表示された、入力された文字列と先頭が一致する語句を入力文字列として確定する入力文字列確定部とを有するデータ入力装置。

請求項2

音声認識部が、動的音声認識辞書、音声認識辞書の順に辞書を用いて音声認識を行う請求項1に記載のデータ入力装置。

請求項3

入力部を車両の走行状態に基づき文字列入力部から音声入力部へ切り替え入力切替部を備えた請求項1または請求項2の何れか1項に記載のデータ入力装置。

請求項4

動的音声認識辞書生成部が、文字列入力部により文字が入力される度に動的音声認識辞書を生成する請求項1から請求項3の何れか1項に記載のデータ入力装置。

請求項5

請求項1から請求項4の何れか1項に記載されたデータ入力装置が確定した文字列を入力とする車載機

請求項6

文字列を入力する文字列入力部と、文字列を表示する表示部と、音声を入力する音声入力部と、音声認識辞書とを備えるデータ入力装置のデータ入力方法であって、前記音声認識辞書に格納された語句から前記文字列入力部から入力された文字列と先頭が一致する語句を抽出し、抽出した語句から複数の語句に共通する共通語句を除いた差分語句を格納した動的音声認識辞書を生成するステップと、前記文字列入力部から入力された文字列と先頭が一致する語句を差分語句を強調して前記表示部に表示するステップと、前記音声入力部により入力された音声を前記動的音声認識辞書を用いて音声認識を行うステップと、前記音声認識の認識結果である語句を含む前記表示部に表示された、入力された文字列と先頭が一致する語句を入力文字列として確定するステップ、を有するデータ入力方法。

請求項7

請求項6に記載のデータ入力方法をコンピュータに実行させるためのプログラム

技術分野

0001

本発明はタッチパネルキー操作等の手入力による文字列入力装置音声認識機能を併用したデータ入力技術に関する。

背景技術

0002

従来の手入力による文字列入力装置と音声認識機能を併用したデータ入力装置としては、手入力により入力された文字から入力される文字列候補予測し、予測した文字列候補に認識対象語を絞って音声認識を行うものが知られている(例えば特許文献1参照)。

先行技術

0003

特開2005−182208号公報

発明が解決しようとする課題

0004

しかしながら、従来のデータ入力装置では、ユーザが文字列入力装置により入力した入力済みの文字列も発話しなければならなかった。

0005

また、文字列候補として共通語句を含む候補が多数予測された場合、予測された文字列候補に認識対象語を絞っても音声認識の精度を向上させることができないという課題があった。

0006

例えば、車を運転して「マクドナルド登録商標鴨居店」に行きたいユーザーが、車載機に「マクド」と打ち込んだところで車が発進し、以降キー入力ができないため音声入力切り替わった場合を想定する。車載機には文字列候補として、例えば「マクドナルド(登録商標)鴨居店」「マクドナルド(登録商標)中山店」「マクドナルド(登録商標)小店」が表示される。

0007

ユーザは、「マクドナルド(登録商標)鴨居店」と入力済みの「マクド」も発話しなければならなかった。

0008

予測された文字列候補は共通語句である「マクドナルド(登録商標)」を含む。文字列候補の大部分が共通語句のため、文字列候補に認識対象語を絞っても音声認識の精度を向上させることはできない。

0009

本発明は、上記課題を解決するもので、入力済みの文字列の発話を不要とし、また、認識対象語を絞り込むことにより音声認識の精度を向上させることにある。

課題を解決するための手段

0010

上記解題を解決するために本発明のデータ入力装置は、文字列を入力する文字列入力部と、音声を入力する音声入力部の二つの入力部と、文字列を表示する表示部と、音声認識辞書とを備えるデータ入力装置であって、前記音声認識辞書に格納された語句から前記文字列入力部から入力された文字列と先頭が一致する語句を抽出し、抽出した語句から複数の語句に共通する共通語句を除いた差分語句を格納した動的音声認識辞書を生成する動的音声認識辞書生成部と、前記文字列入力部から入力された文字列と先頭が一致する語句を差分語句を強調して前記表示部に表示する表示制御部と、前記音声入力部により入力された音声を前記動的辞書生成部が生成した動的音声認識辞書を用いて音声認識を行う音声認
識部と、前記音声認識部の認識結果である語句を含む前記表示部に表示された、入力された文字列と先頭が一致する語句を入力文字列として確定する入力文字列確定部とを備えた構成となっている。

0011

なお、ここで文字列には、1文字も含む。音声認識辞書に格納された語句とは、音声認識の単位をなす文字列をいう。強調して表示するとは、色、太さ、大きさ、フォントを変えて表示すること、点滅表示すること、枠で囲んで表示すること、これらの組み合わせも含む。

発明の効果

0012

本発明によれば、入力済みの文字列の発話を不要とし、また、認識対象語を絞り込むことにより音声認識の精度を向上させることができる。

図面の簡単な説明

0013

本発明の実施の形態1におけるデータ入力装置の構成と車両を示すブロック図
本発明の実施の形態1におけるデータ入力装置を用いたデータ入力処理の一例を示すフロー
本発明の実施の形態1における動的音声認識辞書の生成過程の一例を示す概念
本発明の実施の形態1におけるデータ入力装置を用いたデータ入力時の表示画面の遷移の一例を示す図

実施例

0014

(実施の形態1)
以下、本発明の実施の形態を図面を参照しながら説明する。なお、実施の形態では車載機へのデータ入力として説明するが、本発明は車載機へのデータ入力に限定されるものではない。

0015

図1は、本発明の実施の形態1におけるデータ入力装置の構成と車両を示すブロック図である。

0016

図1において、データ入力装置1000は、車両1100に搭載されたカーナビゲーションシステム等の車載機1102、車両の走行状態を判定する走行状態判定部1101と接続されている。

0017

データ入力装置1000は、入力部として、タッチパネル、キー入力デバイス等の手入力により文字列を入力する文字列入力部1001と、マイク等の音声を入力する音声入力部1002の2つの入力部を備えている。

0018

入力切替部1003は、走行状態判定部1101から入力される車両の走行状態の判定結果に基づき、ユーザが使用する入力部を文字列入力部1001から音声入力部1002へ、音声入力部1002から文字列入力部1001へと切替える。

0019

入力文字列確定部1004は、文字列入力部1001から入力された文字列を入力文字列の一部として確定する。入力文字列確定部1004は、入力文字列の一部として確定した文字列と音声認識部1007の音声認識結果に基づき入力文字列を確定する。入力文字列確定部1004は、確定した入力文字列を車載機1102へ出力する。入力文字列確定部1004は、音声入力部1002から入力された音声を音声認識部1007へ出力し、音声認識部1007から音声認識の結果を入力する。

0020

動的音声認識辞書生成部1006は、入力文字列確定部1004が入力文字の一部として確定した文字列と音声認識辞書1009から動的音声認識辞書1010を生成する。

0021

音声認識部1007は、音声入力部1002から入力された音声を、辞書格納部1008に格納された辞書を用いて認識する。

0022

辞書格納部1008は、音声認識辞書1009と動的音声認識辞書1010とを格納する。音声認識辞書1009はデータ入力装置1000が予め備えている辞書である。動的音声認識辞書1010は、動的音声認識辞書生成部1006が動的に生成する辞書である。

0023

表示制御部1005は、表示部1016の表示を制御する。表示部1016は、表示制御部1005の制御に従い入力文字列確定部1004が確定した文字列、辞書格納部1008に格納された辞書の語句を表示する。

0024

車両1100に搭載された走行状態判定部は、車両の走行状態を判定し、「発進」、「停車」を含む判定結果を入力切替部1003へ出力する。車載機1102は、カーナビゲーションシステム、ディスプレイオーディオ等のデータ入力を必要とする機器である。

0025

以上のように構成されたデータ入力装置1000について、以下にその動作について説明する。図2は本発明の実施の形態1におけるデータ入力装置1000を用いたデータ入力処理の一例を示す図である。

0026

図2において、ユーザーは文字列入力部1001を用いて文字の入力を行う(S201)。入力文字列確定部1004は、入力された文字を入力文字列の一部として確定する。

0027

動的音声認識辞書生成部1006は、入力文字列の一部として確定された文字列を基に、音声認識辞書1009から動的音声認識辞書1010を生成する(S202)。

0028

動的音声認識辞書1010は、音声認識辞書1009に格納された語句で入力文字列の一部として確定した文字列と先頭が一致する複数の語句から、複数の語句に共通する共通語句を除いた差分語句を格納した辞書である。動的音声認識辞書1010の生成に関しては、後に図面を用いて説明する。

0029

入力文字列確定部1004は、音声入力モードか否かを判定する(S203)。音声入力モードとは、入力切替部1003が、入力部を文字列入力部1001から音声入力部1002に切り替えた状態をいう。

0030

音声入力モードでない場合(S203でNOの場合)、S201からS202を繰り返す。動的音声認識辞書生成部1006は、文字が入力され、入力文字列の一部が更新される度に動的音声認識辞書1010を生成する。

0031

音声入力モードの場合(S203でYESの場合)、表示制御部1005は、入力文字列確定部1004が入力文字列の一部として確定した文字列と先頭が一致する音声認識辞書の語句(以後、入力文字列候補と称す)を表示部1016に表示する(S204)。

0032

表示制御部1005は、入力文字列候補のうち、動的音声認識辞書1010に格納された差分語句を強調して表示する。表示制御部1005は、音声入力モードであることを表示部1016に表示する。表示制御部1005は、文字列入力部1001から文字を入力できないことを表示部1016に示す。

0033

ユーザは入力文字列を確定するために必要な語句を発話する(S205)。

0034

ユーザの発話は音声入力部1002から音声認識部1007へ入力される。音声認識部1007は、動的音声認識辞書1010を用いて発話の認識を行う。音声認識部1007は、動的音声認識辞書1010に格納された差分語句とユーザが発話した語句とのマッチングを行う(S206)。

0035

ユーザの発話を認識できた場合、即ち、ユーザが発話した語句と差分語句とがマッチした場合(S207でYESの場合)、入力文字列確定部1004は、ユーザが発話した語句とマッチした差分語句を含む入力文字列候補を入力文字列として確定する(S210)。

0036

ユーザの発話を認識できない場合、即ち、ユーザが発話した語句と差分語句とがマッチしない場合(S207でNOの場合)、音声認識部1007は、音声認識辞書1009を用いて発話の認識を行う。音声認識部1007は、音声認識辞書1009に格納された語句とユーザが発話した語句とのマッチングを行う(S208)。

0037

ユーザの発話を認識できた場合(S209でYESの場合)、入力文字列確定部1004は、認識結果と入力文字列の一部として確定した文字列に基づき入力文字列を確定する。

0038

ユーザの発話を認識できない場合(S209でNOの場合)、S205からの処理を繰り返す。

0039

図3は、動的音声認識辞書1010の生成過程の一例を示す概念図である。図3において語句301は、音声認識辞書1009に格納された語句の一例である。音声認識辞書1009には、「イロハニホ鴨居店」等、具体的店舗名を表す語句が格納されている。動的音声認識辞書1010を用いない従来の音声認識は、これらの語句とユーザが発話した語句とのマッチングを行う。

0040

語句302は、文字列入力部1001から文字列「イロハ」が入力された時に、動的音声認識辞書生成部1006が、音声認識辞書1009に格納された語句301から抽出した語句である。

0041

動的音声認識辞書生成部1006は、音声認識辞書1009に格納された語句から文字列入力部1001から入力された文字列と先頭が一致する語句を抽出する。抽出された語句「イロハニホ鴨居店」「イロハニホ中山店」「イロハニホ新横店」「イロハニホ小杉店」は、入力された文字列「イロハ」と先頭が一致する語句である。

0042

動的音声認識辞書生成部1006は、抽出した語句302を複数の語句に共通する共通語句3021「イロハニホ」と共通語句を除いた差分語句3022とに分ける。動的音声認識辞書生成部1006は、差分語句3022のみを格納した新たな辞書、動的音声認識辞書1010を生成する。語句303は、音声認識辞書1009に格納された語句301から生成した動的音声認識辞書1010に格納された語句の一例である。

0043

図4は、本発明の実施の形態1におけるデータ入力装置を用いたデータ入力時の表示画面の遷移の一例を示す図である。

0044

表示部1016を液晶表示パネル、文字列入力部1001を液晶表示パネルと重ねて配
置されたタッチパネルとして説明するが、表示部1016、文字列入力部1001は、これらに限定されるものではない。

0045

表示画面401は、文字列入力部1001に相当するタッチパネル入力部4012と、タッチパネル入力部4012から入力された文字列を表示する入力文字列表示部4011を有している。入力文字列表示部4011に表示された文字は、入力文字列の一部として入力文字列確定部1004が確定した文字列である。

0046

ユーザーは車両を運転中かつ停車中であり、近場の「イロハニホ」チェーン店へのルート案内を所望しているものとする。図4の表示画面402は、ユーザーがタッチパネル入力部4011から、「イロハ」まで文字列を入力した入力途中の表示画面である。

0047

ユーザが車両を発進すると、走行状態判定部1101は判定結果として「発進」を入力切替部1003に出力する。入力切替部1003は、入力部を文字列入力部1001から音声入力部1002へ切替える。表示画面402は、表示画面403へと遷移する。

0048

表示画面403には、入力文字列候補4031が表示される。入力文字列候補4031は、入力文字列確定部1004が入力文字列の一部として確定した文字列「イロハ」と先頭が一致する音声認識辞書1009に格納された語句である。入力文字列候補4031は、複数の語句で共通する共通語句「イロハニホ」と差分語句「鴨居店」「中山点」「新横店」「小杉店」等からなる。入力文字列候補4031は、差分語句が太字強調表示される。ユーザが入力文字列を確定するために、強調表示された差分語句のみを発話すればよいことを示している。

0049

表示画面403は、タッチパネル入力部4012の表示なくし、タッチパネル入力部4012から文字を入力できないことを示している。

0050

表示画面403には、入力部が音声入力に切替ったこと、音声入力モードであることを示すマイクアイコン4032が表示される。

0051

表示画面403の表示中に、ユーザが「鴨居店」と発話すれば、音声認識部1007は動的音声認識辞書1010を用いて発話の認識を行う。音声認識部1007は発話された語句を「鴨居店」と認識する。入力文字列確定部1004は、音声認識の認識結果である「鴨居店」を含む文字列入力候補「イロハニホ鴨居店」を入力文字列として確定する。入力文字列確定部1004は、確定した文字列「イロハニホ鴨居店」を車載機1102へ出力する。

0052

以上のように本発明の実施の形態1におけるデータ入力装置、およびデータ入力方法によれば、共通語句を除いた差分語句を格納した動的音声認識辞書を用いて音声認識を行うことにより、入力済みの語句の発話を不要とし、また、認識対象語を共通語句を取り除いた差分語句に絞り込むことにより音声認識の精度を向上させることができる。

0053

なお、実施の形態1では、1文字も文字列と称している。強調表示として太字を説明したが、色、大きさ、フォントを変えて表示すること、点滅表示すること、枠で囲んで表示すること、これらを組み合わせて表示するものであってもよい。

0054

また、文字列入力部1001、表示部1016を車載機が備える入力装置出力装置と兼用する構成としてもよい。

0055

また、本発明の実施の形態1にかかわるデータ入力装置は、専用のハードウェアによっ
て実現される他に、その機能を実現するためのプログラムコンピュータ読み取り可能な記録媒体に記録し、この記憶媒体に記録されたプログラムをコンピュータシステムに読み込ませて、実行するものであってもよい。

0056

本発明のデータ入力装置及びデータ入力方法は、カーナビゲーションシステム等の車載機へのデータ入力装置及びデータ入力方法として有用である。

0057

1000データ入力装置
1001文字列入力部
1002音声入力部
1004入力文字列確定部
1006 動的音声認識辞書生成部
1016 表示部
1010 動的音声認識辞書
1102車載機
3021共通語句
3022 差分語句

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

該当するデータがありません

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ