図面 (/)

技術 音声認識装置

出願人 株式会社デンソー
発明者 瀬戸応尚
出願日 2006年2月27日 (14年4ヶ月経過) 出願番号 2006-049881
公開日 2007年9月6日 (12年9ヶ月経過) 公開番号 2007-226098
状態 拒絶査定
技術分野 音声認識
主要キーワード 音声認識コマンド DVDデッキ スピーカ端子 コマンド認識 入力画 PTTスイッチ マイク端子 位置特定処理
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2007年9月6日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (4)

課題

音声認識率を向上させる。

解決手段

ユーザが発したコマンドと同一機能分類された他の音声認識コマンドコマンド一覧情報にあるか否かを判定し(S108)、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定(S108でYESと判定)した場合、コマンドと同一機能に分類された他の音声認識コマンドをコマンド一覧情報から削除する(S112)。

概要

背景

従来、ユーザの音声入力に応じて音声認識を行う音声認識装置が種々提案されている(例えば、特許文献1参照)。
特開2004−101070号公報

概要

音声認識率を向上させる。ユーザが発したコマンドと同一機能分類された他の音声認識コマンドコマンド一覧情報にあるか否かを判定し(S108)、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定(S108でYESと判定)した場合、コマンドと同一機能に分類された他の音声認識コマンドをコマンド一覧情報から削除する(S112)。

目的

本発明は上記問題に鑑みたもので、音声認識率を向上させることを目的とする。

効果

実績

技術文献被引用数
1件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

機能毎に分類された音声認識コマンド登録されたコマンド一覧情報を参照してユーザが発したコマンドを音声認識し、認識したコマンドに応じた機能動作を行う音声認識装置であって、前記ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドが前記コマンド一覧情報にあるか否かを判定する判定手段と、前記判定手段よって前記ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドが前記コマンド一覧情報にあると判定された場合、前記コマンドと同一機能に分類された他の音声認識コマンドを前記コマンド一覧情報から削除する音声認識コマンド削除手段と、を備えたことを特徴とする音声認識装置。

請求項2

ユーザを確認するユーザ確認手段を備え、前記コマンド一覧情報は、前記ユーザ確認手段によって確認されたユーザ毎に用意されており、前記音声認識コマンド削除手段は、前記ユーザ確認手段によって確認されたユーザ用に用意された前記コマンド一覧情報から前記コマンドと同一機能に分類された他の音声認識コマンドを削除することを特徴とする請求項1に記載の音声認識装置。

技術分野

0001

本発明は、機能毎に分類された音声認識コマンド登録されたコマンド一覧情報の中からユーザが発したコマンドを認識し、認識したコマンドに応じた機能動作を行う音声認識装置に関する。

背景技術

0002

従来、ユーザの音声入力に応じて音声認識を行う音声認識装置が種々提案されている(例えば、特許文献1参照)。
特開2004−101070号公報

発明が解決しようとする課題

0003

このような音声認識装置は、予め登録された多数の音声認識コマンドの中からユーザの音声入力と一致するコマンドを特定してコマンドを音声認識するようになっている。したがって、登録されている音声認識コマンドの数が多いほどユーザの発したコマンドが誤認識されやすく、音声認識率が低下してしまう。

0004

本発明は上記問題に鑑みたもので、音声認識率を向上させることを目的とする。

課題を解決するための手段

0005

上記目的を達成するため、本発明の第1の特徴は、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあるか否かを判定し、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定した場合、コマンドと同一機能に分類された他の音声認識コマンドをコマンド一覧情報から削除することである。

0006

このような構成では、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定した場合、コマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報から削除されるので、コマンド一覧情報に含まれる音声認識コマンドの数が少なくなり、音声認識率を向上させることができる。

0007

また、本発明の第2の特徴は、音声認識コマンド削除手段が、ユーザ確認手段によって確認されたユーザ毎に用意されたコマンド一覧情報からコマンドと同一機能に分類された他の音声認識コマンドを削除することである。

0008

このような構成では、ユーザ毎にコマンド一覧情報が用意され、ユーザ確認手段によって確認されたユーザ用に用意されたコマンド一覧情報からコマンドと同一機能に分類された他の音声認識コマンドが削除されるので、他のユーザの使用によって、コマンド一覧情報から音声認識コマンドが削除されてしまうようなことをなくすことができる。

発明を実施するための最良の形態

0009

本発明の一実施形態に係る音声認識装置の構成を図1に示す。本音認識装置は、ナビゲーション装置1を用いて構成されている。ナビゲーション装置1は、LCD10、GPSレシーバ11、ジャイロセンサ12、メモリ13、DVDデッキ14、音声インタフェース(図中では、音声I/Fと記す)15およびCPU16を備えている。なお、図示してないが、CPU16と各部10〜15との間は、基板上の配線パターンあるいはケーブルを介して接続されている。また、CPU16には、音声認識の開始を指示するためのPTT(Push to Talk)スイッチ20が接続され、音声インタフェース16には、ユーザの音声を集音するためのマイク21および音声を出力するためのスピーカ22が接続されている。

0010

LCD10は、CPU16から入力される映像信号に応じた映像を表示するための装置である。

0011

GPSレシーバ11には、GPS衛星から送信される電波を受信するGPSアンテナ11aが接続されている。GPSレシーバ11は、GPSアンテナ11aから入力される信号に基づいて自車位置を特定するための信号をCPU16へ出力する。

0012

ジャイロセンサ12は、自車の旋回角ロール角を検出し、検出信号をCPU16へ出力する。

0013

メモリ13は、プログラム等を記憶するROM、一時的にデータを格納するRAM、音声認識処理で用いられるコマンド一覧情報を記憶する書き換え可能な不揮発性記憶媒体(例えば、フラッシュメモリ、EEPROM等)によって構成されている。

0014

DVDデッキ14は、地図データや音楽データ等が記憶されたDVDディスクからデータを読み出すための装置である。

0015

音声インタフェース15は、マイク21を接続するためのマイク端子およびスピーカ22を接続するためのスピーカ端子(いずれも図示せず)を有している。音声インタフェース15は、マイク端子を介してマイク21から入力されるアナログ信号デジタル信号に変換してCPU16へ出力するとともに、CPU16から入力されるデジタル信号をアナログ信号に変換してスピーカ端子を介してスピーカ22へ出力する。

0016

CPU16は、メモリ13のROMに記憶されたプログラムに従って各種処理を行う。CPU16の処理としては、GPSレシーバ11およびジャイロセンサ12から入力される信号に基づいて自車位置を特定する自車位置特定処理、DVDデッキ14を介してDVDメディアから自車位置周辺の地図データを読み出して、自車位置周辺の地図上に自車位置マークを重ねてLCD10に表示させる地図表示処理、音声インタフェース15を介してマイク21から入力される音声信号の音声認識を行う音声認識処理等がある。

0017

次に、音声認識処理について説明する。ユーザがPTTスイッチ20を押下すると音声認識処理が開始される。この音声認識処理が開始された状態で、ユーザがコマンドを発すると、CPU16は、多数の音声認識コマンドが登録されたコマンド一覧情報の中からユーザが発したコマンドと一致する音声コマンド検索して音声認識を行う。

0018

図2に、コマンド一覧情報の概要を示す。図に示すように、機能Aに対してコマンドA1、A2、A3、…に示すような複数の音声認識コマンドが登録されている。同様に、機能B、機能C、機能D、…等の各機能に対してもそれぞれ複数の音声認識コマンドが登録されている。

0019

例えば、地図を拡大表示する機能に対しては、「拡大」、「詳細」、「ズームイン」の各音声認識コマンドが登録されており、地図を縮小する機能に対しては、「縮小」、「広域」、「ズームアウト」の各音声認識コマンドが登録されている。

0020

CPU16は、図2に示すような、機能毎に分類された音声認識コマンドが登録されたコマンド一覧情報を参照して、ユーザが発したコマンドを音声認識し、認識したコマンドに応じた機能動作を行う。

0021

すなわち、CPU16は、ユーザによって、「拡大」、「詳細」、「ズームイン」のいずれかが発せられると、コマンド一覧情報を参照してユーザが発したコマンドを音声認識し、音声認識したコマンドに応じた「地図を拡大表示する機能」を実施する。また、ユーザによって、「縮小」、「広域」、「ズームアウト」のいずれかが発せられると、コマンド一覧情報を参照してユーザが発したコマンドを音声認識し、音声認識したコマンドに応じた「地図を縮小表示する機能」を実施する。

0022

しかし、このように1つの機能に対して複数の音声認識コマンドが登録されていても、ユーザは特定のコマンドしか使用しない場合が多い。例えば、図2太線に示すように、機能AについてはコマンドA1、機能BについてはコマンドB2、機能CについてはコマンドC1、機能DについてはコマンドD3といったように、複数の音声認識コマンドが用意されていても、いつも決まったコマンドしか使用しない場合が多い。

0023

そこで、本ナビゲーション装置1では、ユーザが使用するコマンドをコマンド一覧情報に残し、ユーザが使用したコマンドと同一機能に分類された他のコマンド(言い替えコマンド)をコマンド一覧情報から削除することにより、コマンド一覧情報に登録されている音声認識コマンドの数を減らす処理を行う。

0024

また、本ナビゲーション装置1は、予めメニュー画面に従ってユーザ毎にユーザ情報を登録するようになっている。ナビゲーション装置1のCPU16は、ユーザによってユーザ情報の登録操作が行われると、ユーザ毎にコマンド一覧情報を用意するようになっている。

0025

次に、図3に示すフローチャートに従って、CPU16の処理について説明する。イグニッションスイッチオンしてバッテリから電源が供給されると、ナビゲーション装置1は動作状態となり、CPU16は、図3に示す処理を開始する。

0026

まず、ユーザ確認を行う(S100)。具体的には、ユーザ情報を入力する画面をLCD10に表示させ、この画面に従って入力されるユーザ情報が予めユーザ登録によって登録されているか否かに基づいてユーザ確認を行う。

0027

なお、ユーザ情報の入力画面に従って入力されたユーザ情報がユーザ登録されていない場合、図示してないが、ユーザを確認することができないことを示すメッセージをLCD10に表示させて、S100のユーザ確認を繰り返す。

0028

ユーザ情報の入力画面に従って入力されたユーザ情報がユーザ登録されている場合、次に、PTTスイッチ20がオンしたか否かを判定する(S102)。具体的には、PTTスイッチ20から入力される信号に基づいてPTTスイッチ20がオンしたか否かを判定する。

0029

ユーザによってPTTスイッチ20が押下されない場合、S102の判定はNOとなり、S102の判定を繰り返す。また。ユーザによってPTTスイッチ20が押下されると、S102の判定はYESとなり、次に、音声認識の開始を示すアイコンをLCD10に表示させる(S104)。

0030

次に、コマンド認識を行う(S106)。具体的には、音声インタフェース15を介してマイク21から入力されるコマンド(音声データ)と、先のS100のユーザ確認にて確認されたユーザ用に用意されたコマンド一覧情報に含まれる音声認識コマンド(音声データ)を比較して、コマンド認識を行う。

0031

次に、認識したコマンドの言い替えコマンドがコマンド一覧情報にあるか否かを判定する(S108)。具体的には、認識したコマンドと同一機能に分類された他のコマンド(言い替えコマンド)がコマンド一覧情報にあるか否かを判定する。

0032

認識したコマンドの言い替えコマンドがコマンド一覧情報にない場合、S108の判定はNOとなり、次に、認識したコマンドに応じた機能動作を行う(S110)。例えば、認識したコマンドが「拡大」の場合、地図を拡大表示させ、認識したコマンドが「縮小」の場合、地図を拡大表示させる。そして、認識したコマンドに応じた機能動作を実施すると、S102へ戻り、上記した処理を繰り返す。

0033

また、認識したコマンドの言い替えコマンドがコマンド一覧情報にある場合、S108の判定はYESとなり、次に、認識したコマンドと同一機能に分類された他のコマンド(言い替えコマンド)をコマンド一覧情報から削除する(S112)。例えば、認識したコマンドが「拡大」の場合、「詳細」、「ズームイン」といった言い替えコマンドをコマンド一覧情報から削除し、認識したコマンドが「縮小」の場合、「広域」、「ズームアウト」といった言い替えコマンドをコマンド一覧情報から削除する。

0034

そして、言い替えコマンドのコマンド一覧情報からの削除が終わると、S110へ進む。

0035

したがって、上記した処理を繰り返すことにより、各種機能の言い替えコマンドがコマンド一覧情報から削除され、コマンド一覧情報に登録されている音声認識コマンドの数が減少していく。

0036

また、S100のユーザ確認において、別のユーザが確認された場合、そのユーザ用に用意されたコマンド一覧情報を用いてS102〜S112の処理が行われる。

0037

なお、本ナビゲーション装置1は、メニュー画面に従って、各種言い替えコマンドが削除されたコマンド一覧情報を、初期状態に戻すことができるようになっている。

0038

上記した構成によれば、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあるか否かを判定し、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定した場合、コマンドと同一機能に分類された他の音声認識コマンドをコマンド一覧情報から削除するので、コマンド一覧情報に含まれる音声認識コマンドの数が少なくなり、音声認識率を向上させることができる。

0039

また、ユーザ毎にコマンド一覧情報が用意され、ユーザ確認によって確認されたユーザ用に用意されたコマンド一覧情報からコマンドと同一機能に分類された他の音声認識コマンドが削除されるので、他のユーザの使用によって、コマンド一覧情報から音声認識コマンドが削除されてしまうようなことをなくすことができる。

0040

なお、上記実施形態における構成と特許請求の範囲の構成との対応関係について説明すると、S108が判定手段に相当し、S112が音声認識コマンド削除手段に相当し、S100がユーザ確認手段に相当する。

0041

また、上記実施形態では、上記実施形態では、音声認識装置として音声認識機能を備えたナビゲーション装置の例を示したが、ナビゲーション装置に限定されるものではなく、各種音声認識機能を備えた装置に適用することができる。

図面の簡単な説明

0042

本発明の一実施形態に係る音声認識装置の構成を示す図である。
コマンド一覧情報の概要を示す図である。
音声認識装置の処理を示すフローチャートである。

符号の説明

0043

1…ナビゲーション装置、10…LCD、11…GPSレシーバ、
11a…GPSアンテナ、12…ジャイロセンサ、13…メモリ、
14…DVDデッキ、15…音声インタフェース、16…CPU、
20…PTTスイッチ、21…マイク、22…スピーカ。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ