図面 (/)

この項目の情報は公開日時点(2000年12月8日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (5)

課題

利用者コマンドを正確に覚えていなくても、そのコマンド内容の主要な部分さえ音声入力できれば、最終的には所望のコマンド入力ができるようにして、使い勝手をより向上させる。

解決手段

最初に音声入力した内容(例えばVICS表示)だけではナビゲーション機能を駆動できない場合であっても、辞書中においてその入力内容に対してキーワードの関連が設定されている操作可能コマンド(例えば渋滞表示、規制表示駐車場表示など)を検索し((d)参照)、ディスプレイに表示してユーザに提示することができる。そのため、その表示内容を見たユーザは、その中の所望のコマンド(例えば渋滞表示)を再度音声入力すれば、操作コマンドとして「VICS渋滞表示」を指示できる。つまり、ユーザは、コマンドを正確に覚えていなくても、そのコマンド内容の主要な部分さえ音声入力できればよい。

概要

背景

概要

利用者コマンドを正確に覚えていなくても、そのコマンド内容の主要な部分さえ音声入力できれば、最終的には所望のコマンド入力ができるようにして、使い勝手をより向上させる。

最初に音声入力した内容(例えばVICS表示)だけではナビゲーション機能を駆動できない場合であっても、辞書中においてその入力内容に対してキーワードの関連が設定されている操作可能コマンド(例えば渋滞表示、規制表示駐車場表示など)を検索し((d)参照)、ディスプレイに表示してユーザに提示することができる。そのため、その表示内容を見たユーザは、その中の所望のコマンド(例えば渋滞表示)を再度音声入力すれば、操作コマンドとして「VICS渋滞表示」を指示できる。つまり、ユーザは、コマンドを正確に覚えていなくても、そのコマンド内容の主要な部分さえ音声入力できればよい。

目的

効果

実績

技術文献被引用数
1件
牽制数
2件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

単語毎に対応する比較対象パターン単語辞書データとして記憶している辞書手段と、音声を入力するための音声入力手段と、該音声入力手段を介して入力された音声を、予め辞書手段に記憶されている複数の比較対象パターンと比較して一致度合の高いものを認識結果とする認識手段と、少なくとも前記認識手段による認識結果を外部装置へ出力する処理を実行可能な認識制御手段とを備える音声認識装置であって、前記辞書手段は、前記外部装置にて実行する機能を特定する上で必要なコマンド内容操作対象コマンド及び操作詳細コマンドという2種類のキーワードに分割した場合の各キーワード間対応関係を持たせて、前記単語辞書データを記憶しており、前記認識制御手段は、前記認識手段による認識結果のみで前記外部装置の機能を実行可能か否かを判断する判断手段を備えており、該判断手段にて前記外部装置の機能が実行可能であると判断された場合は、当該認識結果のみを前記外部装置へ出力し、一方、実行不可能であると判断された場合は、前記辞書手段におけるキーワード間の対応関係に基づき、前記認識結果と対応関係にある前記操作対象コマンドあるいは操作詳細コマンドを抽出し、音声認識装置自らが有する報知手段を介して利用者に報知するか、あるいは前記外部装置が有する報知手段を介し利用者に報知させるために前記外部装置へ指示することを特徴とする音声認識装置。

請求項2

請求項1記載の音声認識装置において、前記判断手段は、前記認識手段による認識結果のみで前記外部装置の機能を実行可能か否かを、前記外部装置の状態に基づいて判断することを特徴とする音声認識装置。

請求項3

請求項1又は2記載の音声認識装置において、前記認識制御手段は、さらに、前記辞書手段に記憶されている単語辞書データの内、前記キーワード間の対応関係に基づいて抽出した前記操作対象コマンドあるいは操作詳細コマンドに対応する単語辞書データのみを、前記認識手段における認識の際の単語辞書データとして有効にする辞書絞り込みを行う辞書管理手段を備えていることを特徴とする音声認識装置。

請求項4

請求項3記載の音声認識装置において、前記辞書管理手段は、前記判断手段により、前記認識手段による認識結果のみで前記外部装置の機能を実行可能であると判断された場合には、前記辞書絞り込みを解除することを特徴とする音声認識装置。

請求項5

請求項1〜4のいずれかに記載の音声認識装置と、当該音声認識装置が認識結果を出力する先である前記外部装置としてのナビゲーション装置とを備え、前記音声認識装置の前記音声入力手段は、少なくとも前記ナビゲーション装置がナビゲート処理をする上で指定される必要のある所定のナビゲート処理関連データの指示を利用者が音声にて入力するために用いられるものであることを特徴とするナビゲーションシステム

請求項6

請求項5に記載のナビゲーションシステムにおいて、前記ナビゲーション装置は表示装置に地図やメニューを表示可能であり、当該表示装置が、前記音声認識装置からの報知指示に応じて前記操作対象コマンドあるいは操作詳細コマンドを報知するための報知手段として機能することを特徴とするナビゲーションシステム。

技術分野

0001

本発明は、例えばナビゲーションシステムにおける目的地の設定などを音声によって入力できるようにする場合などに有効な音声認識装置及びその音声認識装置を備えたナビゲーションシステムに関する。

0002

従来より、入力された音声を予め記憶されている複数の比較対象パターン候補と比較し、一致度合の高いものを認識結果とする音声認識装置が既に実用化されており、例えばナビゲーションシステムにおいて表示されている地図の拡大や縮小の指示、目的地の設定、経路の設定など、所定のコマンドを利用者が音声で指示入力するためなどに用いられている。特に車載ナビゲーションシステム運転手自身が利用する場合、音声入力であればボタン操作や画面注視が伴わないため、車両の走行中に行っても安全性が高いため有効である。

0003

例えば、目的地設定の具体例として、目的地を名古屋に設定するコマンドを指示入力するために「名古屋駅に行く」という音声入力が必要な場合を考える。この場合に、「名古屋駅」、「に」、「行く」というように単語を基本とした所定単位毎に区切って発音しなくてはならないとすると利用者にとって煩わしいので、コマンド単位、すなわち「名古屋駅に行く」とひと続きで入力(一括入力)できるようにすることが考えられている。この場合には、認識辞書中に「名古屋駅に行く」というコマンド単位での辞書が設けられている。

0004

しかしながら、音声認識においては、辞書に登録されていない単語は認識されないため、上述したコマンドを正確に入力しなくては所望の動作を指示することができない。もちろん、ユーザがコマンドを正確に入力できれば問題ないが、コマンド内容が複雑多岐にわたると、それらを覚えきれない状況も想定される。その場合、その都度、説明書などを参照しなくてはならないのでは非常に不便である。

0005

そこで本発明は、このような問題を解決し、利用者がコマンドを正確に覚えていなくても、そのコマンド内容の主要な部分さえ音声入力できれば、それをきっかけとして最終的なコマンド入力ができるようにして、使い勝手をより向上させた音声認識装置を提供することを目的とする。

0006

そして、その音声認識装置を用いたナビゲーションシステムを提供することも目的とする。

0007

上記目的を達成するためになされた請求項1に記載の音声認識装置は、辞書手段が、単語毎に対応する比較対象パターンを単語辞書データとして記憶しており、利用者が音声入力手段を介して音声を入力すると、認識手段が、その入力された音声を辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする。そして、認識制御手段は、少なくとも認識手段による認識結果を外部装置へ出力する。

0008

ここで、前記辞書手段は、外部装置にて実行する機能を特定する上で必要なコマンド内容を操作対象コマンド及び操作詳細コマンドという2種類のキーワードに分割した場合の各キーワード間対応関係を持たせて、単語辞書データを記憶している。操作対象コマンドは、操作の対象を特定するためのコマンドであり、概念的には「何々をどうする」の「何々」に相当する。一方、操作詳細コマンドは、その操作対象が行う内容を特定するためのコマンドであり、概念的には「何々をどうする」の「どうする」に相当する。但し、その分類手法は種々考えられ、例えばナビゲーション関連で言えば、「名古屋駅(という地名)」を操作対象コマンドとし、「行く」を操作詳細コマンドとする一般的なものもあれば、さらに「VICS表示」という一見、操作対象コマンドと操作詳細コマンドとが合体しているようなキーワードも操作対象コマンドとして扱うこともできる。この「VICS表示」という操作対象コマンドに対して、例えば「渋滞表示」、「空き道表示」、「駐車場表示」といった複数の操作詳細コマンドを対応させることができる。

0009

そして、認識制御手段中の判断手段は、認識手段による認識結果のみで外部装置の機能を実行可能か否かを判断し、外部装置の機能が実行可能であると判断された場合は、当該認識結果のみを外部装置へ出力する。一方、実行不可能であると判断された場合は、辞書手段におけるキーワード間の対応関係に基づき、認識結果と対応関係にある操作対象コマンドあるいは操作詳細コマンドを抽出する。例えば、外部装置がナビゲーション装置で、上述例の「VICS表示」が音声入力された場合には、それだけでは機能駆動できないので、「VICS表示」という操作対象コマンドと対応関係にある操作詳細コマンド(例えば上述した「渋滞表示」、「空き道表示」、「駐車場表示」など)を抽出する。そして、音声認識装置自らが有する報知手段を介して利用者に報知するか、あるいは外部装置が有する報知手段を介し利用者に報知させるために外部装置へ指示する。

0010

この報知手段としては、表示にて報知するものを用いることが考えられる。もちろん、音声その他の報知手法を採用してもよいが、上述したように複数の対応する操作詳細コマンドがある場合には、それらを一覧表示して、その中から利用者が選択し易くすることが好ましい。

0011

なお、操作詳細コマンドから逆に操作対象コマンドを辿ることもできる。例えば上述した「駐車場表示」という操作詳細コマンドに分類されるキーワードが音声入力された場合、対応関係を逆にたどれば、駐車場表示の対象として「VICS情報として提供される駐車場情報の表示」なのか、「レストランに完備されている駐車場」の表示なのか、「現在地周辺に存在する駐車場」の表示なのか、などが判る。したがって、これらを同様に一覧表示するなどして利用者に報知すればよい。

0012

このように、本発明の音声認識装置によれば、操作対象コマンドあるいは操作詳細コマンドのいずれか一方が利用者によって音声入力された場合、対応関係にある操作詳細コマンドあるいは操作対象コマンドを報知するため、その報知結果を認知した利用者は、所望のコマンドを再度入力することができる。つまり、利用者は、コマンドを正確に覚えていなくても、そのコマンド内容の主要な部分さえ音声入力できれば、それをきっかけとして最終的なコマンド入力ができるため、使い勝手がより向上する。

0013

なお、判断手段が認識手段による認識結果のみで外部装置の機能を実行可能か否かを判断する場合には、請求項2に示すように、外部装置の状態に基づいて判断することが考えられる。例えば、外部装置がナビゲーション装置であり、VICS情報を提供するモードに設定されている場合には、上述した「駐車場表示」という操作詳細コマンドだけが音声入力されても、操作対象がVICS表示となっているため、そのまま機能駆動できると判断される。同様に、ナビゲーション装置が目的地設定モードとなっていれば、「名古屋駅」という操作対象コマンドのみで機能駆動が可能であると判断される。

0014

また、認識制御手段は、認識結果のみで外部装置の機能を実行不可能である場合に、辞書手段におけるキーワード間の対応関係に基づき、認識結果と対応関係にある操作対象コマンドあるいは操作詳細コマンドを抽出するのであるが、この際、請求項3に示すように、認識制御手段が備える辞書管理手段によって次のような辞書管理を行っても良い。つまり、辞書手段に記憶されている単語辞書データの内、キーワード間の対応関係に基づいて抽出した操作対象コマンドあるいは操作詳細コマンドに対応する単語辞書データのみを、認識手段における認識の際の単語辞書データとして有効にする辞書絞り込みを行うのである。このようにすれば、再度の音声入力に対する誤認識が少なくなり、より適切な音声認識を実現できる。

0015

なお、辞書管理手段が辞書の絞り込みを行った場合、その後、通常の音声認識をする場合には適切な単語辞書データでなくなるので、請求項4に示すように、認識手段による認識結果のみで外部装置の機能を実行可能であると判断手段にて判断された場合には、辞書絞り込みを解除するようにすればよい。

0016

ところで、請求項1〜4のいずれかに記載の音声認識装置をナビゲーションシステム用として用いる場合には、請求項5に示すように構成することが考えられる。つまり、請求項1〜4のいずれかに記載の音声認識装置と、ナビゲーション装置とを備え、音声認識装置の音声入力手段を、少なくともナビゲーション装置がナビゲート処理をする上で指定される必要のある所定のナビゲート処理関連データの指示を利用者が音声にて入力するために用いるのである。

0017

この場合の「所定のナビゲート処理関連データ」としては、目的地が代表的なものとして挙げられ、その目的地としては、地名そのものである場合もあるし、あるいは施設店舗名などの場合もある。また、それ以外にもルート探索に関する条件選択や、上述したVICS表示など、ナビゲート処理をする上で指定の必要のある種々の指示が含まれる。

0018

特に請求項6に示すように、一般的なナビゲーション装置は表示装置に地図やメニューを表示可能であるため、その表示装置を、音声認識装置からの報知指示に応じて操作対象コマンドあるいは操作詳細コマンドを報知するための報知手段として機能させることが考えられる。このようにすれば、音声認識装置自体が報知手段を持たなくてもよい。

発明を実施するための最良の形態

0019

以下、本発明が適用された実施例について図面を用いて説明する。なお、本発明の実施の形態は、下記の実施例に何ら限定されることなく、本発明の技術的範囲に属する限り、種々の形態を採り得ることは言うまでもない。

0020

図1は音声認識装置30を適用した車載用のナビゲーションシステム1の概略構成を示すブロック図である。本ナビゲーションシステム1は、音声認識装置30と機構スイッチ2とリモコンスイッチ3とからなる操作スイッチ部4、その操作スイッチ部4からの操作状況などを入力し、ナビゲーションシステム全体の制御を行う操作制御部5、自車両現在位置を算出するための現在位置算出部6、ユーザの設定した目的地に基づき目的地までの適切なルート(推奨ルート)を算出する経路計算部7、経路計算部7にて計算された推奨ルートに基づき、車両の運転を円滑に進めるために必要な案内を音声や簡易地図などでユーザに提供する制御処理を行う案内制御部8、地図データ検索部9、外部情報入出力装置10、音声出力制御部11,スピーカ12、表示制御部13及びディスプレイ14を備えている。なお操作制御部5は通常のコンピュータとして構成されており、内部には、周知のCPU、ROM、RAM、I/O及びこれらの構成を接続するバスラインが備えられている。

0021

前記現在位置算出部6は、例えばいずれも周知のジャイロスコープ距離センサ及び衛星からの電波に基づいて車両の位置を検出するGPS(Global Positioning System )のためのGPS受信機を有している。これらのセンサ等は各々が性質の異なる誤差を持っているため、複数のセンサにより、各々補間しながら使用するように構成されている。なお、精度によっては上述した内の一部で構成してもよく、更に、地磁気センサステアリング回転センサ各転動輪車輪センサ等を用いてもよい。

0022

地図データ検索部9は、位置検出の精度向上のためのいわゆるマップマッチング用データ、地図データ及び目印データを含む各種データを入力するための装置である。媒体としては、そのデータ量からCD−ROMやDVDを用いるのが一般的であるが、メモリカード等の他の媒体を用いても良い。

0023

一方、外部情報入出力装置10は、図示しないラジオアンテナを介してFM放送信号を受信したり、道路近傍に配置されたVICS(Vehicle Information and Communication System:道路交通情報システムサービス用の固定局から、電波ビーコン信号及び光ビーコン信号を受信する。この受信した情報は操作制御部5へ送られて処理される。また、外部へ情報を発信できるようにもされている。

0024

ディスプレイ14は例えばカラーディスプレイで構成されており、その画面には、現在位置算出部6から入力された車両現在位置マークと、地図データ検索部9より入力された地図データと、更に地図上に表示する誘導経路や後述する設定地点目印等の付加データとを重ねて表示することができる。

0025

機構スイッチ2は、例えば、ディスプレイ14と一体になったタッチスイッチもしくはメカニカルなスイッチ等が用いられ、経路計算のための目的地や各種入力に使用される。また、リモコンスイッチ3を介しても機構スイッチ2と同じ指示入力をすることができるようにされている。そして、音声認識装置30は、上記機構スイッチ2あるいはリモコンスイッチ3が手動操作により目的地などを指示するために用いられるのに対して、ユーザが音声で入力することによっても同様に目的地などを指示することができるようにするための装置である。なお、操作スイッチ部4としては、必ずしもこれら音声認識装置30、機構スイッチ2及びリモコンスイッチ3の全てを備えていなくてはならないということはなく、どれか一つだけでも所望の指示入力は可能であるが、本実施例では利便性を考えて3つを併有するものとする。

0026

次に、この操作スイッチ部4の一部を構成する音声認識装置30について、図2を参照してさらに詳しく説明する。音声認識装置30は、「音声入力手段」としてのマイク31と、マイク31を介して入力した音声信号をA/D変換などによってデータ処理可能な形態に変換処理する入力信号処理部32と、「認識手段」としての認識処理部33と、「辞書手段」及び「辞書管理手段」としての辞書管理部34と、「認識制御手段」としての認識制御部35とを備えている。

0027

なお、図2には図示していないが、本実施例における音声入力方法は、ユーザがPTT(Push-To-Talk)スイッチを押しながらマイク31を介して音声を入力するという使用方法である。具体的には、入力信号処理部32はPTTスイッチが押されたかどうかを判断しており、PTTスイッチが押されている場合にはマイク31を介しての音声入力処理を実行するが、押されていない場合にはその音声入力処理を実行しないようにしている。したがって、PTTスイッチが押されている間にマイク31を介して入力された音声データのみが認識処理部33へ出力されることとなる。

0028

認識処理部33は、入力信号処理部32から入力された音声データを、設定された辞書データ中に比較対象パターン候補と比較して一致度の高い上位比較対象パターンを認識制御部35へ出力する。入力音声中の単語系列の認識は、入力信号処理部32から入力された音声データを順次音分析して音響的特徴量(例えばケプストラム)を抽出し、この音響分析によって得られた音響的特徴量時系列データを得る。そして、周知のDPマッチング法によって、この時系列データをいくつかの区間に分け、各区間が辞書データとして格納されたどの単語に対応しているかを求める。

0029

なお、認識処理部33から認識制御部35に出力される認識結果は1つとは限らない。例えば認識処理部33における類似判定結果の上位複数の語彙、あるいは認識された複数の語彙のこともある。音声認識技術は、登録された認識対象語と取り込まれた音声のパターンマッチングであるため、一致度の高いものを認識結果として複数出力するのが一般的である。また、認識処理部33から認識制御部35へは、各認識結果に「認識度」をセットにして出力される。例えば都道府県名を認識辞書とした場合、「ワカヤマケン」と「オカヤマケン」のパターンが似ていれば、「岡山県」というユーザの発声に対して上記2つが認識結果として出力されることもあるが、その場合に、「ワカヤマケン」は90%、「オカヤマケン」は80%といった具合である。なお、この具体的数値は実際の認識度を表したものではなく、説明の便宜上用いたものにすぎない。

0030

そして、認識制御部35は、その認識結果を操作制御部5へ出力し、逆に操作制御部5からは状態を取得する。この状態とは、ナビゲーションシステム1が現時点でどのような設定状態にあるのかなどを取得する。そして、その取得した状態に基づき、認識処理部33からの認識結果にてナビゲーション機能の駆動が可能かどうかを判断する。

0031

また、認識制御部35は、辞書管理部34に対し、認識結果に対応する操作候補を要求する。ここで、辞書管理部34に記憶されている辞書について説明する。この辞書には、ナビゲーション機能を駆動する上で必要なコマンド内容を、操作対象コマンド及び操作詳細コマンドという2種類のキーワードに分割した場合の各キーワード間の対応関係を持たせた単語辞書データが記憶されている。具体的には、図3(b)に示すように、操作対象コマンドとして、地図表示、VICS表示、レストラン表示、駅表示、到着予想時刻表示、目的地表示、検索画面表示、周辺施設表示などがある。一方、操作詳細コマンドとしては、渋滞表示、空き道表示、規制表示、駐車場表示、全道路表示高速限定、一般限定などがある。図3(b)においては、VICS表示と、上述した地図表示、VICS表示、レストラン表示などが対応関係にあることを示しているが、同様に、他の操作対象コマンドである地図表示やレストラン表示などにあっても、それぞれ対応関係が設定されている。当然ながら、操作詳細コマンドの駐車場表示は、操作対象コマンドのVICS表示だけでなく、レストラン表示や周辺施設表示との間にも対応関係がある。

0032

辞書管理部34は、認識制御部35から認識結果に対応する操作候補を要求された場合、上述のキーワード間の対応関係に基づき、対応する操作候補を認識制御部35へ提示する。そして、認識制御部35は、その提示された操作候補を、さらに操作制御部5へ通知する。そして、操作制御部5では、この通知された操作候補を、ディスプレイ14に表示してユーザに報知する。

0033

次に、本実施例のナビゲーションシステム1の動作について説明する。なお、音声認識装置30に関係する部分が特徴であるので、ナビゲーションシステムとしての一般的な動作を簡単に説明した後、音声認識装置30に関係する部分の動作について詳しく説明することとする。

0034

ナビゲーションシステム1の電源オン後に、ディスプレイ14上に表示されるメニューから、ドライバーが機構スイッチ2またはリモコンスイッチ3により、案内経路をディスプレイ14に表示させるために経路情報表示処理を選択した場合、あるいは、音声認識装置30を介して希望するメニューをマイク31を介して音声入力することで、上述したスイッチ2,3を介して選択されるのと同様の指示が認識制御部35から操作制御部5へなされた場合、次のような処理を実施する。すなわち、ドライバーがディスプレイ14上の地図に基づいて、音声あるいはスイッチ操作によって目的地を入力すると、現在位置算出部6にて車両の現在地が求められ、目的地と現在地との間に、ダイクストラ法によりコスト計算して、現在地から目的地までの最も短距離の経路を誘導経路として求める処理が行われる。そして、ディスプレイ14上の道路地図に重ねて誘導経路を表示して、ドライバーに適切なルートを案内する。このような誘導経路を求める計算処理案内処理は一般的に良く知られた処理であるので説明は省略する。

0035

また、操作制御部5は、外部情報入出力装置10を介してVICSサービス用の固定局から受信した情報に基づく処理も行う。例えば交通規制、渋滞、空いている道路の案内や、駐車場案内などを行う。なお、この場合、VICSサービス用の固定局からナビゲーションシステム1側へ一方的な情報送信のみ行うものも考えられるが、ナビゲーションシステム1側からサービス用固定局へ、現在位置を通知し、サービス用固定局側において、通知された位置において有効な上記交通規制、渋滞、空いている道路や、駐車場を選択して、ナビゲーションシステム1側へ送信することも好ましい。このようにすれば、真に必要な情報をより的確に得ることができるからである。

0036

次に、音声認識装置30における動作について、図3フローチャートを参照して説明する。起動した際の最初のステップS10においては、ナビゲーションシステム1の状態を取り込む。例えば、目的地を設定するための画面表示をしている状態、目的地を音声入力するようユーザに要求している状態、などを取り込む。

0037

そして、続くS20では、操作詳細コマンドを現在認識中であるか否かを判断する。後述するS90にて操作可能コマンドを操作制御部5へ通知しており、且つ、その後にS100での要求機能の操作制御部5への通知が未だなされていない場合に、「操作詳細コマンドを現在認識中である」と判断する。

0038

操作詳細コマンドを現在認識中の場合には(S20:YES)、辞書管理部34中の音声認識用の辞書の絞り込みを行う(S30)が、操作詳細コマンドを現在認識中でない場合には(S20:NO)、辞書管理部34中の音声認識用の辞書の絞り込みを行わず、通常の辞書設定を行う(S35)。なお、S30での認識辞書の絞り込みについては後述する。

0039

こうして音声認識のための準備が完了すると、S40にて音声認識を行い、S50にて音声認識が成功したかどうかを判断する。なお、音声認識は次のように行う。上述したように、図示しないPTTスイッチが押されている間にマイク31を介して入力された音声データのみが入力信号処理部32から認識処理部33へ出力される。したがって、入力信号処理部32からの音声データの入力があれば、認識処理部33は、辞書管理部34にて設定された辞書データを用いて照合を行い認識処理を実行する。この認識結果としては、上述したように複数出力されるのが一般的であり、また「認識度」もセットにされて出力される。

0040

そして、音声データの取込に異常がある、あるいは辞書データを用いた照合の結果、一致するものがない、などの不具合が検出されれば、音声認識は失敗であるとして(S50:NO)、そのまま本処理ルーチンを終了する。一方、音声認識が成功した場合には(S50:YES)、認識制御部35は、その認識結果からナビゲーションシステム1の機能を駆動可能か否かを判断する(S60)。例えば、ナビゲーションシステム1がその時点で目的地設定モードとなっている場合に「名古屋駅」と音声入力すると、名古屋駅という認識結果だけでも機能駆動が可能であると判断される(S60:YES)。そのため、S100へ移行して要求機能の通知を行う。この場合には「名古屋駅」という認識結果のみを送ればよい。

0041

しかし、同様の状況(目的地設定モードになっている場合)で「VICS表示」とだけ音声入力しても、そのままでは機能駆動できない。そのため、認識結果だけからでは機能駆動できない場合には(S60:NO)、S70へ移行して、キーワード関連辞書の設定を行い、さらにS80にて操作詳細コマンドの検索を行う。

0042

この点を図4を参照して具体的に説明する。図4(a)に示すように、「VICS表示」という音声入力がユーザによってなされた場合には、図4(b)に示すように認識辞書を参照することで、図4(c)に示すように、「VICS表示」という認識結果が得られる。しかし、この場合には、「VICS表示」という認識結果だけでは機能駆動ができないため、図4(b)に示すキーワード関連から操作可能コマンドを検索する。具体的には、図4(b)においてキーワード「VICS表示」に対してリンクの張られている「渋滞表示」、「空き道表示」、「規制表示」、「駐車場表示」、「全道路標示」、「高速限定」、「一般限定」が検索される(図4(d)参照)。そのため、図3のフローチャートのS90では、その検索された操作可能コマンドを操作制御部5へ通知し、本処理ルーチンを一旦終了する。

0043

操作制御部5では、その通知された操作可能コマンドをディスプレイ14へ表示し、ユーザへの提示を行う。その提示を見たユーザは、操作可能コマンドの中から自分の所望のするものを選んで再度発声する。この状況では、図3のフローチャートのS20にて肯定判断されるため、S30にて認識辞書の絞り込みが行われる。つまり、この場合には、「VICS表示」に対してリンクの張られた「渋滞表示」、「空き道表示」、「規制表示」、「駐車場表示」、「全道路表示」、「高速限定」、「一般限定」のみが認識対象の辞書として用意される。この状態でS40の認識処理を行うため、誤認識が発生しにくくなる。

0044

図4(e)に示すように、ユーザが「渋滞表示」と発声した場合には、図4(f)に示すように絞り込まれた辞書を参照して認識処理を行うことにより、適切に渋滞表示という認識結果を得ることができる。そして、この場合の認識結果である「渋滞表示」は操作コマンドとしては「VICS渋滞表示」であるため、S100にて操作制御部5へ要求機能の通知を行う。

0045

このように、本実施例のナビゲーションシステム1の音声認識装置30においては、最初に音声入力した内容だけではナビゲーション機能を駆動できない場合であっても、辞書中において当該入力内容とキーワード関連がある操作可能コマンドを検索し、ディスプレイ14に表示してユーザに提示することができるようにされている。そのため、その表示内容を見たユーザは、その中の所望のコマンドを再度音声入力することができる。つまり、ユーザは、コマンドを正確に覚えていなくても、そのコマンド内容の主要な部分さえ音声入力できれば、それをきっかけとして最終的なコマンド入力ができるため、使い勝手がより向上する。

0046

なお、本実施例の場合には、図3のS30にて辞書の絞り込みを行った場合、その後、通常の音声認識をする場合には(S20:NO)、S35にて通常の辞書を設定するので、何ら問題ない。また、図4に示した具体例では、操作対象コマンドである「VICS表示」のみが音声入力された場合に、それと対応関係にある操作詳細コマンド(例えば上述した「渋滞表示」、「空き道表示」、「駐車場表示」など)を抽出するようにしたが、逆に、操作詳細コマンドから操作対象コマンドを辿ることもできる。例えば上述した「駐車場表示」が音声入力された場合、対応関係を逆に辿るのである。図4(b)では、操作対象コマンド「VICS表示」と操作詳細コマンドとの対応関係しか明示していないが、他の操作対象コマンドである、地図表示、レストラン表示、駅表示、周辺施設表示などについても、同様に操作詳細コマンドとの対応関係が設定されている。

0047

したがって、例えばレストラン表示、駅表示、周辺施設表示の3つについて、それぞれ対応する操作詳細コマンド中に駐車場表示がある場合に、「駐車場表示」という音声入力がされると、キーワード関連を逆に辿ることで、「VICS情報として提供される駐車場情報の表示」なのか、「レストランに完備されている駐車場」の表示なのか、「現在地周辺に存在する駐車場」の表示なのか、という操作可能コマンドを検索することができる。そのため、同様にディスプレイ14に表示してユーザに提示すれば、その表示内容を見たユーザは、その中の所望のコマンドを再度音声入力できる。

0048

[その他]
(1)上述した実施例では、最初に音声入力した内容だけではナビゲーション機能を駆動できない場合に、辞書中において当該入力内容とキーワード関連がある操作可能コマンドを検索してディスプレイ14に表示するようにしたが、例えばスピーカ12から音声にて報知するようにすることもできる。但し、上述したように複数の対応する操作可能コマンドを報知する場合には、ディスプレイ14に一覧表示して、その中から利用者が選択し易くすることが使い勝手の点でも好ましいと考えられる。

0049

(2)また、上述した実施例では、音声認識装置30を車載用のナビゲーションシステム1に適用した例を説明したが、適用先としては、車載用でなくてもよく、さらにはナビゲーション以外のシステムも考えられる。

図面の簡単な説明

0050

図1実施例としてのナビゲーションシステムの概略構成を示すブロック図である。
図2実施例の音声認識装置の概略構成を示すブロック図である。
図3実施例の音声認識装置における処理を示すフローチャートである。
図4音声対話遷移を示す説明図である。

--

0051

1…ナビゲーションシステム2…機構スイッチ
3…リモコンスイッチ4…操作スイッチ部
5…操作制御部 6…現在位置算出部
7…経路計算部 8…案内制御部
9…地図データ検索部 10…外部情報入出力
11…音声出力制御部 12…スピーカ
13…表示制御部 14…ディスプレイ
30…音声認識装置31…マイク
32…入力信号処理部 33…認識処理部
34…辞書管理部35…認識制御部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ