図面 (/)

技術 音声制御システム、音声制御方法、及び音声制御プログラム

出願人 アイシン・エィ・ダブリュ株式会社
発明者 八代宏也
出願日 2014年11月20日 (7年1ヶ月経過) 出願番号 2014-235916
公開日 2016年5月30日 (5年6ヶ月経過) 公開番号 2016-099479
状態 特許登録済
技術分野 航行(Navigation) 音声認識
主要キーワード 調節コマンド 制御音声 リストスクロール 実施環境 送信センター コマンド名称 終点側 音声制御システム
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年5月30日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (4)

課題

ユーザの所望の制御を容易に行う事が可能な、音声制御システム音声制御方法、及び音声制御プログラムを提供すること。

解決手段

音声制御システムは、音声の入力を受け付けマイク3と、前記マイク3にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御部8と、を備える。特に、制御部8は、マイク3にて音声が定常的に入力されているか否かを判断する定常判断制御部8aを備え、制御部8は、定常判断制御部8aにて音声が定常的に入力されていると判断されてから、定常判断制御部8aにて音声が定常的に入力されていないと判断されるまでの間、同一の制御を継続する。

概要

背景

従来、車載用ナビゲーション装置において、地図等の表示情報におけるスクロール速度調整等の指示を受け付けるシステムが提案されている。このような従来のシステムでは、スクロールボタンをユーザが指で継続的に押圧している時間や、タッチパネルをユーザがフリックした長さ等に応じて、スクロールの速度調整を行っていた。しかし、この従来のシステムにおいては、指での操作が煩わしく、また、両手が塞がっている場合には操作が出来なかった。そこで、スクロールの速度調整等をより容易に行うことを可能とするシステムとして、ユーザの音声を認識してスクロール操作を行うシステムが提案されていた(例えば、特許文献1参照)。具体的には、このシステムでは、速度が複数の段階(例えば、「スピード極高」、「スピード高」、「スピード中」、「スピード低」、「スピード極低」)に区分されており、ユーザが、十字キーやタッチパネル等を操作して地図をスクロールしている間に、「速く」という音声を発した場合には、システムがこの音声を認識して解析し、当該解析した音声に応じて、スクロールの速度を一段階(例えば、「スピード中」から「スピード高」へ)速くすることを可能としていた。

概要

ユーザの所望の制御を容易に行う事が可能な、音声制御システム音声制御方法、及び音声制御プログラムを提供すること。音声制御システムは、音声の入力を受け付けるマイク3と、前記マイク3にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御部8と、を備える。特に、制御部8は、マイク3にて音声が定常的に入力されているか否かを判断する定常判断制御部8aを備え、制御部8は、定常判断制御部8aにて音声が定常的に入力されていると判断されてから、定常判断制御部8aにて音声が定常的に入力されていないと判断されるまでの間、同一の制御を継続する。

目的

本発明は、上記に鑑みてなされたものであって、音声入力によって、ユーザの所望の制御を容易に行う事が可能な音声制御システム、音声制御方法、及び音声制御プログラムを提供する

効果

実績

技術文献被引用数
0件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

音声の入力を受け付け音声入力受付手段と、前記音声入力受付手段にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御手段と、を備える、音声制御システム

請求項2

前記制御手段は、前記音声入力受付手段にて前記音声が定常的に入力されているか否かを判断する定常判断制御手段を備え、前記制御手段は、前記定常判断制御手段にて前記音声が定常的に入力されていると判断されてから、前記定常判断制御手段にて前記音声が定常的に入力されていないと判断されるまでの間、前記同一の制御を継続する、請求項1に記載の音声制御システム。

請求項3

前記音声入力受付手段にて受け付けられた音声を解析する音声解析手段を備え、前記制御手段は、前記音声解析手段にて前記音声が制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続する、請求項1又は2に記載の音声制御システム。

請求項4

前記制御手段は、車両に搭載された車載装置を制御する、請求項1から3のいずれか一項に記載の音声制御システム。

請求項5

音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御工程と、を含む、音声制御方法

請求項6

音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御工程と、をコンピュータに実行させるための音声制御プログラム

技術分野

0001

本発明は、音声制御システム音声制御方法、及び音声制御プログラムに関する。

背景技術

0002

従来、車載用ナビゲーション装置において、地図等の表示情報におけるスクロール速度調整等の指示を受け付けるシステムが提案されている。このような従来のシステムでは、スクロールボタンをユーザが指で継続的に押圧している時間や、タッチパネルをユーザがフリックした長さ等に応じて、スクロールの速度調整を行っていた。しかし、この従来のシステムにおいては、指での操作が煩わしく、また、両手が塞がっている場合には操作が出来なかった。そこで、スクロールの速度調整等をより容易に行うことを可能とするシステムとして、ユーザの音声を認識してスクロール操作を行うシステムが提案されていた(例えば、特許文献1参照)。具体的には、このシステムでは、速度が複数の段階(例えば、「スピード極高」、「スピード高」、「スピード中」、「スピード低」、「スピード極低」)に区分されており、ユーザが、十字キーやタッチパネル等を操作して地図をスクロールしている間に、「速く」という音声を発した場合には、システムがこの音声を認識して解析し、当該解析した音声に応じて、スクロールの速度を一段階(例えば、「スピード中」から「スピード高」へ)速くすることを可能としていた。

先行技術

0003

特開2005−221244号公報

発明が解決しようとする課題

0004

しかし、特許文献1のような音声による入力システムでは、指での操作による煩わしさが解消されるという利点や、両手が塞がっている場合であっても操作が可能になるという利点があるが、操作対象パラメータの種類によっては、ユーザが所望の制御を容易に行えない可能性があった。すなわち、特許文献1に係る技術では、速度等のパラメータを複数の段階に区分する必要があるが、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを複数の段階に区分してしまうと、パラメータの連続性が損なわれてしまう結果、ユーザが所望の制御を容易に行えない可能性があった。例えば、特許文献1に係る技術において、速度を比較的多くの段階に区分すると、ユーザの所望の速さとするまでに何度も音声入力しなければならないために容易な入力が行えず、一方、速度を比較的少ない段階に区分すると、ユーザの所望の速さに設定する事が出来ない可能性があった。そこで、音声入力の利点を活かしつつ、ユーザの所望の制御を容易に行う事が可能なシステムが要望されていた。

0005

本発明は、上記に鑑みてなされたものであって、音声入力によって、ユーザの所望の制御を容易に行う事が可能な音声制御システム、音声制御方法、及び音声制御プログラムを提供することを目的とする。

課題を解決するための手段

0006

上述した課題を解決し、目的を達成するために、本発明に係る音声制御システムは、音声の入力を受け付ける音声入力受付手段と、前記音声入力受付手段にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御手段と、を備える。

0007

また、本発明に係る音声制御方法は、音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御工程と、を含む。

0008

また、本発明に係る音声制御プログラムは、音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御工程と、をコンピュータに実行させる。

発明の効果

0009

本発明に係る音声制御システム、音声制御方法、及び音声制御プログラムによれば、音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換えるので、音声入力によって、ユーザの所望の制御を容易に行う事が可能となる。特に、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを制御する場合においても、パラメータを複数の段階に区分する必要がないので、パラメータの連続性を損ねることがなく、ユーザの所望の制御を容易に行う事が可能となる。

図面の簡単な説明

0010

本発明の実施の形態に係る音声制御システムを例示するブロック図である。
制御音声テーブルに格納されている制御音声情報を示す表である。
音声制御処理フローチャートである。

実施例

0011

以下、本発明に係る音声制御システム、音声制御方法、及び音声制御プログラムの実施の形態について図面を参照しつつ詳細に説明する。ただし、実施の形態によって本発明が限定されるものではない。

0012

〔実施の形態の基本的概念
まず、実施の形態の基本的概念を説明する。この実施の形態は、概略的に、ユーザの音声入力を受け付けて制御を行う音声制御システムに関する。なお、当該音声制御システムは、ユーザの音声入力に基づいて制御可能な様々な機器に適用できるが、本実施の形態では、車両に搭載された車載用ナビゲーション装置(以下、車載装置)に適用されるものとして説明する。ただし、例えば、スマートフォン携帯用ナビゲーション装置空調機器映像機器、又は音響機器のような車載装置とは一切異なる分野の機器に対しても同様の音声制御システムを好適に適用する事ができる。

0013

ここで、本実施の形態では、ユーザが制御内容の音声入力を行う際において、語尾を伸ばして発声を行う場合があるが、この場合には伸ばされた語尾の部分を「〜」と表記して説明する。ここで、「語尾」とは、ユーザが発声した最後の語(音節)であるが、最後の語が複数の音(例えば、子音母音)によって構成される場合には、これら複数の音のうちの最後の音を意味する。例えば、日本語の単語の場合には、1つの語の最後の音は母音であるため、この母音が「語尾」になる。具体的には、ユーザが日本語の「右」の語尾を伸ばして発声を行った場合、「右」に対応する音は「みぎ」であり、ユーザが発声した最後の語(音節)は「ぎ」である。そして、この「ぎ」の最後の音は母音「い」であるため、語尾は「い」になる。この場合には「右〜」と表記する。

0014

〔実施の形態の具体的内容
次に、実施の形態の具体的内容について説明する。

0015

(構成)
本実施の形態では、車載装置に音声制御プログラムをインストールすることにより、車載装置が音声制御システムとして機能する場合について説明する。なお、上述したように、この他にも、例えば、スマートフォン、携帯用ナビゲーション装置、空調機器、映像機器、又は音響機器を含む任意の装置に音声制御プログラムをインストールすることによって音声制御システムを構成してもよい。また、音声制御システムにおける車載装置としての機能については、公知の車載装置と同様の構成により得ることができるので、その説明は省略することとし、以下では、特に音声制御を達成するための構成について説明する。なお、以下では、この音声制御システムを搭載した特定の車両(車載装置を操作するユーザが搭乗する車両)を単に「車両」と称して説明する。なお、「車両」には、自動四輪車自動二輪車、及び自転車が含まれるが、以下では、車両が自動四輪車である場合について説明する。

0016

(構成)
最初に、車載装置1の構成を説明する。図1は、本実施の形態に係る音声制御システムを例示するブロック図である。図1に示すように、車載装置1は、概略的に、スピーカ2、マイク3、タッチパネル4、ディスプレイ5、現在位置取得部6、通信部7、制御部8、及びデータ記録部9を備えている。

0017

(構成−スピーカ)
スピーカ2は、制御部8の制御に基づいて情報を音声にて出力する音声出力手段である。このスピーカ2から出力される音声の具体的な態様は任意であり、必要に応じて生成された合成音声や、予め録音された音声を出力することができる。

0018

(構成−マイク)
マイク3は、各種の入力を受け付ける複数の入力手段のうちの1つであって、音声の入力を受け付ける音声入力受付手段である。このマイク3としては、公知のマイクロフォンを用いることができる。

0019

(構成−タッチパネル)
タッチパネル4は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル4は、透明又は半透明状に形成され、ディスプレイ5の前面において当該ディスプレイ5の表示面と重畳するように設けられている。このタッチパネル4としては、例えば、抵抗膜方式静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。

0020

(構成−ディスプレイ)
ディスプレイ5は、音声制御システムによって案内された画像を表示する表示手段であり、特に、後述する地図データベース(以下、データベースを「DB」と称する)9aに格納された地図情報に基づいて地図を表示する表示手段である。このディスプレイ5の具体的な構成は任意であり、公知の液晶ディスプレイ有機ELディスプレイの如きフラットパネルディスプレイを使用することができる。

0021

(構成−現在位置取得部)
現在位置取得部6は、車両の現在位置を取得する現在位置取得手段である。例えば、現在位置取得部6は、GPS、地磁気センサ距離センサ、又はジャイロセンサ(いずれも図示省略)の少なくとも一つにより検出した現在の車載装置1の位置(座標)及び方位等を、公知の方法にて取得する。

0022

(構成−通信部)
通信部7は、センター装置(図示省略)との間でネットワークを介した通信を行う通信手段である。この通信手段の具体的な種類や構成は任意であるが、例えば、公知の移動体無線通信手段や、FM多重放送ビーコンを介した公知のVICS(登録商標)システム用の無線通信手段を用いることができる。

0023

(構成−制御部)
制御部8は、車載装置1を制御する制御手段であり、特に、マイク3にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御手段である。具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、本実施の形態に係る音声制御プログラムは、任意の記録媒体又はネットワークを介して車載装置1にインストールされることで、制御部8の各部を実質的に構成する。

0024

この制御部8は、機能概念的に、定常判断制御部8a、及び音声解析部8bを備えて構成されている。定常判断制御部8aは、マイク3にて音声が定常的に入力されているか否かを判断する定常判断制御手段である。音声解析部8bは、マイク3にて受け付けられた音声を解析する音声解析手段である。なお、これら制御部8の各部により行われる具体的な処理については後述する。

0025

(構成−データ記録部)
データ記録部9は、車載装置1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記録装置としてのハードディスク(図示省略)を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、磁気ディスクの如き磁気的記録媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。このデータ記録部9は、地図DB9a、発話例DB9b、及び、制御音声テーブル9cを備えている。

0026

地図DB9aは、地図情報を格納する地図情報格納手段である。ここで、「地図情報」とは、道路道路構造物施設等を含む各種の位置の特定に必要な情報であり、例えば、道路上に設定された各ノードに関するノードデータノード番号、座標)や、道路上に設定された各リンクに関するリンクデータ(リンクID、リンク名、始点側接続ノード番号、終点側接続ノード番号、道路座標道路種別(例えば、有料道路一般道路等)、道路情報地物データ信号機道路標識ガードレール、施設等)、及び地形データ等を含んで構成されている。

0027

発話例DB9bは、ユーザの入力音声の内容を特定するための発話例情報を格納する発話例格納手段である。具体的に、この発話例DB9bは、制御音声のスペクトル情報と、各スペクトル情報を一意に特定するスペクトルIDとを相互に関連付けて格納している。ここで、「スペクトル情報」とは、音声解析部8bの音声解析に使用される情報であって、例えば、音声情報(WAV情報)をフーリエ解析して導出された情報である。また、「制御音声」とは、車載装置1に対する詳細な制御の内容(例えば、「上」、「下」等。以下、「制御内容」)を含む、語尾を伸ばした音声であり、例えば、「上〜」、「下〜」、「右〜」、「左〜」、「拡大〜」、「縮小〜」、「左回り〜」、「右回り〜」、「左回転〜」、「右回転〜」等の言葉が該当する。すなわち、従来技術においては、通常ユーザは語尾を伸ばして発声することはないので、ユーザの入力音声を特定するために語尾を伸ばさない音声のスペクトル情報を格納しているが、本実施の形態においては、ユーザが語尾を伸ばして発声した際の入力音声の内容を特定するので、このように語尾を伸ばした音声のスペクトル情報を格納している。なお、入力音声の内容を特定する具体的な方法については後述する。また、「スペクトルID」は、各制御音声(「上〜」、「下〜」、「右〜」等)に対してそれぞれ割り当てられた識別情報であり、例えば、「0001」、「0002」、「0003」等といった通し番号である。なお、これらの発話例情報を発話例DB9bに格納するタイミングは任意で、例えば、工場出荷時に予め格納しても良いし、プログラムのアップデート時等に送信センター(図示省略)から通信部7を介して情報を受信して格納しても良い。また、ユーザによる音声入力を参照して学習し、発話例DB9bに格納されたスペクトル情報をユーザに適した情報に修正したり、新たなスペクトル情報を追加したりしても良い。

0028

制御音声テーブル9cは、制御音声情報を格納する制御音声格納手段である。図2は、制御音声テーブル9cに格納されている制御音声情報を示す表である。この図2に示すように、制御音声テーブル9cには、項目コマンド名称」、項目「スペクトルID」、及び項目「制御音声」に対応する情報が相互に関連付けられて格納されている。

0029

ここで、項目「コマンド名称」に対応して格納される情報は、音声制御システムが実行する制御の種類(コマンド)を示す情報であって、図2に示すように、ディスプレイ5に表示された地図を特定の方向へスクロールさせるコマンドである「地図スクロール」、ディスプレイ5に表示された地図の縮尺を変化させるコマンドである「地図縮尺」、ディスプレイ5に表示された地図の方位を回転させるコマンドである「地図方位」、目的地候補等のリストをスクロールさせるコマンドである「リストスクロール」、及びスピーカ2のボリュームを変化させるコマンドである「ボリューム」が格納されている。

0030

また、項目「スペクトルID」に対応して格納される情報は、発話例DB9bに格納されたスペクトルIDのうち項目「コマンド名称」に対応する複数のスペクトルIDである。

0031

また、項目「制御音声」に対応して格納される情報は、各スペクトルIDにより一意に特定される制御音声である。なお、これらの制御音声情報を制御音声テーブル9cに格納するタイミングは任意で、例えば、工場出荷時に予め格納しても良いし、プログラムのアップデート時等に送信センター(図示省略)から通信部7を介して情報を受信して格納しても良い。

0032

(音声制御処理)
次に、このように構成される音声制御システムによって実行される音声制御処理について説明する。

0033

この音声制御処理は、概略的に、ユーザが入力した音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える処理であって、本実施の形態では特に、語尾の長さに応じて車載装置1のディスプレイ5の表示内容を制御する処理について説明する。なお、この音声制御処理を実行するタイミングは任意であり、例えば、本実施の形態では車載装置1の電源オンとなり、ユーザによって特定のコマンドモードに設定された際に、自動的に実行されるものとして説明する。なお、このコマンドモードとは、特定のコマンドを実行するためのモードであって、例えば、制御音声テーブル9cの項目「コマンド名称」に対応する5つのモードである「スクロールモード」、「地図縮尺モード」、「地図方位モード」、「リストスクロールモード」、及び「ボリュームモード」の中からユーザに選択されて設定される。このコマンドモードを設定する方法は任意で、例えば、ユーザがタッチパネル4を指で操作して設定しても良い。また、ユーザがマイク3を介して「スクロールモード」、又は「地図縮尺モード」等を音声で入力し、入力された音声を制御部8が解析することにより、特定されたコマンドモードに設定しても良い。なお、このようにコマンドモードの設定を行うための音声解析の具体的な構成や方法については公知であるため、詳細な説明を省略する。以下では、コマンドモードが「スクロールモード」に設定されているものとして説明を行う。

0034

図3は、音声制御処理のフローチャートである。まず、SA1において制御部8は、マイク3に入力された音声の振幅閾値以上となったか否かを判定する。この判定の具体的な方法は任意であるが、例えば、車載装置1に公知のデジタル振動センサを設け、このデジタル振動センサにてマイク3を介して入力された音の振幅を測定しても良い。なお、閾値は任意の値に設定できるが、例えば、人の通常の会話時における音声の振幅と同程度の振幅に設定しても良い。

0035

そして、振幅が閾値以上でない場合(SA1、No)、ユーザによる音声入力が無いものとし、SA1を繰り返すことにより、振幅が閾値以上となるまで待機する。また、振幅が閾値以上である場合(SA1、Yes)、ユーザによる音声入力が有ったものとし、SA2に移行する。

0036

そして、SA2において制御部8は、音声入力記録を開始する。具体的には、ユーザによってマイク3を介して入力された音声を、データ記録部9に随時記録する。この記録の具体的な方法は任意であるが、例えば、音声情報(例えば、WAV情報)をデータ記録部9に記録する。

0037

次に、SA3において定常判断制御部8aは、ユーザの音声が定常となったか否かを判定する。「定常」とは、略同一の音が基準時間(例えば、0.5秒)を超えて連続で繰り返されている状態の事を指し、例えば、「上〜」というように音声の語尾が基準時間伸ばされている状態が該当する。この判定には公知の方法を採用でき、例えば、データ記録部9に記録された音声情報をフーリエ解析してスペクトル情報を導出し、当該導出したスペクトル情報に同一音声のスペクトルが現在時刻から直近の基準時間連続で繰り返されている場合に、音声の語尾が基準時間伸ばされている(すなわち、ユーザの音声が定常となった)と判定してもよい。なお、基準時間の具体的な決定方法数値は任意であるが、例えば、音声の語尾を伸ばすことを意図することなくユーザが音声を発した場合において、同一音声が連続で繰り返される最長時間を実験等で求め、この最長時間を超える時間を基準時間として設定する。また、上記のスペクトル情報以外の情報に基づいて、定常となったか否かの判定を行っても良く、例えばフーリエ解析される以前の音声情報(例えば、WAV情報)に基づいて判定を行っても良い。例えば、音声情報そのものの振幅が例えば基準時間(例えば、0.5秒)収束状態にある場合、定常となったと判定しても良い。

0038

そして、定常となっていない場合(SA3、No)、例えば、「上〜」という音声においては「う」や「え」の音声が入力されている場合等は、SA3を繰り返すことにより、定常となるまで待機する。一方、定常となった場合(SA3、Yes)、例えば、「上〜」という音声において「〜」という語尾の部分の音声が入力されている場合には、SA4に移行する。

0039

SA4において音声解析部8bは、データ記録部9に記録された音声情報を解析し、ユーザによる入力音声を特定する。具体的には、音声解析部8bは、マイク3を介して入力された音声情報を解析してスペクトル情報を求め、このスペクトル情報における語頭の部分(音声入力が開始されてから、SA3にて定常となったと判断されるまでの部分)と、発話例DB9bに格納されている制御音声のスペクトル情報とを比較し、略一致する音声を探索することにより、入力音声を特定する。このように、従来は、音声が入力されてから音声が途切れるまでの部分を解析するのが通常であったのに対し、本実施の形態においては音声が入力されてから音声が定常となるまでの部分を解析するが、発話例DB9bには語尾を伸ばした制御音声のスペクトル情報が格納されているので、好適に入力音声を特定する事ができる。なお、音声情報の解析は、上述のようにスペクトル情報の比較ではなく、WAV情報の比較によって行ってもよい。

0040

次に、SA5において音声解析部8bは、ユーザによる入力音声が、設定されたコマンドに対応する制御音声であるか否かを判定する。具体的には、まず音声解析部8bは、発話例DB9bを参照して、SA4にて特定した音声のスペクトルIDを特定する。次に音声解析部8bは、制御音声テーブル9cを参照し、設定されたモード(本実施の形態ではスクロールモード)のコマンドに対応するスクロールIDとして、上述のように特定したスペクトルIDが含まれるか否かを判定する。そして、音声解析部8bは、設定されたコマンドに対応するスペクトルIDが含まれないと判定した場合、ユーザによる入力音声が、設定されたコマンドに対応する制御音声でないものとし(SA5、No)、音声制御処理を終了する。また、音声解析部8bは、設定されたコマンドに対応するスペクトルIDが含まれると判定した場合、ユーザによる入力音声が、設定されたコマンドに対応する制御音声であるものとし(SA5、Yes)、SA6に移行する。

0041

SA6において制御部8は、制御を実行する。具体的には制御部8は、設定されたコマンドモード(本実施の形態では「スクロールモード」)を特定し、SA4にて特定した制御音声が示す制御内容(本実施の形態では「上」)を特定し、これらの2つに基づいて具体的な制御を実行する。例えば、本実施の形態では、制御部8は、ディスプレイ5に表示された地図を、基準の速度で、基準の量だけ、上方向にスクロールさせる。

0042

次に、SA7において定常判断制御部8aは、ユーザの音声が未だに定常であるか否かを判定する。例えば、「上〜」という音声の語尾の部分が、未だに定常的に繰り返されているか否かを判定する。ただし、この判定の具体的な方法については、SA3と同様に説明できるので、説明を省略する。そして、定常であると判定した場合(SA7、Yes)、SA6において再度同様の制御を実行した後、SA7において再度定常であるか否かの判定を行う。すなわち、ユーザが語尾を伸ばし続けている限り、SA6及びSA7の処理を繰り返し実行することによって、SA6において同様の制御を連続的に実行し続ける。このことにより、例えば、ディスプレイ5に表示された地図を上方向へと移動し続ける事ができる。なお、本実施の形態においては2回目以降のスクロールも、1回目のスクロールと同様の速度で移動させるが、これに限らず、2回目以降は制御を重ねる度に速度を上昇又は下降させていっても構わない。以上にて、音声制御処理の説明を終了する。

0043

〔実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した本発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。

0044

(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏することがある。例えば、音声入力によって、ユーザの所望の制御を容易に行う事が出来ない場合であっても、従来と異なる技術によりユーザの所望の制御を行う事が出来ている場合には、本願発明の課題が解決されている。

0045

(分散や統合について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散や統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷使用状況などに応じて、任意の単位で機能的または物理的に分散又は統合して構成できる。例えば、車載装置1を、相互に通信可能に構成された複数の装置に分散して構成し、これら複数の装置の一部に定常判断制御部8aを設けると共に、これら複数の装置の他の一部に音声解析部8bを設けてもよい。

0046

(形状、数値、構造、時系列について)
実施の形態や図面において例示した構成要素に関して、形状、数値、又は複数の構成要素の構造若しくは時系列の相互関係については、本発明の技術的思想の範囲内において、任意に改変及び改良することができる。

0047

(制御内容について)
本実施の形態では、制御内容として上方向のスクロールを行うものとして説明したが、他の制御内容についても同様に、ユーザの入力音声の語尾の長さに応じて処理を継続する事ができる。例えば、下方向、左方向、右方向、右上方向、左上方向等についても実施の形態と同様に説明する事ができる。また、他のコマンドについても同様に説明する事ができ、例えば、地図縮尺コマンドについては、ユーザの「拡大〜」や「縮小〜」という音声入力があった場合に、語尾の長さに応じて一定の速度で地図縮尺を拡大や縮小していく制御を行う事ができる。なお、この際に、語尾の長さに応じて拡大していく速度や縮小していく速度を上昇させていっても構わない。また、音声制御システムとして構成される装置(本実施の形態では、車載装置1)以外の装置を制御するシステムとして構成しても構わない。例えば、車載装置1と車両に搭載された空調機器とを相互にリンクさせて、ユーザの「上げて〜」という入力音声の語尾の長さに応じて、一定の速度で空調機器の送風温度や風量を上昇させていく制御を行う事としても良い。

0048

また、本実施の形態では、5種類のコマンドのみを明記したが、その他のコマンドについても、適宜制御音声テーブル9cに追加して、同様に説明する事が可能である。例えば、「上〜」、「下〜」等の音声入力に応じてディスプレイ5の輝度を調節する「輝度調節コマンド」や、「暑い〜」、「寒い〜」等の音声入力に応じて空調機器の風量を調節する「風量調節コマンド」や、「開けて〜」、「閉めて〜」等の音声入力に応じて車両の窓の開度を調節する「窓調節コマンド」等を適用しても構わない。

0049

また、本実施の形態では、ユーザによる音声入力の語尾の長さに応じて、同一の制御を継続するものとして説明したが、これに限らず、音声入力の語尾の長さに応じて制御の種類を切換えるものとしても良い。例えば、「モード〜」という音声入力に応じて、設定されたコマンドモードを所定時刻間隔で切換えていっても構わない。すなわち、連続性のあるパラメータを制御する場合に限定されず、非連続的なパラメータやコマンドを制御しても良い。

0050

(制御音声について)
また、本実施の形態ではコマンドモードの設定を行った後に、音声入力を行うものとしたが、これらを同時に行うものとしても良い。具体的には、発話例DB9bに制御音声として「スクロール上〜」や「スクロール下〜」といった音声を格納しておき、ユーザによって同様の音声入力が行われた場合には、スクロールモードに設定しつつ、上方向へのスクロールを語尾の長さに応じて継続しても良い。このような制御によれば、コマンドモードの設定を省略する事が可能となる。

0051

また、本実施の形態では、制御音声として「上〜」、「下〜」等といった制御内容の語尾を伸ばした音声を適用したが、これに限られない。例えば、制御内容を含まない単なる音声「あ〜」や「い〜」等の語尾に応じて制御を継続したり制御の種類を切換えたりしても良い。具体的には、「あ〜」という音声が入力された場合、語尾の長さに応じて上方向に地図をスクロールするように構成し、「い〜」という音声が入力された場合、語尾の長さに応じて下方向に地図をスクロールするように構成しても良い。

0052

〔実施の形態の特徴と効果の一部〕
最後に、これまでに説明した実施の形態の特徴と効果の一部を、以下に例示する。ただし、実施の形態の特徴と効果は、以下の内容に限定されず、以下の特徴の一部のみを具備することによって以下の効果の一部のみを奏する場合や、以下の特徴以外の他の特徴を具備することによって以下の効果以外の他の効果を奏する場合がある。

0053

実施の形態の1つの側面1に係る音声制御システムは、音声の入力を受け付ける音声入力受付手段と、前記音声入力受付手段にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御手段と、を備える。

0054

上記側面1に係る音声制御システムによれば、音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換えるので、音声入力によって、ユーザが所望の制御を容易に行う事が可能となる。特に、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを制御する場合においても、パラメータを複数の段階に区分する必要がないので、パラメータの連続性を損ねることがなく、ユーザの所望の制御を容易に行う事が可能となる。

0055

実施の形態の他の側面2に係る音声制御システムは、上記側面1に係る音声制御システムにおいて、前記制御手段は、前記音声入力受付手段にて前記音声が定常的に入力されているか否かを判断する定常判断制御手段を備え、前記制御手段は、前記定常判断制御手段にて前記音声が定常的に入力されていると判断されてから、前記定常判断制御手段にて前記音声が定常的に入力されていないと判断されるまでの間、前記同一の制御を継続する。

0056

上記側面2に係る音声制御システムによれば、制御内容を含む制御音声が入力された場合に、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続するので、ユーザが制御内容を他の手段で入力する手間等を省略する事ができ、より簡素に制御内容を指示する事が可能となる。

0057

実施の形態の他の側面3に係る音声制御システムは、上記側面1又は側面2に係る音声制御システムにおいて、前記音声入力受付手段にて受け付けられた音声を解析する音声解析手段を備え、前記制御手段は、前記音声解析手段にて前記音声が制御内容を含む制御音声であると解析された場合、当該制御音声が示す制御内容を、当該制御音声の語尾の長さに応じて継続する。

0058

上記側面3に係る音声制御システムによれば、音声が定常的に入力されていると判断されてから、音声が定常的に入力されていないと判断されるまでの間、同一の制御を継続するので、音声が定常的に繰り返されている時間に応じて同一の制御を継続する事ができ、ユーザにとって容易な制御が可能となる。

0059

実施の形態の他の側面4に係る音声制御システムは、上記側面1から側面4のいずれかに係る音声制御システムにおいて、前記制御手段は、車両に搭載された車載装置を制御する。

0060

上記側面4に係る音声制御システムによれば、制御手段は、車両に搭載された車載装置を制御するので、車両の運転時等の手が離せない場合等においても、ユーザが音声を発する事で、語尾の長さに応じた容易な操作が可能となる。

0061

実施の形態の他の側面5に係る音声制御方法は、音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御工程と、を含む。

0062

上記側面5に係る音声制御方法によれば、音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換えるので、音声入力によって、ユーザの所望の制御を容易に行う事が可能となる。特に、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを制御する場合においても、パラメータを複数の段階に区分する必要がないので、パラメータの連続性を損ねることがなく、ユーザの所望の制御を容易に行う事が可能となる。

0063

実施の形態の他の側面6に係る音声制御プログラムは、音声の入力を受け付ける音声入力受付工程と、前記音声入力受付工程にて受け付けられた音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換える制御工程と、をコンピュータに実行させる。

0064

上記側面6に係る音声制御プログラムによれば、音声の語尾の長さに応じて、同一の制御を継続し、又は制御の種類を切換えるので、音声入力によって、ユーザの所望の制御を容易に行う事が可能となる。特に、スクロールのスピードやスクロールの移動量のような連続性のあるパラメータを制御する場合においても、パラメータを複数の段階に区分する必要がないので、パラメータの連続性を損ねることがなく、ユーザの所望の制御を容易に行う事が可能となる。

0065

1車載装置
2スピーカ
3マイク
4タッチパネル
5ディスプレイ
6 現在位置取得部
7通信部
8 制御部
8a定常判断制御部
8b音声解析部
9データ記録部
9a 地図DB
9b発話例DB
9c制御音声テーブル

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ