図面 (/)

技術 情報処理装置、情報処理方法及びプログラム

出願人 ソニー株式会社
発明者 櫻田瑛子繁田脩佐藤斉昭古賀康之山本一幸
出願日 2011年7月22日 (8年11ヶ月経過) 出願番号 2011-160592
公開日 2013年2月4日 (7年4ヶ月経過) 公開番号 2013-025605
状態 特許登録済
技術分野 音声入出力 音声認識 可聴帯域変換器用回路 可聴帯域変換器の回路等
主要キーワード 二乗処理 センサ感知 携帯型オーディオプレイヤ 音声値 ノイズキャンセラー 通話口 ビジュアルフィードバック 図ステップ
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2013年2月4日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (17)

課題

音声入力モードになったことをユーザに確実に報知する。

解決手段

状態検出部と、タッチセンサと、マイクロフォンと、制御部とを有する情報処理装置が提供される。上記状態検出部は、当該情報処理装置の第1の状態変化を検出可能である。上記タッチセンサは、ユーザのタッチを検出可能である。上記マイクロフォンは、入力された上記ユーザの音声音声信号に変換可能である。上記制御部は、上記音声信号を文字情報として認識する音声入力モードを実行可能である。また制御部は、上記第1の状態変化が検出された場合に、上記音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドを生成可能である。さらに制御部は、上記第1の状態変化に続いて上記タッチが検出された場合に、上記音声入力モードが実行可能な状態であることを示す第2の画像の出力するための第2のコマンドを生成可能である。

概要

背景

従来から、音声(ユーザの声)を検出及び認識してそれに応じた処理を行う情報処理装置が存在する。例えば下記特許文献1には、角度検出部により音声入力装置の角度を検出し、距離検出部によりユーザとの距離を検出し、検出した角度及び距離に基づいて音声入力部のオンオフを制御する音声入力装置が記載されている。この音声入力装置は、当該装置がユーザの口元に近づいたことを検出して音声入力モードオンにすることができる。

概要

音声入力モードになったことをユーザに確実に報知する。状態検出部と、タッチセンサと、マイクロフォンと、制御部とを有する情報処理装置が提供される。上記状態検出部は、当該情報処理装置の第1の状態変化を検出可能である。上記タッチセンサは、ユーザのタッチを検出可能である。上記マイクロフォンは、入力された上記ユーザの音声を音声信号に変換可能である。上記制御部は、上記音声信号を文字情報として認識する音声入力モードを実行可能である。また制御部は、上記第1の状態変化が検出された場合に、上記音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドを生成可能である。さらに制御部は、上記第1の状態変化に続いて上記タッチが検出された場合に、上記音声入力モードが実行可能な状態であることを示す第2の画像の出力するための第2のコマンドを生成可能である。

目的

以上のような事情に鑑み、本技術の目的は、音声入力モードになったことをユーザに確実に報知することが可能な情報処理装置、情報処理方法及びプログラムを提供する

効果

実績

技術文献被引用数
1件
牽制数
2件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

情報処理装置であって、当該情報処理装置の第1の状態変化を検出可能な状態検出部と、ユーザのタッチを検出可能なタッチセンサと、入力された前記ユーザの音声音声信号に変換可能なマイクロフォンと、前記音声信号を文字情報として認識する音声入力モードを実行可能であり、前記第1の状態変化が検出された場合に、前記音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドを生成可能であり、前記第1の状態変化に続いて前記タッチが検出された場合に、前記音声入力モードが実行可能な状態であることを示す第2の画像を出力するための第2のコマンドを生成可能な制御部とを具備する情報処理装置。

請求項2

請求項1に記載の情報処理装置であって、前記第1のコマンド及び前記第2のコマンドを外部の表示装置送信可能な通信部をさらに具備する情報処理装置。

請求項3

請求項1に記載の情報処理装置であって、筐体をさらに具備し、前記状態検出部は、前記筐体の角度を検出可能な角度センサを有し、前記制御部は、前記筐体の角度が所定角度範囲になったことが検出された場合に前記第1のコマンドを生成可能である情報処理装置。

請求項4

請求項1に記載の情報処理装置であって、前記第2の画像は、前記第1の画像の一部が変化した画像である情報処理装置。

請求項5

請求項1に記載の情報処理装置であって、前記制御部は、前記第2の画像が出力された状態で、前記マイクロフォンに前記ユーザの音声が入力された場合に、前記第2の画像に代えて第3の画像を出力するための第3のコマンドを生成可能である情報処理装置。

請求項6

請求項1に記載の情報処理装置であって、前記制御部は、前記タッチが検出されなくなった場合に、前記音声入力モードを終了する情報処理装置。

請求項7

請求項1に記載の情報処理装置であって、前記状態検出部は、当該情報処理装置の第2の状態変化を検出可能であり、前記制御部は、前記音声信号の認識中に前記第2の状態変化が検出された場合に、当該音声信号の認識を中止する情報処理装置。

請求項8

請求項1に記載の情報処理装置であって、ネットワーク上の検索エンジンと通信可能な通信部をさらに具備し、前記制御部は、前記認識された文字情報を含む認識結果画像を出力するためのコマンドを生成し、前記認識された文字情報をキーとした検索処理を要求する検索要求情報を前記通信部により前記検索エンジンへ送信する情報処理装置。

請求項9

請求項8に記載の情報処理装置であって、前記状態検出部は、当該情報処理装置の第2の状態変化を検出可能であり、前記認識結果画像は、前記認識された文字情報が表示される第1の領域と、当該第1の領域とは異なる第2の領域とを有し、前記制御部は、第1の文字情報が認識された場合に、当該第1の文字情報を前記第1の領域へ表示させ、前記第1の文字情報の認識後、所定時間内に前記第2の状態変化が検出された場合に、前記第1の文字情報を前記第1の領域から前記第2の領域へ移動させ、前記第2の状態変化の検出後に第2の文字情報が認識された場合に、前記第2の文字情報を前記第1の領域へ表示させ、前記第2の文字情報の認識後、前記所定時間内に前記第2の状態変化が検出されない場合に、前記第1の文字情報と前記第2の文字情報とをキーとした検索処理を要求する検索要求情報を送信する情報処理装置。

請求項10

請求項1に記載の情報処理装置であって、前記タッチセンサは、前記音声入力モード以外のモードにおいてそれぞれ異なる機能が割り当てられた複数のタッチ領域を有し、前記制御部は、前記音声入力モードの準備状態及び実行可能状態においては、前記複数の領域に割り当てられた機能を無効にする情報処理装置。

請求項11

請求項1に記載の情報処理装置であって、前記タッチセンサは、複数のポイントに対するタッチを同時に検出可能であり、前記制御部は、前記複数のポイントに対するタッチが検出されている場合は、前記第1の状態変化が検出されても前記第1のコマンドを生成しない情報処理装置。

請求項12

請求項2に記載の情報処理装置であって、前記表示装置は音声を出力可能であり、前記制御部は、前記第1の状態変化が検出された場合に、前記表示装置により出力される音声の音量下げるための音量コマンドを生成し、当該音量コマンドを前記通信部により送信する情報処理装置。

請求項13

請求項1に記載の情報処理装置であって、前記制御部は、前記マイクロフォンへの前記音声の入力レベルが第1の値以下であることを示す画像を出力するためのコマンドと、前記マイクロフォンへの前記音声の前記入力レベルが第2の値よりも大きいことを示す画像を出力するためのコマンドを生成する情報処理装置。

請求項14

表示部と、ユーザが携帯する携帯機器から、当該携帯機器の所定の状態変化が検出されたことを示す状態情報と、前記携帯機器が有するタッチセンサにより前記ユーザのタッチが検出されたことを示すタッチ情報とを受信可能な通信部と、前記状態情報を受信した場合に、前記携帯機器において実行される音声入力モードが準備状態であることを示す第1の画像を表示し、前記状態情報の受信後に前記タッチ情報を受信した場合に、前記音声入力モードが実行可能な状態であることを示す第2の画像を表示するように前記表示部を制御可能な制御部とを具備する情報処理装置。

請求項15

情報処理装置における情報処理方法であって、前記情報処理装置の所定の状態変化を検出し、前記所定の状態変化が検出された場合に、ユーザの音声から変換された音声信号を文字情報として認識する音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドを生成し、前記所定の状態変化に続いて前記ユーザのタッチを検出し、前記タッチが検出された場合に、前記音声入力モードが実行可能な状態であることを示す第2の画像を出力するための第2のコマンドを生成する情報処理方法。

請求項16

情報処理装置に、前記情報処理装置の所定の状態変化を検出するステップと、前記所定の状態変化が検出された場合に、ユーザの音声から変換された音声信号を文字情報として認識する音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドを生成するステップと、前記所定の状態変化に続いて前記ユーザのタッチを検出するステップと、前記タッチが検出された場合に、前記音声入力モードが実行可能な状態であることを示す第2の画像を出力するための第2のコマンドを生成するステップとを実行させるプログラム

技術分野

0001

本技術は、音声入力に応じた処理を実行可能な情報処理装置、当該情報処理装置における情報処理方法及びプログラムに関する。

背景技術

0002

従来から、音声(ユーザの声)を検出及び認識してそれに応じた処理を行う情報処理装置が存在する。例えば下記特許文献1には、角度検出部により音声入力装置の角度を検出し、距離検出部によりユーザとの距離を検出し、検出した角度及び距離に基づいて音声入力部のオンオフを制御する音声入力装置が記載されている。この音声入力装置は、当該装置がユーザの口元に近づいたことを検出して音声入力モードオンにすることができる。

先行技術

0003

特開2010−217754号公報

発明が解決しようとする課題

0004

しかしながら、上記特許文献1に記載の技術は、音声入力モードがオンになったことをユーザにフィードバックとして返すことができない。すなわちユーザは、実際に音声を入力してそれに応じた処理が実行されるのを確かめる以外に、音声入力モードがオンであることを知る術がなく、使い勝手がよいものとは言えない。

0005

以上のような事情に鑑み、本技術の目的は、音声入力モードになったことをユーザに確実に報知することが可能な情報処理装置、情報処理方法及びプログラムを提供することにある。

課題を解決するための手段

0006

上述の課題を解決するため、本技術の一形態に係る情報処理装置は、状態検出部と、タッチセンサと、マイクロフォンと、制御部とを有する。上記状態検出部は、当該情報処理装置の第1の状態変化を検出可能である。上記タッチセンサは、ユーザのタッチを検出可能である。上記マイクロフォンは、入力された上記ユーザの音声を音声信号に変換可能である。上記制御部は、上記音声信号を文字情報として認識する音声入力モードを実行可能である。また制御部は、上記第1の状態変化が検出された場合に、上記音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドを生成可能である。さらに制御部は、上記第1の状態変化に続いて上記タッチが検出された場合に、上記音声入力モードが実行可能な状態であることを示す第2の画像の出力するための第2のコマンドを生成可能である。

0007

これにより情報処理装置は、第1の画像と第2の画像による2段階のビジュアルフィードバックにより、音声入力モードになったことをユーザに確実に報知することができる。ここで上記第1の状態変化とは、情報処理装置の筐体角度変化や、情報処理装置に設けられたボタン押下操作の検出、所定のタッチ操作の検出等を含む。上記第1の画像及び第2の画像は、上記第1のコマンド及び第2のコマンドに基づいて、当該情報処理装置で表示されてもよいし、外部機器で表示されてもよい。

0008

上記情報処理装置は、上記第1のコマンド及び上記第2のコマンドを外部の表示装置送信可能な通信部をさらに具備してもよい。

0009

これにより情報処理装置は、外部の表示装置に第1の画像及び第2の画像を表示させ、ユーザに、音声入力モードになったことのビジュアルフィードバックをより見やすい形で与えることができる。

0010

上記情報処理装置は、筐体をさらに具備してもよい。この場合上記状態検出部は、上記筐体の角度を検出可能な角度センサを有してもよく、上記制御部は、上記筐体の角度が所定角度範囲になったことが検出された場合に上記第1のコマンドを生成可能であってもよい。

0011

これにより情報処理装置は、ユーザが筐体を上記所定角度範囲まで傾けた場合に音声入力モードの準備を開始し、それをユーザにビジュアル的にフィードバックすることができる。ここで所定角度範囲とは、例えば地面に対する筐体の正面の角度がほぼ垂直になるような角度を中心にした所定範囲の角度である。

0012

上記第2の画像は、上記第1の画像の一部が変化した画像であってもよい。

0013

これにより情報処理装置は、第1の画像と第2の画像とに関連性を持たせることで、情報処理装置が、音声入力モードの準備状態から実行可能状態遷移したことをユーザに容易に把握させることができる。ここで「一部が変化」とは、例えば、第1の画像における所定領域の色(輝度)が第2の画像において変化したり、第1の画像における所定のオブジェクトの位置や形態が第2の画像において変化したりすることであるが、これらに限られない。

0014

上記制御部は、上記第2の画像が出力された状態で、上記マイクロフォンに上記ユーザの音声が入力された場合に、上記第2の画像に代えて第3の画像を出力するための第3のコマンドを生成可能であってもよい。

0015

これにより情報処理装置は、ユーザの音声が入力されていることを、さらなるビジュアルフィードバックによりユーザに報知することができる。

0016

上記制御部は、上記タッチが検出されなくなった場合に、上記音声入力モードを終了してもよい。

0017

これによりユーザは、タッチを解除するという極めて単純かつ容易な操作により音声入力モードを終了させることができる。

0018

上記状態検出部は、当該情報処理装置の第2の状態変化を検出可能であってもよい。この場合上記制御部は、上記音声信号の認識中に上記第2の状態変化が検出された場合に、当該音声信号の認識を中止してもよい。

0019

これにより情報処理装置は、音声信号の認識中であっても、第2の状態変化の検出によりその処理をキャンセルすることができる。ここで第2の状態変化とは、例えば情報処理装置が有するタッチパネルへのユーザのフリック操作の検出や、情報処理装置の筐体をユーザが振る操作の検出、特定の音声の入力等であるが、これらに限られない。

0020

上記情報処理装置は、ネットワーク上の検索エンジンと通信可能な通信部をさらに有してもよい。この場合上記制御部は、上記認識された文字情報を含む認識結果画像を出力するためのコマンドを生成してもよい。さらに制御部は、上記認識された文字情報をキーとした検索処理を要求する検索要求情報を上記通信部により上記検索エンジンへ送信してもよい。

0021

これにより情報処理装置は、認識された文字情報をユーザに把握させた上で、当該文字情報をキーとした検索処理を検索エンジンに行わせることができる。

0022

上記状態検出部は、当該情報処理装置の第2の状態変化を検出可能であってもよく、上記認識結果画像は、認識された文字情報が表示される第1の領域と、当該第1の領域とは異なる第2の領域とを有してもよい。この場合上記制御部は、第1の文字情報が認識された場合に、当該第1の文字情報を上記第1の領域へ表示させ、上記第1の文字情報の認識後、所定時間内に上記第2の状態変化が検出された場合に、上記第1の文字情報を上記第1の領域から上記第2の領域へ移動させてもよい。さらに制御部は、上記第2の状態変化の検出後に第2の文字情報が認識された場合に、上記第2の文字情報を上記第1の領域へ表示させ、上記第2の文字情報の認識後、上記所定時間内に上記第2の状態変化が検出されない場合に、上記第1の文字情報と上記第2の文字情報とをキーとした検索処理を要求する検索要求情報を送信してもよい。

0023

これにより情報処理装置は、第2の状態変化があった場合に、第1の文字情報を第2の領域に表示することで、当該第1の文字情報がスタックされていることをユーザに容易に把握させ、当該第1の文字情報と、続けて認識された第2の文字情報とに基づいて、いわゆるAND検索処理を検索エンジンに実行させることができる。ここで第2の状態変化とは、例えば情報処理装置の筐体が振られる(往復移動する)こと、タッチセンサがユーザのフリック操作を検出すること等であるが、これらに限られない。

0024

上記タッチセンサは、上記音声入力モード以外のモードにおいてそれぞれ異なる機能が割り当てられた複数のタッチ領域を有してもよい。この場合上記制御部は、上記音声入力モードの準備状態及び実行可能状態においては、上記複数の領域に割り当てられた機能を無効にしてもよい。

0025

これにより情報処理装置は、音声入力モードにおいては、ユーザのタッチ操作を当該音声入力モードの実行用としてのみ機能させることができ、ユーザの誤操作を防止できる。

0026

上記タッチセンサは、複数のポイントに対するタッチを同時に検出可能であってもよい。この場合上記制御部は、上記複数のポイントに対するタッチが検出されている場合は、上記第1の状態変化が検出されても上記第1のコマンドを生成しなくてもよい。

0027

これにより情報処理装置は、ユーザがマルチタッチにより、例えばゲームや文字入力等、情報処理装置を特定の目的で用いている場合には、音声入力モードを実行するのを規制することができる。

0028

上記表示装置は音声を出力可能であってもよい。この場合上記制御部は、上記第1の状態変化が検出された場合に、上記表示装置により出力される音声の音量下げるための音量コマンドを生成し、当該音量コマンドを上記通信部により送信してもよい。

0029

これにより情報処理装置は、音声入力モードにおいて、表示装置から出力される音声の影響を極力排除し、音声認識の精度を向上させることができる。

0030

上記制御部は、上記マイクロフォンへの上記音声の入力レベルが第1の値以下であることを示す画像を出力するためのコマンドと、上記マイクロフォンへの上記音声の上記入力レベルが第2の値よりも大きいことを示す画像を出力するためのコマンドを生成してもよい。

0031

これにより情報処理装置は、ユーザから入力される音声のレベルに応じて、情報処理装置とユーザの口との距離を調整させ、音声認識処理の精度を向上させることができる。

0032

本技術の他の形態に係る情報処理装置は、表示部と、通信部と、制御部とを有する。上記通信部は、ユーザが携帯する携帯機器から、当該携帯機器の所定の状態変化が検出されたことを示す状態情報と、上記携帯機器が有するタッチセンサにより上記ユーザのタッチが検出されたことを示すタッチ情報とを受信可能である。上記制御部は、上記状態情報を受信した場合に、上記携帯機器において実行される音声入力モードが準備状態であることを示す第1の画像を表示するように上記表示部を制御可能である。さらに制御部は、上記状態情報の受信後に上記タッチ情報を受信した場合に、上記音声入力モードが実行可能な状態であることを示す第2の画像を表示するように上記表示部を制御可能である。

0033

本技術の他の形態に係る情報処理方法は、情報処理装置における情報処理方法であって、上記情報処理装置の所定の状態変化を検出することを含む。上記所定の状態変化が検出された場合には、音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドが生成される。上記音声入力モードは、ユーザの音声から変換された音声信号が文字情報として認識されるモードである。上記所定の状態変化に続いて上記ユーザのタッチが検出される。上記タッチが検出された場合には、上記音声入力モードが実行可能な状態であることを示す第2の画像を出力するための第2のコマンドが生成される。

0034

本技術の他の形態に係るプログラムは、情報処理装置に、第1の検出ステップと、第1の生成ステップと、第2の検出ステップと、第2の生成ステップとを実行させる。上記第1の検出ステップでは、上記情報処理装置の所定の状態変化が検出される。上記第1の生成ステップでは、上記所定の状態変化が検出された場合に、音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドが生成される。上記音声入力モードは、ユーザの音声から変換された音声信号が文字情報として認識されるモードである。上記第2の検出ステップでは、上記所定の状態変化に続いて上記ユーザのタッチが検出される。上記第2の生成ステップでは、上記タッチが検出された場合に、上記音声入力モードが実行可能な状態であることを示す第2の画像を出力するための第2のコマンドが生成される。

発明の効果

0035

以上のように、本技術によれば、音声入力モードになったことをユーザに確実に報知することができる。

図面の簡単な説明

0036

本技術の一実施形態におけるシステムの構成を示す図である。
上記システムにおけるリモートコントローラハードウェア構成を示す図である。
上記システムにおけるTVのハードウェア構成を示す図である。
リモートコントローラが音声入力モードへ移行するまでの動作の流れを示したフローチャートである。
音声入力モードが準備状態であることを示す画像及び音声入力モードが実行可能な状態であることを示す画像の例を示した図である。
音声入力モードが準備状態であることを示す画像及び音声入力モードが実行可能な状態であることを示す画像の例を示した図である。
音声入力モードが準備状態であることを示す画像及び音声入力モードが実行可能な状態であることを示す画像の例を示した図である。
音声入力モードが準備状態であることを示す画像及び音声入力モードが実行可能な状態であることを示す画像の例を示した図である。
音声入力モードを終了する際のリモートコントローラの動作の流れを示したフローチャートである。
音声入力モードにより音声検索処理が実行される際の、AND検索処理の流れを示したフローチャートである。
上記AND検索処理において表示されるユーザインタフェースの例を示した図である。
上記音声入力モードにおける入力音声の音量の大小を、グラフによりユーザに報知する処理を示した図である。
上記音声入力モードにおける入力音声の音量の大小をアイコンによりユーザに報知する場合の表示例を示した図である。
上記音声入力モードにおける入力音声の音量の大小をアイコンによりユーザに報知する場合の表示例を示した図である。
上記音声入力モードにおいてTVの音声を除去する様子を示した図である。
上記音声入力モードにおいてTVの音声を除去する処理を実行する際のTVの概略構成を示したブロック図である。

実施例

0037

以下、本技術に係る実施形態を、図面を参照しながら説明する。

0038

[システムの概要
図1は、本技術の一実施形態における音声入力システムの構成を示す図である。

0039

同図に示すように、本システムは、リモートコマンダー100(以下、リモコン100と称する)とテレビジョン装置(TV)200とで構成される。後述するが、リモコン100は、ユーザの音声を音声信号に変換し、当該音声信号を文字情報として認識する音声入力モードを実行可能である。当該音声入力モードにおいて、TV200の表示画面26には、当該音声入力モードの実行が準備状態であることを示す画像(アイコン)と、当該音声入力モードが実行可能な状態であることを示す画像(アイコン)とが表示され得る。

0040

携帯端末のハードウェア構成]
図2は、上記リモコン100のハードウェア構成を示す図である。同図に示すように、リモコン100は、CPU11、タッチセンサ(タッチパッド)12、傾きセンサ13、通信部14、マイクロフォン15、RAM(Random Access Memory)16及びフラッシュメモリ17を有する。

0041

CPU11は、リモコン100の各部を統括的に制御し、各種のプログラムに基づき種々の演算を実行する。例えばCPU11は、マイクロフォン15から入力されたユーザの音声を音声信号に変換する上記音声入力モードを実行する。

0042

タッチセンサ12は、例えばリモコン100の表面全体または表面及び裏面の全体にわたって設けられ、ユーザのタッチを検出する。

0043

傾きセンサ13は、例えば加速度センサ、角速度(ジャイロセンサ機械式傾斜センサ等であり、リモコン100の傾きを検出する。傾きセンサ13が加速度センサの場合、少なくとも1軸あれば角度が検出可能であるが、2軸または3軸を有していてもよい。

0044

通信部14は、例えば赤外線電波により、CPU11で生成されたコマンドをTV200へ送信する。また通信部14は、TV200以外のネットワーク上の機器との通信が可能であってもよい。

0045

マイクロフォン15は、アナログデジタル変換機等を有し、ユーザから通話口を介して入力された音声をデジタル音声信号へ変換してCPU11へ出力する。

0046

RAM16は、CPU11の作業領域として用いられる揮発性メモリであり、CPU11の処理に用いられる各種のプログラムや各種のデータを一時的に記憶する。

0047

フラッシュメモリ17は、CPU11の処理に必要な各種のプログラムや各種のデータが記憶される不揮発性のメモリである。

0048

[システムのソフトウェア構成
図3は、上記システム(リモコン100及びTV200)が有する機能(ソフトウェア)の構成を示したブロック図である。

0049

同図に示すように、本実施形態のシステムは、入力デバイス31、センサ感知部32、音声入力判定部33、音声認識部34及び出力デバイス35を有する。

0050

入力デバイス31は、上記タッチセンサ12が担い、ユーザのタッチ操作の入力を受け付ける。

0051

センサ感知部32は、上記傾きセンサ13が担い、リモコン100の傾き(角度)を検出する。

0052

音声入力判定部33は、ユーザがマイクロフォン15を介して音声を入力する際に、音声入力モードがONかOFFか(実行可能な否か)を判定する。

0053

音声認識部34は、例えばCPU11が担い、音声入力モードにおいて、入力内容文字列として認識する処理(音声認識処理)を実行する。音声認識処理は、CPU11が自ら実行してもよいし、CPU11が、入力された音声信号をTV200へ送信し、TV200に実行させてもよい。また、リモコン100またはTV200に接続されたネットワーク上のサーバが音声認識処理を実行してもよい。

0054

出力デバイス35は、上記TV200の表示画面が担い、音声入力モードに入る前及び音声入力モード実行中における各種GUI(Graphical User Interface)を表示する。

0055

音声入力モードによって実行される具体的なアプリケーションとしては、例えば、ネットワーク上の検索エンジンを用いた音声検索アプリケーション音声コマンド、P2P(Peer to Peer)によるインターネット電話サービス等が挙げられるが、これらに限られない。

0056

[システムの動作]
次に、以上のように構成された音声入力システムにおけるリモコン100及びTV200の動作について説明する。以降では、リモコン100のCPU11を主な動作主体として説明するが、この動作は、リモコン100のその他のハードウェア及びソフトウェアと協働して実行される。

0057

(音声入力モードへの遷移)
図4は、本実施形態におけるリモコン100が音声入力モードへ移行するまでの動作の流れを示したフローチャートである。

0058

同図に示すように、まずCPU11は、上記傾きセンサ13によりリモコン100の角度を検出する(ステップ41)。

0059

続いてCPU11は、上記検出された傾き角が、所定の閾値範囲内か否かを判断する(ステップ42)。すなわち、CPU11は、リモコン100が立った状態(リモコン100の主面が鉛直方向にある状態)にあるかを検出する。当該閾値範囲は例えば水平面を0度とした場合に、リモコン100の主面が60度〜90度程度の範囲であるが、これに限られない。

0060

続いてCPU11は、所定時間(例えば1秒程度)経過後、音声入力モードの「準備」状態に遷移する(ステップ43)。ここでCPU11が所定時間の経過を待つのは、傾きセンサ13のチャタリングを防止するためである。

0061

続いてCPU11は、音声入力モードの準備状態を示すアイコン(第1のアイコン)をTV200の表示画面26に出力するための出力コマンドを生成し、当該コマンドをTV200へ送信する(ステップ44)。TV200は、当該コマンドを受信すると、上記第1のアイコンを表示画面26に表示する。

0062

続いてCPU11は、タッチセンサ12によりユーザのタッチが検出されたか否かを判断する(ステップ45)。このとき、タッチセンサ12は、通常のポインティングデバイスとしては機能せずに、ON/OFFボタンとしてだけの機能を割り当てられている。したがって、例えばタッチセンサ12が複数のタッチ領域を有し、それらに異なる機能が割り当てられている場合であっても、音声入力モードの準備状態及び実行可能状態においては、それらの機能は全て無効とされている。

0063

タッチが検出されたと判断した場合(Yes)、CPU11は、音声入力モードへ遷移する(ステップ46)。それとともにCPU11は、音声入力モードが実行可能な状態であることを示すアイコン(第2のアイコン)をTV200の表示画面26に出力するための出力コマンドを生成し、それをTV200へ送信する(ステップ47)。TV200は、このコマンドを受信すると、上記第2のアイコンを表示する。

0064

そしてCPU11は、タッチが検出されている間、ユーザからの音声の入力に応じて、音声入力・認識処理(音声入力モード)を実行する(ステップ48)。このとき、音声入力・認識の状態も、アイコンとしてTV200の表示画面26に表示される(第3のアイコン)。

0065

図5図6図7図8は、それぞれ、上記第1のアイコン、第2のアイコン及び第3のアイコンの例を示した図である。各図において、(A)が第1のアイコン、(B)が第2のアイコン、(C)が第3のアイコンの例を示し、それぞれ音声入力モードの遷移に応じて、第1のアイコンが第2のアイコンに変化し、第2のアイコンが第3のアイコンへと変化する。

0066

図5の例では、アイコンの色の変化により上記音声入力モードの状態の違いが示されている。すなわち、リモコン100が立った状態では、第1のアイコンとして、マイクを模した形状のアイコンが表示画面26に出現する。その際、当該アイコンの色は例えば灰色等の所定色に表示される。その後ユーザのタッチが検出されると、第2のアイコンとして、色が変化した(例えば緑色)マイク型アイコンが表示される。さらに、ユーザの声がマイクロフォン15から入力されると、第3のアイコンとして、さらに色が変化した(例えば黄色)マイク型アイコンが表示される。

0067

図6の例では、アイコンの大きさの変化により上記音声入力モードの状態の違いが示されている。すなわち、第1のアイコンとして比較的小さいマイク型アイコンが表示され、タッチが検出されると、第2のアイコンとして例えば第1のアイコンの2倍程度のマイク型アイコンが表示される。そして、第3のアイコンとして、ユーザの声の大きさにリアルタイムで応じた大きさのマイク型アイコンが表示される。例えば、入力されるユーザの声が比較的小さい場合には、第3のアイコンは第2のアイコンよりも小さくなり、ユーザの声が比較的大きい場合には、第3のアイコンは第2のアイコンよりも大きくなる。

0068

図7の例では、アイコンの色の濃さの変化により上記音声入力モードの状態の違いが示されている。すなわち、第1のアイコンとしては、半透明の状態のマイク型アイコンが表示され、タッチが検出されると、第2のアイコンとして、不透明な状態のマイク型アイコンが表示される。そして、ユーザの音声が入力されると、第3のアイコンとして、さらに濃い状態のマイク型アイコンが表示される。

0069

図8の例では、アイコンの形状の変化により上記音声入力モードの状態の違いが示されている。すなわち、第1のアイコンとして、リモコン100の形状を模したアイコンが表示され、タッチが検出されると、第2のアイコンとして、上記リモコン100を模したアイコンがマイク型アイコンに変化して表示される。そして、ユーザの音声が入力されると、例えば第3のアイコンとして、マイク型アイコンの上部に、波状アニメーションが付加されたものが表示される。この波状のアニメーションは、その中心から波紋が外側へ広がるように表示される。この波紋の数が、入力されたユーザの声の大きさを反映したインジケータとして機能しても構わない。

0070

(音声入力モードの終了)
図9は、リモコン100が音声入力モードを終了する際の動作の流れを示したフローチャートである。

0071

同図に示すように、まずCPU11は、ユーザのタッチが検出されなくなったか否かを判断し(ステップ91)、タッチが検出されなくなったと判断した場合(Yes)には音声入力モードを終了する(ステップ92)。またCPU11は、タッチが検出されなくなっただけでなく、リモコン100の角度が上記所定角度範囲から外れたことをさらに検出することで音声入力モードを終了してもよい。

0072

ここでCPU11は、ユーザにより入力されて解析中(認識中)の音声があるか否かを判断する(ステップ93)。解析中の音声が無いと判断した場合(No)には、CPU11は処理を終了する。

0073

解析中の音声があると判断した場合(Yes)、CPU11は、ユーザから解析処理中断コマンドが入力されたか否かを判断する(ステップ94)。解析処理中断コマンドとしては、例えば、ユーザがタッチセンサ12上で入力する所定方向(例えば左側)へのフリック操作や、ユーザがリモコン100を左右または上下に振る操作や、ユーザからの特定の音声の入力(例えば「中止」「やめ」等)等が考えられる。すなわち、当該コマンドは、リモコン100に何らかの状態変化をもたらすコマンドである。この場合、リモコン100は、解析処理中断を受け付けるための特殊なモードに遷移している。

0074

上記解析処理中断コマンドが入力されたと判断した場合(Yes)、CPU11は、解析処理を中断し(ステップ95)、処理を終了する。

0075

一方、解析処理中断コマンドが入力されていないと判断した場合(No)、CPU11は、上記音声の解析処理を続行し(ステップ96)、解析結果に応じた処理を実行する(ステップ97)。

0076

(AND検索処理)
上述のように、音声入力モードで実行されるアプリケーションの1つに、音声検索がある。図10は、上記音声入力モードにより音声検索処理が実行される際の、AND検索処理の流れを示したフローチャートである。

0077

同図に示すように、CPU11はまず、上記音声認識処理により、ユーザから入力された音声が示す文字列を認識する(ステップ101)。

0078

続いてCPU11は、認識した文字列を、認識結果表示領域へ表示するためのコマンドをTV200へ送信する(ステップ102)。

0079

図11は、上記AND検索処理において表示されるユーザインタフェースの例を示した図である。同図に示すように、上記コマンドが受信されることで、TV200の表示画面26のAND検索処理のユーザインタフェース上では、当該認識された文字列が、認識結果表示領域111内に表示される。

0080

続いてCPU11は、所定時間内に、ユーザによる所定のアクションが検出されたか否かを判断する(ステップ103)。ここで所定のアクションとは、例えばユーザがリモコン100を振る操作や、タッチセンサ12上での右フリック操作等であるが、これに限られない。

0081

上記所定のアクションが所定時間内に検出されなかった場合(No)、CPU11は、認識結果表示領域111内の文字列を検索キーワードとした検索要求を、ネットワーク上の検索エンジンへ送信する(ステップ105)。当該検索要求の検索エンジンへの送信は、リモコン100から、TV200を介して実行されてもよいし、TV200を介さずに直接実行されてもよい。

0082

一方、上記所定のアクションが所定時間内に検出された場合(Yes)、CPU11は、上記認識されて認識結果表示領域111内に表示されている文字列を、リザーブ領域に移動するためのコマンドをTV200へ送信する(ステップ104)。

0083

図11に示すように、上記コマンドが受信されることで、表示画面26の認識結果表示領域111に表示されていた文字列が、例えばその右隣に設けられたリザーブ領域112へ移動して表示される。ここで、上記所定のアクションと異なる(対照的な)ユーザのアクション(例えば左クリック)が検出された場合には、CPU11は、認識結果表示領域111に表示された文字列の入力をキャンセル(消去)してもよい。

0084

そして、CPU11は、上記所定時間内の所定のアクションを待機し、アクションがない場合には、認識結果表示領域111に表示された文字列とリザーブ領域112に表示された文字列とをキーワードとするAND検索要求を上記検索エンジンへ送信する(ステップ105)。検索エンジンから受信された検索結果は表示画面26に表示される。

0085

このように、リモコン100は、ユーザのアクションに基づいて認識結果表示領域111とリザーブ領域112とに文字列を表示することで、音声入力モードにおけるAND検索処理をユーザに容易に実行させることができる。

0086

[まとめ]
以上説明したように、本実施形態によれば、リモコン100は、リモコン100の所定の状態変化に基づいて、音声入力モードの準備状態を示すアイコン(第1のアイコン)と音声入力モードの実行可能状態を示すアイコン(第2のアイコン)とを表示することができる。したがってリモコン100は、ユーザに、音声入力モードの状態及びその遷移を容易に把握させることができる。

0087

[変形例]
本技術は上述の実施形態にのみ限定されるものではなく、本開示の要旨を逸脱しない範囲内において種々変更され得る。

0088

(音量の大小のビジュアルフィードバック)
上述の実施形態において、リモコン100は、入力されるユーザの音声が、音声認識に適した音量に比して大きすぎる、または小さすぎることをユーザに視覚的に報知してもよい。以下、この処理の詳細について説明する。

0089

図12は、音量の大小を、グラフによりユーザに報知する処理を示した図である。

0090

音量の大小をグラフで示す場合、音声は時間経過により大小が刻々変化するので、リアルタイムに(追従性よく)表現するアニメーションよりも、たとえば、以下のように加工することが好ましい。

0091

CPU11はまず、同図(A)に示すような、ユーザの音声から変換された元の音声信号の波形を、同図(B)に示すように絶対値処理(ABS処理)し、正符号スカラ量に変換する。ここで音声信号は、絶対値処理ではなく二乗処理により正符号に変換されてもよい。

0092

さらにCPU11は、上記絶対値処理された音声信号を平滑化処理する。平滑化処理の方法としては、同図(C)に示すようなローパスフィルタを適用するものが考えられる。また同図(C)´に示すように、現在の音声値前値よりも大きいときはその値を現在値として適用し、ある時点の音声値が前値よりも小さいときは現在の音声値から所定値を減じた値を現在値として適用することで、値がピーク値から徐々に落ちていくような平滑化処理が施されてもよい。

0093

そしてCPU11は、同図(C)または同図(C)´に示すようなグラフをTV200の表示画面26に表示させることで、ユーザに、自身の声が大きすぎるまたは小さすぎることを把握させ、声の大きさを調整させることができる。

0094

またCPU11は、音量の大小をアイコンとして表示させてもよい。図13及び図14は、当該音量の大小をアイコンによりユーザに報知する場合の表示例をそれぞれ示した図である。

0095

図13(A)に示すように、CPU11は、ユーザの声が大きすぎる場合(マイクロフォン15への音声の入力レベルが所定の第1の閾値よりも大きい場合)には、上記図5図8で示したようなマイクのアイコンを拡大してその一部を抽出したようなアイコンを表示するコマンドをTV200へ送信する。これによりユーザは、マイクのアイコンが大きくなって全体が見えなくなることから、自身の声が大きすぎることを把握できる。

0096

一方、図13(B)に示すように、CPU11は、ユーザの声が小さすぎる場合(マイクロフォン15への音声の入力レベルが、上記第1の閾値よりも小さい所定の第2の閾値以下の場合)には、上記マイクのアイコンが縮小されたアイコンを表示するコマンドをTV200へ送信する。またCPU11は、これに代えて、上記マイクのアイコンが半透明になったり色が淡くなったりしたアイコンを表示させてもよい。これによりユーザは、マイクのアイコンが小さくなることから、自身の声が小さすぎることを把握することができる。

0097

また図14に示すように、CPU11は、マイクのアイコンの上部に表示される波紋における強調表示の位置によって、音量の大小をユーザに報知してもよい。

0098

すなわち、CPU11は、マイクロフォン15への音声の入力レベルが上記第1の閾値よりも大きい場合には、マイクのアイコンの最も外側の波紋を強調して表示するコマンドをTV200へ送信する。この表示を確認することで、ユーザは、自身の声が大きすぎることを把握することができる。

0099

またCPU11は、マイクロフォン15への音声の入力レベルが上記第2の閾値以下である場合には、マイクのアイコンの最も内側の波紋を強調して表示するコマンドをTV200へ送信する。この表示を確認することで、ユーザは、自身の声が小さすぎることを把握することができる。

0100

一方、CPU11は、マイクロフォン15への音声の入力レベルが、上記第2の閾値よりも大きく上記第1の閾値以下である場合には、マイクのアイコンの真ん中の波紋を強調して表示するコマンドをTV200へ送信する。この表示を確認することで、ユーザは、自身の声の大きさが適切であることを把握することができる。

0101

(TVの音声の除去)
上述の実施形態において、音声入力モードの実行中は、音声の入力の状態はTV200の表示画面26に表示される。ここで、TV200が何らかの音声を出力している場合、マイクロフォン15が、ユーザの音声以外にTV200から出力される音声も拾ってしまい、認識精度が下がってしまう可能性が考えられる。そこで、TV200は、音声入力モードにおいては、出力される音声を除去する機能を有していてもよい。

0102

図15は、上記音声入力モードにおいてTV200の音声を除去する様子を示した図であり、図16は、上記音声入力モードにおいてTV200の音声を除去する処理を実行する際のTV200の概略構成を示したブロック図である。

0103

図16に示すように、TV200は、表示画面26のほか、プロセッサ21、ノイズキャンセラー22、受信機23、マイクロフォン24及びスピーカー25を有する。

0104

プロセッサ21は、TV200の各ブロックを統括的に制御する。ノイズキャンセラー22は、所定の条件が満たされた場合に、マイクロフォン24に入力された音声を除去する。受信機23は、リモコン100から上記各種コマンドや、各種センサからの値を受信する。スピーカー25は、プロセッサ21により生成された音声を出力する。

0105

図15に示すように、リモコン100のCPU11は、ユーザがリモコン100を立てた(所定角度回転させた)ことを傾きセンサ13等により検出すると、TV200のマイクロフォン24をオンにするコマンドをTV200へ送信する。

0106

一方TV200のプロセッサ21は、上記コマンドを受信すると、マイクロフォン24をオンにするとともに、ノイズキャンセラー22も起動させる。

0107

そしてプロセッサ21は、スピーカー25から出力されマイクロフォン24によって入力された音声を、ノイズキャンセラー22によりノイズとして除去する。したがって、上記リモコン100からTV200へ送信されるコマンドは、マイクロフォン24をオンさせるコマンドであると同時に、TV200から出力される音声の音量を下げるためのコマンドであるともいえる。

0108

これにより、音声入力モードにおいては、TV200のスピーカー25から出力される音声は全て除去されるため、リモコン100における音声認識処理に対する悪影響が排除される。

0109

(その他の変形例)
上述の実施形態では、リモコン100は、音声入力モードの準備状態へ遷移するために、傾きセンサ13の出力を用いた。しかし、リモコン100は、傾きセンサ13に代えて、リモコン100からユーザの口元までの距離を検出する距離センサ赤外線センサ)を有し、検出された距離が所定値(例えば3cm〜10cm程度)以下になった場合に、音声入力モードの準備状態に遷移してもよい。

0110

同様に、リモコン100は、傾きセンサ13に代えて、ユーザの口元を撮影するカメラを有し、所定大のユーザの口が撮影された場合に、音声入力モードの準備状態に遷移してもよい。

0111

すなわち、リモコン100は、音声入力モードの準備状態へ遷移するために、リモコン100の何らかの状態変化を検出するための状態検出部を有していればよい。

0112

また、TV200に、ユーザ及びリモコン100の状態を撮像するカメラが設けられ、リモコン100が、リモコン100が立った状態であることを、傾きセンサ13の検出値と当該カメラの映像との双方によりロバストに検出してもよい。

0113

上述の実施形態では、傾きセンサ13やタッチセンサ12による検出値や検出の有無により音声入力モードが遷移した。しかし、それらセンサに代えて、ハードウェアボタンやGUIアイコンにより、ユーザが能動的にモードを遷移させてもよい。

0114

上述の実施形態にでは、リモコン100は、傾きセンサ13によりリモコン100が立てられたことが検出された場合に、音声入力モードの準備状態へ遷移していた。しかし、例えば、ユーザがリモコン100をゲームのコントローラとして用いている場合には、リモコン100を両手の指で把持して立てた状態にすることが考えられる。そこで、リモコン100は、タッチセンサ12の複数のポイントに対するタッチが検出された場合(マルチタッチが検出された場合)には、上記傾きセンサ13の検出値が上記閾値範囲内であっても、音声入力モードの準備状態へ遷移しないよう制御してもよい。

0115

上述の実施形態においてリモコン100のCPU11が実行した処理の少なくとも一部は、TV200のプロセッサ21が担ってもよい。例えば、傾きセンサ13の検出値が所定閾値範囲にあるか否かの判断処理図4のステップ42)、所定時間経過後に音声入力モードの準備状態に遷移する処理(同図ステップ43)、タッチセンサ12の検出に基づく音声入力モードの実行可能状態へ遷移する処理(同図ステップ46)等については、リモコン100は単に各センサの出力のみTV200へ送信し、実際の処理はプロセッサ21が実行してもよい。

0116

上述の実施形態においては、音声入力モードを実行する情報処理装置として、上記図2で示した構成を有するリモコン100が示された。しかし、当該リモコン100に代えて、携帯電話機スマートフォン携帯型オーディオプレイヤー、携帯型ゲーム機器等、ユーザが携帯可能な他のあらゆる情報処理装置が用いられてもよい。また、上述の実施形態では、音声入力モード中にユーザにビジュアルフィードバックを提供する装置としてTV200が示されたが、当該TVに替えて、PC(Personal Computer)、PVR(Personal Video Recorder)、ゲーム機器等のあらゆる情報処理装置が用いられてもよい。

0117

上述の実施形態では、音声入力モードを実行する情報処理装置と、当該音声入力モードの実行中にその遷移状態のビジュアルフィードバックを提供する情報処理装置とが別個に存在する(リモコン100とTV200)例が示された。しかし、音声入力モードを実行する情報処理装置とそのビジュアルフィードバックを提供する情報処理装置とが同一であっても構わない。すなわち、上記リモコン100がディスプレイを有し、当該ディスプレイ上で、音声入力モード中に上記2段階または3段階のビジュアルフィードバックが提供されてもよい。この場合、リモコン100のCPU11が、第1〜第3のアイコンを表示させるための各コマンドを生成して自身のディスプレイに各アイコンをそれぞれ出力させる。

0118

[その他]
本技術は以下のような構成も採ることができる。
(1)情報処理装置であって、
当該情報処理装置の第1の状態変化を検出可能な状態検出部と、
ユーザのタッチを検出可能なタッチセンサと、
入力された前記ユーザの音声を音声信号に変換可能なマイクロフォンと、
前記音声信号を文字情報として認識する音声入力モードを実行可能であり、前記第1の状態変化が検出された場合に、前記音声入力モードが準備状態であることを示す第1の画像を出力するための第1のコマンドを生成可能であり、前記第1の状態変化に続いて前記タッチが検出された場合に、前記音声入力モードが実行可能な状態であることを示す第2の画像を出力するための第2のコマンドを生成可能な制御部と
を具備する情報処理装置。
(2)上記(1)に記載の情報処理装置であって、
前記第1のコマンド及び前記第2のコマンドを外部の表示装置へ送信可能な通信部をさらに具備する
情報処理装置。
(3)上記(1)または(2)に記載の情報処理装置であって、
筐体をさらに具備し、
前記状態検出部は、前記筐体の角度を検出可能な角度センサを有し、
前記制御部は、前記筐体の角度が所定角度範囲になったことが検出された場合に前記第1のコマンドを生成可能である
情報処理装置。
(4)上記(1)から(3)のいずれか1つに記載の情報処理装置であって、
前記第2の画像は、前記第1の画像の一部が変化した画像である
情報処理装置。
(5)上記(1)から(4)のいずれか1つに記載の情報処理装置であって、
前記制御部は、前記第2の画像が出力された状態で、前記マイクロフォンに前記ユーザの音声が入力された場合に、前記第2の画像に代えて第3の画像を出力するための第3のコマンドを生成可能である
情報処理装置。
(6)上記(1)から(5)のいずれか1つに記載の情報処理装置であって、
前記制御部は、前記タッチが検出されなくなった場合に、前記音声入力モードを終了する
情報処理装置。
(7)上記(1)から(6)のいずれか1つに記載の情報処理装置であって、
前記状態検出部は、当該情報処理装置の第2の状態変化を検出可能であり、
前記制御部は、前記音声信号の認識中に前記第2の状態変化が検出された場合に、当該音声信号の認識を中止する
情報処理装置。
(8)上記(1)から(6)のいずれか1つに記載の情報処理装置であって、
ネットワーク上の検索エンジンと通信可能な通信部をさらに具備し、
前記制御部は、
前記認識された文字情報を含む認識結果画像を出力するためのコマンドを生成し、
前記認識された文字情報をキーとした検索処理を要求する検索要求情報を前記通信部により前記検索エンジンへ送信する
情報処理装置。
(9)上記(8)に記載の情報処理装置であって、
前記状態検出部は、当該情報処理装置の第2の状態変化を検出可能であり、
前記認識結果画像は、前記認識された文字情報が表示される第1の領域と、当該第1の領域とは異なる第2の領域とを有し、
前記制御部は、
第1の文字情報が認識された場合に、当該第1の文字情報を前記第1の領域へ表示させ、
前記第1の文字情報の認識後、所定時間内に前記第3の状態変化が検出された場合に、前記第1の文字情報を前記第1の領域から前記第2の領域へ移動させ、
前記第3の状態変化の検出後に第2の文字情報が認識された場合に、前記第2の文字情報を前記第1の領域へ表示させ、
前記第2の文字情報の認識後、前記所定時間内に前記第3の状態変化が検出されない場合に、前記第1の文字情報と前記第2の文字情報とをキーとした検索処理を要求する検索要求情報を送信する
情報処理装置。
(10)上記(1)から(9)のいずれか1つに記載の情報処理装置であって、
前記タッチセンサは、前記音声入力モード以外のモードにおいてそれぞれ異なる機能が割り当てられた複数のタッチ領域を有し、
前記制御部は、前記音声入力モードの準備状態及び実行可能状態においては、前記複数の領域に割り当てられた機能を無効にする
情報処理装置。
(11)上記(1)から(10)のいずれか1つに記載の情報処理装置であって、
前記タッチセンサは、複数のポイントに対するタッチを同時に検出可能であり、
前記制御部は、前記複数のポイントに対するタッチが検出されている場合は、前記第1の状態変化が検出されても前記第1のコマンドを生成しない
情報処理装置。
(12)上記(2)から(11)のいずれか1つに記載の情報処理装置であって、
前記表示装置は音声を出力可能であり、
前記制御部は、前記第1の状態変化が検出された場合に、前記表示装置により出力される音声の音量を下げるための音量コマンドを生成し、当該音量コマンドを前記通信部により送信する
情報処理装置。
(13)上記(1)〜(12)のいずれか1つに記載の情報処理装置であって、
前記制御部は、前記マイクロフォンへの前記音声の入力レベルが第1の値以下であることを示す画像を出力するためのコマンドと、前記マイクロフォンへの前記音声の前記入力レベルが第2の値よりも大きいことを示す画像を出力するためのコマンドを生成する
情報処理装置。

0119

11…CPU
12…タッチセンサ
13…傾きセンサ
14…通信部
15…マイクロフォン
21…プロセッサ
22…ノイズキャンセラー
23…受信機
24…マイクロフォン
25…スピーカー
26…表示画面
31…入力デバイス
32…センサ感知部
33…音声入力判定部
34…音声認識部
35…出力デバイス
100…リモートコマンダー(リモコン)
111…認識結果表示領域
112…リザーブ領域
200…テレビジョン装置(TV)

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ