図面 (/)

この項目の情報は公開日時点(2019年5月30日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題・解決手段

コマンドワード、1又は複数のメディア変数インスタンス、及び1又は複数のゾーン変数のインスタンスを含む音声入力が受信される。コマンドワードに対応するメディア再生システムコマンドが決定される。1又は複数のメディア変数のインスタンスに対応するメディアコンテンツ識別される。メディア再生システムは、1又は複数のゾーン変数のインスタンスに基づいて、メディアコンテンツに対してメディア再生システムコマンドを実行する。

概要

背景

2003年に、ソノズ・インコーポレイテッドが最初の特許出願のうちの1つである「複数のネットワークデバイス間のオーディオ再生を同期する方法」と題する特許出願をし、2005年にメディア再生システム販売を開始するまで、アウトウド設定におけるデジタルオーディオへのアクセスおよび試聴オプションは制限されていた。人々は、ソノズ無線HiFiシステムによって、1つ又は複数のネットワーク再生デバイスを介して多数のソースから音楽体験できるようになっている。スマートフォンタブレット、又はコンピュータインストールされたソフトウェアコントロールアプリケーションを通じて、ネットワーク再生デバイスを備えたいずれの部屋においても、人々は自分が望む音楽を再生することができる。また、例えばコントローラを用いて、再生デバイスを備えた各部屋に異なるストリーミングすることもできるし、同期再生のために複数の部屋をグループ化することもできるし、全ての部屋において同期して同じ歌を聞くこともできる。

これまでのデジタルメディアに対する関心の高まりを考えると、試聴体験を更に向上させることができるコンシューマアクセス可能な技術を更に開発することにニーズがある。

本明細書で開示されている技術の特徴、態様、および利点は、以下の記載、添付の特許請求の範囲、および添付の図面を参照するとより理解しやすい。

概要

コマンドワード、1又は複数のメディア変数インスタンス、及び1又は複数のゾーン変数のインスタンスを含む音声入力が受信される。コマンドワードに対応するメディア再生システムコマンドが決定される。1又は複数のメディア変数のインスタンスに対応するメディアコンテンツ識別される。メディア再生システムは、1又は複数のゾーン変数のインスタンスに基づいて、メディアコンテンツに対してメディア再生システムコマンドを実行する。

目的

1つの態様では、本明細書に記載の例は、ネットワークマイクロホンデバイス(NMD)が動作する周辺環境音響特性をNMDに提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

コンピューティングデバイスのための方法であって、音声入力を受信するステップ、ここで、前記音声入力は、コマンドワード、1又は複数のメディア変数インスタンス、及び1又は複数のゾーン変数のインスタンス、を備える、前記コマンドワードに対応するメディア再生システムコマンドを決定するステップ、前記1又は複数のメディア変数のインスタンスに対応するメディアコンテンツ識別するステップ、及び前記メディア再生システムに、前記1又は複数のゾーン変数のインスタンスに基づいて、前記メディアコンテンツに対して前記メディア再生システムコマンドを実行させるステップ、を含む、方法。

請求項2

さらに、前記メディア再生システムコマンドが前記コマンドワードに対応していると決定する前に、前記音声入力が音楽制御に対応していると決定するステップを含み、前記コマンドワードに対応する前記メディア再生システムコマンドは、音楽制御に対応する利用可能なコマンドに基づいて決定される、請求項1に記載の方法。

請求項3

さらに、前記識別されたメディアコンテンツから1又は複数のメディアアイテムを決定するステップ、及び前記1又は複数のメディアアイテムのネットワーク記憶場所を示す識別子を送信するステップ、含む、請求項1又は請求項2に記載の方法。

請求項4

さらに、前記コマンドワードが第1の位置にあることに基づいて、前記音声入力において前記コマンドワードを識別するステップ、前記1又は複数のメディア変数のインスタンスが第2の位置にあることに基づいて、前記音声入力において前記1又は複数のメディア変数のインスタンスを識別するステップ、及び前記1又は複数のゾーン変数のインスタンスが第3の位置にあることに基づいて、前記音声入力において前記1又は複数のゾーン変数のインスタンスを識別するステップ、を含む、請求項1から請求項3のいずれか一項に記載の方法。

請求項5

前記コマンドワードに対応する前記メディア再生システムコマンドを決定するステップは、前記コマンドワードに対応するインテントを決定すること、及び前記インテントに対応する前記メディア再生システムコマンドを決定すること、を備える、請求項1から請求項4のいずれか一項に記載の方法。

請求項6

前記受信した音声入力における1又は複数のゾーン変数のインスタンスは、メディア再生システムの1又は複数のゾーンを示し、前記1又は複数のゾーンは1又は複数の再生デバイスを備える、請求項1から請求項5のいずれか一項に記載の方法。

請求項7

前記メディア再生システムに、前記メディアコンテンツに対して前記メディア再生システムコマンドを実行させるステップは、前記コンピューティングデバイスから前記メディア再生システムに、コマンド情報を含むメッセージを送信することを備える、ここで、前記コマンド情報は、前記メディア再生システムコマンド、前記1又は複数のメディア変数のインスタンスに対応しているメディアコンテンツを識別するメディア情報、及び前記1又は複数のゾーン変数のインスタンスに対応している1又は複数のゾーン識別子、を識別する、請求項1から請求項6のいずれか一項に記載の方法。

請求項8

前記受信した1又は複数のメディア変数のインスタンスは、メディアコンテンツに関する通知を備える、さらに、前記受信した通知に基づいて少なくとも1つのコンテンツタイプを識別するステップ、前記少なくとも1つのコンテンツタイプをサポートしている少なくとも1つの音楽サービスを、複数の音楽サービスの中から決定するステップ、前記少なくとも1つの音楽サービスが前記少なくとも1つのコンテンツタイプをサポートしていることに基づいて、前記コンテンツタイプと関連付けられたオーディオコンテンツを前記少なくとも1つの音楽サービスに送信させるステップ、を含む、請求項1から請求項7のいずれか一項に記載の方法。

請求項9

コンテンツに関する前記通知は、ネットワークマイクロホンデバイスを介して受信される、請求項8に記載の方法。

請求項10

前記少なくとも1つの音楽サービスを決定するステップは、前記複数の音楽サービスの中の前記少なくとも1つの音楽サービスに対応する信頼性メトリックを決定すること、及び前記少なくとも1つの音楽サービスを決定することが、信頼性レベルの条件が満たされているかどうかを判定することを含むこと、のうちの少なくとも一方を含む、請求項8又は請求項9に記載の方法。

請求項11

前記信頼性メトリックは、前記複数の音楽サービスの中のある音楽サービスへのアクセス履歴、及び前記特定の音楽サービスの特定の利用場所、のうちの少なくとも一方に基づいている、請求項10に記載の方法。

請求項12

さらに、コンテンツに関する第2の通知を受信するステップ、前記受信した通知に基づいて少なくとも1つのコンテンツタイプを識別するステップ、及び前記複数の音楽サービスの中のいずれの音楽サービスも前記少なくとも1つのコンテンツタイプをサポートしていないと判定した場合に、エラー状態トリガされるようにするステップ、を含む、請求項8から請求項11のいずれか一項に記載の方法。

請求項13

前記コンテンツタイプは、アーティストジャンル、曲、アルバム、及びラジオ局からなる群より選択される、請求項8から請求項12のいずれか一項に記載の方法。

請求項14

前記少なくとも1つの音楽サービスを決定するステップは、前記複数のストリーミングサービス用に利用可能なコンテンツのエントリを含むルックアップテーブルにアクセスすることを備える、請求項1から請求項13のいずれか一項に記載の方法。

請求項15

さらに、前記複数の音楽サービスの中から、前記ユーザが登録している音楽サービスのみをクエリするステップ、含む、請求項1から請求項14のいずれか一項に記載の方法。

請求項16

さらに、前記コンテンツタイプを識別した後に、前記コンテンツに関する最初の通知で指定された前記コンテンツタイプをさらに特定するための1又は複数の質問を前記ユーザに対して行うステップ、より具体的なコンテンツタイプを示すようなさらに別のユーザ入力を受信するステップ、及び前記より具体的なコンテンツタイプに基づいて前記1又は複数の音楽サービスを決定するステップ、を含む、請求項1から請求項15のいずれか一項に記載の方法。

請求項17

さらに、前記音声入力を前記メディア再生システムの登録ユーザから受信したかどうかを判定するステップ、及び前記音声コマンドを登録ユーザから受信したと判定した場合に、前記登録ユーザのユーザプロファイル内の情報にさらに基づいて、前記メディア再生システムコマンドを決定するステップ、を含む、請求項1から請求項16のいずれか一項に記載の方法。

請求項18

前記メディア再生システムコマンドは、前記登録ユーザの好みのメディアソースから前記メディアコンテンツを取得するように前記メディア再生システムに指示する、請求項17に記載の方法。

請求項19

前記メディア再生システムコマンドは、前記登録ユーザの好みの再生設定の1つ又は複数を用いて前記メディア再生システムを構成し、及び前記メディア再生システムを介し、前記登録ユーザの好みの再生設定を用いて前記メディア再生システムに前記メディアコンテンツを再生させる指示を含む、請求項17又は請求項18に記載の方法。

請求項20

前記登録ユーザの好みの再生設定は、好みの再生音量、及び好みのオーディオイコライゼーションの設定のうちの1又は複数を含む、請求項19に記載の方法。

請求項21

さらに、前記メディア再生システムに再生設定を変更するように指示する第2の音声入力を受信するステップ、及び前記メディア再生システムにおける1又は複数のメディア再生デバイスの前記再生設定を変更するように前記メディア再生システムに指示するメディア再生システムコマンドを決定するステップ、含む、請求項17から請求項20のいずれか一項に記載の方法。

請求項22

さらに、前記音声コマンドを登録ユーザから受信しなかった場合に、前記音声コマンドをゲストユーザから受信したかどうかを判定するステップ、前記音声コマンドをゲストユーザから受信した場合に、前記ゲストユーザに対して制限設定割り当てるステップ、前記音声コマンドの内容と前記ゲストユーザに対して割り当てた前記制限設定とに基づいて、前記メディア再生システムに対する指示を構成するステップ、及び前記指示を前記メディア再生システムに送信するステップ、を含む、請求項17から請求項21のいずれか一項に記載の方法。

請求項23

さらに、前記メディア再生システムの1又は複数の再生デバイスに前記メディア再生システムコマンドを送信するステップを含み、前記メディア再生システムコマンドは、前記メディア再生システムの1又は複数のメディア再生デバイスを介して前記メディアコンテンツを前記メディア再生システムに再生させる、請求項17から請求項22のいずれか一項に記載の方法。

請求項24

さらに、再生デバイスを設置した周辺環境音響特性を取得するステップ、前記再生デバイスの周辺環境内にあるネットワークマイクロホンデバイスを識別するステップ、前記音響特性を前記ネットワークマイクロホンデバイスに提供するステップ、及び前記ネットワークマイクロホンデバイスが受信した音声入力に、前記ネットワークマイクロホンデバイスによって前記音響特性を適用するステップ、を含む、請求項1から請求項23のいずれか一項に記載の方法。

請求項25

前記周辺環境の音響特性は、キャリブレーション段階において取得される、前記キャリブレーション段階において、1又は複数の前記再生デバイスが1又は複数のトーンを出力する、前記ネットワークデバイスの前記マイクロホンが前記1又は複数の再生デバイスによって出力された前記トーンを受信する、及び前記受信したトーンを解析して、前記周辺環境の音響特性を決定する、請求項24に記載の方法。

請求項26

さらに、前記再生デバイスによって前記周辺環境内で再生中のオーディオコンテンツを前記ネットワークマイクロホンデバイスに提供するステップ、前記ネットワークマイクロホンデバイスが受信した前記音声入力に、前記提供されたオーディオコンテンツを前記マイクロホンデバイスによって適用するステップ、を含む、請求項24又は請求項25に記載の方法。

請求項27

前記識別されたネットワークマイクロホンデバイスは、前記再生デバイスと結合されている、及び前記再生デバイスと同じゾーン内にある、のうちの少なくとも一方である、請求項24から請求項26のいずれか一項に記載の方法。

請求項28

前記マイクロホンデバイスに前記音響特性を送信する前記再生デバイスは、前記メディア再生システムの複数の前記再生デバイスのうちで前記マイクロホンデバイスの直近にある再生デバイスである、請求項24から請求項27のいずれか一項に記載の方法。

請求項29

さらに、前記ネットワークマイクロホンデバイスから、前記音声入力の方向を示す通知を受信するステップ、及び前記受信した前記音声入力の方向を示す通知に基づいて、前記再生デバイスによって再生されるオーディオコンテンツの指向性を調整するステップ、を含む、請求項24から請求項28のいずれか一項に記載の方法。

請求項30

前記ネットワークマイクロホンデバイスに自身が受信した音声入力に対して前記音響特性を適用させるステップは、前記受信した音声入力に適用される前記音響特性に基づいて、前記再生デバイスにフィルタを適用させることを備える、請求項24から請求項29のいずれか一項に記載の方法。

請求項31

前記マイクロホンデバイスに前記音響特性を提供するステップは、前記マイクロホンデバイスに前記音響特性をメッセージとして送信すること、及び前記マイクロホンデバイスに前記音響特性へのアクセスを提供すること、のうちの一方を含む、請求項24から請求項30のいずれか一項に記載の方法。

請求項32

コンピューティングデバイスの1又は複数のプロセッサによって実行されると、請求項1から請求項31のいずれか一項に記載の方法を前記コンピューティングデバイスに実行させる命令を格納している、有形の非一時的なコンピュータ可読媒体

請求項33

コンピューティングデバイスであって、1又は複数プロセッサ、及び前記1又は複数のプロセッサによって実行されると、請求項1から請求項32のいずれか一項に記載の方法を前記コンピューティングデバイスに実行させる命令を格納しているメモリ、を備える、コンピューティングデバイス。

関連出願の相互参照

0001

本出願は、特許協力条約第8条の下に(i)「メディア再生システム音声制御(Voice Control of a Media Playback System)」と題する2016年7月29日に出願された米国非仮特許出願第15/223,218号明細書、(ii)「音楽配信サービスの選択(Music Service Selection)」と題する2016年4月14日に出願された米国非仮特許出願第15/098,718号明細書、(iii)「音声検出の部屋補正(Room−Corrected Voice Detection)」と題する2016年4月14日に出願された米国非仮特許出願第15/098,805号明細書、(iv)「ユーザIDに基づくアクション(Action based on User ID)」と題する2016年4月18日に出願された米国非仮特許出願第15/131,776号明細書、(v)「メディア再生システムの音声制御(Voice Control of a Media Playback System)」と題する2016年3月23日に出願された米国仮特許出願第62/312,350号明細書、(vi)「オーディオ応答再生(Audio Response Playback)」と題する2016年2月22日に出願された米国仮特許出願第62/298,418号明細書、(vii)「音楽配信サービスの選択(Music Service Selection)」と題する2016年2月22日に出願された米国仮特許出願第62/298,425号明細書、(vii)「ネットワーク再生システム及びネットワークマイクロホンシステムを含むメタデータ交換(Metadata Exchange Involving a Networked Playback System and a Networked Microphone System)」と題する2016年2月22日に出願された米国仮特許出願第62/298,350号明細書、(viii)「ネットワークデバイス間のペアリングロスの処理(Handling of Loss of Pairing Between Networked Devices)」と題する2016年2月22日に出願された米国仮特許出願第62/298,388号明細書、(ix)「デフォルト再生デバイス(Default Playback Device(s))」と題する2016年2月22日に出願された米国仮特許出願第62/298,410号明細書、(x)「音声検出の部屋補正(Room−Corrected Voice Detection)」と題する2016年2月22日に出願された米国仮特許出願第62/298,433号明細書、(xi)「コンテンツの混合(Content Mixing)」とする2016年2月22日に出願された米国仮特許出願第62/298,439号明細書、及び(xii)「ユーザIDに基づくアクション(Action based on User ID)」と題する2016年2月22日に出願された米国仮特許出願第62/298,393号明細書に対する優先権の利益を主張するものである。これらの各出願の内容は、その全体を参照によって本明細書に引用するものとする。

技術分野

0002

本願は、コンシューマ製品に関するものであり、特に、メディア再生に向けられた方法、システム、製品、機能、サービス、および他の要素に関するものや、それらのいくつかの態様に関する。

背景技術

0003

2003年に、ソノズ・インコーポレイテッドが最初の特許出願のうちの1つである「複数のネットワークデバイス間のオーディオ再生を同期する方法」と題する特許出願をし、2005年にメディア再生システムの販売を開始するまで、アウトウド設定におけるデジタルオーディオへのアクセスおよび試聴オプションは制限されていた。人々は、ソノズ無線HiFiシステムによって、1つ又は複数のネットワーク再生デバイスを介して多数のソースから音楽体験できるようになっている。スマートフォンタブレット、又はコンピュータインストールされたソフトウェアコントロールアプリケーションを通じて、ネットワーク再生デバイスを備えたいずれの部屋においても、人々は自分が望む音楽を再生することができる。また、例えばコントローラを用いて、再生デバイスを備えた各部屋に異なるストリーミングすることもできるし、同期再生のために複数の部屋をグループ化することもできるし、全ての部屋において同期して同じ歌を聞くこともできる。

0004

これまでのデジタルメディアに対する関心の高まりを考えると、試聴体験を更に向上させることができるコンシューマアクセス可能な技術を更に開発することにニーズがある。

0005

本明細書で開示されている技術の特徴、態様、および利点は、以下の記載、添付の特許請求の範囲、および添付の図面を参照するとより理解しやすい。

図面の簡単な説明

0006

ある実施形態で実施可能な例示的なメデイア再生システムの構成を示す図である。
本明細書に記載の態様に係る例示的な再生デバイスの機能ブロック図である。
本明細書に記載の態様に係る例示的な制御デバイスの機能ブロック図である。
本明細書に記載の態様に係る例示的なコントローラインタフェースを示す図である。
本明細書に記載の態様に係る例示的な複数のネットワークデバイスを示す図である。
本明細書に記載の態様に係る例示的なネットワークマイクロホンデバイスの機能ブロック図である。
ネットワークマイクロホンデバイスに周辺環境音響特性を提供することに関連した例示的なフロー図である。
ネットワークマイクロホンデバイスに周辺環境の音響特性を提供することに関連した、別の例示的なフロー図である。
ネットワークマイクロホンデバイスによって受信された音声入力解釈することに関連した例示的なフロー図である。
周辺環境の音響特性を決定することに関連した例示的なフロー図である。
再生デバイスによって再生されるオーディオコンテンツ指向性を付与することに関連した別の例示的なフロー図である。
本明細書に記載の態様に係る音楽制御の例示的な方法のフロー図である。
本明細書に記載の態様に係る構成プロセスの例示的なユーザインタフェースを示す図である。
本明細書に記載の態様に係る構成プロセスの例示的なユーザインタフェースを示す図である。
本明細書に記載の態様に係る構成プロセスの例示的なユーザインタフェースを示す図である。
本明細書に記載の態様に係る構成プロセスの例示的なユーザインタフェースを示す図である。
いくつかの実施形態に係る例示的な方法を示す図である。
いくつかの実施形態に係る別の例示的な方法を示す図である。
ネットワークマイクロホンデバイスを介して音楽ストリーミングサービス識別することに関連した例示的なフロー図である。
ネットワークマイクロホンデバイスを介して音楽ストリーミングサービスを識別することに関連した別の例示的なフロー図である。

実施例

0007

図面は、いくつかの例示的な実施形態を説明することを目的としているが、本発明が、図面に示した配置および手段に限定されるものではないことは理解される。

0008

I.概要
一般に、音声コマンドは、本明細書で述べているメディア再生システム制御のうちのいずれかの制御を命じるコマンドであってもよい。たとえば、音声コマンドはメディア再生システムに、メディア再生システムにおける1又は複数の再生デバイスを介したメディアコンテンツの再生を命じるコマンドであってもよい。別の実施例では、音声コマンドは、メディア再生システムにおける1又は複数のメディア再生デバイス再生設定変更を命じるコマンドであってもよい。再生設定には、たとえば再生音量、再生トランスポートの制御、音楽ソースの選択、及びグループ化などが主として含まれ得る。

0009

1つの態様では、本明細書に記載の例は、ネットワークマイクロホンデバイス(NMD)が動作する周辺環境の音響特性をNMDに提供することに関する。NMDは、NMDによって受信される音声コマンドを解釈する際に周辺環境の音響特性を使用してもよい。

0010

NMDは、マイクロホンアレイを介してたとえばスピーチなどの音声入力を受信し、且つ音声入力に基づいて機能を実行するデバイスであってもよい。たとえば、NMDは音声コマンドを受信し、且つその受信した音声コマンドを解釈してもよい。次いで、NMDは、音声コマンドに基づいて機能を実行してもよい。NMDは、具体的には「ストリーミングサービス1」から「アーティスト1」による「トラック1」の「再生」を命じる音声コマンドを受信し、その音声入力がオーディオコンテンツの再生を命じるコマンドであると判定し、次いで「ストリーミングサービス1」から「アーティスト1」によるオーディオの要求された「トラック1」を再生するように促してもよい。他の構成も可能である。

0011

NMDが動作する周辺環境は特定の音響特性を有する可能性がある。この音響特性により、その周辺環境内で音声がどのように伝わるかが定義される。周辺環境の音響特性を様々な方法で決定してもよい。1つの例として、スピーカ及びマイクロホンを備える再生デバイスはスピーカを介してテストトーンを出力し、マイクロホンを介してそのテストトーンを受信し、且つ受信したテストトーンを解析してその周辺環境の音響特性を決定してもよい。別の例では、別のネットワークデバイス(制御デバイス、第1の再生デバイス、又はNMD自体でさえ)が、第2の再生デバイスのスピーカからテストトーンを受信し、且つ受信したテストトーンを解析して、その周辺環境の音響特性を決定するマイクロホンを備えていてもよい。このテストトーンは異なる周波数オーディオ音であってもよい。これらの音響特性を、再生デバイス又は通信ネットワーク内コンピューティングデバイスにおいて、オーディオコンテンツ再生時に再生デバイスが使用する目的で格納してもよい。

0012

いくつかの例では、部屋の大きさ、部屋の天井の高さ、部屋にある家具などの周辺環境に関する既知の特性に基づいて、音響特性を推定してもよい。異なる特徴を有する部屋の音響特性をデータベースに格納してもよい。データベースに格納される音響特性を、特定の特徴を有する部屋の以前の解析に基づいて決定していてもよい。ユーザは部屋の特徴を入力してもよく、またデータベースはその周辺環境の音響特性を出力してもよい。また、再生デバイスによる使用のために、再生デバイス自体、又はデータベース内にもこの音響特性を格納してもよい。

0013

また、「再生デバイスのキャリブレーション(Playback Device Calibration)」と題する米国非仮特許出願第14/481,511号明細書、「周辺環境に基づくオーディオ設定(Audio Settings Based on Environment)」と題する米国非仮特許出願第14/216,306号明細書、「移動マイクロホンを用いた空間平均化ルームオーディオキャリブレーションのためのハイブリッドテストトーン(Hybrid Test Tone for Space−Averaged Room Audio Calibration Using a Moving Microphone)」と題する米国非仮特許出願第14/805,140号明細書、「メディアシステムにおけるマルチチャネルペアリング(Multi−Channel Pairing in Media System)」と題する米国非仮特許出願第14/825,961号明細書、及び「デバイスの再生キャリブレーションのためのシステム及び方法(System and Method for Device Playback Calibration」と題する米国特許第9,106,192号明細書において、再生デバイスのキャリブレーションに関する様々な例が記載されており、それらの内容は、その全体を参照によって本明細書にそれぞれ引用するものとする。

0014

NMDは、通常マイクホン応答を介して音声入力を処理することができる。マイクロホン応答は、周波数に対するマイクロホンの感度指標である。いくつかの実施形態では、NMDはまた、周辺環境の音響特性を使用して音声入力を処理し、音声入力の歪みを補正してもよい。このようにして、音声入力をより良好に解釈することができる。

0015

再生デバイスは周辺環境の音響特性をNMDに提供してもよい。メディア再生システムは複数の再生デバイスを有していてもよいので、音響特性を提供する再生デバイスはNMDの直近にあるデバイスであってもよい。別の例として、音響特性を提供する再生デバイスは同じゾーンにある再生デバイスであってもよい。場合によっては、再生デバイスをNMDと結合(グループ化又はペアリング)してもよい。この結合は、再生デバイスとNMDとが同じ部屋又はゾーン内にあるか、及び/又はコンテンツを同期して再生しているなど、これらが互いに近接していることを示していてもよい。NMDを再生デバイスと結合している場合、結合された再生デバイスから周辺環境の音響特性を受信するように、NMDを配置してもよい。さらに、NMDを移動させて別の再生デバイスと結合する場合、結合先となる他の再生デバイスが、NMDを配置した周辺環境用の新たな音響特性を提供してもよい。

0016

NMDは、NMDが配置された周辺環境の音響特性を使用して、自身の動作を改善してもよい。たとえば、NMDは音響特性に基づいてフィルタを定義してもよい。NMDは、自身が受信した音声入力にフィルタを適用して、たとえば音声入力におけるスペクトル歪み空間歪み、及び時間歪みなどの周辺環境の音響特性を補正してもよい。このようにして、音声入力をより良好に解釈することができる。

0017

多くの状況において、NMDをメディア再生システムに近接して配置することができる。メディア再生システムは、オーディオコンテンツを再生する複数の再生デバイスを備えていてもよい。これらの再生デバイスを家庭内の様々な場所に分散設置していてもよく、これらの場所は家庭における寝室リビングルームなどのゾーンであってもよい。結果として、NMDは、メディア再生システムによって同時に再生される音楽などのオーディオコンテンツが流れる中で、音声入力を解釈する必要があり得る。

0018

いくつかの状況では、再生デバイスは、NMDが音声入力にフィルタを適用して周辺環境の音響特性を補正するだけでなく、再生中のオーディオコンテンツを使用して音声入力が良好に分離されるように、NMDに対して再生中のコンテンツに関する通知を提供してもよい。

0019

付加的に、又は代替的に、NMDは音声入力の指向性を決定することが可能であってもよい。この指向性により、音声入力の発信元の方向を定義してもよい。この指向性をメディア再生システムに提供してもよい。メディア再生システムは複数のスピーカを備える。メディア再生システムはこの指向性を使用して、複数のスピーカのオーディオ出力を調整してもよい。たとえば、メディア再生システムは、1又は複数の再生デバイスから発生させるオーディオ音を音声入力の発信元の方向に向けてもよい。これはリスナーが位置する方向であってもよい。他の構成も可能である。

0020

別の態様では、本明細書に記載のいくつかの例は音声入力を介してメディア再生システムを制御することを含む。本明細書で提供されるいくつかの例は、ある方法を含んでいてもよい。本方法は、コマンドワード及び1又は複数のメディア変数インスタンスを含む音声入力を受信するステップ、その音声入力が音楽制御に対応していると判定するステップを含んでいてもよい。本方法は、コマンドワードに対応するコマンドを決定するステップ、音声入力を処理してそのインテントに対応するメディア再生システムのコマンドを識別するステップをさらに含んでいてもよい。音声入力を処理して、1又は複数の音楽変数のインスタンスに関連するメディアコンテンツを識別し、且つメディアコンテンツ内の1又は複数のメディアアイテムを決定してもよい。メディア再生システムに、1又は複数のメディアアイテムに対してコマンドを実行させるようにしてもよい。

0021

他の例では、非一時的なコンピュータ可読媒体を提供している。この非一時的なコンピュータ可読媒体は、コンピューティングデバイスによって実行可能であり、コンピューティングデバイスに機能を実行させる命令を格納している。この機能には、コマンドワード及び1又は複数のメディア変数のインスタンスを含む音声入力を受信すること、その音声入力が音楽制御に対応していると判定することが含まれる。この機能はさらに、コマンドワードに対応するコマンドを決定すること、音声入力を処理してそのインテントに対応するメディア再生システムコマンドを識別することをさらに含んでいてもよい。音声入力を処理して、1又は複数の音楽変数のインスタンスに関連するメディアコンテンツを識別し、且つメディアコンテンツ内の1又は複数のメディアアイテムを決定してもよい。メディア再生システムに、1又は複数のメディアアイテムに対してコマンドを実行させるようにしてもよい。

0022

さらに別の例では、あるシステムを提供している。本システムはプロセッサメモリとを備える。このメモリは、装置によって実行可能であり、本システムに機能を実行させる命令を格納している。この機能には、コマンドワード及び1又は複数のメディア変数のインスタンスを含む音声入力を受信すること、その音声入力が音楽制御に対応していると判定することが含まれる。この機能はさらに、コマンドワードに対応するコマンドを決定すること、音声入力を処理してそのインテントに対応するメディア再生システムコマンドを識別することをさらに含んでいてもよい。音声入力を処理して、1又は複数の音楽変数のインスタンスに関連するメディアコンテンツを識別し、且つメディアコンテンツ内の1又は複数のメディアアイテムを決定してもよい。メディア再生システムに、1又は複数のメディアアイテムに対してコマンドを実行させるようにしてもよい。

0023

さらに別の態様では、本明細書に記載の例は、メディア再生システム(或いは、場合によってはその1又は複数のコンポーネント)が音声コマンドを受信すること、ユーザ識別に基づいてメディア再生システムが実行する適切なアクションを決定することを含む。

0024

音量でメディアコンテンツを聴取することは、家族、友人、及びゲストが参加する団らんの機会となり得る。メディアコンテンツの一例として、トークラジオ書籍テレビからの音声、ローカルドライブに保存された音楽、メディアソース(たとえばPandora(登録商標)Radio、Spotify(登録商標)、Slacker(登録商標)、Radio、Google Play(商標)、iTunes Radio)からの音楽、及びその他の可聴素材を挙げることができる。たとえば、家庭では、人々はパーティーやその他の親睦会で音楽を大音量で再生する場合がある。このような環境では、人々は、各聴取ゾーンの音楽を可聴反響音又は可聴異常音を発生させることなく同期できるように、1つの聴取ゾーン又は複数の聴取ゾーンで同時に音楽を再生することを望む場合がある。人々がオーディオ再生デバイス又はシステムの制御を命じる音声コマンドを使用することができれば、そのような体験はさらに充実する可能性がある。たとえば、人々はオーディオコンテンツ、プレイリスト、又は聴取ゾーンを変更したり、プレイリスト若しくは再生キュー音楽トラックを追加したり、或いは再生設定(たとえば再生、一時停止、次のトラック、前のトラック、再生音量、及びイコライゼーションの設定など)を変更したりすることを望む場合がある。

0025

大音量でメディアコンテンツを聴取することはまた、個人的な体験となり得る。たとえば、個人は出勤前に、エクササイズ中に、夜夕食をとる間に、或いは他の時間において終日にわたり、自宅職場で自ら大音量で音楽を再生することがある。このように個人で体験するために、個人は単一の聴取ゾーン又は範囲に対してオーディオコンテンツの再生を限定することを選択してもよい。個人が聴取ゾーン、オーディオコンテンツ、及び再生設定などの選択を主として命じる音声コマンドを使用できれば、そのような体験はさらに充実する可能性がある。

0026

音声コマンドを実行しようとしている人物を特定することも、このような体験の重要な要素となり得る。その人物が誰であるかと、その人物がメディア再生デバイス又はシステムにしてほしいことは何かとに基づいて音声コマンドを実行することが望ましい場合がある。例示として、家庭におけるパーティーや親睦会では、ホスト又は世帯主がオーディオコンテンツ、聴取ゾーン、又は再生設定の変更を命じる音声コマンドを特定のゲストが使用するのを禁止したい場合がある。場合によっては、ホスト又は世帯主がオーディオコンテンツ、聴取ゾーン、又は再生設定の変更を命じる音声コマンドの使用を特定のゲストに許可する一方で、他のゲストに対してはそのような変更の実施を禁止したい場合がある。ユーザプロファイル又は音声構成設定に基づくユーザ識別は、世帯主の音声とゲストの音声とを区別するのに役立つ可能性がある。

0027

別の例では、ユーザ識別を使用して、成人の音声と子供の音声とを区別することができる。場合によっては、世帯主が、子供にとって不適切なオーディオコンテンツの聴取を命じる音声コマンドを子供が使用するのを禁止したい可能性がある。他の場合には、世帯主が、聴取ゾーン又は再生設定を子供が変更するのを禁止したい可能性がある。たとえば、世帯主が特定の音量でオーディオコンテンツを聴取し、且つ子供がそのオーディオコンテンツの音量を変更するのを禁止したい場合がある。ユーザ識別は、子供が特定のコンテンツにアクセスしたり、聴取ゾーン又は再生設定を変更したりするのを禁止する、ペアレンタルコントロール設定や制限設定を設定するのに役立つ可能性がある。たとえば、ユーザプロファイル又は音声構成設定に基づくユーザ識別は、その子供が誰であるか、その子供が何を聴取できるか、或いはその子供がどの設定を変更できるかを判定するのに役立つ可能性がある。

0028

さらに別の例では、ユーザ識別を使用して意図しない音声コマンドを防止してもよい。たとえば、世帯主が、テレビ又は他の任意のオーディオコンテンツからの音声が意図せずに音声コマンドをトリガすることを防止したい場合がある。上記と類似しているが異なる、他の多くの例を本明細書に記載しており、音声認識に基づく様々なタイプのアクションを示している。

0029

本明細書に記載のいくつかの実施形態は、メディア再生システム(或いは、場合によってはその1又は複数のコンポーネント)が音声コマンドを受信すること、ユーザ識別に基づいてメディア再生システムが実行する適切なアクションを決定することを含む。

0030

例示的な構成では、メディア再生システムは単独の、或いはメディア再生システムサーバなどのコンピューティングデバイスと組み合わせた1又は複数のメディア再生デバイスを備える。別の例示的な構成では、メディア再生システムは、ネットワークマイクロホンシステムサーバ及び1又は複数のNMDを備えるか、又はそれらと通信してもよい。さらに別の例示的な構成では、メディア再生システムサーバ及び/又はネットワークマイクロホンシステムサーバは、クラウドベースサーバシステムであってもよい。これらのデバイス及び/又はサーバの任意の1つ又は組み合わせは、メディア再生システムに対する音声コマンドを受信してもよい。

0031

例示的な動作においては、ネットワークマイクロホンシステム単独で、或いはメディア再生システムと共に1又は複数の機能を実行してもよい。たとえば、音声コマンドを受信することは、ネットワークマイクロホンシステムが1又は複数のNMDを介して音声コマンドを受信すること、その音声コマンドをさらなる処理のためにメディア再生システムに送信することを含んでいてもよい。次いで、メディア再生システムは音声コマンドを同等のテキストコマンドに変換し、そのテキストコマンドを解析してコマンドを識別してもよい。別の場合には、ネットワークマイクロホンシステムは音声コマンドを同等のテキストコマンドに変換し、そのテキストコマンドをメディア再生システムに送信してこれを解析し、且つコマンドを識別してもよい。

0032

音声コマンドは、本明細書に記載のメディア再生システム制御のうちのいずれかの制御を命じるコマンドであってもよい。たとえば、いくつかの実施形態では、音声コマンドは、メディア再生システムにメディア再生システムの1又は複数の再生デバイスを介したメディアコンテンツの再生を命じるコマンドであってもよい。いくつかの実施形態では、音声コマンドは、メディア再生システムの1又は複数のメディア再生デバイスの再生設定変更を命じるコマンドであってもよい。再生設定には、たとえば再生音量、再生トランスポートの制御、音楽ソースの選択、及びグループ化などが主として含まれ得る。

0033

メディア再生システムのコンピューティングデバイスは、音声コマンドを受信した後、その音声コマンドをメディア再生システムの登録ユーザから受信したかどうかを判定してもよい。たとえば、メディア再生システムを家庭内の特定のユーザ若しくは1又は複数のユーザに対して登録してもよい。メディア再生システムのコンピューティングデバイスを、コンピューティングデバイスに格納されたユーザプロファイルに基づいて、音声コマンドを登録ユーザと関連付けるように構成してもよい。登録ユーザはユーザプロファイルを作成し、これをコンピューティングデバイスに格納するようにしてもよい。ユーザプロファイルはユーザ固有の情報を含んでいてもよい。たとえば、ユーザプロファイルはユーザの年齢位置情報、好みの再生設定、好みのプレイリスト、好みのオーディオコンテンツ、及びそのユーザに設定されたアクセス制限に関する情報、並びにそのユーザの音声を識別する情報などを主として含んでいてもよい。

0034

メディア再生システムのコンピューティングデバイスを、ユーザによって設定された音声構成設定に基づいて、音声コマンドをあるユーザと関連付けるように構成してもよい。たとえば、メディア再生システムは、ユーザに音声入力又は一連の音声入力を提供するように要求してもよい。次いで、メディア再生システムのコンピューティングデバイスは音声入力を処理し、その音声入力をユーザと関連付け、且つ情報を格納し、これによってメディア再生システムがユーザからの音声コマンドを認識できるようにしてもよい。

0035

いくつかの例では、メディア再生システムのコンピューティングデバイスを、音声コマンドと関連付けられる信頼性レベルを決定するように構成してもよく、これは、音声コマンドを登録ユーザから受信したかどうかを判定するのにさらに役立つ可能性がある。ユーザ履歴及び位置情報に個別に基づいて、或いはユーザプロファイルで通常確認できる他の任意の情報と組み合わせたものに基づいて、信頼性レベルを決定してもよい。

0036

音声コマンドを登録ユーザから受信したと判定したことに応答して、メディア再生システムのコンピューティングデバイスはメディア再生システムに対する指示を構成してもよい。この指示は音声コマンドの内容と、登録ユーザのユーザプロファイル内の情報とに基づいていてもよい。付加的に又は代替的に、この指示は音声コマンドの内容と、コンピューティングデバイスに格納された音声構成設定とに基づいていてもよい。

0037

本明細書の例に記載しているように、音声コマンドは様々な内容を含んでいてもよい。1つの例では、音声コマンドの内容は、1又は複数の再生デバイスにメディアコンテンツの再生を命じるコマンドを含んでいてもよい。場合によっては、1又は複数の再生デバイスにメディアコンテンツの再生を命じるコマンドと登録ユーザのユーザプロファイル内の情報とに基づいて、メディア再生システムのコンピューティングデバイスは、1又は複数の再生デバイスに登録ユーザの好みのメディアソース(たとえば、音楽ストリーミングサービス)からメディアコンテンツを取得させる指示を構成してもよい。次いで、コンピューティングデバイスは、メディア再生システムに、メディア再生システムの1又は複数の再生デバイスを介してメディアコンテンツを再生させる指示を構成してもよい。さらに別の例では、1又は複数の再生デバイスにメディアコンテンツの再生を命じるコマンドと登録ユーザのユーザプロファイル内の情報とに基づいて、コンピューティングデバイスは、(i)登録ユーザの好みの再生設定の1つ又は複数を用いて1又は複数の再生デバイスを構成し、且つ(ii)メディア再生システムを介し、登録ユーザの好みの再生設定を用いて1又は複数の再生デバイスにメディアコンテンツを再生させる指示を含んでいてもよい。

0038

別の例では、音声コマンドの内容は、1又は複数の再生デバイスにメディアコンテンツの再生を命じるコマンドを含んでいてもよいが、メディア再生システムの特定の聴取ゾーン又は再生ゾーンを特定しない場合がある。音声コマンドの内容と登録ユーザのユーザプロファイル内の情報とに基づいて、コンピューティングデバイスは、1又は複数の再生デバイスを介し、メディア再生システムの特定の再生ゾーン内で1又は複数の再生デバイスにメディアコンテンツを再生させる指示を構成してもよい。

0039

さらに別の例では、音声コマンドの内容は、メディア再生システムに再生設定の変更を命じるコマンドを含んでいてもよい。音声コマンドの内容と登録ユーザのユーザプロファイル内の情報とに基づいて、コンピューティングデバイスは、メディア再生システムにおける1又は複数の再生デバイスの再生設定をメディア再生システムに変更させる指示を構成してもよい。

0040

さらに別の例は、異なるユーザから受信した音声コマンドの競合を解決するために、メディア再生システムが優先順位を決定することを含んでいてもよい。たとえば、メディア再生システムは、登録ゲストから受信した音声コマンドが未登録ゲストよりも高い優先度を有するような優先順位を割り当ててもよい。音声コマンドの競合にはたとえば、あるユーザから受信する曲の再生を命じる音声コマンドと、別のユーザから受信するその曲の再生中止を命じる後続の音声コマンドとが含まれ得る。上記と類似しているが異なる、他の多くの実施例を本明細書に記載している。

0041

別の例では、メディア再生システムは、登録ユーザ又は登録ゲストユーザと関連付けられた起動ワード又は起動フレーズを受信したことに基づいて作動してもよい。起動ワード又は起動フレーズ(たとえば、「ヘイSonos(Hey Sonos)」)を使用して、受信した起動ワードに基づいてユーザからの追加のコマンドをシステムが受け付け時間枠をトリガしてもよい。たとえば、ホスト又は許可されたゲストは再生キューへの曲の追加を命じる音声コマンドを送信してもよく(たとえば、「ねえSonos、再生キューに曲を追加して(Hey Sonos, let’s queue up songs)」)、これにより、再生キューへの特定の曲の追加を命じる追加の音声コマンドをホスト又は許可されたゲストが送信できる時間枠(たとえば、5分)が開放されてもよい。上記と類似しているが異なる、他の多くの実施例を本明細書に記載している。

0042

コンピューティングデバイスのいくつかの実施形態では、メディア再生システムに対する指示又は指示一式を構成した後、その指示又は指示一式をメディア再生システムの1又は複数の再生デバイスに送信してもよい。

0043

さらに別の例では、メディア再生システムのコンピューティングデバイスは音声コマンドを子供から受信したかどうかを判定してもよい。ユーザプロファイル又はゲストプロファイル内の情報に基づいて成人と子供とを区別するように、コンピューティングデバイスを構成してもよい。特に、コンピューティングデバイスは、ユーザの音声のトーン又は周波数に基づいて成人と子供とを区別してもよい。

0044

音声コマンドを子供から受信したと判定したことに応答して、1又は複数の再生デバイスに対して、子供にとって不適切となる恐れのある所与のメディアコンテンツの再生を禁止してもよい。場合によっては、コンピューティングデバイス及び/又は1又は複数の再生デバイスに対して、子供による音声コマンドの内容に基づいた再生設定の変更を禁止してもよい。

0045

さらに別の例では、いくつかのアクションは、メディア再生システムの登録ユーザではなく、ゲストユーザからコマンドを受信したかどうかを判定することに基づいていてもよい。1つの例では、登録ユーザはゲストユーザ用のゲストプロファイルを作成していてもよい。このゲストプロファイルは、ユーザプロファイルに含まれる任意の情報を含んでいてもよい。別の例では、メディア再生システムのコンピューティングデバイスは、音声コマンドを登録ユーザから受信しなかったと判定し、次いで登録ユーザに対してその音声コマンドが登録ユーザ由来のものであるかを問い合わせてもよい。

0046

音声コマンドをゲストユーザから受信したと判定したことに応答して、メディア再生システムのコンピューティングデバイスは、(1)ゲストユーザに対して制限設定を割り当て、(2)音声コマンドの内容とそのゲストユーザに対して割り当てた制限設定とに基づいて、1又は複数の再生デバイスに対する指示を構成し、且つ(3)その指示を1又は複数の再生デバイスに送信してもよい。制限設定は、メディア再生システムの制御を制限する任意の設定であってもよい。

0047

さらに別の態様では、本明細書に記載の例は、コマンドに基づいて適切なストリーミングサービス(たとえばオーディオトラックをストリーミングする)を識別し、且つこれにアクセスすることに関する。

0048

ストリーミングサービスを、NMDによって提供される音声コマンドに基づいて識別し、且つこれにアクセスしてもよい。たとえば、NMDは「Pandora(登録商標)で70年代ロックのラジオを再生して(play Pandora(登録商標)70’s rock radio)」という音声コマンドを受信し、その発言が特定のストリーミングサービスからの特定のラジオ局の再生を命じるコマンドであると判定し、次いでそのサービスからの当該ラジオ局の再生を促してもよい。他の実装形態では、ストリーミングサービスの選択は、制御デバイスのユーザインタフェースを介して入力されるコマンド(たとえばテキスト入力)に基づいていてもよい。他のタイプのコマンドも可能である。

0049

別の例では、ユーザがアクセスを望むストリーミングサービスをコマンドがはっきりと指定しない場合がある。たとえば、ユーザは「クイーンの曲を再生して(play Queen)」又は「70年代ロックを再生して(play 70’s rock)」などのより包括的なコマンドを発行する場合がある。このような場合、既存のシステムでは、どのコンテンツタイプの再生をユーザが望んでいるのか(すなわちアーティストのクイーンなのか、又はアルバムの『クイーン(Queen)』なのか、或いは70年代ロックのラジオ局なのか、又は「ベストオブ」アルバムなのか)を区別する能力限界がある。また、このようなシステムは、ユーザが意図したコンテンツタイプを各種ストリーミングサービスのコンテンツタイプの機能(すなわちどのサービスがラジオ局、アーティスト、及びアルバムを再生できるか)と合致させることができない。

0050

利用可能なコンテンツ量及びストリーミングサービスの数が絶えず増加していることを考慮すると、ユーザコマンドに基づいてユーザに提供するコンテンツタイプに合致した所望のストリーミングサービスをインテリジェントに選択できるシステムが必要とされている。

0051

1つの例では、ストリーミングサービスの選択を、複数のネットワーク対応デバイスを含むネットワーク構成によって遂行してもよい。このネットワーク構成はコマンドを受信し、処理し、且つ解析するNMD、再生デバイス、コンピューティングデバイス、及び/又は制御デバイス(たとえばタブレットやスマートフォン)を含んでいてもよい。この構成は、受信したコマンドの処理及び解析に基づいて、1又は複数の音楽コンテンツ配信サーバからのオーディオコンテンツを取得及び/又は要求することをさらに含んでいてもよい。その後、コマンドに基づいてオーディオ再生体験をもたらすために、オーディオコンテンツをNMD、制御デバイス、及び/又は任意の数の再生デバイスによって取得してもよい。また、ネットワーク構成は他の形態をとっていてもよい。

0052

別の例では、選択はいくつかの基準それぞれに基づいて、或いはこれらを組み合わせたものに基づいていてもよい。ある場合には、ストリーミングサービスの選択は、コマンドによって指定されるコンテンツタイプ(たとえば曲、ジャンル、ラジオ局)と特定のストリーミングサービスが指定されたコンテンツタイプをサポートしているかどうかに依存していてもよい。そのような場合、コンテンツタイプのロジックを使用して、コマンド又はコマンドの一部をコンテンツタイプと関連付けてもよい。次いで、ロジックを通じて識別されたコンテンツタイプを、利用可能なコンテンツタイプを有するストリーミングサービスにマッピングしてもよい。コマンドを通じて指定されるコンテンツタイプの解析を、他の様々な方法で実行してもよい。

0053

さらに別の例では、ストリーミングサービスの選択は、ユーザのストリーミングサービスの嗜好性取り入れることができるユーザ履歴に一部基づいていてもよい。このユーザ嗜好性は、主としてゾーン毎の基準や再生回数が最も多いコンテンツタイプなどに基づいていてもよい。さらに、地理的データ人口統計データ、及び気象タイプのデータを含むが、これらに限定されない様々な形態の「外部」データを引用してもよい。選択に影響する他のタイプの基準を設けていてもよい。

0054

ストリーミングサービスを選択することに加えて、ユーザコマンドの処理によって別の通知が出力されることがある。そのような場合、本システムは、コマンドによって指定されるコンテンツタイプを再生できるストリーミングサービスの提案を出力してもよい。別の例では、本システムは「コンテンツが利用できない」という通知を出力してもよい。そのような通知は、ネットワークマイクロホンデバイス、コントローラで出力されるか、又はNMD若しくはコントローラを介して1又は複数の再生デバイスで出力されてもよい。

0055

様々な選択基準は、各種ストリーミングサービスの信頼性メトリックを決定するためのアルゴリズムの入力として役立つ可能性がある。信頼性メトリックは、特定のストリーミングサービスがユーザが聴取したいと望むものであるかどうかを示すものであってもよい。たとえば、信頼性レベルは、ストリーミングサービスに対して割り当てられる確率値又はパーセンテージ(たとえば1〜100)であってもよい。1つの実施例では、最高信頼性メトリックを有するストリーミングサービスをストリーミングのために指定してもよい。別の場合には、算出された最高信頼性メトリックが閾値信頼値を超えない場合、或いは上位N個の信頼性レベルが互いに特定の範囲内にある場合に、エラー状態をトリガしてもよい。そのような場合、エラー状態を受けてネットワークマイクロホンデバイスは、(1)「コンテンツが利用できない」という通知を出力し、(2)ユーザにコマンドを繰り返すか、又はこれを詳細指定するように要求し、且つ(3)主として好みのサービスパートナー又はデフォルトサービスなどによってオーディオを再生させてもよい。この信頼性メトリックを、他の多くの方法で各種使用してもよい。

0056

本明細書に記載の幾つかの例は、「ユーザ」及び/又は他の実体のような任意の主体によって行われる機能について言及するが、このことは単に例示目的であると理解されるべきである。特許請求の範囲は、特許請求の範囲自体の記載によって明示的に要請されない限り、そのような例示の主体の動作であることを要請するものと解釈されてはならない。当業者にとって、本開示には他の複数の実施形態が含まれることは理解されるであろう。

0057

II.動作環境の例
図1は、本明細書で開示されている1つ又は複数の実施形態で実施可能又は実装可能なメディア再生システム100の例示的な構成を示す。図示されるように、メディア再生システム100は、複数の部屋および空間、例えば、主寝室オフィスダイニングルーム、およびリビングルームを有する例示的なホーム環境と関連付けられている。図1の例に示されるように、メディア再生システム100は、再生デバイス102−124、制御デバイス126および128、有線又は無線のネットワークルータ130を含む。

0058

更に、例示的なメディア再生システム100の異なる構成要素、および異なる構成要素がどのように作用してユーザにメディア体験を提供するかに関しての説明は、以下のセクションで述べられている。本明細書における説明は、概してメディア再生システム100を参照しているが、本明細書で述べられている技術は、図1に示されるホーム環境の用途に限定されるものではない。例えば、本明細書で述べられている技術は、マルチゾーンオーディオが望まれる環境、例えば、レストランモール、又は空港のような商業的環境、スポーツ用多目的車(SUV)、バス又は車のような車両、、若しくはボード、飛行機などの環境において有益である。

0059

a.例示的な再生デバイス
図2は、図1のメディア再生システム100の再生デバイス102−124の1つ又は複数を構成する例示的な再生デバイス200の機能ブロック図を示す。再生デバイス200は、プロセッサ202、ソフトウェアコンポーネント204、メモリ206、オーディオ処理コンポーネント208、オーディオアンプ210、スピーカ212、ネットワークインタフェース214、およびマイクロホン220を含んでもよい。ネットワークインタフェース214は、無線インタフェース216および有線インタフェース218を含む。ある場合では、再生デバイス200は、スピーカ212を含まないが、再生デバイス200を外部スピーカに接続するためのスピーカインタフェースを含んでいてもよい。別の場合では、再生デバイス200は、スピーカ212もオーディオアンプ210も含まないが、再生デバイス200を外部オーディオアンプ又はオーディオビジュアルレシーバーに接続するためのオーディオインタフェースを含んでもよい。

0060

ある例では、プロセッサ202は、メモリ206に記憶された命令に基づいて、入力データを処理するように構成されたクロック駆動コンピュータコンポーネントであってもよい。メモリ206は、プロセッサ202によって実行可能な命令を記憶するように構成された非一時的なコンピュータ可読記録媒体であってもよい。例えば、メモリ206は、ある機能を実行するためにプロセッサ202によって実行可能なソフトウェアコンポーネント204の1つ又は複数をロードすることができるデータストレージであってもよい。ある例では、機能は、再生デバイス200がオーディオソース又は別の再生デバイスからオーディオデータを読み出すステップを含んでもよい。別の例では、機能は、再生デバイス200がネットワーク上の別のデバイス又は再生デバイスにオーディオデータを送信するステップを含んでもよい。更に別の例では、機能は、マルチチャンネルオーディオ環境を作るために、再生デバイス200と1つ又は複数の再生デバイスとをペアリングするステップを含んでもよい。

0061

ある機能は、再生デバイス200が、1つ又は複数の他の再生デバイスと、オーディオコンテンツの再生を同期するステップを含む。再生を同期している間、再生デバイス200によるオーディオコンテンツの再生と1つ又は複数の他の再生デバイスによる再生との間の遅延を、リスナーが気づかないことが好ましい。「複数の独立クロックデジタルデータ処理デバイス間の動作を同期するシステムおよび方法」と題する米国特許第8,234,395号が本明細書に参照として援用されており、それは再生デバイス間のオーディオ再生を同期することが述べられたより詳細な例を提供している。

0062

更に、メモリ206は、データを記憶するように構成されていてもよい。データは、例えば、1つ又は複数のゾーンおよび/又はゾーングループに一部として含まれる再生デバイス200などの再生デバイス200、再生デバイス200によりアクセス可能なオーディオソース、又は再生デバイス200(又は他の再生デバイス)と関連付け可能な再生キュー、に関連付けられている。データは、定期的に更新され、再生デバイス200の状態を示す1つ又は複数の状態変数として記憶されてもよい。また、メモリ206は、メディアシステムの他のデバイスの状態と関連付けられたデータを含んでもよく、デバイス間で随時共有することによって、1つ又は複数のデバイスが、システムと関連するほぼ直近のデータを有してもよい。他の実施形態も可能である。

0063

オーディオ処理コンポーネント208は、とりわけ、1つ又は複数のデジタル−アナログ変換器(DAC)、オーディオ処理コンポーネント、オーディオ強化コンポーネント、又はデジタルシグナルプロセッサ(DSP)などを含んでいてもよい。ある実施形態では、1つ又は複数のオーディオ処理コンポーネント208は、プロセッサ202のサブコンポーネントであってもよい。ある実施形態では、オーディオコンテンツが、オーディオ処理コンポーネント208によって処理および/又は意図的に変更されることによって、オーディオ信号を生成してもよい。生成されたオーディオ信号は、オーディオアンプ210に送信され、増幅され、スピーカ212を通じて再生される。特に、オーディオアンプ210は、1つ又は複数のスピーカ212を駆動できるレベルまでオーディオ信号を増幅するように構成されたデバイスを含んでもよい。スピーカ212は、独立した変換器(例えば、「ドライバ」)又は1つ又は複数のドライバを内包する筐体を含む完全なスピーカシステムを備えてもよい。スピーカ212に備えられたあるドライバは、例えば、サブウーファー(例えば、低周波用)、ミドルレンジドライバ(例えば、中間周波用)、および/又はツイーター高周波用)を含んでもよい。ある場合では、1つ又は複数のスピーカ212のそれぞれの変換器は、オーディオアンプ210の対応する個々のオーディオアンプによって駆動されてもよい。再生デバイス200で再生するアナログ信号を生成することに加えて、オーディオ処理コンポーネント208は、オーディオコンテンツを処理し、そのオーディオコンテンツを1つ又は複数の他の再生デバイスに再生させるために送信する。

0064

再生デバイス200によって処理および/又は再生されるオーディオコンテンツは、外部ソース、例えば、オーディオライン−イン入力接続(例えば、オートディテクティング3.5mmオーディオラインイン接続)又はネットワークインタフェース214を介して、受信されてもよい。

0065

ネットワークインタフェース214は、データネットワーク上で再生デバイス200と1つ又は複数の他のデバイスとの間のデータフローを可能にするように構成されてもよい。このように、再生デバイス200は、再生デバイスと通信する1つ又は複数の他の再生デバイス、ローカルエリアネットワーク内のネットワークデバイス、又は例えば、インターネット等のワイドエリアネットワーク上のオーディオコンテンツソースから、データネットワークを介してオーディオコンテンツを受信するように構成されていてもよい。ある例では、再生デバイス200によって送信および受信されたオーディオコンテンツおよび他の信号は、インターネットプロトコル(IP)に基づくソースアドレスおよびIPに基づく宛先アドレスを含むデジタルパケットの形で送信されてもよい。そのような場合、ネットワークインタフェース214は、デジタルパケットデータを解析することによって、再生デバイス200宛てのデータを、再生デバイス200によって適切に受信して処理することができる。

0066

図示されるように、ネットワークインタフェース214は、無線インタフェース216と有線インタフェース218とを含んでもよい。無線インタフェース216は、再生デバイス200用のネットワークインタフェース機能を提供し、通信プロトコル(例えば、無線規格IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4Gモバイル通信基準などを含む無線基準(規格)のいずれか)に基づいて、他のデバイス(例えば、再生デバイス200に関連付けられたデータネットワーク内の他の再生デバイス、スピーカ、レシーバー、ネットワークデバイス、制御デバイス)と無線通信してもよい。有線インタフェース218は、再生デバイス200用のネットワークインタフェース機能を提供し、通信プロトコル(例えば、IEEE802.3)に基づいて他のデバイスとの有線接続を介して通信してもよい。図2に示されるネットワークインタフェース214は、無線インタフェース216と有線インタフェース218との両方を含んでいるが、ネットワークインタフェース214は、ある実施形態において、無線インタフェースのみか、又は有線インタフェースのみを含んでいてもよい。

0067

マイクロホン220を、再生デバイス200の周辺環境の音声を検出するように配置してもよい。たとえば、マイクロホンを、再生デバイスのハウジング外壁に取り付けてもよい。マイクロホンは、コンデンサマイクロホンエレクトレットコンデンサマイクロホン、又はダイナミックマイクロホンなどの既知であるか、又は今後開発される任意のタイプのマイクロホンであってもよい。マイクロホンはスピーカ220の周波数範囲の一部に敏感であってもよい。1又は複数のスピーカ220は、マイクロホン220とは逆に動作してもよい。いくつかの態様では、再生デバイス200はマイクロホン220を有していない場合がある。

0068

ある例では、再生デバイス200と他の再生デバイスとは、ペアにされて、オーディオコンテンツの2つの別々のオーディオコンポーネントを再生してもよい。例えば、再生デバイス200は、左チャンネルオーディオコンポーネントを再生するように構成される一方、他の再生デバイスは、右チャンネルオーディオコンポーネントを再生するように構成されてもよい。これにより、オーディオコンテンツのステレオ効果を生成するか、又は強化することができる。ペアにされた再生デバイス(「結合再生デバイス」とも言う)は、更に、他の再生デバイスと同期してオーディオコンテンツを再生してもよい。

0069

別の例では、再生デバイス200は、1つ又は複数の他の再生デバイスと音響的に統合され、単一の統合された再生デバイス(統合再生デバイス)を形成してもよい。統合再生デバイスは、統合されていない再生デバイス又はペアにされた再生デバイスと比べて、サウンドの処理や再現を異なるように構成することができる。なぜならば、統合再生デバイスは、オーディオコンテンツを再生するスピーカ追加することができるからである。例えば、再生デバイス200が、低周波レンジのオーディオコンテンツを再生するように設計されている場合(例えば、サブウーファー)、再生デバイス200は、全周波数レンジのオーディオコンテンツを再生するように設計された再生デバイスと統合されてもよい。この場合、全周波数レンジの再生デバイスは、低周波の再生デバイス200と統合されたとき、オーディオコンテンツの中高周波コンポーネントのみを再生するように構成されてもよい。一方で低周波レンジの再生デバイス200は、オーディオコンテンツの低周波コンポーネントを再生する。更に、統合再生デバイスは、単一の再生デバイス、又は更に他の統合再生デバイスとペアにされてもよい。

0070

例として、現在、ソノズ・インコーポレイテッドは、「PLAY:1」、「PLAY:3」、「PLAY:5」、「PLAYBAR」、「CONNECT:AMP」、「CONNECT」、および「SUB」を含む再生デバイスを販売提供している。他の過去、現在、および/又は将来のいずれの再生デバイスにおいても、追加的に又は代替的に本明細書で開示された実施例の再生デバイスに実装して使用することができる。更に、再生デバイスは、図2に示された特定の例又は提供されるソノズ製品に限定されないことは理解される。例えば、再生デバイスは、有線又は無線のヘッドホンを含んでもよい。別の例では、再生デバイスは、パーソナルモバイルメディア再生デバイス用のドッキングステーションを含むか、又は、それらと対話してもよい。更に別の例では、再生デバイスは、別のデバイス又はコンポーネント、例えば、テレビ、照明器具、又は屋内又は屋外で使用するためのいくつかの他のデバイスと一体化されてもよい。

0071

b.例示的な再生ゾーン構成
図1のメディア再生システム100に戻って、環境は、1つ又は複数の再生ゾーンを有しており、それぞれの再生ゾーンは1つ又は複数の再生デバイスを含んでいる。メディア再生システム100は、1つ又は複数の再生ゾーンで形成されており、後で1つ又は複数のゾーンが追加又は削除して、図1に示す例示的な構成としてもよい。それぞれのゾーンは、異なる部屋又は空間、例えば、オフィス、浴室、主寝室、寝室、キッチン、ダイニングルーム、リビングルーム、および/又はバルコニーに基づく名前が与えられてもよい。ある場合では、単一の再生ゾーンは複数の部屋又は空間を含んでいてもよい。別の場合では、単一の部屋又は空間は、複数の再生ゾーンを含んでいてもよい。

0072

図1に示されるように、バルコニー、ダイニングルーム、キッチン、浴室、オフィス、および寝室のゾーンのそれぞれは、1つの再生デバイスを有する一方、リビングルームおよび主寝室のゾーンのそれぞれは、複数の再生デバイスを有する。リビングルームゾーンは、再生デバイス104,106,108,110が、別々の再生デバイスとしてか、1つ又は複数の結合再生デバイスとしてか、1つ又は複数の統合再生デバイスとしてか、又はこれらのいずれかの組み合わせで、オーディオコンテンツを同期して再生するように構成されてもよい。同様に、主寝室の場合では、再生デバイス122および124が、別々の再生デバイスとしてか、結合再生デバイスとしてか、又は統合再生デバイスとして、オーディオコンテンツを同期して再生するように構成されてもよい。

0073

ある例では、図1の環境における1つ又は複数の再生ゾーンは、それぞれ異なるオーディオコンテンツを再生している。例えば、ユーザは、バルコニーゾーンでグリルしながら、再生デバイス102によって再生されるヒップホップ音楽を聞くことができる。一方、別のユーザは、キッチンゾーンで食事を準備しながら、再生デバイス114によって再生されるクラシック音楽を聞くことができる。別の例では、再生ゾーンは、同じオーディオコンテンツを別の再生ゾーンと同期して再生してもよい。例えば、ユーザがオフィスゾーンにいる場合、オフィスゾーンの再生デバイス118が、バルコニーの再生デバイス102で再生されている音楽と同じ音楽を再生してもよい。そのような場合、再生デバイス102および118は、ロック音楽を同期して再生しているため、ユーザは、異なる再生ゾーン間を移動してもアウト−ラウドで再生されるオーディオコンテンツをシームレス(又は少なくともほぼシームレス)に楽しむことができる。再生ゾーン間の同期は、前述の米国特許第8,234,395号で述べられているような再生デバイス間の同期と同様の方法で行ってもよい。

0074

上述したように、メディア再生システム100のゾーン構成は、動的に変更してもよく、ある実施形態では、メディア再生システム100は、複数の構成をサポートする。例えば、ユーザが1つ又は複数の再生デバイスを、物理的にゾーンに移動させるか、又はゾーンから移動させる場合、メディア再生システム100は変更に対応するように再構成されてもよい。例えば、ユーザが再生デバイス102をバルコニーゾーンからオフィスゾーンに物理的に移動させる場合、オフィスゾーンは、再生デバイス118と再生デバイス102との両方を含んでもよい。必要に応じて、制御デバイス、例えば制御デバイス126と128とを介して、再生デバイス102が、ペアにされるか、又はオフィスゾーンにグループ化されるか、および/又はリネームされてもよい。一方、1つ又は複数の再生デバイスが、再生ゾーンを未だ設定していないホーム環境において、ある領域に移動させられた場合、新しい再生ゾーンがその領域に形成されてもよい。

0075

更に、メディア再生システム100の異なる再生ゾーンは、動的にゾーングループに組み合わされてもよいし、又は別々の再生ゾーンに分割されてもよい。例えば、ダイニングルームゾーンとキッチンゾーン114とがディナーパーティ用のゾーングループに組み合わされることによって、再生デバイス112と114とがオーディオコンテンツを同期して再生することができる。一方、あるユーザがテレビを見たい一方、他のユーザがリビングルーム空間の音楽を聞きたい場合、リビングルームゾーンが、再生デバイス104を含むテレビゾーンと、再生デバイス106,108,110を含むリスニングゾーンと、に分けられてもよい。

0076

c.例示的な制御デバイス
図3は、メディア再生システム100の制御デバイス126と128とうちの一方又は両方を構成する例示的な制御デバイス300の機能ブロック図を示す。図示されるように、制御デバイス300は、プロセッサ302、メモリ304、ネットワークインタフェース306、ユーザインタフェース308、マイクロホン310、及びソフトウェアコンポーネント312を含んでもよい。ある例では、制御デバイス300は、メディア再生システム100専用の制御デバイスであってもよい。別の例では、制御デバイス300は、メディア再生システムコントローラアプリケーションソフトウェアをインストールされたネットワークデバイス、例えば、iPhone(登録商標)、iPad(登録商標)、又は任意の他のスマートフォン、タブレットあるいはネットワークデバイス(例えば、PC又はMac(登録商標)などのネットワークコンピュータ)であってもよい。

0077

プロセッサ302は、メディア再生システム100のユーザアクセスコントロール、および構成を可能にすることに関する機能を実行するように構成されてもよい。メモリ304は、プロセッサ302によって実行可能な1つ又は複数のソフトウェアコンポーネントを、それらの機能を実行するために、搭載可能なデータストレージであってもよい。また、メモリ304は、メディア再生システムコントローラアプリケーションソフトウェアと、メディア再生システム100とユーザとに関連付けられた他のデータを記憶するように構成されていてもよい。

0078

ある例では、ネットワークインタフェース306は、工業規格(例えば、赤外線、無線、IEEE802.3などの有線規格、IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15などの無線規格、4G通信規格など)に基づいてもよい。ネットワークインタフェース306においては、制御デバイス300がメディア再生システム100内の他のデバイスと通信するための手段を提供してもよい。ある例では、データおよび情報(例えば、状態変数)は、ネットワークインタフェース306を介して制御デバイス300と他のデバイスとの間で通信されてもよい。例えば、メディア再生システム100における再生ゾーンおよびゾーングループの構成は、制御デバイス300によって、再生デバイス又は別のネットワークデバイスから受信されてもよいし、あるいは制御デバイス300によって、ネットワークインタフェース306を介して別の再生デバイス又はネットワークデバイスに送信されてもよい。ある場合では、他のネットワークデバイスは、別の制御デバイスであってもよい。

0079

ボリュームコントロールおよびオーディオ再生コントロールなどの再生デバイス制御コマンドは、ネットワークインタフェース306を介して制御デバイス300から再生デバイスに通信されてもよい。上述したように、メディア再生システム100の構成の変更は、ユーザにより制御デバイス300を用いて行うことができる。構成の変更は、1つ又は複数の再生デバイスをゾーンに追加すること、1つ又は複数の再生デバイスをゾーンから取り除くこと、1つ又は複数のゾーンをゾーングループに追加すること、1つ又は複数のゾーンをゾーングループから取り除くこと、結合プレーヤー又は統合プレーヤーを形成すること、結合プレーヤー又は統合プレーヤーから1つ又は複数の再生デバイスに分けることなどを含んでもよい。このように、制御デバイス300は、コントローラと呼ばれてもよく、制御デバイス300は、メディア再生システムコントローラアプリケーションソフトウェアをインストールした専用のコントローラか、又はネットワークデバイスであってもよい。

0080

制御デバイス300はマイクロホン310を備えていてもよい。マイクロホン310を、制御デバイス300の周辺環境の音声を検出するように配置してもよい。マイクロホン310は、コンデンサマイクロホン、エレクトレットコンデンサマイクロホン、又はダイナミックマイクロホンなどの既知であるか、又は今後開発される任意のタイプのマイクロホンであってもよい。マイクロホンは周波数範囲の一部に敏感であってもよい。2つ以上のマイクロホン310を、音源(たとえば、音声、可聴音)の位置情報を捕捉し、及び/又は背景雑音フィルタリング補助するように構成してもよい。

0081

制御デバイス300のユーザインタフェース308は、図4に示されるコントローラインタフェース400などのようなコントローラインタフェースを提供することによって、メディア再生システム100のユーザアクセスおよび制御を可能にするように構成されていてもよい。コントローラインタフェース400は、再生制御領域410、再生ゾーン領域420、再生ステータス領域430、再生キュー領域440、およびオーディオコンテンツソース領域450を含む。図示されるユーザインタフェース400は、図3の制御デバイス300などのようなネットワークデバイス(および/又は図1の制御デバイス126および128)を設けられたユーザインタフェースの単なる一例であって、ユーザによってメディア再生システム100などのようなメディア再生システムを制御するためにアクセスされるものである。あるいは、様々なフォーマットスタイル、および対話型シーケンスを他のユーザのインタフェースを1つ又は複数のネットワークデバイスに実装し、メディア再生システムへ類似の制御アクセスを提供してもよい。

0082

再生制御領域410は、(例えば、タッチ又はカーソルを用いることで)選択可能なアイコンを含んでもよい。このアイコンによって、選択された再生ゾーン又はゾーングループ内の再生デバイスが、再生又は停止、早送り、巻き戻し、次にスキップ、前にスキップ、シャッフルモードオンオフリピートモードのオン/オフ、クロスフェードモードのオン/オフを行う。再生制御領域410は、別の選択可能なアイコンを含んでもよい。別の選択可能なアイコンは、イコライゼーション設定再生ボリュームなど他の設定などを変更してもよい。

0083

再生ゾーン領域420は、メディア再生システム100内の再生ゾーンの表示を含んでもよい。ある実施形態では、再生ゾーンのグラフィック表示が選択可能であってもよい。追加の選択可能なアイコンを移動させることによって、メディア再生システム内の再生ゾーンを管理又は構成することができる。例えば、結合ゾーンの作成、ゾーングループの作成、ゾーングループの分割、およびゾーングループのリネームなど他の管理又は構成を行うことができる。

0084

例えば、図示されるように、「グループ」アイコンは、再生ゾーンのグラフィック表示のそれぞれに設けられてもよい。あるゾーンのグラフィック表示内の「グループ」アイコンは、メディア再生システム内の1つ又は複数のゾーンを選択して、あるゾーンとグループ化するオプションを出せるように選択可能であってもよい。一度グループ化すると、あるゾーンとグループ化されたゾーン内の再生デバイスは、あるゾーン内の再生デバイスと同期してオーディオコンテンツを再生するように構成される。同様に、「グループ」アイコンは、ゾーングループのグラフィック表示内に設けられてもよい。この場合、「グループ」アイコンは、ゾーングループ内の1つ又は複数のゾーンをゾーングループから取り除くために、ゾーングループ内の1つ又は複数のゾーンを選択から外すというオプションを出すように選択可能であってもよい。ユーザインタフェース400等のユーザインタフェースを介してゾーンをグループ化およびグループ解除するための他の対話をすることも可能であるし、実施することも可能である。再生ゾーン領域420内の再生ゾーンの表示は、再生ゾーン又はゾーングループ構成が変更されると、動的に更新されてもよい。

0085

再生ステータス領域430は、現在再生されているオーディオコンテンツ、前に再生されたオーディオコンテンツ、又は選択された再生ゾーン又はゾーングループ内で次に再生するように予定されているオーディオコンテンツ、のグラフィック表示を含んでもよい。選択可能な再生ゾーン又は再生グループは、ユーザインタフェース上で、例えば、再生ゾーン領域420および/又は再生ステータス領域430内で視覚的に区別されてもよい。グラフィック表示は、トラックタイトル、アーティスト名、アルバム名、アルバム年、トラックの長さ、およびメディア再生システムを、ユーザインタフェース400を介して制御するときに、ユーザにとって有益な他の関連情報を含んでいてもよい。

0086

再生キュー領域440は、選択された再生ゾーン又はゾーングループと関連付けられた再生キュー内のオーディオコンテンツのグラフィック表示を含んでもよい。ある実施形態では、それぞれの再生ゾーン又はゾーングループは、再生ゾーン又は再生グループによって再生される0以上のオーディオアイテムに対応する情報を含む再生キューと関連付けられていてもよい。例えば、再生キュー内のそれぞれのオーディオアイテムは、ユー・アールアイ(URI)、ユー・アール・エル(URL)、又は再生ゾーン又はゾーングループ内の再生デバイスによって使用可能な他の識別子を含んでいてもよい。これらによって、ローカルオーディオコンテンツソース又はネットワークオーディオコンテンツソース、からオーディオアイテムを見つけ、および/又は取り出し、再生デバイスによって再生することができる。

0087

ある例では、プレイリストが再生キューに追加されてもよい。この場合、プレイリスト内のそれぞれのオーディオアイテムに対応する情報が再生キューに追加されてもよい。別の例では、再生キュー内のオーディオアイテムは、プレイリストとして保存されてもよい。更に別の例では、再生デバイスがストリーミングオーディオコンテンツ、例えば、再生時間を有することで連続して再生されないオーディオアイテムよりも、停止しない限り連続して再生されるインターネットラジオを再生し続けているとき、再生キューは、空であってもよいし、又は「未使用」であるが埋められていてもよい。別の実施形態では、再生キューは、インターネットラジオおよび/又は他のストリーミングオーディオコンテンツアイテムを含むことができ、且つ再生ゾーン又はゾーングループがそれらのアイテムを再生しているとき「使用中」とすることができる。他の例も可能である。

0088

再生ゾーン又はゾーングループが「グループ化される」か、又は「グループ解除」されるとき、影響を受ける再生ゾーン又はゾーングループに関連付けられた再生キューは、クリアされてもよいし、又は再び関連付けられてもよい。例えば、第1再生キューを含む第1再生ゾーンが、第2再生キューを含む第2再生ゾーンとグループ化された場合、形成されたゾーングループは、関連付けられた再生キューを有していてもよい。関連付けられた再生キューは、最初は空であるか、(例えば、第2再生ゾーンが第1再生ゾーンに追加された場合、)第1再生キューのオーディオアイテムを含むか、(例えば、第1再生ゾーンが第2再生ゾーンに追加された場合、)第2再生キューのオーディオアイテムを含むか、又は第1再生キューと第2再生キューとの両方のオーディオアイテムを組み合わせられる。その後、形成されたゾーングループがグループ解除された場合、グループ解除された第1再生ゾーンは、前の第1再生キューと再び関連付けられてもよいし、空の新しい再生キューと関連付けられてもよいし、あるいはゾーングループがグループ解除される前にゾーングループと関連付けられていた再生キューのオーディオアイテムを含む新しい再生キューと関連付けられてもよい。同様に、グループ解除された第2再生ゾーンは、前の第2再生キューと再び関連付けられてもよいし、空の新しい再生キューと関連付けられてもよいし、あるいはゾーングループがグループ解除される前にゾーングループと関連付けられていた再生キューのオーディオアイテムを含む新しい再生キューと関連付けられてもよい。他の例も可能である。

0089

図4のユーザインタフェース400に戻って、再生キュー領域440内のオーディオコンテンツのグラフィック表示は、トラックタイトル、アーティスト名、トラックの長さ、および再生キュー内のオーディオコンテンツと関連付けられた他の関連情報を含んでいてもよい。ある例では、オーディオコンテンツのグラフィック表示は、追加の選択可能なアイコンを選択して移動させることができる。これにより、再生キューおよび/又は再生キューに表示されたオーディオコンテンツを管理および/又は操作することができる。例えば、表示されたオーディオコンテンツは、再生キューから取り除いてもよいし、再生キュー内の異なる位置に移動させてもよいし、すぐに再生させるか若しくは現在再生しているオーディオコンテンツの後に再生するように選択されてもよいし、あるいは他の動作を実行してもよい。再生ゾーン又はゾーングループに関連付けられた再生キューは、再生ゾーン又はゾーングループ内の1つ又は複数の再生デバイスのメモリ、再生ゾーン又はゾーングループに入っていない再生デバイスのメモリ、および/又は他の指定のデバイスのメモリに記憶されていてもよい。

0090

オーディオコンテンツソース領域450は、選択可能なオーディオコンテンツソースのグラフィック表示を含んでいてもよい。このオーディオコンテンツソースにおいては、オーディオコンテンツが選択された再生ゾーン又はゾーングループによって取り出され、再生されてもよい。オーディオコンテンツソースに関する説明は、以降のセクションを参照することができる。

0091

d.例示的なオーディオコンテンツソース
前回図示したように、ゾーン又はゾーングループ内の1つ又は複数の再生デバイスは、再生するオーディオコンテンツを、(例えば、オーディオコンテンツの対応するURI又はURLに基づいて、)複数の入手可能なオーディオコンテンツソースから取り出すように構成されていてもよい。ある例では、オーディオコンテンツは、再生デバイスによって、対応するオーディオコンテンツソース(例えば、ライン−イン接続)から直接取り出されてもよい。別の例では、オーディオコンテンツは、1つ又は複数の他の再生デバイス若しくはネットワークデバイスを介してネットワーク上の再生デバイスに提供されてもよい。

0092

例示的なオーディオコンテンツソースは、メディア再生システム内の1つ又は複数の再生デバイスのメモリを含んでもよい。メディア再生システムとしては、例えば、図1のメディア再生システム100、1つ又は複数のネットワークデバイス上のローカルミュージックライブラリ(例えば、制御デバイス、ネットワーク対応パーソナルコンピュータ、又はネットワーク接続ストレージ(NAS)など)、インターネット(例えば、クラウド)を介してオーディオコンテンツを提供するストリーミングオーディオサービス、あるいは再生デバイス又はネットワークデバイスのライン−イン入力接続を介してメディア再生システムに接続されるオーディオソース、他の可能なシステムであってもよい。

0093

ある実施形態では、オーディオコンテンツソースは、図1のメディア再生システム100などのようなメディア再生システムに定期的に追加されてもよいし、定期的に取り除かれてもよい。ある例では、1つ又は複数のオーディオコンテンツソースが追加される、取り除かれる、又は更新される度に、オーディオアイテムのインデックス付けが行われてもよい。オーディオアイテムのインデックス付けは、ネットワーク上で共有される全てのフォルダディレクトリ内識別可能なオーディオアイテムをスキャンすることを含んでもよい。ここで、ネットワークは、メディア再生システム内の再生デバイスによってアクセス可能である。また、オーディオアイテムのインデックス付けは、メタデータ(例えば、タイトル、アーティスト、アルバム、トラックの長さなど)と他の関連情報とを含むオーディオコンテンツデータベースを作成すること、又は更新すること、を含んでもよい。他の関連情報とは、例えば、それぞれの識別可能なオーディオアイテムを見つけるためのURI又はURLを含んでもよい。オーディオコンテンツソースを管理し、且つ維持するための他の例も可能である。

0094

再生デバイス、制御デバイス、再生ゾーン構成、およびメディアコンテンツソースに関しての上述した説明は、以降で述べられている機能および方法を実施可能ないくつかの例示的な動作環境のみを提供している。本発明は、本明細書で明示的に述べられていないメディア再生システム、再生デバイス、およびネットワークデバイスの他の動作環境および構成であっても適用可能であり、その機能および方法を実施するのに適している。

0095

e.例示的な複数のネットワークデバイス
図5は、音声制御に基づいてオーディオ再生体験をもたらすように構成され得る例示的な複数のデバイス500を示す。当業者であれば、図5に示したデバイスは例示する目的のみのものであり、異なる及び/又は追加のデバイスを含む変形例が可能であってもよいことを理解する。図示されているように、複数のデバイス500はコンピューティングデバイス504,506,508と、ネットワークマイクロホンデバイス(NMD)512,514,516と、再生デバイス(PBD)532,534,536,538と、制御デバイス(CR)522とを備える。

0096

複数のデバイス500の各々は、主として広域ネットワークWAN)、ローカルエリアネットワーク(LAN)、及びパーソナルエリアネットワーク(PAN)などの1又は複数のタイプのネットワークを介し、主としてNFC、Bluetooth(登録商標)、Ethernet、及びIEEE802.11などの1又は複数のネットワークプロトコルに従って、複数のデバイス内の1又は複数の他のデバイスとの通信を確立できるネットワーク対応デバイスであってもよい。

0097

図示されているように、コンピューティングデバイス504,506,508はクラウドネットワーク502の一部であってもよい。クラウドネットワーク502は追加のコンピューティングデバイスを備えていてもよい。1つの例では、コンピューティングデバイス504,506,508は異なるサーバであってもよい。別の例では、コンピューティングデバイス504,506,508の2つ以上は単一のサーバのモジュールであってもよい。同様に、コンピューティングデバイス504,506,508の各々は1又は複数のモジュール若しくはサーバを備えていてもよい。本明細書において例示を容易にするために、コンピューティングデバイス504,506,508の各々をクラウドネットワーク502内の特定の機能を実行するように構成してもよい。たとえば、コンピューティングデバイス508は音楽ストリーミングサービス用のオーディオコンテンツのソースであってもよい。

0098

図示されているように、コンピューティングデバイス504を、通信経路542を介してNMD512,514,516とインタフェースするように構成してもよい。NMD512,514,516は1又は複数の「スマートホーム」システムのコンポーネントであってもよい。ある場合には、NMD512,514,516を、図1に示すデバイスの配置と同様に、家庭全体に物理的に配置してもよい。別の場合には、NMD512,514,516の2つ以上を、互いに比較的近接して物理的に配置してもよい。通信経路542は主としてインターネットを含むWAN、LAN、及び/又はPANなどの1又は複数のタイプのネットワークを備えていてもよい。

0099

1つの例では、NMD512,514,516のうちの1つ又は複数は、主として音声検出用に構成されたデバイスであってもよい。別の例では、NMD512,514,516のうちの1つ又は複数は、様々な一次ユーティリティを有するデバイスのコンポーネントであってもよい。たとえば、図2及び図3に関連して上述したように、NMD512,514,516のうちの1つ又は複数は、再生デバイス200のマイクロホン220又はネットワークデバイス300のマイクロホン310であってもよい。さらに、場合によっては、NMD512,514,516のうちの1つ又は複数は、再生デバイス200又はネットワークデバイス300であってもよい。1つの例では、NMD512、514、及び/又は516のうちの1つ又は複数はマイクロホンアレイに配置される複数のマイクロホンを備えていてもよい。

0100

図示されているように、コンピューティングデバイス506を、通信経路544を介してCR522と、PBD532,534,536,538とにインタフェースするように構成してもよい。1つの例では、CR522は図2のネットワークデバイス200などのネットワークデバイスであってもよい。したがって、CR522を、図4のコントローラインタフェース400を提供するように構成してもよい。同様に、PBD532,534,536,538は図3の再生デバイス300などの再生デバイスであってもよい。このため、PBD532,534,536,538を、図1に示すように家庭全体に物理的に配置してもよい。例示する目的上、PBD536及び538は結合ゾーン530の一部であってもよく、その一方でPBD532及び534は自身が属するそれぞれのゾーンの一部であってもよい。上述したように、PBD532,534,536,538を動的に結合、グループ化、結合解除、且つグループ解除してもよい。通信経路544は主としてインターネット含むWAN、LAN、及び/又はPANなどの1又は複数のタイプのネットワークを備えていてもよい。

0101

1つの例では、NMD512,514,516と同様に、CR522とPBD532,534,536,538とはまた、1又は複数の「Smart Home」システムのコンポーネントであってもよい。ある場合には、PBD532,534,536,538をNMD512,514,516と同じ家庭全体に配置してもよい。さらに、上記で提案したように、PBD532,534,536,538のうちの1つ又は複数はNMD512,514,516の1又は複数であってもよい。

0102

NMD512,514,516はローカルエリアネットワークの一部であってもよく、通信経路542はNMD512,514,516のローカルエリアネットワークをWANを介してコンピューティングデバイス504にリンクする(通信経路は図示せず)アクセスポイントを備えていてもよい。同様に、NMD512,514,516の各々は、そのようなアクセスポイントを介して互いと通信してもよい。

0103

同様に、CR522並びにPBD532,534,536,538は、前項で説明したように、ローカルエリアネットワーク及び/又はローカル再生ネットワークの一部であってもよく、また通信経路544は、CR522及びPBD532,534,536,538のローカルエリアネットワーク及び/又はローカル再生ネットワークをWANを介してコンピューティングデバイス506にリンクするアクセスポイントを備えていてもよい。このため、CR522並びにPBD532,534,536,538の各々はまた、そのようなアクセスポイントを介して互いと通信してもよい。

0104

1つの例では、通信経路542及び544は同じアクセスポイントを備えていてもよい。1つの例では、NMD512,514,516、CR522、並びにPBD532,534,536,538の各々は、家庭用の同じアクセスポイントを介してクラウドネットワーク502にアクセスしてもよい。

0105

図5に示すように、NMD512,514,516、CR522、並びにPBD532,534,536,538の各々はまた、通信手段546を介して他のデバイスの1又は複数と直接通信してもよい。本明細書に記載の通信手段546は、1又は複数のタイプのネットワークを介し、1又は複数のネットワークプロトコルに従ったデバイス間の1又は複数の形式の通信を含んでいてもよく、及び/又は1又は複数の他のネットワークデバイスを介した通信を含んでいてもよい。たとえば、通信手段546はBluetooth(登録商標)(IEEE802.15)、NFC、ワイヤレスダイレクト、及び/又は独自規格ワイヤレスの1又は複数を主として備えていてもよい。

0106

1つの例では、CR522はBluetooth(登録商標)を介してNMD512と通信してもよく、且つ別のローカルエリアネットワークを介してPBD534と通信してもよい。別の例では、NMD514は別のローカルエリアネットワークを介してCR522と通信してもよく、且つBluetooth(登録商標)を介してPBD536と通信してもよい。さらに別の例では、PBD532,534,536,538の各々はローカル再生ネットワークを介し、スパニングツリープロトコルに従って互いと通信してもよく、一方でローカル再生ネットワークとは異なるローカルエリアネットワークを介してCR522とそれぞれ通信してもよい。他の例も可能である。

0107

場合によっては、NMD512,514,516、CR522、並びにPBD532,534,536,538間の通信手段は、デバイス間の通信のタイプ、ネットワーク状態、及び/又はレイテンシ要求に応じて変化してもよい。たとえば、PBD532,534,536,538と共にNMD516を家庭に最初に導入するときに、通信手段546を使用してもよい。ある場合には、NMD516はNFCを介してPBD538にNMD516に対応する識別情報を送信し、またPBD538はNFC(又は他の何らかの形式の通信)を介してNMD516にローカルエリアネットワーク情報を送信してもよい。しかしながら、ひとたびNMD516が家庭内で構成されれば、NMD516とPBD538との間の通信手段は変化してもよい。たとえば、NMD516は通信経路542、クラウドネットワーク502、及び通信経路544を介して続けてPBD538と通信してもよい。別の例では、NMDとPBDとは、ローカル通信手段546を介しては決して通信しないようにしてもよい。さらに別の例では、NMDとPBDとは、主としてローカル通信手段546を介して通信してもよい。他の例も可能である。

0108

例示的な例では、NMD512,514,516を、PBD532,534,536,538を制御するための音声入力を受信するように構成してもよい。利用可能な制御コマンドは、主として再生音量の制御、再生トランスポートの制御、音楽ソースの選択、及びグループ化など、前述した任意のメディア再生システム制御を含んでいてもよい。たとえば、NMD512はPBD532,534,536,538の1又は複数を制御するための音声入力を受信してもよい。音声入力を受信したことに応答して、NMD512は通信経路542を介して、処理を目的として音声入力をコンピューティングデバイス504に送信してもよい。1つの例では、コンピューティングデバイス504は音声入力を同等のテキストコマンドに変換し、そのテキストコマンドを解析してコマンドを識別してもよい。コンピューティングデバイス504は、その後、続けてコンピューティングデバイス506にテキストコマンド送信してもよい。別の例では、コンピューティングデバイス504は音声入力を同等のテキストコマンドに変換し、次いで、続けてそのテキストコマンドをコンピューティングデバイス506に送信してもよい。次いで、コンピューティングデバイス506は、テキストコマンドを解析して1又は複数の再生コマンドを識別してもよい。

0109

たとえば、テキストコマンドが「『ゾーン1』で『ストリーミングサービス1』」から『アーティスト1』による『トラック1』を再生して」である場合、コンピューティングデバイス506は(i)「ストリーミングサービス1」から入手できる「アーティスト1」による「トラック1」のURLと、(ii) 「ゾーン1」内の少なくとも1つの再生デバイスとを識別してもよい。この例では、「ストリーミングサービス1」からの「アーティスト1」による「トラック1」のURLは、コンピューティングデバイス508を指すURLであってもよく、また「ゾーン1」は結合ゾーン530であってもよい。このように、URLとPBD536及び538の一方又は両方とを識別すると、コンピューティングデバイス506は、通信経路544を介してPBD536及び538の一方又は両方に識別された再生用のURLを送信してもよい。PBD536及び538の一方又は両方は迅速に反応して、受信したURLに従ってコンピューティングデバイス508からオーディオコンテンツを取得し、且つ「ストリーミングサービス1」から「アーティスト1」による「トラック1」の再生を開始してもよい。

0110

さらに別の例では、コンピューティングデバイス504は何らかの処理を実行してユーザの関連コマンド又はインテントを識別し、且つ当該音声入力に関連したメディアコンテンツに関する情報をコンピューティングデバイス506に提供してもよい。たとえば、コンピューティングデバイス504は音声入力の音声テキスト変換を実行し、且つ音声入力を解析して、コマンド又はインテント(たとえば、再生、一時停止、停止、音量を上げる、音量を下げる、スキップ、次の曲を再生、グループ化、グループ解除)をコマンドの実行方法に関する他の情報と共に生成してもよい。コンピューティングデバイス504又はコンピューティングデバイス506は、コンピューティングデバイス504によって決定されたコマンド又はインテントにどのPBDコマンドが対応しているかを判定してもよい。音声入力から決定されたコマンド若しくはインテント及び/又はコマンドの実行に関連する他の情報を、コンピューティングデバイス504からコンピューティングデバイス506に送信してもよい。コンピューティングデバイス504上での処理はアプリケーション、モジュール、アドオンソフトウェアネイティブのネットワークマイクロホンシステムのソフトウェアプラットフォームとの統合、及び/又はネイティブのネットワークマイクロホンシステムのソフトウェアプラットフォームによって実行してもよい。

0111

当業者であれば、上記は単なる1つの例示的な例であり、他の実装形態も可能であることを理解する。ある場合には、上記のように複数のデバイス500の1又は複数によって実行される動作は、複数のデバイス500内の1又は複数の他のデバイスによって実行されてもよい。たとえば、音声入力からテキストコマンドへの変換を、NMD512、コンピューティングデバイス506、PBD536、及び/又はPBD538などの別のデバイス又は複数のデバイスによって代替的に、部分的に、若しくは完全に実行してもよい。同様に、URLの識別をNMD512、コンピューティングデバイス504、PBD536、及び/又はPBD538などの別のデバイス又は複数のデバイスによって代替的に、部分的に、若しくは完全に実行してもよい。

0112

f.例示的なネットワークマイクロホンデバイス
図6は、図5のNMD512,514,516の1又は複数となるように構成され得る例示的なネットワークマイクロホンデバイス600の機能ブロック図を示す。図示されているように、ネットワークマイクロホンデバイス600はプロセッサ602と、メモリ604と、マイクロホンアレイ606と、ネットワークインタフェース608と、ユーザインタフェース610と、ソフトウェアコンポーネント612と、スピーカ614とを備える。当業者であれば、他のネットワークマイクロホンデバイスの構成及び配置も可能であることを理解する。たとえば、ネットワークマイクロホンデバイスは、別法としてスピーカ614を除外するか、或いはマイクロホンアレイ606の代わりに単一のマイクロホンを有していてもよい。

0113

プロセッサ602は、汎用プロセッサ又は専用プロセッサ若しくはコントローラの形態をとり得る1又は複数のプロセッサ及び/又はコントローラを備えていてもよい。たとえば、処理ユニット602はマイクロプロセッサマイクロコントローラ特定用途向け集積回路、及びデジタル信号プロセッサなどを備えていてもよい。メモリ604は、これらの機能を実行するためにプロセッサ602によって実行可能な1又は複数のソフトウェアコンポーネントをロードできるデータ記憶装置であってもよい。したがって、メモリ604は、主として、ランダムアクセスメモリレジスタキャッシュなどの揮発性記憶媒体と、読取り専用メモリハードディスクドライブソリッドステートドライブフラッシュメモリ、及び/又は光学記憶装置などの不揮発性記憶媒体とが例として挙げられる、1又は複数の非一時的なコンピュータ可読記憶媒体を備えていてもよい。

0114

マイクロホンアレイ606は、ネットワークマイクロホンデバイス600の周辺環境の音声を検出するように配置された複数のマイクロホンであってもよい。マイクロホンアレイ606は、主としてコンデンサマイクロホン、エレクトレットコンデンサマイクロホン、又はダイナミックマイクロホンなどの既知であるか、又は今後開発される任意のタイプのマイクロホンであってもよい。1つの例では、マイクロホンアレイを、ネットワークマイクロホンデバイスに対する1又は複数の方向から音声を検出するように配置してもよい。マイクロホンアレイ606は周波数範囲の一部に敏感であってもよい。1つの例では、マイクロホンアレイ606の第1のサブセットは第1の周波数範囲に敏感である一方で、マイクロホンアレイの第2のサブセットは第2の周波数範囲に敏感であってもよい。マイクロホンアレイ606を、音源(たとえば、音声、可聴音)の位置情報を捕捉し、及び/又は背景雑音のフィルタリングを補助するようにさらに構成してもよい。特に、いくつかの実施形態では、マイクロホンアレイは複数のマイクロホンではなく、単一のマイクロホンのみで構成されていてもよい。

0115

ネットワークインタフェース608を、図5に関連してCR522、PBD532〜538、クラウドネットワーク502内のコンピューティングデバイス504〜508、及び他のネットワークマイクロホンデバイスなどを主として含む、様々なネットワークデバイス間の無線及び/又は有線通信を容易にするように構成してもよい。このため、ネットワークインタフェース608はこれらの機能を実行するのに適した任意の形態をとっていてもよく、その例としてはEthernetインタフェースシリアルバスインタフェース(たとえば、FireWire、USB2.0など)、無線通信を容易にするように構成されたチップセット及びアンテナ、並びに/又は有線及び/又は無線通信を提供する他の任意のインタフェースを挙げることができる。1つの例では、ネットワークインタフェース608は業界標準に基づいていてもよい(たとえば、IEEE802.3を含む赤外線規格、無線規格、及び有線規格、IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15を含む無線規格、並びに4Gなどの移動体通信規格など)。

0116

ネットワークマイクロホンデバイス600のユーザインタフェース610を、ネットワークマイクロホンデバイスとのユーザ対話を容易にするように構成してもよい。1つの例では、ユーザインタフェース608は、ユーザがネットワークマイクロホンデバイス600に入力を直接提供できるようにするために、主として物理的ボタンタッチセンサ画面及び/又は面上に設けられるグラフィカルユーザインタフェースなどの1又は複数を備えていてもよい。ユーザインタフェース610は、視覚的フィードバック及び/又は音声フィードバックをユーザに提供するための1又は複数のライトとスピーカ614とをさらに備えていてもよい。1つの例では、ネットワークマイクロホンデバイス600を、スピーカ614を介してオーディオコンテンツを再生するようにさらに構成してもよい。

0117

III.音声検出の部屋補正のための例示的なシステム、装置、及び方法
多くの場合、ネットワークマイクロホンデバイスを再生デバイスに近接して配置してもよい。たとえば、再生デバイスをネットワークマイクロホンデバイスと同じ部屋に配置してもよい。

0118

本明細書に記載の実施例は、NMDが動作する周辺環境の音響特性をNMDに提供することを含む。この周辺環境は、寝室やリビングルームなどの家庭内の部屋であってもよい。周辺環境の音響特性により、音声が室内でどのように伝わるかが定義されてもよい。周辺環境の音響特性は、NMDに向かって発せられた音声入力を解釈するためにNMDが使用してもよい。多くの場合、ネットワークマイクロホンデバイス(NMD)を再生デバイスに近接して配置してもよい。たとえば、再生デバイスをNMDと同じ部屋に配置してもよい。

0119

音響特性は通常、周辺環境内の表面によって定義される。たとえば、室内の硬い表面が音声を反射することがある。その一方で、柔らかい表面は音声を吸収することがある。周辺環境にこれらの異なるタイプの表面が存在し、且つ配置されることは、その部屋の音響特性とNMDの音声入力を解釈する能力とに影響を与えることになる。

0120

NMDはこれらの音響特性を考慮して、発せられた音声入力を正確に回収する必要があり得る。また、場合によっては、オーディオコンテンツは再生デバイスによって、NMDが音声入力を受信すると同時に再生されてもよい。周辺環境及び/又はコンテンツ再生時の音響特性に関する知識を、音声入力を解釈するためにNMDが使用してもよい。

0121

図7図11は、開示された動作環境内で実行できる実施形態を提示している。

0122

図7は、NMDによって受信される音声入力の解釈を改善するために実行され得る機能のフローチャートである。いくつかの例では、記載したこれらの機能の1又は複数を再生デバイスによって実行してもよい。他の例では、504〜508などのコンピューティングデバイスはまた、再生デバイスと連携して、或いはこれの代わりにこれらの機能の1又は複数を実行してもよい。コンピューティングデバイスは再生デバイスと関連付けられていてもよく、且つ再生デバイスと関連付けられた処理を実行してもよい。

0123

ステップ702において、周辺環境の音響特性を取得してもよい。この音響特性を、再生デバイスが動作している周辺環境と関連付けてもよい。この音響特性を様々な方法で決定していてもよい。たとえば、再生システムは、いくつかのキャリブレーション段階を通じて周辺環境の音響特性を既に決定していてもよい。メディア再生システムの再生デバイスはマイクロホンとスピーカとを有していてもよい。スピーカは1又は複数のトーンを出力してもよく、また1又は複数のスピーカはそれぞれのマイクロホンを使用してトーンを受信してもよい。このトーンは音声における1又は複数の周波数であってもよい。再生デバイスの各々はトーンを出力してもよい。複数の再生デバイスによって受信されたトーンに基づいて、周辺環境の音響特性を決定することができる。別の例では、別のネットワークデバイス(制御デバイス、第1の再生デバイス、又はNMD自体でさえ)は、第2の再生デバイスのスピーカによって出力されるテストトーンを受信するマイクロホンを備えていてもよい。再生デバイスではなく、或いは再生デバイスに加えて、他のネットワークデバイスは受信したテストトーンを解析して、周辺環境の音響特性を決定してもよい。他の構成も可能である。

0124

当該トーンのスペクトル応答空間応答、及び時間応答によって音響特性を定義してもよい。スペクトル応答は、マイクロホンで受信される音声エネルギーの解析結果であってもよい。空間応答は、マイクロホンで受信される音声エネルギーの方向の解析結果であってもよい。時間応答は、マイクロホンで受信される音声エネルギーの反射に対する解析結果であってもよい。本再生システムはこれらの応答を解析し、場合によっては当該トーンを受信した場所からの方向も考慮して周辺環境の音響特性を決定してもよい。この音響特性を示す通知を、再生デバイス及び/又コンピューティングデバイス504〜508の1又は複数に格納してもよい。

0125

別の例では、部屋の大きさ、部屋の天井の高さ、部屋にある家具などの周辺環境に関する既知の特性に基づいて、音響特性を事前に定義してもよい。コンピューティングデバイス504〜508の1又は複数によって維持されるデータベースにおいて、異なるタイプの特徴を有する部屋の音響特性を格納してもよい。コンピューティングデバイス上に格納される音響特性を、特定の特徴を有する部屋に対する以前の解析に基づいて決定していてもよい。ユーザはメディア再生システムの制御デバイス上に部屋の特徴を入力してもよく、また制御デバイスはこのデータベースにアクセスして部屋の音響特性を決定してもよい。次いで、これらの音響特性を当該環境内に配置された再生デバイスに提供してもよく、或いはこれらをコンピューティングデバイスに格納してもよい。

0126

1つの例として、音響特性は部屋の左側に硬い表面が存在し、右側に柔らかい表面が存在し、且つこの部屋が長方形形状であることを示してもよい。要するに、音響特性によって音響的観点からその部屋を特徴付けることができる。

0127

メディア再生システムは複数の再生デバイスを備えていてもよい。再生デバイスの各々は、再生デバイスが動作する周辺環境の音響特性を有していてもよい。ステップ704において、1又は複数のNMDを識別してもよい。1又は複数のNMDは同じ周辺環境内にあってもよい。いくつかの例では、NMDに音響特性を送信する再生デバイスはNMDの直近にある再生デバイスであってもよい。別の例では、NMDに音響特性を送信する再生デバイスはNMDと同じゾーンにある再生デバイスであってもよい。その近接性を再生デバイス及び/又はNMDの設定中、いくつかのキャリブレーションプロセスにおいて示してもよい。たとえば、NMDは自身の存在提示を再生デバイスに対して送信してもよい。この存在の有無を再生デバイス内の状態変数によって提示してもよい。再生デバイスはこの状態変数にアクセスしてNMDを識別してもよい。また、NMDも再生デバイスの存在を識別する同様の状態変数を有していてもよい。

0128

他の例では、メディア再生システムの再生デバイスをNMDと結合(ペアリング又はグループ化)してもよい。この結合はまた、再生デバイスとNMDとが同じ部屋又はゾーン内にあるか、若しくはコンテンツを同期して再生しているなど、これらが互いに近接していることを示してもよい。再生デバイスとNMDとの結合は、いくつかの点で再生デバイスの結合方法と同様であってもよい。この結合を、再生デバイスによって格納された状態変数に反映してもよい。NMDを再生デバイスと結合している場合、NMDを識別するように再生デバイスを配置してもよい。さらに、NMDを移動させて別の再生デバイスと結合する場合、別の再生デバイス内の状態変数を更新して、NMDとの結合を反映するようにしてもよい。同様に、NMDは自身の状態変数を更新して、新たな再生デバイスの存在を反映するようにしてもよい。

0129

いくつかの例では、結合された再生デバイス及びNMDにおいて、それらの間のレイテンシを低減するために様々なネットワーキング技術を使用してもよい。たとえば、WANネットワーク接続ではなくローカルネットワーク接続(LAN又はBluetooth(登録商標))を通信に使用してもよい。別の例として、再生デバイスをNMDと結合している間に、通信がたとえば「典型的な」2.4Ghz通信から5Ghz通信に切り替わるなど、ローカルネットワーク内で異なる周波数範囲に戻る可能性がある。さらに別の例として、再生デバイスをNMDと結合した場合に、通信が2.4Ghz又は5Ghzスペクトルのいずれかの予約チャネルに切り替わるか、或いはたとえば、再生デバイスが他のネットワークトラフィック中継ノードとして機能することを停止するなど、他のネットワークトラフィックが低減される可能性がある。他の構成も可能である。

0130

ステップ706において、音声入力に適用させるために音響特性を提供してもよい。1つの実施形態では、通信ネットワーク546の1又は複数を介してNMDに対し、再生デバイスからメッセージとして音響特性を送信してもよい。他の実施形態では、再生デバイスは、コンピューティングデバイス上の音響特性を通信リンク542を介してNMDに送信させてもよい。さらに別の実施形態では、音響特性は再生デバイスと関連付けられたコンピューティングデバイス上にあってもよく、また再生デバイスは、NMDと関連付けられたコンピューティングデバイスに対し音響特性にアクセスさせてもよい。他の構成も可能である。

0131

いくつかの実施形態では、再生デバイスは、音響特性をNMDに提供する必要がない場合がある。代わりに、NMDによってコンピューティングデバイス自体から音響特性を取得することが可能であってもよい。NMDは、自身に近接した(結合されているか、ペアリングされているか、又はその他の方法で)再生デバイスの通知を提供してもよく、また、コンピューティングデバイスは周辺環境の音響特性を提供してもよい。他の構成も可能である。

0132

NMDは、通常マイクロホン応答を介して音声入力を処理することができる。マイクロホン応答は、周波数に対するマイクロホンの感度の指標である。

0133

いくつかの実施形態では、NMDは自ら受信した音声入力に音響特性を適用して、音声入力における歪みを補正してもよい。このように、NMDによって音声入力を良好に解釈することが可能であってもよい。NMDは、この音響特性を自ら適用してもよく、及び/又はNMDでの処理がクラウドベースであり得る場合に、コンピューティングデバイスに処理をオフロードしてもよい。

0134

NMDは、音声入力への音響特性の適用時に音響特性に基づいてフィルタを定義してもよい。このフィルタは、周辺環境におけるスペクトル応答、空間応答、及び時間応答を含んでいてもよい。NMDは、自身が受信した音声入力にフィルタを適用して、音声入力を解釈する前に歪みを補正してもよい。このフィルタを、以下の導出に基づいて決定してもよい。
Xa(w)×P(w)×h(w)×m(w)=Ya(w)
ここで、Xaはキャリブレーショントーンであり、Pは再生デバイスのスピーカ応答であり、hは室内応答(たとえば、室内の音響特性)であり、mはマイクロホン応答であり、Yaは処理応答であり、これは、キャリブレーションプロセス中に送信されるトーンに対応する受信済みトーンであってもよい。符号×は周波数領域の畳み込み関数を表す。Xa、P、m、及びYaは分かっているので、室内応答(たとえば、フィルタ)を次のように算出してもよい。
h−1(w):Xa(w)×P(w)×m(w)=Ya(w)×h−1(w)
次いで、音声入力Ybを受信した場合、室内応答h(たとえば、フィルタ)を適用して、音声入力Xbを次のように決定してもよい。
Xb(w)=Yb(w)×h−1(w)×P−1(w)×m−1(w)

0135

いくつかの実施形態では、再生システムは周辺環境の変化を考慮して、周辺環境の音響特性を周期的に決定してもよい。この場合、NMDが受信した音声入力に最新の音響特性を適用してそれを適切に解釈できるように、1又は複数の再生デバイスは動作702〜706を周期的に実行してもよい。

0136

図8は、NMDによる音声入力の回収を改善するために実行され得る機能を表した別のフローチャートである。いくつかの例では、記載したこれらの機能の1又は複数を再生デバイスによって実行してもよい。他の例では、コンピューティングデバイス504〜508などはまた、再生デバイスと連携して、或いは再生デバイスの代わりに、これらの機能の1又は複数を実行してもよい。コンピューティングデバイスは再生デバイスと関連付けられていてもよく、且つ再生デバイスと関連付けられた処理を実行してもよい。

0137

ステップ802において周辺環境の音響特性を取得してもよく、ステップ804においてNMDを識別してもよく、またステップ806において音響特性を提供してもよい。この音響特性を、NMD及び/又はNMDと関連付けられたコンピューティングデバイスに提供してもよい。

0138

場合によっては、NMDは、メディア再生システムが同時にオーディオコンテンツを再生している周辺環境において動作してもよい。NMDは、オーディオコンテンツが同時に再生されている場合でも音声入力を受信してもよい。

0139

ステップ808において、オーディオコンテンツを提供してもよい。オーディオコンテンツをNMD及び/又はNMDと関連付けられたコンピューティングデバイスに提供してもよい。このコンテンツは、たとえば、再生デバイスによって再生される音楽のストリームであってもよい。再生デバイスは、NMDと同じゾーン内にあるNMDに近接しているNMDに対して、或いはNMDと結合され得る(又はグループ化され得る)NMDに対してオーディオコンテンツを提供してもよい。いくつかの実施形態では、たとえばNMDによる処理がクラウドベースである場合などに、コンピューティングデバイスを介してこのコンテンツをNMDに提供してもよい。さらに別の実施形態では、たとえば、NMD及び/又は再生デバイスによる処理がクラウドベースである場合などに、再生デバイスと関連付けられたコンピューティングデバイスを介してNMDと関連付けられたコンピューティングデバイスに対してコンテンツを提供してもよい。

0140

ステップ808において、音響特性(及び、必要に応じてオーディオコンテンツ)を音声入力に適用してもよい。たとえば、NMD(又はNMDと関連付けられたコンピューティングデバイス)は、自身が受信した音声入力にフィルタを適用して、その音声入力を解釈してもよい。たとえば、NMD(又はNMDと関連付けられたコンピューティングデバイス)は、音声入力を良好に分離するために、音声入力と共に再生されるオーディオコンテンツを使用してもよい。音声入力を解釈するために、再生デバイスによって再生されるオーディオコンテンツは事実上ノイズであってもよい。この点において、受信した音声入力を良好に分離するために、受信した音声入力からオーディオコンテンツを除去してもよい。

0141

図9は、音声入力の解釈時に、NMD及び/又は関連付けられたコンピューティングデバイスによって実行される機能のフローチャートである。ステップ902において、周辺環境の音響特性を示す通知を取得してもよい。ステップ904において、再生デバイスにより再生中のオーディオコンテンツも必要に応じて受信してもよい。再生デバイスは、NMDが配置されている中で同じゾーン内にあるか、又はNMDと結合されていてもよい。ステップ906において、たとえばNMDによって音声入力を受信してもよい。音声入力は音声コマンドであってもよい。NMDは、NMD上の何らかのボタンが押下されたこと、又はそれが音声入力であることを示す音声入力内のコマンドワードによって、音声入力を受信したことを知る場合がある。ステップ908において、フィルタ及び/又は再生デバイスによって再生されるオーディオコンテンツのうちの1又は複数を適用若しくは使用して、受信した音声入力を解釈してもよい。

0142

図10は、たとえば再生デバイスに周辺環境の音響特性を提供させるのではなく、NMDがこれを決定できるようにする機能のフローチャートである。この機能を、再生デバイス及び/又は再生デバイスと関連付けられたコンピューティングデバイスによって実行してもよい。

0143

NMDは、1又は複数の再生デバイスにトーンの再生を命じる指示を送信してもよい。NMDが指示を送信する再生デバイスは、NMDに近接した再生デバイス、及び/又はNMDと結合されている(又はグループ化されている)か、若しくはNMDと同じゾーン内にある再生デバイスを含んでいてもよい。

0144

ステップ1002において、オーディオトーンの再生を命じる指示を受信してもよい。この指示をNMD又はNMDと関連付けられたコンピューティングデバイスから受信してもよい。これに応答して、ステップ1004において再生デバイスによってオーディオトーンを出力してもよい。NMDはマイクロホンアレイ606を使用してこのトーンを受信してもよい。マイクロホンアレイ606はトーンの振幅を示す通知を提供してもよい。さらに、マイクロホンアレイ606はトーンの方向を示す通知を提供してもよい。この方向を、複数の再生デバイスからのトーン受信に基づいて決定してもよい。次いで、NMD及び/又は関連付けられたコンピューティングデバイスは、複数の再生デバイスからのトーン受信に基づいて周辺環境の音響特性を決定してもよい。このように、NMDはこの音響特性を再生デバイスから取得する必要がない場合がある。

0145

マイクロホンアレイ606は、NMDが音声入力の発信元の方向を決定できるようにしてもよい。この方向を、オーディオコンテンツの再生を改善するために再生デバイスによって使用することができる。たとえば、メディア再生システムは、1又は複数の再生デバイスから発生させるオーディオ音を音声入力の発信元と同じ方向に向けてもよい。これはリスナーが位置する方向であってもよい。他の構成も可能である。

0146

図11は、NMDによって決定された指向性を使用することに関連した、再生デバイス及び/又は関連付けられたコンピューティングデバイスによって実行される機能のフローチャートである。

0147

ステップ1102において、方向を示す通知を受信してもよい。これをNMD及び/又は関連付けられたコンピューティングデバイスから受信してもよい。この方向は、NMDが音声入力を受信した場所、したがってユーザがその周辺環境において位置し得る場所を示していてもよい。再生デバイスは複数のスピーカを有していてもよく、これらの出力を制御して、再生デバイスによって再生されるオーディオコンテンツの指向性に効果をもたらすようにしてもよい。ステップ1104において、再生デバイスはこの指向性を使用して、複数のスピーカのオーディオ出力を調整してもよい。このオーディオ出力は音楽コンテンツの再生であってもよい。再生デバイスは、スピーカによって出力されるオーディオ信号の位相を調整して、NMDによって指定される指向性に従ってオーディオ出力の指向性を生成してもよい。この点において、オーディオコンテンツはユーザに対して指向され得、したがってオーディオ聴取体験が改善されることになる。付加的に、又は代替的に、再生デバイスがオーディオ出力の振幅(たとえば、音量)を調整することもある。場合によっては、NMDがオーディオ出力を発生させることもある。この音声出力は、音声入力に対する音声応答であるか、又はビープ音やトーンなどの他の何らかのタイプの音声であってもよい。さらに付加的に、又は代替的に、再生デバイスがこの指向性を使用して、NMDの代わりに、若しくはNMDに加えて、当該オーディオ出力を出力するのに適している可能性のある再生デバイスを識別してもよい。たとえば、識別された再生デバイスはリスナーのすぐ手前にあり得、これによってリスナーがオーディオ出力を容易に聴取できる。他の構成も可能である。

0148

IV.メディア再生システムの音声制御のための例示的なシステム、装置、及び方法
本明細書に記載の例は、メディア再生システムを制御することを含んでいてもよい。特に、図12は、音声応答を再生するための方法に関する例示的なフロー図1200を示す。方法1200は、たとえば、図1のメディア再生システム100、図2の再生デバイス200の1又は複数、図3の制御デバイス300の1又は複数、及び図5のシステム500における複数のデバイスの1又は複数を含む動作環境内で実行できる方法の実施形態を提示している。方法1200は、本明細書に記載しているような様々な通信経路を介してネットワークマイクロホンシステムとメディア再生システムとの間で情報の送受信を行うこと、及び/又は「ネットワーク再生システム及びネットワークマイクロホンシステムを含むメタデータ交換(Metadata Exchange Involving a Networked Playback System and a Networked Microphone System)」と題する2016年2月22日に出願された出願第62/298,350号明細書に記載のメタデータ交換チャネルを使用することを含んでもよい。本出願は、その全体を参照によって本明細書に引用するものとする。方法1200は1又は複数の操作、機能、又はアクションを含んでいてもよい。

0149

いくつかの例では、NMD512,514,516の1又は複数を、1又は複数のネットワーク若しくは通信経路542、546に接続してもよい。NMDを、メディア再生システム(たとえば、コンピューティングデバイス506、CR522、PBD532,534,536,538)と統合又はインタフェースするように構成してもよい。NMDはネットワークマイクロホンシステム(たとえば、NMD512,514,516,504)に含まれていてもよい。

0150

ブロック1202において、NMDがメディア再生システムとインタフェースする、又はこれをメディア再生システムと関連付けるようにNMDを構成するために、ユーザは、たとえばブロック1202でNMD又はネットワークマイクロホンシステム若しくはメディア再生システムと関連付けられたアプリケーションを起動するための制御デバイス(たとえば、CR522)を選択してもよい。このアプリケーションは、ネットワークマイクロホンシステム及び/又はメディア再生システムの機能若しくは設定を制御するためのアプリケーションであってもよい。ネットワークマイクロホンシステムは、ネットワークマイクロホンシステムに機能の追加又は強化をもたらすために利用可能な1又は複数の専用アドオン機能を有していてもよい。

0151

ブロック1204において、ネットワークマイクロホンシステム用に利用可能なアドオン機能をユーザが選択できるように表示してもよい。利用可能なアドオン機能を表示している例示的なユーザインタフェース1300を、図13Aに示している。NMDは1又は複数の利用可能なアドオン機能1302,1304,1306を有していてもよい。機能1302は、たとえば、メディア再生システムの再生を制御することができる音楽制御機能であってもよい。ブロック1206において、制御デバイスは、音楽制御機能又はスキルをNMDに追加するためのユーザ入力を受信してもよい。たとえば、ユーザは機能1302を選択することによって、音楽制御機能1302の追加を選択してもよい。音楽制御機能1302は、音楽制御機能又はスキルをユーザのためにネットワークマイクロホンシステムに追加するアプリケーションであってもよい。音楽制御機能1302の追加を選択すると、ディスプレイが切り替わってユーザインタフェース1308が表示され、ユーザからのアカウント情報の入力を促す。

0152

ブロック1208において、制御デバイスは、ユーザインタフェース1308と入力フィールド1310及び1312とを介して音楽制御機能を追加するためのアカウント情報を受信してもよい。このアカウント情報は、ユーザがメディア再生システム及び/又は音楽サービスにおいて有するアカウントのものであってもよい。アカウント情報は当該アカウントのユーザ名とパスワードとを含んでいてもよい。ユーザ名をフィールド1310に入力してもよく、またパスワードをフィールド1312に入力してもよい。ユーザは送信ボタン1314などのボタンを選択してユーザ名とパスワードとを送信し、メディア再生システム(たとえば、コンピューティングデバイス506)及び/又は音楽サービス(たとえば、コンピューティングデバイス508)への認証作業を行ってもよい。アカウント情報をコンピューティングデバイス504、コンピューティングデバイス506、及び/又はコンピューティングデバイス508での認証作業のために、通信経路542,544,546及び/又はメタデータ交換チャネルのいずれかを介して送信してもよい。ひとたび認証されると、当該アカウントと関連付けられたユーザ情報はメディア再生システムからネットワークマイクロホンシステムに送信されてもよい。ユーザ情報はカスタム名(たとえば、カスタムゾーン名、カスタムプレイリスト名、カスタム曲名、カスタムアルバム名、カスタムアーティスト名など)、ユーザ情報と関連付けられた世帯識別子、PBD識別子、及び/又はゾーン識別子であってもよい。カスタム名は、ユーザによって指定される任意の名前であってもよい。たとえば、メディア再生システムは、ゾーンに名前を付けるときにユーザが選択できるような共通のゾーン名のリストを提供し、及び/又はユーザにゾーンの名前入力時のオプションを付与してもよい。制御デバイス300のインタフェースは共通のゾーン名のリストを表示し、及び/又は制御デバイス300が入力(たとえば、音声、テキスト)を受け取ることによってユーザがカスタムゾーン名を入力できるフィールドを表示してもよい。カスタム名情報をシステム500内の任意のデバイスに送信するか、又はこれと共有してもよい。

0153

ブロック1210において、1つのデフォルトゾーン(たとえば、1又は複数の再生デバイス)又は複数のデフォルトゾーン(たとえば、異なるゾーンにおける少なくとも2つの再生デバイス、少なくとも2つのゾーンのグループ)をNMDに対して決定してもよい。このデフォルトゾーン又は再生デバイスを、「デフォルト再生デバイス」と題する2016年2月22日に出願された出願第62/298,410号明細書に記載されているように決定してもよい。本出願は、その全体を参照によって本明細書に引用するものとする。

0154

いくつかの態様では、ユーザは初期構成又は設定中にデフォルトゾーンを指定してもよい。図13Cに示すユーザインタフェース1316は、NMDと関連付けるためのデフォルト再生ゾーンをユーザが選択できるようにする例示的なユーザインタフェースを示している。ユーザインタフェース1316は、利用可能な再生ゾーン1318のリストを表示してもよい。表示される利用可能な再生ゾーンの名前は、ブロック1208で入力済みユーザアカウントと関連付けられたカスタム名を含んでいてもよい。たとえば、利用可能な再生ゾーン1318のリストは、「リビングルーム」と、「キッチン」と、カスタムゾーン名である「ニックの部屋(Nick’s Room)」とを含んでいてもよい。表示されるリストは、NMD又は他の制御デバイスによって受信されたコマンドに応答して、音声応答及び/又は音楽を再生するためのデフォルトゾーンをユーザが指定できるように選択可能であってもよい。図13Cは、ユーザがキッチンをデフォルトゾーンとして選択する例を示している。ユーザは、送信ボタンなどのボタン1320を選択してデフォルトゾーンの選択を確定し、且つその選択を送信してもよい。図13Dに示す確認画面1322を表示して、設定プロセスが完了したことをユーザに通知してもよく、またユーザはボタン1326を選択して、確認画面1322を閉じてもよい。

0155

ブロック1212において、ユーザ固有の再生情報を、たとえばメディア再生システムからネットワークマイクロホンシステムに送信してもよい。ユーザ固有の情報は、カスタムゾーン名、カスタムプレイリスト、及び/又はカスタムプレイリスト名などのカスタム再生情報であってもよい。いくつかの態様では、ユーザ固有の情報及び/又はユーザアカウントは世帯識別子(HHI)と関連付けられていてもよい。ユーザ固有の再生情報を、たとえばメタデータ交換チャネル及び/又はメディア再生システムとネットワークマイクロホンシステムとの間の他の任意の通信経路を介して、メディア再生システム(たとえば、コンピューティングデバイス506、CR522、PBD532、PBD534、PBD536、及び/又はPBD538)からネットワークマイクロホンシステム(たとえば、コンピューティングデバイス504、NMD512、NMD514、及び/又はNMD516)に対して送信してもよい。

0156

コンピューティングデバイス504は、カスタム再生情報を動的変数として格納してもよく、動的変数は様々な変数型と動的に関連付けることができる変数であってもよい。たとえば、「ニックの部屋」はカスタムゾーン名であってもよく、これをゾーン変数型と関連付けられた動的変数として格納してもよい。別の例として、「ニックのお気に入り(Nick’s Faves)」は、ユーザによって作成されたカスタム名を有するカスタムプレイリストであってもよい。「ニックのお気に入り」という名前は動的変数として格納され、且つプレイリスト変数型と関連付けられてもよい。このようにして、ネットワークマイクロホンシステムは、音声入力内でユーザと関連付けられたカスタム情報を認識し、且つ識別してもよい。

0157

動的変数はテーブル又は他のデータ構造体に格納され、且つ様々な変数型と動的に関連付けられてもよい。たとえば、各動的変数は1又は複数の変数型と関連付けられてもよい。動的変数は、ユーザアカウントと関連付けられた識別子と共に格納されてもよい。たとえば、カスタムゾーン名である「ニックの部屋」を、メディア再生システムのゾーン識別子及び/又は「ニックの部屋」ゾーン内のPBDの識別子と関連付けてもよい。別の例として、カスタムゾーン名である「ニックの部屋」をゾーン識別子タグと共に格納してもよく、及び/又は「ニックの部屋」ゾーン内のPBDの識別子を「ニックの部屋」ゾーンのタグと共に格納してもよい。動的変数は、ユーザによって追加又は削除されるか、又はユーザアカウントと関連付けられた新たなカスタム名を含むように、常時、周期的、若しくは非周期的に更新されてもよい。カスタム名はデータベースに既に存在しているか、又は存在していない可能性のある、ユーザが指定した任意の名前であってもよい。

0158

いくつかの例では、各動的変数は、メディア再生システムコマンドの動的変数を識別するために使用され得る識別子と共に格納されるか、又はこれと関連付けられてもよい。たとえば、「ニックの部屋」というゾーン名はメディア再生システムに固有のゾーン識別子と共に格納されてもよく、またコマンドが「ニックの部屋」内の再生デバイス上でアクションが実行されることを要求した場合、メディア再生システムコマンドと共に「ニックの部屋」に加えて、又はこれの代わりに「ニックの部屋」のゾーン識別子が提供されてもよい。

0159

ブロック1214において、ユーザは、NMDによって受信され得るコマンド又は要求を発することによって、音声入力を提供してもよい。ネットワークマイクロホンシステムは音声入力を音声からテキストへと変換し、且つその言葉を解析して音声入力のシンタックスを決定することができる。音声コマンドは、音楽再生制御の範囲又はドメイン内にあるとネットワークマイクロホンシステムが認識できるような特定のシンタックスを有していてもよい。たとえば、ユーザは「キッチンとニックの部屋でビートルズの曲を再生して(play The Beatles in the Kitchen and Nick’s Room)」と言う場合がある。ネットワークマイクロホンシステムは、「再生して」という言葉を音楽再生と関連付けられたインテントに対応するコマンドか、又はインテントそのものであると認識してもよく、ブロック1216において、この音声コマンドが音楽再生制御の範囲又はドメイン内にあると識別してもよい。

0160

別の例では、1又は複数のメディア変数のインスタンス及び/又は1又は複数のゾーン変数のインスタンスが存在するか、若しくは含まれているということは、「再生して」というコマンドワードが「再生」インテントに対応していることを示していてもよい。ネットワークマイクロホンシステムは、音楽メタデータを含む音楽カタログ検索し、且つ、たとえばアーティストが「ビートルズ(The Beatles)」という名前であると判定することにより、「ビートルズ」がメディア変数のインスタンスに対応していると判定してもよい。ネットワークマイクロホンシステムは、「キッチン」及び/又は「ニックの部屋」が、共通のゾーン名及び/又はゾーン変数型と関連付けられた動的変数に基づいたゾーン名に対応していると判定してもよい。「再生して」というコマンドワードと「ビートルズ」というメディア変数及び/又は「ニックの部屋」との組み合わせにより、ネットワークマイクロホンシステムが、その音声入力が、要求された音楽の再生に関する音楽制御のインテントに対応していると判定できるようにしてもよい。

0161

音声コマンドが音楽再生制御の範囲又はドメイン内にあると識別されたので、ネットワークマイクロホンシステムは、既知のアーティストである「ビートルズ(The Beatles)」に関連する音楽コンテンツの検索結果の優先度を上げ、既知のアーティストに何ら関連のない同音異義語である「ザ・カブトムシ(the beetles)」に関連する音楽コンテンツの検索結果の優先度を下げるか、又は除外してもよい。換言すれば、当該音声入力が音楽ドメイン内にあると識別したことに応答して、音声テキスト認識に使用される言葉又は語彙一式を、通常辞書では見つからないか、及び/又は辞書掲載され得る言葉、或いは話し言葉とは異なる文体の言葉を含み得る、音楽ドメインに特有のものとなるように変更してもよい。

0162

たとえば、その音声入力が音楽ドメイン内にあると判定したことに応答して、音声テキスト認識に使用される言葉又は語彙一式を、メディアアイテム(たとえば、アーティスト名、トラック名、アルバム名、曲名)に関するメタデータ情報を含むように更新してもよい。いくつかの態様では、音声入力は、たとえばカスタム名(たとえば、ゾーン、プレイリスト)、メディア変数、及び/又はアーティスト名、アルバム名、及び/又はトラック名などにおいて文字及び/又は記号の入力を含んでいてもよい。別の例として、音声テキスト変換から得られるテキスト中の言葉を、音楽制御コマンドを処理する前に、メディア特有の言葉を使用するように変更してもよい。メディア変数のインスタンス用の音声テキスト変換において、ネットワークマイクロホンシステムに使用される標準的な言葉に加えて、又はそれの代わりに、音楽メタデータ、メディアカタログ、及び/又はカスタム若しくはローカルメディア識別子(たとえば、プレイリスト名、トラック名、アルバム名、アーティスト名など)に見られる言葉を使用してもよい。同様に、ゾーン変数用の音声テキスト変換においてカスタムゾーン名を使用してもよい。

0163

ブロック1218において、音楽制御コマンドを含む音声入力を処理してもよい。ネットワークマイクロホンシステムは、ユーザのインテント(たとえば、再生、一時停止、キューへの追加、グループ化、他のトランスポートの制御、制御デバイス300を介して利用可能な制御)と関連付けられた様々な所定のシンタックスを有していてもよい。各インテントは、当該インテントと同じであるか若しくは類似している、又は同じでないか若しくは類似していない可能性のある1又は複数のメディア再生システムコマンドに対応していてもよい。たとえば、第1のゾーンから第2のゾーンへ音楽再生を転送するインテントは、現在再生中のメディアアイテム及び/又は再生キューを第1のゾーンから第2のゾーンに転送するメディア再生システムコマンドに対応していてもよい。別の例では、音楽を転送するインテントはメディア再生システムに第1のゾーンの再生キューを第2のゾーンの再生キューにコピーし、及び/又は第1のゾーンの状態変数を第2のゾーンの状態変数にコピーすることを命じる再生キューコピーコマンドに対応していてもよい。

0164

さらに別の例として、音楽を転送するインテントは2つのメディア再生システムコマンドに対応していてもよい。これらの2つのコマンドは、第2のゾーンを第1のゾーンとグループ化し、次いでグループから第1のゾーンを除去して、第1のゾーンの状態を第2のゾーンへと実質的に転送してもよい。

0165

メディア再生システムコマンドは、インテントがメディア再生システムコマンドに対応していると判定したことに応答して呼び出されるアプリケーションプログラムインタフェースAPI)を含んでいてもよい。ネットワークマイクロホンシステム及び/又はメディア再生システムは、ユーザのインテントとメディア再生システムコマンドとの間に定義されたマッピング又は対応関係を有していてもよい。

0166

いくつかの例では、メディア再生システムコマンドを、クラウドネットワーク502内のコンピューティングデバイス(たとえば、コンピューティングデバイス504、コンピューティングデバイス506、コンピューティングデバイス508)に格納されたデータに対して実行してもよい。たとえば、別のプレイリスト又は再生キューにメディアアイテム(たとえば、トラック、アルバム、プレイリスト)を追加するインテントを、クラウドネットワーク502に格納されたプレイリスト又は再生キューに追加してもよい。再生キューの一部がクラウドネットワーク502内のプレイリスト又は再生キューの一部若しくは全体と一致するように、PBD532,534,536,538に格納された再生キューを、クラウドネットワーク502に格納された再生リスト又は再生キューの変更に応じて更新してもよい。

0167

特定の言葉、シンタックス、及び/又はフレーズを同じインテントと関連付けてもよい。たとえば、音声入力において「再生する」、「聴く」、又は「聞く」というコマンドワードを含むことは、メディア再生システムがメディアコンテンツを再生するというユーザのインテントに対応していてもよい。各インテントは、コマンド又はインテントによって指定されたアクションを実行するために事前に定義された様々なタイプの変数又はスロットを有していてもよい。変数又はスロットは、様々なフレーズ内の所定の場所又は位置にあってもよい。たとえば、「再生」コマンドのシンタックスは、ユーザが再生を望むメディア用のメディア変数を有していてもよく、且つユーザが関連付けられた再生デバイスにメディアコンテンツの再生を望む場所若しくはゾーン用の場所変数又はゾーン変数をさらに有していてもよい。「キッチンでビートルズの曲を再生して(play The Beatles in the Kitchen)」という音声コマンドの例では、メディア変数又は音楽変数のインスタンスは「ビートルズ」であり、ゾーン変数のインスタンスは「キッチン」であってもよい。ネットワークマイクロホンシステム及び/又はメディア再生システムは、メディア変数のインスタンス及び/又はゾーン変数のインスタンスに対応する関連オブジェクトを識別する際に、ゾーン変数とは別個に、及び/又はこれとは異なる形態でメディア変数を処理してもよい。

0168

「再生」インテントと関連付けることができるシンタックス又はフレーズの別の実施例としては、「[ゾーン変数]で[メディア変数]を聞かせて」というシンタックスを挙げることができる。このシンタックスに関する1つの例としては、「エミリーの部屋でポール・サイモンの曲を聞かせて(Let me hear Paul Simon in Emily’s Room)」を挙げることができ、ここでは「聞かせて(Let me hear)」が「再生(play)」インテントと関連付けられていてもよく、「ポール・サイモン(Paul Simon)」がメディア変数のインスタンスであってもよく、また「エミリーの部屋(Emily’s Room)」がゾーン変数のインスタンスであってもよい。ネットワークマイクロホンシステムは音声入力を解析し、ネットワークマイクロホンシステムに格納されたシンタックスのうちのいずれが当該音声入力と一致しているかを判定して、当該音声入力のインテントを識別してもよい。このシンタックスを、ネットワークマイクロホンシステム内の任意のデバイスに格納してもよい。

0169

「再生」インテント若しくはコマンドのシンタックス又はフレーズに関するさらに別の例としては、「[ゾーン変数]で[メディア変数]を聞きたい」というシンタックスを挙げることができる。「聴く(listen)」という言葉又は「聴きたい(I want to listen)」という節を「再生(play)」インテントと関連付けてもよい。「再生」インテント用の他のシンタックスも可能である。

0170

別の例示的なコマンド又はインテントは、メディア再生システム(たとえば、PBD、コンピューティングデバイス506、及び/又はCR522内に)格納され得るキューにメディアコンテンツを追加することに関連していてもよい。例示的なキューに追加シンタックスは、「[ゾーン変数]のキューに[メディア変数]を追加して」であってもよい。本明細書に記載の他の態様と同様に、ゾーン変数は任意のものであり、本システムは様々な技術又は方法(たとえば、デフォルトゾーンを使用する、前回使用したゾーンを使用する、ユーザのプレゼンス情報に基づいて、或いはよくメディアを再生しているゾーンを使用するなど)に基づいて、コマンドが適用されるゾーンを決定してもよい。メディア変数に対応する選択済みメディアコンテンツを、ゾーン内のキューに追加してもよい。

0171

さらに別の例示的なコマンド又はインテントとしては、「次再生コマンド」を挙げることができ、このコマンドによって選択されたメディアコンテンツを、ゾーン内で次に再生されるようにキューの先頭に追加してもよい。このコマンドの例示的なシンタックスは「[メディア変数]を次に再生して」であってもよい。本明細書に記載の他の態様と同様に、ゾーン変数は任意のものであってもよい。

0172

コマンド又はインテントに関する別の例としては、「移動コマンド」又は「転送コマンド」を挙げることができ、このコマンドによって、現在再生中の音楽及び/又はゾーンの再生キューをあるゾーンから別のゾーンに移動又は転送してもよい。たとえば、ユーザは、「音楽を[ゾーン変数]に移動させて」という音声入力を発してもよく、ここで「移動」又は「転送」というコマンドワードは、再生状態を別のゾーンに移動させるインテントに対応していてもよい。

0173

本明細書に記載のコマンド及びインテントは例示のものであり、他のインテント又はコマンドも可能である。たとえば、本明細書に記載した、メディア再生システムを制御するために制御デバイス300を介して利用可能な制御の各々は、本システムを制御するために利用可能な対応するインテントを有していてもよい。たとえば、制御コマンドの名前はインテントに対応していてもよい。制御コマンドが1又は複数のメディアアイテムを含む場合、そのコマンドのシンタックスは1又は複数のメディア変数を含んでいてもよい。制御コマンドが1又は複数のゾーンを含む場合、そのコマンドのシンタックスは1又は複数のゾーン変数を含んでいてもよい。異なるインテントと共に使用される他の変数が存在していてもよい。

0174

メディア再生システムを制御するために制御デバイス300を介して利用可能な制御の例としては、トランスポート制御コマンドを挙げることができる。これらのコマンド又はインテントは現在再生中のメディアアイテムに関連しており、これらにはトランスポートコマンド(たとえば、停止、一時停止、スキップ、巻き戻し、早送り、前の曲に戻る、音量調整など)、又は現在再生中のメディアアイテムの保存、若しくは別の再生キュー或いはプレイリストへのこれの追加に関連するコマンドが含まれる。現在再生中のメディアアイテムに対して実行されるインテント又はアクションのシンタックスはより簡素であり、且つトランスポート制御の名前に対応していてもよい。たとえば、音楽再生を一時停止するインテント用の音声入力は、「一時停止」という音声入力であってもよい。

0175

様々なコマンドのシンタックスにおいては様々なタイプの変数を使用してもよい。メディア変数の場合、メディア変数は、ユーザが聴取又は再生を望むメディアコンテンツを音声入力を介して指定する可能性が高い、シンタックス内の変数又はスロットであってもよい。メディア変数は音楽に関連した特徴又は特性(たとえば、メディア変数のタイプ)であってもよく、これらはアルバム名、アーティスト名、曲名、プレイリスト名、カスタムプレイリスト名、ジャンル(たとえば、ポップ、クラシック、カントリー、ロック、R&Bなど)、雰囲気(たとえば、ロマンチックな、エクササイズ向けの、生産性を高めるなど)、音楽のテンポ(たとえば、アップビートスロー)、ラジオ局名、作曲者名、音楽の時代性(バロック、ロマン派、古典派、20世紀音楽など)、期間(たとえば、80年代、90年代)、プレイリストの作成者名、ランキング(たとえば、ベスト、トップ40)及び/又は他の音楽的識別に関する特徴を含むが、これらには限定されない。音楽変数は、ユーザアカウントのユーザが作成したカスタムプレイリスト名であり得るカスタム名、及び/又は他のカスタム名(たとえば、カスタム曲名、カスタムアルバム名、カスタムアーティスト名)を有していてもよい。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ