図面 (/)

技術 マイク選択装置、マイク選択方法及びマイク選択プログラム

出願人 日本電信電話株式会社
発明者 中茂睦裕渡邊大喜
出願日 2013年7月24日 (7年4ヶ月経過) 出願番号 2013-153376
公開日 2015年2月5日 (5年9ヶ月経過) 公開番号 2015-025839
状態 拒絶査定
技術分野 可聴帯域変換器の回路等 可聴帯域変換器用回路 音声の分析・合成 他に分類されない音響(残響,カラオケ等)
主要キーワード 音声量 相関閾値 選択精度 一定音量 ピッチ値 選択フロー 楽曲特徴量 特徴量比較
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2015年2月5日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (8)

課題

複数のマイクから同時に大きな音量音声が入力されるなかで、所定のマイクの選択精度を改善する。

解決手段

マイク選択装置4は、複数のマイク11からの複数のマイク音声のうち、楽曲データベース3から取得した楽曲データのボーカル音声ピッチテンポのうちいずれか1つ以上が合致したマイク音声を選択する。

概要

背景

マイク入力機能を具備するブラウザが増加している。そのようなブラウザを用いたサービスにおいて、複数のマイクから所定のマイクを選択できる技術が求められている。これについて特許文献1によれば、マイクから入力された音声の強度に基づいてマイクを選択するようにしている。

概要

複数のマイクから同時に大きな音量の音声が入力されるなかで、所定のマイクの選択精度を改善する。マイク選択装置4は、複数のマイク11からの複数のマイク音声のうち、楽曲データベース3から取得した楽曲データのボーカル音声ピッチテンポのうちいずれか1つ以上が合致したマイク音声を選択する。

目的

本発明は、上記事情を鑑みてなされたものであり、マイクの選択精度を改善することを目的とする

効果

実績

技術文献被引用数
1件
牽制数
2件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

複数のマイクから複数のマイク音声をそれぞれ入力する入力手段と、楽曲データの記憶手段から所定の楽曲データを取得する取得手段と、前記複数のマイク音声のうち、前記楽曲データのボーカル音声に最も合致したマイク音声を選択する選択手段と、を有することを特徴とするマイク選択装置

請求項2

前記選択手段は、前記ボーカル音声の音量ピッチテンポのうちいずれか1つ以上に基づきマイク音声を選択することを特徴とする請求項1に記載のマイク選択装置。

請求項3

複数のマイクから複数のマイク音声をそれぞれ入力する入力手段と、前記複数のマイク音声のうち、楽曲データの記憶手段に記憶された所定の楽曲データのボーカル音声に対応するマイク音声のみを出力する出力手段と、を有することを特徴とするマイク選択装置。

請求項4

コンピュータにより、複数のマイクから複数のマイク音声をそれぞれ入力する入力ステップと、楽曲データの記憶手段から所定の楽曲データを取得する取得ステップと、前記複数のマイク音声のうち、前記楽曲データのボーカル音声に最も合致したマイク音声を選択する選択ステップと、を有することを特徴とするマイク選択方法

請求項5

コンピュータにより、複数のマイクから複数のマイク音声をそれぞれ入力する入力ステップと、前記複数のマイク音声のうち、楽曲データの記憶手段に記憶された所定の楽曲データのボーカル音声に対応するマイク音声のみを出力する出力ステップと、を有することを特徴とするマイク選択方法。

請求項6

コンピュータを請求項1乃至3のいずれかに記載のマイク選択装置として機能させるためのマイク選択プログラム

技術分野

0001

本発明は、マイク音声を選択する技術に関する。

背景技術

0002

マイク入力機能を具備するブラウザが増加している。そのようなブラウザを用いたサービスにおいて、複数のマイクから所定のマイクを選択できる技術が求められている。これについて特許文献1によれば、マイクから入力された音声の強度に基づいてマイクを選択するようにしている。

先行技術

0003

特開平06−062103号公報

発明が解決しようとする課題

0004

しかしながら、電話会議のように発話者以外のマイクからは一定音量の入力がないことを前提としているため、複数のマイクから同時に大きな音量の音声が入力される場合、有効化するマイクを誤って選択してしまう。例えば、カラオケに用いる場合、歌い手以外のマイクを選択してしまい、直接関係のない音声を伴奏等にミキシングしてしまう。

0005

本発明は、上記事情を鑑みてなされたものであり、マイクの選択精度を改善することを目的とする。

課題を解決するための手段

0006

請求項1に記載のマイク選択装置は、複数のマイクから複数のマイク音声をそれぞれ入力する入力手段と、楽曲データの記憶手段から所定の楽曲データを取得する取得手段と、前記複数のマイク音声のうち、前記楽曲データのボーカル音声に最も合致したマイク音声を選択する選択手段と、を有することを要旨とする。

0007

本発明によれば、複数のマイク音声のうち、楽曲データのボーカル音声に最も合致したマイク音声を選択するため、マイクの選択精度を向上できる。

0008

請求項2に記載のマイク選択装置は、請求項1に記載のマイク選択装置において、前記選択手段は、前記ボーカル音声の音量、ピッチテンポのうちいずれか1つ以上に基づきマイク音声を選択することを要旨とする。

0009

請求項3に記載のマイク選択装置は、複数のマイクから複数のマイク音声をそれぞれ入力する入力手段と、前記複数のマイク音声のうち、楽曲データの記憶手段に記憶された所定の楽曲データのボーカル音声に対応するマイク音声のみを出力する出力手段と、を有することを要旨とする。

0010

本発明によれば、複数のマイク音声のうち、楽曲データの記憶手段に記憶された所定の楽曲データのボーカル音声に対応するマイク音声のみを出力するため、マイクの選択精度を向上できる。

0011

請求項4に記載のマイク選択方法は、コンピュータにより、複数のマイクから複数のマイク音声をそれぞれ入力する入力ステップと、楽曲データの記憶手段から所定の楽曲データを取得する取得ステップと、前記複数のマイク音声のうち、前記楽曲データのボーカル音声に最も合致したマイク音声を選択する選択ステップと、を有することを要旨とする。

0012

請求項5に記載のマイク選択方法は、コンピュータにより、複数のマイクから複数のマイク音声をそれぞれ入力する入力ステップと、前記複数のマイク音声のうち、楽曲データの記憶手段に記憶された所定の楽曲データのボーカル音声に対応するマイク音声のみを出力する出力ステップと、を有することを要旨とする。

0013

請求項6に記載のマイク選択プログラムは、コンピュータを請求項1乃至3のいずれかに記載のマイク選択装置として機能させることを要旨とする。

発明の効果

0014

本発明によれば、カラオケを複数人で楽しむようなサービスにおいて、マイクの選択精度を向上できる。

図面の簡単な説明

0015

メロディ伴奏システムの全体接続構成を示す図である。
マイク選択装置の機能ブロック構成を示す図である。
マイク選択装置の機能ブロック構成(最小構成)を示す図である。
マイク選択装置の処理フローを示す図である。
モニタの表示例を示す図である。
特徴量の比較・マイク音声の選択フローを示す図である。
特徴量の比較・マイク音声の選択フローを示す図である。

実施例

0016

以下、本発明を実施する一実施の形態について図面を用いて説明する。

0017

図1は、本実施の形態に係るメロディ伴奏システムの全体接続構成を示す図である。このメロディ伴奏システムは、複数の携帯端末1と、1つの無線ルータ2と、楽曲データベース3と、ミキシング機能付きマイク選択装置4と、スピーカ付きモニタ5とで構成される。

0018

携帯端末1は、内蔵のマイク11で集音されたユーザの発声(以下、マイク音声)を、RF網を介し無線ルータ2を経由してマイク選択装置4に入力する機能を備えている。例えば、スマートフォン等で実現できる。マイク音声をマイク選択装置4に入力できればよいため、カラオケ装置等のワイヤードマイクを用いてマイク選択装置4に直接接続してもよい。

0019

楽曲データベース3は、事前録音又は生成され、映像データや伴奏データ等、メロディを伴奏するために必要な楽曲データ(映像・音声)を読み出し可能に記憶しておく機能を備えている。例えば、通信カラオケで使用される配信サーバ等で実現できる。

0020

マイク選択装置4は、指定された楽曲データを楽曲データベース3から取得すると共に、複数の携帯端末1から複数のマイク音声をそれぞれ入力して、その楽曲データの再生によるボーカル音声に最も合致した1つ以上のマイク音声を選択する機能を備えている。また、選択されたマイク音声のみを再生中の楽曲データに重畳してモニタ5に出力するミキシング機能も備えている。例えば、CPUやメモリを備えたコンピュータで実現できる。

0021

モニタ5は、マイク選択装置4から出力されたマイク音声や映像をスピーカやモニタからそれぞれ再生する機能を備えている。例えば、通信カラオケで使用されるモニタ装置や一般のテレビ装置等で実現できる。

0022

次に、マイク選択装置4について詳述する。図2は、マイク選択装置4の機能ブロック構成を示す図である。マイク選択装置4は、音声特徴量検出部41と、楽曲特徴量検出部42と、特徴量比較・マイク音声選択部43と、ミキシング部44と、映像・音声出力部45とで構成される。

0023

音声特徴量検出部41は、複数のマイク11から出力された複数のマイク音声をそれぞれ入力し、各マイク音声の特徴量をそれぞれ検出する機能部である。

0024

楽曲特徴量検出部42は、指定された楽曲データのボーカル情報を楽曲データベース3から取得して、そのボーカル情報の特徴量を検出する機能部である。なお、ボーカル情報には、タイムラインに沿ったボーカル音声の音量や、ボーカル音声のピッチやテンポの各値が含まれている。

0025

特徴量比較・マイク音声選択部43は、音声特徴量検出部41で検出された各マイク音声の特徴量と、楽曲特徴量検出部42で検出されたボーカル情報の特徴量とをそれぞれ比較し、ボーカル情報の特徴量との間で相関度閾値以上の特徴量を持つマイク音声を選択する機能部である。

0026

ミキシング部44は、上記指定された楽曲データと、特徴量比較・マイク音声選択部43で選択されたマイク音声とを重畳する機能部である。

0027

映像・音声出力部45は、ミキシング部44で重畳された楽曲データとマイク音声をスピーカ付きモニタ5に出力する機能部である。

0028

以上、マイク選択装置4について説明した。なお、これら各機能部以外に、マイクを所持したユーザ等を撮影するカメラやその他付属装置を備えてもよい。また、図3に示すように、音声特徴量検出部41と楽曲特徴量検出部42と特徴量比較・マイク音声選択部43とのみでマイク選択装置4を構成してもよい。その場合、ミキシング部44や映像・音声出力部45を備えたカラオケサービス提供装置6に接続して内蔵するようにしてもよい。例えば、通信カラオケ装置、テレビ装置、ゲーム機カーナビ装置パソコン等に内蔵する。

0029

続いて、マイク選択装置4の動作について説明する。図4は、マイク選択装置4の処理フローを示す図である。

0030

まず、音声特徴量検出部41により、無線LAN等を介して、複数の携帯端末1のマイク11でそれぞれ集音された複数のマイク音声が入力され、例えば44.1kHzのサンプリング周波数で各マイク音声に含まれる音声パワー値と音声スペクトル値がそれぞれ量子化される(ステップS101)。

0031

次に、楽曲特徴量検出部42により、指定された楽曲データのボーカル情報が楽曲データベース3から取り出され、そのボーカル情報から各タイミングでのボーカル音声の音量とピッチの値とテンポの値とがそれぞれ取得される(ステップS102)。

0032

次に、特徴量比較・マイク音声選択部43により、ステップS101で変換された各マイク音声の量子化情報(音声パワー値、音声スペクトル値)と、ステップS102で取得されたボーカル情報(ボーカル音声の音量、ピッチ値テンポ値)とが相互相関関数を用いてそれぞれ比較される(ステップS103)。

0033

具体的には、それら各情報を用いて、現在の再生タイミングにおける、主旋律の音量とマイク音声の音声量が比較され、主旋律のピッチとマイク音声のピッチが比較され、更に、主旋律のテンポとマイク音声のテンポが比較される。

0034

次に、特徴量比較・マイク音声選択部43により、ボーカル情報に記録されている発生すべきタイミングに発話すべき音量等で入力があったマイク音声のみが選択される(ステップS104)。一方、発声すべきタイミングと異なるタイミングで発声があったマイクや、発声すべき音量に達しなかったマイク音声は選択されない。

0035

次に、ミキシング部44により、ステップS102で取り出された楽曲データと同じ楽曲データが取り出され、その楽曲データに記録されているキャプション等の映像情報や伴奏等の音声情報と、ステップS104で選択されたマイク音声とが重畳される(ステップS105)。

0036

最後に、映像・音声出力部45により、ステップS105で重畳された楽曲データとマイク音声がスピーカ付きモニタ5に出力される(ステップS106)。モニタ5の表示例を図5に示す。

0037

最後に、特徴量の比較・マイク音声の選択方法について詳述する。例えば図6に示すように、あるマイクのマイク音声の特徴量を検出した後に(ステップS201)、マイク音声の量子化情報を用いて前述の3つの比較を段階的に実行し(ステップS202〜ステップS204)、音量,ピッチ,テンポのうち少なくともいずれか1つ以上が任意の相関閾値(例えば、相関度が90%)を超えるマイク音声を選択する(ステップS205)。そして、全てのマイク音声についてステップS201〜ステップS205を繰り返し実行し(ステップS206)、該当するマイク音声のみを選択する。

0038

その他、例えば、図7に示すように、あるマイクのマイク音声の特徴量を検出した後に前述の3つの比較を段階的に実行し(ステップS301〜ステップS304)、音量,ピッチ,テンポの全てが相関閾値を超えるマイク音声を選択する(ステップS305)。そして、全てのマイク音声についてステップS301〜ステップS305を繰り返し実行し(ステップS306)、該当するマイク音声のみを選択するようにしてもよい。

0039

なお、合唱、デュエットハーモニー等をしていることもあるため、2つ以上のマイク音声が選択される場合も当然にある。

0040

本実施の形態によれば、複数のマイク音声のうち、楽曲データのボーカル音声に最も合致したマイク音声を選択するので、カラオケを複数人で楽しむようなサービスにおいて、マイクの選択精度を向上できる。

0041

また、本実施の形態によれば、複数のマイク音声のうち、楽曲データの記憶手段に記憶された所定の楽曲データのボーカル音声に対応するマイク音声のみを出力するので、マイクの選択精度を向上でき、更に、複数のマイクが同時に入力を受け付ける状態であっても、ボーカル音声に関係のない音声(例えば、歓声,声援,拍手,合いの手等)を排除できる。

0042

更に、マイクの種類は限定されないため、個人所有する携帯端末等をカラオケのマイクとして使用できる。

0043

最後に、本実施の形態で説明したマイク選択装置4の各動作をプログラムとして構築し、コンピュータにインストールして実行させることや、通信ネットワークを介して流通させることも可能である。

0044

1…携帯端末
11…マイク
2…無線ルータ
3…楽曲データベース
4…ミキシング機能付きマイク選択装置、マイク選択装置
41…音声特徴量検出部(入力手段)
42…楽曲特徴量検出部(取得手段)
43…特徴量比較・マイク音声選択部(選択手段)
44…ミキシング部
45…映像・音声出力部(出力手段)
5…スピーカ付きモニタ
6…カラオケサービス提供装置
S101〜S106、S201〜S206、S301〜S306…ステップ

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • ソニー株式会社の「 情報処理装置および電子機器」が 公開されました。( 2020/09/24)

    【課題・解決手段】本技術は、どのユーザに対して応答するべきかを正しく判断することができるようにする情報処理装置および電子機器に関する。発話者特定部は、ユーザが存在する環境の画像と音声に基づいて、所定の... 詳細

  • 中興通訊股ふん有限公司の「 音声再生方法および端末、記憶媒体」が 公開されました。( 2020/09/24)

    【課題・解決手段】音声再生の過程においてターゲットスピーカーモジュールを識別し、前記ターゲットスピーカーモジュールを用いて音声を再生することを含む、音声再生方法である。端末である。本開示は受話器または... 詳細

  • グーグルエルエルシーの「 オーディオベースのコンピュータプログラム出力の修正」が 公開されました。( 2020/09/24)

    【課題・解決手段】音声または非テキスト入力アクティブ化環境においてコンピュータプログラム出力を修正することが提供される。システムは、デバイスのマイクロフォンによって検出されるオーディオ信号を受信するこ... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ