図面 (/)

技術 音声処理装置、インターホン装置、及びインターホンシステム

出願人 パナソニックIPマネジメント株式会社
発明者 鷲哲平前嶋真行瀧秀範福島実木村克彦池田光治
出願日 2015年3月23日 (5年9ヶ月経過) 出願番号 2015-059077
公開日 2016年10月6日 (4年2ヶ月経過) 公開番号 2016-178584
状態 特許登録済
技術分野 インターホン 電話機の機能
主要キーワード スイッチング精度 室内装置 判定感度 設定比率 室外装置 中間モード データサンプル数 アラート信号
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年10月6日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (8)

課題

設置位置の環境に関わらず、快適な通話を実現する。

解決手段

ボイススイッチ部142は、マイク11aから入力される信号をスピーカ12aへ出力する信号より優先させる送話モードを選択可能である。音声信号検出部141は、マイク11aから入力される信号から音声信号を含む音声区間を検出する。ボイススイッチ部142は、音声信号検出部141において音声区間が検出されているとき送話モードを選択する。音声信号検出部141は、残響時間に応じて音声区間と判定する感度を調整する。

概要

背景

マンション等の集合住宅ではロビーインターホンを設置する場合が多い。来訪者はロビーに設置されたインターホンから住戸内住人来訪を伝え、住人が解錠すると来訪者が中に入ることができる。ロビーは空間が広いため残響の影響が大きくなる。

インターホンでは、送話受話音声を比較して大きい方の音声を優先させるボイススイッチ機能が使用されることがある(例えば、特許文献1参照)。

概要

設置位置の環境に関わらず、快適な通話を実現する。ボイススイッチ部142は、マイク11aから入力される信号をスピーカ12aへ出力する信号より優先させる送話モードを選択可能である。音声信号検出部141は、マイク11aから入力される信号から音声信号を含む音声区間を検出する。ボイススイッチ部142は、音声信号検出部141において音声区間が検出されているとき送話モードを選択する。音声信号検出部141は、残響時間に応じて音声区間と判定する感度を調整する。

目的

本発明はこうした状況に鑑みなされたものであり、その目的は、設置位置の環境に関わらず、快適な通話を実現する音声処理装置インターホン装置、及びインターホンシステムを提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

マイクから入力される信号をスピーカへ出力する信号より優先させる送話モードを選択可能なボイススイッチ部と、前記マイクから入力される信号から音声信号を含む音声区間を検出する音声信号検出部と、を備え、前記ボイススイッチ部は、前記音声信号検出部において前記音声区間が検出されているとき前記送話モードを選択し、前記音声信号検出部は、残響時間に応じて前記音声区間と判定する感度を調整することを特徴とする音声処理装置

請求項2

前記音声信号検出部は、設定される残響時間が長いほど音声区間と判定する感度を高くすることを特徴とする請求項1に記載の音声処理装置。

請求項3

前記音声信号検出部は、前記マイクから入力される信号の短期移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記長期の移動平均値を算出する対象期間を長くすることを特徴とする請求項1または2に記載の音声処理装置。

請求項4

前記音声信号検出部は、前記マイクから入力される信号の短期の移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記短期の移動平均値を算出する対象期間を短くすることを特徴とする請求項1または2に記載の音声処理装置。

請求項5

前記音声信号検出部は、前記マイクから入力される信号の短期の移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記閾値を小さくすることを特徴とする請求項1または2に記載の音声処理装置。

請求項6

前記残響時間は、ユーザ入力により設定されることを特徴とする請求項1から5のいずれかに記載の音声処理装置。

請求項7

前記残響時間は、前記マイクから入力される信号を解析して前記残響時間を推定する残響時間推定部から設定されることを特徴とする請求項1から5のいずれかに記載の音声処理装置。

請求項8

音声処理装置と、集音した音を電気信号に変換して前記音声処理装置に入力するマイクと、前記音声処理装置から出力される電気信号を音に変換するスピーカと、を備えることを特徴とするインターホン装置

請求項9

インターホン室内装置と、前記インターホン室内装置と通信するためのインターホン室外装置であり、請求項8に記載のインターホン装置が使用されるインターホン室外装置と、を備えることを特徴とするインターホンシステム

技術分野

0001

本発明は、マイクから入力される信号を処理する音声処理装置インターホン装置、及びインターホンシステムに関する。

背景技術

0002

マンション等の集合住宅ではロビーインターホンを設置する場合が多い。来訪者はロビーに設置されたインターホンから住戸内住人来訪を伝え、住人が解錠すると来訪者が中に入ることができる。ロビーは空間が広いため残響の影響が大きくなる。

0003

インターホンでは、送話受話音声を比較して大きい方の音声を優先させるボイススイッチ機能が使用されることがある(例えば、特許文献1参照)。

先行技術

0004

特開2012−323685号公報

発明が解決しようとする課題

0005

ロビーのように残響の影響が大きい場所では、音声と騒音判別が難しくなる。従って来訪者が発話している最中に音声を騒音と誤判定する場合が発生し、その場合、送話を優先するモードから中間モード切り替わってしまうため快適な通話が阻害されることがあった。

0006

本発明はこうした状況に鑑みなされたものであり、その目的は、設置位置の環境に関わらず、快適な通話を実現する音声処理装置、インターホン装置、及びインターホンシステムを提供することにある。

課題を解決するための手段

0007

上記課題を解決するために、本発明のある態様の音声処理装置は、マイクから入力される信号をスピーカへ出力する信号より優先させる送話モードを選択可能なボイススイッチ部と、前記マイクから入力される信号から音声信号を含む音声区間を検出する音声信号検出部と、を備える。前記ボイススイッチ部は、前記音声信号検出部において前記音声区間が検出されているとき前記送話モードを選択し、前記音声信号検出部は、残響時間に応じて前記音声区間と判定する感度を調整する。

0008

本発明の別の態様は、インターホン装置である。この装置は、上述の音声処理装置と、集音した音を電気信号に変換して前記音声処理装置に入力するマイクと、前記音声処理装置から出力される電気信号を音に変換するスピーカと、を備える。

0009

本発明のさらに別の態様は、インターホンシステムである。このインターホンシステムは、インターホン室内装置と、前記インターホン室内装置と通信するためのインターホン室外装置であり、上述のインターホン装置が使用されるインターホン室外装置と、を備える。

0010

なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システムなどの間で変換したものもまた、本発明の態様として有効である。

発明の効果

0011

本発明によれば、設置位置の環境に関わらず、快適な通話を実現できる。

図面の簡単な説明

0012

本発明の実施の形態に係るインターホンシステムの構成を示す図である。
ロビーインターホン装置の構成を示す図である。
マイクにより集音される信号波形の一例を示す図である。
マイクにより集音される信号の移動平均値波形の一例を示す図である。
マイクにより集音される信号の移動平均値波形の別の例を示す図である。
図6(a)−(c)は、発話音声信号のレベル推移、残響の影響が小さい場合のマイク入力信号のレベル推移、及び残響の影響が大きい場合のマイク入力信号のレベル推移を模式的に描いた図である。
図7(a)−(c)は、スピーカ出力信号のレベル推移、残響の影響が小さい場合のマイク入力信号のレベル推移、及び残響の影響が大きい場合のマイク入力信号のレベル推移を模式的に描いた図である。

実施例

0013

図1は、本発明の実施の形態に係るインターホンシステム1の構成を示す図である。本実施の形態ではインターホンシステム1をマンションに設置する例を想定する。インターホンシステム1はロビーインターホン装置10、制御装置20、インターホン室内装置30及びドアインターホン装置40を備える。

0014

ロビーインターホン装置10はロビーに設置されたインターホン室外装置であり、来訪者は部屋番号を入力して、訪問先の住戸内に設置されたインターホン室内装置30を発呼する。制御装置20は機械室管理人室などの共用スペースに設置される。制御装置20はロビーインターホン装置10とインターホン室内装置30との間の信号を中継する。ドアインターホン装置40は住戸玄関に設置される。インターホン室内装置30とドアインターホン装置40は親機子機の関係にある。

0015

なお図1では単純化するため1つの住戸しか描いていないが、実際には多数の住戸が存在し、制御装置20は複数のインターホン室内装置30とロビーインターホン装置10との間を中継する。また制御装置20は分電盤や各種のセンサに接続されており、火災などの異常が発生した際、各住戸のインターホン室内装置30にアラート信号を送信する。

0016

図2は、ロビーインターホン装置10の構成を示す図である。ロビーインターホン装置10はマイク11a、マイクアンプ11b、A/D変換器11c、スピーカ12a、スピーカアンプ12b、D/A変換器12c、処理部13、通信部17及び操作部18を備える。処理部13は音声処理部14、残響時間設定部15及び残響時間推定部16を備える。音声処理部14は音声信号検出部141及びボイススイッチ部142を含む。

0017

図2の処理部13の機能ブロックには、本実施の形態で注目する処理に関連する機能ブロックのみを描いている。処理部13の機能はハードウェア資源ソフトウェア資源協働、又はハードウェア資源のみにより実現できる。ハードウェア資源としてプロセッサ、ROM、RAM、その他のLSIを利用できる。ソフトウェア資源としてファームウェアアプリケーション等のプログラムを利用できる。

0018

マイク11aは来訪者の声を集音し、電気信号に変換してマイクアンプ11bに出力する。マイクアンプ11bはマイク11aから入力される信号を増幅してA/D変換器11cに出力する。A/D変換器11cはマイクアンプ11bから入力されるアナログ信号デジタル信号に変換して音声処理部14に出力する。

0019

通信部17は、ロビーインターホン装置10のマイク11aまたはインターホン室内装置30で集音された音を変換して生成される電気信号(以下、音信号という)を制御装置20を介してインターホン室内装置30と双方向通信するための通信インタフェースである。音声処理部14は通信部17を介してインターホン室内装置30から受信した音信号を処理してD/A変換器12cに出力する。なお音信号が圧縮符号化されている場合は伸張復号する。なお伸張復号は音声処理部14の前段復号部(不図示)で行ってもよい。

0020

D/A変換器12cは、音声処理部14から入力されるデジタル信号をアナログ信号に変換してスピーカアンプ12bに出力する。スピーカアンプ12bはD/A変換器12cから入力される信号を増幅してスピーカ12aに出力する。スピーカ12aは、スピーカアンプ12bから入力される電気信号を物理的な振動に変換して出力する。

0021

操作部18はユーザの操作を受け付けるためのユーザインタフェースである。操作部18は少なくとも、部屋番号を入力するためのテンキーボタン呼出ボタンを備える。

0022

ボイススイッチ部142は、マイク11aから入力される信号をスピーカ12aへ出力する信号より優先させる送話モード、及びスピーカ12aへ出力する信号をマイク11aから入力される信号より優先させる受話モードを選択できる。送話モードでは、通信部17を介して入力される音信号を減衰する。100%減衰してスピーカ12aから音声出力されない設計でもよいし、100%未満の減衰率で減衰してスピーカ12aから出力される音声レベル下げる設計でもよい。またマイクアンプ11bの増幅率を上げる処理を併用してもよい。

0023

一方、受話モードではマイク11aから入力される信号を減衰する。100%減衰して有意な信号をインターホン室内装置30に送出しない設計でもよいし、信号レベルを下げてインターホン室内装置30に送出する設計でもよい。またスピーカアンプ12bの増幅率を上げる処理を併用してもよい。なおボイススイッチ部142は、マイク11aから入力される信号およびスピーカ12aへ出力する信号を同じ減衰量で減衰させる中間モードも選択できる。

0024

図2では、信号の減衰処理デジタル信号処理による数値演算で実現する例を想定しているが、アナログ素子で構成される減衰器を使用してもよい。その場合、A/D変換器11c及びD/A変換器12cは、ボイススイッチ部142と通信部17の間に移動される。

0025

音声信号検出部141は、マイク11aから入力される信号から音声区間を検出する。以下の説明では音声とは人間により発声された音を指し、音声信号検出部141は人間により発声された音を含む区間を音声区間と判定し、人間により発声された音を含まない環境音のみの区間を非音声区間と判定する。ボイススイッチ部142は、音声信号検出部141において音声区間が検出されているとき送話モードを選択し、非音声区間が検出されているとき受話モードまたは中間モードを選択する。

0026

音声信号検出部141は具体的には、マイク11aから入力される信号絶対値の長期の移動平均値Nと、短期の移動平均値Sを算出する。音声信号検出部141は短期の移動平均値Sと長期の移動平均値Nとの比率S/Nを算出し、当該比率S/Nが設定比率α以上であれば音声区間と判定し、設定比率α未満であれば非音声区間と判定する。すなわち短期の移動平均値Sが長期の移動平均値Nより設定比率α以上大きくなると音声区間に突入と判定する。反対に短期の移動平均値Sが長期の移動平均値Nの設定比率α未満になると非音声区間に復帰と判定する。

0027

通常、音声信号の振幅の方が騒音信号の振幅より大きくなるため、音声信号を含む区間は振幅が大きくなる。音声および騒音とも振幅が小刻みに変動するため、単純に信号レベルが大きいとき音声区間と判定する方法では、判定結果が音声区間と非音声区間との間で頻繁に切り替わることになる。そこで一定期間の平均値を使用して信号データにヒステリシスを持たせる。音声が存在しない状態から音声が存在する状態に変化したとき、短期の移動平均値Sの方が長期の移動平均値Nより先に立ち上がることになる。長期の移動平均値Nの方が、より過去のデータを多く含んで平均化された値であるため短期の移動平均値Sより変化が緩やかなためである。

0028

音声信号検出部141は、残響時間に応じて音声区間と判定する感度を調整する。具体的には残響時間が長いほど音声区間と判定する感度を高くする。残響とは音源が振動を停止した後も音が響いて聞こえる現象を指す。一般的に残響時間は、音源が振動を停止してから60デシベル減衰するまでの時間と定義される。残響時間は、音が鳴っている空間が広いほど長くなる性質がある。従って広いロビーでは残響時間が長くなる。残響時間が長くなると音声に追加されて集音される残響の影響が大きくなる。

0029

図3は、マイク11aにより集音される信号波形の一例を示す図である。図3では、同じ音声(こんにちは)を残響の影響が小さい環境下で集音した場合の信号波形と、残響の影響が大きい環境下で集音した場合の信号波形を模式的に描いている。残響の影響が大きい環境下で集音した信号波形の方が振幅の変動が小さくなることが分かる。振幅の変動が小さくなと、短期の移動平均値Sと長期の移動平均値Nとの乖離が小さくなる方向に作用するため、音声を騒音と誤検出しやすくなる。

0030

そこで音声信号検出部141は残響時間が長いとき、音声区間と判定される感度を高くして、通常より音声区間と判定されやすくする。以下、音声検出判定感度を上げる3つの方法を説明する。第1の方法では音声信号検出部141は、残響時間が長いほど長期の移動平均値Nを算出する対象期間を長くする。

0031

図4は、マイク11aにより集音される信号の移動平均値波形の一例を示す図である。音声(こんにちは)が存在する区間では、短期の移動平均値波形の方が長期の移動平均値波形より大きくなる。長期の移動平均値は音声が存在するようになる前の期間のデータを多く含むため、短期の移動平均値より相対的に小さくなる。対象期間が相対的に長い「長期の移動平均波形」と、対象期間が相対的に短い「長期の移動平均波形」を比較すると、前者の方がより、音声が存在するようになる前の期間のデータをより多く含むことになる。従って前者の方が後者よりレベルが小さくなる。よって、対象期間が相対的に長い「長期の移動平均値」を使用した方が短期の移動平均値との差分が大きなり、音声区間と判定されやすくなる。残響時間が長くなるほど長期の移動平均値と短期の移動平均値との乖離が小さくなる方向に作用するが、長期の移動平均値の対象期間を延長することにより、その影響を相殺または緩和できる。

0032

音声検出の判定感度を上げる第2の方法では音声信号検出部141は、残響時間が長いほど短期の移動平均値Sを算出する対象期間を短くする。

0033

図5は、マイク11aにより集音される信号の移動平均値波形の別の例を示す図である。図5において対象期間が相対的に短い「短期の移動平均波形」と、対象期間が相対的に長い「短期の移動平均波形」を比較すると、前者の方が振幅の変動が大きくなる。従って対象期間が相対的に短い「短期の移動平均値」を使用した方が長期の移動平均値との差分が大きくなりやすく音声区間と判定されやすくなる。残響時間が長くなるほど長期の移動平均値と短期の移動平均値との乖離が小さくなる方向に作用するが、短期の移動平均値の対象期間を縮小することにより、その影響を相殺または緩和できる。

0034

音声検出の判定感度を上げる第3の方法では音声信号検出部141は、残響時間が長いほど設定比率αを小さくする。設定比率αを小さくすれば、短期の移動平均値Sと長期の移動平均値Nとの比率S/Nが設定比率α以上になりやすくなり、音声区間と判定されやすくなる。

0035

以上の説明において、短期の移動平均値Sの対象期間(すなわちデータサンプル数)、長期の移動平均値Nの対象期間、設定比率αのそれぞれ値には、実験シミュレーションをもとに導出した値を用いることができる。また残響時間の変化値と、長期の移動平均値Nの対象期間の変化値との関係も実験やシミュレーションをもとに導出した関係を用いることができる。当該関係は関数で規定してもよいし、当該関係を記述したテーブルを用いてもよい。長期の移動平均値Nの対象期間、又は設定比率αを変化させる場合も同様である。

0036

また残響時間と、長期の移動平均値Nの対象期間との関係はモードで規定してもよい。例えば残響時間に「短」、「普通」、「長」の3モードを用意し、長期の移動平均値Nの対象期間にも「短」、「普通」、「長」の3モードを用意する。残響時間のモードが「長」に設定されている場合、音声信号検出部141は対象期間が「長」の場合のサンプル数で長期の移動平均値Nを算出する。

0037

図2に戻る。残響時間設定部15は残響時間を音声信号検出部141に設定する。残響時間設定部15は、操作部18からユーザにより入力された残響時間の値を、音声信号検出部141に設定する。例えばロビーインターホン装置10の施工時、施工業者騒音計を用いてロビーの残響時間を測定し、測定した値を操作部18から入力してもよい。

0038

このように残響時間にはユーザにより入力された値を使用できるが、推定値を使用することもできる。また推定値を使用したほうが、壁の材質変更、温度、湿度などの環境条件の変化を直ぐに残響時間に反映できる。残響時間推定部16は、マイク11aから入力される信号を解析して残響時間を推定する。例えば残響時間推定部16は、マイク11aから入力される信号の音声区間の終了からの傾きを検出することにより残響時間を推定できる。

0039

図6(a)−(c)は、発話音声信号のレベル推移、残響の影響が小さい場合のマイク入力信号のレベル推移、及び残響の影響が大きい場合のマイク入力信号のレベル推移を模式的に描いた図である。図6(b)と図6(c)を比較すると、図6(c)に示す残響の影響が大きい場合のマイク入力信号の方が発話音声文末からの傾きが緩くなる。残響時間推定部16は例えば、音声区間から非音声期間に切り替わってから、マイク入力信号のレベルが非音声期間の平均レベルに到達するまでの時間を測定することにより残響時間を推定する。このような来訪者の発話音声を利用する方法では、後述するようなスピーカ12aから音を出力する必要がなく、テスト用の音源データを用意する必要もない。

0040

残響時間の推定に使用するマイク入力信号は発話音声を含む信号に限るものではない。例えば残響時間推定部16はスピーカ12aから音を出力させ、その音をマイク11aから集音して残響時間を推定してもよい。この場合、スピーカ12aからの出力音終了タイミングを厳密に特定できるため、より高精度に残響時間を推定することができる。

0041

図7(a)−(c)は、スピーカ出力信号のレベル推移、残響の影響が小さい場合のマイク入力信号のレベル推移、及び残響の影響が大きい場合のマイク入力信号のレベル推移を模式的に描いた図である。図7(b)と図7(c)を比較すると、図7(c)に示す残響の影響が大きい場合のマイク入力信号の方がスピーカ出力終了時点からの傾きが緩くなる。スピーカ出力信号を使用する場合、残響時間推定部16はスピーカ出力の終了時から、マイク入力信号のレベルが非音声期間の平均レベルに到達するまでの時間を測定することにより残響時間を推定する。

0042

残響時間推定部16は、スピーカ12aから出力させる残響推定用テスト信号の音源データを保持するテスト音データ保持部16aを備えていてもよい。残響時間推定部16は音声処理部14の起動シーケンスにおいて、テスト音源データ保持部16aから音源データを読み出してスピーカ12aからテスト音を出力させる。残響時間推定部16は当該テスト音をマイク11aで集音し、残響時間を推定する。残響時間は温度や湿度の影響も受けるため音声処理部14の起動の度に残響時間を推定することは、その時点の環境に合致した残響時間を使用する観点から望ましい制御といえる。

0043

なお残響推定用テスト信号の音源データとして、来訪者が住人を呼び出す際に鳴動させるバックトーンの音源データを流用してもよい。この場合、残響推定用テスト信号の音源データを別途に用意する必要がなくなる。残響時間推定部16は呼出しボタンが押下される度に、マイク11aから呼出音を集音して残響時間を推定してもよい。

0044

残響時間推定部16は、スピーカ12aから出力される通話中受話音声を、マイク11aから集音して残響時間を推定してもよい。この推定処理は、ボイススイッチ部142が受話モードを選択してるときに実行することが好ましい。この場合も、残響推定用テスト信号の音源データを別途に用意する必要がなくなる。

0045

以上説明したように本実施の形態によれば、残響時間に応じて音声信号検出部141において音声区間と判定する感度を調整することにより、送話モードと受話モードのスイッチング精度が高くなり快適な通話を実現できる。特にロビーなどの残響の影響が大きい場所に設置されるインターホン装置に有効である。また残響時間推定部16を設けることにより、設置場所環境変化リアルタイムにボイススイッチ機能に反映させることができる。

0046

以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

0047

上記の実施の形態では、短期の移動平均値Sと長期の移動平均値Nとの比率S/Nが設定比率α以上のとき音声区間と判定する方法を説明したが、短期の移動平均値Sと長期の移動平均値Nとの差分(S−N)が設定値β以上のとき音声区間と判定してもよい。

0048

上記の実施の形態では、ボイススイッチ部142を含む音声処理部14をロビーインターホン装置10に搭載する例を説明した。この点、音声処理部14をドアインターホン装置40またはインターホン室内装置30に搭載してもよい。なおドアインターホン装置40のマイクで集音される残響の影響を低減するための音声処理部14を、親機としてのインターホン室内装置30に搭載してもよい。ドアインターホン装置40が設置される廊下も比較的残響が大きい場所であるため、音声処理部14を搭載する意義が大きい。

0049

また住戸内の天井が高いなど、住戸内の空間が広い場合はインターホン室内装置30のマイクで集音される残響の影響を低減するための音声処理部14をインターホン室内装置30に搭載してもよい。

0050

また音声処理部14を制御装置20に搭載してもよい。制御装置20がロビーインターホン装置10とインターホン室内装置30間の音信号を中継する際、ボイススイッチを適用してもよい。その場合、残響時間推定部16は制御装置20に搭載されてもロビーインターホン装置10に搭載されてもよい。後者の場合、残響時間推定部16が推定した残響時間は幹線を介して制御装置20に伝達されることになる。

0051

上記の実施の形態ではマンションに設置されるインターホンシステム1を説明したが、戸建てに設置されるインターホンシステム1にも同様に適用できる。戸建てに設置されるインターホンシステム1では、ロビーインターホン装置10及び制御装置20が設けられない。上述のボイススイッチ機能は、インターホン室内装置30とドアインターホン装置40間の音信号に適用される。

0052

なお、実施の形態は、以下の項目によって特定されてもよい。

0053

[項目1]
マイク11aから入力される信号をスピーカ12aへ出力する信号より優先させる送話モードを選択可能なボイススイッチ部142と、
前記マイク11aから入力される信号から音声信号を含む音声区間を検出する音声信号検出部141と、を備え、
前記ボイススイッチ部142は、前記音声信号検出部141において前記音声区間が検出されているとき前記送話モードを選択し、
前記音声信号検出部141は、残響時間に応じて前記音声区間と判定する感度を調整することを特徴とする音声処理装置(音声処理部14)。
これにより、残響により音声区間と判定する精度が低下することを抑制できる。
[項目2]
前記音声信号検出部141は、設定される残響時間が長いほど音声区間と判定する感度を高くすることを特徴とする項目1に記載の音声処理装置(音声処理部14)。
これにより、残響の影響により音声区間を非音声区間と誤判定する確率を低減できる。
[項目3]
前記音声信号検出部141は、前記マイク11aから入力される信号の短期の移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記長期の移動平均値を算出する対象期間を長くすることを特徴とする項目1または2に記載の音声処理装置(音声処理部14)。
これにより、長期の移動平均値を下側にシフトさせることができ、音声区間と判定する感度を高めることができる。
[項目4]
前記音声信号検出部141は、前記マイク11aから入力される信号の短期の移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記短期の移動平均値を算出する対象期間を短くすることを特徴とする項目1または2に記載の音声処理装置(音声処理部14)。
これにより、短期の移動平均値の変化を大きくさせることができ、音声区間と判定する感度を高めることができる。
[項目5]
前記音声信号検出部141は、前記マイク11aから入力される信号の短期の移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記閾値を小さくすることを特徴とする項目1または2に記載の音声処理装置(音声処理部14)。
これにより、短期の移動平均値と長期の移動平均値との比率または差分が、設定比率または設定値以上となる確率を上げることができ、音声区間と判定する感度を高めることができる。
[項目6]
前記残響時間は、ユーザ入力により設定されることを特徴とする項目1から5のいずれかに記載の音声処理装置(音声処理部14)。
これにより、残響時間を設置環境に応じた値に設定できる。
[項目7]
前記残響時間は、前記マイク11aから入力される信号を解析して前記残響時間を推定する残響時間推定部から設定されることを特徴とする項目1から5のいずれかに記載の音声処理装置(音声処理部14)。
これにより、残響時間を設置環境をリアルタイムに反映した値に設定できる。
[項目8]
項目1から7のいずれかに記載の音声処理装置(音声処理部14)と、
集音した音を電気信号に変換して前記音声処理装置(音声処理部14)に入力するマイク11aと、
前記音声処理装置(音声処理部14)から出力される電気信号を音に変換するスピーカ12aと、
を備えることを特徴とするインターホン装置(ロビーインターホン装置10)。
これにより、残響により音声区間と判定する精度が低下することを抑制でき、快適な通話が可能なインターホン装置を実現できる。
[項目9]
インターホン室内装置(インターホン室内装置30)と、
前記インターホン室内装置(インターホン室内装置30)と通信するためのインターホン室外装置(ロビーインターホン装置10)であり、項目8に記載のインターホン装置が使用されるインターホン室外装置(ロビーインターホン装置10)と、
を備えることを特徴とするインターホンシステム1。
これにより、残響により音声区間と判定する精度が低下することを抑制でき、快適な通話が可能なインターホンシステムを実現できる。

0054

1インターホンシステム、 10ロビーインターホン装置、 11aマイク、 11bマイクアンプ、 11c A/D変換器、 12aスピーカ、 12bスピーカアンプ、 12c D/A変換器、 13 処理部、 14音声処理部、 141音声信号検出部、 142ボイススイッチ部、 15残響時間設定部、 16残響時間推定部、 16aテスト音源データ保持部、 17通信部、 18 操作部、 20制御装置、 30インターホン室内装置、 40ドアインターホン装置。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社ナカヨの「 電話機」が 公開されました。( 2020/10/29)

    【課題】安価な構成で半二重通話によるハンズフリー通話が可能な電話機を提供する。【解決手段】通話モード制御部111は、マイク101に入力された送話信号の送話音量レベルおよび電話機能部100が通話相手から... 詳細

  • 株式会社ケアコムの「 ナースコールシステム」が 公開されました。( 2020/10/29)

    【課題】発声障害を有する患者であっても、簡単な操作で自分の要求や意思を看護師に的確に伝えることができ、用件の伝達と確認にかかる患者および看護師の手間を軽減できるようにする。【解決手段】用件伝達型子機7... 詳細

  • ローム株式会社の「 電子機器」が 公開されました。( 2020/10/29)

    【課題】近接センサを有し、かつ筐体のサイズを小さくすることができるような電子機器を提供する。【解決手段】カバーパネル51は、表示パネル5の上に配置され、表示パネル5を覆う第1の領域R1と、表示パネル5... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ