図面 (/)

技術 音空間効果方法および装置

出願人 スフェリックオーディオラボラトリーズインコーポレイテッド
発明者 スティーヴンディーマークデヴィッドエフドールシャル
出願日 1994年11月14日 (25年8ヶ月経過) 出願番号 1994-279003
公開日 1996年1月23日 (24年6ヶ月経過) 公開番号 1996-023600
状態 未査定
技術分野 ステレオ方式 他に分類されない音響(残響,カラオケ等)
主要キーワード 上方信号 ノイズ発生装置 減衰パターン 増減パターン 近接信号 標準媒体 空間効果 前方信号
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1996年1月23日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (6)

目的

現実に適用できかつ人間に知覚することが容易な三次元音空間効果を生じせしめる。

構成

音声源20から発せられる原音声信号22と、所定のグレイノイズを付加されたテンプレート記憶媒体24に記憶された、空間的失見当を起こさせるテンプレート信号26とを音声処理装置28により合成する。合成信号30を増幅器36やスピーカ32に出力して再生する。

概要

背景

概要

現実に適用できかつ人間に知覚することが容易な三次元音空間効果を生じせしめる。

音声源20から発せられる原音声信号22と、所定のグレイノイズを付加されたテンプレート記憶媒体24に記憶された、空間的失見当を起こさせるテンプレート信号26とを音声処理装置28により合成する。合成信号30を増幅器36やスピーカ32に出力して再生する。

目的

本発明は上記事情に鑑み、現実的かつ知覚容易な三次元の音空間効果を生じせしめる手段を提供することを目的とするものである。さらに本発明は、映画サウンドトラック記録媒体、生演奏、その他の商用電子オーディオ機器と便宜的に統合しうる態様でバイノーラル効果を発揮することができる手段を提供することをも目的とするものである。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

所定周波数において1以上の振幅変動を含むノイズ信号を発生させ、該ノイズ信号を原音声信号に適用することを特徴とする原音声信号において1以上の三次元音空間効果を生じせしめる方法。

請求項2

前記ノイズ信号が、変形ホワイトノイズ信号からなることを特徴とする請求項1記載の方法。

請求項3

前記変形ホワイトノイズ信号が、約4,000Hz未満の周波数が強調されたホワイトノイズパターンからなることを特徴とする請求項2記載の方法。

請求項4

前記変形ホワイトノイズ信号が、約4,000Hzよりも高い周波数が抑制されたホワイトノイズパターンからなることを特徴とする請求項2記載の方法。

請求項5

前記振幅変動が、前記ノイズ信号における1以上の振幅スパイクからなることを特徴とする請求項1記載の方法。

請求項6

前記振幅変動が、前記ノイズ信号における1以上の振幅ノッチからなることを特徴とする請求項1記載の方法。

請求項7

前記振幅変動が、前記ノイズ信号における第1の振幅スパイクと、該第1の振幅スパイクに周波数が隣接する振幅ノッチと、該振幅ノッチに周波数が隣接する第2の振幅スパイクとからなることを特徴とする請求項1記載の方法。

請求項8

前記振幅変動が、前記ノイズ信号における第1の振幅ノッチと、該第1のノッチに周波数が隣接する振幅スパイクと、該振幅スパイクに周波数が隣接する第2の振幅ノッチとからなることを特徴とする請求項1記載の方法。

請求項9

前記ノイズ信号の最初約2秒間には、振幅変動が含まれていないことを特徴とする請求項1記載の方法。

請求項10

前記ノイズ信号が、該ノイズ信号に含まれる最後の振幅変動以降、少なくとも0.5秒程度持続することを特徴とする請求項1記載の方法。

請求項11

前記ノイズ信号が、ディジタル音声処理装置を用いて発生せしめられることを特徴とする請求項1記載の方法。

請求項12

前記ノイズ信号の前記原音声信号への適用が、ディジタル音声処理装置を用いてなされることを特徴とする請求項1記載の方法。

請求項13

前記原音声信号が、予め録音された信号からなることを特徴とする請求項1記載の方法。

請求項14

前記原音声信号が、映画サウンドトラックの信号からなることを特徴とする請求項1記載の方法。

請求項15

前記原音声信号が、電子合成音からなることを特徴とする請求項1記載の方法。

請求項16

前記原音声信号が、生演奏の信号からなるとともに、前記ノイズ信号の前記原音声信号への適用が、前記生演奏中に行なわれることを特徴とする請求項1記載の方法。

請求項17

空間的失見当を起こさせる刺激信号と原音声信号とを合成し、前記空間的失見当刺激信号が存在している間に、空間的再指南を起こさせる刺激信号と前記原音声信号とを合成することを特徴とする原音声信号において音空間効果を生じせしめる方法。

請求項18

前記空間的失見当刺激信号と前記空間的再指南刺激信号とが単一の信号の成分をなすことを特徴とする請求項17記載の方法。

請求項19

前記空間的失見当刺激信号の合成が、ノイズ信号と前記原音声信号とを合成する段階をさらに含むことを特徴とする請求項17記載の方法。

請求項20

前記ノイズ信号が、変形ホワイトノイズ信号からなることを特徴とする請求項19記載の方法。

請求項21

前記変形ホワイトノイズ信号が、約4,000Hzよりも低い周波数が強調されたホワイトノイズパターンからなることを特徴とする請求項20記載の方法。

請求項22

前記変形ホワイトノイズ信号が、約4,000Hzよりも高い周波数が抑制されたホワイトノイズパターンからなることを特徴とする請求項20記載の方法。

請求項23

前記空間的再指南刺激信号が、所定周波数において1以上の振幅変動を含むノイズ信号からなることを特徴とする請求項17記載の方法。

請求項24

前記振幅変動が1以上の振幅スパイクを含むことを特徴とする請求項23記載の方法。

請求項25

前記振幅変動が1以上の振幅ノッチを含むことを特徴とする請求項23記載の方法。

請求項26

前記振幅変動が、前記ノイズ信号における第1の振幅スパイクと、該第1の振幅スパイクに周波数が隣接する振幅ノッチと、該振幅ノッチに周波数が隣接する第2の振幅スパイクとからなることを特徴とする請求項23記載の方法。

請求項27

前記振幅変動が、前記ノイズ信号における第1の振幅ノッチと、該第1の振幅ノッチに周波数が隣接する振幅スパイクと、該振幅スパイクに周波数が隣接する第2の振幅ノッチとからなることを特徴とする請求項23記載の方法。

請求項28

ディジタル音声処理装置を用いて前記空間的失見当刺激信号を発生させる段階をさらに含むことを特徴とする請求項17記載の方法。

請求項29

ディジタル音声処理装置を用いて前記再指南刺激信号を発生させる段階をさらに含むことを特徴とする請求項17記載の方法。

請求項30

前記空間的再指南刺激信号よりも少なくとも約2秒前から前記空間的失見当刺激信号が存在していることを特徴とする請求項17記載の方法。

請求項31

前記空間的再指南刺激信号が終わってから少なくとも約0.5秒後まで前記空間的試験等刺激信号が存在していることを特徴とする請求項17記載の方法。

請求項32

前記原音声信号が、予め録音された信号からなることを特徴とする請求項17記載の方法。

請求項33

前記原音声信号が、映画のサウンドトラックの信号からなることを特徴とする請求項17記載の方法。

請求項34

前記原音声信号が、電子合成音からなることを特徴とする請求項17記載の方法。

請求項35

前記原音声信号が、生演奏の信号からなるとともに、前記合成が前記生演奏中に行なわれることを特徴とする請求項17記載の方法。

請求項36

所定周波数において1以上の振幅変動を含むノイズ信号を発生させる手段と、前記ノイズ信号を原音声信号に適用する手段とからなることを特徴とする原音声信号において1以上の三次元音空間効果を生じせしめる装置。

請求項37

前記ノイズ信号が、変形ホワイトノイズ信号からなることを特徴とする請求項36記載の装置。

請求項38

前記変形ホワイトノイズ信号が、約4,000Hzよりも低い周波数が強調されたホワイトノイズパターンからなることを特徴とする請求項37記載の装置。

請求項39

前記変形ホワイトノイズ信号が、約4,000Hzよりも高い周波数が抑制されたホワイトノイズパターンからなることを特徴とする請求項37記載の装置。

請求項40

前記振幅変動が、前記ノイズ信号における1以上の振幅スパイクからなることを特徴とする請求項36記載の装置。

請求項41

前記振幅変動が、前記ノイズ信号における1以上の振幅ノッチからなることを特徴とする請求項36記載の装置。

請求項42

前記振幅変動が、前記ノイズ信号における第1の振幅スパイクと、該第1の振幅スパイクに周波数が隣接する振幅ノッチと、該振幅ノッチに周波数が隣接する第2の振幅スパイクとからなることを特徴とする請求項36記載の装置。

請求項43

前記振幅変動が、前記ノイズ信号における第1の振幅ノッチと、該第1の振幅ノッチに周波数が隣接する振幅スパイクと、該振幅スパイクに周波数が隣接する振幅ノッチとからなることを特徴とする請求項36記載の装置。

請求項44

ディジタル音声処理装置をさらに備えたことを特徴とする請求項36記載の装置。

請求項45

前記ノイズ信号が効果テンプレートであり、該効果テンプレートを前記原音声信号に適用する前記手段が、ディジタル音声処理装置からなることを特徴とする請求項36記載の装置。

請求項46

前記原音声信号が、予め録音された信号からなることを特徴とする請求項36記載の装置。

請求項47

前記原音声信号が、映画のサウンドトラックの信号からなることを特徴とする請求項36記載の装置。

請求項48

前記原音声信号が、電子合成音からなることを特徴とする請求項36記載の装置。

請求項49

前記原音声信号が、生演奏の信号からなるとともに、前記ノイズ信号を適用する前記手段が前記生演奏中に操作可能であることを特徴とする請求項36記載の装置。

請求項50

空間的失見当を起こさせる刺激信号と原音声信号とを合成する手段と、前記空間的失見当刺激信号が存在している間に、空間的再指南を起こさせる刺激信号と前記原音声信号とを合成する手段とからなることを特徴とする原音声信号において音空間効果を生じせしめる装置。

請求項51

前記空間的失見当刺激信号と前記空間的再指南刺激信号とが単一の信号の成分をなすことを特徴とする請求項50記載の装置。

請求項52

空間的失見当刺激信号を合成する前記手段が、ノイズ信号と前記原音声信号とを合成する手段をさらに含むことを特徴とする請求項50記載の装置。

請求項53

前記ノイズ信号が、変形ホワイトノイズ信号からなることを特徴とする請求項52記載の装置。

請求項54

前記変形ホワイトノイズ信号が、約4,000Hzよりも低い周波数が強調されたホワイトノイズパターンからなることを特徴とする請求項53記載の装置。

請求項55

前記変形ホワイトノイズ信号が、約4,000Hzよりも高い周波数が抑制されたホワイトノイズパターンからなることを特徴とする請求項53記載の装置。

請求項56

前記空間的再指南刺激信号が、所定周波数において1以上の振幅変動を含むノイズ信号からなることを特徴とすることを特徴とする請求項50記載の装置。

請求項57

前記振幅変動が、1以上の振幅スパイクを含むことを特徴とする請求項56記載の装置。

請求項58

前記振幅変動が、1以上の振幅ノッチを含むことを特徴とする請求項56記載の装置。

請求項59

前記振幅変動が、前記ノイズ信号における第1の振幅スパイクと、該第1の振幅スパイクに周波数が隣接する振幅ノッチと、該振幅ノッチに周波数が隣接する第2の振幅スパイクとからなることを特徴とする請求項56記載の装置。

請求項60

前記振幅変動が、前記ノイズ信号における第1の振幅ノッチと、該第1の振幅ノッチに周波数が隣接する振幅スパイクと前記振幅スパイクに周波数が隣接する第2の振幅ノッチとからなることを特徴とする請求項56記載の装置。

請求項61

前記空間的失見当刺激信号を発生させるディジタル音声処理装置をさらに含むことを特徴とする請求項50記載の装置。

請求項62

前記空間的失見当刺激信号よりも少なくとも約2秒前から前記空間的失見当刺激信号が存在していることを特徴とする請求項50記載の方法。

請求項63

前記空間的失見当刺激信号が終わってから少なくとも約0.5秒後まで前記空間的試験等刺激信号が存在していることを特徴とする請求項50記載の方法。

請求項64

前記原音声信号が、予め録音された信号からなることを特徴とする請求項50記載の装置。

請求項65

前記原音声信号が、映画のサウンドトラックの信号からなることを特徴とする請求項50記載の装置。

請求項66

前記原音声信号が、電子合成音からなることを特徴とする請求項50記載の装置。

請求項67

前記原音声信号が、生演奏の信号からなるとともに、前記合成手段が前記生演奏中に操作可能であることを特徴とする請求項50記載の装置。

請求項68

1以上の原音声信号と、前記音声信号と合成される1以上のノイズ信号であって、所定周波数において1以上の振幅変動を含む1以上のノイズ信号とからなり、前記全ての信号が記録媒体上に記録される、ことを特徴とする1以上の三次元音空間効果のある音声録音

技術分野

0001

本発明は音声再生分野に関し、特に詳細には、バイノーラル的な三次元音空間効果を生じせしめ、再現する技術に関する。

背景技術

0002

バイノーラル(文字どおり「両方ので聴く」)音響効果が初めて発見されたのは、電話ステム発表されて間もない1881年のことであった。初期電話装置は、演劇やオペラ実演舞台から遠く離れた場所で聴くために使用されていた。当時は再生音の質があまりよくなかったため、マイクロホンの配置やヘッドホン構成のどんなちょっとした工夫でも、音の質や現実感を少しでも高めるものなら大いに喜ばれ、そのためにはどうするのが最善の方法かを定めるために多くの研究が行なわれた。その後、イヤホンを単一のマイクロホンに接続するよりも、各々が別々のイヤホンに接続された2つのマイクロホンを使用した方が、再生音の質が実質的に高くなり、2つのマイクロホンを数インチ離して配置すると、この効果がさらに高まることが発見された。すなわち、実際の聴取者の耳と略同じ位置に2つのマイクロホンを配置すると、さらに高い効果が得られることがわかった。このようなバイノーラル装置は、単一のマイクロホン装置では再現できなかった電子再生音に関して、非常に現実感のある空間効果をもたらした。このように、バイノーラル音響装置の方がモノラルの装置よりも空間的な現実感を高められるということは、今世紀のごく初期から認識されていた。

0003

しかしながら、バイノーラルの原理具現化し、かつ実際に良好な効果を発揮するオーディオ・システムを商品として通用するものにすることは、非常に困難であった。このため、耳にマイクロホンを装着するという基本的な方法は何十年も前から周知であったのに、この方法は商品化されていない。第一に、小型のマイクロホンを耳に挿入して録音したものをヘッドホンで再生した時、録音者本人にとっては望ましい空間効果が得られたとしても、同じ録音の再生を他人がヘッドホンで聴いた時やラウドスピーカ装置で聴いた時も同じ効果が得られるとは限らない。また、耳にマイクロホンを挿入して録音している時に、録音者本人が少しでも動けば、録音処理に支障をきたす可能性がある。唾を飲みこむ音や呼吸の音、お中のなる音、あらゆる種類の身体の動きが、最終的な録音においては、非常に耳につく大音量になってしまう。こうした音は、身体の骨格を介して伝導され、伝導によりマイクロホンに伝わるため、マイクロホンに向って直接囁いた時と同様に伝わってしまう。各々のトラックに適した録音とするために、録音回数が数十回以上になることもある。解剖学的にできるだけ正確な人間の頭部の模型を用いることによってこうした問題を解決しようとする試みがなされてきたが、このような手段により行なわれた録音は、満足できるとは言えないものであった。これ以外の問題の中でも、人間の肉や骨と全く同じ吸音性と音の反射性とを有する材料を見つけることは、実際問題として非常に困難であった。

0004

耳に装着するマイクロホンまたは頭部の模型を用いたバイノーラル録音が、実際問題として満足できるものではないため、純粋に電子的な手段によってバイノーラル的な効果を生じせしめるために、さまざまな努力がなされてきた。しかしながら、バイノーラル音響に豊かさと立体感とを与えている要因変数解明と抽出とはきわめて困難であり、これらの要因や変数をめぐって論議が今日に至るまで続けられている。バイノーラル録音技術の一般的な論議については、例えばサニエール J.、「バイノーラル音響の歴史」、オーディオ・マガジン、1986年3月(Sunier J., "A History of Binaural Sound," Audio Magazine, March 1986)およびサニエール J.、「マイクを入れる耳」、オーディオ・マガジン、1989年11−12月(Sunier, J., "Ears where the Mikes Are," Audio Magazine, November-December 1989)を参照されたい。

0005

例えば通常の「ステレオ」装置は、さもなくば平面的なモノラル音響に方向感を付与するためにバイノーラル録音装置に利用されている特定の一要素、すなわち両耳聴の時間的なずれ(「両耳聴遅れ」または「両耳間の遅れ」としても周知)を用いて行なわれている。両耳聴の時間的なずれは、空間のどこか一地点から発せられた音が一方の耳に達する時間の方が他方の耳に達する時間よりも早くなるという事実に基づいている。この時間差は、時間にしてわずか数ミリ秒にすぎないが、脳はこの時間情報を利用して方向を計算していると考えられている。しかしながら、現実のバイノーラル録音に含まれている全帯域の音空間信号を商用音響装置において捕えるという点に関しては、現在に至るまで実質的に何の進歩も見られない。このため、真のバイノーラル装置は、三次元の音空間効果を再現できるものでなければならないのに、ステレオ装置では、単一の平面上での移動感や方向感を生じせしめることしかできないのである。

0006

耳にマイクロホンを装着して行なうバイノーラル録音法を利用して、優れた音空間効果を生じせしめることができることがあるのは、理論的には、人間の頭蓋耳介外耳道の種々の部分とが一組の周波数選択減衰器として機能し、さまざまな方向からやってくる音がさまざまな形でこれらの構造と相互作用するためであるといわれている。例えば、聴取者のすぐ前方で生じた音は、音声パワースペクトルの16,000Hz付近周波数聴覚器官によって選択的にフィルタリングされ(すなわち減衰し)、他方、聴取者の上方からやってくる音は、実質的に8,000Hz近辺の周波数が減衰している。したがって、脳は減衰パターン相違に注目することによって、音のする方向を探り出していると理論的に考えられている。すなわち、脳に達した音が、16,000Hz付近の周波数が著しく欠如したものであれば、脳は、聴取者の前方から聞こえてくると推測するわけである。この点に関しては、米国特許第4,393,270号;ブラウワー、J.、空間的な聴力人体の音響の精神物理学的作用、MIプレス、1983年(Blauert, J., Spatial Hearing: The Psychophysics of Human Sound, MITPress, 1983 );ヘブランク、J.H.およびライト、D.,「正中面上での音の定位には両耳が必要か」、米国音響学会報、1974年、第56巻、pp.935〜938(Hebrank, J.H. and Wright, D., "Are Two Ears necessary forLocalization of Soundson the Mdeian Plane?", J. Acoust. Soc. Am., 1974,Vol. 56, pp. 935-938 );ハートレー、R.V.L.およびフライズ、T.C.、「両耳聴による純音の定位」、物理学評論、1921年、シリーズ2、第18巻、pp.431〜442(Hartley, R.V.L. and Frys, T.C., "The Binaural Localization of Pure Tones", Phys. Rev., 1921, 2d series, Vol. 18, pp.431-442)に記載されている。

発明が解決しようとする課題

0007

多くのオーディオ装置は、この脳の働きに基づいて、電子的にバイノーラル音空間効果を作り出そうとするものであり、音声スペクトルのごく狭い帯域において原音声信号振幅を選択的に減衰させるために、ノッチフィルタが用いられている。例えば米国特許第4,393,270号にノッチフィルタを用いたオーディオ装置が記載されている。このような装置を具体化することは比較的に容易であるが、一般にごく限られた効果しかないことが実証されている。このような装置で作り出される三次元効果は弱く、非常に注意して聴かなければ認識できない。選択的に減衰するという考え方には何らかのメリットがあるが、何も考えずにノッチフィルタを使用して選択的減衰を模倣することは、明らかに満足できる解決策ではない。

0008

バイノーラル録音およびこれに関連する音空間効果は、1世紀以上にわたって、広く科学のとして残されてきた。「サラウンドサウンド」やその他のバイノーラル的な音響効果を人工的に作り出すための近年の試み(例えばヒューズサウンド・レトリーバル登録商標)(Hughes Sound Retrieval)、Qサウンド(登録商標)(Qsound)、スペシアライザ(登録商標)(Spatializer) )でさえ、満足のできないものである。これらの方法によると、三次元の音空間効果が、完全に失われることはなくても、平均的な人間には知覚しにくいレベルまで低下してしまうのである。バイノーラル音響効果がいかに望ましくとも、通常の映画サウンドトラックレコードアルバム、その他の電子オーディオ装置にバイノーラル音響効果を使用しうる態様で真にバイノーラル効果を発揮しうる実際的な手段は開発されていない。

0009

本発明は上記事情に鑑み、現実的かつ知覚容易な三次元の音空間効果を生じせしめる手段を提供することを目的とするものである。さらに本発明は、映画のサウンドトラックや記録媒体、生演奏、その他の商用電子オーディオ機器と便宜的に統合しうる態様でバイノーラル効果を発揮することができる手段を提供することをも目的とするものである。

課題を解決するための手段

0010

本発明による原音声信号において1以上の三次元音空間効果を生じせしめる方法は、所定周波数において1以上の振幅変動を含むノイズ信号を発生させ、前記ノイズ信号を原音声信号に適用することを特徴とするものである。

0011

また、本発明による原音声信号において音空間効果を生じせしめる方法は、空間的失見当を起こさせる刺激信号と原音声信号とを合成し、前記空間的失見当刺激信号が存在している間に、空間的再指南を起こさせる刺激信号と前記原音声信号とを合成することを特徴とするものである。

0012

さらに、本発明による原音声信号において1以上の三次元音空間効果を生じせしめる装置は、所定周波数において1以上の振幅変動を含むノイズ信号を発生させる手段と、前記ノイズ信号を原音声信号に適用する手段とからなることを特徴とするものである。

0013

また、本発明による他の原音声信号において音空間効果を生じせしめる装置は。空間的失見当を起こさせる刺激信号と原音声信号とを合成する手段と、前記空間的失見当刺激信号が存在している間に、空間的再指南を起こさせる刺激信号と前記原音声信号とを合成する手段とからなることを特徴とするものである。

0014

さらに、本発明による1以上の三次元音空間効果のある音声録音は、1以上の原音声信号と、前記音声信号と合成される1以上のノイズ信号であって、所定周波数において1以上の振幅変動を含む1以上のノイズ信号とからなり、前記全ての信号が記録媒体上に記録される、ことを特徴とするものである。

0015

本発明は、空間的な方向を失わせる刺激を人間の聴覚器官に与えて、人工的に取り入れられた空間信号によって、人間の知性による空間的判断(すなわち、「音がどこからやってくるのか」という感覚)を現実に起こさせるようにする新規な方法により、どうすれば三次元の音響効果を生じせしめることができるかという問題を解決するものである。したがって、本発明によれば、基礎をなす原音声信号に、空間的な方向性を失わせる(空間的失見当)背景音響パターンが付加される。この空間的失見当を起こさせる背景音は、以下により詳細に述べるように、好ましくは「グレイノイズ」のテンプレートの形態をとるものとする。グレイノイズテンプレートには、人間の聴覚器官に所望の音空間効果を知覚させるような空間的再指南信号(spatially reorienting cues)も含まれ(または重ねられ)ている。好ましくは、グレイノイズテンプレートの振幅における周波数別の「ノッチ」および/または「スパイク」により、これらの再指南信号がもたらされることとなる。

0016

また、本発明は、方向性を失わせるグレイノイズと再指南信号とをともに含むグレイノイズテンプレートを発生させる。このテンプレートは、その後、必要に応じて原音声信号に付加される。

0017

さらに本発明は、映画のサウンドトラックやその他の音響記録媒体における三次元音空間効果の生成に適用可能なものである。または、生演奏のコンサートやその他の実演用の三次元音空間効果の創造に本発明の方法を適用可能である。

0018

下図面を参照して本発明の実施例について説明する。

0019

図1は本発明による音空間効果を生じせしめる装置の実施例を表すブロック図である。

0020

図1に示す実施例においては、基礎をなす原音声信号に、空間的な方向性を失わせる(空間的失見当)を起こさせる背景音響パターン(「テンプレート」)を付加するものである。このテンプレートには、人間の聴覚器官に所望の音空間効果を知覚させるような空間的再指南信号も含まれている。音楽演奏の録音や映画のサウンドトラック等の原音声信号22は、様々な記録媒体または音発生媒体(例えば、コンパクトディスク装置や磁気テープコンピュータ・ゲーム等から発せられるコンピュータ合成音)から音声源20から発せられる。テンプレート信号26(以下により詳細に説明するように、空間的失見当信号および再指南信号の両方を含む)は、磁気テープ、CD−ROMに記憶されているライブラリ、コンピュータのハードディスクに入っているデータ等のテンプレート記憶媒体24から得られる。

0021

音声信号22に三次元音響効果を付与するために、従来の音響ミキサ(好適な実施例においては、ピラミッド6700(Pyramid 6700)ミキサを使用して成果をおさめた)でも十分な音声処理装置28により、テンプレート信号26と音声信号22とを合成する(すなわち、足し合わせてひとつにする)。あるいは、ディジタル音声処理装置を用いて前記合成作業を行なってもよく、この方法は、下記のようにさらなる信号処理が望まれる場合に有効である。実際には、ディテック(DigiTec)8−70A型8トラックレコーダといったようなマルチトラックレコーダの別々のトラックにテンプレート信号26と音声信号22とを送り、レコーダの出力部からミキシングを行なう方法が便利である。このようにすると、原音声信号の所望の部分に空間信号を同期させる作業が簡便化されるとともに、より複雑なミキシングも可能になる。

0022

この合成の結果得られた合成信号30を磁気テープレコーダやコンパクトディスク・レコーダ、コンピュータの記憶装置等の記録装置34に送って記憶し、後に再生することもできる。別な方法として、増幅器36やラウドスピーカ32といった音声出力装置に合成信号30を送って、直ちに聴くこともできる。このようにして得られる音声出力は、所望の三次元効果を有するものとして聴取者に知覚される。さらに以下に述べるように、前述した装置は、本発明の範囲に含まれる数多くの実施例の内のほんの一例にすぎないものである。

0023

本実施例において、「グレイノイズ」はテンプレート内において一定の空間的失見当信号として機能する。従来技術において周知のように、ホワイトノイズとは、周波数20Hzから20,000Hzまでの全ての可聴音を略等量ずつ無作為に混合することによって人工的に作り出される音であり、それだけを聴くと、ホワイトノイズはヒスノイズ(hissing noise )によく似ている。ここで「グレイノイズ」と呼ぶノイズは、低域周波数の割合が若干高いという点を除けば、ホワイトノイズに類似している。本発明者による実験の結果本発明との関連においては、グレイノイズテンプレートの方がホワイトノイズテンプレートよりも優れた音空間効果を生じせしめるものであることがわかった。グレイノイズについては、多種多様な配合が可能であるが、実験を通じて、以下述べる表と略同じ配合の場合に、最も優れた効果を発揮することがわかった(全ての値について、同じ音量の同等周波数のホワイトノイズの振幅を「Z」とする)。

0024

0025

最大の効果を得るために、このグレイノイズの背景信号は、各々の空間的再指南信号の立上り前に最低約2秒間付与され、かつ前記各再指南信号が停止してから約0.5秒以上持続することとする。

0026

本実施例においては、一定の「失見当信号」以外に、同様に「再指南信号」と呼ばれる一以上の「空間的再指南信号」が必要となる。本実施例において、再指南信号はグレイノイズテンプレート内に含まれている。これと同一の方法として、必要であれば、再指南信号を原音声信号に別途付加してもよいものである。これらの再指南信号のパターンは、これらの信号が好ましくは時間変動信号であり、どんな音空間効果を生じるかによって異なるため、一定なグレイノイズ背景よりも複雑なものとなる。

0027

図2に、所望の「失見当」特性と「再指南」特性とを有したグレイノイズテンプレートの生成方法の一例を示す。図2において、音波発生装置40は、当業者には周知の普通のプログラム可能な音波発生装置であり、必要に応じて増幅器を介して、全域スピーカ45に連結されている。音波発生装置40は、前記表Iに示すグレイノイズを発生させるべくプログラムされている。今のところ、このような目的には、簡単な全域スピーカ(ラジオショックリアリスティック(登録商標)ミニマス−77(Radio Shock′s Realistic Minimus-77)スピーカ等)に連結されたテクトロニクス2642Aフーリエ分析装置に含まれる信号発生器が最も適している。これに代わる方法として、標準ホワイトノイズ発生装置狭帯域高品位ディジタルイコライザセイバインFBX1200(SabineFBX 1200 )等)と併用して、表Iに記載の周波数帯域に所望の強調(emphasis)と抑制(deemphasis)とをかけることもできる。このようなノイズ発生装置およびスピーカについては、これ以外にも多くのものが利用可能であり、かつこれに匹敵する成果が得られるものである。発生したホワイトノイズは、非常にランダムなものであることが好ましい。スピーカ45を直接音発生装置40に接続するよりは、音波発生装置40の出力を録音して、後でスピーカ45から再生するほうが有利であることが多い。

0028

録音主体42は、好ましくは、正常な聴覚を有する人物とし、両外耳道に各1個の小型マイクロホン47を挿入する。センハイザー(登録商標)(Sennheizer)のマイクロホン等、小型のクリスタルラペル・マイクロホンが一般に最も優れた効果を発揮する。所望の音空間効果を生じせしめるテンプレートを作るには、音波発生装置40を作動させ、スピーカ45を録音主体42に対して、所望の三次元効果に対応する相対的な位置(たとえば、録音主体の頭部の上方、後方、前方等)に配置する。また、空間の中を一つの場所から別な場所に移動する移動感を出したい場合は、対応する軌線に沿ってスピーカ45を移動させる。標準のミキサ49を用いてマイクロホン47からの信号を合成して、テンプレート信号26を生成する。テンプレート信号26は、従来式のテープレコーダまたはその他の記録装置であるテンプレート記憶装置24を用いて保存されて、後に再生される。

0029

図1を用いて説明したように、テンプレート信号26を目標の原音声信号と合成すると、三次元効果が発生する。すなわち、音波発生装置のスピーカ45と録音主体42との間の空間的な関係が、目標の音声信号に関する知覚可能な空間効果として再現される。例えば、の録音と、前方に配置されたグレイノイズ発生装置のグレイノイズテンプレートとを合成すると、あたかも聴取者の前方に歌手がいるように感じられるのである。同様に、歌の録音と、聴取者の上方および後方に配置されたグレイノイズ発生装置により録音されたグレイノイズテンプレートとを合成すると、出来上がった音楽は、聴取者の上方および若干後方から聞こえてくるように感じられる。

0030

図2の方法は、有用な実例であるが、本発明の実施例においては、実際に耳にバイノーラル・マイクロホンを装着して、テンプレートを生成する必要はない。その代わりにディジタル音声処理装置を用いると、このようなテンプレートをゼロから人工的に生成することができる。図2の方法を用いて作り出されて実際に実用できたテンプレートのパワースペクトルから、このようなテンプレートの特徴をなす特定の音空間信号が明らかになる。したがって、ただ単に、「空白」のグレイノイズテンプレート(すなわち、前記の表Iに示す成分配合に一致したグレイノイズを数秒間録音したもの)からグレイノイズテンプレートの複製を人工的に作り、次に一組のピーク・ノッチフィルタ、周波数イコライザまたは類似のコンピュータ音声波形処理装置を用いて、バイノーラル録音のグレイノイズテンプレートに示される増減パターンに一致するように、グレイノイズテンプレートを完成させればよい。

0031

本実施例において、このような合成テンプレートは、サウンドボードを組み込んだ従来式のディジタル・コンピュータを用いて生成される。特に、イリノイシャンパーニュシンボリック・サウンド・コーポレーション(Symbolic SoundCorporation, Champagne, Illinois )製のキャパバイラ(登録商標)(Capabyra)ディジタル音声処理装置とカイマ(登録商標)(Kyma)ソフトウェア・システムとを備えたIBM−PC(登録商標)互換機の486コンピュータ装置が有効である。付随のカイマ(登録商標)ソフトウェアは、テンプレート信号の形成および作りかえることが可能な波形編集機能と関連するユーティリティ機能とを有している。このシステムを用いて生成された波形をコンピュータ装置に接続されたハードディスク駆動装置または光学ディスク駆動装置において記憶させることができる。再生する時は、前記システムに、従来のアナログ音声信号が得られる出力ジャックが設けられており、この信号を他の装置に接続してさらに処理したり録音したりすることができる。当然ながら、ここに説明したタスクと同様に適したディジタル信号処理装置が他にも数多く存在する。このような装置は、好ましくは、高調波ひずみが極めて低いものとする。

0032

人工的に作られたグレイノイズテンプレートは、図2の対応するテンプレートと比較して遜色のない効果(以下にさらに詳細に説明するように、より高い効果とは言わないまでも)を発揮し、図2の方法の特徴である「耳にマイクロホンを装着して行なう」バイノーラル録音の問題点を回避することができる。

0033

また別の実施例において、図2との関連で説明したバイノーラル録音のテンプレートを単に適用するだけではなく、むしろさらに鮮明かつ印象的な効果を生じしめるグレイノイズテンプレートを人工的に作り出すことができる。例えば、バイノーラル録音のテンプレート(図2のように作成された)に見られるパワースペクトルの増減プロフィールを単に適用するだけではなく、そのプロフィールの高低域をかなり誇張して、音空間信号が強調された合成グレイノイズテンプレートを作り上げることができる。この方法の場合、図2に示すバイノーラル録音により発生する効果よりも優れた音空間効果が発生することがある。

0034

所望の音空間効果を得るために行なわれる特定のパワースペクトルのプロフィールの設計は、減衰と増幅とをどのように組み合わせれば最も優れた音響効果が得られるかという点で、音声技術者主観的な判断によることが多い。作曲する上で絶対的な「正しい方法」というものがないのと同様に、本発明による音空間効果の創造もまた、個人の好みの問題となる。しかしながら、多種多様なグレイノイズテンプレートを用いて行なった実験を通じて、本発明者は、特定の音空間効果を生じせしめることを目的としたグレイノイズテンプレートを合成するための好ましい技術に関して、いくつかの結論を得るに至った。以下に、これらの結論について説明する。

0035

聴取者がどんな種類の音空間効果を体験するかは、信号の配されている音声パワースペクトル部分によって定められる。すなわち、ノッチやスパイク等、同じパターンを異なるパワースペクトル部分に重ねると、異なる音空間効果が生じるのである。表IIに、研究対象となったいくつかの特定の音空間効果と、表に示す効果を得るために再指南信号が付加されるべき対応周波数とを併記する。

0036

表II
上方: 8,000Hz、500Hz
前方: 16,000Hz、2,000Hz、200Hz
後方: 10,000Hz、1,000Hz
近接: 9,000Hz、9,500Hz
所定のパワースペクトル部分の一つに信号を付加しても、何らかの効果が得られる。しかしながら、関連する全ての部分に適切に信号を付加すると、効果の質が大幅に高まる。

0037

本発明の一実施例において、空間的再指南信号は、グレイノイズテンプレート内において周波数別ギャップ、すなわち「ノッチ」の形態をとるものとすることができる。図3に示すように、これまでなされてきたもの(例えば、背景部分で説明した「選択的減衰」方式)は、図3に「B型」および「C型」としてそれぞれ示す丸形および矩形の波形を持つノッチに注目していた。しかしながら、本発明者は多数の異なる形状のノッチを用いて実験を行ない、試験対象となった全てのノッチのうち、矩形ノッチの効果が最も低いことを発見した。これに対して、「A型」として示す山形のノッチは、近接信号および上方信号に関して最も効果的であり、他方、「B型」として示す丸形のノッチは側方信号と前方信号と後方信号とに関して、より効果的であることがわかった。

0038

本発明の別な実施例において、空間的再指南信号は、グレイノイズテンプレート内において周波数別増大、すなわち「スパイク」の形態をとるものとすることができる。図4に示すように、スパイクは、数種類特定形状をとるものとすることができる。実験を通じて、三角スパイク(図4にX型として示す)は上方信号または近接信号の場合に最も効果的であり、矩形スパイク(Z型として示す)は側方信号と急速な動きに関わるあらゆる種類の信号とに、より効果的であることを見いだした。Y型の頂点の形状は、変更可能である。

0039

さらに、図5に示すように、ノッチを一組のスパイクで挟むと、空間的再指南効果が最大になることが実験的にわかった。これは、人間の聴覚器官の場合には、多くの電子検出装置と違って、特定の周波数の音が存在する時には、その周波数に敏感な音覚細胞がかなり刺激される一方、それに近い周波数に敏感な細胞は抑制されるという事実によるものと思われる。側方抑制として周知のこの効果は、人間が音を知覚する上で重要な役割を果たしている。一般に、ベクシー、G.、感覚抑制プリンストン大学新聞(Bekesy, G., Sensory Inhibition, Princeton University Press)、1967年;ナベット、B.およびプリンター、R.、知覚神経網:側方抑制、CRCプレス(Nabet, B. and Printer, R., SensoryNeural Networks: Lateral Inhibition, CRC Press)、1991年にその詳細が記載されている。したがって、主要空間信号としてノッチではなくスパイクを用いる場合も、スパイクの両脇に隣接した一組のノッチを設けることにより、側方抑制効果を利用して、三次元効果の質を高めることができる。

0040

スパイクをノッチで挟む方法とその逆の方法に関する前記発見は、スパイクとノッチとをどのような形状にするか(図3および4に関する前記説明を参照して最適と判断された形状)にかかわりなく、いかなる場合にも適用でき、かつ音声周波数スペクトルのどの部分に信号を付加するか(表IIに関する前記説明を参照して最適と判断された部分)にかかわりなく適用できる。

0041

さらに、実験結果から、グレイノイズテンプレートを作る時には、グレイノイズテンプレートの「K」(「K」はテンプレートの背景振幅であって、スパイクやノッチの振幅ではない)を好ましくはプログラム素材(原音声信号22)の「M要素」(「M」要素は、下記のように定義される)の約68%〜約78%に維持することが好ましい。理想的には、この関係は、プログラム素材のM要素の変動に伴って実時間で維持されるべきである。ここで、「M要素」の定義を以下の等式の表に示す。

0042

表III
M要素の定義
M={(Z1 ・20)+(Z2 ・10)+(Z3 ・7)+(Z4 ・4)}/40
Z1 =信号の中心周波数の上下1,000Hzの周波数を含む帯域の音量(単位:dB)
Z2 =信号の中心周波数の上下1,000Hzを上回り、かつ前記中心周波数の上下4,000Hzを下回る全ての周波数からなる帯域の音量(単位:dB)
Z3 =信号の中心周波数の上下4,000Hzを上回り、かつ前記信号の中心周波数の上下10,000Hzを下回る全ての周波数からなる帯域の音量(単位:dB)
Z4 =信号の中心周波数の上下10,000Hzを上回る全ての周波数からなる帯域の音量(単位:dB)
また、ノッチとスパイクとを作る時は、好ましくは表IVに示す数式に従うべきであるが、試行錯誤により、これらの変数を前記理想値からいくらか変化させた方がよい場合もある。

0043

0044

本発明は多種多様な音声関連の用途に極めて有用である。例えば、所望の音空間効果を含むグレイノイズテンプレートを事前に録音された(何らかの標準媒体に)の原音声信号に重ねたり、生演奏やコンピュータ合成音(コンピュータ・ゲームから発せられる音等)といった「生」の信号に適用したりすることができる。さらに、所望の場合にはトラックごとに異なるテンプレートを使用して、この手順を個別に実行することができる。例えば、リードボーカルのトラックに前方再指南テンプレートを重ねて、まるで聴取者の前方からリードボーカルの声が聞こえてくるかのようにし、他方、バックコーラスのトラックに後方再指南信号を重ねて、あたかも聴取者の後方からバックコーラスの声が聞こえてくるかのようにすることができる。

0045

別の好適な実施例において、特定の音響効果(たとえば聴取者の後方や上方、下方、聴取者から特定の距離において頭部のまわりを時計方向にゆっくりと移動する効果、その他)を含むグレイノイズテンプレートの既存記録「ライブラリ」をまとめて記憶させておいて、ミキシング技術者が所望の各効果に対してライブラリから特定のテンプレートを必要に応じて選択できるようにすることができる。

0046

さらに、本発明の方法を用いると、映画の全編または望ましいと見なされる特定の箇所のみにおいて、三次元の音響効果により映画のサウンドトラックの臨場感を高めることができる。同様に、これらの同じグレイノイズテンプレートを生演奏に随意に取り入れることも可能である。

0047

さらに、前述したノッチとスパイクとの形成および配置に関する規則を適用することにより、従来技術の装置を用いて生成された音空間効果の質を顕著に高めることもできる。このように、こうした従来技術の装置の場合には、本発明の空間的失見当信号にではなく、原音声信号に直接ノッチとスパイクとが適用されることとなる。

0048

また、本発明の範囲から逸脱することなく、ここに例として示した実施例に種々の変更を加えうることを理解されたい。よって、本発明は、添付の特許請求の範囲以外の制限を受けないものとする。

図面の簡単な説明

0049

図1本発明の一実施例による音声処理装置のブロック図
図2本発明に用いられるグレイノイズテンプレート生成技術を説明するための図
図3さまざまな波形ノッチの形状を示す振幅−周波数グラフ
図4さまざまな波形スパイクの形状を示す振幅−周波数グラフ
図5スパイク2つとノッチ1つとの組合せとして、好適な再指南信号を示す振幅−周波数グラフ

--

0050

20音源
22原音声信号
24テンプレート記憶装置
26テンプレート信号
28音声処理装置
30合成信号
34記録装置
36再生用増幅器
40音発生装置
49 ミキサ

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ