2018/12/04

立体音響のワード

立体音響と言うワードの意味には明確な定義がない。
打ち合わせなどしていても、「立体音響の定義がある訳では無いのですが...」的な前置きをして話し合われる事が多いと思います。
人によって持つイメージが違えば話もまとまりませんね。

一応、アコースティックフィールドでは立体音響関連のワードを、以下の意味として使っています。


- マルチチャンネル再生 -
音の立体感が有る無しに関係無く多数のスピーカーで再生すること。
その音やシステムやフォーマットのこと。

- 立体音響 -
単なるマルチチャンネル再生から没入感ある立体音場まで、幅広い意味での立体的な音やシステムのこと。

- VR音響 -
現実非現実に関わらず本物とは違う何かを本物に置き換えるバーチャルリアリティの要素を持った音やそのシステムのこと。

- 立体音場 -
立体的な空間表現を持つ音場のこと。(システムやフォーマットのことでは無い)

- 3Dサウンド -
立体音場と似た意味だが、それよりもう少し広い意味で立体的な表現が可能なシステムから再生された音のこと。

- 臨場感サウンド -
実際にその場に居る様な雰囲気を持った音のこと。

- 没入感(イマーシブ)サウンド -
実際にその場に居る様な錯覚を持ってしまう音のこと。
臨場感を超えて入り込んでしまう自らの感覚がある。
また、臨場感と違い現実世界の音で無くてもよい。



以上の様に、曖昧であってもある程度は言葉の意味を共有していく必要が今後はあると思う。


2018/11/21

プロダクションのスピーカー配置における立体音場生成

先日のブログで立体音場生成のスピーカー配置について書きました。
InterBEEのゼンハイザージャパン様ブースでのトークセッションで話させていただいた内容を補足した内容でした。



ゼンハイザージャパン様ブース【interBEE 2018 スペシャルセッション】

「立体音響の考え方とアンビソニックスについて / VR X MUSIC 音楽制作における VR 音響の可能性」


自分の時間配分が悪く肝心な所まで話は及びませんでした。
トーク内容として「プロダクションのスピーカー配置では立体音場を作りにくい」と言う所で終わってしまっています。

では、「プロダクションワークのスピーカー配置でどうしたら立体音場生成ができるのか」について書きたいと思います。


Ambisonicsはスピーカーを均等配置に組むことで最もそのサウンドを発揮する事が出来る、と言う事は前回書いた通りです。


以下は、5.1.4chのフォーマットに、そのままAmbisonicsのB-formatをスピーカーデコードした場合のエネルギー分布(右下の赤い表示)です。
左右60度の間にL/C/Rの3台もスピーカーがある前方が極端に暗くなっています。


5.1.4chのエネルギー分布

(分かりやすく説明するためAllRADecoderの設定方法は実際の使い方とは異なります)



「出来るだけ均等にスピーカーを配置する」を考慮すれば、まずセンタースピーカーは必要なくなります。
実際にミックスるエンジニアの皆さんも、狭い範囲に沢山スピーカーがあると難しいと言う事はよくご存知かと思います。

センタースピーカーを外したエネルギー分布は以下のようになります。
少しバランスが改善されました。


センタースピーカーを排除し計算したエネルギー分布


更に、前方のL/Rスピーカーを30度から35度に開き、後方を120度から125度へそれぞれ5度ずつ広げます。
5度変えただけでさらにバランスが改善されたのが分かると思いますが。
これがそのまま立体音場生成の質となるので、臨場感や没入感へと導ける可能性が高まります。


各スピーカーの角度を5度ずつ変更したエネルギー分布


まず以上のとこを踏まえ、Ambisonicsを有効に使い、オブジェクトベースの音をミックスして行くと、よりイマーシブサウンドに近づく可能性が見えてきます。
後は、スピーカーの選択、音響調整など、没入感生成するためにはサウンドエンジニアリングの要素も大きく関わることを忘れてはいけません。


InterBEEのゼンハイザージャパン様ブースのデモ用に制作された「SYMPHONY IN THE NATURE - Satoshi Suzuki」のサウンドも、
森で録音した鳥の声、生楽器、はAmbisonicsで録音されているため、FL/FR/RL/RR/TpFL/TpFR/TpRL/TpRRの8chで再生されており、その他の音は5.1.4の9chで再生すると言うミックスをしています。


SYMPHONY IN THE NATURE - Satoshi Suzuki


さて、プロダクションワークを行うスタジオではスピーカー配置が決まっています。
よって、Ambisonicsに対しセンタースピーカーを使わない事はできても、スピーカーの角度を調整することはできません。
その場合は、サウンドエンジニアリングが重要になってくるわけですが、一つ大きなファクターとして、AmbisonicsのB-formatにおけるWチャンネルの調整と言うのがあります。
B-formatはW,X,Y,Zの4つで構成されています。
X,Y,Zは双指向のアルゴリズムですが、Wは全指向です。
Wの全指向成分で立体音場のバランスを保っています。
このWを0~-4dBくらいの間で調整する事で、音空間の感じ方が変わります。
音素材が環境音であれば、Wを調整することで実際の空間の広さへ近づける事が出来るかもしれません。
これは音源、スピーカーの距離などいくつかの要素によって作られますので、聴いた感じで判断する事になります。
そうした理屈では無いトライも時には必要です。



それでも、下層スクエア4ch+上層スクエア4chのキューブ配置など、立体音場生成をするのに適したスピーカー配置の音には敵いません。
現在では音楽制作において、そうしたスピーカー配置をベースにしたプロダクションンワークも始まっています。
「SYMPHONY IN THE NATURE」の制作をした鈴木理氏も、下層スクエア4ch+上層スクエア4chのキューブ配置の環境を持っています。



一方良い事ばかりでは無く、こうした制作環境での立体音響作品はサウンドインスタレーションには適していますが、フォーマット化されていないため、パッケージメディアや放送、配信に載せることが難しいと言う問題があります。


よって今求められている物が

1つは立体音場を作りやすいスピーカー配置で作品を作り、それをプロダクションワーク配置で再生すること。
例えば、下層スクエア4ch+上層スクエア4chのキューブ配置で作品を作り、5.1.4chで再生するというもの。

もう一つは逆にプロダクションワーク配置で作ったサラウンド作品を、立体音場スピーカー配置で再生すること。

この双方向を考えていかないと、両者の壁は無くなりません。

DVDなどパッケージメディアやホームオーディオのサラウンドアンプで音を出すなら、高度な立体音場作品をプロダクションフォーマットに変換しないと行けないですし、スタジオの5.1chで作った音をパブリックて再生するには会場スピーカー配置に最適変換しないと行けないません。

そうしたクロスフォーマットを単なるダウンミックスの様な手法ではなく、出来る限り作品のバランスを維持して変換する必要があります。


「耳で視る」という新たな聴覚体験を創出する、サウンドアーティストevala氏( http://evala.jp/ )のプロジェクト「SEE by YOUR EARS」の発信拠点となるスタジオは、音とアートと建築の融合をテーマとした、従来の音楽スタジオとは全く異なる音の新たな可能性を探るスタジオです。

ここでは「耳で視る」ための没入感を当然の条件とし、その先で音の可能性を追及しているスタジオです。

このスタジオでは、下層スクエア4ch+上層スクエア4chのキューブ配置での制作はもちろん、その配置を変えずに5.1chや9.1ch、22.2chといった再生が出来ます。
場合によってスピーカー配置を変えてのプロダクションワークも行うことが出来る、非常に柔軟性の高いスタジオとなっています。

詳細は、11月24日発売のサウンド&レコーディング・マガジン 2019年1月号のプライベートスタジオ特集で紹介されています。
https://www.rittor-music.co.jp/magazine/sound-recording/


今後こうした制作環境が増えて行くにつれて、良い立体音響作品も増えていくと思っています。


evala "hearing things #Metronome" (WIRED Lab., 2016)



2018/11/18

立体音場生成に必要なスピーカー配置のイメージ

イマーシブサウンドはスピーカーのチャンネル数や配置で生まれるものではありません。 ハイトチャンネルを加えた再生システムに対しミックスされた音楽を、すべてイマーシブと表するのは違和感があります。 その再生環境で全くイマーシブでないサウンドを作ることは容易に出来る訳で、イマーシブかどうかは作品によるところ。 映像や音楽作品では5.1chや7.1chの水平サラウンドが主流だったところに、ハイト4chを加えた形の増設再生システムなので、スムースな立体音場生成は難しく、イマーシブ(没入感)な音を鳴らすのはなかなか大変です。


まず再生フォーマットがあり、そこからの個別の音を上手く一つの音場として聴かせる




そうしたプロダクション制作とは別の流れで来た立体音響作品やVR音響では、まず立体音場生成を目的として再生システムを考えるので、もともと5.1chなどと言った再生フォーマットの縛りはなく、没入感ある音を鳴らすための最適なスピーカー配置を一から考える事が出来ます。
よって没入型VRのシステム設計において、自ら5.1chを提案したことはありません。


まず表現したい立体音場があり、それを生成するための台数や配置、手法を考える



アコースティックフィールドではよく、下層4chスクエア、上層4chスクエアのキューブ型スピーカー配置を行い作品展示をしていますが、それはフォーマットではありません。 その時に展示している作品が立体的な表現や臨場感、没入感を持つ作品なので、それに合せてスピーカー数と配置を考えた結果です。 立体音場生成のための最もミニマムな構成がキューブ型のスピーカー配置なのです。


下層4chスクエア + 上層4chスクエア スピーカー配置



立体音場を作るにあたり、耳の高さのスピーカー配置の優先順位は高くありません。 下と上に立体配置することが先となります。 その方がイマーシブに鳴らしやすいです。 なぜか、それが自然だからです。 人は日常的に全方位から音を浴びていますが、その状態を最も単純に構成出来るのが下層スクエア4ch+上層スクエア4chのキューブ配置になります。 耳の高さの前方に音があるから通常のL/Rスピーカーが必要、と言うのはチャンネルベースの考えが抜けていないから陥る落とし穴です。 2chの音楽制作においても、L/Rのスピーカーでパンを用いスピーカーの無い位置へ音像を定位させています。 Lスピーカーの位置からだけ音を出そうとミックスすることはまれな事ではないでしょうか? 音は空間に定位させたいのであって、スピーカーに定位させたいわけではないです。 その事を忘れると、とにかくスピーカーの台数を増やそうとする発想になってしまいます。 耳の高さの水平配置に上層を足すスピーカー配置は不自然です。 考えてみてください。 スピーカーが1台あったら、正面に置くのが自然かと思います。 2台なら左右に置きますね。 正面と左といった置き方はしません。 左右のスピーカー配置は縦方向に考えた場合上下となります。 そう考えれば耳の高さと上層だけと言うのはおかしいですよね。 また、耳の高さに上層とさらに下層を足し、天高が無いのに縦に3つのスピーカーを並べているのを見かけますが、立体音場を生成すると言う点から見ると無駄ですし扱いにくいシステムになってしまいます。 左右2chのスピーカーにセンターを足してLCRにすると扱い辛くなるのと同じです。 高さ方向も上中下の3点にしてさらに扱い辛くしてどうするのでしょうか。


5+4chのスピーカー配置のAmbisonics
左下の赤色のマップはエネルギー分布を表示
不均一なのが分かる
(IEM Plugin - AllRADecoder 使用



8chキューブのスピーカー配置のAmbisonics
均一なのが分かる


(分かりやすく説明するためAllRADecoderの設定方法は実際の使い方とは異なります)


均等に配置することが、Ambisonicsを扱う上でも有利な事を、鋭い方はすでにイメージされたかと思います。
アコースティックフィールドでは、長くAmbisonicsやチャンネルベースのミックスなどをこうしたスピーカー配置により混在させ、よりイマーシブな作品作りをサポートしています。


スピーカーの数が増えればそれだけスピーカーを個別に鳴らそうとする。 エンジニアもクリエーターも同じです。
そうなると「たくさんのスピーカーが鳴っている作品」が出来がちでイマーシブにはなりにくい。
逆にスピーカーが少なければ空間を鳴らす工夫をします。 その積み重ねによって作品にも没入感が出て来るのです。 システム側の考えとしては、アーティストが狙った表現を作り出しやすくするために、横方向と縦方向を区別せず同じ考え方をし、出来る限りスピーカー数は少なく、均等で自然な配置を心がけるのが、良い作品作りに繋がると思っています。


次回投稿の「プロダクションのスピーカー配置における立体音場生成」は続編になりますので是非。


2018/08/19

バイノーラルの音楽制作に足りないもの

※この記事は、性能の高い3Dパンナー NovoNotes 3DX が発売される以前のものです。


バイノーラルの音楽制作を考えた場合、今最も必要とされているのが使いやすい3Dパンニングです。

某VRシステム向けに開発した8ch 3D Panner
某VRシステム向けに開発した8ch 3D Panner


立体音響制作では、一般もプロも同じ市販のツールを使い制作するしか他に方法がありません。(一部の人を除き)
しかし実際に制作をした人からは一様に「良くなかった」と言う感想を耳にします。(音が変わってしまう、残響が付き過ぎてしまう、立体に聴こえない、etc.)
アーティストやエンジニアの技量以前にツールによる表現力の限界が先に来てしまっています。
また、使い手がそうしたツールの音しか知らなければ、「こういう音」なんだと思ってしまい可能性を見出せないですし更なる向上も臨めないでしょう。

一つは立体的なパンニング、もう一つはバイノーラルプロセッシング、そのいずれも未成熟であることが原因です。
パッケージ化されていると一つの信号処理として考えがちですが、内部プロセスとしては2段階あるのです。

3Dパンイングとバイノーラル化の2プロセス
3Dパンニングとバイノーラル化の2プロセス

プロもDAW依存でプラグインが無いと制作出来なくなってしまっています。
しかし現状DAWだけで立体音響制作は出来ません。
その意味ではDAWを立体音響制作に対応するよう進化させない限り、本格的なプラグインも開発されて来ないことでしょう。
それにはDAWの開発者が3Dサウンドの制作のノウハウを身に付けなければなりません。
(ちなみに一線のサウンドアーティストは良い道具があれば使いこなす、または自らプログラムすると言った柔軟性を持つ)

2006年の作品「渋谷慶一郎+池上高志 / filmachine」では
コンボリューションシステム「Huron」にインストールされた
SonicAnimatorで音像の全軌道が作られ(プログラムはevala氏)
同時に24音源がリアルタイム処理されていた


ソフトウェア設計者がバイノーラル3Dサウンドとガッツリ向き合い、音の「研究」では無く「感覚」を身に着け磨いていかない限り、今後良いツールは開発出来ないと思います。
まずビジネスを忘れ、ひたすら良い物を追求し開発して欲しいものです。


ではまず、信号の流れの順から3Dパンニングのプロセッシングを考えてみます。

実験用のVRでも無ければ正しいシミュレーション(何度とか距離何mとか)を行う必要は無いので、音楽の中でより効果的な音を表現出来ることが望ましくなります。
例えば距離減衰のパラメータも、リニア(距離の二乗に反比例)だけではなく、減衰カーブを調整でき、同様に周波数特性の変化量も調整できる他、ある距離からは音が近付いても音量が上がらない様に設定するミニマムディスタンス機能等が必要になってきます。
この3つの機能は、ダイナミックな音像移動を表現する上で必要不可欠です。

皆さんご存知のSPATを見ると解るように、3DパンにはVBAP, DVAP, Ambisonicsなど様々な処理方法があり音の表現力が違います。
それぞれ表現に得意不得意があるので、使おうとしているソフトウェアが何をベースにしているのか知っていた方がいいです。
どれが良いかは作品にもよる所なので色々と試すしかありませんが、ここで手を抜くとこの後の処理がすべて台無しになりますのでとても重要です。
もし、試そうとするソフトウェアが、バイノーラルだけでなくスピーカー出力にも対応しているのであれば、バイノーラルで試聴する前にスクエアに4台のスピーカーを配置し、その表現力をテストするのがよいでしょう。
音質、移動感、距離感、など、スピーカーで聴いてダメなものはバイノーラル化してもダメです。あたりまえですが。

より定位が明瞭な方が音の動きはダイナミックになりますが、単にスピーカーをコントロールすると、スピーカー間での単純な受け渡しとなるため、スピーカーの間隔が広ければ音がジャンプして聴こえてしまい、空間で音が移動している様に聴こえず、単にスピーカーを順に鳴らしているだけの音になります。
それを防ぐためにスピーカーの台数を増やし音を繋げていくのが一般的ですが(3mに1台必要と考えられている)、その分コストが掛かるのはもちろん、設置も困難になりますし、スピーカー間での受け渡しである以上スピーカーが鳴っている感覚は否めず遠近の表現も上手く出来ません。
やはり空間に音像を作れないと立体音場では無くなってしまいます。

バイノーラル化するに当たっては、ch数(仮想スピーカー数)が増えればその分処理能力を必要とするため、負荷を減らすために音を犠牲にする設計がされることがあります。
そうなると当然立体感が失われたり、音色が変わってしまったりするわけです。

プロセスがパッケージ化されたソフトウェアでは、仮想スピーカー数がいくつなのか想像する事は難しいと思いますが、少ないにも関わらず音像移動の繋がりが滑らかな処理であれば、バイノーラルのプロセスも負荷が少ないので音に有利に働きます。
そうしたソフトウェアを見つけることが出来るかどうかです。
仮想スピーカー数が多いから良いとは限りません。


残響のシミュレーションはとても大切です。
音像の位置に応じて、残響もシミュレーションされれば空間演出は向上します。
そうした機能は多くあるのですが、逆に残響を付けずに空間表現を行うことが苦手なケースが殆どです。
残響は音の明瞭度を下げ、音色に変化も付けてしまいます。
ドライでありながら空間表現豊かな移動音を作れる空間系パンナーが理想です。
それに加えて残響を自在にシミュレート出来たら最高です。


良い3Dパンニングプロセスが行なえるとして、次はバイノーラルプロセッシングです。
多くのバイノーラルプロセッシングは空気感や存在感を表現するのが苦手です。(本来それが得意で無ければならないのに)
反射や残響により部屋を付加する事での空間演出ではありません。
リアルで極わずかな反射は残響感が少なく、自然な空気感を作り出してくれます。
残響の少ない空間シミュレーションが出来ないと、ドライな音の3Dパンニングが作れませんし、Ambisonics録音の様な環境音をバイノーラル化する事が出来なくなります。
環境音に残響が付加されたらおかしいですよね。
音が変わってしまうモニタースピーカーを誰が買うでしょうか?

もう少し空間に着目して話をすると、市販のバイノーラルプロセッシングでは特に前後が潰れたサウンドになりがちです。
バイノーラルで前後の表現は難しいと言われていますが、簡単な左右にだけ頭外定位をワイドにしてしまい、比較して前後を狭くしてしまっている、とも言えます。
この不均等が人に「空間」を感じさせない要因となるのです。
左右を多少狭くしてでも全方位に出来るだけ均一に音場を作らないと、人は空間として捉える事が出来なくなります。
逆に空間を感じさせる事が出来れば、脳は自然と全てを立体的にイメージし始めます。
なぜなら空間=立体だからです。

横に広いバイノーラル空間
横に広いバイノーラル空間

横に狭くても前後左右に均一なバイノーラル空間
横に狭くても前後左右に均一なバイノーラル空間


すぐにHRTFの個人適応云々と考えがちですが、それ以前に全方位のバランスを整える事の方が重要です。
どのくらい前方に、あるいは後方や左右に音が定位するかなど部分的に着目するのではなく、全体としてどうか、まず空間を感じとれるかどうかに注目すべきです。

どの方位に対しどの位の奥行きを感じるかには個人差があります。
そうした聴こえ具合は、日常生活において個人が自然と補正しているものです。
全方位に均一な立体音場を作っておけば(空間を感じさせれば)、例えば音を左前から右後へ移動させたらそれが自然と感じ取れる能力があります。
例えハッキリそう聞こえなくても、空間での連続した音の繋がりが少なくとも立体的なイメージを人に与えます。
それがまず第一歩です。

極端に左右にワイドなバイノーラルにおいて、音像を頭部から等距離で360度周回させたと思ってください。
真横に向かうにつれ極端に広がって行くため、左右の動きが強調され音が周っているという感覚は逆に得られなくなります。
それでは空間と言う感覚にも至らず、全方位にダイナミックな音像移動(空間パンニング)は作れません。
横に広い事で左右のパンニングの様な音に
横を狭くしても立体感はある


まずは横に狭くてもいいので立体音場をヘッドフォン内に作る事を意識し、次のステップとして空間を広げていく事を考えた方が発展性があります。


質の悪い3Dパンナーは、音が非常に狭い範囲でしか動かない、音が悪く音像が小さい、と言った特徴があります。
その逆が良いツールになるわけですが、音が十分広範囲に移動し、且つ音像が小さくならない性能を出すのは中々大変ことです。
今現在、これとお奨めできるツールはありません。
過去に使って来た優れた3Dパンナーは、すべて強力なDSPを持った専用PCまたはハードウェアベースの製品でした。
ソフトウェアで同等の物を実現するには、かなりのCPU負荷を覚悟しないとなりません。
「プラグインでないと」とか「重すぎる」とか、言っている場合では無いです。


以上の様に、表現豊かな3Dパンナーと、その空間音像をヘッドフォンに生成するバイノーラルプロセッシング技術の向上。
それらが3Dの音楽制作では求められるべきものです。

音がヘッドフォンの外から聞こえる、右から聞こえる、左から聞こえる、後ろから、とか。もう数十年前から言われているような事を今喜んでいては、この先何の進歩も望めません。
もっと違ったレベルで立体音場を捉え制作するべきです。


2018/08/17

AES国際コンファレンス2018後記

8月7日~9日に開かれたAES国際コンファレンスにて、アコースティックフィールドでどの様なデモをしていたのかをまとめておきます。




【協賛企業展示ブース - ヘッドフォン再生でのデモ】

① HPL音源作品の試聴
UNAMASレーベル最新作「Touch of Contra Bass」のHPL9版をはじめとするイマーシブサラウンド作品や、3Dサラウンド野球中継の音源などの試聴。


② ヘッドトラッキング+HPLの試聴
高性能なヘッドトラッキングシステムとHPLを組み合わせ、なめらかで自然なバイノーラルプロセッシングシステムを実験的に構築。22.2ch音源で体験。


③ 3Dパンニングシステムの試聴
極力残響が付加されない、音が変わってしまわない3Dパンナー+HPLのシステムを体験。


【デモルーム - スピーカー再生でのデモ】

① 8k 22.2chのインスタレーション作品、3Dサラウンド作品の試聴。
スピーカー配置のフォーマットや立体音響技術の種類に捕らわれず、トップアーティストが作る最先端の立体音場を体験する作品展示。

② Soundfield SPS200マイクでの録音源を、1次のAmbisonics(B-format)で上層下層4台ずつのキューブ配置と言う最もシンプルにスピーカーデコードし試聴。
基本となる1次Ambisonicsの音を知るためのデモ。





以上のように、かなり自由に多種多様なデモ展示となりました。
一部同様のデモを11月のInterBEEでも行います。
作品を考えればスピーカーの配置や数量に決まったフォーマットは必要ないですが、InterBEEでは分かりやすくフォーマットに沿った展示をするかも知れません。


2018/07/15

立体音響システムの機材選び



立体音場生成に適したハードウェアは少ない。
やはり要なのはスピーカーなのですが、要求を満たす仕様の製品はなかなかありません。

ACOUSTIC FIELDではここ数年、CODA D5-Cubeを使う事が多いです。(7m四方以内の再生環境において)
音は良くパワーもあり扱いやすく、様々なコンテンツに対応出来るスピーカーなので助かっています。
ただサイズが小さいので90Hz以下はあまり出ません。
マルチチャンネルの再生ではリスニング位置において低域が増える傾向にはなるものの、70Hzくらいまでは出てくれるととても楽になります。


CODA D5-Cube


世の中には高性能なモニタースピーカーは数多くありますが、それらは全て2Mix用、あるいは水平のサラウンドをターゲットに設計されているため、高さ方向のある立体音響システムに使おうとすると、調整が難しくなります。

ハイトサラウンドに対応したスタジオでも従来のモニタースピーカーを設置しているところがほとんどですが、要求の高い研究やアーティストが望む質の高い立体音場を生成するには十分とは言えません。

何が異なるのか?
まず左右と同じ上下の繋がりを考慮する必要があります。
それにはスピーカーの指向特性の左右と上下が同じである事、スピーカーの中心一点に音源がある事が問われます。
つまりフルレンジ1ユニットか、同軸2wayと言った仕様となります。
左右と上下だけでなく斜めも当然均一な指向特性が望ましいのでエンクロージャーは球体が理想となります。
そうすれば、リスニングエリアで均一で自然な立体音場を作り易くなります。
スピーカーの設置距離が短い場合は、前面にバスレフポートのあるスピーカーも適しません。


以前マルチチャンネル再生用のスピーカー選びが某所で行われた際、2Mix用モニタースピーカーを選ぶ時と同じ様に1台のスピーカーの音質に担当者はこだわっていましたが、上下の繋がりや多数で鳴らした時のバランスは全く考慮されていませんでした。(すごく縦長のスピーカーがあるなど)
単にマルチチャンネル再生のシステム構築であれば、スピーカー単体の性能を重視し、その1台毎のチャンネル再生の寄せ集めと考えて良いと思いますが、スピーカーの数量を掛け合わせる様に一つの立体音場を生成する立体音響システムでは、スピーカー同士の自然な繋がりを考慮する必要があります。

それによりスピーカーが鳴るのか、空間で音が鳴るのかの違いが生まれます。

最終的にその際は同軸2Wayのパワードスピーカーか選ばれたわけですが、目的から考えて妥当な選択になったと思います。

音楽制作に長く携わってきた現場では、従来の中層+上層と言った高さ方向を無意識にレイヤー化し区別した見方をしがちですが、立体音響システムでは上も下も前も後ろも区別なく同等に扱うことを自然と考えます。


CODA D5-Cube
ONE OK ROCK "LIVE SENSATION" @ SHIVUYA-TSUTAYA
evala "hearing things #Metronome"
evala "See by Your Ears" @ Sonar+D
evala "Our Muse @ Asia Culture Center"
・建設関係R&D数社

KSdigital C5-Coax(生産終了品)
・NHK 22.2ch対応音声中継車SA-1

ECLIPSE TDシリーズ

Anthony Gallo (Gallo Acoustics) A'Diva Ti(生産終了品)
evala "Our Muse & 大きな耳をもったキツネ" @ ICC


Anthony Gallo A'Diva Ti


それから再生環境が広くなればスピーカーも大きなものを使う必要がありますが、そちらは理想的なスピーカーが無く、それ以前に広ければそれだけ立体音場が作りづらくなると言う別問題が出てきます。

空間についてはまた別途書きたいと思っています。


パワーアンプ
マルチチャンネルのパワーアンプはグレートの違いが少なく、価格の違いはパワーの違いによる事が多いと思います。
また、アンプの設置場所=再生場所の場合は、ファンレスのアンプが必要です。
そうなれば選択肢はだいぶ狭まります。
だからと言ってアンプは何でもいい、とは絶対に考え無い方が良く、スピーカーを活かすも殺すもアンプであり、特にマルチチャンネルの場合はチャンネルセパレーションやレベル誤差など、様々な、要素が立体音場の質を崩して行きます。
酷い製品だとそのせいで立体に聴こえなくなる、なんて事も起きますので注意してください。

スピーカーと同じく、再生環境が広くなれば高出力のアンプが必要となりますが、マルチチャンネルアンプの種類は少なくなります。
その場合は種類が豊富な2chパワーアンプを必要台数揃えます。


ファンレス マルチチャンネル パワーアンプ
CROWN CT4150 & CT8150



DAコンバーターやオーディオインターフェースで気を付けなくてはならないのはデジタルのシンク。

トラブルを無くすには、必要とされるチャンネル数を1台でカバー出来る製品を使う事。
つまり12スピーカーのシステムであれば16chの製品を、24スピーカーであれば32chの製品を選ぶと言うこと。

仕方なくDAコンバーターを2台にするのであれば、マスタークロックを導入し、2台にクロックを送ること。
もちろんDAコンバーターの前段の機器にも、それだけでなく全てのデジタル機器にクロックを送ることです。
DAコンバーターをインプットロックで使っても良いですが、その場合は上流の機器から完全にシンクした2つの出力が2台のDAコンバーターへ送られている必要があります。

それでも絶対に大丈夫とは言えないので、その見分けが付かないなら、安全をとってマスタークロックを使った方が良いです。
ちなみに見分けるためにはデジタルオーディオ機器の接続経験とその知識がかなり必要。
インプットとエクスターナルでロックの方法は同じか、リクロックされるのかしないのか、そもそもの性能は。
さらに単体での製品知識だけでなく、製品AやBとの組み合わせはどうか?
それらを経験と知識を持って判断しないといけません。


マスタークロックジェネレーター
TASCAM CGシリーズ


オーディオインターフェースもDAコンバーター同様出来る限り1台で全chをカバーした方が良いです。と言うかそうすべきです。
1つのPCに2台のオーディオインターフェースをUSBで接続した場合、2台のオーディオインターフェース間で極々僅かなズレが発生する事があります。
それは普通に音楽などのマルチチャンネル再生をしていても気付かないと思うレベルのズレです。

過去にとてもセンシティブなシステムを納入する際に気付いたのですが、解決策を見つける事が出来ませんでした。
その時のシステムは12スピーカーを再生するもので、オーディオインターフェースは6chのものを2台使用。
理由はその当時16chのDAコンバーターが高価だったため予算内に収まらなかったから。

この場合、異なるオーディオインターフェースから出力されている隣り合うスピーカー間で、本来の定位から僅かにズレて再生されてしまう事がありました。
これが毎回起動時に確実に起こるのではなく、7割くらいの率で発生する症状で、恐らくUSB接続にある遅延が厳密に安定した値でないからでは?と言う見解にいたり、実際の原因は掴めていません。
これはマスタークロックを使っても改善しません。

他にも複雑なデジタル接続となるシステムで、Ambisonicsの音源が立体的に再生されないと言う事例もありました。
こちらはマスタークロックを使う事により解決。


この様に、複数台のスピーカーで一つの立体音場を生成するには、スピーカーから音が出るまでに起こるチャンネル毎の遅延やセパレーションには気を使うべきです。

一番簡単な方法は、必要なチャンネル数を1台でカバー出来る製品を使い、システムを出来る限りシンプルにする事。

立体音響はシステムを組めば終わりでは無く、狙い通りの立体音場が生成されるために調整を行いますし、サウンドインスタレーションであればシステム設置後に作品制作の時間が必要ですので、システムのトラブルは避けないといけません。
それには信頼性の高い製品を使いトラブルの無いシステムを組むことが重要となります。


ACOUSTIC FIELDでは、オーディオインターフェースに長年RME製品を使用していますが、その理由は信頼性と柔軟性です。
安定したオーディオドライバによる、PCとそのアプリとの動作における信頼性。
TotalMixの機能とデジタル機器同士の接続における柔軟性。
独自開発のStedyClockによるリクロックの恩恵なのか、マスタークロックを使用しなくてもデジタル機器接続のトラブルが少なく、ある程度の融通が利く所(その判断は難しい)も助かります。
あとはサポート体制が整っている事です。


RME MADIface XT オーディオインターフェース
Ferrofish A16 MK-II 16ch AD/DAコンバーター
CROWN CT4150 4chパワーアンプ


オーディオインターフェース
RME MADIface XT
RME Fireface 802
RME HDSPe MADI FX
RME MADIface Pro

AD/DAコンバーター
・Ferrofish A16 MK-II(生産終了)
Ferrofish A32
Ferrrofish Pulse16 MX



今回紹介している製品は、決してハイエンドなハードウェアでは無く、どちらかと言えばエントリークラスの物も含まれています。

チャンネル数が増える立体音響システムでは、ハードウェアの費用が通常よりも掛かります。
予算的に何でも選択出来る訳では無い中、必要な性能を持った製品選びをすることが求められます。
もし、2スピーカーで最善のシステムを組む様に、マルチチャンネル再生用のシステムを組めたなら、更なる没入感レベルを持った立体音場が作れる気がしますが、8ch 150万円で済んでいたものが1000万円とかになってしまうので現実的では無いですね。

音を良くする製品では無く、まずは音を悪くしない製品選びを心がけましょう。


あと最後に、
空間で鳴るような音の表現を作るのはアーティストの能力でありシステムの性能ではありません。
よいシステムは、その制作をより助ける事が出来る、だけです。



2018/07/03

バイノーラルマイク

誰でも比較的気軽に立体音場を体験出来るバイノーラル録音。

自分で楽しむだけであればマイクを自作する事も出来ますし、一方でクオリティを突き詰め高臨場感の作品を制作する事も出来る立体音響の代表格ですね。

今回はそのマイクに付いて、これまでの経験から得た事を書きます。


まず、全てのバイノーラル用マイクに共通となるその目的ですか、それは人が聴く全方位の音環境を丸ごと収める事です。

丸ごとなので、必要で無い音も録れてしまう事になります。

そのことを忘れ、何を作るかに関わらず、立体音響作品だからとバイノーラルマイクを持って来て録音すると失敗します。


野球の試合のスタンドにバイノーラルマイクを置いた場合、良い事はそのままの臨場感を録れること、悪い事は近くにいる人の話し声が一番大きく録れる事です。
それでは放送や録音作品には使えません。(話し声も臨場感ですが)

コンサートを録音する場合、演奏と響きと観客などそのままの臨場感を録れるのは良い事ですが、演奏が聴きづらくても直すことは出来ません。

演奏をしっかり押さえたいのであれば、演奏を録るための録音プランを立てるべきです。
バイノーラル録音がすべてには成り得ません。

また、耳型の付いた物をバイノーラル用マイクだとすると、通常の録音に使うマイクと仮に同じグレードのバイノーラルマイクがあったとすれば、比較すると必ず音は悪くなります。
マイクに障害となる造形物を取り付けている訳ですから当然です。

そうした事もあり、全方位の音を聴く自然環境音の録音には向いていると思いますが、空間の一部にフォーカスして聴く様な音楽録音には向かないと思っています。

単純に良い音で録れないですし、不要な音が多くそれを後から調整する事も出来ないからです。

バイノーラル録音は、全方位の音をすべて聴き感じ取る様な立体音場の表現が必要な際のみ使うようにしています。

その音場の中には不必要な音もあり、それをマスキングするかどうかは聴く人に委ねる場合です。



ではどの様なマイクを使うのか。



イヤホン型

まず、最も手軽に購入出来、気軽に使え楽しめるのが、イヤホン型のマイクです。
最初に買うのはこのタイプのマイクがいいと思います。
良いマイク選びをし、録音に慣れることで、バイノーラルと言うものが何となく分かって来ます。



音質面はそこそこなので、制作にはもっと良いマイクを使いたいですが、テスト録音やマイクを設置出来ない場所での使用に重宝します。
何より常に携帯してフィールド録音を楽しめるのがいいですね。

気になるところと言えば、自分の耳に装着して録音しますので、自分のHRTFになってしまうところかと思いますが、自分以外誰が聴いても立体音場が得られないHRTFの持ち主を除き、他人が聴いてもバイノーラルらしさが無くなる事はあまりありません。

逆に各々のHRTFでの音の違いなど、色々と実験が出来ます。


イヤホン型バイノーラルマイク録音による音源
"Hard Rain and Thunder"
mic: OKM II CXS Solo
recoder: ORYMPUS LS-10



大雨の感じが出るくらいの音量で聴くようにします。
臨場感を得るには適切な音量調整も重要です。
大き過ぎても小さ過ぎてもダメです。

※非圧縮の音源が下記リンクよりダウンロード出来ます。
環境音は圧縮してしまうと音質が大きく落ちてしまう事が比較すると分かります。
これも立体音場生成には重要な知識です。

"Hard Rain and Thunder"非圧縮音源



簡易型

耳型と、そこへ音を伝達させるための最小限の円盤で構成されたマイク。
頭部が無いのでHRTFでは無く、この型のマイクは耳型頼りの製品となります。

確かに、バイノーラルの効果はマイクの位置と耳型がかなりを占めると聞くので、成り立っていると思いますが、あくまでもバイノーラルマイクと言う位置付けをギリギリ満たす性能を確保しつつ、省ける物をすべて省いたマイクだと思っています。

人には顔があり、顔には鼻があります。

正面から受けた音も直接耳に届く音だけで無く、鼻から頬を伝い耳に遅れて届く音も聴いているので、それが無いこの型のマイクで録音された音は、前方と後方の音に奥行きが無く、サウンドも中抜けした様な音になります。

両耳間を樽形状にし多少なりとも音の流れを作ろうとする製品もありますが、やはり前方の不自然さは残ります。

中にはプロ向けに高性能なマイクを使うモデルがありますが、それなりの金額となり、であればダミーヘッドを、高音質録音をしたいなら通常のマイクによる録音をした方が良いと思っています。



ダミーヘッド型

頭部の形状をしたマイクです。
ノイマンが有名ですね。
恐らく以前は計測器用としてのダミーヘッドマイクばかりで、録音用として業務用のレコーダーと簡単に接続できる製品が他に無く、中でもノイマンのKU100が比較的安価であったから、だと思うのですが、現在もこのマイクを愛用するプロの録音家は多いです。

ちなみにダミーヘッドマイクは、頭部だけをモデル化したマイクを指し、胴体も含んだマイクはHATS(ハッツ:Head and Torso Simulator)と呼ばれています。

研究ではHATSが使われることが多く、ダミーヘッドは殆ど見かけません。

KU100を見ると、顔の形状が滑らかでないことが分かると思います。
これは想像ですが、耳へ伝達させる音の量を多くするデザインでは無いかと考えています。
簡易型の円盤部分をより広範囲にしている、と思ってください。
また、頬のあたりにはっきりとエッジがありますが、専門家の話に寄ればこうした滑らかで無い部分では必ず乱れが発生するそうなので、正面から受けた音と横から受けた音の扱いをある程度分けてデザインしているのかも知れません。
この方が斜め前方の定位が出やすいとか... 分かりませんが何か理由があって。


HATSの中で最も多く使ったことがあるのは、Bruel & Kjaerの製品です。
これを使用してのバイノーラル録音、インパルス応答の測定は相当数しました。



写真の様に頭部は意外とリアルな凹凸が無く、滑らかなデザインとなっています。

最近は殆どインパルス応答の測定をしなくなりましたが、過去には自動車メーカー、オーディオメーカー、家電メーカー、通信会社などでインパルス応答測定によるIRを使用したシステム開発を行った事がありますが、いずれも良い結果となりました。
機会があれば事例を紹介したいと思っています。

これら計測器メーカーのマイクは非常に高価です。
インパル応答測定には良いのですが、測定が主となるマイク特性であることが多く、録音に適しているかと言うと、そうとも限りません。
また外耳にマイクが取り付けられたタイプは音質を望めません。
録音に用いる場合は外耳の入り口に口径の大きなマイクが使われている方が望ましいです。


もう少し安価で、手軽に録音も出来、バイノーラルの特性を正確に出せそうな製品は無いかと思っていた所に発売されたのが、サザン音響のダミーヘッドマイクでした。

サザン音響製のマイクは、シンプルで滑らかな凹凸を持った頭部モデルに最小限ではありますが肩周りがあり、一応HATSになります。
肩からの音の反射もバイノーラル録音に置いては影響が大きいので必要だと思っています。(服を着せることもある)
高周波の音源を顔の周りで動かすと、顔の凹凸が感じ取れるくらい滑らかなHRTFをしています。

もともと開発者と面識があったこともあり、色々とお話を伺いSAMREC Type 2700 Pro と言う、マイクとイヤーモデルが変更されたものを購入しました。

48Vファンタム電源なので、プロ用のHAと接続して使用することが出来ます。



バイノーラル録音は環境を丸ごと録るので、その空気感をどれだけ上手く録ることが出来るかが立体音場の質を大きく左右します。
よって、HA選びは大変重要です。

2014年に制作されたハウステンボスの「ナイトメア・ラボ」では、このSAMRECを使い、HAにはSytek MPX-4A、レコーダーにはKORGのMR-2000Sを使いDSDレコーディングしています。
DSD録音の音は生々しさがあることで知られていますが、それは立体音場生成にも同じ様に生きてきます。
作品ではそれをアンビエント素材としてのみ使用しました。下地作り、ですね。
現実の音と現実には無い音を、時には区別させ、時には区別させない様に再生したかったため、サウンドを担当したevala氏の発案でDSD録音までしたわけです。
そうしたこだわりが気付かぬ間の没入感を生む事にもなります。


ダミーヘッド型バイノーラルマイク録音による音源
"ナイトメア・ラボ-テスト録音"
mic: サザン音響 SAMREC Type 2700 Pro
recoder: KORG MR-2000S

DSD音源ファイル(5.6MHz)

PCM音源ファイル(48kHz)

DSD音源を再生出来る人は、PCMの48kHzへ変換したものと比較試聴してみてください。
だいたいこの程度の空気感に変化が出ます。
ただ、元がDSDだと言う事、そしてマイク、HAなどシステムを整えれば、48kHzに変換してもかなりリアルな立体音場を再生できます。

バイノーラル録音用のマイクを使えばVRになるわけではありません。

そしてもう1つ重要なのが再生装置、つまりヘッドフォンなどの選択です。
ハイレゾを意識して高域がやたらキレイな昨今のヘッドフォンは、帰ってリアル感を損なわせてしまう事にもなります。
ヘッドフォンについてはまた別途書きたいと思います。


あらためて最後に、
バイノーラル録音は全方位における頭外定位の音像や場の雰囲気を録る物。

です。

2018/06/19

エンジニアにとっての立体音響制作

今各方面で立体音響制作へのチャレンジが始まっていますが、どの様にして作るのか、よく分からず手探りで進むケースが殆どの様です。

映画やゲームにはサラウンドでのサウンド制作に歴史があり、その制作環境も整っていると言えます。
専用のソフトウェア&ハードウェア、そしてスタジオがあり、すでに多くの作品が世の中に出ています。

では、
VR音響はどうか?
サウンドインスタレーションはどうか?
そして音楽制作は?

それぞれのフィールドの間に明確な垣根はありません。
しかし求められるサウンドは大きく異なります。
極端な言い方をすれば、ゲームやVRで求められるのは"効果"。「後ろから物音がする」とか。
音楽制作ではそれよりも"音質"。「心地よい」とか。

きっと立体音響と聞いて連想する音も各々違うはずです。

自分がどのフィールドに向け、何を作り、どう聴かせたいのか?
目的を定め適切なツールを使い制作していく必要があります。

スピーカー再生にすべきかヘッドフォン再生にすべきか。
そこからです。


立体音響と聞いて、それならバイノーラル録音としか思いつかない人はもはや居ないと思いますが、それに近い状態で、制作に用いることのできるハードウェアやソフトウェアに対する知識は、身についていないのではないでしょうか?

何を作るのか、何が必要で適しているのかを知らなければ、良い作品など出来るわけがありません。


今回はまず、各フィールドにおける立体音響制作の概要をおさらいします。


VRと言ってまず想像するであろう、昨今のYouTubeやFacebookでの360°映像に付加するVRサウンド。
Ambisonics対応のマイクロフォンで収録した立体音場を付加するためのAPIが用意されており、簡単に実現することが出来ます。
プロとして、より質を求めるのであれば、マイクのクオリティには十分気を使いマイク選びをするのは当然の事です。

SOUNDFIELD SPS200
SOUNDFIELD社マイクのエントリーモデル
http://www.acousticfield.jp/product/soundfield_sps200.html

マイクで録音すると言うことは実環境音となりますが、ミックスで音を作りたい場合は、3Dパンナーとモニタリングシステムが必要となります。
Ambisonicsに対応したソフトウェアでは、パンニングからAmbisonicsエンコード、そしてそのバイノーラルモニタリングがオールインワンとなっている製品があります。
結論を言うと、B-formatはパンニングに向きません。3次くらいのAmbisonicsにはする必要があると思います。
いずれにしても、パンニングはチャンネルダイレクトの方がいいです。
また、バイノーラルモニタリングについても、Ambisonicsの音を正しく生成出来るものはありません。(スピーカー再生ですら、ちゃんと生成出来ているシステムは少ないです)
もちろん、YouTubeにアップした場合もそれは同じ事が言えます。
Ambisonicsを調整されたスピーカーシステムで再生した時の、3割程度の音場しか再現出来ていないと思ってください。
パンニングやバイノーラルモニタリングの話はまた別の機会にします。


アミューズメントのVRアトラクションになると少し複雑になります。
非インタラクション系のアトラクションであれば、完パケを再生するだけになるので映画等に近い制作方法になりますが、インタラクションが加わるアトラクションとなれば、リアルタイムのサウンド制御が必要となります。

シーンによって多くの音をリアルタイムに扱う事や、マルチチャンネルでのスピーカー再生への適応、またコンテンツによってはバイノーラルプロセッシングでヘッドフォン再生と、ハードウェアを含め総合的にシステムから構築することとなります。
その場合、市販のソフトウェアは柔軟性に欠けます。
映像など外部システムとの同期をする場合は、その制御信号に対しスレーブで動作するのでソフトウェアの開発も必要となります。
弊社ではCycling'74のMAXを使用し、案件ごとに最適な仕様のシステムを構築する事にしています。
https://www.mi7.co.jp/products/cycling74/

MAX用のAmbisonicsや3Dパンニングのオブジェクトを使い構築するわけですが、代表的なのはambidecodeとSPAT。
パンナーとしてSPATを組み合わせる人が最も多いと思いますが、アルゴリズムの種類とパラメータは比較的豊富に用意されているので、音像を数値的に合わせ込むのは楽ですが、プラスアルファの表現力を求めようとすると融通が利かない所もあります。


VR音響は企業や大学の研究開発用途として古くから納入されてもいます。
こちらはかなり大掛かりなシステムが多く存在しますが、使用するツールは基本的に同じです。
ただし仕様は複雑な物が多く、完成まで数年を要するケースもあります。

R&DではT社「ドライビングシミュレーター」を代表とするインタラクションのVRが多く、アミューズメントではハウステンボスの「ナイトメアラボ」「VRホラーハウス」など、完パケを制作する事が多いように思います。(予算的な理由が大きいと思いますが)
これらの制作についても、いずれ別途触れたいと思っています。)


Toyota's Driving Simulator




ACOUSTIC FIELDで、あらゆるシステム作りに際し常に意識して取り組んでいるのが音質です。
オーディオ的な意味合いでは無く、音質による臨場感や没入感の向上は1ランク上の立体音場をもたらすからです。
よって制作環境も再生環境も音質には十分注意しています。

条件がそろったサウンドインスタレーション程音質を高められる制作は他に無いかも知れません。
なので可能な限り音には拘りたい。その結果作品の質があがるのであれば大変やりがいのあることです。


インスタレーションにおいても制作環境はMAXが多く使われます。
インスタレーションではアーティスト自らサウンドプログラムを行うことが殆どなので、3Dパンニングについてはアーティストが一つのツールに拘る事は無く様々なソフトウェアを併用、あるいは音の軌道自体をプログラムし表現していく事が多い様です。
システム構築の面から見ても、サウンド生成やシステム開発のバランスを考えると今の所MAXがベターです。

Ambisonicsの他、高性能のコンボルバーVSTプラグインを使い、残響やバイノーラルのIRを作品毎に設計し、最適な信号処理を行なうシステムを構築します。
そこが立体音場生成の質に繋がる核となる所です。
高性能なコンボルバーだけでもダメ。IRだけでもダメ。ハードウェアの選定も重要。そしてアーティストのスキル。
すべてが揃った時、最高の立体音響作品が生まれます。

evala / hearing things #Metronome(2016年)は、アーティストのサウンドプログラムとエンジニアの信号処理技術、そして音響システムが高いレベルで融合し3Dサウンドデザインがなされた数少ない作品の一つだと思います。


evala "hearing things #Metronome" (WIRED Lab., 2016)



アーティストのインスピレーションがつくる「音のVR」
https://wisdom.nec.com/ja/technology/2017011001/index.html



そして音楽制作。
数十年かけてハイレゾやサラウンドを熟成させようとしている世界。
ここ数年で、水平だけでなくハイトchが加わり、ようやくスピーカー配置が立体的になりました。
音楽制作では古くからある水平の5chサラウンドに対し、高さのある4chを加えた5.1.4chと言ったフォーマットが今後主流になりそうです。
音楽制作を行う人の考え方として、まず水平で基本の音作りを行い、ハイトには例えば響きを加える、と言ったチャンネル毎に役割を持たせる考え方があります。そこはVRと異なる所です。
正面にサウンドステージがあることを前提とした世界なので、5.1chにしても前に3台後ろに2台、角度も違えばスピーカーの種類も違う、立体音場を生成するには始めから不利な環境と言えます。
また、多くのスピーカーを配置する22.2chを見ても分かる通り、前方にはボトムに3台のスピーカーがあるにも関わらず、サイドと後方には1台も有りません。
要するに、音楽制作では耳の高さより上の世界だけの立体音響制作が行われています。
VRやインスタレーションでは、立体音場を作るためにスピーカー配置を考えますが、音楽制作ではスピーカー配置が先に決まっており、その中でどう制作するかを考えます。


Dolby Atmosの登場で知られるようになったオブジェクトベースと言うスピーカーの配置を意識しない音像定位の考え方も、VRやインスタレーションの制作では古くから当然の事としてやって来ました。
音楽制作ではこれまで、ダイレクトにスピーカーをコントロールするパンナーを使っていたため、空間系のパンニング技術が追い付いていません。
スピーカーコントロールでは、そのスピーカーの距離で音が移り変わるだけなので、立体的な表現力にかけます。
立体とは、前後左右上下だけでなく、遠近が加わる表現を指すからです。
音楽制作においては、3Dパンニングに関して現在これと言ったツールが無く困っている状況です。
VRやインスタレーションの様に、MAXで3Dパンニングのオブジェクトを使い、作品ごとに環境を構築する事は出来ません。
SPATの様なツールが音楽制作の業界でも紹介され始めましたが、サウンドエンジニアには扱い辛いと思います。
3Dパンの音像に思ったような表現力を持たせるのには、かなりの慣れが必要です。慣れたとしても音質には不満が残ることでしょう。

ACOUSTIC FIELDでは、HuronやXite3Dと言った高性能なDSPによる3Dパンナーを使用して来ましたが、その音を知っていると、妥協して今一歩のツールをシステムに組み込むのはモチベーションが下がります。
高性能なハードウェアが生産終了してしまっている今、ソフトウェアベースで色々と工夫をし対応していると言うのが現状です。


Huronが使われたサウンドインスタレーション作品
[Installation]filmachine(フィルマシン) / Keiichiro Shibuya + Takashi Ikegami(渋谷慶一郎+池上高志)




よって、音楽制作ではこれまで培った録音技術やミキシング技術を総動員して制作する方法となります。
それはそれでノウハウが豊富にあるため、それを活かすことは十分に有効です。
臨場感や没入感には音質が重要と話した通り、録音から綿密に計画されたハイレゾサラウンドの作品は大変素晴らしいものがあります。


A.Piazzolla by Strings and Oboe - UNAMASレーベルが描くタンゴの巨匠ピアソラの新たな一面
https://synthax.jp/user-artists/articles/unamas-piazzolla.html

高音質録音がなされた9.1ch等のハイレゾ3Dサラウンド作品は、ACOUSTIC FIELDのHPL技術でヘッドフォン用音源として発売されています。
https://www.hpl-musicsource.com/music


このように、各フィールドは立体音響に対するアプローチ、歴史、目的、そして技術など、様々な違いがあります。
よって、すべてに万能な制作ツールや環境と言った物は存在しません。

ただし、各々のフィールドを知ることで、それを少しずつ取り入れるなどして発展させる事は出来ると思います。
自分のフィールドだけで手探りしていても、新たな事を始めた時にそれまでと同じアプローチでしか行動も思考も出来ず、結果良い作品が出来なかった、と言うことにならないためにも、たまには他の畑をリスペクトしつつ覗いて見ることをお勧めします。

2018/05/16

ラジオの3Dサラウンド放送 2

今回も、
藤本健のDigital Audio Laboratory
「プロ野球のラジオ生中継でリアルな3Dサラウンド! 制作現場を見てきた」
で取材していただいた、ニッポン放送ショウアップナイターでの3Dサラウンド放送についてです。
https://av.watch.impress.co.jp/docs/series/dal/1120234.html


球場ごとに異なる配置の既設マイクから、どの様に3Dサラウンド化しHPLによるリアルタイムバイノーラルプロセッシングを行うか。

前回も紹介した、東京ドームの既設マイク位置と3DサラウンドMixの関係図。



マイクは全部で8本。
それをL、R、C、SiL、SiR、Ls、Rs、TpFL、TpFR、TpRL、TpRRへ振って行きます。
以前はこうした標準のサラウンド配置では無く、内野、外野、など、オリジナルのスピーカー配置によるインパルス応答を作っていました。
例えば内野であれば、左右に開いて高さ的にはミッド。外野であれば、内野よりも中央よりで高さを上げ、距離も遠くすると言った具合です。
今はそれよりも、バランスの取れたスピーカー配置であることと、ミキシングエンジニアにも理解しやすいと言うことで、標準のスピーカー配置を採用し、音の振り分けで立体音場を作る様にしています。



画像の一番上、テープ上に書かれたのがマイク配置とそのch番号です。

そしてHPL Broadcasting System画面内、上段が同じくその入力chです。
各chの信号を下段のサラウンドchへ振り分ける訳ですが、その部分はUIに出していません。
本番中には触らないからです。
ちなみに入力の11chだけ文字を赤にしてありますが、これは実況&解説のchなので、誤って触ってしまい事故にならない様にそうしてあります。

読みにくいですが、テープの記述を見ると、ch3/4の外野スタンドマイクの音を、TpFL/R、SiL/R、Ls/Rsへ送っている事が分かります。
他球場には内野用のマイクがあり、その場合は恐らく外野マイクをLs/Rsに送ることはせず、内野マイクの音を使っていた事でしょう。


当然それぞれの送りのレベルは異なります。
そうして下段の各サラウンドchへ振り分けた後、レベル調整を行い3Dサラウンドのバランスを整えます。
それらはもちろんHPLのリアルタイムプロセッシングでバイノーラル化された音をイヤホンでモニターしながら行なっています。
モニターに使うイヤホンは僕の場合ULTRASONEのTioを使っています。


音もモニターしやすくチャンネルセパレーションも良い。そして装着しやすい。しょっちゅう付けたり外したりするので。
とにかく球場内の音は大きく、ヘッドフォンでは空間音響のモニターは出来ません。

歓声や場内アナウンスなどの音をノイズと呼ぶのですが、そのノイズと別にMixされた実況&解説の1chを合わせた、いわばHPL11+1としています。
センターchがあるのに、実況&解説をそこへ送らないのは、センターchに振ってしまうと声が遠くなり明瞭さが薄れてしまう事が理由です。
放送では必ず声は明瞭に聴かせて欲しいと言うリクエストがあるので、実況&解説用にはノイズ用センターchよりもかなり手前に想定された別のセンターchを作りHPL化しています。
実況&解説は間近に、歓声などフィールドは奥に、と言う音場を作っています。


HPL Broadcasting System画面右側下段には、NoiseとVoiceのグループフェーダーを用意し、試合中、常に実況&解説とノイズの音量バランスを調整しています。


その上にあるGain調整で最終的な音量を調整します。
試合開始前に、基準信号による出力レベル合せを行うのですが、実際に試合が始まってみないと、試合が盛り上がった時にどの位実況の声と球場の音が大きくなるのかが分からないので、ここも試合中に調整する他ありません。
出力段にはリミッターが入っているのですが、ダイナミックレンジは臨場感や立体感を作る要素でもあるので、むやみに上げて良いものではありません。

立体音場生成の仕組みはもちろん、そうした調整があって初めてエンタテインメントとして楽しめる音になるのです。
ここで誤解があってはいけませんが、ミックスやその他の調整をしているのは音の定位で楽しませる事を目的としているのではなく、リスナーに空間を感じさせる事を第一にしていると言う点です。
それが3Dサラウンドにはとても重要であり、ただ立体音響用のツールを使うだけでは不十分で、調整によりその上のレベルにする必要があります。

よって、こうした3Dサラウンド放送が標準化されるためには、ミキシングエンジニアの皆さんに3DサラウンドMixの面白さを分かっていただき、それに慣れてもらう事も必要なのです。


2018/05/13

ラジオの3Dサラウンド放送

先日、
藤本健のDigital Audio Laboratory
「プロ野球のラジオ生中継でリアルな3Dサラウンド! 制作現場を見てきた」
がAV Watchに掲載されました。
https://av.watch.impress.co.jp/docs/series/dal/1120234.html


音の仕事をしている自分とって、音だけで成り立っている放送メディアであるラジオは、色々とやりがいのある素晴らしい世界。
制作現場も手作り感があり親しみ深い。機材にしてもテレビ局にくらべラジオ局のスタジオはとてもシンプル。
だからHPLをすぐに試してもらえたし、そうした思い切った判断が楽しい番組を生むことになる。

HPLがニッポン放送さんの目に留まったタイミングは、FM補間放送、つまりワイドFMが始まるタイミングと重なっていました。
radikoだけでなく、電波放送もステレオとなれば、もうステレオ放送が主に成らざるを得ない。
一度はAMでもステレオ放送を始めてみたものの、すぐモノラル放送に戻って行ってしまったのに...

そうした中ラジオ局がワイドFMを推進して行くにあたり、「(今までよりは)音が良くなります」「ステレオ放送になります」ではあまりにインパクトがありません。
テレビのステレオ放送が当たり前になって何年経っているのか。音楽がステレオになって何年経っているのか。
だからHPLを提案し、「ステレオになります」では無く、一気に「サラウンドになります」にしましょうと。

ご存知の方は殆どいないと思いますが、2015年10月に始まった試験電波によるワイドFM放送内で、【HPL5】The Four Seasons( http://www.e-onkyo.com/music/album/unahq2005h/ )など数曲のHPL音源が放送されています。
自分の作ったHPL音源がラジオで流れる。即ラジオを買いに行き、放送日実際にHPL音源がラジオから流れた時は感動しました。
そして音質こそ落ちているものの、HPLとしての効果は落ちていない事を確認。
それがニッポン放送さんとのHPLを使ったラジオ放送のスタートです。


野球中継を3Dサラウンド放送するにあたり、まず問題なのは放送ブースが狭い事。
そのために最小限の機材でお邪魔する必要があります。
そして通常放送の技術や進行を大きく変えてしまうこと無くその中へスッと入り込む。
新しい試みを形にするにはハードルを下げないと。

よって球場の既設マイクを使い、手荷物程度の持ち込み機材で(実際電車で現場入りした)3Dサラウンド放送にしています。
もちろん3Dサラウンドを考慮したマイク設置、特別回線などの準備をすればとても素晴らしい音で放送出来ると思いますが、有る物を利用しちょっと工夫する程度でも、従来の放送と比較して飛躍的に楽しい音となります。
この事はリスナーの感想を集めると明らかになりますが、しかしやる前は「これでわかるだろうか?」と二の足を踏みがち。
何事も「やって見たら思った以上に楽しんでもらえた」となる事が殆どなのでどんどん挑戦すべきです。
作り手以上に聴き手は感動するもの。


記事中にもあるように、現在は僕が3Dサラウンドミキシングを行なっていますが、もちろんそれをしていては今後の進展はありません。

ニッポン放送さんの場合放送ブースの卓がDante対応なので、プロセッシングを行うPCに使用するオーディオインターフェースをDante仕様にすれば、卓とDante接続でセンドリターンが組め、システムは更にコンパクトになりますし、ミキサーさん自身が3DサラウンドMixを行なえる環境が整います。
後はミキサーさんに3DサラウンドMixの楽しさを知っていただき身に付けてもらえたら、すべての野球放送を3Dサラウンドで放送出来るはずです。




画像は、東京ドームの既設マイク位置と、3DサラウンドMixの関係を示しています。
もちろんマイクの設置位置や本数は球場ごとに違うのでMixも変わります。
サッカーもテストした事がありますが、全く異なります。
それを「大変」と思うか「楽しい」と思うかは熱意の問題ですね。


ラジオは音の文化です。
テレビはやはり映像がメイン。
ラジオの音はテレビより面白いものであって欲しい。


次回、3DサラウンドMixの所をもう少し話したいと思います。


2018/05/11

ブログ始めます

立体音響、立体音場、バイノーラル、3Dサラウンド、VR、Ambisonicsなどなど、
そうしたワードに関わる事、また今後携わる人のために、何か残しておきたいと思い。

ごく一部の人達にはためになるブログ、となる事を願います。

書くことはすべて20数年の経験にもとづく自説です。
なので、偉そうな感じになるかも知れませんがご了承ください。


久保二朗
ACOUSTIC FIELD INC.