ACOUSTIC FIELD blog: 2020

2020/06/12

バイノーラルプロセッシングプラグインを知る -Part2-

Part1では、バイノーラルプロセッシングプラグインの定位や空間表現の違いについて書きました。
A-formatマイクで録音した自然音を使い、Ambisonicsの空間表現をどの程度再現出来ているか3つのプラグインで比較しましたが、今回は音楽を試聴することで音質も含めての比較をしたいと思います。

さて、ここで早速問題が。
環境音と違い、音楽素材は著作権の関係で簡単に扱えない。
出来れば皆さんご存じの、よくレファレンスに使われている音源を使って話を進めたいところですがそうはいきません。

そもそも、サラウンドになるとレファレンスとなる共通の音楽素材の存在自体が無いと思います。

いえ、あります！
自分もエンジニアの一人として参加している”Lenna - Miyu Hosoi”。
22.2chの本作を納めた24chのWAVファイルが、クリエイティブ・コモンズのライセンス下で無料ダウンロードでき、マルチチャンネルの音楽研究等に使用することが出来ます。

詳細はこちら
https://miyuhosoi.com/lenna/

と言うことで、いきなり5.1chや7.1chなどをすっ飛ばして22.2ch音源で検証してみましょう。

Ch数が多い分、ヘッドフォンの音場内でバランスよく再現されているのか、その空間表現が分かりやすいと思います。
5台だけでは多少バランスが崩れていても気にならないかも知れません。
実空間で考えてみてください。
5.1chサラウンドシステムって、結構いい加減に配置されていたりしませんか？
22台もあればちゃんとバランス良く配置しないと隣のスピーカーとくっついてしまいます。
ヘッドフォンの中の音もそれと同じです。

では聴いて見ましょう。
と行きたいところですが、せっかくなのでPart1と同じプラグインを使いたいですよね。
NOISE MAKERSはBinauralizer Studioと言うプラグインがあり、22.2chをバイノーラル化出来るのですが、IEMはAmbisonics用プラグインなのでそうしたツールはありません。
ですのでここは前回と同じくAmbisonicsからのバイノーラル化で比較して行こうと思います。

まず、Lennaの24ch音源をIEMのMultiEncoderプラグインでAmbisonicsエンコードします。

IEM MultiEncoder - 22.2chをAmbisonicsエンコード例

この様に22.2ch全てのスピーカー配置を入力すれば、Ambisonicsエンコードすることが出来ます。
今回は音像が多いので、Ambisonicsは3次にエンコード（Ambix SN3D）します。
3次であれば対応したソフトウェアも多いと思いますので、皆さんの環境で同様の比較が出来ると思います。

Lenna 22.2ch音源 → 3次Ambisonics → 比較するバイノーラルプラグイン
と言うプロセッシングの流れになります。

Biduleでの接続例

ではまず基準として、LennaのHPL22 Ver.を聴くことにします。

この音源はもちろんAmbisonicsエンコードしたものではないので、今回試聴するプラグインの音がまったく同じ様に聞こえることはあり得ないのですが、Ambisonicsであろうがチャンネルベースであろうがスピーカーで再生したならば空間があるわけで、それをバイノーラル化しているという部分は比較対象として成立します。

ちなみに、ここで聴いていただくLenna HPL22 Ver.はリリースされているものではなく、この記事のためにクリエイティブ・コモンズライセンス下の同じ22.2ch音源を使いHPLプロセッシングしたものになります。

リリースされたLenna HPL22 Ver.を聴いてみたい人は検索してください。
Spotify等で無料で聴くことも出来ますが、最も音質の良いのはOTOTOYなどで販売されている96kHzサンプリング版のLennaになります。
https://ototoy.jp/_/default/p/392431

それでは試聴を始めます。
聴きどころは、
一番初めのフレーズがフロントセンターで鳴りますのでその音質、音色、定位、奥行き感など。
そこから前方を中心に広がる残響の感じ。
その後の主に前方から真横までの空間を使って展開される音の定位感などになります。

※ブラウザのプレイヤーで再生される音源ファイルはMP3(320kbps)です。
download linkの音源ファイルはWAVファイルとなっています。

基準音源 - Lenna HPL22 Ver.
download link

それではまずAmbiHead HDを試聴します。
ここで分かったのですが、3次AmbisonicsではWidthを50%にすると空間が狭くなってしまいます。音も極端に悪くなります。Widthって何をしているのでしょうか？
そこは置いておき、今回はとりあえず試聴した感じ良さそうだったWidth=100%にしました。

22.2ch > Ambisonics > AmbiHead HD Binaural
download link

ちょっとこもった音になります。
1次のAmbisonicsで環境音を聴いていた時は気にならなかったものが、音楽では気になります。
試しに1次にしてみましたが、多少クリアになるものの似た傾向でした。

前方定位はいかがでしょうか？
本物より近いですよね？

最初のフレーズからの残響までで、本物には前方に空間が感じられます。
後半になり聴き慣れるにつれてAmbiHeadの音場が横に細長くなっていることが見えてくると思います。

少し話がそれますが、バイノーラルをテストする時の聴き方として、ひとつに「この音源は立体的だ」と信じて聴く、と言うのがあります。
疑って否定的な聴き方をしては何を聴いてもそう感じなくなります。

「この音は前方にある、前方には空間がある」と言い聞かせながら聴いた時に、それでも前方に対する奥行きを感じることが出来なければ、それは実際に無いのだと思います。

また、パッと聞いて判断するのもやめましょう。
普段体験していない音を脳が受け入れるのには時間が掛かります。
何度も聴き返すことが大切です。
パッと聴いて「わかった」と言う人は、実際は正しく解ってはいません。

それでは次にIEMのBinauralDecoderです。

22.2ch > Ambisonics > IEM Binaural
download link

AmbiHeadよりもさらに近いと思います。
音はクリアですが、かなり左右に広がった音場であるために、角度的に開いていない音（2Mixで言うとセンター寄りの音）は頭内定位し始めていて、言うなれば普通のステレオサウンドに近づいている音だと思います。

理想を言えばヘッドフォン内の音場が均一な全球体となれば良いのですが、左右二つのスピーカーユニットだけでは限界があります。
出来る限りそれに近づくようなバイノーラルプロセッシングを行う必要があります。

バイノーラルによるヘッドフォン音場の理想（2chの場合）

しかし殆どのバイノーラルプロセッサーは前後の空間表現が極端に悪く疎かになっています。
これは人が前後に敏感ではないことだけでなく、バイノーラル技術として足りてないものが多いということです。

左右が誇張されたヘッドフォン音場

いかがでしょうか？
中には同じ様に感じなかった人もいると思います。
一人一人聞こえは異なるのでそう言うものです。
そもそも他人がどう聴いているかなど分かり得ないことです。

個人のHRTFを用いたとしても、多少定位が改善される程度で、IEMの前方定位感がオリジナルのLenna HPL22 Ver.になることはありません。
それぞれのプラグインの欠点が多少改善される、と思ってください。

他人のHRTFを使うと極端に定位が悪くなる可能性はありますが、平均化されたダミーヘッド等で作り出されたHRTFを使っている限り、極端に定位が悪くなることは無いと思います。
「HRTFが自分に合っていない」からそのプラグインが良くないのでは無く、それがそのプラグインの基本性能と考えるのが自然です。

今回使用したプラグインはいずれもHRTFにNeumann KU100が使われています。
他のプラグインでもこのHRTFを使っているものは多い印象です。
このダミーヘッドは比較的音楽録音に適しているとされていますが、頭の形状から分かるように滑らかではありません。
これは恐らく側面からの音を耳のマイクまで効率よく回析させそうに見えますが、前方からの音が耳までたどり着く経路は不自然です。
その辺りが前方定位の弱さに繋がっているのでは？
と言うのは自分の憶測です。

IEMはAmbisonicsの計算をきちんと行い、それをシンプルにNeumann KU100のHRIRでプロセッシングしているイメージがあります。
なので音は良い。ただNeumann KU100のHRTFの特性がそのまま出ている。

AmbiHeadはそれ以外に何かやっている。よって音が変わってしまう。

こうした推理はいかがでしょう。

いくつかのプラグインの性能を知っておくことで、新たなプラグインを試すときの目安になりますし、初めての制作環境で使われるソフトウェアのバイノーラルの質を把握することも出来ます。
それによってMixのやり方を変えるなど対処も出来るようになります。
音楽制作の現場ではそれが大事です。

さて、ここからは余談なのですが、

サラウンドでミックスされた音源がバイノーラル化されヘッドフォンで再生されたとき、それが正しいかどうか普通はスピーカーとの比較となります。
それだと異なるプラグインを使ってバイノーラル化の試聴をしても、どちらがより正しいのかの判断は正確には下せません。

ヘッドフォンは音を出すスピーカーが2つしか無く、それを耳に装着しているわけですから、実空間よりも狭く感じるのは当然です。スピーカー再生と同じ、と言うことにはなりません。
同じにはならないのですから、ヘッドフォンの音場として良いのはどのプラグインなのか、判断は経験を積まなければ難しいかと思います。

しかし！
Lennaの音源ならばそれが分かります。

なぜなら、LennaはヘッドフォンMixで作られているからです。
HPLプロセッシングを使用し、22.2chをバイノーラルモニタリングしつつMixしています。
そのバイノーラル音源は、そのまま”Lenna HPL22 Ver.”としてリリースされました。
且つ、そのHPLプロセッシングされる前段の状態、つまり22.2chの音源がそのままスピーカー再生用としてMixし直されること無くリリースされているのです。

つまり、Lennaの22.2ch音源をバイノーラル化したら、Lenna HPL22 Ver.とまったく同じサウンドになるべきなのです。
この様に明確な正解があるので、Lennaの22.2ch音源がプラグインを通過した後の音が、Lenna HPL22 Ver.にどれだけ近づくかでそのプラグインの性能を判断することが出来てしまいます。

と言ういじわるです。

では検証してみましょうw

22.2chをバイノーラル化出来るプラグインとして、NOISE MAKERSの”Binauralizer Studio”を使用し検証を進めます。
https://www.noisemakers.fr/binauralizer-studio/

Binauralizer Studioは、2chから22.2ch までのフォーマットをバイノーラル化出来る優れた仕様のプラグインです。
これでMixのモニタリングが出来たら大変便利です。

22.2ch > BinauralizerStudio Binaural
download link

先ほどのLenna HPL22 Ver.と聴き比べてください。

基準音源 - Lenna HPL22 Ver.
download link

いかがでしたか？
やはり空間が狭く立体感がちょっと薄いですよね。

やれる人は是非Lenna 24chファイルを使って、バイノーラルチャレンジして見てください。

22.2chのハードルが高い人は、Binauralizer Studioもそうですが、2chをバイノーラル化しても検証は出来ます。
2ch音源でしたら普段聴いている音源ですので、Binauralizer Studioがどんな音質なのか、すぐに分かると思います。
同様に様々なプラグインを比較試聴し考察してみてください。

HPLの2chも無料でプラグインを配布しています。
是非お使いください。

HPL2 Processorプラグイン
https://www.hpl-musicsource.com/software

※HPL2Processorプラグインの無料配布は終了しました。

現在はNovoNotesより、さらに音質向上されたHPL2Processorプラグインが発売されています。

https://novo-notes.com/ja/hpl2-processor

さて、最後に自分の興味でテストしてみた音を載せておきます。

これは、最初のテスト同様Lennaの24ch音源を一旦Ambisonicsエンコードし、その後でHPLによりバイノーラルプロセッシングした音になります。
一度Ambisonics化してしまっているので、Lenna HPL22 Ver.と同じにはならない分けですが、同じ性質を持つHPLプロセッシングだとどう表現されるのか？
参考までにご視聴ください。

22.2ch > Ambisonics > HPL Binaural
download link

いかがでしたか？

Ambisonicsエンコード時点でちょっと問題があるように思いました。
そのあたりはまた別の機会に。

-使用音源-
Lenna 22.2ch（24ch 48kHz 24bit PCM）

-制作チームクレジット-
Lenna(2019)
Concept&Voices&Recorded: 細井美裕
Composer: 上水樽力
Mixed: 葛西敏彦(studio ATLIO), 蓮尾美沙希
Mastered: 風間萌(studio ATLIO)
Recording assisted: 飯塚晃弘(studio ATLIO)
3D Audio Designer: 蓮尾美沙希
3D Sound System: 久保二朗(株式会社アコースティックフィールド)

2020/06/04

公共空間での立体音響調整

公共空間は音響としては整った場所ではありません。
基本的に残響が多すぎます。
そんな場所でもスピーカーの数と配置をよく考え、そして調整を行えば十分に楽しめる立体音場を作ることが出来ます。
普段どの様な調整を行っているのか？詳細ではありませんがポイントを記述したいと思います。

スピーカーなどの音響調整が済んでいたとして、
まず中心に立って前後と左右の音の違い、音量差を確認。その後上下の関係も同様に確認し微調整します。
この時測定結果にこだわり過ぎると失敗します。
上下のスピーカーを鳴らしてその中間に定位するか？音色変化は？などを聴いて調整。
前後左右上下に均一な音場を作るイメージで。

例えば、左前のスピーカーと左後ろのスピーカーだけ音を出し中間に定位するか？
次に左前のスピーカーと左前上のスピーカーから音を出し中間に定位するか？
不自然な音色変化は無いか？

空間が広ければ、下のスピーカーよりも上のスピーカーの音は小さくなるので音量を上げる訳ですが、上げ過ぎると立体音場のバランスが保てなくなるので、完全に均一を目指す必要はありません。
どの程度上げるか？最終的には作品を聴いての調整となり、結果的に+2dB程度であることが多いです。

あと、ディレイは入れません。
ここで言う立体音響は没入感ある立体音場を作れる環境を対象としているので、広さ的には20m四方以内と思ってください。
もっと広い空間でのサラウンドは没入型にはなりません。

各スピーカーからの出音が大体揃ったらレファレンスの音源を再生し、いつもの立体感になっているかを確認。
問題無ければ最後に音を整えていくわけですが、基本的には重たくなりがちな帯域（250Hz付近）を少し抑えたりロー（80Hz以下）を抑えたりしてスッキリさせます。

マルチチャンネルの場合、全てのスピーカーで同じ帯域を1dB下げるとかなり音は変わります。
場合によっては、下層のスピーカーだけとか、上層のスピーカーだけを調整すると言ったことを作品を聴きながら調整していきます。
それらが作品の持つ空間表現の調整となり、いわゆる空間がアル、ナイがここで決まります。

そして最後にサブウーファーをどの辺りの周波数からどの程度入れるかを決めます。
サブウーファーの帯域調整によっては、せっかく整えた空間表現を台無しにすることになります。
空間を残したまま必要なローを出す周波数ポイントとカーブを見つけてください。

それから最後に一番大事なのが全体音量です。
その作品の持つ立体音場、没入感を再生するに最も適した音量を見つけてください。

2020/04/09

バイノーラルプロセッシングプラグインを知る -Part1-

ゲームは以前からそうでしたが、最近は音楽制作用途でもAmbisonicsを取り入れたソフトウェアが多くなりました。
そこにはバイノーラルプロセッシングのツールも用意されていますが、何も知らずにそれらを使うことはキケンです。

どのソフトウェアのバイノーラルも信号処理は同じだと思っていませんか？
それは大きな間違いです。

Ambisonics用のバイノーラルプラグインには、Ambisonicsからデコードする技術とその後バイノーラル化する技術の2つが絡んでいます。
数種類あるAmbisonicsのエンコードからいかに信号を受け継ぎバイノーラルプロセッシングを行うか？
またどの程度のバイノーラルの技術があるか？
各ソフトウェアがここ数年での取り組みであることから、その完成度はまだ浅いことが想像できます。
自分の使っているソフトウェアのバイノーラルプロセッシングの質はどの程度なのか、それを知ることにより、例えばバイノーラルプロセッシングだけ他のソフトウェアを使うと言った、より良い制作のための判断が出来るようになります。

もちろんバイノーラルプロセッシングにはHPLをお薦めしたいところですが、~~今日現在誰もが使えるツールではありません。（近々ハードウェアが発売されますが）~~
※その後HPLバイノーラルプロセッサープラグイン NovoNotes HPL Processor、ハードウェアの RA-6010-HPL

NovoNotes 3DX

などが発売

そこで今回は、誰でも使用することが出来るAmbisonics用の2つのバイノーラルプロセッシングプラグインについて、自分が思う問題点を解説しますので、皆さんが使用しているソフトウェアのバイノーラルの音と比較してみてください。

では、まずはNOISE MAKERSのAmbiHead HD です。

AmbiHeadはHRTFを選択できますが、今回はNeumann KU100のHRTFを使います。
それが一番良いので。（その他がダメなので）
Bass BoostはもちろんOffです。
InputはとりあえずAmbixにします。

下記の無響室で録音された女声アナウンスのモノラル音源をバイノーラル化して見ましょう。

※音源はMP3です。目的上音質を考慮しダウンロードしての試聴をお勧めします。

Anechoic source
download link

IEM Plug-in SuiteのMultiEncoderを使いAmbisonics化（1次）し、その出力にAmbiHeadを接続しバイノーラルプロセッシングしました。

AmbiHeadの問題は、Widthの初期設定が100%になっていることです。
これが実はワイド過ぎるのです。

Width 100%の設定のまま、MultiEncoderで音声を0度（正面）に定位させ、数秒してから左30度に切り替えた音を作りましたので聴いて見てください。
立体感とかは考えず、注目ポイントは何度くらいに聞こえるか、だけです。

download link

いかがでしょうか？
左過ぎませんか？
左90度と言われても疑わないかも知れません。

次にWidthを50～55%に設定し、同じく0度から左30度に切り替えた音です。

download link

まず0度の音に少し芯が出ているのが分かりますか？
Width 100%だと中抜けしているわけです。
30度の音は「まぁこの位かな」と言う定位ではないかと思います。

左回りに音を1周させてみましたので、音の繋がりも聴いて見てください。
音が周っているか分からないかも知れませんが、ここでの注目ポイントはそこでは無く、音像移動が自然かどうかです。

ではWidth 100％の音です。

download link

Width 100%では、すぐに音が左右どちらかへ大きく動き、左右90度に近づくにつれ音が極端に大きくなります。
この様な設定だと、特にヘッドトラッキングを行った際には、頭を回したときの音が左右に行き来するだけの立体音場とは言えない空間表現となり没入できません。

Widthと言う機能が、空間を前後左右上下ともに拡げると思っていませんか？
この機能は左右を拡げる機能です。
左右を拡げると、Ambisonicsのアルゴリズムでは前後が狭まります。

このWidth設定は、100%にしてしまうと「前後の奥行きを捨てて左右の広がりをとにかく重視した音」になってしまいます。
これではマイクで全方位を録音していたとしても全く再現されません。
前後にとても薄っぺらな空間が生成されるだけです。

ちなみにWidth 50%で1周させた音はこのような感じです。
音像移動が自然なのは分かると思います。

download link

AmbiHeadにはこうした設定があるのでまだ良いのですが、次に説明するIEM Plug-in SuiteのBinauralDecoderには設定が何もありません。

IEMのBinauralDecoderも、HRTFは同じNeumann KU100のHRTFが使われていますので、IEMの方が低域がスッキリしてはいますが音のキャラクターはほぼ同じです。

同様にしてIEMのMultiEncoderからBinauralDecoderへ接続し、0度から左30度に切り替えた音を作りました。

download link

AmbiHeadのWidthを100%近くにした様な音と非常に似ています。

ただ、それを変更する設定は何もありません。

唯一設定できるのが、ノーマライゼーションのSN3DとN3Dの切り替えのみ。
試しにN3Dにして同じ録音を行うと、過度なワイド感は無くなりますが前後は少し狭いと思います。

download link

なぜか現在では、Ambisonicsフォーマットの基本がAmbixのSN3Dらしいのですが、その理由は分かりません。

~~Ambisonicsをスピーカー再生してみても、SN3DはN3Dよりも左右の広がりが出ます。~~
~~バイノーラルプロセッシングほどでは無いのですが、自然な音からは離れていく感じがするのであまり使いません。~~ 追記(2020.05.18):一概にそうとは言えずアプリとその設定にもよる。

SN3DやN3Dのことを知りたい人は、以下のページに説明がありますので参照してください。

https://en.wikipedia.org/wiki/Ambisonic_data_exchange_formats

Ambisonicsでは、ソフトウェアによってアルゴリズムが微妙に違うことがあるため、調整の出来ないバイノーラルプロセッシングは要注意です。
Ambixに対応しているからそれを選択しておけば安心と言う話では無いのが難しいところで、SN3DでエンコードされたものはSN3Dでデコードした方が良さそうには思います~~が、しかしそれが正解かは分かりません~~。追記(2020.05.18):その後のテスト結果からSN3DエンコードならSN3Dデコードすべきと思っています。
ですので耳で判断してください。

ここまでは単純な定位感について試聴しましたが、ここからは空間表現について考えてみます。

A-formatマイクは1ポイント録音であるため、Ambisonicsのスピーカー再生の音は空間表現が豊かです。
「空気感」などと言いますが、そうした感覚が得られれば得られるほど没入感は増していきます。
それをヘッドフォン内でもなるべく実現したいところです。

ではまず、ザワザワしている体育館の録音素材がありますので、それを聴いて見ましょう。

マイクはSoundField SPS200です。
A-formatからB-formatへの変換プラグインは、今回AMBEO A-Bフォーマットコンバーターを使いますが、この変換プラグインに何を使うかでも音は変わります。
しかし今回はそこには触れずに進みます。
そしてバイノーラルプロセッシングはHPLで行いました。
この音をレファレンスとします。

ここでの注目ポイントは「空間」を聴くことです。
数か所での会話やシューズのキュっという音の響き方から、空間的な存在感（定位では無い）や前後左右上下の奥行きなどを聴きます。
ここからはとても繊細な音の試聴になりますので密閉型ヘッドフォンをお勧めします。
短い音源なのでまず10回くらいは繰り返して隅々まで聴いてください。

download link

では、AmbiHeadのWidthを100%に設定した音を比較してみましょう。
1回聴いてすぐに、先ほど書いた「前後にとても薄っぺらな空間」と言うのが分かると思います。

download link

これをWidth 55%にすることで空間が生まれてきます。

download link

さらに、AmbixをFuMaに変えてみました。

download link

いかがでしょうか？
違いが分かりますか？

いずれにしてもWidthを100%では、録音されているはずの空間が失われていることが分かったと思います。
Width 55%でも、若干ですが全方位の奥行きがレファレンスよりも弱く、高域も少ないことが分かります。
この辺りが音質の違いです。

さて、IEMはどうでしょうか？

SN3D設定ではAmbiHeadのWidth 100%と同じく、前後にとても薄っぺらな空間になってしまいます。

download link

N3D設定の音も聴いてください。
SN3Dよりは前後の空間が生まれています。

download link

いかがでしょうか？

AmbiHeadとIEMでは同じHRTFが使われていますが、Ambisonicsとそこに加えられる機能のアルゴリズムにより、また今回だとAMBEOのAmbixのSN3D（恐らく）との相性などにより、バイノーラル感は変わることが分かったと思います。

これらの音は皆さんの環境でも同じプラグイン構成にすれば再現出来ますので試してみてください。
その音をレファレンスとすれば、他のソフトウェアのバイノーラルプロセッシングの良し悪しを判断できるようになります。

もう一つ、滝の音を試聴したいと思います。
川や滝の音はそれだけ聴くとザーっと言うノイズみたいなものです。
しかし自然の音なので、必ず空間があるはずです。
はじめ枝を踏む音も聞こえます。それらと共に空間を探してみてください。
前方の奥行きと上下の広さが比較的わかりやすいかも知れません。
マイクはRODE NT-SF1です。

まずは、AmbiHeadのAmbixでWidth 100%です。

download link

AmbiHeadのAmbixでWidth 50%です。

download link

AmbiHeadのFuMaでWidth 50%です。

IEMのSN3Dです。

IEMのN3Dです。

最後はHPLです。

いかがでしたか？
今回は環境音でしたが、音楽素材で比較すると音質によりまた新たな違いが見えてきます。が、今回はここまでにします。
音楽を配信するようなケースでは、音質に気を配る必要があるのは当然。
それはまた別の機会で。

2020/04/01

サラウンドの座席配置の考え方

スピーカーを使用したマルチチャンネル再生のイベント等で、座席を隅までパンパンに並べているのを見かけますが、通常のチャンネルベースで制作された作品の場合、正しく音を聴けるのは中心の1席だけです。
それは22.2chのようにスピーカー数が増えようとも一緒です。

そうならない様に色々と工夫をする訳ですが、すでに完成された作品を再生している場合はそれも難しく。
とは言え客席の中央で音を確認して、あとは席を並べるだけで「端の席は仕方ない」と考えてしまうのは、作品に対してのリスペクトが掛けていると思います。

自分の関わる作品もやはり中心が最も良い席ではありますが、座席位置による極端なミックスバランスの変化が起きない様に注意を払い、中心から端に行くに連れ少しずつ音が変化する様な調整を心がけています。
そして作品が成立しなくなるほどミックスバランスの崩れる位置には座席を設けません。
設けなくてはいけない場合も「いやだー」と主張します。

当然中心と端とではミックスバランスはかなり変わりはしますが、その席なりに楽しめるサウンドにすることは出来ます。

これはミックスの仕方とスピーカー配置、音響調整など総合的な工夫となりますので、それに関わる全ての人にその意識が無いと達成されません。
そのことについては簡単に書ける内容では無いので、今回はサラウンド作品の試聴位置について考えたいと思います。

スピーカーに囲まれた中心が最も良いリスニング位置と言う考えは皆さん持っていると思いますが、謎なのがその中心から椅子を横に並べ始める行為です。

4席であればこの様に。

8席の場合はどうでしょうか？
前列4席、後列4席、と並べられていると思います。

なぜ？

自分の場合、4席ならこう。

8席ならこう並べます。

均等にスピーカーが4隅にあり、そこから同じ音が出ていたとするなら、すべての音が同じ大きさで聞こえるのは中心です。
そして放射状に広がりを見せると思いがちです。

しかし人は左右に敏感です。
左右のズレは誰でも気になるもの。
そして前後は左右に比べて曖昧だったりします。
なので、出来る限りリスニングエリアは横に広げない方が良いです。

また広がっていった先にスピーカーが有るか無いかも関係します。
出来るだけスピーカーには近づかないこと。

インビジブルシネマ「Sea, See, She - まだ見ぬ君へ」evala（See by Your Ears）を例にとると、この様になっていました。

120席の配置

中心の最も良い位置から、外に行くにつれて徐々に変化するようにサウンドを調整したいので、座席はスピーカーに対し均等な距離を保つことが重要です。

スピーカー配置に対するサラウンドの有効な範囲のイメージ

さらに言うなら、50名に対し100席用意するのも良くありません。
何故なら端に座りたがるからです。
ちゃんと聴いてもらいたいなら、なるべく無駄な椅子を置かないこと。

座席が多すぎた場合、安易に前後の1列を削ろうとせず端を削ります。

まずは両端1列

両端1列を削り100席に

次に削るのはここ。

角の席を削り88席に

実はSea, See, Sheの上映では、少しでも良い音体験をしてもらおうと、スタッフにより毎回椅子の数を調整し対応していました。
そうしたチーム一丸となっての作品を扱う姿勢は本当に素晴らしいと思います。

今後椅子を並べる際は、作品の事、聴く人の事をよく考え並べてみてください。

ここまで考えたとしても、端になればなるほど左右のバランスが悪くなることに代わりません。
席が前や後ろになっても出来る限りセンターの軸に近い席に座った方がバランスの取れたサウンドを楽しめます。

こうしたことを改善していく一つの考えとして、「センタースピーカーを重視したサウンド作り」があります。
これは音響だけでなく、作品としてセンタースピーカーを中心に考えて作ることからはじまります。

図のaの位置に座った場合、L/Rのステレオ作品ではセンター定位であるはずの音がLスピーカー寄り聴こえてしまいます。
ボーカルやベース、キックと言ったサウンドの芯となる音がLスピーカー側へ寄ってしまうことで、サウンド全体が左よりになってしまう。
その上でどんなにスピーカーをサラウンド配置したとしても、左寄りのサウンドであることには変わりありません。

サウンドの芯がLスピーカー側へ

しかし実際にセンタースピーカーを置き、そこからセンター定位の音を出せば、どの座席から聴いてもセンターは同じ1か所に固定されます。
当たり前ですね。

サウンドの芯をセンターへ

しかしこれが当たり前に出来ないのです。
普段2chステレオでしか音楽制作をしていなければ、センタースピーカーを核としたミックスをする経験はありません。
センターチャンネルをボーカル専用に使ったり、L/Rの音を多少混ぜたりと言った程度の使い方をしがちです。

その一つの理由が、センタースピーカーから音を出すと、センター定位が明確になり過ぎ左右に少しでもずれると気持ち悪くて動けなくなるのです。
音場の中心で聴けるなら、センタースピーカーは無い方が良かったりするのです。

しかし、センタースピーカーの軸上に座れない人が多い場合、逆にセンター定位を明確にした方が良いと思います。

サウンドの芯を音場のセンター軸に据え、そこから左右そして後方へと音を広げる意識でサラウンドミックスを行えば、より多くの人に同じサウンドイメージを共有してもらえると考えます。
もちろん左右のバランスは聴く位置によって異なりますが、センター定位がきちんとあるためセンター+サラウンドの音場となり、違和感はかなり軽減されます。

あくまでもセンター定位を軸としたサラウンドミックス

これらは一つの案ですが、ライブ、パブリックビューイングはもちろん、サイネージに至るまで、そうしたサウンドのサービスは当然の様に工夫されなければならないものだと思います。

2020/03/07

立体音響システムの考え方 - 「Sea, See, She - まだ見ぬ君へ」編

「evalaが現在到達している次元は、他の追随を許さないところまで来ている」

リットーミュージック出版のサウンド＆レコーディング・マガジン2020年4月号に、2020年1月24日～26日SPIRALホールで上映された、インビジブルシネマ「Sea, See, She - まだ見ぬ君へ」evala（See by Your Ears）のレポートが掲載されています。

サウンド＆レコーディング・マガジン2020年4月号

記事にあるように、evala氏の立体音場を生成するための「空間の作曲力」は誰もまねの出来ない次元にあるのかも知れない。

先日、「4次元の映像に興味があるのですが4次元の音って作れるのですか？」と言う質問を受けた際、evala氏のサウンドはすでに4次元かもと思ったくらい。

では、そのサウンドを支える音響システムはどのようなものだったのか、解説したいと思います。

evala作品はそのサウンドに対しスピーカー数が驚くほど少ない。
少ないスピーカー数でも表現させる腕があるわけですが、それはどんなスピーカーシステムにおいても同じ様に出来るわけではありません。

それから、少ないと言いましたが私はそう思っていません。
無駄に多くないだけです。

スムースな音の繋がりを考えると、スピーカーは3m間隔に置いて...
と言うような考え方はチャンネルベースの考え方です。
はじめにこのスピーカーへ音を送り、徐々に次のスピーカーへ送る...

そうではなく、空間ベース（オブジェクト＆シーンベースとでも言えば分かりやすいだろうか）での思考で取り組めば、おのずと音は繋がり立体音場を生みやすいシステムを構築できます。

空間ベースの考え方は、その音は空間のどこにありその音場はどんな空間なのかのイメージが先にあり、それを今あるスピーカー配置のフォーマットの全てのスピーカーを使ってどう鳴らすのかと言う考え方。

考え方はそうなのですが、具体的には空間ベースで最も優秀なフォーマットはAmbisonicsですし、現在はDAWにも標準で搭載されはじめていることを考えれば、まずAmbisonicsをきちんと鳴らせるスピーカーシステムを構築すること、そしてそれがチャンネルベースにおいてもきちんと鳴ることをまずは目指すことから始めるのが良いと思います。

要は「同じスピーカーを均等に配置する」というAmbisonicsを最も効果的に鳴らす条件と、チャンネルベースのフォーマットを両立すればよいわけです。

Sea, See, Sheではイメージされた立体音場の生成に向け、音響システムはどの様に構築されたのでしょうか。

まず、前提として、スパイラルで音響システムを構築したのは今回で3回目だと言うこと。
過去の経験は当然ながら大きな助けとなります。

2016年の「MARGINAL GONGS」森永泰弘では、スピーカー配置のデザインから3DサラウンドMixとその現場実装＆調整を担当。
その際は、演目の内容から下層6ch（濃い青）上層6ch（薄い青）の12chに、上層の奥とステージ前、下層のステージ前に計3ch分のセンタースピーカーを加える配置にしていました。

MARGINAL GONGS スピーカー配置

ステージを含む全体（緑の点線）の8chキューブ配置（スピーカー1,2,5,6,7,8,11,12）と、客席だけ（青の点線）の8chキューブ配置（スピーカー3,4,5,6,9,10,11,12）とに分けて立体音場をMixし、例えばステージ内から音を聴かせたい場合や波が客席へ寄せて来る表現などは全体の8chキューブでMix、客席の上空を風がうねる様な表現は客席だけの8chキューブでMixすると言った具合です。

また、2019年のサイレント映画＋立体音響コンサート「サタンジャワ」森永泰弘でもそうなのですが、スピーカーシステムをMeyer Soundに統一していました。
これはアーティストリクエストによるもの。
その現場で、当時最新モデルであったULTRA X-40を2台だけでしたが試しています。

一方で、2019年のインビジブルシネマ「Sea, See, She - まだ見ぬ君へ」プレ公演ライブパフォーマンスでは、スパイラルの4隅にスピーカーを配置するシンプルな4chスクエア配置のシステムでした。
これは前年日本科学未来館で行われたMUTEK.JPにて初披露された「Sea, See, She - まだ見ぬ君へ」ライブセットを元に構成されています。

Sea, See, She プレ公演ライブスピーカー配置

このスパイラルのライブで確認したのは、MUTEK.JPの未来館での音がスパイラルではどう変わるか？ 4chだけでどの程度の立体感が出るのか？
サイドのサポートスピーカーの必要性など。

これらの経験を元に、スピーカーの選定と台数そして配置をevala氏と共に決めていきます。

まず8月のプレ公演終了後、すぐにサイドウォールをすべて暗幕で覆うことは決断。
これは出来る限り余分な反射を抑え、スピーカーの調整を行いやすくするためです。

スピーカーをMeyerに決めたのは、evala氏との過去の会話の中で「Meyerの音は良かった」と話していたこと。
アーティストの言う「良かった」は、自分の音を出しやすかったという意味です。
これはスピーカー選定において最も重要な情報となります。
アーティストが表現しやすい環境を用意することが、上質な立体音場生成への一番の近道です。

次に、立体音場生成においてスピーカーの発音点は出来る限り小さい方がよく、そして均一な音の放射が重要です。

ここ数年よく使用しているCODA D5-Cubeはその理由で、同軸2wayでありキューブ型なので水平と垂直の指向角が同じ、それにより8chキューブ配置にした際水平と垂直の音の繋がり方が均一となり一つの空間として音場を生成しやすく、それによりスムースな音像移動と没入感ある立体音場生成を可能にしています。

小型ながらパワーと音質のバランスが良く、自分のスタジオ、evala氏のスタジオ、最近ではRittor BaseもD5-Cubeを使用しています。

ちなみにICC無響室展示や「聴象発景」で使用している小型球型スピーカーは、Gallo AcousticのA’Divaというスピーカー。
球型であれば音の放射は全方位に均一なので、キューブ型スピーカー以上に繋がりが良いのはもちろん、パワーは無いが自然な音から電子音まで自然にカバーしてくれる良いスピーカーです。

しかし、大出力のPAスピーカーシステムでは、その目的からその様なスピーカーは現時点で存在しません。
その時点で立体音場生成を実現するにあたってマイナスです。

今回使用したMeyerのULTRAシリーズも水平と垂直では指向性が異なりますので、あとは会場のどこにどの向きで設置するかをよく考え、そのデメリットをカバーする事が重要となります。
それもスピーカーの性能が低ければ実現できません。
ポイントソースのスピーカーとしても定評のあるMeyerは、今回の作品には欠かせない選択でした。

通常のPAでのスピーカー指向角と配置は、サービスエリアを考えてのことが主となりますが、立体音響においては一つの音場を生成するための空間の繋がりを主として考えます。

そして決定したスピーカー配置がこちら。

Sea, See, She 本上映スピーカー配置

いわゆる7.1.4chサラウンドフォーマットです。
（システムとしては7.4.4ch）

evala氏の代表シリーズ作である「Anechoic Sphere」では、下層4ch上層4chの8chキューブスピーカー配置が使われます。
真の立体音場が作りやすいフォーマット。
しかし今回は映画。
映画ではあくまでもL/C/Rがメインの制作が行われます。
それを念頭に入れつつも、これまでの立体音響作品に近いミックスを行うことを考慮し、Dolby Atmosの制作環境をイメージしたスピーカー配置としました。

没入感ある立体音場を生成するには、すべてのスピーカーを同じモデルにするのが理想。
しかしL/C/Rの間隔は他のchに比べて狭いので、指向角が70度でその分パワーのあるX-42を3台使用。
指向角が110度と広いX-40をサイド、リア、そしてトップに使用しました。

Meyer ULTRA X-42（上段）と900-LFC（下段）
小型ながらパワーがあり自然な音も出せる

サイドスピーカーのX-40
当然ですが客席とは出来るだけ離す

リアのX-40+900-LFCとリアトップのX-40
リアスピーカーと客席との距離も十分にとる事が重要

キューブ配置の考えの時は、ボトムのスピーカーの真上にトップのスピーカーを配置させます。
しかし今回は客席中心から見て等距離となる球面配置にするため、トップのスピーカーはボトムよりすべて内側に入った位置に設置。
その指向角と配置のバランスの方がスパイラル全体の繋がりを均一に出来ると考えたからです。
ディレイを物理的に少なくする意味もあります。

フロントスピーカーとトップフロントスピーカーの位置関係
フェイスは客席中央よりへ
側壁は暗幕ですべて覆い反射を抑えめに

ホール4隅に設置した4台の900-LFCには、超低域だけを任せています。
まず始めの調整では、X-42またはX-40と900-LFCとの組み合わせでフルレンジとなるよう調整したのですが、最終的にはX-42とX-40はフルレンジで鳴らし、900-LFCは主にLFE chを担当させていました。

この様にすると、トップのX-40を含めすべてのスピーカーの再生周波数レンジを揃えることが出来るので、立体音場生成にとっては良い条件となります。

しかし、そうなるとX-42, 40だけでは低域のパワーは十分ではありません。
通常はサブウーファーでパワーある低域を気持ちよく鳴らそうと考えるのですが、自然音を没入感ある立体音場として生成するには、ライブの様に低域をタイトに効かせるよりも、自然な柔らかさを持った音で鳴らす事が重要だったりします。
音楽的な再生と環境音再生とを高いレベルで両立させるには、ミックスからシステムまでトータルに考える必要があり、その辺りのプランニングは常に課題となります。

今回会場のシステムプランと同じスピーカー配置をevala氏のSee by Your Earsスタジオにも作り、スタジオで作ったミックスバランスがスパイラルでも崩れないよう配慮しました。

マルチチャンネルの作品では、「会場でどう聴こえるか」が分からないと事前に作業を進めることが出来ません。
スタジオで5.1chで作り会場でそのまま鳴らせばOK、と言った雑な考えは有り得ません。

会場での調整時間は短いものです。
広さもスピーカーも空間も違う会場で、事前にスタジオミックスした音がそのまま鳴ることは無いです。
最終的には、厳密に音は違えど作品の表現は同じに仕上げないといけない。
スタジオでミックスしていた音が100%とするなら、会場ですぐ80%で鳴ってくれたら、あと20%をどれだけ近づけるか、あるいはその会場ならではの音にするかをアーティストが仕上げていけばよいのですが、会場に持ち込んでもし50%の音だったら...

スタジオに同じスピーカー配置を作るのは大変ですが、チャンネル数が無駄に多くなければそれも可能となります。
また、それが7.1.4のフォーマットであれば、サラウンド対応スタジオも無いわけではありません。

スピーカーが組めない場合は、HPLプロセッシングによってヘッドフォンを使ったバイノーラルモニタリングでの制作が有効です。

すばらしい立体音響作品を目指すためにエンジニアがしなければならない事、
アーティストが自身の音を出しやすくミックスしやすい環境を会場にもスタジオにも用意する。
その対策と準備が一番重要です。

2020/01/26

Lenna ICC無響室

あと1か月でICCのLennaの展示も終わるので少し技術系の話をすると、

ICCのLennaもYCAMのLennaも、その展示話が浮上したのはアルバムOrbの制作が終わった後。
つまり展示のために作られた作品では無く、すでにある音源をICCの無響室で鳴らすなら、YCAMのホワイエで鳴らすならとフォーマットや環境を考える、まさにLennaのコンセプトが実行された展示なのです。

ICCもYCAMもどちらもクリエイティブコモンズのライセンス下で無料ダウンロードして使用できる22.2chの音源データを使っています。
特に自分がメインで関わったICC無響室のLennaは、22.2ch音源をHPLプロセッシングしバイノーラル化した音そのもので、それはアルバムOrbに納められているLenna(HPL22 Ver)ほぼそのままです。
単に2台のスピーカーとリスニング位置の調整と音量調整のみであのサウンドが生まれています。

なので、Lenna(HPL22 Ver)の音源と2つのスピーカーがあれば誰でもICCのLennaは作れます。
もちろん無響室で無ければ、あそこまでの音の立体的な定位の再現は難しいですが、自分のノートPCなんかはたまたまスピーカーの位置が良いのか、Lennaを再生すると後ろまでは回り込まないものの、正面0度として120度くらいは回り込んだりします。
普通の部屋での話です。
興味のある人は自分の再生環境を工夫して自分なりのLennaを作ってみてください。
目標はICC無響室のLennaです。

さて、ICCの無響室展示はなぜ2スピーカーになったのか...

無響室に22.2chを設置出来ないと言う話から始まり、「じゃあ何chにするべきか」となった時に、一番体験者がスピーカーを意識しないのが2台だから、です。

決して2スピーカーでの3Dサウンド体験が面白いから、ではありません。

よく「Lennaらしさ」と言っているのですが、技術的には「らしさ」が損なわれなければLennaであり、損なわない音響デザインをすることを心がけています。
（つまらない事言ってるなぁ）
それにはスピーカーを意識させたくなかった。

元々22.2chのLennaを22.2chスピーカーで再生すれば、空間の無い無響室においては何も＋されるものが無く、単にLenna音源を試聴する体験にしかなりません。
そうでは無く無響室作品Lennaとして展示したい、となり...

では自分がよくやる8chキューブではどうか？

一般の人から見たら、22.2chも8chも随分な多ch再生です。
スピーカーの存在が強いと「試聴」になりやすい。
これは逆に1スピーカーでも同じです。
目の前にスピーカーが1台しか無かったら気になりますよね？
体験者が一番気にしないのが2台スピーカーを置く事なのです。
無響室と言うあまりに不自然な部屋がさらに際立ち、さほどスピーカーを意識しないまま椅子に座ると部屋は暗転し、するといきなり声が空間に浮かび上がる。
一気に没入し作品Lennaのスタートです。

展示は3月1日まで。
それ以降はもう無響室でLennaを聴くことは無いのでは？
是非ご体験ください。

NTTインターコミュニケーション・センター[ICC]
「オープンスペース2019 別の見方で」展
《Lenna》細井美裕
https://www.ntticc.or.jp/ja/archive/works/lenna/

おまけ

2スピーカーで立体再生するLennaには、個人的に裏テーマを設けています。
バイノーラル化した2ch音源にどれだけ立体的な音の情報が残っているのか、それは同時に現在何も考えずに行っている安易なダウンミックスでどれだけその情報を失ってしまうのかを、サラウンドに携わる者に知ってもらうことです。

2020/01/02

2つの受賞作にみる共通点

2019年は2つの作品が受賞。
この2つの作品には共通点があります。

「Stradivarius: Timeless Journey」

https://qosmo.jp/projects/stradivarius-timeless-journey/

2018年の「ストラディヴァリウス 300年目のキセキ展」でのQosmoさん企画制作によるインスタレーション作品。
アジア地域最大級の広告コミュニケーションに関するフェスティバルSpikes AsiaのDigital Craft 部門にてグランプリを獲得。

300歳のヴァイオリン、ストラディヴァリウス「サン・ロレンツォ」を無響室で録音。
徹底して資料を集め、ストラディヴァリの工房、ヴェルサイユ宮殿のプチトリアノン内サロン、旧ゲヴァントハウス、そしてサントリーホールをモデリングし音響シミュレーションを行う。
その音と映像をヘッドフォンで視聴するもの。

音響シミュレーションとバイノーラルシステムを担当。これほど魅力的な企画もそうは無いだろうということで、二つ返事で参加を承諾。とーっても大変でしたが、やり甲斐とロマンある作品でした。音はほんのちょっとだけ、下記リンク先の作品説明ビデオで聴くことができます。ヘッドフォンやイヤホンでどうぞ。

https://www2.spikes.asia/winners/2019/digitalcraft/

「Lenna」

https://miyuhosoi.com/ux-portfolio/orb/

アルバム「Orb」Miyu Hosoi に収録された22.2chの「Lenna」を5chにレンダリングしたバージョンが、第26回日本プロ音楽録音賞のハイレゾリューション部門（クラシック、ジャズ、フュージョン）優秀賞、ニュー・プロミネントマスター賞をダブル受賞。

https://www.japrs.or.jp/prorec/awards_vol_26/

22.2chのスピーカーシステムに代わり、HPLのバイノーラルプロセッシングでの22.2chヘッドフォンモニタリングシステムを用意し、3Dサラウンドミキシングをサポートしました。

22.2chの音楽作品であり、まったく新しい制作方法とコンセプト。
ニュー・プロミネントマスター賞は誰が見ても納得の内容だと思いますが、ハイレゾ部門の優秀賞は本当にセンセーショナル。
作品の中心となったアーティスト、作曲家、エンジニアの3人が20代のこの作品の受賞、その実際に高いクオリティは音楽制作関係者にとってショッキングだったと思います。

これが起爆剤となって音楽制作が進化することを切に願います。

この2つの作品にはしっかりとした技術が軸にあります。

インパルス応答を用いた残響付加やバイノーラルと言った技術は昔からある。

重要なのはそれをどう高いクオリティで使うか、面白く作品に繋げるか、そして最後にはエンタテインメントとしてどう仕上げるのか、と言うプロセスが自分は好きなのだと思います。

音楽作品である「Lenna」はもちろん、インスタレーションの「Stradivarius: Timeless Journey」もエンタテインメントの作品を目指して制作されました。

現存しない部屋を資料からモデリングしその音を復元するだけなら、恐らくそれは歴史的な技術資料として「こんな音だったのか」と言う確認作業をするだけの体験となります。

そこからもう一歩踏み込んで、音楽の気持ちよさや作品の面白さを使われている技術抜きに体感できるところまで持って行くことで、エンタテインメントになると思います。

それには音源としての音質、音響としての音質をある程度確保する技術が大切です。
それが立体音響ならなおさら。

登録: 投稿 (Atom)