2020/06/12

バイノーラルプロセッシングプラグインを知る -Part2-




Part1では、バイノーラルプロセッシングプラグインの定位や空間表現の違いについて書きました。
A-formatマイクで録音した自然音を使い、Ambisonicsの空間表現をどの程度再現出来ているか3つのプラグインで比較しましたが、今回は音楽を試聴することで音質も含めての比較をしたいと思います。

さて、ここで早速問題が。
環境音と違い、音楽素材は著作権の関係で簡単に扱えない。
出来れば皆さんご存じの、よくレファレンスに使われている音源を使って話を進めたいところですがそうはいきません。

そもそも、サラウンドになるとレファレンスとなる共通の音楽素材の存在自体が無いと思います。

いえ、あります!
自分もエンジニアの一人として参加している”Lenna - Miyu Hosoi”。
22.2chの本作を納めた24chのWAVファイルが、クリエイティブ・コモンズのライセンス下で無料ダウンロードでき、マルチチャンネルの音楽研究等に使用することが出来ます。

詳細はこちら
https://miyuhosoi.com/lenna/


と言うことで、いきなり5.1chや7.1chなどをすっ飛ばして22.2ch音源で検証してみましょう。

Ch数が多い分、ヘッドフォンの音場内でバランスよく再現されているのか、その空間表現が分かりやすいと思います。
5台だけでは多少バランスが崩れていても気にならないかも知れません。
実空間で考えてみてください。
5.1chサラウンドシステムって、結構いい加減に配置されていたりしませんか?
22台もあればちゃんとバランス良く配置しないと隣のスピーカーとくっついてしまいます。
ヘッドフォンの中の音もそれと同じです。


では聴いて見ましょう。
と行きたいところですが、せっかくなのでPart1と同じプラグインを使いたいですよね。
NOISE MAKERSはBinauralizer Studioと言うプラグインがあり、22.2chをバイノーラル化出来るのですが、IEMはAmbisonics用プラグインなのでそうしたツールはありません。
ですのでここは前回と同じくAmbisonicsからのバイノーラル化で比較して行こうと思います。

まず、Lennaの24ch音源をIEMのMultiEncoderプラグインでAmbisonicsエンコードします。


IEM MultiEncoder - 22.2chをAmbisonicsエンコード例


この様に22.2ch全てのスピーカー配置を入力すれば、Ambisonicsエンコードすることが出来ます。
今回は音像が多いので、Ambisonicsは3次にエンコード(Ambix SN3D)します。
3次であれば対応したソフトウェアも多いと思いますので、皆さんの環境で同様の比較が出来ると思います。

Lenna 22.2ch音源 → 3次Ambisonics → 比較するバイノーラルプラグイン
と言うプロセッシングの流れになります。


Biduleでの接続例



ではまず基準として、LennaのHPL22 Ver.を聴くことにします。

この音源はもちろんAmbisonicsエンコードしたものではないので、今回試聴するプラグインの音がまったく同じ様に聞こえることはあり得ないのですが、Ambisonicsであろうがチャンネルベースであろうがスピーカーで再生したならば空間があるわけで、それをバイノーラル化しているという部分は比較対象として成立します。

ちなみに、ここで聴いていただくLenna HPL22 Ver.はリリースされているものではなく、この記事のためにクリエイティブ・コモンズライセンス下の同じ22.2ch音源を使いHPLプロセッシングしたものになります。

リリースされたLenna HPL22 Ver.を聴いてみたい人は検索してください。
Spotify等で無料で聴くことも出来ますが、最も音質の良いのはOTOTOYなどで販売されている96kHzサンプリング版のLennaになります。
https://ototoy.jp/_/default/p/392431


それでは試聴を始めます。
聴きどころは、
一番初めのフレーズがフロントセンターで鳴りますのでその音質、音色、定位、奥行き感など。
そこから前方を中心に広がる残響の感じ。
その後の主に前方から真横までの空間を使って展開される音の定位感などになります。

※ブラウザのプレイヤーで再生される音源ファイルはMP3(320kbps)です。
download linkの音源ファイルはWAVファイルとなっています。



基準音源 - Lenna HPL22 Ver.
download link




それではまずAmbiHead HDを試聴します。
ここで分かったのですが、3次AmbisonicsではWidthを50%にすると空間が狭くなってしまいます。音も極端に悪くなります。Widthって何をしているのでしょうか?
そこは置いておき、今回はとりあえず試聴した感じ良さそうだったWidth=100%にしました。


22.2ch > Ambisonics > AmbiHead HD Binaural
download link



ちょっとこもった音になります。
1次のAmbisonicsで環境音を聴いていた時は気にならなかったものが、音楽では気になります。
試しに1次にしてみましたが、多少クリアになるものの似た傾向でした。

前方定位はいかがでしょうか?
本物より近いですよね?

最初のフレーズからの残響までで、本物には前方に空間が感じられます。
後半になり聴き慣れるにつれてAmbiHeadの音場が横に細長くなっていることが見えてくると思います。


少し話がそれますが、バイノーラルをテストする時の聴き方として、ひとつに「この音源は立体的だ」と信じて聴く、と言うのがあります。
疑って否定的な聴き方をしては何を聴いてもそう感じなくなります。

「この音は前方にある、前方には空間がある」と言い聞かせながら聴いた時に、それでも前方に対する奥行きを感じることが出来なければ、それは実際に無いのだと思います。

また、パッと聞いて判断するのもやめましょう。
普段体験していない音を脳が受け入れるのには時間が掛かります。
何度も聴き返すことが大切です。
パッと聴いて「わかった」と言う人は、実際は正しく解ってはいません。




それでは次にIEMのBinauralDecoderです。



22.2ch > Ambisonics > IEM Binaural
download link


AmbiHeadよりもさらに近いと思います。
音はクリアですが、かなり左右に広がった音場であるために、角度的に開いていない音(2Mixで言うとセンター寄りの音)は頭内定位し始めていて、言うなれば普通のステレオサウンドに近づいている音だと思います。


理想を言えばヘッドフォン内の音場が均一な全球体となれば良いのですが、左右二つのスピーカーユニットだけでは限界があります。
出来る限りそれに近づくようなバイノーラルプロセッシングを行う必要があります。


バイノーラルによるヘッドフォン音場の理想(2chの場合)


しかし殆どのバイノーラルプロセッサーは前後の空間表現が極端に悪く疎かになっています。
これは人が前後に敏感ではないことだけでなく、バイノーラル技術として足りてないものが多いということです。


左右が誇張されたヘッドフォン音場



いかがでしょうか?
中には同じ様に感じなかった人もいると思います。
一人一人聞こえは異なるのでそう言うものです。
そもそも他人がどう聴いているかなど分かり得ないことです。

個人のHRTFを用いたとしても、多少定位が改善される程度で、IEMの前方定位感がオリジナルのLenna HPL22 Ver.になることはありません。
それぞれのプラグインの欠点が多少改善される、と思ってください。

他人のHRTFを使うと極端に定位が悪くなる可能性はありますが、平均化されたダミーヘッド等で作り出されたHRTFを使っている限り、極端に定位が悪くなることは無いと思います。
「HRTFが自分に合っていない」からそのプラグインが良くないのでは無く、それがそのプラグインの基本性能と考えるのが自然です。


今回使用したプラグインはいずれもHRTFにNeumann KU100が使われています。
他のプラグインでもこのHRTFを使っているものは多い印象です。
このダミーヘッドは比較的音楽録音に適しているとされていますが、頭の形状から分かるように滑らかではありません。
これは恐らく側面からの音を耳のマイクまで効率よく回析させそうに見えますが、前方からの音が耳までたどり着く経路は不自然です。
その辺りが前方定位の弱さに繋がっているのでは?
と言うのは自分の憶測です。

IEMはAmbisonicsの計算をきちんと行い、それをシンプルにNeumann KU100のHRIRでプロセッシングしているイメージがあります。
なので音は良い。ただNeumann KU100のHRTFの特性がそのまま出ている。

AmbiHeadはそれ以外に何かやっている。よって音が変わってしまう。

こうした推理はいかがでしょう。


いくつかのプラグインの性能を知っておくことで、新たなプラグインを試すときの目安になりますし、初めての制作環境で使われるソフトウェアのバイノーラルの質を把握することも出来ます。
それによってMixのやり方を変えるなど対処も出来るようになります。
音楽制作の現場ではそれが大事です。




さて、ここからは余談なのですが、

サラウンドでミックスされた音源がバイノーラル化されヘッドフォンで再生されたとき、それが正しいかどうか普通はスピーカーとの比較となります。
それだと異なるプラグインを使ってバイノーラル化の試聴をしても、どちらがより正しいのかの判断は正確には下せません。

ヘッドフォンは音を出すスピーカーが2つしか無く、それを耳に装着しているわけですから、実空間よりも狭く感じるのは当然です。スピーカー再生と同じ、と言うことにはなりません。
同じにはならないのですから、ヘッドフォンの音場として良いのはどのプラグインなのか、判断は経験を積まなければ難しいかと思います。


しかし!
Lennaの音源ならばそれが分かります。

なぜなら、LennaはヘッドフォンMixで作られているからです。
HPLプロセッシングを使用し、22.2chをバイノーラルモニタリングしつつMixしています。
そのバイノーラル音源は、そのまま”Lenna HPL22 Ver.”としてリリースされました。
且つ、そのHPLプロセッシングされる前段の状態、つまり22.2chの音源がそのままスピーカー再生用としてMixし直されること無くリリースされているのです。

つまり、Lennaの22.2ch音源をバイノーラル化したら、Lenna HPL22 Ver.とまったく同じサウンドになるべきなのです。
この様に明確な正解があるので、Lennaの22.2ch音源がプラグインを通過した後の音が、Lenna HPL22 Ver.にどれだけ近づくかでそのプラグインの性能を判断することが出来てしまいます。

と言ういじわるです。



では検証してみましょうw


22.2chをバイノーラル化出来るプラグインとして、NOISE MAKERSの”Binauralizer Studio”を使用し検証を進めます。
https://www.noisemakers.fr/binauralizer-studio/

Binauralizer Studioは、2chから22.2ch までのフォーマットをバイノーラル化出来る優れた仕様のプラグインです。
これでMixのモニタリングが出来たら大変便利です。


22.2ch > BinauralizerStudio Binaural
download link



先ほどのLenna HPL22 Ver.と聴き比べてください。


基準音源 - Lenna HPL22 Ver.
download link




いかがでしたか?
やはり空間が狭く立体感がちょっと薄いですよね。

やれる人は是非Lenna 24chファイルを使って、バイノーラルチャレンジして見てください。

22.2chのハードルが高い人は、Binauralizer Studioもそうですが、2chをバイノーラル化しても検証は出来ます。
2ch音源でしたら普段聴いている音源ですので、Binauralizer Studioがどんな音質なのか、すぐに分かると思います。
同様に様々なプラグインを比較試聴し考察してみてください。

HPLの2chも無料でプラグインを配布しています。
是非お使いください。

HPL2 Processorプラグイン
https://www.hpl-musicsource.com/software


※HPL2Processorプラグインの無料配布は終了しました。
現在はNovoNotesより、さらに音質向上されたHPL2Processorプラグインが発売されています。
https://novo-notes.com/ja/hpl2-processor



さて、最後に自分の興味でテストしてみた音を載せておきます。

これは、最初のテスト同様Lennaの24ch音源を一旦Ambisonicsエンコードし、その後でHPLによりバイノーラルプロセッシングした音になります。
一度Ambisonics化してしまっているので、Lenna HPL22 Ver.と同じにはならない分けですが、同じ性質を持つHPLプロセッシングだとどう表現されるのか?
参考までにご視聴ください。


22.2ch > Ambisonics > HPL Binaural
download link


いかがでしたか?

Ambisonicsエンコード時点でちょっと問題があるように思いました。
そのあたりはまた別の機会に。





-使用音源-
Lenna 22.2ch(24ch 48kHz 24bit PCM)

-制作チームクレジット-
Lenna(2019)
Concept&Voices&Recorded: 細井美裕
Composer: 上水樽力
Mixed: 葛西敏彦(studio ATLIO), 蓮尾美沙希
Mastered: 風間萌(studio ATLIO)
Recording assisted: 飯塚晃弘(studio ATLIO)
3D Audio Designer: 蓮尾美沙希
3D Sound System: 久保二朗(株式会社アコースティックフィールド)


2020/06/04

公共空間での立体音響調整



公共空間は音響としては整った場所ではありません。
基本的に残響が多すぎます。
そんな場所でもスピーカーの数と配置をよく考え、そして調整を行えば十分に楽しめる立体音場を作ることが出来ます。
普段どの様な調整を行っているのか? 詳細ではありませんがポイントを記述したいと思います。


スピーカーなどの音響調整が済んでいたとして、
まず中心に立って前後と左右の音の違い、音量差を確認。その後上下の関係も同様に確認し微調整します。
この時測定結果にこだわり過ぎると失敗します。
上下のスピーカーを鳴らしてその中間に定位するか? 音色変化は? などを聴いて調整。
前後左右上下に均一な音場を作るイメージで。

例えば、左前のスピーカーと左後ろのスピーカーだけ音を出し中間に定位するか?
次に左前のスピーカーと左前上のスピーカーから音を出し中間に定位するか?
不自然な音色変化は無いか?

空間が広ければ、下のスピーカーよりも上のスピーカーの音は小さくなるので音量を上げる訳ですが、上げ過ぎると立体音場のバランスが保てなくなるので、完全に均一を目指す必要はありません。
どの程度上げるか? 最終的には作品を聴いての調整となり、結果的に+2dB程度であることが多いです。

あと、ディレイは入れません。
ここで言う立体音響は没入感ある立体音場を作れる環境を対象としているので、広さ的には20m四方以内と思ってください。
もっと広い空間でのサラウンドは没入型にはなりません。


各スピーカーからの出音が大体揃ったらレファレンスの音源を再生し、いつもの立体感になっているかを確認。
問題無ければ最後に音を整えていくわけですが、基本的には重たくなりがちな帯域(250Hz付近)を少し抑えたりロー(80Hz以下)を抑えたりしてスッキリさせます。

マルチチャンネルの場合、全てのスピーカーで同じ帯域を1dB下げるとかなり音は変わります。
場合によっては、下層のスピーカーだけとか、上層のスピーカーだけを調整すると言ったことを作品を聴きながら調整していきます。
それらが作品の持つ空間表現の調整となり、いわゆる空間がアル、ナイがここで決まります。

そして最後にサブウーファーをどの辺りの周波数からどの程度入れるかを決めます。
サブウーファーの帯域調整によっては、せっかく整えた空間表現を台無しにすることになります。
空間を残したまま必要なローを出す周波数ポイントとカーブを見つけてください。

それから最後に一番大事なのが全体音量です。
その作品の持つ立体音場、没入感を再生するに最も適した音量を見つけてください。