ACOUSTIC FIELD blog

※今回は特に音楽制作においてバイノーラルを扱う人に向けた内容となっています。

先日、とあるイマーシブ界隈の集まりにお声がけいただきました。

そこでソニーさんが開発した360 Virtual Mixing Environment（360VME）を体験。
以前プロトタイプを試聴したことがあり、今回は2度目。
性能は全く同じだったと思います。

360VMEというのは、スタジオのモニタリング位置でマイクを耳に仕込み、スピーカーとヘッドホンから測定信号を再生してIRを実測、そのIRを使ってバイノーラルプロセッシングすることで、自宅などの別環境でもスタジオでMixしているかの様な状態を作り出すもの。
https://www.sony.co.jp/Products/create360RA/360VME/

体験は、スピーカーからの音とヘッドフォンからの音とを比較するのですが、大抵は皆さん、そのそっくりな再現性にびっくりし、「こんなバイノーラルは聴いたことがない」「すごい発明だ」となります。
しかしそれは、バイノーラル技術を知っている人であればその結果の当然と言え、なんなら大昔からよく実験されてきたバイノーラル技術としてとてもベーシックなものなのです。
僕はその結果よりも、測定からプロファイルが作られるまでのスムーズさ、正確さの方をとても素晴らしいソフトウェアであると評価しています。

今回肝心なのは、スタジオのエンジニアさんらが集まるこの体験会での論点が、音楽制作の仮想Mix作業環境としてこの技術が有効かどうかを見極めることにあるとわかっているかどうかです。

実際、スタジオではあれだけスピーカーとそっくりでヘッドフォンをしていないかのようなサウンドだったにも関わらず、自宅など全く異なる環境で聴いてみると「こんなものだった？」となります。
これもまた当然の結果だったりします。

それも記憶を辿り自分をアジャストしていくと、徐々にスタジオの空間が蘇ってきます。
自宅にはスタジオと同じ位置に同じモデルのスピーカーがあるわけではないので、完全一致とはなりませんが（していても確かめようが無い）、スタジオの音が見えてきます。

その状態でMixが行えるのであれば、実際にスタジオで本Mixを行う前のプリMix作業を自宅で行える様になり、コストダウンや、時間の有効活用が望め、作品や取り組む人が増え、最終的には質の向上にもつながると考えられます。

ところが、試聴してびっくりしただけで論点が見えていない人は、「これはすごいからこの音を商品にできないか」などと脱線していきます。

商品にはなりません。
すべきではありません。
この後で述べますが、その音は色付けされており、そのクオリティではありません。
この技術は作品制作の作業に必要とされるモニタリングシステムです。

目的をまず理解せずに他の使い方を持ち出してくるのは失礼な話です。
Atmosスタジオで音楽を聴いて良かったから、
「いいね、ここを貸し出して映画館にしようよ」と言っているのと同じです。
バイノーラルに対しての認識の低さがそのような発想を生んでしまいます。

そうならないために
僕は最初に試聴体験をさせていただき、終わった後感想を聞かれた際に、「別の部屋で試聴できないのか？それが本来の使い方」「できないのであれば目を閉じて別の空間に居ると想像しながら試聴した方がよい」と主張させていただきました。

そうしないとせっかくの体験会の意味がないと思ったからです。

（実際は測定したプロファイルを後日いただけて、各自自宅で試聴できる段取りとなっていました）

その話を理解できたのは、恐らく普段から仕事で360VMEを使用し試聴環境を提供してくださったスタジオのスタッフさんだけだったと思います。

で、
僕の感想はというと、「有効」です。
使えると思います。
HPLと同じです。使えます。

ただし条件があります。
かなり整った環境で測定する必要があります。
そうでないと、定位の再現性云々の前にまず音が悪いことでMixする気になれないと思います。

さて、ここまで360VMEの話をしてきましたが、
360VMEは、スピーカーモニタリングシステムの代用としてバイノーラル技術が活用された事例になります。

では、バイノーラル技術は他にどの様な目的で活用されているのでしょうか？

現在音楽用のバイノーラルプロセッシングには目的別に3種類あると思っています。
① サラウンドモニタリング用途
② バイノーラルエフェクト用途
③ コンバーター用途

① サラウンドモニタリング用途とは
実存するスタジオのスピーカーモニタリングシステムのリスニングポイントで、エンジニアが耳にマイクを仕込みIRを実測。

それを使ってコンボリューションすることでそのスタジオでモニタリングしている状態をヘッドフォン内に生成するもの。
条件は実存するスタジオで実際に人の耳で実測すること。
ダミーヘッドで実測したり、後からHRTFを差し替えるプラグインなどは条件を満たしません。

この手法はMix時のモニタリング専用になります。
というのは、実測することによりそのスタジオの部屋、機材、その他すべてが影響し加味された音となるため、そのスタジオを知らない人が聴いた場合は逆に違和感あるサウンドに聴こえます。
あくまでも、実際にそのスタジオで作業をする人が、スピーカーの無い環境で違和感なく作業をするためのものであり、スタジオでスピーカー受聴したときに正しい音となるMixを、スピーカーの代わりにヘッドフォンで行えるというだけです。

スピーカーモニタリングシステムの代用です。
そのままバイノーラル音源としてリリースや配信するものではありません。

話が少しそれますが、
”サラウンド”としているのは、2chステレオに対しては同じ手法が用いられないからです。
2Mixは無処理のままヘッドフォンで聴けばよいと思っている人が多く、この技術がスタジオの再現性が高いのであるなら、2Mixのヘッドフォンモニタリング時も同じ手法をとるべきですよね。

② バイノーラルエフェクト用途とは
現在利用できるバイノーラルプロセッシングのほとんどがこのカテゴリーだと思っています。
スピーカーMixしたものを、バイノーラル化する際に何かしらの味付けをする。
例えばAtmos RendererのバイノーラルにあるNear/Mid/Farのモード選択や、SOFAなどのHRTFの入れ替えなどがそれです。
スピーカーのMixバランスとは関係のない、ヘッドフォン受聴専用の調整機能が加わるケース。
また、始めからヘッドフォンモニタリングでバイノーラルMixする場合で、スピーカーでのリスニングを想定しないケースもこれにあたります。
言ったらヘッドフォン受聴のために自由に制作できる利点があり、ヘッドフォン内に空間を作るための反射や残響をふんだんに盛り込むことができるため、ヘッドフォン音楽制作としては大変効果的な手法と言えます。

ただし、ヘッドフォン受聴のみのサウンドとなってしまいますので、そのMixのバイノーラル化前の状態（例えば7.1.4chなど）でスピーカーモニタリングしても、正しく同じ様なサウンドとして聴くことができません。
ヘッドフォン内でだけ成立するMixをしてしまっているからです。

Atmos Rendererだけでなく、360 Reality Audioのバイノーラルや、各社DAW、プラグインなどで使用されているバイノーラルプロセッシングは、スピーカーモニタリングとの整合性は考慮していなかったり、正しいスピーカーバランスの再現よりも頭外定位などの効果を優先していたり、正しいバランスを求めようとしていても性能不足だったりするので、結果的にスピーカーでは正しく聴くことのできないヘッドホン受聴限定用途となってしまいます。
また、サウンドのキャラクターも様々であることから、エフェクターと考えると分かりやすいと思います。
ヘッドフォン受聴専用ですので、そのままバイノーラル音源としてリリースや配信することができます。

③ のコンバーター用途とは
これは実質HPLバイノーラルのことです。
HPLはスピーカーでのMixバランスがヘッドフォンで再現されることに重きを置いて開発されました。
音楽で重要な音質を保持しつつ、あらゆるchフォーマットでのスピーカーMixバランスをヘッドフォンでも感じ取れることを最重要視。

①のモニタリング用途の技術との違いは、実在する環境も人もキャプチャーしていないので、ニュートラルなサウンドである点です。
実在する環境を知らないことで違和感を感じてしまうという①のデメリットがありません。
また、実測は実在の環境以上のサウンドを生むことができませんが、実測しなければヘッドフォンでスピーカー音場を実現するための理想のサウンドを追求することができます。

測定場所の質に左右されることも無く、常にニュートラルな作業環境でMixが行えます。

②のエフェクト用途との違いは、音質とMixバランスを重視していることにより、バイノーラル化前の状態をスピーカーモニタリングしても、やはり音質とMixバランスが整ったサウンドとして聴くことができる点です。

このように双方向のコンバーターとしてスピーカーとヘッドフォンとの繋ぎ役となります。

バイノーラル音源としてリリースや配信することもできます。

コンバーターであるがゆえ、音はあくまでもニュートラルであり、HPLでバイノーラル化したからといってエフェクトの様なそれだけでヘッドフォンに面白い空間表現が生まれることはありません。
そうしたサウンドはMixで作り出すもの、となります。

スピーカーMixのサポートとして使うのか、

ヘッドフォンで楽しむ音を作るのか、

その両方に対応するのか、

いずれの目的であっても、
スピーカーとヘッドフォンは全く異なる再生装置であって、そっくりの音が出ることは決してない、という考えは大前提であります。
その上で、それぞれの長所を求めて目的に応した技術を選ぶことがバイノーラルを上手く活用するための第一歩と考えています。

最後にあらためて3つのバイノーラルの用途をまとめておきます。

① サラウンドモニタリング用途
ヘッドフォンモニタリングでMixし、スピーカーで聴く。

② バイノーラルエフェクト用途
スピーカーあるいはヘッドフォンでのモニタリングでMixし、ヘッドフォンで聴く。

③ コンバーター用途
スピーカーあるいはヘッドフォンでのモニタリングでMixし、スピーカーでもヘッドフォンでも聴く。

ACOUSTIC FIELD blog

2025/05/02

バイノーラルプロセッシングを知る - 2025版