人工知能第一研究室

 
水平面音像定位のおける頭部伝達関数の学習効果の研究

下記のPDFと平行して読んで行くと分かりやすいかと思います。

水平面音像定位のおける頭部伝達関数の学習効果の研究

 

  • 研究背景と目的

昨今、MP3プレイヤーや携帯端末の普及により、外出先で「気軽に」音楽を楽しむ機会が増えました。

しかしながら、ヘッドホンでは頭内で音が鳴っているように聞こえ、臨場感がすくないという問題点があります。

よって、頭の前後左右から音がきこえるようにし、ヘッドホンでも3次元のサウンドを楽しめるための研究が盛んに行われています。

今研究でも、臨場感ある音楽作品をmp3プレイヤーや携帯端末などで気軽に聞ける未来を目指して研究を進めます。

 

  • 従来研究

従来研究としてまず、ヘッドホン等の2chの出力だけで仮想的にサラウンドな音を作り出すために頭部伝達関数というものを使用します。

しかし、この頭部伝達関数には個人性があるという欠点があります。

人の頭の大きさや耳の形などはそれぞれ違います。頭部伝達関数も人の身体特性に依存するため、人によって値が違います。

よって、他人の頭部伝達関数を使うと位置が間違って知覚されるという欠点があります。
 
そのための解決方法として、まず個別に測定するという方法がありますが、大掛かりな装置や時間がかかるため現実的ではありません。

その他の方法として、さまざまありがすが、今研究では、頭部伝達関数を学習するという方法を使用します。

 

  • 解決したい課題

解決したい課題として、実環境で頭部伝達関数を学習する場合を考えます。

まず、とある人がAという人の頭部伝達関数データを使って立体音響のコンテンツ(音楽など)を作ったとして、また別の人がBという頭部伝達関数データを使ってコンテンツを作成しました。

Aの頭部伝達関数で作られたコンテンツを聞きた場合、頭部伝達関数Aについて学習してからコンテンツを聞きます。

また、Bの頭部伝達関数で作られたコンテンツを聞きた場合、頭部伝達関数には個人性があるため、またBについて頭部伝達関数を学習してからコンテンツを聴くという流れが想定されます。

つまり、実用環境を考えると、コンテンツごとに頭部伝達関数を学習する必要があります。そのため複数の頭部伝達関数を連続して学習できるのかを明らかにする必要があります。

よって、頭部伝達関数を連続学習によってどういう挙動を示すか、連続学習は可能であるか、問題点はなにかを明らかにしていきます。

 

  • 実験準備

頭部伝達関数を学習するためのPCソフトウェアを作成しました。

開発言語はVisualBasicを使用しています。

ソフト

 

  • まとめ

今回作成した学習ソフトを用いて、頭部伝達関数を連続して学習するとどうなるかを明らかにしていきます。

今後の展望として、頭部伝達関数の学習によって、様々な頭部伝達関数によって作られたコンテンツを定位よく聞くことができる学習システムを構築することを目指し研究を進めて行きたいと考えています。