人工知能第一研究室

 
全天球型高臨場感音響のための頭部伝達関数の補間に関する研究

全天球型高臨場感音響のための頭部伝達関数の補間に関する研究

研究背景・目的

  • 近年、スマートフォンの普及により全天球動画,VRの視聴が気軽にできる環境が整ってきている.そこで音声に臨場感を付与するにはHRTFを使用する必要がある.
    そこで本研究では,ラグランジュ補間を用いてHRTFの補間を行い補間精度を向上させ、より自然な音像定位を実現する研究です.

  • HRTFについて
    音源から出た音が人間の両耳に到達するまでに,耳や顔などの体の各部によって音が反射・回折して音響的に変化した特徴が含まれるインパルス応答である。さらに,左右の耳に音が到着する時間差(ITD),音量差(ILD)も含まれる。
    これらすべての情報が含まれているものがHRTFである.
  • ラグランジュ補間について

  • 頭部運動フィルタ
  • 概要
    • スマートフォンの方位センサーにより頭部水平回転を取得し,頭部の角度に合わせたフィルタを入力信号に適用し,ヘッドホンから再生します.
    • フィルタを頭部運動に追従させることで頭外定位しやすくなります.
    • 自然な音像定位を再現を目指します.
  • MATLABを使ったリアルタイムフィルタ
      スマートフォンから送信された頭部の水平角を読み込み,顔の水平角によってフィルタを切り替えながら入力信号に適用し,計算結果をヘッドホンから出力します.
頭部追従システム
システム構成

方位センサー


    • 評価実験
    • 客観評価と主観評価について下図で示す.

客観評価

主観評価


  • 結果
  • 線形2点補間とラグランジュ補間の補間精度の比較した結果
    音源に近い方向の補間精度は線形2点補間よりもラグランジュ補間のほうが良い結果が得られた.

  • 線形2点補間とラグランジュ補間を使用したHRTFの音像移動の主観評価を比較した結果
      頭部運動時での音像移動の評価では、線形2点補間よりもラグランジュ補間のほうが良い結果が得られた.


  • 結論
  • ラグランジュ補間によるHRTF振幅応答の補間を提案しました.
    また補間を用いた細かい角度間隔のフィルタを作成した.
    実験の結果,音源に近い方向のHRTF振幅応答の補間では提案手法のほうが補間精度が良い結果であることがわかりました.またラグランジュ補間を使用した細かい角度間隔のフィルタの音像移動が良くなることが分かりました。
  • 今後の課題
  • 頭部運動を計測するために作成したスマートフォン用アプリのセンサーの誤差の問題を解決する必要があると考えます.

« »

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です