人工知能第一研究室

 
受聴者位置検出による指向性追従スピーカーシステムの研究(研究中)

研究背景

人が生活している空間の中には音がたくさんあふれています。その音はさまざまな人に情報を伝えるため発信されていますが、その情報を必要としない人にとっては騒音と感じられます。

図1

こういった環境において、音を必要としている人のみに向けて届けることでそれ以外の人への騒音を減らすことができます。

キャプチャ

この状況を実現するには、「指向性スピーカー」の開発が必要になります。

研究目的

本研究では、複数人が存在する生活空間で特定の聴取者のみへ音を集中させることを目的とします。

図3

※生活空間として一つの部屋を想定

従来研究

 

ここでは本研究と関連・類似する目的や、技術について検証されている研究を紹介します。

  • 音の指向性を作る手法
  • 音を届けたい場所(受聴者)の検出
  • 指向性の向きをかえる手法

についてそれぞれ実験・検証されています。

図4

 

これらの研究には、用いた技術によってそれぞれ特徴があります。

01

人認識の精度

 

音を届けたい場所(受聴者)の検出のために、人の位置を見つける2つの手法が研究されています。”画像”による認識と、”深度“による認識です。

この二つを比べると、奥行きの情報を得られるという点で、深度による人認識のほうが優れています

02 03

 

音量・音質

指向性を持つ音を作る」には、超音波スピーカーがよく用いられます。しかし超音波スピーカーは優れた指向性を持つ一方、短所も存在します。1つは通常のスピーカーに比べて「音質が悪い」こと。もう1つは「音量に制限がある」ことです。音量については、人体に向けて超音波を照射する際、健康への影響がでることが考えられるために制限がかかります。

設置・組込み、可搬性

指向性の向きをかえる」とき、2つの手法が考えられます。複数のスピーカーから「出る音を制御する」(スピーカーアレイ)か、指向性を持つ音を出す「スピーカーの向きをかえる」、の2つです。

後者のスピーカーの向き自体をかえる手法については、設置・組込みに不便持ち運びがしにくいといった問題が存在します。スピーカーの向きをかえるということはシステムにモーターなどの可動部が存在することになり、”動くのに十分なスペースの確保”、”移動させる際の破損の危険”といった問題への対処が 必要になります。

 アプローチ

04

先述の従来研究を踏まえて、人認識の精度音量・音質設置・組込みや可搬性全てにおいて問題のないスピーカーシステムの開発を目標に研究を行います。このために、「深度情報」を用いた人認識、超音波やモーターを用いない「スピーカーアレイ」とその「制御」による音の指向性生成・方向制御といった技術組み合わせます。

検討すべき課題と対策案

提案手法は超音波を用いないため、「指向性があまり鋭くならない」といった課題を抱えています。

図5

 

これに対し、深度情報を用いた人認識の三次元精度を音の指向性生成・制御に活用することで、音をひとつの点に集めることが可能になり、指向性をより鋭くすることができると考えられます。

図6

 

提案システム

研究目標の実現のため、次のようなシステムを提案します。

 05

深度情報を用いて人の三次元座標の取得をデバイスで行い、認識した人の頭の座標をもとにそこに指向性が向くよう音の情報を改変し(スピーカーアレイの制御)、スピーカーアレイに出力します。

使用装置・技術

  • Kinect

「 深度情報による人認識」として「Kinect」というデバイスを用います。Kinectにはハードウェア機能として、RGBカメラ、深度(距離)カメラ、マイクアレイ、チルトモーターを持ちます。

この中の「深度カメラ」によって人の骨格を検出できます。この装置は従来深度情報を利用する際に必要となる装置を必要とせず、手軽で高精度な人認識を実現しています。これで得た骨格の頭の座標を、音を届けたい場所の検出として用います。

  •  スピーカーアレイ

スピーカーを配列状に並べたものをスピーカーアレイといいます。

06

この並べたスピーカーから、全て同時同じ音を出すことで、スピーカーの正面方向に音が指向性を持つようになります。これに加えて各スピーカーから音が出る時間を制御することで、できた指向性の方向を変えることができます。

07

 

予備実験

目標のシステムを構築するために予備実験として、提案システムのシミュレーションを作成しました。

08

 

実際のスピーカーを用いた実装を行うには技術・知識の蓄積が十分でないと考えたため、本研究ではシミュレーションを用いた検証を行っています。

今後の計画

  • 三次元指向性制御のシミュレーション構築

現在のシミュレーションは左右に動かす二次元の指向性制御のみを再現しているため、三次元が再現できるよう改良を行います。

  • アプローチにおける課題についての検討

先にも紹介した指向性の問題への対策をシミュレーション上で行います。

  • 本研究のアプローチによって期待できる効果の検証

シミュレーション上で提案システムによって、どの程度の効果が得られるかを検証します。

 

なお、スピーカーへの実装は大学院での研究を予定しています。