音源分離を用いたバンド演奏のための個人練習支援システム

2025年度のデモ大会で発表した内容です。

＜概要＞

本デモでは、音源分離した4つのパートの再生を、顔の動きによって操作できるGUIを作成した。カメラ映像から取得した顔情報を用いて、上下左右の顔動作に応じて各パートのON/OFF操作を行う。

＜開発環境＞

開発言語：Python

開発環境：Visual Studio Code

使用ライブラリ

・Tkinter / ttkbootstrap (GUI作成)

・soundfile / sounddevice (音声ファイル読み込み、再生)

・OpenCV (映像取得)

・MediaPipe (顔検出)

＜発表資料＞

音メディア処理研究室