2025年度のデモ大会で発表した内容です。
<概要>
本デモでは、音源分離した4つのパートの再生を、顔の動きによって操作できるGUIを作成した。カメラ映像から取得した顔情報を用いて、上下左右の顔動作に応じて各パートのON/OFF操作を行う。
<開発環境>
開発言語:Python
開発環境:Visual Studio Code
使用ライブラリ
・Tkinter / ttkbootstrap (GUI作成)
・soundfile / sounddevice (音声ファイル読み込み、再生)
・OpenCV (映像取得)
・MediaPipe (顔検出)
<発表資料>
コメントを残す