音メディア処理研究室

 
未分類

音源分離・コード分析を用いたtab譜作成支援

2024年度のデモ大会で発表した内容です。

<概要>

tab譜がない楽曲でも簡単にtab譜が作成出来たら効率よく練習ができると思い今回の実験に至った。

<開発環境>

開発言語:Python

環境  :Visual Studio Code

<手法>

<実行結果>

[分離前音源]

使用音源  swim/04 Limited Sazabys  youtubeより

(元音源)

音声プレーヤー

 

[分離後]

(bass)

音声プレーヤー

(drum)

音声プレーヤー

(その他(ギターや打ち込み音源など))

音声プレーヤー

(vocal)

音声プレーヤー

分離後分離した音源(今回はギターの音源)にコード分析を行うと約0.1秒ごとにコードを表示される。

その後指定のサイトにアクセスされこのコードをもとにtab譜を作成する事が可能になる。

<まとめ>

コード推定を行うことによりtab譜の作成スピードがギターを触って音を探りながらするよりも向上した。

コード推定の精度が上がればさらに効率アップにつながると感じた。

<参考文献>

・Qiita AI音声解析・分離ソフトDemucsの検証レポート

mitzi2funk 2024/10/21

https://qiita.com/mitzi2funk/items/2a9c3492ac13d0a9f399

・AI研究所 PyTorchとは?できることや使い方、インストール方法を分かりやすく解説 坂本将磨 2025/1/3

https://www.ai-souken.com/article/what-is-pytorch

ESPnetを利用した自分自身の音声合成モデルの作成

2024年に行われたデモ大会の発表内容です。

2258234 瀬田啓太

背景

現在様々な場面において利用されている音声合成において、自分の声で文章を読み上げるモデルを作成したいと思ったため。

音声合成の仕組み

ESPnetとは

学習結果

学習に利用した文との比較

実際の音声

音声プレーヤー

100epoch学習時

音声プレーヤー

学習に利用していない未知の文との比較

実際の音声

音声プレーヤー

100epoch学習時

音声プレーヤー

検討

生成した音声に入るノイズ音について。

→学習した音声の録音環境に問題がある。

生成した音声の音割れや類似度合いについて。

→学習させた音声のデータ量が不足していた。

まとめと応用

参考文献

ジェスチャーによるバーチャル楽器演奏

2021年度に行われたデモ大会で体の動きに反応して音を鳴らすことをテーマとして発表したものです。

今回のデモではkinectを用いて音階を画面上に表示しました。

<開発環境>

Microsoft Visual Code

kinect

<実装できた機能>

①画面上の音階の枠内に手が入るとその音が鳴る

②音階の下に楽譜を表示した

 

下の動画は実際にKinectを用いてきらきら星を演奏したものである。

VR動画に立体的な音の追加

スライド内の映像が再生できなかったので、下に載せておきます。

同時インパルス応答測定法におけるS/N比の改善の研究

救急車のドップラー効果の再現

デモ大会で発表した内容です。

[概要]
救急車のドップラー効果の再現

ドップラー効果の公式を用いて、周波数の計算を行い、MATLABで音を作成しました。

[開発環境]
MATLAB R2017b

詳しくは以下のスライドをご覧下さい。

[スライド]

[音源]
作成した救急車の音

(1)音の大きさを変化させた音

音声プレーヤー

(2)(1)に加え、左右で出力する音量を変化させた音
(イヤホンで聞くと右から左に通り過ぎるように聞こえます)

音声プレーヤー