半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索

Abstract

本論文では音響信号自動タグ付け・検索問題に対し,半教師付き正準密度推定法SSCDE(Semi-supervised canonical density estimation)の適用を試みる.SSCDEは正準相関分析にタグ無しサンプルの大域的分布構造を組み込んだ半教師型正準相関分析(SemiCCA)によりトピックを表現する潜在変数の空間を構築し,カーネル密度推定法を半教師化した多クラスSSKDEによって潜在変数空間上のモデル学習を行う,トピックモデルに基づく半教師型の学習手法である.この手法は画像認識・検索の分野において提案されたものであるが,音響信号に対する適用もスムーズに行うことができる.実際の音楽データを用いた実験により,使用できるタグ付き音響信号が少ない状況下でも,SSCDEを用いて半教師型の学習を行うことにより,タグ付け性能が向上することを確認した.

Publication
電子情報通信学会技術研究報告 PRMU

Related