2017-10-03から1日間の記事一覧

音声信号をSTFT、MS、MFCC、CQTで可視化してみる

広田研・廣瀬研にいたときに視触覚のクロスモダリティをテーマに研究をしていた。 GANの応用について調べていたら、同じクロスモダリティを扱った論文を見つけた。 Deep Cross-Modal Audio-Visual Generation https://arxiv.org/abs/1704.08292 この中で音声…