非负矩阵分解音乐数据

大家好，我是EYS的张森，在EYS从事音乐机器学习的开发业务。今天我们谈谈非负矩阵分解（NMF）。

矩阵分解和非负矩阵分解

从某段钢琴的触的第一成分

第一成分强度的时间推移

矩阵分解，就是把一个（N，M）的矩阵V分解成两个矩阵W和H

V = WH

W和H分别为（N，h）和（h, M）的矩阵。这样一来，乍一看好像需要处理的变数增加了，然而通常情况下h远远小于N和M，所以整体的成分是减少的。也就是说用更少的数字记述同一个量。

在这里，V相当于你拥有N个样本，每个样本里有M种数据。而把V分解成W和H，就相当于你把原先有M成分的量分解成h种主要的成分（H），然后把每个样本数据用这h种成分来说明（W）。这样做的原因是，M在数量上可能有很多，但起主要作用的因素往往没有那么多。H把主要成分抽取了出来，有时也被称为字典（dictionary）。

比如说音乐，我们可以把频谱当作行列来看，每段时间就相当于一个样本，每段时间内的每个频率振幅就相当于样本所带的数据。我们知道每个声音往往都有其固定的频率分布，而矩阵分解就相当于抽出其中最常见的几种分布（比如说各种音高的音频分布等），然后用它们重新构成原先的音乐。频谱通常取傅立叶分解系数的绝对值，V是一个正值的矩阵，我们需要H也是正值。而我们把声音分解成各个成分时也每个成分应该也是正的，所以也需要W为正值。在V为正的前提下，保证W和H为正直的分解，就是非负矩阵分解。

实际效果

接下来我们看看处理的实际效果。声音是随便从Freesound.org下载的。

https://drive.google.com/open?id=1q-CbQ12pJ_fgs80vltTbPGZMtK-JCq2l

如果只用一种成分（h=1）的话，结果就是一种声音在演奏

https://drive.google.com/open?id=1Zxixv4mE4S7IWQYYgKF6FEhZkwJwjWjx

用五种成分（h=5）时，声音就显得有变化了：

https://drive.google.com/open?id=1MyXEPLIHhRe6B7VlDNFMQwi3GJEePHua

用十种成分，声音好许多了：

https://drive.google.com/open?id=1b1tbW4y8mXoklsCaxEFpmkcJdC4xed2S

用二十种成分，一部分余韵似乎也出来了：

https://drive.google.com/open?id=17F--ZBIzRe-aAR8Idi6HKSZKdGgbmtWF

需要注意的是，傅立叶分析后的数据每个样本里有600多个成分，现在仅用20个成分就可以几乎重现原本的声音了。说明钢琴声音作为音乐数据，内部应该是存在很强的结构和规律的。

最后，我们把整个音频的频率分布和NMF成分做了一个比较动画，供大家参考。

https://youtu.be/-ON8m7u2BWo

2nd Community株式会社's job postings

非负矩阵分解音乐数据

張森

2nd Community株式会社 / Engineer/programmer

分析機械学習

2nd Community株式会社

"主力事業である音楽学習事業(EYS音楽教室)を起点に、 ■音楽学習事業根幹事業でもある音楽教室の運営。「音楽教室は楽しくない」というこれまでの常識を覆した当社独自のビジネスモデルを、現場×カスタマー×本部の三方向において、人でなければできない領域を常に思考させ、牽引していく部門。 ■Inspiart（楽曲制作・流通）事業ブロックチェーン技術を用いた著作権管理をおこない、機会学習を活用した楽曲制作機能を用いて、誰でも自由に世界中の人とセッションし、オリジナル楽曲をリリースでき、且つ収入も得られる新しい仕組み（世界）を作り上げる事業です ■Otolier（楽器製造・販売）事業貿易ルートの開拓や世界各地の楽器工房の開拓を行い、各工房から自由に楽器を販売・購入できるサイトを構築し、世界の楽器市場にメスを入れることがOtolier事業部のミッションです。 ■コミュニティー事業学習事業において競争優位を確立した現在、最も重要視しているのが中小都市型のビジネスモデルの成功と、全国１０００箇所へのスタジオ展開。その実現に向けた戦略立案と実施を行うことがコミュニティー事業のミッション。 ■地球住所プロジェクト「エンジニアと音楽家は言語に左右されず、世界のどこでも活躍ができるはず」この思想のもと、世界基準で活躍できるエンジニアを多数輩出することが大きなミッションです。 ■エンターテインメント事業参加型プラットフォームの開発や、気軽にオンステージ体験できるライブイベントの開催、フェスの企画・運営は勿論のこと、音楽でもっと自己表現ができる世界を作り上げることがミッションです。以上、主に6つの事業を多角的に展開しています。弊社の特徴は、・利益化が難しいとされるコンシューマー向けの学習教室において、データマーケティングやオペレーションの効率化を積極敵に導入し、事業の合理化を実現している点・常にユーザーファーストを貫き、ユーザーニーズに基づく品質の高い学習コンテンツを量産できる体制を有している点・内製化された高い技術力をベースに、音楽・教育業界に革新をもたらすIoT/AI/blocchain等の最先端テクノロジーを事業化させている点にあります。また、業界でも異例の連続的な事業成長を牽引しているメンバーは、有名企業で活躍を続けてきたエンジニアやトッププレイヤー、新卒で弊社に入社し、若くして執行役員や事業管掌を任されてきた優秀なメンバー達です。音楽業界・教育業界・エンタメ業界に革新をもたらす既存事業の価値向上および、壮大なビジョンの実現に向けて、仲間を積極的に募集しています。

Like 張森's Story

Let 張森's company know you're interested in their content

2nd Community株式会社

分析

Weekly ranking