1
/
5

機械学習勉強会で原点への振り返り堅田 洋資

データミックスにおける勉強会

データミックスはデータサイエンティストを育成したり、コンサルティングのサービスを提供している会社です。データミックスでは他の会社の方達と交流することで新しい気づきや発見があったら楽しいよね!ということで勉強会を主催したりしています。ということで、その勉強会の様子をお伝えしたいと思います!

今回の勉強会はレコメンデーションのお話

対象者はエンジニアとして機械学習を使っている方や、業務で使おうかと考えている人向けの勉強会でした。場所は弊社のセミナールームです。普段はたくさん机が並んでいるのですが、30名近い方が参加されるということで椅子だけにしたので、こんな写真になっています。

プロトタイプからサービスまでの苦難を語ってくれた久松さん

スピーカーは株式会社Speeeでデータサイエンティストをされている久松さんと白ヤギコーポレーションのエンジニアである谷田さんのお二人でした。

久松さんは業務でレコメンデーションエンジンを開発されており、そのプロトタイプから実際のサービスにする過程の苦労や、A/Bテストで工夫したことなどをお話していただきました。話を聞きながら頷いている方も多くいて「機械学習を実際の業務で使うための実装力」が重要だなぁと改めて感じました。お話の中で印象に残っているのが、同時に重たい処理を行うためのアーキテクチャーの工夫とパラメーターチューニングを行うためのダッシュボードを作るといった様々な工夫です。その中でも特に印象的だったのは、Speeeさんからエンジニアの方含めて他にも5名ほど参加されていて、久松さんはもちろん様々なスキルを持った人たち全員で難しい問題をクリアされてきたのだろうと感じて、最後に大事なのはチームプレーですね!って思いました。


続いての登壇は白ヤギ谷田さん「ゼロから始めるレコメンダシステム」

谷田さんは風邪気味にもかかわらず1時間弱ぶっ通しで話してくれました。内容は、協調フィルタリングに始まり、行列分解を用いた方法、コンテンツベースレコメンデーション、最後にFactorization Machinesを紹介してくれました。久松さんは実務の泥臭い部分をお話してくださったのに対し、谷田さんは理論的な部分を触れながら説明してくれたので結果的にはちょうど良いバランスだったのではと思います。

Factorization MachinesはKaggleでも時々登場する手法で、ざっくりいうと線形回帰の進化形?のようなもので、交互作用項に係る回帰係数をパラメーターそのものではなく、行列分解した形でパラメーターを持っておくモデルです。その部分がFactozation(行列分解)なんですね。協調フィルタリングだとuser x itemの行列の形でデータを持ちますが、Factorization Machinesの場合は、user x item x contextといった形でデータを持つことができます(contextの部分はなんでも良いはず)。さらに面白いのはパラメーターが増えるんですが、実は学習時間はそこまで増えない工夫がされているいうのもFactorization Machinesのすごいところです(興味がある方は元の論文読んでみてください)。


最後にビール&ピザパーティ!

数式を書きながら改めて議論する一幕や、「最近どうよ」的な話で盛り上がっている人など様々でしたが、楽しかったですね!また企画してやろうと思います!

ご参加いただいたみなさん、スピーカーのお二人、ありがとうございました!

株式会社データミックス's job postings
5 Likes
5 Likes

Weekly ranking

Show other rankings