This page is intended for users in Singapore. Go to the page for users in United States.

DLLAB DAY 2018 深層学習を使いこなす日ー資産運用とビッグデータ解析

ナウキャストの今井が登壇

2018/6/21にマイクロソフト主催のDEEP LEARNING LABの1周年イベントにナウキャストの今井が登壇しました。

DEEP LEARNING LABとは、深層学習の実社会での応用を推進したいというPreferred Networks様とMicrosoft様 の思いから生まれた、ディープラーニングに関連する技術とビジネスの両面に精通したプロ達が活動を行うコミュニティです。

以下、今井が登壇し、お話したことをご紹介します♪

【講演録】

 当社は投資家を対象に、オルタナティブデータと言われる、いままで投資の世界で使われていた一般的な情報とは異なるPOSデータやクレジットカードデータ等のデータを提供、データ解析をするベンチャーです。Finatextグループに入っています。



オルタナティブデータとは

 今、オルタナティブデータに投資家の注目が集まっています。オルタナティブデータを活用して投資を行い、利益を得ているのです。では、オルタナティブデータとは具体的には何でしょうか。何が最も使われているデータなのでしょうか。興味を持っている・活用を考えているオルタナティブデータはなにかという機関投資家向けの業界調査によりますと、Consumer Transaction Data、つまり消費者がいつどこで何を買ったかというデータを活用しているのがほとんどです。我々が注目している衛星画像データはあまり使われていない、もしくは大きな関心は集めていないのが現状です。もう一つ関心がもたれているのはBtoBのデータセットである、企業間の取引・関係性の情報ですが、入手が難しいというのが実情です。我々もこのデータの扱いには興味を持っています。


我々にとってのディープラーニング

 当社はオルタナティブデータを活用する会社でありますが、ディープラーニングは一つのメソッドでしかありません。トラディショナルなものも使うし、最新のディープラーニングも目的に合えば使うという立場をとっています。

 一般的によく言われますが、重要なのはディープラーニングに何のデータを入れてどう使うかです。端的にいうとGarbage to Garbageにしないことです。どれだけ価値があり希少性のあるデータを使ってもそのデータを汚いままいれてしまうと目的に対して最適なアウトプットは出てきません。ディープラーニングは非常に素直かつ高度なメソッドですので、データの性質を如実に表してくれますが、それが目的と一致するかは全くの別問題です。



我々が何を使っているか

 我々は投資家の皆さんに投資情報として、判断材料として使えるデータをお渡ししています。例えば、企業の商品売上の状況や成長性の予測、ネットでの評判のスコア、などです。

 先ほどの調査にあるように、投資家の皆さんは高い確率で消費者購買データに興味を持っています。消費者が何をどれだけ買っているかという情報が企業の業績に連動しています。そこで我々はPOSデータを用いて企業業績を予測しています。実際はより複雑ですが。

 マーケットコンセンサスの企業業績の予想に対して、我々は平均1%高い成果を出すことに成功しています。

 我々のPOSデータを買っていただければすべてのみなさんがモデルを構築できるのかというとそれはノーです。例として、オーガニックデータと私は呼びますが、オルタナティブデータをオーガニックな状態で、そのまま買ってきた状態のままディープラーニングにつっこんだらどうなるでしょうか。具体的なモデルは省きますが、実際の消費者購買データの売上が右肩上がりのとき、変化点検知を行い、明確な売上トレンドの変化点が機械によって得られたとします。確かに趨勢の変化はとらえられますが、実はPOSデータそのものの特性による変化を機械が見つけてきているだけです。この場合はPOSデータで収集しているお店の数が劇的に増えたという意味を表していただけであり、ただ単純にそれを探してきてくれたということです。

 つまり、オーガニックデータの性質をわからないままモデルに投入しても意味がないということです。



我々のこだわり

 我々ナウキャストは最終的なアウトプットのクオリティを最重要視し、モデルは一つの手段と考えています。まず、オーガニックデータを発掘してきます。それには消費者購買データだけでなく、衛星画像など様々なものがあります。しかしオーガーニックデータは、まだ原石の状態であるため、洗練していい方向にしないとまともなモデルは組めません。だからこそ我々は、データのクレンジングと適切なモデリングを行って、プロダクトとしての投資アイデアまでつなげられるかにこだわりをもってやっています。

ナウキャスト(Finatextグループ)としてデータサイエンティストを募集しています。
ご興味のある方はぜひ、ご応募ください。

https://www.wantedly.com/projects/207898

また、データサイエンティストとしてインターンも活躍しています。
サマーインターンも募集しておりますので、学生の方はこちらからご応募ください。

https://www.wantedly.com/projects/232871

株式会社Finatext's job postings
Anonymous
Picture?height=40&width=40
26993878 1415113415266479 4316090493587576707 n
2 Likes
Anonymous
Picture?height=40&width=40
26993878 1415113415266479 4316090493587576707 n
2 Likes

Weekly ranking

Show other rankings
If this story triggered your interest, go ahead and visit them to learn more

Page top icon