1
/
5

ABEJAのデータサイエンティストたちが語るリアル㊤

企業のAI支援で、欠かせない存在がデータサイエンティスト。
集めたデータで何ができるか、顧客の現場から出た要望に対して必要なデータの見立てや助言をする、AI支援の要です。
ABEJAにいるデータサイエンティストは、仕事にどう向き合っているのか。11月に開かれたイベント「大企業とDXを推進するデータサイエンティストたちが語るリアル」で、個性あふれる2人のDSが、そのあたりを余すことなくお伝えしました。

前編は、大垣翔さん。数学者になろうと博士号をとるも「他にもしたいことがある」と、金融業界へ。その後飛び込んだABEJAでは?


大垣翔
データサイエンティスト。 Ph.D. (数学)。 現在の専門は機械学習全般、時系列解析、金融工学。 2016年3月に大阪大学 数学専攻 博士後期課程を修了後、シンプレクス株式会社にて、クオンツとして大手金融機関の金融モデル開発に従事したのち、2018年8月ABEJAに参画。ABEJAでは、データサイエンティストとして、機械学習やデータサイエンスをビジネスで活用するべく、様々なプロジェクトに携わり、ディープラーニングを始めとする多様な機械学習モデルを取り扱う。また、数学の専門家として、数学を社会で役立てるための研究開発にも取り組む。


大垣: 元々は数学者になりたくて博士号も取ったんですが「ほかにもしたいことがある」と、東京・大手町の金融システムを作る会社に入り、「クオンツ」と呼ばれる金融機関のデータサイエンティストのような仕事を3年ほどしていました。

『物理学者、ウォール街を往く。』という、著名なクオンツが書いた本がありますが、私でいうなら、さしずめ「数学者、大手町を往く」といった感じですね。



その後ABEJAに入り「Use Case事業部」や小売向けSaaS「ABEJA Insight for Retail」でも、データサイエンティストとしてプロダクト開発に関わっています。
研究開発的なこともしています。九州大学の数学専攻関係者が主催している「Study Group Workshop」という、企業側の人間が課題を持ちこみ、数学の研究者や大学院生に解決のアイデアを出してもらう趣旨のワークショップに、課題提供者として参加しました。


ABEJAのデータサイエンティストの仕事とは



次に、具体的にどんな仕事をしているかについてお話します。
AIや、機械学習の活用を考える時、弊社では大体5つぐらいのフェーズに分けています=上図

私は初期段階の技術的なアドバイスから関わり始めることが多いです。PoCの段階にいくと、「どんなデータを用意したらいいか」という話から始まり、じゃあ「その上でどんなモデルを作ればいいか」も決める。そして実際にモデルを作ってみる。

使うデータですが、ABEJAはディープラーニング・画像系が強いイメージがありますが、実際は時系列のデータも、構造データも、自然言語も、全方位できるという印象です。


物流工場の仕事の「見える化」に取り組む

今日は図の①-③について、私が担当した大手物流会社の事例から紹介します。

この会社が持っている大きな物流センターの業務の「見える化」がミッションでした。約5か月で具体的なテーマに落とし、モデルを作り、検証していくーーという流れです。

最初の1ヵ月半でテーマを固め、次の3か月弱でアセスメントし、その次の2か月でデータ・モデル作りに取り組みました。
まず、どんな課題があるのかを洗い出すために、現場の担当者さんから話を聞いて流れを把握しました。

大きな倉庫にモノが入ってきてから、いったん在庫として保存され、出荷されるという過程を経て、最後に配送されていく。
この過程をすべて分解していきました。同時に今どんなことが行われているのか「現在地」の把握と、テクノロジーが将来、さらに進歩した先に何が待っているのかについても話を伺いました。


どこをAI化すれば価値が出るのか。課題を洗い出す

こうしたヒアリングを経て課題を洗い出していく段階に移ります。

「もしかしたらこういう課題があるのでは?」と仮説を立てた上で、実際に倉庫にカメラを設置して、現場の作業員が実際に何をしているかを見ながら「こういう課題があるんじゃないか?」と話し合いました。
いくつか課題が見えてきました。

まず倉庫に商品が入って来た時、その商品の情報を作る「入荷検品」に課題がありました。それから出荷の時や入退室の際にも課題がありました。
見つけ出した課題に対し、今度はAIで解決できることがないかを考えていきます。

実際、物流センターの様々な場所にカメラを付けて作業を見ながら「どこをAIモデル化すれば、限られた期間で短期的にも長期的にも価値が出るのか」を見つけていきました。

こうして最初の1か月半ほどは課題を洗い出し、次にどんなデータでどんなモデルを作ればいいのかを実証するPoCの段階に進みました。

物流センターの入荷から出荷までのプロセスは、もともと次のような流れです。

入荷作業ではまず、青い箱に入った商品を取りにいきます。次に、出荷作業では、梱包用の別の箱に、商品を指定された個数だけ入れる。その後、梱包用箱のフタを閉め、出荷します。最後に、入荷の際に商品が入っていた青い箱をしまうーーという流れになっています。

PoCでは、このプロセスのうち、指定された個数のアイテムが梱包用の箱にきちんと入っているかどうかを、物体検出というディープラーニングの技術で確認できるよう目指しました。

物流会社の事例は、社長同士で「こういうことをしていきたい」という話がまずあり、現場で取り組みを実現した、珍しい流れでした。経営者レベルでは「こういうことをやりたい」と大筋で合意できていても「では具体的にどういうテーマを設定するか」を決めるのは難しい面もあります。

通常は「こういうことをしたい」という現場の課題から、具体的にどんなモデル、データを用意するかからスタートする案件のほうが多いです。


ステークホルダーが揃って初めてビジネスができる

今日、一番話したかったことがあります。
個人的な思いですが、UseCase事業部を客観的に見ると、カジノのスロットに似てるなと感じています。

「777」(スリーセブン)が揃うと、10億円ももらえるスロットがあります。スロットはリールが3つとか4つあって、それが揃うといい。
これ、ステークホルダーも同じじゃないか、と思うんです。ステークホルダーには経営者もいれば、その下の経営企画レベルの人もいれば、現場の人もいれば、研究開発の人もいる。

そのステークホルダーのゴーサインがそろって初めて「777」になり、ビジネスが成り立つんじゃないかなと、最近実感しています。
例えば現場のプロジェクト担当者はセブンを出してくれていても、1個上に行くと駄目と言われて揃わないこともある。

機械学習の領域にスロットマシンにそれぞれどのくらいお金を配分すればリターンを最大にできるかを見つける「バンディット問題(multi-armed bandit problem)」というのがあります。その考えは、UC事業部のミッションとすごく似ているなと思います。



でも違う面もある。一番違うのが、目的です。
バンディット問題を考えると、最終的に持ってるお金が一番多ければいい訳だから、投資してもらったお金のリターンを最大にする行動を取る。

これが普通の企業の考えだとすると、対してUC(ABEJA)は「大当たり」を狙っている。「大当たりする回数」とか「大当たりの総量」の期待値を最大化する。ここが一般企業とUCの違うところだと思います。
スロットマシンは1回3ドルあれば挑戦できる。3ドル賭ければ、10億ぐらいもらえるチャンスが誰にでも訪れる。

他方で、UCで狙う「大当たり」は、大企業や業界全体に変革を起こす可能性がある優秀な人たちが揃った上で、さらに努力し続けて初めて得られるものなのかな、と振り返って思います。

質問:物流会社の事例で、大変だったことは?

大垣:具体的なPoCを行うための具体的なテーマを作り、「データはこれで」「モデルはこれで」と決めていくのは、すごく難しかったです。ABEJAが価値を出すのは、モデルを作り、最終的にそれをその先のビジネスの変革に繋げるビジョンを生み出した時です。

ただそういうのがなくても、うまくできてしまうケースもあります。そういう時にABEJAとしては、機械学習やディープラーニングに寄せるテーマを作るのが最適ですが、クライアントにとって、それが本当に価値になのか?とか、「それ、機械学習、使う必要あるの?」とか、そのあたりはすごく悩みましたし、毎回案件を受けるたびに悩むところではあります。

質問:ルールベースのアプローチも使いますか?

大垣:ルールベースのアプローチが有効な引き合いもありますが、できればやりたくないと思っています。ルールはメンテナンスが大変だったり、ヒアリングが大変だったりするから。顧客のビジネスのロジックが変われば、それに合わせて全部変えないといけない。ベンチャーとしてやっていくには、大変な領域かと思います。

質問:PoCのクライマックスステージで、モデルの開発者は、実際にどれくらい時間を割けるんですか?

大垣:データサイエンティストだと、だいたい一人2案件、1か2抱えていることが多いですね。その中でフェーズも違って、それぞれモデルを作ってるフェーズもあれば、片方は結構上流の、そもそもビジネス的な話をしている段階からアドバイスで入ってたりもしますし。
時期によっては本当にモデルだけ作っている時期もあります。逆にあまりソースコードは業務では書かず、技術調査だけしたり、ちょっとビジネス側の人と議論したり、お客さんと話したり、というフェーズが入ったりもあります。両方混ざるフェーズもあれば、という感じです。

(後編は2月6日配信予定です)


(2020年2月5日掲載の「note | テクプレたちの日常 by ABEJA」より転載)

ABEJAのデータサイエンティストたちが語るリアル㊤|テクプレたちの日常 by ABEJA|note
企業のAI支援で、欠かせない存在がデータサイエンティスト(DS)。集めたデータで何ができるか、顧客の現場から出た要望に対して必要なデータの見立てや助言をする、AI支援の要です。 ...
https://note.com/abeja/n/na274066b18a4
株式会社ABEJA's job postings

Weekly ranking

Show other rankings
Invitation from 株式会社ABEJA
If this story triggered your interest, have a chat with the team?