こんにちは!
バンダイナムコネクサスのデータ戦略部でデータマネージャーをしている吉村です。
データ戦略部ではバンダイナムコグループのデータを使い、ビジネスに貢献するための取り組みを進めています。
データを利用するためにはデータ分析のスキルも重要ですが、利用者が安全に利用しやすいようにデータを管理する事も同様に重要です。
正しく管理されているデータとスキルを持ったデータ利用者がいることで、ビジネスにおけるデータの価値は跳ね上がります。
一般的に、ビジネスに役に立つようにデータを資産として管理することをデータマネジメントと呼びます。
バンダイナムコネクサスのデータマネージャーがデータをどのように管理して、利用者が利用しやすいようデータを管理しているのか紹介します。
バンダイナムコグループにおけるデータマネジメントとは
バンダイナムコネクサスはグループのデータ利活用の推進を担っている主軸の会社であり、エンターテインメント事業を幅広く行っているバンダイナムコグループのデータマネジメントを行う必要があります。
データマネジメントとは具体的に何を行うかというと、バンダイナムコグループ全社を対象に「ビジネスに必要なデータを収集する」こと、及び「収集したデータを安全に利用しやすいように管理する」ことを行います。
データマネジメントは保持しているデータをいかにモダンな環境で管理するのかというエンジニアリングを主軸として語られることも多いですが、ビジネスに必要なデータをいかに集めてくるのかということもスコープに入ります。
今回は上記2点をどのようにして取り組むのかについて説明します。
ビジネスに必要なデータを収集する
データの管理はビジネスに役立てるために行います。逆算するとビジネスに役に立つデータを収集しなければなりません。
既に情報系システムに存在するのであれば、システム間で連携して収集すればよいですが、ビジネスに役に立つデータが必ずしも情報系システムに存在するとは限りません。
どのようにしてデータを特定し、収集するのか以下にゲームの分析に関するデータを収集するサンプルケースを記載します。
サンプルケースでは分析を手段としているのでデータサイエンティストと連携してますが、機械学習が手段となる場合は機械学習エンジニアと連携して進めます。
1.まずどのようなことを行いビジネスに貢献するのか決める
例えばゲームの次回作を作る時の材料として「ユーザーはゲームをどのような体験を期待しているのか調査する」ことを分析の目的に設定します。
データサイエンティストより、調査の方法としては、データを利用した定量分析と、ユーザーの意見を利用した定性分析を行うと連携を受けました。
2.それを実現するために必要なデータは何かを特定する
データサイエンティストと連携して必要なデータを定義します。定量分析のために必要なデータはユーザーの属性情報、利用状況、ログ情報と定義しました。
また、定性分析のために必要なデータは今作のユーザーからのインタビューやアンケートが候補となりますが、今回はアンケートが必要だと定義しました。
3.必要なデータの保持先を特定する
ここからはデータマネージャーがメインとなる領域です。
ユーザーの属性情報、利用状況、ログ情報はすでに管理していたので、問題なく利用できることがわかりました。
一方、アンケートはバンダイナムコネクサスには保持していないことがわかりました。
バンダイナムコネクサスには保持していないので、BNグループ内で保持している会社を探すか、新たにアンケートを取るかになります。
BNグループ内の関連部門に声を掛けたらアンケートが存在することがわかりました。
4.保持先にデータをもらえるように条件を詰める
保持先がわかれば、アンケートを保持しているグループ会社に相談を持ち掛けます。
この時一番大切なのは、お客様のプライバシーを守ることで、アンケートの授受に関してお客様に不利益が生じないかを確認することです。
法令、セキュリティ上も問題ないことが確認できれば具体的に授受に進めます。
収集したデータを利用しやすいように管理する
収集したデータもビジネスに利用できるように管理していなければ意味がありません。そのためには使いやすい環境に、使いやすい形で保管しておく必要があります。
データ収集に続いて、収集したデータをどう管理するのかを紹介します。
1.具体的なデータを調査する
まずアンケートのフォーマットを特定します。今回はアンケートはCSVで管理されていました。 中身をチェックした結果、目的であるゲームの分析に使えそうなデータであることが確定したので、システム的にどう管理すれば利用しやすいかを検討します。
2.データの連携方法を決める
対象データについてデータエンジニアと連携して、データをどのように取り込むのかを決めます。 今回は一時的に取得したアンケートだったため、データが自動連係される開発は不要で、ショットでBigQueryに取り込むことになりました。
3.データを検品する
その後は、CSVの中身をいわゆるデータ品質に関する観点でチェックをします。 ここでデータ品質に問題があり、このままでは利用できないと判断された場合は、保持先と品質の高いデータを得ることが可能か相談しなおす必要があります。
4.データの保管方法を決める
ここまででビジネス目的に適したデータと品質の担保ができました。 今回のアンケートは前提と内容から、CSVをBigQueryにインポートして取り込むことにしました。 BigQueryの管理ルールに従ってデータを保管します。もちろん、セキュリティが担保されるように、規則に従った権限管理をしっかり行います。
5.利用に必要な情報を整える
最後はメタデータ管理として、一連の工程で明らかになったメタデータをデータカタログに反映していきます。 あとは、データサイエンティストが当初掲げていた分析を行えば完了です。
以上で、データマネージャーの業務である「ビジネスに必要なデータを収集する」こと、及び「収集したデータを利用しやすいように管理する」ことを紹介しました。
データを利用者が利用しやすいようにデータを管理するデータマネージャーがいることで、データエンジニア、データサイエンティスト、機械学習エンジニアは本来の業務に専念することができます。
さいごに
バンダイナムコネスサスのデータマネジメント業務の紹介は以上になります。
データマネージャーはデータエンジニア、データサイエンティスト、機械学習エンジニアと密に連携して、幅広い取り組みを行っております。
データ業界で注目されているデータマネジメントが組織として整備されているバンダイナムコネクサスでデータ利活用を行いませんか。
少しでも興味を持って頂けたら気軽にお話を聞きに来て下さい!