実践MLOps オープンソースプラットフォームMLflowの紹介【社内勉強会レポート】 | 社内勉強会
GRIでは、「Hacky Monday」というエンジニア勉強会を開催しており、Streamlitなどを利用してクイックに開発したモックを共有しています。新規プロダクトのアイデア共有やスキルアップ...
https://www.wantedly.com/companies/gri/post_articles/499130
GRIデータサイエンス事業部では普段、案件ごとにチームに分けて仕事を進めていますが、この度は、各自担当している案件において、他の案件でも参考になる有益な情報を共有する勉強会【横展会】を定期的に実施することになりました。月一頻度で月曜のランチタイムにオンラインで開催し、社員は自由に参加できます。
発表者が案件で培った知見を他のメンバーに共有することで、組織(主にDS事業部)に貢献し、聴講者が自分の案件でも活かせそうな知見を取得し各自のクライアントに貢献できることを目標としています。
今までも、隔週水曜日に新規プロダクトのアイデア共有やスキルアップの場としての役割を果たす「Hacky Monday」が開かれていました。Hacky Mondayの第一回勉強会レポートはリンクからご覧になれます。
本記事では、2023年10月23日に開催された第一回横展会の内容の概要をお届けします。今回のスピーカーはGRIマネージャ望月です。
まず、データカタログが必要とされる背景を紹介します。今回のクライアント企業は、データの収集、蓄積からダッシュボードの制作、共有までのワークフローが定着化し、データドリブンの組織文化が一定程度進んでいます。ETLツール(Matillion)で抽出・変換・書き出しを行い、クラウドベースなデータウェアハウス(Snowflake)に格納し、可視化ツール(Tableau)と連携してビジネスインサイトを社内に共有しています。
しかし今までは、Snowflake上のテーブルが乱立していて、どれが良く使われているテーブルか、ワークブックやテーブルをメンテナンスする際に影響範囲も不明な状態で、いざメンテナンスしようとしても、対応関係がまとまっておらず調べるのに時間がかかっていました。
そこで、組織内のデータに関する情報を整備し、一元化して管理するために、Tableau Cloud上にパブリッシュされているワークブックとそのワークブックに紐づくデータの対応関係を把握するための対応表をTableau Desktopで作成しました。
メタデータAPIを利用してワークブックとテーブルの対応表の取得方法については以下のブログ記事にまとめています。
また、ワークブックへのアクセス回数をTableau CloudでのAdmin insightsから、TS Eventsというデータを取得することができます。それらを使ってワークブックの作成者や作成時間などのメタデータと、直近90日間のアクセス数とアクセスユーザー数を可視化したダッシュボードを作ることができます。
勉強会の後半では、運用で日次などでメタデータを自動更新したい場合、Matillion上でメタデータAPIの利用方法について紹介しました。早速他の案件で役に立ったみたいです!
今回の横展会では、メタデータAPIとAdmin Insightsを利用したデータカタログ作成についてお話しました。参加者からは「ニッチなポイントでの時間の浪費を防げる」といった声が聞かれました。
次回は分析官の横井から「大規模データ基盤構築とIoTデータの可視化」について共有する予定です。次回のイベントレポートもお楽しみに!
GRIでは、一緒に働く方を募集中です!
領域にとらわれず柔軟にイノベーションを創出する仕事に興味のある方、GRIで働いてみませんか?
詳しくはこちら → https://gri.jp/recruit