株式会社 LegalOn Technologies / Site Reliability Engineer (SRE)
機械学習系APIの実行環境の構築と運用
GKE上に機械学習系のアプリケーション(gRPC)の実行環境をTerraformで構築。認証はCloud Endpointで行い、ESPv2はCloud Runに配置した。上記のアプリケーションをCloud BuildのGitHubトリガーを用いてビルドとデプロイを行っている。その他、AI Platform(Vertex AI)環境の運用やMLFlowサーバの構築と運用などを行っている。現在運用中。