こんにちは!コインチェック人事部の山下です。
本日は、コインチェックの安心・安全を守るべく日々インフラ構築に奮闘するSREグループをご紹介します!
インタビューにこたえてくれたのは、SREグループの渡邉隆志(通称:わたりん)さん。暗号資産(仮想通貨)取引所のSREってどんな業務をしているの?チームの雰囲気や働きかたは?などなど、気になる疑問に迫ります!
ーコインチェックに入社するまでは何をされていたんですか?
ポータルサイトの会社でコミュニティ系サービスの開発をメインでやっていました。
2006年に同じ業界で転職したんですけど、当時サーバー周りのことをわかる人が少なくて、その中自分はデータベースなどもわかる方だったので、そこからインフラを担当するようになりました。
Coincheckに興味を持ったのは、新規事業のプロジェクトに入ったばかりの頃、元上司だったニールさん(現コインチェック執行役員、VP of Engineering)に声をかけてもらったのが最初ですね。
当時は新規事業のプロジェクトに注力していたので話を聞いただけだったんですけど、プロジェクトが終わったタイミングでコインチェックへの転職を決めました。新規事業で決済関連のシステムに関わったのと、以前からIT統制とかセキュリティとかも担当していたこともあって、自分がこれまでやってきたことがどこまで通用するのか試してみたい!と思うようになったのが入社の決め手ですね。
ーSREグループはどのような業務をしているんでしょうか?
業務内容は主にAWSを使用したインフラの構築・運用になります。トイル削減や、セキュリティ・信頼性向上、また会社全体の開発スピード向上のための開発がメインの業務です。
例えば最近ですと、
- Infrastructure as CodeやGitOpsの強化
- AutoScaling等の自動運用の導入
- セキュリティツールの入れ替えや、設定の強化
- 各種ツールやミドルウェア等の継続的なバージョンアップ
- 監視設定の継続的な見直し
- Deployの高速化・安定化のためのDeploy方式の変更
- 検証環境の強化
などを行っています。
また、新規サービスのためのインフラ構築の案件もありますね。その際には既存の構成をそのまま使い回すのではなく、サービスの要件にあわせて、どういった構成がよいかをよく検討します。その結果、Serverlessや、コンテナなどを活用した新しい構成とすることもあります。
近いところで、アプリケーション開発の部門からのいろいろな相談とかも日常的にあり、それからインフラの改善や構築につながることもあります。
あとは、インシデントがあったときの対応や、そのポストモーテム、再発防止策の実施も大事な業務ですね。もちろん、日常の監視と対応や、各部署からの依頼対応なども毎日行っていますが、いろいろな改善を進めている効果も出てきて、最近はこういったトイル業務の割合が、よく言われている50%以下に収まるようになってきています。
SLOも最近策定して、運用を始めました。
ーチームの雰囲気や働き方について教えてください!
私を入れて5人なんですけど、インフラ・SREをずっとやっているメンバーから、元iOSやサーバーサイド開発エンジニアもいます。年齢は私が40代で、その他のメンバーは30代前半くらいですね。
チームの雰囲気は非常にいいと思います。心理的安全性が担保されているというか、気になる点があればチームみんな遠慮なく意見を言い合ってますね(笑)。
技術が好きなメンバーばかりなので、「こんなものがあるらしいよ」「これってどんな内容なの?」など、日常的に技術的なコミュニケーションを取っているんですよね。こういった議論を活発にしているからこそ、お互いを尊重しながら意見を言い合える関係性ができているんだと思います。
ー他部署から見てもSREの人たちは”技術好き”のイメージがあります(笑)。今はどのような働き方をされているのでしょう?
今はほぼリモートワークですね。自宅のネットワークだと時間がかかってしまう時などは出社することもありますが、基本的には自宅作業です。
リモートになってからは毎日朝会・夕会を実施していますね。なにをやっているかの共有はもちろん、業務内容の意見交換や相談などもできるようにしています。四半期かけて週に数回1日1~2時間ほど時間をとり、今の課題や今後やっていきたいことの議論もしていますね。
こういった定例以外にも、SlackとあわせてZOOMにもグループの常設部屋を用意していて、雑談から相談まで密にやり取りができるように心がけています。グループ内で簡単な勉強会やワークショップ的なことをしたり、隔週でのKPTなども実施してますよ!
ーコインチェックならではのSRE業務の魅力や課題などはありますか?
コンプライアンス対応だけではないセキュリティ対策を実践できるところですかね。金融業としての統制・セキュリティとネットサービスとしてのアジャイルの両立に挑戦できるのは、コインチェックならではの環境だと思います。インフラに関する部門・個人の裁量が大きい点も魅力ですね。
上司や執行役員との風通しがいいことも特徴的ですね。担当執行役員は、開発だけでなく、インフラやセキュリティのバックグラウンドもあるので、現場のことをしっかり理解してくれています。またお金についても規模感のズレがないのはとても仕事がしやすいです。
課題でいうと、セキュリティを最優先でやってきたので、それ以外のことが追いついていないんですよ。いわゆるトイル的な業務がまだまだ残っている状態です。
セキュリティのために、SREグループでは私を含めメンバー全員が暗号資産の鍵には一切アクセスすることができないようになっていますし、本番環境へのSSHや構成変更などもできないようになっています。
なので、この制約の中で、いかにうまくやっていくか、を考えるのがとても大事ですね。
今のコインチェックは、サービス・組織ともに、モノリシック・単一RDBでサービスが提供できるぎりぎりのところに近づいてきていると思っています。だからこそ、今後サービスが伸びていく中での負荷対策や、アーキテクチャ更新などをリアルで体験できる可能性があることも今後、面白くなってくると思いますよ。会社規模やサービスの成長を肌で感じながら対策をしていくことはなかなかできない経験なので。
ー今後一緒に働きたい、SREグループに向いているのはどのような人でしょうか?
技術が好きな方ですね。チームの雰囲気の良さの根本には「技術好き」という共通点が大きいと思っています。あとは、アラートやメトリクス、ログなどを見るのが好きな人は向いているのではないでしょうか。
ただし、とにかく新しい技術やシステムをどんどん使いたい!という人は難しいかもしれません。高いセキュリティ・統制要件の裏腹として、自由に本番環境をいじることはできないですし、どうしても高い信頼性が要求されます。こういった制約がない会社に比べると、どうしても、技術的な自由が少ないとか、進みが遅いなどと感じたりする場面は出てきてしまいます。そういった制約のなかで、いかにより良いものを素早く作っていくのか、ということを楽しめる方が向いていると思います。
一緒に仕事をしていく仲間なので、自分だけの仕事を作って抱え込まないように、積極的に議論やコミュニケーションをとっていける人だと嬉しいですね。
インタビューにご協力いただきありがとうございました!
この記事を読んでコインチェックにご興味を持っていただいた方、SREで一緒に働いてみたいと思った方、是非ご連絡お待ちしております!