1
/
5

データドリブンで取り組むトラブルシューティング

運用エンジニアとして

私はユーザー企業の情シス部門でインフラの運用エンジニアをやってきました。
新卒で配属されたばかりのころは社内で障害が多く、対応を繰り返すうちに技術的な基礎が身につきました。このとき私が思ったことは、外部ITベンダのサポートもレベルにばらつきがあり、丸投げではうまく行かない事、自らもきちんと技術と向き合い勉強していかなければシステム運用は出来ないということでした。

トラブルシューティングのため、最初は見よう見まねではじめた通信パケットの解析がスキルとして徐々に形になり、システムの問題解決が得意になっていきました。

SDNとの出逢い

社内でネットワークに一番詳しい、という状態になった時、SDNに出会いました。SDNとは、Software Defined Netwrokという「ネットワークをソフトウェアで制御して上手に使おうという技術」です。ちょうどSDNから撤退する会社がエンジニアの受け皿を探していたため、自社が手を上げて新技術に参入しようとする計画が持ち上がり、「社内で詳しい奴は誰だ?」と経営会議に呼ばれることになりました。チャンスだとばかりに熱弁をふるい、結果、SDN市場への参入が決まりました。

情シスの一担当者でありながらSDNの凄腕エンジニアたちと交流する機会に恵まれ、そこで私も参画して開発したOpenflowという仕組みを利用したネットワークシステムを、私が管理する海外現地法人に導入することになりました。

まだ市場に事例がほとんど無いネットワークシステムを小規模とはいえ、いきなり本番で使う事には社内にもかなりの抵抗がありましたが、全て自分で責任を持つ事を約束し、現地法人のトップにも働きかけた結果、OKが出ました。長年ITサポートで現地との信頼を築いていた結果だと思います。

余談ですが、このプロジェクトではほとんどノートラブルで国際VPNの通信品質が劇的に改善し、現地従業員には非常に感謝されましたが、システムは売れ行きが悪く、後に撤退が決まります。

思わぬ発見

ソフトウェア制御のシステムを現地に導入するにあたり、デバッグの仕組みを予め整える必要がありました。全ての通信を収集して問題解決に当たれるよう、自作のパケットキャプチャ装置を作りました。これはネットワークに流れる全てのデータを解析するための仕組みです。

データ収集の仕組みを整え、現地に導入した結果、今まで手間がかかっていた遠隔でのトラブル解決に非常に有用である事が分かりました。プライベートの時間を使って機能拡張を行い、機械学習による異常検知機能やWEBのダッシュボードなどを整えるうちにこの仕組みが非常に大きな可能性を秘めていると感じるようになりました。

今後は収集したデータを高度に活用する仕組みと、それらをビジネスにどう使うかという点について検討したいと考えています。