こんにちは。HEROZ広報の片桐です!
プレスリリースも出させていただきましたが、
NVIDIA DGX-1システム12台を追加し合計GPU 128枚の計算機環境を構築しました!!!
増加したGPUの使い道とエンジニア勢の感想を聞いてみました!
導入のきっかけ
HEROZのエンジニアのみなさんは案件への取り組みや個々の研究にとても熱心です!
(私はHEROZの職場の雰囲気は大学の研究室みたいだなーといつも思っています。)
最近はBtoB案件が増えたことに伴い、複雑なデータや大量のデータが増加しています。
「もっと自由に計算リソースを使用できたらな・・。」「混みあっていて使いづらいな・・・」
エンジニアのそんな思いと背景から導入となりました。
最新のTeslaV100搭載NVIDIA DGX-1システム12台を追加導入し、合計128枚のGPUを設置
・この量は「HEROZはAIベンチャー企業で国内最大規模となるDGX-1クラスタ環境」とエヌビディア合同会社 エンタープライズ事業部 事業部長の井﨑様よりコメントいただきました!
・性能としては、理論上のピーク性能は16PFLOPS!
・これをエンジニアが利用できる環境として、AWSやGCPなどのクラウドサーバーリソースに当てはめると、月額200万円相当のリソースを自由に利用できることになります!
・処理速度としては、CPUと比較してGPUは約80%時間を削減できる!
エンジニアの反応
・案件化していない自主研究にも使えて嬉しい
・メモリ、CPU、ストレージどれも強化されて、処理速度が上がった
・実験が分散して行えるなど効率的な作業が可能になった
・順番待ちしなくてもよい
・1人あたりの使用量が他社に比べて多いから嬉しい
・他の人への影響を気にすることなく実験ができるようになった
・今後はもっと積極的に使っていきたい
今後の活用について
・時系列データの高頻度な処理
HEROZが提供している自動監視・異常検知ツール「HEROZ Kishin Monitor」では、プラットフォームを監視し、データを取得、そのデータを解析し、AIが未来の動きを予測します。そして実測値が予測から大きく外れると異常のアラートを出してくれます。このツールの監視タイミングや過去のデータを用いた未来予測の頻度を、これまでより高頻度にし、精度を高めていきます。
・より複雑で大量なデータの処理
HEROZでは、様々な産業領域へAIを提供していますが、建設領域で用いるCADやBIMデータは建物の3次元モデルデータに建物形状・空間関係、地理情報、建物部材の数量や特性を含んだデータです。このような複雑なデータを用いて検証を行う際にも、高性能GPUによってより効率良く処理を行っていきます。
[おまけ]
あるエンジニアが早速新しいGPUで実験してみました!
この度導入したTesla V100搭載のMASやDGX-1は既存のものと比較してどのくらい処理速度が上がるのだろうか?
そんな思いから、複数のプログラミング言語を用いて、同じ計算負荷をかけ、速度の違いを調べてみました!
※DGX-1はdocker上で実行。 ※空欄は時間の関係上実験していません。。すみません。。
―考察・まとめー
・既存サーバに比べるとMASとDGX-1は速度が速い!
・dockerでも早く処理できる!
・プログラミング言語の速度差が結構あるので、状況に応じて選定する必要がある
<Python>
機械学習の便利なライブラリが多いですが、実行速度の面で注意して使う必要あり
<CUDA>
CPUとGPUのデータのやり取りが速度のボトルネックになりやすい
⇒少量のデータを逐次的に処理するプロジェクトには向かない
⇒大量のデータを一括で計算させるプロジェクトに適している
<その他の言語>
C++だけでなく、JAVAや.NETも十分速い
※あくまでも、個人の意見です。ご了承ください。
エンジニアのみなさんもHEROZの最新GPUを使って一緒にお仕事しませんか?(^▽^)
本日はHEROZの計算環境についてお話をさせていただきました。
進化を続けるHEROZにぜひ遊びにきてください!