ゼロから始めるGPUサーバー構築

株式会社STAR AIの技術チームです。
弊社ではテックブログを更新しているのですが、そこで公開された技術情報を
wantedly内でも共有します。

今後もテックブログシリーズや技術の最新情報などがあれば発信していきます。
どうぞよろしくお願いいたします。

少し長くなりますが、ぜひお時間のある方は最後まで見ていただけると嬉しいです。

はじめに
必要な環境（構築時に選定が必要な項目）
1. AWS関連（構築時に選ぶことになる項目）
2. サーバー内環境（プロジェクトに応じて変わる構成）
AWSインスタンスの作成
1. EC2サーバーにログイン
2. インスタンス名を入力
3. OSを選ぶ
4. インスタンスタイプを選ぶ
5. キーペアの作成
6. ストレージを入力
Elastic IPの設定
1. Elastic IPの管理画面に移動
2. IPアドレスを紐づける
キーファイルの保存先と権限設定
1. キーファイルの保存先を確認
2. 権限の変更コマンドを実行
3. 権限が正しく変更されたか確認
SSH接続の設定
1. SSH設定ファイルの編集
2. VSCodeでリモート接続
Anacondaのインストール（仮想環境構築）
1. ディレクトリの作成
2. Anacondaのダウンロード
3. 仮想環境の作成と有効化
nvidia-smiのインストール
1. 推奨ドライバの確認
2. ドライバのインストール
3. インスタンスの再起動
4. 動作確認（nvidia-smi）
必要ライブラリのインストール
1. MeCabのインストール
2. mecab-ipadic-neologdのインストール
3. Pytorchのインストール
4. その他のインストール
モデルを稼働させる
1. モデルの読み込み
2. プロンプト
3. 出力の制御
4. 結果
おわり

はじめに

今回は、LLM（大規模言語モデル）を活用した機能開発にあたり、GPUサーバーを構築する必要があったため、その手順を備忘録としてまとめました。
AWSのGPUインスタンスを使い、LLMが動作可能な開発環境をゼロから構築する流れをご紹介します。モデルのサイズや使用用途によって求められるGPU性能は異なりますが、本記事の手順で多くのケースに対応できるはずです。

必要な環境（構築時に選定が必要な項目）

ここでは、LLMを動作させるために必要な環境のうち、特にプロジェクトや利用者ごとに構成が変わるポイントを中心に整理しています。ネットワーク接続やエディタの準備といった基本的な部分は割愛し、それぞれの環境に応じて補っていただければと思います。

1. AWS関連（構築時に選ぶことになる項目）

2. サーバー内環境（プロジェクトに応じて変わる構成）

AWSインスタンスの作成

AWSでGPUインスタンスを作成する手順を解説します。インスタンスのタイプやOS、キーペアの設定など、実際に使い始めるまでの基本構成を整えていきます。

1. EC2サーバーにログイン

AWSマネジメントコンソールにログインし、「EC2」サービスを開きます。インスタンスの管理画面から「インスタンスを起動」をクリックします。

2. インスタンス名を入力

インスタンスに任意の名前を設定します。チームで共有する場合は、タスク名や目的がわかりやすい名前にしておくと管理がスムーズです。

3. OSを選ぶ

使用するOSは「Ubuntu」を選びます。本記事の手順はUbuntu環境に基づいています。他のOSを使用する場合は、コマンドの違いに注意してください。

4. インスタンスタイプを選ぶ

LLMの処理にはGPUが必要なため、GPU搭載のインスタンスタイプを選択します。今回は「g4dn.2xlarge」を例にしていますが、モデルのサイズや用途に応じて適宜選択してください。

5. キーペアの作成

SSH接続用のキーペアを作成します。すでにキーペアがある場合はそれを再利用しても問題ありません。新しく作成する場合は以下を参考にしてください。

キーペア名：お好きな名前で良いです
キーペアタイプ：「RSA」
ファイル形式：「.pem」を選択してください

作成した秘密鍵（.pemファイル）は、安全な場所に保管しましょう。

6. ストレージを入力

必要に応じてストレージサイズを指定します。今回は256GiBを設定していますが、用途に応じて変更可能です。ルートボリュームはデフォルト設定のままで問題ありません。

Elastic IPの設定

EC2インスタンスを作成した直後は、接続のたびにパブリックIPアドレスが変更される仕様になっています。これではSSH接続のたびにIPアドレスを確認する手間がかかるため、**Elastic IP（固定IP）**を割り当てて接続を安定させましょう。

1. Elastic IPの管理画面に移動

EC2ダッシュボードの左側メニューから「ネットワーク＆セキュリティ」内の「Elastic IP」をクリックし、「Elastic IP の割り当て」ボタンを選択します。設定は基本的にデフォルトのままで問題ありません。「割り当て」ボタンをクリックすれば、Elastic IPが発行されます。

2. IPアドレスを紐づける

取得したElastic IPを選択し、「アクション」メニューから「Elastic IP アドレスの関連付け」を選択します。表示される画面で、先ほど作成したEC2インスタンスを指定し、「関連付け」を実行してください。これで、EC2インスタンスには固定のパブリックIPアドレスが設定され、今後は常に同じIPでアクセスできるようになります。