Event Report | GENEROSITY ENGINEER MEETUP【画像生成AIハンズオン】

記事概要

先日弊社の初主催イベントであるWebARハンズオンオフラインイベントの第3回目を行いました。
本記事ではこちらのENGINEER MEETUPイベントレポートを行います！

前回同様、多様なバックグラウンドのエンジニア計4名の方が参加してくださいました。
中級者向けの内容となっており皆さんと試行錯誤しながらの楽しい時間となりました。
後半には、軽食とお酒を囲みながらの交流会も実施しました。

【AI画像生成ハンズオン】GENEROSITY ENGINEER MEETUP (2023/08/03 19:00〜)

開催概要 * 日時：8/3(水) 19:00 - 21:00 * 会場：東京都港区南青山1-15-9第45興和ビル 1F 株式会社GENEROSITYオフィス内 ※ビル正面の扉が閉まっている場合は、ビル右手奥の裏口からご入館ください。 * 費用：無料 * 緊急連絡先：03-4405-8941 時間 | 内容 ---|--- 18:45-19:00 | 受付開始 (弊社エントランスにお集まりください) 19:00-19:15 | 弊社紹介 19:15-20:10 | AI画像生成ハンズオン 20:10-20

https://connpass.com/event/288703/

ハンズオン内容

Point-EとGoogleColabを使って、画像から3DCGを生成する

今回は、無料で使えるGoogleColabとOpenAIがオープンソースで
公開しているPoint-Eという学習モデルを使って、
GoogleColab上で環境構築して簡単な3Dアセットを生成するというハンズオンでした。

Point-Eとは

Point-Eは、ChatGPT、DALL-E2を開発しているOpenAIが公開している点群データ生成AIモデルです。
Point-Eでは、ユーザーが入力した画像やテキストから推論し、
点群データに変換するアルゴリズムを用いて3DCGのデータを生成します。

GoogleColabとは

GoogleColabはGoogleの提供するプラットフォームで、
誰でもブラウザ上で Pythonを記述、実行することができます。
機械学習、データ分析などに気軽に使うことができます。
無料ライセンスでも連続使用12時間までGPU(Tesla K80 or Tesla T4)を使うことが
できるため、スペックの低いマシンでも生成AIの環境構築を行うことができます。

今回は、参加された方が選んだ好きな画像から点群データを生成した後、
メッシュを貼る処理をしてポリゴンモデル化してみようと思います。

自分で環境構築をするメリット

生成AIサービスを使う生成AIの状況は日々目まぐるしく変わっていく中、
今まで無料で使えていたサービスが有料化したり、無料でもライセンス待ちになるパターンが
増えてきています。
また、AI生成は思った絵を出しづらく狙った結果にたどり着くまで試行錯誤が必要で、自分で環境を
構築してトライアンドエラーの回数を重ねる必要が出てきます。
PCに依存せずGPUのパワーが強く、すぐにPythonを実行できるGoogleColabは
試行錯誤を重ねることに適しています。

生成の元になる画像を探そう

今回は画像から推論させるので、読み込ませたい画像を選んでいきます。
回数を重ねた結果、背景が白い画像が好ましいようです。
参加者の方々はりんごや動物など盛り上がりながら好きな画像を選んでいました。
今回私は公式サンプルとして同梱されているコーギーの画像を使用します。

実際に生成してみよう

私の方であらかじめ用意したColabのノートブックを参加者の方々にシェアしており、
そこでご自身のPCのChromeを使って上から順に処理を実行していきます。

ノートブックの設定で、GPUの利用が選択されているかまずは確認します。

Colabのセルを上から実行していきます。左上の再生ボタンを押すと処理が始まります。
問題がなければチェックマークが評され、

Colabで自動で頭から終わりまで再生することもできますが、
処理の内容を皆で追いかけながらやるので、今回は1つ1つセルを実行していきました。

セルの左上のプレイボタンを押し、エラーが出なければグリーンのチェックボックスが表示されます。
順番に進めていきます。

Point-Eのリポジトリをクローン

!git clone https://github.com/openai/point-e.git

Point-Eのフォルダ配下に移動

%cd point-e

必要なプラグインを追加インストール

!pip install .

from PIL import Image

import torch

from tqdm.auto import tqdm



from point_e.diffusion.configs import DIFFUSION_CONFIGS, diffusion_from_config

from point_e.diffusion.sampler import PointCloudSampler

from point_e.models.download import load_checkpoint

from point_e.models.configs import MODEL_CONFIGS, model_from_config

from point_e.util.plotting import plot_point_cloud

画像生成準備

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')



print('creating base model...')

base_name = 'base40M' # use base300M or base1B for better results

base_model = model_from_config(MODEL_CONFIGS[base_name], device)

base_model.eval()

base_diffusion = diffusion_from_config(DIFFUSION_CONFIGS[base_name])



print('creating upsample model...')

upsampler_model = model_from_config(MODEL_CONFIGS['upsample'], device)

upsampler_model.eval()

upsampler_diffusion = diffusion_from_config(DIFFUSION_CONFIGS['upsample'])



print('downloading base checkpoint...')

base_model.load_state_dict(load_checkpoint(base_name, device))



print('downloading upsampler checkpoint...')

upsampler_model.load_state_dict(load_checkpoint('upsample', device))

ベースモデルと拡散モデルの作成

sampler = PointCloudSampler(
    device=device,
    models=[base_model, upsampler_model],
    diffusions=[base_diffusion, upsampler_diffusion],
    num_points=[1024, 4096 - 1024],
    aux_channels=['R', 'G', 'B'],
    guidance_scale=[3.0, 3.0],
)

ここまで実行したら好きな画像を'point_e/examples/example_data/'
配下にアップロードします。左サイドのフォルダボタンで
ディレクトリを開き、アップロードアイコンから画像をアップしたら
example_data内に収めましょう。

そうしたら、コードの中の'corgi.jpg'を先ほどアップロードしたファイルの名前を書き替えます。
(サンプルコードはデフォルトのコーギーのままで行きます。)
書き換えたら再び再生ボタンを押して実行します。
対象物の各画角の点群データを生成

pc = sampler.output_to_point_clouds(samples)[0]
fig = plot_point_cloud(pc, grid_size=3, fixed_bounds=((-0.75, -0.75, -0.75),(0.75, 0.75, 0.75)))

全方位の静止画の点群のプレビューが生成されました。
公式に用意されているサンプルのためなかなか綺麗に生成されました。

点群データをプレビューに必要なライブラリをインポート

import plotly.graph_objects as go

fig_plotly = go.Figure(
        data=[
            go.Scatter3d(
                x=pc.coords[:,0], y=pc.coords[:,1], z=pc.coords[:,2],
                mode='markers',
                marker=dict(
                  size=2,
                  color=['rgb({},{},{})'.format(r,g,b) for r,g,b in zip(pc.channels["R"], pc.channels["G"], pc.channels["B"])],
              )
            )
        ],
        layout=dict(
            scene=dict(
                xaxis=dict(visible=False),
                yaxis=dict(visible=False),
                zaxis=dict(visible=False)
            )
        ),
    )

生成された点群データをレンダリング

fig_plotly.show(renderer="colab")

3Dビューアーでくるくると回せるようになりました。立体になるとテンションが上がります。

メッシュ化に必要なパッケージなどをインポート

from point_e.util.pc_to_mesh import marching_cubes_mesh
import skimage.measure

メッシュ化処理

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

print('creating SDF model...')
name = 'sdf'
model = model_from_config(MODEL_CONFIGS[name], device)
model.eval()

print('loading SDF model...')
model.load_state_dict(load_checkpoint(name, device))

頂点カラーつきのメッシュに変換

# Produce a mesh (with vertex colors)
mesh = marching_cubes_mesh(
    pc=pc,
    model=model,
    batch_size=4096,
    grid_size=128,
    # grid_size=32, # increase to 128 for resolution used in evals
    progress=True,
)

meshをPLYフォーマットのファイルとして書き出す

with open('mesh.ply', 'wb') as f:
    mesh.write_ply(f)

point-eの直下にmesh.plyという3Dデータが生成されました。
ファイルにカーソルをホバーすると右側に3点リーダーが出てくるので、そこをクリックして
3Dデータをローカルにダウンロードしてみましょう。

PLYデータがブラウザで再生できるwebサービスでmesh.plyを読み込んでみます。

3D PLYファイルをオンラインで表示する無料オンラインツール - ImageToStl

この無料ツールを使用して、ソフトウェアをインストールすることなく、3D ply (Stanford Triangle Format)ファイルをオンラインで表示することができます。

https://imagetostl.com/jp/view-ply-online

頂点カラーのデータを持ったPLYファイルが再生されました。

メッシュ化が成功していることを確認できました。
頂点カラーのデータも表示されていることがわかります。

参加者の皆さんは色々な画像から試行錯誤してモデル化していました。
GoogleColabを使うことで、すぐに他の画像で試すことができ
いくつも出力できたところも良かったポイントでした。
クオリティとしてはまだまだこれからという感じではありますが、
画像やテキストから立体がすぐに作り出せる未来はあっという間に訪れるのだろうなと
感じますね。興味がある方はぜひ触ってみてくださいね。

最後に

アンケートでもポジティブなご感想をいただけてモチベーションに繋がりました。
ご参加いただいた皆様、ありがとうございました。

弊社では今後もこのようなMEEETUPイベントを期開催していきたいと思っております。
少しでもご興味を持っていただけた方は、ぜひお気軽にご参加ください！

Invitation from 株式会社GENEROSITY

If this story triggered your interest, have a chat with the team?

株式会社GENEROSITY's job postings

Event Report | GENEROSITY ENGINEER MEETUP【画像生成AIハンズオン】

Mika Maruyama

株式会社GENEROSITY / Graphic designer

2 Likes

株式会社GENEROSITY

株式会社GENEROSITYは、『DESIGNING A NEW BRAND LOVE』をブランドメッセージに掲げ、デジタル×リアルに特化した「ブランドを愛したくなる体験」を手がけるエクスペリエンススタジオです。最先端のテクノロジーに高いデザイン力を駆使し、企業・ブランドのプロモーションやリアルイベントにおける戦略立案から、企画・クリエイティブ制作・運営・データ分析まで、ワンストップでのマーケティング支援及び時代のニーズに合わせた最適なコミュニケーション施策を提供しています。現在では特にリアルプロモーションのDXに注力し、常に新規事業への取り組みを積極的に行い、革新的なサービスを作り続けています。【会社紹介スライド】 https://speakerdeck.com/generosityhrteam/20211201-generosity-companyprofilebook ■ 成長著しいベンチャー企業 2015年の創業以来、毎年2桁以上の売上成長を続けており、新型コロナの影響によるDX加速の流れによって更に成長は加速しております。2019年には9億円という大型調達を行い、数年後の上場に向けて着実に基盤を固めています。組織も若く規模も拡大しているため、若手が役員・大型プロジェクト責任者・事業部長・マネージャー・リーダー各ポジションを務めており、新たに入社頂く方にも同様のチャンスが開かれます。 ■ 広告業界の中でも独特のポジション GENEROSITYは広告／イベント代理店の中でも。　□ 自社にプランナー・エンジニア・デザイナーのチームを保有している点　□ 自社のデジタルサービスを保有している点　□ 多数の世界的ハイブランドと直接取引している点　によって独自のポジションを築けています。 ■ GENEROSITYの主な事業 GENEROSITYの主な事業は、大きく分けて5つの軸で展開しています。 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - # マーケティングプランニング／実行支援ブランドの年間を通じたマーケティング計画に沿って、プロモーション戦略・キャンペーン企画・クリエイティブ制作を行います。直近では大手総合代理店やコンサルティングファームが手かげるような案件も実施しています。 # O2Oマーケティングソリューションリアル・ソーシャル・デジタルを駆使し、特別な体験とビジュアルコミュニケーションでブランドのマーケティングをサポートする自社プロダクトを様々展開しています。 # キャスティング事業トップインフルエンサーからマイクロインフルエンサーまで、クライアントの要望に合わせてキャスティングを行います。 # 広告配信事業 SNS広告のプランニング・配信ができる広告事業です。イベント来場者のデータをベースにプランニングを行うことが可能です。 # デジタルプロダクト／サービス開発ブランドキャンペーンで活用されるアプリやWEBサイト等、オリジナルのシステムを開発します。システムとしての機能性のみならず、ハイブランドのデザインルールに則ったクリエイティブも同時に実装します。 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 設立8年目のベンチャー企業ですが、現在までにハイブランドを中心とした累計2300件以上、国内だけでなく海外15都市を含めたイベント実績は、他のベンチャーにはない魅力だと自負しております。

Like Mika Maruyama's Story

Let Mika Maruyama's company know you're interested in their content

Event Report | GENEROSITY ENGINEER MEETUP【画像生成AIハンズオン】

記事概要

ハンズオン内容

Point-EとGoogleColabを使って、画像から3DCGを生成する

Point-Eとは

GoogleColabとは

自分で環境構築をするメリット

生成の元になる画像を探そう

実際に生成してみよう

最後に

株式会社GENEROSITY

Weekly ranking