Masabumi Ishihara
Stable DiffusionにDWPoseを導入して人物のポーズを再現しました。
DWPoseとは、論文『Effective Whole-body Pose Estimation with Two-stages Distillation』をもとに実装された姿勢推定のためのAIモデルです。 Control Netとは、Stable Diffusion WebUIの拡張機能の1つで、あらかじめ用意した画像からポーズ、輪郭、奥行き、顔やスタイルなどの情報(形状情報)を抽出し、それを用いて画像生成する技術です。 ・左側の画像が元画像、右側の画像がポーズを推定した画像です。 ・ポーズ推定画像の顔と手指のキーポイントの位置が元画像と比較して正確であることがわかります。 ・生成画像のキャラクターは元画像のキャラクターと異なります。 ・しかし、生成画像のポーズは元画像のポーズと同じです。