当社では分析業務を通じて身に付けた知識・経験を技術ブログなどを通じて発信することも重視しております。
前回の記事(【技術記事紹介①】データサイエンティスト業務を知りたい方にもおすすめ!当社社員が書いたデータ分析技術に関する記事を紹介します | TDSE株式会社 (wantedly.com))に引き続き、今回も当社社員がまとめた分析手法解説記事の一部をご紹介します。
ご紹介するのは因果推論について踏み込んだ2つの記事です。
差分の差分法(前回記事でご紹介)と並んで重要な手法である「傾向スコア」と、時系列データを用いる「コーザルインパクト(Causal Impact)」が題材となっています。
比較対象となる集団の差異をモデル化し施策の効果を精緻に浮き彫りにする「傾向スコア」
差分の差分法は、ある施策を実施した集団Aと実施していない集団Bの間で、施策前後の傾向の変動の差異をもとに因果推論をおこなう手法でした。
一方で傾向スコアは、集団Aと集団Bの性質の違いが結果に与える影響を「傾向スコア」を用いて考慮し施策効果を求める手法です。
例えば、TVCM施策の効果を測る際にはTVCMを見た集団と見ていない集団を比較することになりますが、両集団にはTVCM視聴以外にも差異があることが想定されます。この差異をモデル化して補正するというのが傾向スコアのコンセプトになります。
この記事では、因果推論の基本的な考え方を振り返りつつ、傾向スコアの適用例として平均処置効果(ATE)および処置群の処置効果(ATT)の考え方を、数式も交えて解説しています。
反実仮想を用いて時系列データに対する施策効果を推定する「Causal Impact」
差分の差分法や傾向スコアを用いた因果推論は、(理想的には)施策の有無だけが異なる2つの集団を比較して施策効果を検証する手法です。一方で、施策の出し分けが許されないなどの事情があり集団間の比較が難しいシチュエーションも存在します。
Causal Impactは、施策を実施した対象に対して「もし施策を打たなかったらどうなっていたか」という反実仮想をモデル推定し、それと比較することで効果検証をおこなうというコンセプトとなります。
この記事では、Causal Impactの基本的な考え方とRを用いた実装例を解説しています。
前回、今回の記事の他、基本的な分析手法の丁寧な解説や、システム実装にフォーカスした解説などもありますので、ぜひ当社マガジン・Qiitaを閲覧いただけますと幸いです!!