「実装できました」が、ブラウザで開くと動いていない ── AI エージェントの E2E QA を「実装者と評価者の分離」で自律ループ化した話【株式会社ライトコード】
この記事で分かることAI エージェントに実装を任せたとき、なぜ「実装できました」を鵜呑みにできないのかそこで自動 QA をワークフローに組み込んだら、今度は人間が毎回はさまる面倒 が生まれた話その面倒を消すために作った、実装したら勝手に検証→修正→再検証が回る自律 QA ループの設計実際に 1 画面でパイロットして分かった、ハマりどころと教訓(失敗込みの実録)この記事は、私たちが実際にたどった道のりを 4幕の物語 として書いています。「動かない」→「自動 QA を入れた」→「でも人間が毎回はさまる」→「自動で回るようにした」という、私たちがたどった順序そのものです。第1幕:「実装できまし...