こんにちは!Algoage採用広報チームです。
2025年10月4日(土)・5日(日)に開催された日本最大級のテックカンファレンス「東京AI祭2025」にCTOの宮田が登壇しました。東京AI祭2025のプレゼンテーション内容をレポートし、当日を振り返ります。
AIへの関心が高い人が集まる中で、AlgoageのAI活用事例を紹介
10月5日(日)、東京AI祭2025 Learningステージにて「AI Agentの限界を超え、現場を動かすAgentic Workflowの設計と実践」をテーマに登壇しました。
今回は、 AI エージェントを作り現場に導入する上で「市場と現場はどういう状況におかれているのか」という状況分析と、課題分析、そこに対して「現場ごとにどういう設計で組めば、実際業務効率化が進むのか」という内容を発表してきました。
Algoageは、東京大学で機械学習を研究していたメンバーにより創業し、AI受託開発を通じてテクノロジー起点の多様なソリューションを提供してきました。2020年には、M&Aを機にDMMグループに参画し、事業づくりに舵を切って主力プロダクト「DMMチャットブーストCV」をリリース。以来、同プロダクトは多くのお客様に支持され急成長を続けています。さらに生成AIを活用した新規事業開発を推進し、組織拡大や経営体制の刷新を経て、第二創業期を迎えています。
LLMに関する最新のトレンドだけでなく、機械学習の過去の歴史を理解した上で俯瞰して事業に取り組んでいます。そのR&Dでの成果事例をご紹介し、Algoageに興味を持っていただく方が増えればと思い、登壇しました。
当日は、学生から業務でAIに関わる方、AI研究者の方が一堂に会し、オフライン・オンラインのハイブリッドで会が開催されました。多くの方にオフラインでもプレゼンテーションをお聞きいただき、また質疑応答ではワークフローの実際の評価指標をどうすべきかという質問や、実際にAgentic Workflowを組む上での詳細の技術スタックに関するご意見をいただき、闊達な意見交換ができ、とても有意義で勉強になりました。
AI活用の課題や適切な設計とは
ここから発表内容をご紹介します。
以下、5つのアジェンダにそって発表しました。
なぜ今Agentic Workflow?背景と課題
AI エージェントというワードが去年末あたりから騒がれ始め、AI・LLMでできることの幅が一気に増え、自律的に任せられる領域が広がるのではという期待感が持たれていました。
実際に「社内でツールを導入して業務効率化に取り組みだした」、「業務効率化するためのツール開発のPOCを回しはじめた」という現場が増えてきたと感じています。
その中で各社さまざまな課題に立ち向かっているかと思います。よく語られる課題を、大きく3つに分類しました。
また、その壁がある中で、市場を取り巻く環境として、「巷で噂のAIでのビックリ体験は現場で求められておらず、本当に必要なのはミスなく信頼性高く普段の業務をお任せできるツールである」ことも多いです。
もちろんAIによる新しい体験の研究も必要とされる領域がありますが、それは適材適所で見極めていく必要がありますし、それぞれのゴールに対しての適切な技術選定・技術設計が必要になります。
日進月歩で進化し、複数ある選択肢の中からトレードオフを理解し、かつそれをR&Dの限られたコストの中で適切に作っていくことが大切です。
非常に難しい領域ですが、この発表では、その設計について深堀してお話していきます。
設計原則と全体アーキテクチャ
現場に対してどこまでの設計を、どこまで作り込む必要があるのか、パターンを4象限にしてまとめてみました。
「計画と実行をどこまでLLMに自律的に任せるか」「LLMやツールが実行するフローをどこまで事前宣言するか」という2軸で分けています。
左下はLLMモデルに対して1つの実行依頼を1プロンプトで投げるようなイメージです。
実装は楽ですし、立ち上げも最速ですが、1プロンプトでモデルの性能も変わったりします。その与えるコンテキストによって出力も変わるため、 再現性が低くなる可能性もあります。
左上は、左下のシンプルな構成をもう少し複雑に実行できる領域です。AI エージェントとして「どういうステップで何をしてもらい、どんな情報を使って何を実行するか」という計画を LLMに考えてもらい、実行もLLMにを全面的に頼るというケースです。
柔軟性は高いものの、再現性が低かったり依頼側のコストも高いです。
右上では、より安定して期待通りのアウトプットを出すために、LLMの外部で「こういうステップでこの業務を必ず行ってください」というワークフローを静的に宣言した上で、内部の各アクションを LLMで補助していくという方法です。
ミスが許されないかつその業務フローが多岐に渡る場合のユースケースで適切な設計となります。ワークフローの事前定義の負荷や、実行するツールの複雑性へのさまざまな対応が必要になります。
今回は、右上の項目について深堀したいと思います。
業務フローの形式化と評価
まず、先ほどのスライドの右上の開発コストは、すごく高くなる前提で以下の通りまとめています。
なぜなら、ワークフローを網羅的に宣言しないといけないですし、宣言したワークフローの実行も安全性と再現性が高い状態で担保しないといけないからです。
そのため、ここに対しては適切なAgentic Workflowを構築、運用するためのプランを作っていく必要があります。
流れとしては大きく上記の設計をしています。
- ワークフローを形式化
- 定義された複数のワークフローを、どの状況でどのワークフローを実行すべきかを確認する
- 選択したワークフローを実行し常に状態監視しながらツールやエージェントに実行依頼をし、ワークフローの品質評価のためのログを出す
- ワークフローの実行の安全性を担保するために各種ツールでのコントロールを行う
この中で、以下二つのサイクルが重要です。
- ワークフロー自体を 正しく作ってモーラル的に改善していく、品質を上げていくためのサイクル
- その決まった型を実行すると決めたワークフローを安全に実行するというサイクル
信頼性/安全性を担保する実行環境
次に、具体的に品質を上げるサイクルと安全に実行するサイクル。この二つのサイクルについて具体的に紹介します。
まず、評価のサイクル先の画像の左下の評価改善とは、ワークフローを実行された後のログの検証とそれをもとに「業務のワークフローは本当はこうあるべき」という改善をする部分です。
改善後、実際に業務フローのワークフローを組む部分で重要になります。ワークフローの 業務フローも同じですが、その構築における課題や勘どころが二つあります。
ワークフローを定義するポイント2点
一つ目は、ツールのドメインに特化したワークフローの中間言語を作る部分
これはDSLと言われたりしますが、書き方を定義した上で、その構文でワークフローを定義することが一般的です。
ドメインに特化した言語を作れるかの探索、人間が作成したマニュアルから自動生成するため、ツール開発とDSLの構文が正しいかを検証するためのツール開発等々が重要なポイントになってきます。
二つ目は、組んだワークフローの意味的な正しさの評価をする部分
ここの観点で重要なのは、そもそも人間のワークフローをAIツールで動かすように定義して実装してみたものの、そもそもその人間の業務マニュアルが正しくない場合です。
ここは適切に評価しながら、普段の業務内容の評価指標を通してワークフローが意味を成しているか全体で評価します。評価指標の一例ですが、採用の場合は面接の通過率やその後の内定率など、普段のKPIで測るなどです。
さらにワークフローとしての評価プロセスが必要になります。これは業務コンサルに近いような領域に入ってくるため、業務理解が必須になります。そこが非常に難しいと思います。
人間が書いたマニュアルをルールに変換するツールを作ることや、特定ルールによって自己修正するツールを作ったりすることが重要です。
①普段のKPIに沿ってワークフローを評価すること、②それに必要なログを取得し分析する、このオペレーションサイクルを作ることが大事です。
ワークフローを実行する上でのポイント2点
一つ目は、どのワークフローを実行するのか、目的の整理
今ユーザーがどういう状況に置かれていて、どのワークフローを組めばいいのかということを適切に理解していることが必要です。そのためテキストの準備と足りなければ加えてヒアリングを行い、信頼性を持った状態でワークフローを実行するということが重要なポイントです。
コンテキストエンジニアリングの領域で、どこまでの情報をどう保持しておくかが重要なポイントとなります。
二つ目は、選択したワークフローがある状態で、それを安全に実行するための、信頼性が必要になります。 まずLangGraphをはじめとしたフレームワークで作ったステートマシンを駆使し、ワークフローを実行します。これを実現するフレームワークは色々とありますが、適切なものが選ばれていれば問題ありません。
重要なのは、実行している状態を俯瞰して確認する親エージェントのようなもの、「親のプロセス」を必ず用意し、そこがどんな状態でもインターセプトして制御できるようにすることです。
さらに、安全設計の一例としてPIIの情報は載せてはいけないという点もあります。もう一点がHuman in the loopと近い概念のHuman as a toolです。
また、MCPツールの権限管理の仕組みを作るということも大事になります。
人間が行う判断や、AIが自律的に判断できないところを人間が介入して判断するということをHuman in the loopと言ったりしますが、それよりもう少しワークフロー主体の考え方でワークフローの中では絶対にここは人に聞きましょうというものを定義しすることをHuman as a toolと言っています。人間をある意味ツールとして考え、ここは絶対に人間が判断してください、というワークフローが主体で人間がこのワークフローに指示されて動く というような概念です。
最後に
Algoageでは今回紹介したような、最新技術を実際に事業として昇華するための難しい課題に挑戦しながら、本質的に価値がありインパクトを出せる事業の開発をしています。
一緒に働いてくれる開発の仲間を募集しているので、興味があればぜひお声掛けください。