ライフサイエンス統合データベース部門 (DBCLS) / 特別共同利用研究員
RAG論文読解支援エージェント
複数の論文に対して一つのクエリを入力するだけで、関連情報を自動抽出し、引用元を明示した回答を生成するRAGシステムです。アーキテクチャはクラウドネイティブなETLパイプラインを採用しており、論文をS3にアップロードすると、AWS Glueが解析・分割・ベクトル化を行い、Amazon RDSでPostgreSQLに格納します。検索エンジンはLangGraphによる状態遷移で構築し、クエリの意図に応じて直接回答と検索回答を自動で切り替えます。検索精度が低い場合はクエリを自動で書き換える自己修正機能も備えています。さらに、類似クエリに対する応答を再利用するセマンティックキャッシュにより、応答速度とコストを最適化しました。ユーザーはStreamlitのダッシュボードから対話的に操作できます。研究員の論文調査時間を50%以上短縮し、年間12000時間以上の生産性向上を実現しました。