株式会社タスキ / 開発チーム
GPTを活用した物件資料のワンタッチ読み取りOCR
# 背景 不動産情報を記載した大量の紙あるいはスキャンデータを、自社不動産管理SaaSへインポートする際、一枚一枚、各項目を人力で登録する必要があった。 また、既存のOCRサービスにおいては、認識した文字列から目的のデータを特定することが、構造化され規定されたフォーマットでないと難しかった。(不動産会社ごとにフォーマットが異なる) # 関わり方 そこでchatgptを導入することで、非定形なOCRスキャンデータから目的の文字データを精度良く抽出できるようになるのではないかという考えから、主体的に部署内提案し、実際にプロジェクトとして進めていくことが決定した。 プロンプトの与え方がどのように抽出精度に影響を与えるかを検証し実用レベルで使えることを実証した後、処理サーバーのインフラ構築、実装、既存のSaaSアプリケーションとの処理連携実装を行った。また、事業部側と新機能のUIについて合意を取るために、初めてFigmaを使ってUIデザインに挑戦した。画面遷移のイメージをプロトタイプ作成を通してスムーズにチーム内で共有でき、実装後の認識ずれも防ぐことができた。 # 得たもの・教訓 もともとビジネスアイディアとしてはあったが、どう頑張っても技術力や人員工数的に無理なのではないかと社長含めチームの誰もが本当はやりたいけど諦めていたテーマだった。それに対して、本当にできないのか、少しでも可能性のある方法はないのかと休日も含めて常に考えることをやめずにいたときに、chatgptを使う案を思いついた。諦めずにいればたいていのことは成し遂げられるし、完璧ではないにせよ、何かしらやりようがあるという教訓を学んだ。 そして、誰もがやらないことに取り組むことこそ、自分は燃える性格であることに気づいた # 活用フレームワーク、ツール等 Microsoft OpenAI Service, Microsoft Azure Form Recognizer, make, AWS Amplify, AWS CDK, Figma # 今後の課題 ## プロンプト改善の仕組み プロンプト評価、A/Bテスト、LLMへのフィードバック ## 抽出項目ごとの抽出値信頼性 LLMが出力した抽出値の確からしさ(=信頼性)を出す方法の模索 → 信頼性が低いものはユーザーへ通知したり、非表示にしたりなどしたい ## より多様な資料フォーマットへの対応 1枚に複数の物件情報が記載のフォーマット