チーム開発:関連語・要約ライブラリを用いた検索エンジンの作成
【設計思想】 情報が多く蔓延るこの世の中で、情報を素早く広く集めたい。そのために検索語に似た言葉や、その説明や、使われている文章に素早くアクセスできるものを目指しました。 【プロダクト・ポジション詳細】 検索ワードを入力すると、その関連語とそれに合う記事が要約されて可視化される検索システムです。 事業計画, PM, PdM, 機械学習周りと検索エンジン・ログ管理周り、バックエンドのサポート、また法務を担当していました。 以下、自分の業務例です。 【事業計画】 ターゲットを考え、PPM分析とチャレンジャー or ニッチという立場を生かしてKGI/KPIがそれなりの数値を取れる事業に絞る作業。 【PM, PdM】 リーン開発を基本として、ミニマルなプロダクトの実装。ユースケース図の作成。バックエンドの教育。 【機械学習】 既存ライブラリの改良。メモリ管理のためのプロダクト開発。 ・言語 :Python, C++ ・ライブラリ:word2vec, magnitude等 要約ライブラリの使用。 ・ライブラリ:sumy, pysummarization 【検索エンジニア】 Elasticseachを使用したindexの作成。メモリが十分に確保できる時にクローリング、スクレイピング(Python)を行い、記事の要約をinsert。 フロントログをイベントドリブンでindexを作成し、ロガーとログDBを作成。 非公開レポジトリにつき、プロダクトURLは非公開。