アポロ株式会社の守屋と申します。
様々な業務に携わらせていただいており、その中のひとつとして推薦エンジンの研究開発を進めさせていただいています。
現在の消費者の購買行動と推薦エンジンについて、ユーザやアイテムの類似や過去の評価に基づいて推薦しているが、“今のユーザの状況(コンテクスト)” を反映する枠組みが無く、実際の利用にあたってはギャップがあると感じています。
刻一刻と変化する消費者の状況に応じて最適な提示を行う推薦エンジンを構築するために、時間知識グラフ(Temporal Knowledge Graphs)について論文を調査してみました。
「EvoKG: Jointly Modeling Event Time and Network Structure for Reasoning over Temporal Knowledge Graphs」とは、時間知識グラフ上で推論するための手法である。イベントタイムと進化するネットワーク構造の両方を単一のフレームワークでモデル化するという課題を扱うように設計されています。
イベント時刻のモデル化には、イベント時刻の確率分布を推定するための柔軟で効率的なメカニズムであるニューラル密度推定を使用しています。
進化するネットワーク構造をモデル化するために、EvoKGはリカレントイベントモデリングと時間近傍集計を使用しています。リカレントイベントモデリングは、変化する時間知識グラフの構造的・時間的ダイナミクスを捉え、時間的近傍集約はエンティティ間の相互作用をそれらが発生する時間的コンテキストに基づいてモデル化しています。
全体として、EvoKGはイベント時間とグラフの進化する構造の両方を考慮することにより、時間知識グラフから新しい事実を正確かつ効率的に予測するように設計されています。
推薦システムで使用するために、時間を意識した情報を知識グラフに組み込むことが有効だとわかりました。ただし、タイムスタンプの数が多くなるとどうなるのか、タイムスタンプが必ずしもユーザーの類似行動を示唆するとは限らないのではないかという疑問がわきました。
引き続き時間知識グラフについて調べていきたいと思います。
今回、下記の記事を参考にさせていただき落合フォーマットに沿って論文の要約を行ってみました。
どんなもの?
リカレントイベントモデリングにより、刻々と変化する構造的・時間的ダイナミクスを捉え、時間的近傍集合フレームワークにより、エンティティ間の相互作用をモデル化し、両課題を効果的なフレームワークで統合的にモデル化するものである。さらに、ニューラル密度推定に基づく柔軟かつ効率的なメカニズムを用いて、イベント時間の正確なモデリングを実現する。
先行研究と比べてどこがすごい?
既存の時間知識グラフの手法は2つの項のどちらかをモデル化することに重点を置いており、両方を同時にモデル化することはできない。 例えば、イベント時刻をモデル化しない方法は、イベントがいつ発生するかを予測できず、イベント時刻のみをモデル化する方法は、タイムスタンプ付きイベントの尤度を推定する際にイベントトリプルを考慮に入れることができない。
この2つのモデル化タスクを統合することで、時間知識グラフに対するより正確な推論が可能になる。
技術や手法のキモはどこ?
イベント時刻、進化するネットワーク構造の両方を単一のフレームワークでモデル化する。
どうやって有効だと検証した?
EvoKGはどの程度正確にイベント時刻を推定できるか?
EvoKGはどの程度正確に時間的リンクを予測することができるか?
議論はある?
"エンティティ i がエンティティ j と相互作用すると推定されるとき、どの過去の出来事が現在の両者の関係に大きな影響を与えたのか? EvoKGの説明可能性と透明性を高めるようにする予定である。
次読むべき論文は?
引用文献36 Intensity-Free Learning of Temporal Point Processes
イベント間時間の条件付き分布を直接モデル化することによって、強度に基づくアプローチの限界を克服する方法を示す。 我々は、フローの正規化に関する文献を参考に、柔軟かつ効率的なモデルを設計する。さらに、フローベースのモデルの柔軟性にマッチし、かつ閉形式でのサンプリングとモーメントの計算を可能にする単純な混合モデルを提案する。 提案するモデルは、標準的な予測タスクにおいて最先端の性能を達成し、シーケンス埋め込み学習や欠損データの代入などの新しいアプリケーションに適している。
最後まで読んでいただき、ありがとうございます。
アポロならではの技術的課題に対する取り組みやプロダクト開発の試行錯誤で得た学びなどを定期的に発信していきます。
少しでも業界へ貢献できれば嬉しいです。
今後ともよろしくお願いいたします。