RecSys 2018のペーパーを読んでいく(5) ... あなたの「やらなかった」を推薦にとりこむ話
2019/04 、RecSys 2018の論文をひたすら読みます。ルール。
- 1日ひとつ
- 読み終わらなくてもOK
- 理解と疑問点を毎日まとめる
今日はInterpreting User Inaction in Recommender Systems
Abstract:
- 今までの推薦システムは「クリック」などの反応に注目してきたけど、「クリックしなかった」「採用しなかった」などの「やらなかった」という事実はあまりとりいれてこなかった
- でも何もしない人の方が圧倒的に多い
- まず、「やらない」ということが何を意味するのか、心理学的な観点から解析を試みる
- 次に「やらない」をモデル化することにより、行動推定と推薦のタイミング、両方を改善する可能性を示唆する
ざっくり:
- この論文では4つの疑問 (行動しない理由にはどのようなものがあるのか?、行動しない理由が違うとユーザへの未来の推薦に影響があるんじゃないか?、行動しない理由を推論できる?、行動しないでRecSysを改良できる?)に取り組む
- まず、MovieLens 上でアンケートをとって、やらなかった原因をさぐった
- クリックしない理由が「きづいていない」「今じゃない」場合があるので、すぐに推薦対象からはずすのはまずい
- 特に「他の人と見る映画を探している」場合は「今じゃない」ことが多く「あとで推薦してほしい」。
- 反対に「好みじゃない」場合は「もう推薦してほしくない」
- なので、「行動しない」場合、その理由を推論してみた
- 「行動しない」の理由は「行動しそう」で説明できるのではないか(例えば、その映画の詳細を見るだろう=今じゃない )
- MF で行動しそうを推定するモデルつくって、GBDT とか XGBoostとか回帰とかして、「行動しない」理由の推定モデルをつくった。難しかった
- 「行動しない」をレコメンドに生かすとりくみは、Factorization Machine とかでやってみた。オフライン評価で「可能性があるよね」ということは示唆できた
感想:
- 「見た」から「もう推薦しなくていい」は全推薦システムに取り入れてほしい機能
- とりそうな行動(rate / click ...)から推定できるなら、「行動しない」を推論しなくてもいいんじゃないのかな...
- アンケートとアプリケーションログを組み合わせて調査・検証することは参考になる
- 「もう見た」はシンプルに聞いたり、購買履歴からもってきてもいいかもね