RecSys 2018のペーパーを読んでいく(11) ... ユーザアクションの単調性を活かした推薦システムの話
2019/04 、RecSys 2018の論文をひたすら読みます。ルール。
- 1日ひとつ
- 読み終わらなくてもOK
- 理解と疑問点を毎日まとめる
読んでいこうと思っていたのですが、ビデオがつくようになったのでそれを見ます。今日は、
Item Recommendation on Monotonic Behavior Chains
Abstact:
- 推薦システムに利用するユーザの行動には「レビュー」や「Rating」などの明示的なものと「クリック」や「購買」の暗黙的なものがある
- 推薦システムでそれらは別々の証拠として扱われ学習されている
- ただし、これらの行動には「前の行動がなければ次の行動がない」=「単調性」という強い制約がある
- この性質を考慮してモデリングすることにより、従来の手法よりよい結果が得られた
ざっくり
- 推薦システムはユーザ行動よりその人の嗜好を推測する
- ユーザ行動には、1. はっきりと嗜好を表明するがものすごくデータがすくない「レビュー」や「Rating」と、2. 量は多いが本当にその人の好きを表明しているか不明な「クリック」や「購買」がある
- 2種類の行動を別々に扱っていたが一緒に扱い、データの特性を補いあうことにより、推定の精度をあげることができないか?
- また、この行動の連鎖を学習することにより、より汎用的な推薦システムができないか?
- 行動のchain は クリック → 購買→ rating → レビューというものを考える
- 特徴は、「購買したなら、かならずクリックしている」という点
- 行動した = 1, しないを 0 とすると、そこが1 なら連鎖の左の行動は全て1、そこが0なら連鎖の右の行動は全て0 になる
- なので、アイテムごと・ユーザごとの行動の有無を学習したいのだが、単調性を考慮すると「どこが1/0 の境界となるか」を学習すればよい
感想
- rating したひとのみレビューする、というのはわりと強い前提を強気でおいてきたなあ、と感じた
- 購買をimplicit なfeedback に分類していたのが、斬新だった。コンバージョンが何になるかはビジネスによるので、なにを指標にするかは本当に難しい問題だな、と。