RecSys 2018のペーパーを読んでいく(11) ... ユーザアクションの単調性を活かした推薦システムの話

2019/04 、RecSys 2018の論文をひたすら読みます。ルール。

  • 1日ひとつ
  • 読み終わらなくてもOK
  • 理解と疑問点を毎日まとめる

読んでいこうと思っていたのですが、ビデオがつくようになったのでそれを見ます。今日は、
Item Recommendation on Monotonic Behavior Chains

 

Abstact:

  • 推薦システムに利用するユーザの行動には「レビュー」や「Rating」などの明示的なものと「クリック」や「購買」の暗黙的なものがある
  • 推薦システムでそれらは別々の証拠として扱われ学習されている
  • ただし、これらの行動には「前の行動がなければ次の行動がない」=「単調性」という強い制約がある
  • この性質を考慮してモデリングすることにより、従来の手法よりよい結果が得られた

ざっくり

  • 推薦システムはユーザ行動よりその人の嗜好を推測する
  • ユーザ行動には、1. はっきりと嗜好を表明するがものすごくデータがすくない「レビュー」や「Rating」と、2. 量は多いが本当にその人の好きを表明しているか不明な「クリック」や「購買」がある
  • 2種類の行動を別々に扱っていたが一緒に扱い、データの特性を補いあうことにより、推定の精度をあげることができないか?
  • また、この行動の連鎖を学習することにより、より汎用的な推薦システムができないか?
  • 行動のchain は クリック → 購買→ rating → レビューというものを考える
  • 特徴は、「購買したなら、かならずクリックしている」という点
  • 行動した = 1, しないを 0 とすると、そこが1 なら連鎖の左の行動は全て1、そこが0なら連鎖の右の行動は全て0 になる
  • なので、アイテムごと・ユーザごとの行動の有無を学習したいのだが、単調性を考慮すると「どこが1/0 の境界となるか」を学習すればよい

感想

  • rating したひとのみレビューする、というのはわりと強い前提を強気でおいてきたなあ、と感じた
  • 購買をimplicit なfeedback に分類していたのが、斬新だった。コンバージョンが何になるかはビジネスによるので、なにを指標にするかは本当に難しい問題だな、と。