RecSys 2018のペーパーを読んでいく(18)... 推薦システムと生成モデルを融合して「次は何がくる?」問題に挑戦した話

2019年春、RecSys 2018の論文をひたすら読みます。ルール。

  • 1日ひとつ
  • 読み終わらなくてもOK
  • 理解と疑問点を毎日まとめる

昨日から5月だった。1日ひとつ読めていませんが、全部読んでから考える。次はGeneration meets recommendation: proposing novel items for groups of users

Abstract:

  • どのようなコンテンツ、製品をつくったら、自分の顧客を満足させられるか、というのは、企業の悩み
  • この課題を解決するモデルを提案する
  • Deep な生成モデルで、潜在空間を学習
  • Greedy Search アルゴリズムで学習した潜在空間から、特定のユーザグループとそこにうけいれやすい製品の機能・特徴を見つける

ざっくり

  • 推薦システムは「消費者」に好みのアイテムを推薦するものがほとんど
  • これを「生産者」に何をつくれば受け入れられるか、示唆するものに変えたい
  • 製品がすでに市場に出回っていれば、ユーザがどの製品を好きかどうか測ることにより、どのような製品がどのユーザに受け入れられているか、みることができる
  • ただ、いま知りたいのは「未来にどんな製品をつくるべき?」という話。製品がないので、データもない。
  • ここを解決するために、生成モデルを構築した
  • VAEを利用して、製品とお客さんから潜在空間を学習
  • 潜在空間上でユーザのカバレッジがよくなるような製品をピックアップする(最適化)する
  • 潜在空間上の製品をデコードすると「どんな機能をもつ製品なのか」がわかる

感想

  • 面白い(うすい感想)
  • 質問「なんでGANは使わなかったの?」に対する返答はわからなかった。なにか前提と条件(カバレッジ最高にする)があわなかったのかもしれない
  • ただ、この手法でわかった特徴が、映画だったら「excellent script」だったりすると、んー... まあ、そうか.... としかいいようが
  • 生成モデルまでいかなくても「好き度合いとカバレッジでリソースの配分を決める」ことは集計レベルでもできそうな気がする