RecSys 2020 (2) Day1 , Real-World Applications I

ここからは全体では2回目のセッション。

Goal-driven Command Recommendations for Analysts

Abstract

データ分析のための推薦システムの話。データ分析をするための操作は、ユーザのゴールを示唆する情報が含まれるが、従来の推薦システムで操作のみからユーザの分析のゴールを識別するのは難しい。ただ、分析をスムーズに進めるためのコマンドの推薦をしたい。コマンドをソフトウェアコマンドとデータコマンドに分類し、データコマンドのsequence に既存のSequence モデルの技術を適用してみたりしたが、今回は Goal ドリブンなコマンド推薦を提案する。また、評価のための指標の提案も行う。 f:id:ayakobaba:20200923205727p:plain

感想

Adobe India の人。テクニカルサポートのサジェストを自動で学習する話か。 質疑応答面白い。 Q. 実用化されているの? A. プロトタイプ段階。サジェストされること自体はポジティブなフィードバックをもらっているが、実用化には「何を」サジェストするかだけでなく「いつ」サジェストするかも重要。あとで読む。

SSE-PT: Sequential Recommendation via Personalized Transformer

Abstract

NLP のTransformer の手法は SASRec など 推薦システムへの応用例もでてきたが、SASRec はパーソナライズされていない。そこで Personalized されたTransformer を用いた手法を提案する。

感想

でた。Transformer。Architecture はこんな感じ。Stochastic Shared Embeddings がポイントみたいだが、この図ではわからない。 f:id:ayakobaba:20200923210755p:plain

[Industrial Session]Developing Recommendation System to Provide a Personalized Learning Experience at Chegg

Abstract

Chegg (オンライン教育)のセッション。生徒それぞれの興味とレベルにあったコンテンツを推薦したいが、教育の分野も教育コンテンツのパターンもいろいろあるのが特徴。そこで、Knowledge グラフを活用する。 f:id:ayakobaba:20200923211348p:plain

コンテンツとKnowledge グラフと関連付け、さらにユーザとKnowledge グラフも結びつけることにより、推薦する。Knowledge グラフ作成のために、コンテンツの分類を行うが、これには Character Based CNN を利用した。

感想

去年も実直な感じが面白かったChegg。このあたりの機械学習に本気で取り組んでいる人たちはルールベースも惜しげもなく活用しているのがいつもここ逃げてはいけないなあ、と感じます。

[Industrial Talk] Behavior-based Popularity Ranking on Amazon Video

Abstract

Amazon Video でユーザが動画を探す方法は二つ。Discovery と Search。ただ、Discovery が70% と多いのでここで発見しやすくすることが必要。ただ、Discovery では検索と違い、ユーザがキーワードを明示することがないので、ユーザの嗜好をImplicit な証拠から推論しなければならない。 推薦ではscale と freshnessが重要。ここでは「動画のPopularity」を予測することを検討する。動画の数がすくなければヒューリスティックなものもワークするが、今はコンテンツの数が多いので、Customer Streaming Behavior をモデリングすることにより、実現する。

f:id:ayakobaba:20200923213633p:plain

特徴量は customer streaming and purchase signals , video metadata , date feature (newness)など。

感想

Motivation はわかったのだが、肝心のCustomer Streaming Behavior あたりでおいてかれてしまった。

[Industrial Talks] A Human Perspective on Algorithmic Similarity

Abstract

Netflix のセッション。 推薦システムで「Similarity」の概念が肝になるが、さて「Similarity」ってなんだろう。検証した結果、複雑すぎて一概には言えないが、3つのポイントがある。

f:id:ayakobaba:20200923214448p:plain

Where / Who / What. Where、例えば映画をみ終わったあとにでてくる「次、これみたら」は、はっきりととてもよく似ていることを期待するし、「もしかしてこれも好き?」でいっぱいでてくるときは、すこしはずれたものもあった方がうれしい。 また、似ているかどうか判断する軸は人によって違う。ある人は「同じ俳優がでてるから」、ある人は「ハッピーエンドだから」とかで選ぶ。 そして、「何を」。つまり「コンテキスト」。リアリティショーのあとにつづけてリアリティショーをみたい人は 18%しかいない。コンテキストが類似性を凌駕する。

感想

結局ドメインへの洞察が深く、理解に基づいたモデリングをすることがポイント。