メルカリでやってた「SIGIR2018 報告会」にいってきた
2018/09/03
SIGIR
情報検索技術における世界最大級の学会
日本ではあまり知られていないよね
AlibabaとAirbnbは結構面白かったらしい
Alibaba
市に許可を受けて車、豚、人をAIで監視している
デザイン
機械学習で大量にデザインを生成してパフォーマンスが良いものを選ぶ時代
Airbnb
Google広告へのBiddingを自動で最適化している
予算の配分...
1予約あたりの価値などを割り出す
ペースを最適化品がCPCを最適化していく
→ スライドへのリンクを...
頻出単語
発見の体験が大事〜
探索的検索: 少しづつ自分の欲しいものに近づいていく
Criteo
brand / ...
ebay
季節性を考慮したquery expansion
同じクエリでも季節によって欲しいものが異なる
Walmart
検索をしてくるお客さんには5つの分類がある
ターゲットを持ってくる
ブランドを決めて..
買う特定のものを決める
買う種類だけを決めて来る
コレクターズアイテムのような特定のものに関連した物を決める
E-commaerceの検索の問題
Googleと違って答えを求めてるのではなく、ざっと見しに来てる感じ
どうやって検索を評価する?
買わないけれど実はユーザーが満足している可能性がある
オントロジーがない
良いメトリクスがない
ユーザーの理解
質問の理解
...
...E-commerceの話
ECはGMVを重視するが...
ユーザーが多ければ多いほどよいが...、その分コストが増える
Efficiency
tree traverseをbitwiseに変換すると...
clicksとsatisfuctionの間に大きなギャップがある
興味があってクリックしたのに満足をしていない...という例もある
期待以下のクオリティだった場合は、満足度が下がってしまう
短期的な成功と長期的成功の間にギャップがある...
ちょっと文脈がわかってないのでスライドを見る
メモ: 2軸のflamegraphが割と見やすいなと思った
Eコマース検索における機械学習
---
Solrクエリをmemochachedにキャッシュ
クエリを作るのにDBアクセスがあるのなら良さそう
メルカリはbackendにsolrを使っていた
関連ワードバッチとかのデータはmemcachedに保存している
関連ワード
キーワードの相対エントロピーを計算して、閾値を...
jaccard距離
---