2019/07/04 Generating Product Descriptions from User Reviews Authors
Slava Novgorodov^1, Ido Guy^1, Guy Elad^2, Kira Radinsky^2
1. eBay Research
2. Technion, Israel Institute of Technology
eBayの論文、第一著者はNLPとかDataManagementとかをやっているらしい
どんなもの?
ユーザーのレビューから重要文抽出の要領でeBay上の商品に対する説明文を生成
先行研究と比べてどこがすごい?
レビューから商品に対する説明文を生成したはじめての論文
End-to-Endで商品説明文を生成するシステムを構築し人での評価で5段階中4.3を獲得
データセット作りと分析
eBay上のFashoinとMotorsカテゴリの商品を使用し説明文の生成を試みた
https://gyazo.com/b1e0577c03cc622960858ce1b29a5ef2
ユーザーのレビューについて商品説明文として適切かどうか(good/bad)をプロフェッショナルによってアノテーションしている
説明文にも冗長な文章が含まれていることがあるのでこれらを除くためプロフェッショナル削除している (下の文章みたいなもの)
Give your clothes the luxury they deserve with these wonderful hangers!
1 year limited warranty
For over 35 years, we have been one of the largest sunglasses brand.
レビューと説明文を比較すると前者はここの体験が混じった抽象的なものが多いのに対して、後者は具体的に製品がなにか, なぜこの商品を買うべきかを書いている。
KL Divergenceを使って分析するとこんな感じ
https://gyazo.com/be9aca22dad256827989f0f235975687
候補文抽出
説明文生成を行うため対象の文を絞り込む作業を行う
ルールベース (以下の文を除外)
短すぎる文
- "i"や"my", "he" といった一人称、三人称の名詞が入っている文
- "price"や"shipping"などの本質的に商品とは関係ない単語
アノテーション
主観的すぎる文や文脈が足りていない文等を"bad"、そうでない適切な文を"good"としてアノテーション
https://gyazo.com/cd913ee1fd1d107f5ce041bb74f5a345
https://gyazo.com/86ade9b4c2c201070db380dd421c47b4
分類
XGBoostやLSTMなどで二値分類
https://gyazo.com/7690abcd97815928ecaa9e9ff7433727
LSTMはMulti-task learningを使うバージョンも試している
前段でアノテーションされた「レビューが主観的かどうか」「文脈が足りているか否か」も予測することによってよりよい分類を可能に
https://gyazo.com/63303cd566981a7c79cf1d6192dfe893
多様化
似通った文章ばかりが説明文になっては微妙なので、多様性をもたせる処理を間に挟む
文間のコサイン類似度を用いて似通った文が少なくなるようにする
https://gyazo.com/26c33dbe7a978264e83af5fbebcb35a7
文選択
Greedy approach good/badのスコアが高い順にk文選択
LexRank ノードを文、エッジを2文間の類似度として計算したPageRank
K-means classification score kクラスタごとに最もgood/badのスコアが高い文を選択
K-means centroid kクラスタごとに最もクラスタの中心に近い文を選択
評価
人手評価
https://gyazo.com/4bb436deb75a64b118b237d2a4311436
https://gyazo.com/d2a7d33e4356cc85e2b229752cad499f
https://gyazo.com/afb206b88f1be4c6983773ebf14a6adb
まとめ
レビューから説明文を作る手法を提案
読みやすい文の並び替え、何文選択するかを自動で決めるなどが今後の課題
感想
古き良き言語処理をの波動感じる
要約的なアプローチでSeq2Seqとかだとどうなるんだろう :thinking_face:
それこそPointer-generatorとか気になる :eyes: