chABSA-dataset
chakki's Aspect-Based Sentiment Analysis dataset
「chABSA-dataset」は上場企業の有価証券報告書(2016年度)をベースに作成されたデータセットで、各文に対してネガティブ・ポジティブの感情分類だけでなく、「何が」ネガティブ・ポジティブなのかという観点を表す情報が含まれています。
公開の背景
機械学習・自然言語処理を用いて観点に沿って情報をまとめる「観点要約」に取り組んでいます。
今回公開した「chABSA-dataset」は、この「観点要約」の研究の一貫で作成されたものです。「chABSA-dataset」を利用することで、「何が」良い評価・悪い評価なのかを判断する機械学習モデルの開発が可能になります。
文章中の文1つ1つにマルチラベルで付与されている
どこがポジティブ/ネガティブなのかも分かる