Twitter Dataset
Twitter日本語評判分析データセット
ツイート本文は含まれないが、ワーカを使って文章のネガポジ判定した結果をメタデータとして付与している
知見
付加的な二次データであれば、ID に紐づけて再配布できる
個人的見解
Twitterを探る前に必要としていたスプレッドシートに関して:
①著作権的に問題がある記述が含まれない
②調査した結果得られたデータを付与(新規性の担保)
③データへのラベリング
④別のデータとの関連付け
⑤↑その根拠
これらの要素がスプレッドシートには含まれてるけど、公開については問題なさそうじゃない?
(強いて言えば、収集者が一人なので偏りが含まれているかもしれない可能性を排除できないくらい