【研究】皮肉文検出(誹謗中傷検出)
皮肉文検出
しばらく一人言が続きますので,どんな研究をしているか気になる方は,本題 までスクロールしていただけると幸いです!
研究内容だけ知りたい人は 研究内容 までスクロールしていただけると幸いです!
一人言
https://scrapbox.io/files/6512fef0474f6c003546d6ee.jpeg
みなさんは1日何回SNSを見ますか?
その中で何回 誹謗中傷 を見ますか?
世の中には思想の自由もあるし,発言の自由もあるし,好きに物事を考えれば良いと思います.
けどその自由は人を傷つけてもいい理由にはならないと思うんですよね.
私は偽善者でも何でもないので,誹謗中傷を一言も言わないかと言われると首を潔くは横に振れないと思います.
誹謗中傷の研究をしてる人でもこうなのだから,自分の思ってしまう誹謗中傷を超えるくらい誹謗中傷を撲滅できたら良いんじゃね?と思ったわけです.
一言で誹謗中傷といっても,罵倒・デマ・嫌味・揶揄・皮肉,etc.
人を傷つけるのにどれだけの種類があるんだとも思いますが,視点を変えると直接攻撃するのではなく,間接的に,遠回りして,緩衝材を挟んだような表現を考えたと捉えることもできるかもしれないですね.
数ある誹謗中傷の中から選ばれたのはこいつ!!
ズバリ 皮肉 です.
冒頭でも書いてますね?
「お宅の息子、おピアノ上手ですねぇ」
先に京都の皆様には謝っておきましょう.
本当に申し訳ございません.
皮肉の研究を始めてからというもの,例を出すたび,安易に「昔の京都の人はよく皮肉を言いますよね」といってしまっています.
本当につかみにもってこいなんです..
本題では,
皮肉って何なの?
皮肉を検出することの何が難しいの?
皮肉を検出して何の意味があるの?
どうやって検出するの?
バナナはおやつに入るの?
上記のような質問に答えていければなと思っています!!
本題
やっと本題 に入ります.
まず,バナナはおやつに入りません.
そうそう,皮肉って何なの?ですね.
皮肉とは
対象の欠点や弱点を遠回しに批判する言語現象です.
改めて意味を文字にしてみるとわかりにくいものですね.
図を用いて理解していきましょう.
今回は下記を例にして説明します.
対象:家
欠点・弱点:汚い
https://scrapbox.io/files/6513fbe8354164001c87ec71.png
「君の家は(対象の)(欠点:汚いけれど)綺麗な家だね(遠回しに批判している)」
本来ならば汚い家には汚いというのが直接的な表現ですが,本当に思っている意図は文面には出さず,綺麗なはずがないのに綺麗ということで,そんなわけないのに,,,と間接的に伝えてるんですよね.
このように,皮肉は,明記されている字面だけの情報と伝えたい意図に差がある表現になっています.
/icons/水平線.icon
皮肉はわかったけど,皮肉を検出することの何が難しいの?と思ったりしませんか?
トピックの分け方を疑問文にしていますが,この????????と思う感情こそが,研究というものを生み出しているのではないかと思います.
記事を読んでいて,トピックと同じように???????と思ったそこのあなた?
私たちと一緒に研究してみませんか?
皮肉検出とは
誹謗中傷の検出など,特定の文字や表現を検出するには,その表現に使われる単語などを見つけ出し,検出することができます.
例えば「あの先生って本当にバカだよな」
という誹謗中傷を検出しようと思ったら,悪口単語辞書に入っている,「バカ」を検出することで誹謗中傷を検出することができます.
しかし先ほどの「お宅の息子、おピアノ上手ですねぇ」ではどうでしょう?
京都人(もう本当に申し訳ございません)でもない限り,これが皮肉と判断するのは難しいですよね?
言い方を変えると,「上手」というのは褒め単語辞書に入っている単語なのです.
皮肉を検出することの何が難しいの?の答えには,
皮肉は 悪口単語を含まない ことが多い.
皮肉は感情分析(文章がポジティブかネガティブか分析すること)では ポジティブな単語 を含む.
皮肉は文の 表層的な意味とその意図 が一致しない
というようなことが当てはまります.
皮肉の単語を見つけようにも褒め単語と違いがないし,意味を見つけようにも書かれている文章とその意味が違うので,見つけることが難しいとされているのです.
/icons/水平線.icon
皮肉の検出が難しいことはわかったよ.
一つ賢くなったところで,また一つの疑問.
そんなに難しいなら,やらなきゃいいじゃん!
皮肉を検出してなんの意味があるの?
そう思ったそこのあなた.
やはり私たちと一緒に研究をしましょう.
そうなんです,別に皮肉を検出することに大きな意味はないかもしれません.
誹謗中傷の中で皮肉が占める割合はほんのわずかです.
そこで一つ,質問をしましょう.
あなたは誹謗中傷がしたいですか?
ここまで読んでくれたあなたには,いいえと答えて欲しいところですが,,,
聞き方を変えると,褒めていたつもりなのに,誹謗中傷になっちゃってた みたいなことは起きてほしくはないと思うんですよ.
先に答えを言ってしまうと,
意図しない誹謗中傷を防ぐ
が,皮肉を検出する意味だと私は考えています.
どういうことかと説明すると,先ほども言ったように皮肉は褒め単語を使って相手を批判しています.
下の例を見てみましょう.
意図しない誹謗中傷の発生する事例
ある選手が野球の試合で調子が悪かったとします.
あるSNSユーザがその選手の過去の活躍動画を見て「この選手やっぱりすごいなー」投稿しました.
その選手は,今日は活躍できなかったのに,称賛しているだと?すごくないって皮肉か,,,
意図していないのに誹謗中傷になっている.
https://scrapbox.io/files/65153f91c8bad6001b14c76c.png
考えすぎでしょうか.
これくらい考えてもいいと思うんです.
この選手みたいに卑屈な人もいるだろうし,何を言われても楽観的な人もいると思います.
どこかの誰かが人を傷つけず,人に傷つけられず,そんな研究が一つくらいあってもいいんじゃないでしょうか.
学術的にも意味があり,商品開発に伴い,大量のレビューを分析するときに,皮肉は細かい分析をするときにノイズ(邪魔)になります.
また皮肉は,文の表層的な意味とその意図が異なるため,皮肉を機械が理解することができるというのは,文や表現の含意(その文や表現に含まれている意味)を理解できることにつながります.
では改めて,どんな研究をどんな方法で行っているか説明していきましょう.
研究内容
皮肉文検出のための皮肉状況の検出
(M1 畑玲音)
なんのために?
誹謗中傷を検出したい
その中でも皮肉の検出は難しい
肯定表現を含んでいる
文の表層的な意味とその意図が一致しない
皮肉を検出する手がかりを見つけたい
意図しない誹謗中傷が発生するかもしれないから
https://scrapbox.io/files/651549601763da001b4518a6.png
どんなことをした?
皮肉の構成要素に着目した
皮肉文には皮肉状況と皮肉表現で成り立っていると仮定
皮肉表現はただの肯定表現なので検出しても意味をなさない
皮肉表現以外の文章に,肯定表現を皮肉たらしめる情報が含まれているのではないか
その情報を皮肉状況とし,皮肉状況が検出できるのか検証
https://scrapbox.io/files/651548d67a281f001c63cdb9.png
どんな方法で?
状況文を皮肉状況と非皮肉状況に分ける分類器を作成
皮肉状況と非皮肉状況が含まれている状況文のコーパスを作成
BERTと呼ばれる機械学習で分類器を作成
作成した分類器が皮肉に含まれる皮肉状況を検出できるか検証
皮肉文から抽出した皮肉状況である皮肉状況文コーパスを作成
https://scrapbox.io/files/65154aa4325996001bcd98fa.png
研究の詳しい内容を聞きたい方はこちらまで
松下研究室 修士1年 畑玲音
Mail: k223167@kansai-u.ac.jp
/icons/水平線.icon
学会発表論文
畑 玲音, 森野 穣, 松下 光範. 皮肉文検出のための皮肉状況の検出, 2023年度人工知能学会全国大会(第37回)