WISS2024 参加報告
WISS2024(第32回インタラクティブシステムとソフトウェアに関するワークショップ)
冬にあえてホテルに缶詰になって議論を交わすという独特のカルチャー
今回WISS2024に参加した背景
WISS2024はWISS 30周年という節目であるため、Helpfeelとしても盛り上げるべく、スポンサーになった
私はスポンサー企業の一員として参加した
全体的な感想
WISS2022と比べると、登壇発表、国際学会招待発表、デモ発表、WISS Challenge、という4つの形式で、発表形式がシンプルになっていた 登壇発表や国際学会招待発表で聞いたものをデモ発表で実際に研究者と対話しながら見たり触ったり体験できるというのが良かった
WISS ChallengeのようなWISSらしさは今後もぜひ引き継がれてほしい、良いカルチャーだなと思った
機械学習はもはや当たり前の存在になりつつある。生成AIの登場によってさらにハードルが下がった印象
ただ使えばいいというものではない。あくまでもパーツ
特に関心を持った発表
Helpfeelが企業賞を授与した発表
生成AIが人間に質問をすることでメール返信を出力するシステム
人間からの質問にAIが返答するよくある質問応答システムではなく、AIが質問をしてきて、人間が答える
その人間の返答によって、より人間の意図に沿った返信メールを生成AIが作成するという仕組み
良いアイデアかつシンプルで使いやすく工夫されたインターフェースで、実用性も高い
身近かつ解決する価値の高い問題を発見し、独創的なアプローチで解決策を見出し、実際に使えるものとして実装し、自身でドッグフーディングもしているのが素晴らしい
メール以外でも同じアプローチが使えそうだし、メールの中でも特定の分野に特化するとか、あるいはインターフェースを一層洗練させるといった、今後のさらなる研究の展開も期待できる
https://gyazo.com/3fcd42ad3b866f3d57745353032fae41
30周年記念特別講演
CyberCodeやNaviCamがめちゃくちゃ懐かしかった
30年間に渡って第一線で活躍し続けている研究者たちの研究テーマの変遷を本人の言葉で俯瞰することができたのはとても貴重な機会で、学びも多かった
やはり研究でも名前重要ということで、アイデアやプロダクトに対する命名法は、自分なりのスタイルを見つけ出したいと思った https://gyazo.com/9e9aad215929e47ee0242d278b21dc18
WISS Challenge
WISS2024のSlack内で動作する、生成AIを使った質問応答システム
アイデアをメンションすると、RAGによって関連しそうな学術論文を探してきて、壁打ちができる
参加者たちから非常に活発に使われていた
自分もWISS2024の期間中に何回か使って、役に立った
先行研究を教えてもらったりした
生成AIを使ったテキストの再帰的な要約システム
めちゃくちゃ便利だった
気になる発表の詳細を深堀りしたい時に、ページに書かれている概要よりも細かく自分が知りたいポイントだけを素早く掘り下げて知ることができて、実際に便利だった
論文ごとにユニークなIDが発行されていて実際に使えるようになっているのがすごかった
生成AIを使ったAIクローン、質問応答、非同期コミュニケーションシステム
論文を読み込ませることで著者のAIクローンを作って、音声で対話できる
対話は記録されて、著者にメールが届く
著者本人がより細かく説明したかったらメールでやり取りすることもできる
ホテルの柱にiPadがガムテープで貼られていてシュールだった
https://gyazo.com/a92ad38be3d64a38ecb2d67cf821bb9dhttps://gyazo.com/68f113c3333fc8537b22cb1302cc89ee
登壇発表
機械学習のためのアノテーションの負担や課題を、データ構造やインターフェースの工夫によって改善しているシステム
データセットの構築において、データ構造やインターフェースの工夫が重要であることを改めて実感
国際学会招待発表
オンライン講義などのスクリーンレコードにおいて、話者が指し示している箇所をわかりやすく強調・拡大するシステム
WISS2023でHelpfeelが企業賞を授与した方がさらに研究を深めていたのが印象的だった 弱視の方のための研究だが、晴眼者にとっても役立ちそうで、素晴らしい
画面共有時にプライバシーに関わる情報をリアルタイムでマスキングするシステム
WISS2022でポスター発表していた方で、興味深くお話させていただいたのを思い出した あそこから二年間で実際にリアルタイムに動くシステムになっていたとは本当に驚いた
名刺交換させていただき、デモも拝見させていただけた。ありがとうございました!
https://gyazo.com/511a9a91536f2b30517f2e5a6534480ahttps://gyazo.com/4c24f7c65abe44f5ba52a2beaf8b3c6c
https://gyazo.com/86476eb95ff99ee22376d9083f8b10a9https://gyazo.com/83ac9bbfd7c5bc477c2aacc8960476d7
https://gyazo.com/fab0177f1ded38f70619bb8c42d3575chttps://gyazo.com/ce2f6c4ed6335298ddb33b701d1edfac
https://gyazo.com/e9fd4af5c7cbc94c4b751bda8e221ec0https://gyazo.com/0f20fb445cd49d71c99af109343b6298
デモ発表
LLM、生成AIを使っている
鏡になっているディスプレイで自分と向き合う
マイクに向かって発言するとディスプレイの中の自分の頭にフキダシが表示される
=生成された内言
他人じゃなくて自分のほうが良いのか?
対話相手が自分であるメリット
他人に説得されるんじゃなくて自分で納得したい
もともと教育用途の研究
自己決定を促す
現状、生成される内言はOpenAI APIが勝手にそれっぽいものを出しているだけ
各個人の内言のデータで学習する必要があるが……
日記とか?
ツイートを学習させるなど?
https://gyazo.com/83cbfe8481a487f398e2d9c28dc0b6dehttps://gyazo.com/2a2c6c9f44185066164fae48f863c474
生成AIによるリアルタイムな文字起こし・会話要約システム
5分間の会話を30秒毎に要約してテーマを表示
実際に会場で私と研究者の方との会話内容を適切に要約していて、すごかった
ただ、さらにリアルタイムにしたいらしい
5分間というバッファを1分間にすると生成AIが適切にトピックを捉えられなくなって荒ぶるとのこと
日本語文字起こしの精度と、要約のよりリアルタイムな更新が課題で、苦労していそうだった
地図
東京都が出している保育園の第三者機関による調査の単語の共起ネットワークを分析
UMAPとk-meansによるクラスタリング
意味的なクラスタリング結果が地域に対応していることが判明したという話が非常に興味深かった
https://gyazo.com/152e0be09117f82e7d7d62f7d272c2c7https://gyazo.com/dfd62015f7c2cd1df6d9a591a6aea1c7
GPSアートが作れるアプリ
GPSの軌跡で地上絵を描くというGPSアートは知っていたが、それを複数のGPSの軌跡の組み合わせにしたもの
アプリの作り込みがされれば結構流行るのではないかと思った
https://gyazo.com/fd9cca90e61f8f6b2e4df09d4b888ebc
終わりに
ナイトセッションの酒がすごかった
全部新潟県の地酒
https://gyazo.com/e698678d16a4a86a1e02c86914e740d8