2024/09/21

メインの主張

人間が認知タスクを効率化しよう・できることを増やそうとするとき、2種類のアプローチがある。

言語を使って他人に委譲する。

無意識に行える身体的アクションに落とし込み小脳に委譲する。

コンピュータによる認知拡張は、この2種類それぞれの流れに基づいて実施されてきた。

これ考えれば考えるほど本当かって気持ちになるな。GUIは違うのでは？

より脳で扱いやすいメンタルモデルに認知を変えるというアプローチだな

なんかすべてを小脳と呼んでいるけど普通に違う気もする

大脳の認知負荷を下げるために、大脳で扱いやすいモデルに考え方を変える・大脳から小脳に委譲する・言語で他者に委譲するの3種類があると思った

1はデザイナーの仕事、2・3はユーザがそれぞれできること

つまりツールのユーザ体験としては2と3でしかない。複数のツールを比較したときにどれか扱いやすいか、という点で1が存在する。

Figmaのコンポーネント化とかは、1をある程度ユーザもできる仕組みのことを指しているな。

今の流れはAIによる他人化。他人とは言語でコミュニケーションする必要があるので、必然的に齟齬が生まれる。他人的なソフトウェアには、必ずコミュニケーションの齟齬に対応するための仕組みが組み込まれる（チャット形式、エラーメッセージ）。

他人に委譲しても、「自分の」できることが増えたことにはならない。この認識に対応するのが行為主体感という指標。

言語に表現しづらいことは「自分でやったほうが早い」。ChatGPTにやらせているのも自分だけど、それは「自分でやってる」うちに入っていない。

曖昧な言語を通じて会話しないといけない存在は、絶対に「自分」にはなり得ない。というか、その曖昧さ・不確実さこそが自分と他人を区別する因子だ。

骨折などで自分の手が思い通りに動かないとき、自分の手が自分のものでなくなったかのような感覚になる。

ブッダは「真に思い通りになるものは存在しない」というロジックで「無我」を説いた。

思い通りに操れる他人のことを「手足」と呼ぶ表現。

これはメンタルモデルが完全に共有されていて、言葉を用いて指す対象に曖昧性がないから、言ったことがそのまま伝わるという点で手足のようになっている。

完全にコントロールできないという点で自分ではないが、メンタルモデルを内部でそもそも持たないのが「環境」

Google検索は環境に近い？

言語そのまんまUIを集めている

なぜこれは変な感じがするのだろう

ChatGPTはこれをさらに言語側に推し進めた形であり、完全に言語によって指示を行う

普通のGoogleフォームはこれをオブジェクト指向UI側に推し進めた形であり、「言語」というより、各ステップごとにユーザの頭から「連想されること」を入力していく仕組み。

Googleフォームを使っているとき、言語そのまんまUIでみられるような完全な文を脳内で生成している人はいない。

実は突き詰めていくとREST APIというのはフォームを入力する行為に等しい。このようなAPIを使うサービスにおいても、ほとんどの場合は日本語や英語などの言語を使っていない

嫌なSpotify「私は【藤井風】の【まつり】を【再生 / 一時停止 / プレイリストに追加 / クレジット閲覧】したいです」

普通のGUIのフォームのような見た目と言語による指示が同居しているのが面白い点

「自分が行う操作」について過剰に説明するのは、UIデザインの禁忌とされている。

「取説のようなUI」という表現がある。ユーザがわかってくれるか不安になって、各操作項目に大量のラベルをつけた結果、まるで取説を読みながら操作しているようになってしまう。

システムの操作マニュアルを不要にする秘訣 | 日経クロステック（xTECH）

「説明が不要で、見るだけですぐに操作できる画面が良いUIだ」とアステリアの北原執行役員は話す。

説明なしでもわかるUIを実現するために！マイクロインタラクションの基本を理解しよう｜ferret

説明書を読まずに簡単に操作できる状態を実現することで、ユーザーに心地よい体験を提供できます。

（でもラベルあったほうがいいってこともあるし、それは「説明書が不要」に近いよね……）

というよりあれか。ユーザに伝えるときに言葉を使うのは学習の過程だからよくて、今回のスコープはユーザからの入力に言語的思考を強要するか否かってことか。

プログラミングも一定言語的思考。

今あるUIは言語による思考から離れる術としてオブジェクト指向を使っているのではないか？もっと言えば、言語による思考の限界を超えるために使っているのではないか？

言語と小脳、自己と他者

（ここ急だな……根拠もほしい……）

ここでラディカルな主張。

人間が認知タスクを効率化しよう・できることを増やそうとするとき、そこには2種類のアプローチがある。

言語を使って他人に委譲する。

無意識に行える身体的アクションに落とし込み小脳に委譲する。

言語そのまんまUIは、言語のような見た目をしているのに、言語指示に特有の不確実性が存在しないことがわかる。逆に言うと、これまでの「言語っぽい」ソフトウェアはすべて、制約をつけられた擬似言語だった。Google検索もそう。

ChatGPTは真に言語で会話できる初めてのインターフェイスであり、本当の意味で委譲が行える可能性が出現している。ただそれはどこまでいっても自分の行為/自分の力にはならない。前提知識や文脈を深いレベルで共有していくことで、非常に自分に近い仲間にはできるかもしれなくて、それには希望を持てる気もする。

ただ、やっぱり自分でできることは重要（だと思っている）で、そのための手段であるGUIがすべてチャットUIに取って代わられたり、毎回UIが生成されるようになるといった極端な意見はやはり間違っているし、「自分の力を増やす」という方向でのサイボーグ化は今後も進化の余地があると思う。これが正しかったかどうかは10年後くらいにわかるだろう。

メンタルモデルの話一回削っちゃう説

→2024/09/23