ヒューマンインターフェス
https://gyazo.com/726ffc3b47afb742eedc2d3025d4509c
増井俊之 (著), 小池英樹 (著)
1. ヒューマンインタフェースとはなにか
インタフェース
性質が異なるものを接続するための仕組み
マンマシンインタフェース
人間と機械の間の対話
インタラクション
リアルタイムな対話
対話的なインタフェース
人間→目覚ましアラームセット: 非対話的
人間↔蛇口: 対話的
コンピュータヒューマンインタフェース
ヒューマンコンピュータインタフェース
ユーザインタフェース
本講義ではヒューマンインタフェース
人間工学(エルゴノミクス)
人間が使いやすい道具を設計する技法
ヒューマン・インタフェースでは人間工学的な側面だけではなくインタラクションすべての使い方を含むものと考える
コンピュータと人間のインタフェース設計は本質的に難しい
人とコンピュータの差異
AI技術
音声認識・画像認識
溝を埋めるためのヒューマンインタフェース技術はこれからも重要
直感的
ペンの利用が直感的なのは慣れ
直観的より慣用的にmtane0412.icon
ダグラス・エンゲルバート
マウスの発明者
世の中には自然な人工物など存在せず、慣れ親しんだものを自然だと感じるだけだ
マウスのデザイン
アフォーダンス
ものの形状が人間の動作を誘導する
ユニバーサルデザイン
誰でも使えるような設計
バリアフリー
障害があっても利用できるようなデザイン
優れたヒューマンインタフェースはユニバーサルデザインに基づいているべき
人間中心デザイン
人間にとっての使いやすさを最重要視するデザイン
近年のヒューマンインタフェースのデザインの考え方の基本
人間の弱点を把握したうえの柔軟なデザイン
undoなど
そもそもからの発想
乗り物
馬車に慣れている人は馬車の乗り心地や使い勝手を考える
そもそも人間が移動する必要があるのか
ユーザ評価
インタフェースシステムの良し悪しを議論するために必要
主観的な評価も重要
数値化・客観化が難しい
p値
帰無仮説(null hypothesis)に基づいて計算された統計量よりも極端な統計量が観測される確率
ユーザ評価実験により計測された値がどの程度信頼できるのかを示す指標としてよく利用されている
p値計算によるユーザ評価の信頼性には議論がある
検定力が低い実験を何度もやると良いp値が出てしまうことがある
@yutakashino: 心理学の7つの大罪 | クリス・チェインバーズ https://t.co/3KWWdAFr8Q repligate/replication crisis https://t.co/hax06vEIxU と呼ばれる心理学の有名な実験が再現不能であることに関する状況の整理(図の通り)と原因を追及した本の邦訳.HARK, p値ハッキング,発表バイアスなど相当根が深いです…
https://pbs.twimg.com/media/D3WLBxwXkAI2fTS.jpg
そもそも精緻な実験を行わないと違いがわからないようであれば大した違いとはいえないのではないかという意見(ニコラス・ネグロポンテ『ビーイング・デジタルルービットの時代』)
実験によって初めて分かることもある
実際に計測してみるとショートカットキーはメニュー利用よりも遅い
AskTog:Keyboard vs. The Mouse, pt 1
評価実験により直感と異なる事実が判明することもあるので重要
2. ヒューマンインタフェースの歴史
バッチ処理
昔は対話的ではなくタスク/ジョブを投入して結果を待つのが普通だった
パンチカード
TSS(Time Sharing System)
複数のユーザが1つのコンピュータを同時に(時間をシェアして)利用できるようにしたシステム
複数のユーザが同時に複数の端末を利用してプログラムを書いたり処理を指示したりできるようになった
対話的なユーザインタフェースのはしり
CLI
文字端末は計算機に指令を送るだけで計算は行わない
リモコンと同じようなもの
1. ユーザの要求を文字列で指定してコンピュータに送る
2. 受け取った操作指令をコンピュータが解釈して計算する
3. 結果文字列をユーザに返送し、ユーザの端末で表示/印刷する
プロトコル
通信の規格
GUI
一般的なGUIはウィンドウ、アイコン、メニュー、ポインティングデバイスを利用するという特徴(WIMP)
ポインティングデバイス
Sketchpad(1963)
ドナルド・サザランド
ディスプレイ装置ブラウン管
ライトペン
マウス(1960年代に提案)
ダグラス・エンゲルバート
両者ともチューリング賞受賞
Alto
最初のWIMP型GUI
PARC(PaloAlto Research Center)で開発された
ハード: チャールズ・サッカー
ソフトウェア・インタフェースはアラン・ケイら
両者ともチューリング賞
SmaltalkやMesaのような高級プログラミング言語を動かせる
AltoのGUIの基本機能はAppleのLisaやMacintoshに受け継がれた
直接操作(Direct Manipulation)
実際にそこにファイルや紙が存在するかのようにものを操作
WYSIWYG(What You See is What You Get)
ウィンドウ
優れたインタフェースシステムは人間の錯覚をうまく利用したものが多い
動画の表示
メタファー
デスクトップ画面はデスクトップメタファーに基づく
フォルダ
メタファーの利用が常に良いことだとは限らない
マニラフォルダ
米国で広く利用されている文房具
日本では同じ用途にクリアフォルダが利用される事が多い
最近だと保存のメタファーのフロッピーを若者が知らないmtane0412.icon
世の中に存在しないものでも使いやすいインタフェースは存在する
ズーミングする画像や地図
スクロールする画面
イディオム
一度覚えると忘れにくい言い回し
ユーザインタフェースのイディオム
一度体験すると忘れにくく、直感的に利用し続けることができるようなインタフェース技法
プルダウンメニューやスクロール
並列処理
コンピュータ上で複数のプログラムが同時に動くもの
JavaScriptのコールバック
実質的には並列処理
並列処理をそれほど必要としないインタフェースも存在する
電卓など
半二重通信
一度に一つの方向のみ通信が行われる
人間同士の会話は半二重通信的
全二重通信
情報の送信と受信を同時に行う通信
WIMPが究極のインタフェース技法であるとはいえない
情報視覚化にすぎず、もっと良い方法で置き換えられる可能性がある
スクロールバーというGUI部品が利用されるのが普通だった
スマホやタブレット端末ではスクロールバーを使わず指で画面をなぞる
ズーミングインタフェース(ZUI)というものが提案されている
ケン・パーリンはPadというZUIを提案
3次元インタフェースは期待されたがこれも操作が難しいということで流行するに至らなかった
根本的にGUIが適切に利用できない領域も存在する
スライダの微調整
処理を自動実行させることが難しい
ブラウザでWebを利用するときのヒューマンインタフェースが非常に重要になっている
グループウェア
複数のユーザが共同で作業を行うための様々なっステム
3. インタフェースの入出力装置
入出力装置
近年
入力: キーボード・マウス・タッチパッドなど
出力: ビットマップディスプレイ・プリンタなど
バッチ処理が主流だった初期のコンピュータ
入力: パンチカード・紙テープなど
センサ
サーミスタ
温度により抵抗値が変化する→温度センサ
CdS
光の強さにより抵抗値が変化する→光センサ
キーボード
スイッチ・圧力センサ・静電容量センサ
コンピュータ普及時にすでにタイプライターが普及していた
レミントン社のQWERTRY配列が広く使われる
英語圏以外
フランスではAZERTY配列
タッチパネル
圧力センサ・静電容量センサ
ASCIIコード
ISOの標準にもなっている
Sketchpad
アイバン・サザランド
GUIの先駆的システム
ライトペン
受光素子を搭載したペン型のポインティングデバイス
絶対位置
マウス
ダグラス・エンゲルバート
Altoでマウスがポインティングデバイスとして利用→デファクト
マウスは相対位置
エンゲルバートのマウス
回転板が2つ内蔵
バッチ処理が基本の時代なので対話的に使うという発想ではない
ボール式マウス
Altoのマウスはボール式
回転検出にはロータリーエンコーダが利用される事が多い
光学マウス
イメージセンサ
マウスホイール
スクロールやズーミングに便利だということで急速に普及
トラックボール
トラックポイント
キーボード上に指をおいたままポインティングデバイスを操作できる
タッチパッド
静電容量センサ
複数の指を検出できるのでジェスチャが可能
タッチパネル
スマホやタブレットで広く利用される
ペンで使う圧力式と指で使う静電容量式
圧力式は1つの位置情報のみ
Deep Learningによって音声認識精度が格段に向上
音声認識が完璧でも音声入力が常に最適とは限らない
音を利用したインタフェース
Active Badge
超音波音源を内蔵
部屋に設置した超音波マイクを利用して端末の位置を計測
Ping Pong Plus
MITメディアラボの石井裕が開発
卓球台の四隅にマイクを置くことによってピンポン玉が落ちた位置を計測
視線を利用するインタフェースは期待されたほどは普及していない
意図的かたまたまかの区別が難しい
ジェスチャ入力
ディスプレイ装置
人間の目は大量の二次元情報を高速に処理できる
電球やLED
ブラウン管
蛍光塗料が塗られたガラス面に電子ビームを照射して発光
陰極管ディスプレイとも呼ばれる
オシロスコープのような計測器でも広く利用された
真空管であるためサイズが大きく図雨量も大きい
液晶ディスプレイ、有機EL装置、E-Inkなど
文字表示装置
ニキシー管、蛍光表示管、7セグメントLED
音によるインタフェース
電子レンジ音、ドアベルなど
アクチュエータ
ものの動きに変換して情報を出力
モータやメータ
痛覚や味覚を伝えたり、筋肉に刺激を与えたりすることもできる
触覚フィードバック
4. 情報検索のインタフェース
検索
情報整理するのは検索を簡単にするため
検索が簡単であれば整理をする必要もない場合が多い
Cosensemtane0412.icon
生活行動も検索行動が多い(探す)
分類
複雑で大量のデータを分類するのは難しい
こうもり問題
テキスト検索
ACM(Association for Computing Macinary)のSIGIR(Special Interest Group on Information Retrieval)
テキストの検索手法を研究
情報検索はテキスト検索が主流だった
全文検索
Web上のすべてのテキストに対しては膨大な時間がかかる
索引(インデックス)を計算している
あらかじめ作成したデータベースからリストを得る
F値
適合率と再現率の調和平均
$ F = 2 \cdot \frac{\mathrm{precision \cdot recall}}{\mathrm{precision + recall}}
これらはトレードオフ関係
precision(適合率/精度)
検索結果の中で自分が欲するデータが有る割合
recall(再現率)
検索されるべき情報のうちどれだけが検索結果に含まれるか
tf-idf法
tf値とidf値の積で文書をソートするユーザの要求に最も近い文書を検索
tf(term frequency)
文書中にある単語が含まれている数を、その文書中の全単語数で割った値
idf(inverse document frequency)
総文書数をその単語を含む文書数で割ったものの対数をとった値
単語iの文書jにおける重要度を示すと考えられるので、検索結果をtf-idf値でソートすると、適切な順にテキストがランキングされる
利点: データのみを利用してランキング計算できる
1990年代のWeb検索で主流
→現在はページランクが主流
正規表現
曖昧検索(あいまい検索)
多少の誤りを許す
正規表現を使うことはできるが、簡単ではないので特別のアルゴリズム(approximate pattern matching)が利用される事が多い
インクリメンタル検索
動的検索(Dynamic Query)
検索条件を変えたときに直ぐに結果を表示する検索手法
GUIの直接操作と同じような意味を持つ
キーワード検索の限界
キーワードを知らないと検索することはできない
検索空間mtane0412.icon
Search Requires Knowledge of the Search Space
ページランク(PageRank)
ラリー・ペイジ、セルゲイ・ブリン
Page Rankによる計算結果は人間の常識や評判を反映したものに近くなる
ソーシャルフィルタリング
他人の知識、行動や口コミを利用して検索を行うこと
ハイパーテキスト
1963 テッド・ネルソンが発明
1945 ヴァネヴァー・ブッシュが情報のリンクを利用して検索や発想を行うというアイデアを提案
Wiki
Wiki Wiki Web
1993 ウォード・カニンガムが開発
ファセット検索
検索可能な属性をユーザーに提示し、それをユーザーが選んでいくことによって検索実行させる
質問文検索
結果を検索するよりも質問文を検索するほうが有益になることがある
Helpfeelがこの発想mtane0412.icon
5. テキスト入力のインタフェース
テキスト入力
1978年に日本初の日本語ワードプロセッサ
キーボード
タイプライタの長年の実績
二本の手の文字入力は熟練すれば相当高速
QWERTY配列
英米のタイプライタやコンピュータで広く採用
諸説ある
印字のためのアームの衝突を防ぐための配列という説が有名だが誤り
アクセントやウムラウトは用意されていないので追加の機能が必要
AZERTY配列
フランスで主流
ドイツのパソコンの配列も微妙に違っている
スペイン語ではアクセント以外に専用のキーが用意されている
DVORAK配列
英語入力のQWERTY配列は普及しているが入力効率は最適ではない
DVORAK配列は英文テキストを効率よく入力できるように工夫された配列
配列が全く異なるため広く利用されるには至っていない
英文タイプライタ由来のキーボードは人間工学的に優れているとは言えない
分割キーボード
CLIの文字端末は英数字のみ利用するのが一般的
英語26種類、大文字小文字で52種類、10個の数字や記号を加えたとしても100種類くらい使えれば充分だという考えがあったと思われ、これらに番号を割り当てたものがコンピュータ内で利用されている
どの文字にどの数字を割り当てるかは現在は標準化されている
ASCIIでは$ 2^7=128文字だけが定義されている
1文字の単位を8ビットにして$ 2^8=256文字を扱えるようにしたものが広く利用されており、8ビット=1バイトとしてコンピュータのデータ処理の単位になっている
英語以外の文字を表現するためには1バイトでは足りない
現在ではUTFという規格が広く利用されている
日本語入力
日本語入力タブレット
初期の日本語ワープロでは、漢字を選択できるタブレットを利用して直接1文字ずつ感じを選択していく方式
英数字の組み合わせで感じを選ぶ手法
T-Code式, 1 4という2つのキーで漢という漢字を入力することができる
組み合わせを記憶するのが大変難しいので普及しなかった
かな漢字変換
最も広く使われている
日本語JISキーボード
親指シフトキーボード
連文節変換
文字列を変換する連文節変換システムが長年研究されている
正しく単語を分離する必要
文脈の計算
近年は大量のコーパスをもとに機械学習を行って変換システムを構築する「統計的かな漢字変換」が主流
文法規則や変換アルゴリズムを利用するよりも正確であることが多い
問題点
正確な読みの入力が必要
すべての読みの入力が必要
予測/補完手法
変換結果が一意に決まらない
カスタマイズが難しい
標準語しか使えない
キーボードの問題点
ユビキタスコンピューティングの時代にはキーボード以外の入力デバイスなどが重要になってくる
テンキー入力
小型キーボード
Twiddler
Half-QWERTY
Frogpad
速記用キーボード
ミケーラ
T9
複数の文字をテンキーの1つのキーに割り当てる
携帯電話の入力
キーボードをなぞる手法
Shapewriter
予測入力
POBox
入力補完
曖昧入力
多少のミスを許容
文字認識
一筆書きによる認識
Graffiti
PalmPilotというPDAで利用されていた
Unistroke
Xerox PARCで開発された一筆書きの文字認識システム
音声認識