ヒューマンインターフェス
https://gyazo.com/726ffc3b47afb742eedc2d3025d4509c
1. ヒューマンインタフェースとはなにか
性質が異なるものを接続するための仕組み
人間と機械の間の対話
リアルタイムな対話
対話的なインタフェース
人間→目覚ましアラームセット: 非対話的
人間↔蛇口: 対話的
ヒューマン・インタフェースでは人間工学的な側面だけではなくインタラクションすべての使い方を含むものと考える
コンピュータと人間のインタフェース設計は本質的に難しい
人とコンピュータの差異
AI技術
溝を埋めるためのヒューマンインタフェース技術はこれからも重要
マウスのデザイン
ものの形状が人間の動作を誘導する
誰でも使えるような設計
障害があっても利用できるようなデザイン
優れたヒューマンインタフェースはユニバーサルデザインに基づいているべき
人間にとっての使いやすさを最重要視するデザイン
近年のヒューマンインタフェースのデザインの考え方の基本
人間の弱点を把握したうえの柔軟なデザイン
undoなど
乗り物
馬車に慣れている人は馬車の乗り心地や使い勝手を考える
そもそも人間が移動する必要があるのか
インタフェースシステムの良し悪しを議論するために必要
主観的な評価も重要
数値化・客観化が難しい
ユーザ評価実験により計測された値がどの程度信頼できるのかを示す指標としてよく利用されている
p値計算によるユーザ評価の信頼性には議論がある
検定力が低い実験を何度もやると良いp値が出てしまうことがある
https://pbs.twimg.com/media/D3WLBxwXkAI2fTS.jpg
そもそも精緻な実験を行わないと違いがわからないようであれば大した違いとはいえないのではないかという意見(ニコラス・ネグロポンテ『ビーイング・デジタルルービットの時代』)
実験によって初めて分かることもある
実際に計測してみるとショートカットキーはメニュー利用よりも遅い
評価実験により直感と異なる事実が判明することもあるので重要
2. ヒューマンインタフェースの歴史
昔は対話的ではなくタスク/ジョブを投入して結果を待つのが普通だった
複数のユーザが1つのコンピュータを同時に(時間をシェアして)利用できるようにしたシステム
複数のユーザが同時に複数の端末を利用してプログラムを書いたり処理を指示したりできるようになった
対話的なユーザインタフェースのはしり
文字端末は計算機に指令を送るだけで計算は行わない
リモコンと同じようなもの
1. ユーザの要求を文字列で指定してコンピュータに送る
2. 受け取った操作指令をコンピュータが解釈して計算する
3. 結果文字列をユーザに返送し、ユーザの端末で表示/印刷する
通信の規格
一般的なGUIはウィンドウ、アイコン、メニュー、ポインティングデバイスを利用するという特徴(WIMP) ポインティングデバイス
ディスプレイ装置ブラウン管
ライトペン
最初のWIMP型GUI
PARC(PaloAlto Research Center)で開発された 実際にそこにファイルや紙が存在するかのようにものを操作
優れたインタフェースシステムは人間の錯覚をうまく利用したものが多い 動画の表示
デスクトップ画面はデスクトップメタファーに基づく
フォルダ
メタファーの利用が常に良いことだとは限らない
米国で広く利用されている文房具
日本では同じ用途にクリアフォルダが利用される事が多い
最近だと保存のメタファーのフロッピーを若者が知らないmtane0412.icon
世の中に存在しないものでも使いやすいインタフェースは存在する
ズーミングする画像や地図
スクロールする画面
一度覚えると忘れにくい言い回し
一度体験すると忘れにくく、直感的に利用し続けることができるようなインタフェース技法
プルダウンメニューやスクロール
コンピュータ上で複数のプログラムが同時に動くもの
JavaScriptのコールバック
実質的には並列処理
並列処理をそれほど必要としないインタフェースも存在する
電卓など
一度に一つの方向のみ通信が行われる
人間同士の会話は半二重通信的
情報の送信と受信を同時に行う通信
WIMPが究極のインタフェース技法であるとはいえない
情報視覚化にすぎず、もっと良い方法で置き換えられる可能性がある
スクロールバーというGUI部品が利用されるのが普通だった
スマホやタブレット端末ではスクロールバーを使わず指で画面をなぞる
3次元インタフェースは期待されたがこれも操作が難しいということで流行するに至らなかった
根本的にGUIが適切に利用できない領域も存在する
スライダの微調整
処理を自動実行させることが難しい
ブラウザでWebを利用するときのヒューマンインタフェースが非常に重要になっている
複数のユーザが共同で作業を行うための様々なっステム
3. インタフェースの入出力装置
入出力装置
近年
入力: キーボード・マウス・タッチパッドなど
出力: ビットマップディスプレイ・プリンタなど
バッチ処理が主流だった初期のコンピュータ
入力: パンチカード・紙テープなど
温度により抵抗値が変化する→温度センサ
光の強さにより抵抗値が変化する→光センサ
キーボード
英語圏以外
タッチパネル
圧力センサ・静電容量センサ
ISOの標準にもなっている
GUIの先駆的システム
受光素子を搭載したペン型のポインティングデバイス
絶対位置
マウス
Altoでマウスがポインティングデバイスとして利用→デファクト
マウスは相対位置
エンゲルバートのマウス
回転板が2つ内蔵
バッチ処理が基本の時代なので対話的に使うという発想ではない
ボール式マウス
Altoのマウスはボール式
回転検出にはロータリーエンコーダが利用される事が多い
光学マウス
イメージセンサ
マウスホイール
スクロールやズーミングに便利だということで急速に普及
トラックボール
トラックポイント
キーボード上に指をおいたままポインティングデバイスを操作できる
タッチパッド
静電容量センサ
複数の指を検出できるのでジェスチャが可能
タッチパネル
スマホやタブレットで広く利用される
ペンで使う圧力式と指で使う静電容量式
圧力式は1つの位置情報のみ
Deep Learningによって音声認識精度が格段に向上
音声認識が完璧でも音声入力が常に最適とは限らない
音を利用したインタフェース
超音波音源を内蔵
部屋に設置した超音波マイクを利用して端末の位置を計測
卓球台の四隅にマイクを置くことによってピンポン玉が落ちた位置を計測
視線を利用するインタフェースは期待されたほどは普及していない
意図的かたまたまかの区別が難しい
ジェスチャ入力
ディスプレイ装置
人間の目は大量の二次元情報を高速に処理できる
電球やLED
ブラウン管
蛍光塗料が塗られたガラス面に電子ビームを照射して発光
液晶ディスプレイ、有機EL装置、E-Inkなど
文字表示装置
ニキシー管、蛍光表示管、7セグメントLED
音によるインタフェース
電子レンジ音、ドアベルなど
ものの動きに変換して情報を出力
モータやメータ
痛覚や味覚を伝えたり、筋肉に刺激を与えたりすることもできる
4. 情報検索のインタフェース
情報整理するのは検索を簡単にするため
検索が簡単であれば整理をする必要もない場合が多い
Cosensemtane0412.icon
複雑で大量のデータを分類するのは難しい
テキストの検索手法を研究
情報検索はテキスト検索が主流だった
Web上のすべてのテキストに対しては膨大な時間がかかる
あらかじめ作成したデータベースからリストを得る
適合率と再現率の調和平均
$ F = 2 \cdot \frac{\mathrm{precision \cdot recall}}{\mathrm{precision + recall}}
これらはトレードオフ関係
検索結果の中で自分が欲するデータが有る割合
検索されるべき情報のうちどれだけが検索結果に含まれるか
tf値とidf値の積で文書をソートするユーザの要求に最も近い文書を検索
文書中にある単語が含まれている数を、その文書中の全単語数で割った値
総文書数をその単語を含む文書数で割ったものの対数をとった値
単語iの文書jにおける重要度を示すと考えられるので、検索結果をtf-idf値でソートすると、適切な順にテキストがランキングされる
利点: データのみを利用してランキング計算できる
1990年代のWeb検索で主流
多少の誤りを許す
検索条件を変えたときに直ぐに結果を表示する検索手法
GUIの直接操作と同じような意味を持つ
キーワード検索の限界
キーワードを知らないと検索することはできない
Page Rankによる計算結果は人間の常識や評判を反映したものに近くなる
他人の知識、行動や口コミを利用して検索を行うこと
検索可能な属性をユーザーに提示し、それをユーザーが選んでいくことによって検索実行させる
質問文検索
結果を検索するよりも質問文を検索するほうが有益になることがある
5. テキスト入力のインタフェース
テキスト入力
1978年に日本初の日本語ワードプロセッサ
タイプライタの長年の実績
二本の手の文字入力は熟練すれば相当高速
英米のタイプライタやコンピュータで広く採用
諸説ある
印字のためのアームの衝突を防ぐための配列という説が有名だが誤り
フランスで主流
ドイツのパソコンの配列も微妙に違っている
スペイン語ではアクセント以外に専用のキーが用意されている
英語入力のQWERTY配列は普及しているが入力効率は最適ではない
DVORAK配列は英文テキストを効率よく入力できるように工夫された配列
配列が全く異なるため広く利用されるには至っていない
英文タイプライタ由来のキーボードは人間工学的に優れているとは言えない
CLIの文字端末は英数字のみ利用するのが一般的
英語26種類、大文字小文字で52種類、10個の数字や記号を加えたとしても100種類くらい使えれば充分だという考えがあったと思われ、これらに番号を割り当てたものがコンピュータ内で利用されている
どの文字にどの数字を割り当てるかは現在は標準化されている
ASCIIでは$ 2^7=128文字だけが定義されている 1文字の単位を8ビットにして$ 2^8=256文字を扱えるようにしたものが広く利用されており、8ビット=1バイトとしてコンピュータのデータ処理の単位になっている
英語以外の文字を表現するためには1バイトでは足りない
日本語入力
日本語入力タブレット
初期の日本語ワープロでは、漢字を選択できるタブレットを利用して直接1文字ずつ感じを選択していく方式
英数字の組み合わせで感じを選ぶ手法
T-Code式, 1 4という2つのキーで漢という漢字を入力することができる
組み合わせを記憶するのが大変難しいので普及しなかった
かな漢字変換
最も広く使われている
日本語JISキーボード
親指シフトキーボード
連文節変換
文字列を変換する連文節変換システムが長年研究されている
正しく単語を分離する必要
文脈の計算
近年は大量のコーパスをもとに機械学習を行って変換システムを構築する「統計的かな漢字変換」が主流 文法規則や変換アルゴリズムを利用するよりも正確であることが多い
問題点
正確な読みの入力が必要
すべての読みの入力が必要
予測/補完手法
変換結果が一意に決まらない
カスタマイズが難しい
標準語しか使えない
キーボードの問題点
ユビキタスコンピューティングの時代にはキーボード以外の入力デバイスなどが重要になってくる
テンキー入力
小型キーボード
速記用キーボード
ミケーラ
複数の文字をテンキーの1つのキーに割り当てる
携帯電話の入力
キーボードをなぞる手法
Shapewriter
予測入力
入力補完
多少のミスを許容
文字認識
一筆書きによる認識
Xerox PARCで開発された一筆書きの文字認識システム