Alexa Day 2019参加レポート
神戸は日本のAlexaコミュニティの聖地だった。
https://gyazo.com/066ff82631bcfd0120b2df46925666d8
何の話かというと
Amazon Alexa関連のユーザーコミュニティイベント「Alexa Day 2019」の参加レポート。
神戸は知る人ぞ知るAlexaの聖地となっており、今回のイベントからものすごい熱気を感じた。
JAWS-UGとはまた参加者の層も異なり、新しい人達とお話できて楽しかった。
VUXは日本でもこれからさらに盛り上がりそうな予感。
Alexa Day 2019とは
AlexaDay2019 公式サイト
Alexa DayはAmazonが提供するAIアシスタントAlexaのユーザーコミュニティイベント。詳細はイベント公式ページに的確にまとまっているので、以下引用する。
Alexa Day 2019は、米国をはじめとして世界中で爆発的な人気となっており、今後国内のAI技術に対して大きなインパクトを与えることが予想されるAIアシスタントの「Alexa」やこれを支えるServerlessアーキテクチャ・LEX・AIやMLなどの技術や最新情報の共有を目的として、 Amazon Alexa のユーザーコミュニティ「AAJUG」とAWSの日本のユーザーグループ「JAWS-UG」メンバーを中心とした有志のボランティアにより企画・開催されるものです。
当日はビギナーからハイエンドなエンジニア、ビジネス層の方、ファミリーまで楽しくカジュアルに参加できる企画を実施する予定です。
2018年に最初のAlexa Dayが神戸で開催され、今回は2回目の開催。
神戸はこれまで2人のAlexaチャンピオンを輩出し、(おそらく)国内初のAlexaユーザーコミュニティカンファレンスが開催されるなど、知る人ぞ知るAlexaの聖地となっている。
前夜祭
イベントに先立って、前夜祭が行われるというので、こちらにもお邪魔した。
会場近くのHUBという英国パブ風のお店で、皆好きな時間に来て飲んで、好きな時間に帰る自由なスタイルなのがよい。
キャッシュ・オン・デリバリー会計なので全員で会計とか割り勘とかが無い、「AWS HUB」方式なのである。
19時頃から緩やかに開始し、ジワジワと少しずつ参加者が増えていく。これが楽しい。
(おそらく明日は早くから集合であろう)運営メンバーの方々も一緒に盛り上がった。さあ、明日も頑張るぞ。
https://gyazo.com/5e0dd29ddbfc0f472664dd1566ea429e
だいぶスケールしてきたころの様子
聞いたセッションのメモ
参加セッションの受講時のメモと感想を以下記載する。
講師の発言内容と若干ずれてしまう部分があったらご容赦願いたい。
「まとめと感想」の部分はワタシの感想なので、発表者の見解ではない。
セッションメモ:Adobe XDでもっと自由に簡単に作るVUIプロトタイプ
Adobe XDは画面デザインやプロトタイプを簡単に作れるUI/UXデザインツールです。2018年10月より音声コマンドにも対応し、例えばスクリーン付きのスマートスピーカー、Amazon Echo Show向けのプロトタイプもプログラミングなしで制作できます。このセッションでは、Adobe XDの概要と誰でも作れるVUIプロトタイプの制作方法を紹介します。
Speakers
轟 啓介 Keisuke Todoroki アドビ システムズ 株式会社
Adobe XD 公式ページ
セッションスライド]
Adobe XDでもっと自由に簡単に作るVUIプロトタイプ
米国のVUI状況
男性は6割がスマートスピーカーを所有している。ここ最近で急速に普及しており、今後も増加していく傾向にある。
使用場所は家ではベッドルームでの使用が圧倒的に多い。用途は音楽再生が多い。ついで天気予報。
シンプルなやりとりでの利用が多い段階にある様子。
VUIの種類
画面優先のアシスタンス
音声のみ
音声優先(画面つき)
VUIのメリットを改めて整理する
少ない学習コストで操作できる。なじみ深い会話の形で。特に年配者に優しい。
ハンズフリー 育児中、運転中、料理中につごうがよい。
速度(内容によっては口で言った方が圧倒的に早い)
長所と短所
ビジュアルに向いているもの:長いリストや数値データによるグラフ、製品情報
音声に向いているもの:やることが決まっているユーザーコマンド、簡単な説明書など
UXデザインのアプローチはこれまでと同じ
会話型フローの設計が必要。そこからインタラクションシートに落とし込んでいく
Utterance(発話。つまりユーザーが実際に言う言葉の表現。)
Situation(ユーザーが発話する際の状況)
Response(VUXシステムの返答)
Prompt(ユーザー側に発話を促す内容)
検討すべきこと
ユーザーへのフィードバックを適宜知らせること。どういうシステムの状況かわからないとユーザーは困る。
長い文を避けること。次のステップを順番に提供する。選択肢が多い場合は複数のステップに分ける。
エラー時の対処を適切に行うこと。エラーの場合も「ちょっと何言ってるかわからない」とか返さないで欲しい。
テストはとても重要
様子が見えない状態で音声だけでユーザーテストを行う。これをオズの魔法使いという。
設計後期になったら、ユーザーが実機を触れる環境で、様子を見ながらテストやモニタリングをする。
開発の際には実際に動かせる画面つきVUIのプロトタイプを、できればコーディング無しで早く簡単に作りたい。
Adobe XD
Adobe XDは以下の3つの機能を提供する。
UI Design(デザイン作成)
Prototype(プロトタイプ動作)
Share(他の人との共有)
画面デザインから、画面の遷移フロー、プロトタイプ作りが簡単に実現できる。 操作が簡単でコーディング無しで高速に作れるので、どんどん調子に乗って作り進めることができる。
★まとめと感想
VUXでも、テスト重要
いろんな形でテストしないと、ユーザーにとって自然で使いやすいスキルにはならない
実際に作って使ってみないと中々わからないので、アイディア出しからプロトタイプ作成まではできるだけ早く簡単にできると捗る
Adobe XDはデザインとプロトタイピングを支援するツール
---
セッションメモ:世界ではじめて楽器にAVSを搭載するまでの道
RolandがCES2019にて発表した世界初のAlexa搭載の電子楽器「Go-Piano with Alexa Built-in」 AVSの仕組みから製品化にいたるまでの技術的な課題などを交えて紹介いたします。
Speakers
栂井 秀方 Hidemasa Togai ローランド株式会社
高橋 慎一 アイレット
Go-Piano 公式サイト
Rolandはなぜ楽器に音声インターフェイスを搭載したかったのか
Rolandはギターエフェクター、キーボードなどを製造している。 Go Pianoという電子ピアノにAlexaを搭載した。 CESで二つの賞を受賞した。
電子楽器とAIスピーカーとの関連
AIスピーカーでは、音楽サービスからストリームで音楽を再生する機会が多い。楽器を演奏するときにも頻繁に音楽を再生する。楽器を持ちながら、音楽を声で再生したかった。
電子楽器のUI
電子楽器には大抵小さいディスプレイがついている。画面はとても小さい。操作性はどれも正直よくない。
その割に機能メニューは多くて、たとえば音色設定だけでも256種類も選べたりする。
設定できる項目が多いと、ユーザーはメニューの下の階層に潜っていく必要がある。たとえばメトロノームの拍子を変えるだけでも、結構メニュー操作が大変。だったら、楽器に口で言った方が操作がラクだ。
楽器にWifi接続機能をつけたので、楽器から演奏データをクラウドに保存して、後から聞き返すこともできる。自分の練習日記にしてもよいし、お子さんの記録として使うのもよいだろう。
https://gyazo.com/4ca02b53a6cc04c15eb7319f0d5740dc
基本的な仕組み
発話したものがテキストに変換されて、コマンドが動作する。 Device Cloudを介している。
PoCから製品投入までで得られた気づき
「Alexa × Somethingで何かできるかも」と安直に発想しがちだが、それが生む体験価値を真剣に考え抜かないといけない。
道のりは長い。多くの検証プロセスを踏まないといけない。
デバイスやハードウェア系の知識は真面目に重要。ソフトウェア系の知識やクラウドの知識だけだと到底実現できない。専門外の知識を持ってる人たちが組んで進めないといけない。
★まとめと感想
楽器とVUXははじめは何の関連も無いものと思ったが、体験価値がとてもよく考えられている。
実際のデモを体験するとめちゃくちゃ良いと思った。何を解決するのかがしっかり考えられているスキルはクールだ。
体験するとVUXで実現する良さがシンプルに実感できる。
---
セッションメモ:Backlog for Amazon Alexa enhance を 全部見せます
プロジェクト管理ツール Backlog とリンクすることのできる Alexa Skill version 2のエンハンスの中身全部見せます。
全ての機能をどのようにエンハンスしていったか。会話設計から各APIの実装、テストまで全部見せます。
Speakers
伊東 知治 Tomoharu Ito (Alexa Champion) 
セッションスライド
Backlog for Amazon Alexa enhance を 全部見せます
VUI and Project Management
音声UIとプロジェクトマネジメントについて考えてみる。
はじめに
Backlogは課題管理ツールで Nulabさんが運営している。チケットみたいに課題を管理していくツール。 APIが全部オープン。管理画面でできることはだいたいAPIでできる。
Backlog for Amazon Alextというスキルを作った。「進捗どうですか?」と聞くと、進捗状況を教えてくれる。
仕組みのはなし
Communication Layer
ユーザーとの会話を豊かにするための層。 利用状況に合わせた発話や利用頻度に応じたウェルカムメッセージを出す。ちょっと気の利いた一言をいう。ロジックと会話を豊かにする部分を分けて考えたいので切り出した。
Workflow Layer
発話から意図を汲み取り処理する層。インテントに対する処理を記述し、結果をコミュニケーションレイヤーに渡す。
PMに役立つスキルとは
PMはいつもたくさんのことを考えている。PMは常時様々な情報の入力を受け、分析して、アクションのための判断を下しているとも言える。
PMは意思決定をするために多角的な分析をしたい。ただの生の情報では無く、できれば情報を軽く分析したものが欲しい。 (未完了タスクの数そのものより、何らかの完了率の数値にして出す等)
VUXでは簡単な分析と、「ちょっと気の利いたアドバイス」を添えた情報を出すようにすると、とっても便利なものになる。従来のシステム機能と全く同じものを、Voiceにまんま乗せではあまり意味がない。
VUXは何かの機能の代替としてではなく、「人間的でちょっと気の利くアドバイザー」になって欲しい。
開発のツールについて
とにかくCodeStarはいい。 複雑なスキルを何人かで共同で作る場合には圧倒的にCodeStarは便利だ。
CodeStarはなにがそんなに良い?
CodeStarはCI/CDのプロセスを一通り自動で作ってくれる。 SAM(AWS Serverless Application Model)が勝手についてくる 
CodeStarはASK-CLIの初期設定でコケる心配がいらない。(皆んなここで心折れそうになる、よね?)
リポジトリへのPUSHでデプロイができる。
お作法としては、Alexaのテンプレートからプロジェクトを作ったら、まずは一回デプロイしておくということ。この状態から変更を加えるようにしていくとその後のトラブルを防げる。
現在の構成内容
https://gyazo.com/3d127a534fc55a7225e0f73a0c8ccc4e
Communication Layer
Greetingは訪問回数に応じて反応を分けるようにした。ランダムで変わるのではなく、回数に応じて変化させている。
Talkオブジェクト 
このオブジェクトの中で気の利いたことを言ってくれるようにしている。
Workflow
基本は1インテントに対して1ワークフローを対応づける。 インテント名を指定すれば対応付けられたワークフローを処理するだけになる。ハンドラー内がシンプルですっきりする。
Analytics
情報を取得した後に、情報を分析するオブジェクト。スキルの脳みそ。割合とかを算出する。
リポジトリ
BacklogのAPIをコールして、分析の元になるデータをもらう。
結論
プロジェクトマネージャのためのアドバイザーになりましょう。 システムのコピーになってはいけません。
★まとめと感想
このセッションはひたすら勉強になった。
VUXを設計するときに、ワークフロー、コミュニケーター、ホスピタリティに分ける形はデザインパターン的で美しい。
VUXは従来機能の置き換えではなく、「ちょっと気の利くアドバイザーであるべし」とは、目からウロコが100回落ちた。
前夜祭の時からCodeStar+Cloud9の環境を激推しされたので、試してみたい。
---
セッションメモ:隣の芝生は青かった?!VoiceUI/UXデザイナーがスキル解剖して気づいたいくつかのこと
私は、VoiceUI/UXデザイナーとして、過去多数のスキルを作ってきました。もちろんAmazonの「Alexa音声設計ガイド」を参考にしながら。けれども、やっぱり隣のお家のVoice UIデザイン設計が見てみたい…という好奇心が湧いてくるのがVoiceUI/UXデザイナーの性というもの。でも簡単に他人の作ったスキルフローなんて見られるもんじゃない。だったら、自分で解剖するしかない!…ということで、自分なりに解剖してみて気づいたいくつかのことをご紹介したいと思います。皆さんのVoiceUI/UXデザイン設計にお役に立てれば幸いです。
Speakers
元木 理恵 Rie Motoki 株式会社サイバード
セッションスライド
隣の芝生は青かった?!VoiceUI/UXデザイナーがスキル解剖して気づいたいくつかのこと
はじめに
Alexaの開発をやっている人でも、以外と他のサードパーティのスキルを自身では使っていない。 今回いろいろなスキルを解剖して、どんな設計なのかを調べてみた。
解剖例
JR東日本
運行状況を知りたい路線名を「山手線」のように言ってください。 路線を登録する場合に、あといくつ登録できますと言ってくれるのは親切。
食べログ
「食べログで恵比寿駅のフレンチを調べて」など、呼び出し方を知っていれば、ワンショットで呼び出せるのが便利。 ピックアップ口コミを読み上げてくれる。
Yahoo天気災害
非常にシンプルでムダな情報が全くない。しゃべる速度が早口なのは、おそらく忙しい状況で使うだろうから。シンプルに住んでいる場所の天気を知りたいときには便利。ちょっと欲を言えば、家だけでなく、職場やよく行く場所も登録できてほしい。 
スキルの要素
ご挨拶
スキルの自己紹介と、できることの説明
さあ、使ってみましょうと促す
ワークショップ
セッション中のミニ・ワークショップで、「イケメンとおしゃべり」というスキルのハッピーパス(ユーザーとAlexaで理想的に会話が進んだ場合のフローのこと)を書いて見るということを行った。
このスキルを呼び出すとレオナルドとフィンセントという、2人のイケメンと会話を楽しむことができる。
ユーザーとイケメン達は、同じ屋敷に住んでいるという設定。
二人のイメケンのうちの一人がランダムに選択され、選択されたイケメンが様々な甘い言葉を囁いてくれる。
★ワークショップやってみた感想
上記を踏まえて実際に書いてみると、エンタメ系スキルなので、このスキルに用意された世界観を壊さない様にしながら、進行を進めていくことになり、言葉選びにも結構苦心する。正直かなり悩みながら書いては消してを繰り返した。
スキル作成時のポイント
起動のワードは極力シンプルにできると良いが、一語の呼び出しは登録商標などでないと許可されない。
0からスキルを作っていくのはとても難しい。他の人のスキルを使ってみて、中身を解剖してみると大きな学びがある。
良いスキルとはつまり・・・三高だ
クオリティが高い
リテンションが高い
独自性が高い
※:三高:三高とは女性が結婚相手を選ぶ際の三つの好条件、高学歴・高収入・高身長を指す。バブル全盛期に流行った言葉。
★まとめと感想
VUXのデザインはGUIのデザインとはまた異なり、独自の設計スキルが必要と感じた
実際にユーザーがどんな言葉を発するか、その場面になったら何を感じるかを考える必要があるが、作っている側に回るとうまく考えられない。
多くの人に使われるスキルは不自然さがなくて、便利な様に色々考えられている。
---
ラストは懇親会
https://gyazo.com/38e94351f36b69484e4031b65e2007b3
最後は懇親会の会場に移動して、乾杯!
従来のJAWS-UGの勉強会とはまた参加者の層も異なり、新しい人達とたくさんお話できたのがとても良かった。
皆さんありがとうございました。来年また会いましょう。
来年は、実際にスキルを体験できるものをたくさん展示できると、楽しいだろうなぁ。
Alexa
AWS
VUX