画像キャプチャサービス「Gyazo」と関連画像検索システム
画像キャプチャサービス「Gyazo」と関連画像検索システム
増井俊之
慶應義塾大学
2017/3/13
情報処理学会 CGVI研究会 第166回研究発表会
http://masui.org/cgvi
https://gyazo.com/80587820d34f9fb8fe963470e1dfbe0c
自己紹介
シャープ、ソニー、産総研などに勤務
ケータイの予測変換(POBox)などを開発
2008秋まで米国Appleに勤務
フリック入力システムなどを開発
2009より慶應義塾大学
ユーザインタフェースの研究開発
IoT, 検索システム, 情報視覚化
各種Webサービス運用中
Gyazo, Scrapbox, 本棚.org, ...
POBox
https://gyazo.com/ac2b347a7042f920edd576ee07c4b7f4
POBox on Palm
https://gyazo.com/024607009f06219624ea05727c585a74
「フリック」入力
http://gyazo.com/1691febad27439d3bf44232c54dcb1e8.png
スマホに満足してますか? - ユーザインタフェースの心理学
光文社新書
http://gyazo.com/64c56d9c3e67745e95bc038487d09c98.png
煽り
http://gyazo.com/bf3bc7510fdb74c8db4bb058fd3ed6d6.png
増井の研究開発方針
自分の欲しいものを作る
自分で使う
コロンブスの卵が好き
今すぐ使えて売れるものを作る
コロンブス日和
http://masui.org/807873e8e41db04289c5a6e5bdae6262.jpg
技術評論社のSoftware Designの連載記事
1. GyaTV (2015/11)
2. Gyump (2015/12)
3. Gyamm (2016/1)
4. Gyazo (2016/2)
5. Gyaki (2016/3)
6. Dynamic Macro (2016/4)
7. Gyaim (2016/5)
8. EpisoPass (2016/6)
9. ExpandHelp (2016/7)
10. DragZoom (2016/8)
11. Gear (2016/9)
12. SmoothSnap (2016/10)
13. 廃れるページ (2016/11)
14. HashInfo (2016/12)
15. フラット整理術 (2017/1)
16. Scrapbox(1) (2017/2)
17. Scrapbox(2) (2017/3)
18. 発見プログラミング (2017/4) = 最終回
ドッグフーディング
Eat your own dogfood
自分で作ったものを使い倒して改善する
Gyazoとは
超簡単な画像アップロードサービス
https://gyazo.com/80587820d34f9fb8fe963470e1dfbe0c
Gyazoキー
https://gyazo.com/b9334bb40d7690e8372f51624fd042a5
デモ: Gyazo
Gyazo (2010/7)
http://gyazo.com/765bc52757dc9b5ce5a613aee9a1c771.png
Gyazo (2012/1)
http://gyazo.com/4c35c873fcce18c60c335d337c5e2a9c.png
Gyazo (2014/1)
http://gyazo.com/0780f93a7992fdeca48cdda7a5ca6dcf.png
Gyazo (2015/1)
http://gyazo.com/bde4e61c85ebeeb357e1705b2a0a9fb3.png
Gyazo (2015/9)
https://gyazo.com/faec970a92d2ea5968b6f2283b1cac46.png
Alexaデータ (2013/11/14)
http://gyazo.com/426f5616b89d741d5edca122e4f68b26.png
Alexaデータ (2014/1/15)
http://gyazo.com/73548f7c10a1148e4ac475945c66f947.png
Alexaデータ (2014/10/27)
http://gyazo.com/cecd0d5b1e47514518cd97f627b88d2e.png
Alexaデータ (2015/3/3)
http://gyazo.com/59823b38bca6e8f59b38d01a391ed34c.png
Alexaデータ (2017/3)
https://gyazo.com/5237717b8431603f87af40b0ab26a8c4
資金ゲット!
https://gyazo.com/375b988a59ae643eb89be007883aeb9a
Gyazo紹介
https://gyazo.com/f4630a9e02639d1a97840ad9f55d7730
セールスピッチ
https://gyazo.com/179515f4e7342a95774d777658b1e1a3
Gyazo導入企業
https://gyazo.com/77c45e9b33a43ab065b9deb3546be8b4
Gyazoの成長
https://gyazo.com/336584862fc5925aae3a1b8bbbf0934a
関連サービス
https://gyazo.com/3f739002ca38ef227d67932f85f7bf9d
Gyazoの歴史
2007/9 増井が個人で運用開始
2010? Nota inc. でサポート開始
2014/4 Gyazo GIFリリース
2014/11 資金ゲット
2015/7 IvySearchリリース
2016/7 OCR リリース
機能は画像をアップするだけ
関連URLなどを保存
関連画像の表示
ビジネスモデル
フリーミアム
広告
Gyazoのデータ量
月間アップロード2400万枚
月間ユニークユーザ1000万
Gyazoの運用環境
海外サーバ
Elastic Searchによる全文検索
MongoDBでメタデータ管理
画像検索の考察
検索の分類
知ってるものの検索
見たことがあるものにアクセス
e.g. 古い写真の検索, ファイル検索
知らないものの検索
見たことがないものを捜す
e.g. Google検索, 写真素材検索
知ってるものの検索
一度見たことがある
関連情報を覚えている
みつからないと腹がたつ
例
古い写真
古い書類
知らないものの検索
存在するかどうかも不明
みつからなくても平気
例
知らない情報
写真素材
画像の検索方法
イメージ中身で検索
メタデータで検索
両者の比較
自分の写真の検索の方が機会は多い
画像をアップロードしたことは覚えている
全く知らない画像を検索することは少ない
関連情報からの検索が有用な場合は多い
「豪邸」とか「喧嘩」とかを検索できるか?
「赤坂で会った人」を検索できるか?
漠然としたことは覚えている
日時
場所
地名、緯度経度
人物
環境
温度、音楽、...
関連キーワード
関連情報検索
「芋蔓式」検索が大事
IvySearch
https://gyazo.com/72e43e1b762e5b846553ab62a475532a.png
IvySearch
https://gyazo.com/b35695a82214d3869218bf298c060d98.png
デモ: IvySearch
例: 「請求書」
例: 「自転車」
例: 「名山」
例: 「イギリス」
例: 「テンセグリティ」
実装
ElasticSearchを利用
kuromojiで形態素解析
code:json
{
"cluster_name" : "ivy",
"status" : "green",
"timed_out" : false,
"number_of_nodes" : 5,
"number_of_data_nodes" : 4,
"active_primary_shards" : 16,
"active_shards" : 32,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 0,
"delayed_unassigned_shards" : 0,
"number_of_pending_tasks" : 0,
"number_of_in_flight_fetch" : 0
}
Spec
8 vCPUs, 52 GB memory, 1TB SSD
運用
Gyazoったときはキーワードも入れる
写真をDrag&Dropしてコメントを書く
芋蔓検索の強み
自分のコンテンツなのにナビゲーションが面白い
意外と検索に成功する
関係ないものが出てきて面白い
セレンディピティ支援
芋蔓検索を有効にするコツ
どんなものでも画像でセーブ
コメントかキーワードを自分で書いておく
全部にキーワードをつけない
つけすぎると大変なことに
自動があってももちろんかまわない
タイムスタンプやOCRは有効
キーワード付加は面倒?
それほどでもない
と増井は思う
便利さの方がはるかに上回る
Scrapboxと芋蔓検索
近傍検索システム
近傍の情報をたどって目的の情報に接近
時間的近傍
内容的近傍
位置的近傍
http://masui.org/3280e44d32b77d6c1b61cb6f25adab61.jpg
Scrapboxとは
フレキシブルな共有ノート
芋蔓的情報検索
https://gyazo.com/7057219f5b20ca8afd122945b72453d3
デモ: Scrapbox
Scrapboxの特徴
WYSIWYGなWiki
複数ユーザ同時編集
Gyazo画像の活用
ページ代表画像の利用
ページとタグの区別が無い
階層構造なし
双方向リンク
アウトライン編集
コード記法, コードブロック記法
柔軟で簡単なScrapbox記法
強力な文字装飾記法
情報整理と検索
整理には分類が必要?
検索できれば整理したのと同じ
分類/階層化の必要はない
e.g. IvySearch
情報管理の難しさ
大量の情報を分類するのはほぼ不可能
階層的整理は困難
整合性の問題
分類不能なもの
複数カテゴリに分類したいもの
階層的情報管理
ファイルシステムや情報整理で常識的
分類や階層化で悩む
Evernote
各種の「ノート」を「ノートブック」で管理
ノートはメモでも画像でも何でも
複数のノートブックを「スタック」で管理
ノートに「タグ」を付加可能
管理や分類のルールが面倒
Mindmap
https://gyazo.com/749f3d889b9ceba357f6d2288267180f
スプートニクとソユーズとボイジャーが全然別物になってる
Scrapbox
ページとリンクだけを利用
階層思考や分類思考を排除
とにかく書いてキーワードに印をつける
タグはページで代用する
Scrapboxの特長
シンプルなのに強力
あらゆる情報の芋蔓検索
例: /masuilab
例: /prog-examples
例: /masuifamily
例: /UIPedia
文献情報検索システム
定型的な情報しか入力できない
AとBは夫婦、とか入力できるか?
例: CGVIのサイトを生成
http://Scrapbox.io
その他の芋蔓検索
dshelf: 書籍の芋蔓検索
http://dshelf.nikezono.net/ https://gyazo.com/d8479a44d2934b48731e022eb71e6dc1
デモ: dshelf
Pivotty: 映画の芋蔓検索
https://gyazo.com/d83ba4d9765298c3b27ca54f9da003e1 http://www.pitecan.com/tmp/Pivotty/
デモ: Pivotty
結論
芋蔓検索の活用
一般的な検索手法との融合が課題
#講演資料