画像キャプチャサービス「Gyazo」と関連画像検索システム
画像キャプチャサービス「Gyazo」と関連画像検索システム
増井俊之
慶應義塾大学
2017/3/13
https://gyazo.com/80587820d34f9fb8fe963470e1dfbe0c
自己紹介
シャープ、ソニー、産総研などに勤務
ケータイの予測変換(POBox)などを開発
2008秋まで米国Appleに勤務
フリック入力システムなどを開発
2009より慶應義塾大学
ユーザインタフェースの研究開発
IoT, 検索システム, 情報視覚化
各種Webサービス運用中
Gyazo, Scrapbox, 本棚.org, ...
POBox
https://gyazo.com/ac2b347a7042f920edd576ee07c4b7f4
POBox on Palm
https://gyazo.com/024607009f06219624ea05727c585a74
「フリック」入力
http://gyazo.com/1691febad27439d3bf44232c54dcb1e8.png
光文社新書
http://gyazo.com/64c56d9c3e67745e95bc038487d09c98.png
煽り
http://gyazo.com/bf3bc7510fdb74c8db4bb058fd3ed6d6.png
増井の研究開発方針
自分の欲しいものを作る
自分で使う
コロンブスの卵が好き
今すぐ使えて売れるものを作る
コロンブス日和
http://masui.org/807873e8e41db04289c5a6e5bdae6262.jpg
ドッグフーディング
Eat your own dogfood
自分で作ったものを使い倒して改善する
Gyazoとは
超簡単な画像アップロードサービス
https://gyazo.com/80587820d34f9fb8fe963470e1dfbe0c
Gyazoキー
https://gyazo.com/b9334bb40d7690e8372f51624fd042a5
デモ: Gyazo
Gyazo (2010/7)
http://gyazo.com/765bc52757dc9b5ce5a613aee9a1c771.png
Gyazo (2012/1)
http://gyazo.com/4c35c873fcce18c60c335d337c5e2a9c.png
Gyazo (2014/1)
http://gyazo.com/0780f93a7992fdeca48cdda7a5ca6dcf.png
Gyazo (2015/1)
http://gyazo.com/bde4e61c85ebeeb357e1705b2a0a9fb3.png
Gyazo (2015/9)
https://gyazo.com/faec970a92d2ea5968b6f2283b1cac46.png
http://gyazo.com/426f5616b89d741d5edca122e4f68b26.png
http://gyazo.com/73548f7c10a1148e4ac475945c66f947.png
http://gyazo.com/cecd0d5b1e47514518cd97f627b88d2e.png
http://gyazo.com/59823b38bca6e8f59b38d01a391ed34c.png
Alexaデータ (2017/3)
https://gyazo.com/5237717b8431603f87af40b0ab26a8c4
https://gyazo.com/375b988a59ae643eb89be007883aeb9a
https://gyazo.com/f4630a9e02639d1a97840ad9f55d7730
セールスピッチ
https://gyazo.com/179515f4e7342a95774d777658b1e1a3
Gyazo導入企業
https://gyazo.com/77c45e9b33a43ab065b9deb3546be8b4
Gyazoの成長
https://gyazo.com/336584862fc5925aae3a1b8bbbf0934a
関連サービス
https://gyazo.com/3f739002ca38ef227d67932f85f7bf9d
Gyazoの歴史
2007/9 増井が個人で運用開始
2010? Nota inc. でサポート開始
2014/4 Gyazo GIFリリース
2014/11 資金ゲット
2015/7 IvySearchリリース
2016/7 OCR リリース
機能は画像をアップするだけ
関連URLなどを保存
関連画像の表示
ビジネスモデル
フリーミアム
広告
Gyazoのデータ量
月間アップロード2400万枚
月間ユニークユーザ1000万
Gyazoの運用環境
海外サーバ
画像検索の考察
検索の分類
知ってるものの検索
見たことがあるものにアクセス
e.g. 古い写真の検索, ファイル検索
知らないものの検索
見たことがないものを捜す
e.g. Google検索, 写真素材検索
知ってるものの検索
一度見たことがある
関連情報を覚えている
みつからないと腹がたつ
例
古い写真
古い書類
知らないものの検索
存在するかどうかも不明
みつからなくても平気
例
知らない情報
写真素材
画像の検索方法
イメージ中身で検索
メタデータで検索
両者の比較
自分の写真の検索の方が機会は多い
画像をアップロードしたことは覚えている
全く知らない画像を検索することは少ない
関連情報からの検索が有用な場合は多い
「豪邸」とか「喧嘩」とかを検索できるか?
「赤坂で会った人」を検索できるか?
漠然としたことは覚えている
日時
場所
地名、緯度経度
人物
環境
温度、音楽、...
関連キーワード
関連情報検索
「芋蔓式」検索が大事
IvySearch
https://gyazo.com/72e43e1b762e5b846553ab62a475532a.png
IvySearch
https://gyazo.com/b35695a82214d3869218bf298c060d98.png
デモ: IvySearch
実装
ElasticSearchを利用
kuromojiで形態素解析
code:json
{
"cluster_name" : "ivy",
"status" : "green",
"timed_out" : false,
"number_of_nodes" : 5,
"number_of_data_nodes" : 4,
"active_primary_shards" : 16,
"active_shards" : 32,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 0,
"delayed_unassigned_shards" : 0,
"number_of_pending_tasks" : 0,
"number_of_in_flight_fetch" : 0
}
Spec
8 vCPUs, 52 GB memory, 1TB SSD
運用
Gyazoったときはキーワードも入れる
写真をDrag&Dropしてコメントを書く
芋蔓検索の強み
自分のコンテンツなのにナビゲーションが面白い
意外と検索に成功する
関係ないものが出てきて面白い
セレンディピティ支援
芋蔓検索を有効にするコツ
どんなものでも画像でセーブ
コメントかキーワードを自分で書いておく
全部にキーワードをつけない
つけすぎると大変なことに
自動があってももちろんかまわない
タイムスタンプやOCRは有効
キーワード付加は面倒?
それほどでもない
と増井は思う
便利さの方がはるかに上回る
Scrapboxと芋蔓検索
近傍検索システム
近傍の情報をたどって目的の情報に接近
時間的近傍
内容的近傍
位置的近傍
http://masui.org/3280e44d32b77d6c1b61cb6f25adab61.jpg
Scrapboxとは
フレキシブルな共有ノート
芋蔓的情報検索
https://gyazo.com/7057219f5b20ca8afd122945b72453d3
Scrapboxの特徴
WYSIWYGなWiki
複数ユーザ同時編集
Gyazo画像の活用
ページ代表画像の利用
ページとタグの区別が無い
階層構造なし
双方向リンク
情報整理と検索
整理には分類が必要?
検索できれば整理したのと同じ
分類/階層化の必要はない
e.g. IvySearch
情報管理の難しさ
大量の情報を分類するのはほぼ不可能
階層的整理は困難
整合性の問題
分類不能なもの
複数カテゴリに分類したいもの
階層的情報管理
ファイルシステムや情報整理で常識的
分類や階層化で悩む
Evernote
各種の「ノート」を「ノートブック」で管理
ノートはメモでも画像でも何でも
複数のノートブックを「スタック」で管理
ノートに「タグ」を付加可能
管理や分類のルールが面倒
Mindmap
https://gyazo.com/749f3d889b9ceba357f6d2288267180f
スプートニクとソユーズとボイジャーが全然別物になってる
Scrapbox
ページとリンクだけを利用
階層思考や分類思考を排除
とにかく書いてキーワードに印をつける
タグはページで代用する
Scrapboxの特長
シンプルなのに強力
あらゆる情報の芋蔓検索
文献情報検索システム
定型的な情報しか入力できない
AとBは夫婦、とか入力できるか?
例: CGVIのサイトを生成
その他の芋蔓検索
http://dshelf.nikezono.net/ https://gyazo.com/d8479a44d2934b48731e022eb71e6dc1
https://gyazo.com/d83ba4d9765298c3b27ca54f9da003e1 http://www.pitecan.com/tmp/Pivotty/
結論
芋蔓検索の活用
一般的な検索手法との融合が課題