データ管理プラットフォーム(draft)
データをプラットフォームや企業の独占から解放し、人々に帰属させる。
私たちはデータに対して選択可能になる
どこにデータを公開するか、提供するか
どのデータを見せるか
どこまで公開するか
いつまで公開するか
企業の利益や都合によって制御されていたデータから私たちに返還され、私たちの利益や都合(プライバシー)が第一となる。
「Self-Sovereign Data」と呼んでもいいかもしれない。
重要なのがデータに対する信用
企業側でユーザーのデータを制御することによりデータへの信用を得ている
ユーザー側がデータに対して編集(削除や追加などの改ざん)が行えない
企業側がデータを改ざんする可能性があるのは「公開」するタイミング。
データの信用 = データが正当である= 「真」である
ユーザーがデータを制御する際にデータを「検証可能」にする。
編集されたかどうか
どこからデータは保存されたか
検証可能にすることにより「真」であることが証明できる。
ハッシュ関数は重要な解決方法?
※100%は難しいと思うが、少なからずユーザー上で編集は行われていないか検証可能
これによってPersonal Data -> Commons dataへ簡単に移行可能
逆は難しい
データ制御プラットフォームの概要
プライベート空間の定義:
ユーザーのみが制御できる、選択が行える
暗号化、復号化 = 公開、非公開
何を、どこまで
Access control = データ共有、通信
どこに、誰に
重要なのが「編集」されたか、どうかが検証可能であること。
https://scrapbox.io/files/63e2eb0a9f8ef6001bafba49.png
ユーザーはデータをPipele上にアップロードすると、暗号化して保存する。 「暗号化されたデータ」を復号化する条件は「SBT」を保持
アップロードしたファイルを復号化するには、一旦自分に共有選択を行わないと復号化できていないのでは?
「SBT」を条件にしていたが、最適な条件が他にありそう
Lit Protocolのノードはまだ運営しか保持していないことを忘れてはいけない。
共有したい相手の選択するとSBTが発行され、共有相手は暗号化されたデータへのアクセス(復号化)が可能 SBTであることで削除をどのように行うか、期間の設定をどのように行うのか
データの制御と言っても足りない部分はまだ多い
「IPFSはコンテンツ(= データ)を編集するとCIDが変化する。」 = 編集や改ざんがされたかどうかを検証可能にする事ができる。 = ハッシュ関数の偉大さ
Webやプラットフォームとの接続
PipeleはユーザーからのみPipeleにデータが保存されている = つまり検証可能なデータ(生データ)になっていない。 ユーザーによって編集されたかもしれない
どこから得たデータなのか知る余地もない
現状のデータの移動: 人=> Pipele => 人
そこでPipeleをWeb、プラットフォームへ繋げる必要がある。
「企業側やプラットフォームが独占しているデータをユーザーに帰属させる」を実現させるために。
プラットフォーム => Pipele =>人
Web => Pipele =>人
その先は、
人=> web、プラットフォーム、人
となる必要がある。
妄想で書いてみる。
データの保存先をプラットフォームやサービス側で選択すると思う
これを実現するためには「保存先」をPipele(現状はIPFS)にする必要があるが、毎回データの保存先が変化するのってかなり難しい気がするんだけど。
理想形は保存先(例えばIPFS)は指定されており、その保存先の中のプライベート空間(変数)ができればいいのか。
ってかこれCeramicが出来ているかもしれない?
プライベート空間の検索-> プライベート空間内の識別
「現在のWebはページの検索は可能だがデータの検索は可能ではない」
プライベート空間の中には無数のデータの集合体が存在している
プライベート空間 = 暗号化されている
暗号化されたデータをどのように検索を行うのかが重要
1つの暗号鍵で暗号化する場合、ツリー構造にすることで解決できる可能性がある。
Enc tree構造
Index tree構造
Enc treeとIndex treeは同じ構造になっており、Index treeの(1)を選択するとEnc treeの(1)を選択可能?
多分データの名前は暗号化してはだめ?
検索には識別情報は必要ではある。
Data Controllerのみが検索することは可能なの?(DID Controllerの方がいい?)
プライベート空間へのAccsess Control
Pipeleの現状は共有相手にSBTを送信し、そのSBTが条件で復号化が可能
= データ共有、通信
EOAを持っていないと使用不可
EOAを持っていなくても使用可能ではないといけない
空間としての共有、個体としての共有
空間= 1つの鍵によって暗号化されたデータの集合体
現状は1つの鍵で1つのデータになっている
Enc tree構造とIndex tree構造によって空間の作成と共有が可能になるかもしれない
単体を拡張して空間を作成するイメージ
CIDが変化するからmappingをどのように行うのかを解決する必要がある
選択的開示が行えるようにするには、「プライベート空間の検索」が重要
個体と集合体
複数の個体(= 空間)が集合体となり、この集合体が「個人のプラットフォーム」となる。
つまりユーザーは複数の個体を作成が行えて、個体同士を接続可能にする必要がある。
1つの条件のみで制御が行える場合これは達成される
例: あるDIDを保持している人が復号化可能
ただユーザーによってはA DIDの個体から B DIDの個体へデータを移動させたいかもしれない = ecosystem間のデータ移動
A DID個体とB DID個体は全く異なる空間同士 (異なるユーザーとして捉えられる)
繋げられるように条件設計をする必要がある
現状のSBTで考えるとEOAでAとBのDIDを制御している場合、条件はSBTの所持だから理論的には可能(同一人物であることが証明されている)
EOAは所持しておらずDIDのみ所持している場合にどうするか
https://scrapbox.io/files/63e44b4af403f5001b51fdd8.png
上記の画像で考えると、A DIDでB DID個体のデータを呼び出すことを可能にする必要がある。
データを復号化せず他の人が制御可能にする
まだ足りない
プライバシー
により、Webの世界でより人間として扱われる。
企業側は独占対象が無くなる。
利益が下がるわけではない
= より多くのデータを活用することが可能 ※自分たちのデータも活用可能
"How Cooperation Beats Aggregation"って書いてあって、ある意味利益を最大化するために独占や中央集権的に進めても、それは最大ができておらず持続可能では無い
これは意思決定ができることを指しており、自由であることを指している。
= データ制御はWeb上で人間であることが認められるようになる。
今まではプラットフォームや企業によって管理されていたデータがユーザーに返還するという事は、全プラットフォームや企業がデータに対してアクセス出来る機会を得ることになる。 = 人間を介したデータの相互運用性
関連: