Decartography
仕組みの話について:
ソーシャルグラフ構築の話も、分散型オラクルの仕組みもおもろい
ただ、その二つをくっつけるのには若干疑問を感じた
というかこれは分散型オラクルではないのか
わかりやすくソーシャルグラフとしているが、どんなものを提供するのがいいのかわからないtkgshn.icon
Q. タグ付けの手段として、人力は最適?
感想として、まあなんかちゃんと仕組み作ればそれなりにうまく行く気はするが、エレガントではないなと思ってしまったblu3mo.icon
「タグ付けの手段が人力」っていうのは、ソーシャルグラフを作ることだけでみた時だと思うtkgshn.icon
あくまでもラベル付け ≒ データの圧縮がしたいなら、もう少し機械的にする方法もありそうな気がした
記述ということ?tkgshn.icon記述方法を自然言語にして、ベクトルで測るみたいなこと?(実際pol.isは同じ言語上でしか動かなかったりしたはず)
あーでも自然言語で書かれたやつに対して、人が投票するんだっけなtkgshn.icon
↑「記述」で指しているものがよくわからないblu3mo.icon
詳しくtkgshn.icon*5
ここで言いたかった違和感は、すぐ下の「思った課題」でより具体的にかけた気がするのでそっち参照blu3mo.icon
「人に自然言語のタグを選ばせる」作業がとても言語に依存しているから、情報が削減されたり恣意性が生まれたりしてよくないよな〜みたいな気持ち
完全に同意、これは参考にさせてもらいます!ありがとうtkgshn.icon*3
思った課題
人力タグ選択の課題の一つとして、人間が言葉(=タグ)として解釈できる粒度まで情報量が落とされてしまう問題がありそう
「Public Goods」のタグをつけてもらう場合、その中の違いは全部削ぎ落とされてしまう
むずいよな、どうするのがいいんやろtkgshn.icon
そもそもクラスタリングというのは情報量を落とす行為だから、ここでは人間の言葉に依存するというのが良くないということだよねu7693.icon そう、言語のラベル付けに依存しない方法ならクラスタリングせずにすむ手段もありそう
あと、選択肢のタグの設定が恣意的な問題もありそう
例えば特定のタグを選択肢から排除することで、DeCartographyでそこのpluralityを判定できないようにするみたいな不正が容易にできる
上の問題と被るけど、一般的にクラスタリングは教師なし学習でやることが多いと思っていて、k-meansとか使えば良さそう?u7693.icon クラスタリング(英: clustering)、クラスタ解析(クラスタかいせき)、クラスター分析(クラスターぶんせき)は、データ解析手法(特に多変量解析手法)の一種。教師なしデータ分類手法、つまり与えられたデータを外的基準なしに自動的に分類する手法。また、そのアルゴリズム。
目的はアドレス間の多様性の評価なので、そもそもクラスタリングをする必要はなさそうblu3mo.icon
それはそうu7693.icon
それでいうと、アドレスはクラスタリングされるという暗黙の前提に基づいてるのは危険かもしれないu7693.icon
他の手段として思いついたもの
例えば、「二つのアドレスはどの程度似ているか」みたいな質問に群衆に答えてもらって、それを高次元空間にプロットして距離判定、みたいな手段もある気がする?
この場合、言葉の粒度まで情報量が落とされてしまう問題が解決できる
あと、用意するタグの恣意性が入り込まないのでより良い
なるほどねぇ、それはあるかも。何回も繰り返せばいわゆる2次元以上の空間にできるイメージ?tkgshn.icon
「二つのアドレスはどの程度似ているか」というのはやはり人間の恣意的な部分が入ってくるから、完全に機械だけで判定するべきかなぁと思ったu7693.icon
恣意的と民主主義(的な概念)に対してどんな感覚なのか気になるtkgshn.icon なんかまぁ別という感じか、オラクルに関してはどっちなんだろう。
ようはこれって、人間の言葉で表せられるベクトル空間にマッピングしているということになりそう?u7693.icon
機械で目的を達成できるならそれで良いと思うが、「投票における"良い"多様性」を判定するには人間世界の情報がないとできないような気がした(直感)blu3mo.icontkgshn.icon
なので人間あるいは自然言語モデルとかを使う手段になる?
人間の自然言語モデルを使うのめっちゃ良いなu7693.icon
ただ自然言語モデルはそれこそモデルの選択が恣意的なので、それよりは群衆を使う方が良い気はする?blu3mo.icon
「二つのアドレスはどの程度似ているか」という質問をするよりも、群衆が作った自然言語モデルを使った方が恣意的な部分は減りそうな気がした(直観)u7693.icon
ここの論点一般化して「恣意性を排除した自然言語モデルの作り方」、分散システムの方法論(詳しくは知らん)が応用出来そうでおもろそう
+100u7693.icon
あと「投票における"良い"多様性」とは?をもっと追求したいu7693.icon
それはそうblu3mo.icon*4x100
本当にそれは良いのか?u7693.icon
Q. そもそもタグ付け情報は何に使う?
「タグが異なる2人の投票の方が、タグが同じ2人の投票より価値ある」とする、ということかな
そういうことですtkgshn.icon*3
じゃあソーシャルグラフとは関係ない話?
①ソーシャルグラフによる社会的距離情報 + ②タグ付け情報 で、アドレスの多様性を判定するみたいな感じかな?
もっと思想的な部分について:
blu3mo.iconの理解:
それを根拠に、「タグが異なったりソーシャルグラフで遠い2人の投票が、近い2人の投票より重要」という主張をしている
まあなんかそう言われればそうかも?という気持ち
ただ
自分は追えていないが、vitalik周辺の人々が色々議論していてstableな土台があるんだろうなと予想
この主張/思想の土台、referenceがあるなら知りたいblu3mo.icon
「多様が良いという思想は前提なので、その前提に関しての疑問はそっちを参照してね」というやつ
例えばvitalik(誰でも良いけど)がこの主張の根拠を長文でかいてたりするなら、それがreferされてると良いなと思ったblu3mo.icon
クリプトのここ二、三に関しては
NFTサマー(2020)
DeFiサマー(2021)がきた後に若干落ち込んでる
今までDAOとか作られてきたけど、思想面が全く非中央集権になってなかった(組織構造とかも含めて) そこで、プロジェクトトークンがエクイティ(をただ、トークンにしたもの)みたいなところがあって、「これは単なる証券化では」みたいなのもあった
そこで、どんどん多様化してきて、やっと「もっと人間的にちゃんとしてるっぽいやつの方が良くね?みたいな
戻ってきた感
2. 「多様な投票の方が良い」という前提が真だとして、「タグが異なったりソーシャルグラフで遠い2人」が、良いとされている「多様性」であるという繋がりの説明や前提が知りたい
何となくそんな気はするが、とても曖昧な主張に感じる
全然ない、やってみないとわからん。だからもっといろんな人からつっこまれたいtkgshn.icon
やってみてどうだったら、それが良いと言えるのかが知りたいblu3mo.icon
(評価方法が定まってないなら実験をする意味がないので)
あ、Decartographyの目的はシビル攻撃の防止だった?blu3mo.icon いや、そこからだとユースケースが強そうかなという感じ。実際にGitcoinのチームも興味持ってもらってるなら、すぐに検証できるところでやれた方がいいかなとtkgshn.icon
シビル攻撃①談合防止の用途と、②多様な投票を良いとしたい用途は多分別の話だと思うので、後者の評価方法もあるなら知りたいblu3mo.icon
例えば、つながりのない2人が同じ投票をしたとして、
①談合防止の目的の場合: 別に良い
②多様な投票良いとする場合: 同じメディア見たNPCだろうから重み付け下げたい
という理解blu3mo.icon
そうだよね〜それは分かるんだけど、まぁなんか疑問とかわからんことあるけどやってみないとわからんくね?というのが一貫した感想かな。むしろどうしたらいいと思ったりしてるのかを知りたいtkgshn.icon
「やってみないとわからん」は同意、ただやってみて結果が出た後に(特に②の論点に関して)それをどう評価するのかが気になったblu3mo.icon
(例えば学会でAIモデルの研究を発表するなら、モデルを評価するところも含めて論文に書く)
crpytoの世界だと、結果をフォーラムとかに公開して評価は他の人に任せる、みたいな方法論だったりする?blu3mo.icon
いや〜まぁそれはそんなことないんじゃないかなwtkgshn.icon
別に評価をしてもしなくてもいいし..
ふむ、あるオラクルのデータソースとしてはまず検証してもらって、それをGitcoinがいい感じに使えるんじゃね?みたいな感じだな今tkgshn.icon
まぁそれでいうと、仮説持っていってフォーラムに投げた方がいいのはそらそうか
流れ
2. ホワイトペーパーというかリリースしてにこんな方法でこんなの作ったよ
3. フォーラムに投稿する
4. データ使ってもらう
ぐらいしかわからんわwtkgshn.icon
そこからはコミュニティが評価する(あるいは残念な場合は放置される)みたいな感じかblu3mo.icon
そうそう。本当にわからないし、どこで声かけてもらえるかとかも運だし、でもなんかこっちおもしろくねみたいな感じかなぁ...tkgshn.icon*3
そこを詳しく知りたい/言語化して欲しい気持ちblu3mo.icon*2
なぜ期待値を高いと思うのか
オラクルは出せば儲かるんじゃね?みたいな雰囲気は感じるwtkgshn.icon そこが根拠だと思うので
ただ、何を評価するために実験するのかのイメージはあった方が、最適な行動が取れる気はするblu3mo.icon
例えば、「ソーシャルグラフとタグ付けに思想の多様性は表れるのか」みたいなResearch Question
このあたり、アカデミア的方法論とcryptoの方法論(主語でかいかも)の違いがあっておもろそうblu3mo.icon
シビル攻撃ではない、談合の防止tkgshn.icon 例えば反例を書くなら、
99%の人はAと考えるが、1%の人はBと考える、みたいな状態があったとして、Bはタグ付けに反映される?
minorityのものを一番反映させたいのだと思うが、それをタグ候補として提示するの、むずくね
(これは反例というより仕組みの欠点の指摘だな、論点が違ったblu3mo.icon)
なので、それらのジャッジがどう動いてるかを透明性持てれば、Gitcoin側にそれは交渉できるようにすればいいんじゃないかな、知らんけど
自分はCryptoの世界の知識ないので、良い反例を指摘するのむずいなblu3mo.icon
というかまあ反例は実験しないと指摘できないので、どちらかというと論点の提示をすべきか
Q. ソーシャルグラフとタグ付けに思想の多様性は表れるのか
究極は51%攻撃的なものに悩まされるtkgshn.icon が、これはいろんなエコシステムがどんどんウォレットに対してPOAPやSBTなどをdropするので、それらを共有しながら幅広い人たちのタグ付けを取り入れることが可能 (Twitterでいう)いわゆる「ある程度のフォロワーとかツイート内容がないとBotとみなされる」
https://www.youtube.com/watch?v=MsMsL5v2-Ls&ab_channel=GitcoinMedia
Q. ソーシャルグラフ/タグ付けに恣意性は入りこまないのか
など
ここの論理的つながり/反例への強度がしっかりしていた方がDeCartographyの仕組みに納得出来そう
そもそも論として、DeCartographyは資金の分配をするときのQFの変数を求めたいという話だった記憶があって、とあるプロジェクト関係者からだけの投票だと意味が無いu7693.icon
つまり「投票における"良い"多様性」は投票によって異なるんだろうなu7693.icon
DeCartographyの場合は、投票者が関係してるプロジェクトが多様であることが良いu7693.icon
@kanair_jp: この話、人が恣意的に選んだものよりも、アルゴリズムに選ばれたものの方がフェアだという認識がすでにできつつあることが面白い。信頼されるAI技術をどう作るかというのはよく話題になるが、実はAIの方が信頼される世の中になるのではないか。