Numerai 式 multiunit Dutch auction
https://gyazo.com/cda8ab120ac0a9157281b3d236388a0b
m0t0k1ch1.icon < ホワイトペーパー を引用しながら Numerai の multiunit Dutch auction の概要をまとめます。ざっくりとした意訳が多いと思うので、「ん?」と思った方は原文をご参照ください。なお、Numerai 自体についてはあまり言及しません。 ---.icon
要点
m0t0k1ch1.icon < multiunit Dutch auction 的な手法を用いることで、データサイエンティストが自身の学習モデルの価値を正直に申告することを促している(もちろん、コンペの参加者が報酬獲得に対して合理的に動くという前提はある)。こうすることで、高精度な学習モデル評価をベースにした競争原理が機能し、その中で優秀な学習モデルが生まれる。ということだと思われる。シンプルに言うと、「競争原理の利用」と「競争を成立させるための multiunit Dutch auction」。
---.icon
前提:Numeraire トークン(NMR)とコンペの概要
Numeraire is an ERC20 Ethereum token.
Numeraire は ERC20 トークン。
m0t0k1ch1.icon < Numeraire はトークン名、Numerai はプロジェクト名
m0t0k1ch1.icon < ややこしいので、以降トークンを表す際は NMR と記載
The Ethereum smart contract dictates there will never be more than 21 million Numeraire minted.
発行上限は 21,000,000 NMR。
m0t0k1ch1.icon < Bitcoin ぽい
After the initial distribution, the smart contract will mint a fixed number of Numeraire each week until the maximum is reached.
発行上限に達するまで、毎週一定量の NMR がスマートコントラクトによって発行される。
When data scientists are confident of the predictions they have made, they send Numeraire to the Numeraire Ethereum smart contract.
データサイエンティストはコンぺに参加するときに NMR をスマートコントラクトに預ける必要がある。
After$ thas passed, Numerai will send a message to the contract with information on which data scientists’ predictions performed well on new data. Those data scientists whose predictions performed well earn dollars based on the auction mechanism, and their Numeraire are returned. Those data scientists whose predictions did not perform well on new data risk having their Numeraire destroyed.
コンペ終了後、Numerai が結果をスマートコントラクトに通知する。成績が良かったデータサイエンティストは、オークションメカニズム(後述)に従って報酬(USD)を獲得でき、預けた NMR も返ってくる。成績が悪かったデータサイエンティストは、預けた NMR を失うリスクを負う。
m0t0k1ch1.icon < 学習モデルは未知のデータ(new data)で検証される(汎化性能が重要ということ)
m0t0k1ch1.icon < 結果通知に関しては centralized な感じぽい
syrohei.icon < 分散型オラクルの実装が求められるw (きびしい)
---.icon
Numerai 式 multiunit Dutch auction の概要
Every tournament has a staking prize pool, which is some fixed number of dollars. The auction mechanism allocates the prize pool among data scientists.
全てのコンペには報酬プール(一定量の USD)が存在する。オークションメカニズムによって報酬がデータサイエンティスト達に割り当てられる。
Data scientists can submit bids to the auction. Bids are tuples$ (c, s)where$ cis confidence defined as the number of Numeraire the data scientist is willing to stake to win 1 dollar, and$ sis the amount of Numeraire being staked. For some time$ t,$ sis locked in the Ethereum contract, inaccessible to anyone, including Numerai. After$ thas passed, a variant on the multiunit Dutch auction is used to determine the payouts.
データサイエンティストはオークションに入札することができる。入札は$ (c, s)で表される。$ c(confidence)は 1 USD 得るために賭けてもいい NMR の量。$ s(stake)は掛ける NMR の量で、$ t経過するまでスマートコントラクトにロックされる(Numerai 含め、誰もアクセスできない)。$ t経過後、支払いを決定するために以下で説明するオークションメカニズムが利用される。
The auction mechanism is a multiunit Dutch auction with some additional rules.
オークションメカニズムは、いくつかのルールを追加した multiunit Dutch auction。
The performance evaluation metric is logloss, a suitable metric for binary classification problems like Numerai’s machine learning competition.
パフォーマンスの評価基準は logloss。Numerai の機械学習コンペのような二項分類問題に適した指標である。
m0t0k1ch1.icon < logloss は知らないが、一旦目を瞑って話を進める
A model is considered to have performed well if$ logloss \lt - \ln{(0.5)}, and badly if $ logloss \geq - \ln{(0.5)}. The data scientists are ranked in descending order of confidence$ c. In descending order of confidence until the prize pool is depleted, data scientists are awarded$ s/cdollars if their models performed well or they lose stake$ sif they perform badly. Once the prize pool is depleted, data scientists no longer earn dollars or lose their stakes.
$ logloss \lt - \ln{(0.5)}だった場合は良いモデルだと評価し、$ logloss \geq - \ln{(0.5)}だった場合は悪いモデルだと評価する。データサイエンティストは$ cの降順に並べられる。報酬プールが枯渇するまで$ cの降順で$ s/cUSD が付与されていく。が、付与されるのは良いモデルだと評価された場合の話。悪いモデルだと評価された場合、賭けた$ sを失う。報酬プールが枯渇したら、それ以降のデータサイエンティストは報酬なし、賭け金を失うこともない。
以下、具体例で考えてみる。
Assume a prize pool of 3000 dollars, and that time$ thas elapsed. Assume the staking auction ended as follows:
3,000 USD の報酬プールを仮定、$ t経過後、オークションが以下の状態で終了したとする。
https://gyazo.com/1f0b9769fa878153593eb462ad83006c
WSW didn’t achieve$ logloss \lt - \ln{(0.5)}, so his 10,000 Numeraire are destroyed. XIRAX receives $500 and his Numeraire are returned. PHIL_CULLITON receives $2000 and his Numeraire are returned. DAENRIS’ Numeraire are destroyed. ABRIOSI receives $500, $100 less than his bid because the prize pool is exhausted. Everyone below ABRIOSI will have the Numeraire returned and receive zero dollars.
結果は以下のように解釈できる。
table:auction result
データサイエンティスト名 報酬 失う賭け金
WSW - 10,000 NMR
XIRAX 500 USD -
PHIL_CULLITON 2,000 USD -
DAENRIS - 5,000 NMR
ABRIOSI 500 USD -
ABRIOSI より下位 - -
ABRIOSI が 500 USD 獲得した時点で報酬プールが枯渇するため、ABRIOSI は 600 USD($ s/c)獲得することはできない。
---.icon
Numerai 式 multiunit Dutch auction 参加者の振る舞い
Let$ pbe the probability that the model achieves$ logloss \lt \ln{(0.5)}on new, unseen data. A low$ pwould imply a high probability that a model is overfit.
学習モデルが新しい未知のデータに対して $ logloss \lt \ln{(0.5)}を達成できる確率を$ pとする。$ pが低いということは、過学習なモデルになっている可能性が高いことを意味している。
Let$ ebe the exchange rate of Numeraire per dollar.
NMR と USD の変換レート(NMR / USD)を$ eとする。
Therefore, the expected value in dollars of staking$ swith confidence$ cis
$ E(c, s) = p\frac{s}{c} - (1 - p)\frac{s}{e}
A data scientist will stake if
$ E(c, s) \gt 0
$ p\frac{s}{c} - (1 - p)\frac{s}{e} \gt 0
This implies
$ p \geq \frac{c}{c + e}
よって、報酬の期待値(単位は USD)は以下の式で表される。
$ E(c, s) = p\frac{s}{c} - (1 - p)\frac{s}{e}
よって、$ E(c, s) \gt 0すなわち$ p \geq \frac{c}{c + e}であれば、データサイエンティストは賭けに参加するだろう。
This results in self-revelation: Data scientists are moved to reveal their true inner values. Solely in the interest of maximizing winnings, data scientists reveal their knowledge of their models’ abilities to generalize to new, unseen data. As we let these tournaments repeat, we expect to see bidding behaviors that accurately reflect$ p, since overbidding and underbidding are both nonoptimal behaviors and the accuracy of estimating$ pincreases with time.
これは、self-revelation をもたらす。すなわち、データサイエンティストは自身の本当の価値を公開するよう動機付けられる。報酬を最大化することだけを考え、学習モデルの汎化性能がどれだけあるかに対する情報を公開する。このようなコンペを繰り返すことで、入札には$ pが正しく反映されるようになるだろう。なぜなら、overbidding も underbidding も最適な行動ではないし、$ pを予測する精度は時間とともに向上するから。
m0t0k1ch1.icon < overbidding だと賭け金を失うリスクが伴い、underbidding だと報酬が得られないので、データサイエンティストは自身の学習モデルの$ pを正直に加味して入札を行うよね、ということだと思う
The purpose of this auction is to get accurate probability estimates, not to maximize Numeraire staked. The auction need not be revenue maximizing, but self-revelation is important.
オークションの目的は、$ pの正確な予測を得ることであり、賭け金である NMR を最大化することではない。オークションは収入を最大化する必要はないが、self-revelation は重要である。
---.icon
参考
---.icon
質問・議論
q.iconm0t0k1ch1.icon < トークン発行について
トークンはいつ発行される?
コンペの報酬付与の際?発行のトリガーを引く存在はいる?
q.iconm0t0k1ch1.icon < 没収?された NMR について
何処へ?
次のコンペの賞金などに回される?それとも単に運営の収入?
q.iconsyrohei.icon < 初歩的な質問で恐縮ですが
NMRの発行上限を21,000,000にしている理由が知りたい
NMRは無限に発行することがあると、無限にインフレするから、ステークホルダーのインセンティブを与えるため?
デフレ化を促すため?
データサイエンティストは、NMRをデポジットし、コンペに参加するほどのインセンティブがあるのでしょうか?
NMRがもし、ロックされてしまう場合、得られる報酬に対し、NMRの価格変動リスクを許容できるか?
没収されたNMRを分配するなら、インセンティブがありそう。。
自分がやるなら、USDでデポジットして、USDで報酬を得たい。。
m0t0k1ch1.icon 初歩的な質問のようで非常に本質的だと思いますw 自分もちょっと気になって調べた程度でまだ詳細までは理解できてませんが、何か分かったら追記していきます〜
syrohei.icon ありがとうございますー