スケールフリーネットワーク
Barabási, A. L., & Albert, R. (1999). Emergence of scaling in random networks. science, 286(5439), 509-512.
リンク数に比例
https://gyazo.com/e047762fa791bca50541bced02850c26
ランダム
https://gyazo.com/e16f82217399fbefba6c57938a078bc0
世の中にある「スケールフリーネットワーク」って実際は一部を除いてそんなにスケールフリーネットワークじゃなかったよ、という論文
Scale-free networks are rare. Nat. Commun. 10: 1017 (2019)
Scale-free networks are rare
https://gyazo.com/3e7ac6a8967390ededcebe8032344ad5
実世界のネットワークはしばしばスケールフリーであると主張されますが、これは次数kのノードの割合が力法則k-αに従うことを意味し、複雑なシステムの構造やダイナミクスに広く意味を持つパターンです。しかし、スケールフリーネットワークの普遍性についてはまだ議論の余地がある。ここでは、スケールフリーネットワークのさまざまな定義を整理し、1000近くの社会・生物・技術・交通・情報ネットワークに適用された最新の統計ツールを用いて、スケールフリーネットワークの経験的な有病率の厳しいテストを構築する。これらのネットワークにおいて、強くスケールフリーな構造は経験的には稀であることを示す強固な証拠が得られた。さらに、社会的ネットワークはせいぜい弱いスケールフリーであるが、技術的ネットワークや生物学的ネットワークは一握りであるが、強くスケールフリーであるように見える。これらの知見は、現実世界のネットワークの構造的多様性と、これらの非スケールフリーパターンの新しい理論的説明の必要性を強調しています。
ネットワークは、複雑なシステムの構造を表現し、研究するための強力な方法です。今日では、個人間の社会的相互作用、生体内のタンパク質や遺伝子の相互作用、デジタル・コンピュータ間の通信、様々な交通システムなどがその例として挙げられます。科学的な領域やネットワークのクラスを超えて、現実世界のネットワークのほとんど、あるいはすべてがスケールフリーであるという主張に遭遇することがよくあります。この主張の正確な詳細は様々ですが1,2,3,4,5,6,7、一般的には、次数kのノードの割合がα>1の力法則分布k-αに従う場合、ネットワークはスケールフリーであるとみなされます。この「スケールフリー仮説」のいくつかのバージョンでは、例えば、2 < α < 3を要求したり、ノードの度数が優先的なアタッチメントメカニズムによって進化することを要求したりと、より強い要件を持っています8,9。他のバージョンでは,例えば,力の法則が上尾でのみ保持される必要がある10,指数的なカットオフを示すことができる11,あるいは,指数や正規分布のような薄い尾を持つ分布よりも,単にもっともらしいというだけである12など,より弱くなっています。
スケールフリーなネットワークの研究と利用は、ネットワーク科学の分野で広く行われています1,9,13,14,15。多くの研究では、スケールフリー構造の存在がネットワーク上を走るダイナミクスをどのように形作るかを調査しています6,7,14,16,17,18,18,19,20,21,22。例えば、倉本振動子モデルでは、グローバル同期への移行は正確な閾値Kcで起こることが知られており、その値は次数分布の力率パラメータαに依存しています23,24,25,26,27。スケールフリーネットワークは、ネットワークベースの数値シミュレーションや実験の基盤としても広く利用されており、スケールフリーネットワークの特定の生成メカニズムの研究は、すべてのネットワークアセンブリを理解するための共通の基盤を提供するものとしてフレーム化されています3,8,9,28,29,30,31,32。
しかし、スケールフリーネットワークの普遍性については議論の余地がある。多くの研究では、ユビキタス性を支持している4,5,16,17,33,34,35の研究もあれば、統計的または理論的な根拠に基づいてそれに挑戦する研究もあります2,3,10,36,37,38,39,40,41,42,43,44の研究もあります。このような視点の対立が続いているのは、これまでの研究が典型的には、小規模でドメイン固有のデータセット、あまり厳密でない統計手法、「スケールフリー」構造の定義の違い、そして何がスケールフリー仮説の賛否の証拠としてカウントされるかの基準が不明確であるためである4,5,6,7,16,17,45,46,47,48。さらに、フィットした力行分布と、代替的な非スケールフリー分布、例えば、対数正規分布や伸張指数など、現実的な標本サイズで力行形を模倣することができる力行分布との統計的に厳密な比較を行った研究はほとんどありません49。これらの問題は、実世界のネットワークにおけるスケール・フリー構造の強力な実証的証拠が普及しているかどうかという自然な疑問を提起しています。
この議論の中心にあるのは、"スケールフリー・ネットワーク "という言葉の多様な使い方によって引き起こされる曖昧さである。古典的な定義1,21,35,37は、ネットワークの度数分布Pr(k)が累乗則k-αの形をしている場合、ネットワークはスケールフリーであると述べています。累乗則とは、ネットワークのノード度に対する唯一の正規化可能な密度関数f(k)であり、再スケーリング下で不変であること、すなわち、任意の定数c14に対してf(ck)=g(c)f(k)であり、自然なスケールの「自由」であることです。ネットワークの度数分布では、スケールフリーであることは力法則パターンを意味し、その逆もまた然りです。スケール不変性は、ネットワーク構造の非度数ベースの側面を指すこともあります。例えば、ネットワークのサブグラフは構造的に自己相似であることがあります50,51。
スケールフリーなネットワークは、ネットワークアセンブリのメカニズムに関する文献でよく議論されていますが、特にノードが接続を得る確率が現在の次数kに比例する優先アタッチメント1,28,29の文脈では、スケールフリーなネットワークを生成する最も有名なメカニズムですが、スケールフリーなネットワークを生成するメカニズムは他にも存在します13,14,15。また、優先的アタッチメントのいくつかのバリエーションは、それらのネットワークはまだ時々、紛らわしいことに、スケールフリーと呼ばれていますが、力行度数分布35を生成しません。程度分布の形状は、ネットワーク全体の構造にわずかな制約を与えるだけであるため52、分布の機能的な形態が明らかな場合であっても、生成メカニズム53,54,55,56を区別しようとするときには、比較的弱い証拠となる。しかし、経験的なデータからその形を特定することは、例えば、対数正規分布が度数分布によく適合するか、力行法よりもよく適合することが多いため、容易ではないかもしれません49,56,57。
このような広範な文献において、「スケールフリーネットワーク」という用語は、次数分布における正確または近似的な統計的パターン、漸近限界における創発的な振る舞い、または特定のメカニズムのファミリーによって部分的または全体的に組み立てられたすべてのネットワークの特性を意味する場合があります。このような不正確さが、スケールフリー仮説をめぐる論争の一因となっている。
ここでは、スケールフリーなネットワークの伝統的な定義に焦点を絞ります。この範囲内であっても、定義は補助的な仮説を導入することによって修正されることが多い58。例えば、スケールフリー・パターンは最大の次数の場合にのみ成立し、Pr(k)∝k-α for k ≥ kmin > 1を暗示しています。他の設定では、有限サイズ効果は、基礎となるシステムのサイズに近い度数を持つノードの頻度を抑制し、Pr(k)∝ k-αe-λkを暗示し、ここでλは、極端な上尾の力則と指数関数的カットオフの間の遷移を支配します。あるいは、度数間の極端な不均一性が第一の関心事であるかもしれず、2 < α < 3のような制限を暗示していて、分布の平均が有限であるのに対し、分散は漸近的に無限である。最後に、累乗則は、データそのものの良いモデルであることを意味するのではなく、むしろいくつかの代替案、例えば、指数分布や対数正規分布、または単に "ヘビーテール "分布の一般的なスタンドイン、すなわち、指数よりもゆっくりと減衰する分布よりも良いモデルであることを意味しているかもしれません。
スケール・フリー・ネットワークという用語のこのような様々な使い方の結果として、異なる研究者が同じ用語を微妙に異なる概念を指すために使うことがあり、この曖昧さは基本的な仮説を実証的に評価する努力を複雑にします。ここでは、実世界のネットワークの大規模かつ多様なコーパスに最新の統計的手法を適用することで、スケールフリー・ネットワークのユビキタス性についての厳しい検証58を構築する。これまでの文献でスケールフリーネットワークがどのように定義されてきたかのバリエーションを明示的にカバーするために、我々は、特定のネットワークにおけるスケールフリー構造の強さと証拠の種類の違いを表す一連の定量的な基準を定式化した。この一連の基準は、共通のバリエーションとその組み合わせを統一し、スケールフリー度分布の証拠の異なるタイプと程度を評価することを可能にしている。コーパスの各ネットワーク・データ・セットについて,最適な力法則モデルを推定し,その統計的妥当性を検証し,代替的な非スケールフリー分布と比較する.これらの結果をまとめて分析し、スケールフリーな構造の証拠が領域間でどのように変化するかを検討し、いくつかの代替基準の下でのロバスト性を定量的に評価する。最後に、スケールフリー仮説の経験的妥当性についての前向きな議論を行い、ネットワークの構造に関する将来の研究への示唆を提供する。
組織はツリーではない - Jim Coplien さんのスケールフリーネットワーク論