Direct Gradient Computation for Barren Plateaus in Parameterized Quantum Circuits
https://www.semanticscholar.org/paper/Direct-Gradient-Computation-for-Barren-Plateaus-in-Yao-Hasegawa/d9e9da5ac474fd5a92bca4c6d59610a9ecf6affc
Abstruct
不毛高原現象 (barren plateau phenomenon)、すなわちパラメータ化された量子回路の勾配が極めて小さくなる現象は、量子機械学習において大きな課題となっています。これまでの研究では、この不毛高原現象を Weingarten公式 を用いて説明しようとしましたが、この公式に依存すると不正確な結論に至ります。本研究では、回転ゲートから構成されるユニタリ演算子Uを考え、勾配計算に必要な期待値を厳密に計算します。我々の手法により、勾配の期待値および分散を直接求めることが可能となります。
解析の結果、勾配の期待値は Weingarten公式から導かれる結果とは異なりゼロにはならず、系の量子ビット数に依存することが明らかになりました。さらに、有効パラメータ数、回路の深さ、および勾配の分散が、深いパラメータ化量子回路においてどのように相互に関連しているかを示します。数値シミュレーションによっても、我々の理論結果の妥当性が確認されました。我々のアプローチは、量子回路の最適化を解析するための、より正確な枠組みを提供します。
Introduction
量子機械学習技術の進展に伴い、パラメータ化量子回路(Parameterized Quantum Circuits, PQCs) は様々な量子計算タスクに広く用いられるようになっています。ところが、PQCs の訓練においては、構造の大きさ、回路の深さ、その他の制約などの要因により、最適化過程で勾配がほぼゼロに近づいてしまい、学習が停滞し、全体的な性能が低下することがしばしばあります。この現象は 不毛高原(barren plateau) として知られ、PQCs の効率的な訓練における大きな課題となっています。
不毛高原に関する関連研究として、いくつかの研究 [1–24)は勾配の期待値および分散の原理に基づく理論解析を用いています。Weingarten 公式 [25–28)とその派生手法 [8)は、Haar ランダム分布の下では勾配期待値が常にゼロであることを示すために利用されました [7)。また、異なる量子ビット数や回路の深さにおける勾配分散の特徴も調査されました。一方で、先行研究 [4–6)では、勾配分散をその上限および下限を探索することにより効果的に推定しています。浅い PQCs では、研究 [1, 2)により、局所的な観測量を用いると、大域的な観測量を用いる場合よりも分散が小さく、より安定した収束が得られることが示されました。さらに別の研究 [29, 30)では、回路構造と観測量の双方が、パラメータが分散に寄与する仕方やその全体的な大きさに影響を与えることが詳しく論じられています。具体的には、異なる回路アーキテクチャや観測量により、パラメータ変化が回路内をどのように伝播するかが変わり、それによって勾配分散の振る舞いが変化するのです。
しかし、Weingarten 公式には落とし穴があります。
ユニタリ行列
https://scrapbox.io/files/68dbbbd98379c7c31ccba1e5.png
を考えましょう。ここで$ U_i はユニタリ行列、$ θ_i は任意の実数で、$ θ の列を形成します。$ U_i の数が増えると、$ U は徐々に Weingarten 公式における Haar 測度の分布に近づき、その全体の期待値は次のように表されます:
https://scrapbox.io/files/68dbbbfdd9e370b34269e47b.png
両者の違いは、
https://scrapbox.io/files/68dbbc98cc5c3a04ae34ffff.png
のような追加の交差項(クロスターム)が生じる点にあります。
Weingarten 公式は複雑な回路を扱ううえで強力な数学的ツールですが、誤差を導く可能性があります。
本研究では、勾配計算に関わる期待値を厳密に計算する手法を提示します。我々の手法は、勾配の期待値と分散を系統的に算出し、不毛高原現象に対する定量的な洞察を与えます。その結果、勾配期待値は本質的にゼロにはならず、Weingarten 公式を用いた従来の結論に異議を唱えることができることを示します。さらに、勾配分散、回路深さ、有効パラメータ数の間に正確な定量的関係を確立しました。特に、PQCs において基本的なスケーリング則を明らかにしました:
勾配分散は有効パラメータの比率に直接比例する。
この発見は、不毛高原を緩和するうえでパラメータ効率が果たす重要な役割を強調するものです。
PQCs は、様々な計算問題を解くために最適化可能な調整パラメータを備えた量子回路です。PQCs は以下の主要な要素で特徴づけられます:量子ビット数
𝑛
n、回路の深さ
𝑑
d、回路構造
𝑈
(
𝜃
)
U(θ)、初期状態
∣
init
⟩
∣init⟩、目的関数
𝑂
O、および最適化プロセス。
回路構造は次のように表されます: