pythonでニューラルネットワークを使った相転移検出 - イジングモデルのシミュレーション、CNNで学習 -

2021/01/17programming colaboratory physics ising-model tensorflow

“ディープラーニングと物理学”本にイジングモデルのシミュレーション結果を機械学習モデルの学習データとして用いて、ある状態が相転移状態か否かを判定するモデルを作成する手法が紹介されていたのでやってみた

環境

google colabratory

イジングモデルの計算とシミュレーション方法

理論、方法ともに”ディープラーニングと物理学原理がわかる、応用ができる”より。結構いろんな章を参考にした

ページ数は参考にした箇所を表す

ハミルトニアンと確率

p. 48~

ハミルトニアンは系におけるエネルギーのようなもの

熱浴系においてエネルギーEを持った状態が実現される確率は

$p = \frac{1}{Z}\exp[-\frac{E}{k_BT}]$

$k_B$ はボルツマン定数、 $T$ は温度[K]を表す

Zは分配関数といい、状態確率の規格化定数のようなもの。以下のように表す

$Z = \sum_{全状態}\exp[-\frac{H}{k_BT}]$

メトロポリス法

p.126~

確率的シミュレーションにおいて、状態遷移をある条件で行っていく方法のこと状態遷移はエネルギーとその遷移確率から決まっていく

平衡分布を以下のように取る

$p_{eq}(s_i) = \frac{1}{Z_{\beta}}e^{-\beta H[s_i]}$

$\beta=\frac{1}{k_{B}T}$ は逆温度、 $s_i$ はある状態、 $H[s_i]$ はハミルトニアン表す

$i$ から $j$ に行く確率を求める

$H[s_i] < H[s_j]$ となるとすると、 $s_i$ は $s_j$ よりも低いエネルギーなので、iに留まりそう。これを

$p(s_i|s_j) = 1$

とおく

詳細釣り合いの原理(iからj、jからiに行く確率はどちらも等しい)より反対方向には

$e^{-\beta H[s_j]} = p(s_j|s_i) e^{-\beta H[s_i]}$

ここで左辺は $p(s_i|s_j) = 1$ 、より

$p(s_j|s_i) = e^{-\beta (H[s_j]-H[s_i])}$

となり、状態遷移確率は各状態のエネルギー差分に依存する（エネルギー差分が低いほど、高温ほど高い確率）

すなわち、ある状態を変化させて、その時のエネルギーの変化をみていくことで状態の遷移確率がわかる

メトロポリス法は以下のような順番で行う

適当な初期状態iを用意
状態iでのハミルトニアンを求める
状態をiからjに変化させる（変化させる手法は任意
状態jでのハミルトニアンを求める
状態の更新を行う。メトロポリステストと呼ぶ。

エネルギーが小さくなる $H[s_i] > H[s_j]$ ならば次の状態をjに更新する。そうでなければ、遷移確率で判定を行うプログラミング的には0~1の乱数rに対して $r>p(s_j|s_i)$ ならば状態を更新する状態が更新されることをacceptという、反対にそのままのときはrejectという

イジングモデルのシミュレーション

イジングモデルは磁性体をミクロな視点から説明するモデルのこと

各格子点に $\pm{1}$ の値をとるスピンsが配置されており、それらの配位（各スピンの状態）より系のハミルトニアンが求まる

二次元正方格子を考える。あるスピン配位でのハミルトニアンは以下のように表される

$H[s] = -J\sum_{i,j}s_{i,j}(s_{i+1,j}+s_{i,j+1})$

スピン $i$ のハミルトニアンは隣接しているスピンの状態に依存する

$H_i = -J s_i \sum_{j \in <i,j>}s_j$

$<i,j>$ はiに隣接しているスピンの集合

状態変化はあるスピンの反転とする。変化前後のエネルギー差分と状態遷移確率より、メトロポリス法をもちいて状態の更新を行っていく

各ステップで状態変化を行い、エネルギーHとスピン配位s（配列）を取得するまた、相転移の温度を閾値としてラベルを設定する。ある温度Tについて、 $T<2.27$ ならば $d=0$ 、 $T>2.27$ ならば $d=1$ とする（ $T=2.27$ のときは $d=0$ とした）ある温度における、ある時点のスナップショットを取得して、(温度範囲×取得するスナップショット数)分、(step, T, H, s, d)の学習データを作成する