ボルツマン分布とは、系の微視的状態について最も確からしい状態を反映したものです。
当ページではボルツマン分布式の導出を詳しく解説していきます。
■このページで分かる内容のまとめ■
分子が取り得る微視的なエネルギー状態 \(\epsilon_0\), \(\epsilon_1\) \(\cdots\) \(\epsilon_r\) に、それぞれ \(N_0\), \(N_1\) \(\cdots\) \(N_r\) の分子が占有する場合の微視的状態の総数 \(w\) について、\(w\) が最も大きくなる状態を調べることによって、最も確からしい系の状態を知ることができます。
また \(w\) が最大値を取るとき、それぞれのエネルギー状態を占有する分子数 \(N_i\) は次の関係を満たします。
\[ \ln N_i + \alpha + \beta \epsilon_i = 0 \]
ここで \(\alpha\) および \(\beta\) は未定係数です。
またエネルギー \(\epsilon_i\) および \(\epsilon_j\) を持った分子数 \(N_i\), \(N_j\) の比は、次で記述することができ
\[ \frac{N_i}{N_j} = e^{-\beta (\epsilon_i - \epsilon_j)} \]
これをボルツマン分布と言います。
■目次■
ボルツマン分布の導出
起こり得る確率が最も高い微視的状態
系の微視的状態は、それぞれの分子がどのくらいのエネルギーを持つかという視点から記述することができます。
数学的には組み合わせの総数 \(w\) として次式で与えられます。
\[ w(\boldsymbol{N}) = \frac{N!}{N_0!N_1!N_2! \cdots N_r!} = \frac{N!}{\prod_{i = 0}^r N_i!} \]
\(N_i ~ \big(1 \leq i \leq r\big)\) は分子が取り得るエネルギー \(\epsilon_i\) をもつ分子数で、また式中の \(\boldsymbol{N}\) は分子数の組を表しており、具体的には \(\boldsymbol{N} = \big( N_0, ~ N_1, ~ N_2 ~ \cdots ~ N_r \big)\) となっています。
微視的状態の総数 \(w\) は、式(1)に示す通り異なるエネルギー状態を占有する分子数 \(\big( N_1, ~ N_2 ~ \cdots N_r \big)\) によって変化します。
\(w\) の値が大きいほど確率的にもその状態は生じやすいことになりますね。
そして高確率で生じる微視的状態はそのまま巨視的な状態にも反映されると考えられるので、\(w\) が最大値を取る分子数の組 \(\boldsymbol{N}\) を知ることは非常に重要なことです。
イメージだけで言うと、次に示す図のように微視的状態の総数 \(w\) とエネルギー \(\epsilon_i\) をもつ分子数 \(N_i\) の関係は釣鐘型の概形になると分かりますので、\(w\) が最大となる \(\boldsymbol{N}\) を求めることができそうです。
(※縦軸は全場合の数で割った確率として表現しています。)
関数の最大最小問題は微分法を利用して解くのが一般的です。分子数 \(N_i\) は\(1\), \(2\), \(3\) \(\cdots\) と整数値しか取らない離散変数なので微分できないのですが、連続的に変化するとして計算を推し進めていきます。
そんな事して良いのかと思いますが、一般に系を構成する分子の数は非常に膨大であるため分子1つや2つの変化が全体に及ぼす影響は極めて小さいです。
そのため \(N_i\) を近似的に連続量としてみなすことができるというロジックです…OK?
スターリングの公式で解析が簡単になります。
上記の内容をもとに \(w\) を \(N_i\) で微分していきます。
\[ \frac{\partial w(\boldsymbol{N})}{\partial N_j} = \frac{\partial}{\partial N_j} ~ \frac{N!}{\prod_{i = 0}^r N_i!} \]
さて、ここで早速問題が生じました。
私達は \(N_i!\) の微分を知らないので、以降計算を実行することができません。
計算を進めるためには別の方法を試す必要があります。その方法が対数微分法。
つまり \(\ln w(\boldsymbol{N})\) を \(N_i\) で微分すると上手く計算できるということ。
念のため…
\[ \frac{\partial \ln w(\boldsymbol{N})}{\partial N_i} = \frac{d \ln w}{dw} \frac{\partial w}{\partial N_i} = \frac{1}{w} \frac{\partial w}{\partial N_i} \]
数学的にはこの様な関係にあるので、最大値を求める条件 \(\frac{\partial \ln w}{\partial N_i} = 0\) と \(\frac{\partial w}{\partial N_i} = 0\) は等価であり、対数で考えることは何ら問題はありません。
では、対数微分を実行するに当たって、まずは \(\ln w\) を式変形しておきましょう。
\[ \begin{align*} \ln w(\boldsymbol{N}) &= \ln \frac{N!}{\prod_{i = 0}^r N_i!} \\[15pt] &= \ln N! - \ln \prod_{i = 0}^r N_i! \\[15pt] &= \ln N! - \sum_{i = 0}^r \ln N_i! \end{align*} \]
ここで次のスターリングの近似公式を利用することで扱いやすい状態にすることができます。
\[ \begin{align*} \ln N! \simeq N \ln N - N \\[15pt] \ln N_i! \simeq N_i \ln N_i - N_i \end{align*} \]
ほらっ!微分しやすそうになった!
式(4)を式(3)に代入して整理すると次のようになります。
\[ \begin{align*} \ln w(\boldsymbol{N}) &\simeq \big( N \ln N - N \big) - \sum_{i = 0}^r \big( N_i \ln N_i - N_i \big) \\[15pt] &= N \ln N - \sum_{i = 0}^r N_i \ln N_i \end{align*} \]
微分を実行します。
微視的状態の総数 \(w\) は式(5)に示す通り、見事に微分を実行しやすい表式になりました。
早速、計算の続きをして \(w\) が最大になる \(\boldsymbol{N}\) を求めることにしましょう。
\[ \frac{\partial \ln w}{\partial N_j} = \frac{\partial}{\partial N_j} \left( N \ln N - \sum_{i = 0}^r N_i \ln N_i \right) \]
式(6)第1項を微分すると
\[ \begin{align*} \frac{\partial}{\partial N_j} N \ln N &= \frac{\partial N}{\partial N_j} \cdot \ln N + N \frac{\partial \ln N}{\partial N_j} \\[15pt] &= \frac{\partial N}{\partial N_j} \cdot \ln N + N \frac{\partial \ln N}{\partial N} \cdot \frac{\partial N}{\partial N_j} \\[15pt] &= \frac{\partial N}{\partial N_j} \left( \ln N + N \frac{\partial \ln N}{\partial N} \right) \\[20pt] &= 0 ~~~ \left( ~ \because \frac{\partial N}{\partial N_j} = 0 ~ \right) \end{align*} \]
となります。分子総数 \(N\) は定数なので、微分は 0 となります。
続いて式(6)第2項を微分すると
\[ \begin{align*} \frac{\partial}{\partial N_j} \sum_{i = 0}^r N_i \ln N_i &= \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \ln N_i + \sum_{i = 0}^r N_i \frac{\partial \ln N_i}{\partial N_j} \\[15pt] &= \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \ln N_i + \sum_{i = 0}^r N_i \frac{\partial \ln N_i}{\partial N_i} \cdot \frac{\partial N_i}{\partial N_j} \\[15pt] &= \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \ln N_i + \textcolor{red}{\sum_{i = 0}^r \frac{\partial N_i}{\partial N_j}} \end{align*} \]
ここで赤色で示した和の項は、和と微分を交換して整理すると次のように 0 になることが分かります。
\[ \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} = \frac{\partial}{\partial N_j} \sum_{i = 0}^r N_i = \frac{\partial N}{\partial N_j} = 0 \]
したがって、式(6)第2項の微分は
\[ \frac{\partial}{\partial N_j} \sum_{i = 0}^r N_i \ln N_i = \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \ln N_i \]
となります。
まとめると、\(\ln w(\boldsymbol{N})\) の微分は次式で表されることが分かります。
\[ \frac{\partial \ln w(\boldsymbol{N})}{\partial N_j} = - \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \ln N_i \]
条件付き最大最小問題はラグランジュの未定乗数法で解決。
微視的状態の数 \(w\) の最大値をとる \(\boldsymbol{N}\) を求めるに際して、系の総エネルギー \(E\) は一定であるという条件を設けることにしましょう。
また、このとき分子の総数 \(N\) が変化しないことも条件に課されることに注意してください。
\[ \begin{align*} &\sum_{i = 0}^r N_i \epsilon_i = E ~~~ ( ~ \text{Const.} ~ ) \\[15pt] &\sum_{i = 0}^r N_i = N ~~~ ( ~ \text{Const.} ~ ) \end{align*} \]
繰り返しになりますが、式(12)において \(E\) および \(N\) は定数であり、変数は \(N_i ~ \big(1 \leq i \leq r\big)\) です。
式(12)のような束縛条件が付いた最大最小問題は、ラグランジュの未定乗数法を利用するのが一般的です。
ラグランジュの未定乗数法では、条件式(12)を \(N_j\) で偏微分した下記の式
\[ \begin{align*} &\sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \epsilon_i = 0 \\[15pt] &\sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} = 0 \end{align*} \]
これらの定数倍が、ちょうど \(\frac{\partial \ln w}{\partial N_j}\) に等しい関係にあることを利用します。
\[ \begin{align*} \frac{\partial \ln w(\boldsymbol{N})}{\partial N_j} = \alpha \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} +\beta \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \epsilon_i \\[30pt] \therefore ~ - \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \ln N_i = \alpha \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} +\beta \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \epsilon_i \end{align*} \]
式(14)を整理すると次式が得られます。
\[ \sum_{i = 0}^r \frac{\partial N_i}{\partial N_j} \big( \ln N_i + \alpha +\beta \epsilon_i \big) = 0 \]
ボルツマン分布へ到達。
ここまで来れば、後は簡単です。
導いた式(15)が成立するには \(\frac{\partial N_i}{\partial N_j} ~ \char`≠ ~ 0\) であることを考えると次の関係を満たす他ありません。
\[ \begin{align*} \ln N_i &= - \alpha - \beta \epsilon_i \\[15pt] \Leftrightarrow ~ N_i &= e^{-\alpha} e^{-\beta \epsilon_i} \end{align*} \]
これで微視的状態の数 \(w\) が束縛条件 式(12)の下で最大値をとる \(\boldsymbol{N}\) を求めることができました。
しかし、未確定な係数 \(\alpha\) と \(\beta\) が気になりますね。
\(\alpha\) はすぐに消去することができて、例えば \(N_j\) も式(16)と同様の関係を満たすので
\[ N_j = e^{-\alpha} e^{-\beta \epsilon_j} \]
\(N_i\) と \(N_j\) の比を考えれば
\[ \frac{N_i}{N_j} = e^{-\beta(\epsilon_i - \epsilon_j)} \]
となります。
また式(18)をボルツマン分布といって、異なるエネルギーをもつ分子の数の比とエネルギー差について記述された関係式となります。
一方で \(\beta\) は逆温度といって温度の逆数と比例する量になりますが、当ページでは説明を割愛します。
ボルツマン分布の概形
ボルツマン分布式(18)にしたがって、最も確からしい微視的状態は決まります。
具体的には、エネルギーが小さい状態の分子数は多く、エネルギーが大きい状態の分子数は少ないことを理解できます。
式(18)からは \(\beta\) の符号を知らない限りエネルギーと分子数の関係について断定することはできませんが、エネルギー \(\epsilon_i\) をもつ分子数 \(N_i\) に対する微視的状態の総数 \(w\) のグラフからその傾向を掴むことは可能です。
上図は \(\epsilon_0\), \(\epsilon_1\), \(\epsilon_2\), \(\epsilon_3\) のエネルギーを持つ分子の分布を表しています。
グラフから、エネルギーの低い分子が大多数を占め、エネルギーの高い分子の数は少数となる微視的状態を生じやすいことが理解できるでしょう。
したがってボルツマン分布は単調に減少するグラフであることも分かります。
【サイト運営 : だいご】
今年で物理化学歴11年目になります。
大学入試2次数学でたった3割しか得点できなかったいわゆる数弱落ちこぼれ。それでも好きこそものの上手なれと言ったところか、学会で最優秀賞受賞したり首席卒業できてしまったので、役に立つ知識を当サイトに全て惜しみなく公開しようと思います。ブックマークをオススメ。