皆さん、こんにちは!今日は情報幾何という分野に出てくる「アフィン接続」という考え方を、できるだけ丁寧に解説していきます。
まずは、身近な例から考えてみましょう。例えば、地球儀のような曲面の上に、アリがチョークで線を引くことを想像してみてください。アリにとっての「まっすぐな線」って、どういうものでしょうか? 地球儀の上では、普通の定規で引いたような線は「まっすぐ」ではありませんよね。
実は、この「まっすぐ」という考え方が、アフィン接続と深く関わっているんです。
ベクトル空間と多様体:舞台設定
まずは、議論の舞台となる数学的な構造を定義します。
高校で学ぶベクトルは、向きと大きさを持つ量であり、足し算やスカラー倍といった演算が定義されています。これらの性質を持つ集合をベクトル空間と呼びます。
一方、地球の表面のような曲がった空間は、局所的には平面のように見えますが、全体としては曲がっています。このような空間を数学的に記述するために多様体という概念が用いられます。多様体は、各点の近傍がベクトル空間とみなせるような空間です。
曲面から導く多様体の基礎
この記事では多様体とは何か、どうしてそんな概念が生まれたのかを考えていきます。 最初に多様体とは何なのかを一言で言うなら「なんだかよくわからないものを自分の土俵に持ち込み理解するための概 ...
続きを見る
多様体上の各点には、その点における「向き」を表す接ベクトルが存在します。ある点 \(p\) における全ての接ベクトルを集めたものを接空間 \(T_p M\) と呼び、これはべクトル空間となります。
多様体の各点に一つずつ接ベクトルが対応しているとき、これをベクトル場と呼びます。例えば、地球上の各地点における風の向きと強さを表すものがベクトル場の一例です。
https://forest.watch.impress.co.jp/img/wf/docs/1141/465/html/image2.png.html
なぜアフィン接続が必要なのか?
多様体上の異なる点に存在する接ベクトル同士を比較したり、微分したりするためには、それらを「結びつける」ための仕組みが必要です。なぜなら、単に座標成分を比較するだけでは、空間の曲がり具合を考慮できないからです。
多様体は「曲がった空間」です。例えば、球面やトーラス(ドーナツ型)といった曲面を考えるとき、それらはその「上」で生きる微分積分を扱えるような空間として定義されます。多様体上には局所的な座標系が定義できますが、グローバルに見れば曲がっています。ここで問題になるのが、「曲がった空間で、ベクトル(向きと大きさを持つ量)をどのように移動させるか」ということです。これがアフィン接続の役割の一つです。
実際のところ、平らな空間(ユークリッド空間)では、ベクトルを平行に動かす(平行移動する)ことは自然にできます。床の上に矢印を描いて、その矢印を大きさも向きも変えずにスライドさせれば、どこにでも同じ向き・大きさで移動させることができます。しかし、球面上を考えてみると、その「平行移動」をどう定義すればいいのでしょうか?
再度、地球儀をイメージしてください。北極点で赤道に向けて「東向き」のベクトルを考えるとします。このベクトルを、地球表面(2次元の多様体)をなぞりながら赤道上まで移動させるにはどうするか?途中で方向がずれないように運ぶには、何らかの「移動のルール」が要ります。この「ルール」を定めるのがアフィン接続です。
アフィン接続とは?
ベクトル場 \(\mathrm{X}\)をある方向 \(\mathbf{v}\) に沿って微分することを考えます。ユークリッド空間では、単に各成分を微分すればよいのですが、多様体上ではそうはいきません。空間の曲がりを考慮した微分が必要となり、これを共変微分 \(\nabla_{\mathbf{v}} \mathrm{X}\) と呼びます。
【定義】アフィン接続
アフィン接続 \(\nabla\) とは、多様体上のベクトル場に対して、以下の性質を満たす共変微分 \(\nabla_{\mathbf{v}} \mathbf{X}\) を定めるものです。
1. 線形性: \(\nabla_{a \mathbf{v}+b \mathbf{w}} \mathbf{X}=a \nabla_{\mathbf{v}} \mathbf{X}+b \nabla_{\mathbf{w}} \mathbf{X}\)
2. 線形性: \(\nabla_{\mathbf{v}}(a \mathbf{X}+b \mathbf{Y})=a \nabla_{\mathbf{v}} \mathbf{X}+b \nabla_{\mathbf{v}} \mathbf{Y}\)
3. ライプニッツ則: \(\nabla_{\mathbf{v}}(f \mathbf{X})=(\mathbf{v} f) \mathbf{X}+f \nabla_{\mathbf{v}} \mathbf{X}\) (ここで \(\mathbf{v} f\) は関数 \(f\) の方向微分)
共変微分とは?
簡単に言えば、 \(\nabla_X Y\) は、「ベクトル場 \(Y\) がベクトル場 \(X\) の方向にどのように変化しているか」を表しています。
通常のベクトル微分(偏微分など)は、「平らな空間(ユークリッド空間)」であれば当たり前に定義できます。たと えば \(\mathbb{R}^n\) でベクトル値関数
$$
Y(x)=\left(Y^1(x), Y^2(x), \ldots, Y^n(x)\right)
$$
を考えると、座標 \(x^j\) による「偏微分」
$$
\frac{\partial Y^i}{\partial x^j}
$$
によって、 \(Y\) の成分がどの方向にどのように変化しているかを調べることができます。
ところが、多様体(球面やトーラスなどの曲がった空間)では、「ベクトルをどう比較すればいいのか」が問題になります。多様体上では、離れた点のベクトル同士を直接「引き算」して比較することが容易ではありません。そこで、
- 多様体上で「ある方向に沿ってベクトル場がどのように変化するか」を定義したい
- そのために、ベクトル場どうしを(局所的に)つなぎ合わせる際のルールが必要
という考えのもと生まれたのが共変微分です。共変微分は、アフィン接続(前回お話しした「ベクトルをどのように運ぶかを決める構造」)を使って、曲がった多様体でも「方向微分」をうまく定義するための道具です。
直感的には、次のように考えると分かりやすいです。
- 多様体上にベクトル場 \(Y\) があるとき、ある点 \(p\) からごく近い点 \(p+\delta\) ヘベクトルを「並行に運ぶ(平行移動 する)」方法を、アフィン接続が与えてくれる。
- その平行移動によって、 \(\delta\) 先でのベクトル場 \(Y\) と「運んできたベクトル」とを比べることで「変化量」を測る。
- これを「方向 \(X\) に沿って」の極限で定義すると、 「\(\nabla_X Y\)」 と呼ばれる量になる。
平行移動という作業が入る点が、単なる偏微分(成分を引き算して割る)とは大きく異なるところです。
【定義】共変微分
\(M\) を多様体とする. 以下の 4 条件を満たす写像
$$
\nabla: \mathcal{X}(M) \times \mathcal{X}(M) \longrightarrow \mathcal{X}(M):(X, Y) \longmapsto \nabla_X Y
$$
を \(M\) の共変微分という : 任意の \(X, Y, Z \in \mathcal{X}(M)\) と任意の \(f \in C^{\infty}(M)\) に対し
i) \(\nabla_X(Y+Z)=\nabla_X Y+\nabla_X Z\)
ii) \(\nabla_X(f Y)=(X f) Y+f \nabla_X Y\)
iii) \(\nabla_{X+Y} Z=\nabla_X Z+\nabla_Y Z\)
iv) \(\nabla_{f X} Y=f \nabla_X Y\)
局所座標 \(\left(x^1, \ldots, x^n\right)\) を導入すると、しばしばクリストッフェル記号 \(\Gamma_{i j}^k\) を使って
$$
\nabla_{\frac{\partial}{\partial x j}}\left(\frac{\partial}{\partial x^i}\right)=\Gamma_{i j}^k \frac{\partial}{\partial x^k}
$$
と書けます。つまり、座標変換によって \(\Gamma_{i j}^k\) は複雑に変化しますが、それは「多様体が曲がっている」ことの反映です。
任意のベクトル場 \( \mathbf{X}=\sum_j X^j \frac{\partial}{\partial x^j}\)と \(\mathbf{Y}=\sum_i Y^i \frac{\partial}{\partial x^i}\)に対して、共変微分は以下のように計算できます。
$$
\nabla_{\mathbf{Y}} \mathbf{X}=\sum_{i, j, k} Y^i \frac{\partial X^j}{\partial x^i} \frac{\partial}{\partial x^j}+\sum_{i, j, k} Y^i X^j \Gamma_{i j}^k \frac{\partial}{\partial x^k}
$$
もう少し具体的に、球面上をイメージしてみましょう。地球上で、北極から赤道までベクトルを「平行に運ぶ」ことを考えます。このとき、もし地球を回りながら移動すると、到着地点でのベクトルの向きは、移動ルートによって違ってきます。これは「地球の曲率」が影響しており、地球表面(球面)という曲がった空間上では、ベクトルがどう変化するかに“ねじれ”が生じるからです。
共変微分 \(\nabla_X Y\) は、ある意味、「そのねじれを考慮した上で、方向 \(X\) に沿って \(Y\) がどれはど変化するのか」を定量的に測るものです。
アフィン接続と平行移動
アフィン接続を用いることで、ある点における接べクトルを、多様体上の別の点まで「平行に移動」させる概念を厳密に定義できます。 ベクトル場 \(\mathbf{X}\) が曲線 \(\gamma(t)\) に沿って平行であるとは、その曲線の接ベクトル \(\dot{\gamma}(t)\) 方向への共変微分がゼロになることです。
$$
\nabla_{\dot{\gamma}(t)} \mathbf{X}=\mathbf{0}
$$
局所座漂で表すと、平行移動されるベクトルの成分 \(X^k\) は以下の微分方程式を満たします。
$$
\frac{d X^k}{d t}+\sum_{i, j} \Gamma_{i j}^k \frac{d \gamma^i}{d t} X^j=0
$$
この微分方程式を解くことで、ある点から別の点へのベクトルの平行移動が具体的に計算できます。
情報幾何におけるアフィン接続:確率分布の空間へ
アフィン接続は、曲がった多様体上の「幾何構造」を決める中心的な道具の一つです。これによって曲率(多様体がどの程度曲がっているか)を定義できます。また、測地線(多様体上で「最もまっすぐな曲線」)もアフィン接続から定まります。測地線は「接ベクトルが平行移動によって一定方向を保つような曲線」です。
また、リーマン多様体(内積構造を持つ多様体)では、特定の条件を満たす特別な接続(レビ・チビタ接続)が一意的に存在し、その接続を使って幾何学的な議論が展開されます。
情報幾何学では、確率分布族を多様体とみなし、その上にFisher情報計量という計量を入れます。しかしこの計量だけでは、双対アフィン接続という特異な構造が自然に現れます。そこでは、情報量の「歪み」や「非対称性」を測るために、アフィン接続が重要な役割を果たします。
ここでは、分布空間の点間で「パラメータの変化に応じてベクトル場がどう変化するか」を把握する必要があり、そのためにアフィン接続が必須の道具になるわけです。
まとめ
アフィン接続は、単に「平行」という概念を定義するだけでなく、多様体上の微分や幾何学的な構造を理解するための強力な道具です。情報幾何においては、確率分布の空間にアフィン接続を導入することで、統計的な推論や学習の原理を幾何学的に捉え直し、新たなアルゴリズムや解析手法の開発に繋がっています。