逆関数定理、陰関数定理の証明【一点から局所的な情報を導く】

多様体論で基礎となる3つの定理、逆関数定理、陰関数定理の証明を紹介します。これらは、写像の一点の情報からその点の局所的な性質を導くことのできる強力な定理です。逆関数定理と陰関数定理はどちらかを示せばもう一方が示されるという関係なのですが、この記事では逆関数定理を示してから陰関数定理を示すことにします。証明が長いせいか、証明を書いている記事が少なかったので、書いてみました。また、陰関数定理の簡単な応用として、正則値定理を紹介します。

逆関数定理

逆関数定理とは

まずは逆関数定理の主張を述べましょう。

定理. 逆関数定理

$A$ を $\mathbb{R}^n$ の開集合, $f : A \to \mathbb{R}^n$ を $C^r$ 級写像 ($r \geq 1$) とし, $A$ の一点 $a$ において $f$ の微分 $Df$ が

$$\det Df (a) \neq 0$$

を満たすとする. このとき, $a$ の開近傍 $U$ ($ \subset A$) と $f(a)$ の開近傍 $W$ が存在し, $f$ を $U$ に制限した $f |_{U} : U \to W$ が $C^r$ 級同相写像となる. つまり, $f |_{U}$ の逆写像 $g$ が存在し, $g$ は $C^r$ 級写像である. $\Box$

証明の前に、条件 $\det Df (a) \neq 0$ について考えてみましょう。この条件が $a$ の近傍での $f$ の挙動をどのくらい決定できるのでしょうか。

まず、$Df(a)$ の値自体が $f$ の $a$ の近傍での情報をどのくらい持っているかですが、ほとんど持っていないと言っていいでしょう。というのも、例えば以下の関数

$$\psi(x) = \begin{cases} e^{-\frac{1}{x}} & (x > 0) \\ 0 & (x \leq 0) \end{cases}$$

は原点において全ての階数の微分が $0$ ですが、関数自体は原点の近傍で $0$ ではありません。全ての階数の微分の値がわかっても近傍の値は決定されないのですから、1階の微分の値だけでは近傍の情報をごく一部しか持っていないと言えます。

一方で、 $\det Df (a) \neq 0$ という条件は $Df(a)$ が可逆であるということであり、素朴に考えれば $a$ の周りの微小なベクトルが $f(a)$ 周りの微小なベクトルと1対1に対応するということです。ということは、$a$ にとても近い部分と $f(a)$ にとても近い部分が1対1に対応する、ということがありえそうです。多様体の言葉で言えば、$\det Df (a) \neq 0$ は $Df(a)$ が $a$ 上の接空間 $T_a \mathbb{R}^n$ と $f(a)$ 上の接空間 $T_{f(a)} \mathbb{R}^n$ の間の全単射を与えているということです。そしてもし $a$ の近傍と $T_a \mathbb{R}^n$ の $0$ の近傍、$f(a)$ の近傍と $T_{f(a)} \mathbb{R}^n$ の近傍の間の全単射があれば、$a$ の近傍と $f(a)$ の近傍の全単射が存在するのではないか?ということになります。リーマン計量を入れると、指数写像によって点の近傍とその点上の接空間の $0$ の近傍全単射が構成されます。(ただし、指数写像が全単射であることに逆関数定理を用いるので、この方針での証明はできません。)

また、$Df$ が連続であることから、$\det Df$ は $a$ の近くでも $0$ でありません。各点での微分の値が分かっていれば、積分して $f$ を求めることもできますので、条件 $\det Df (a) \neq 0$ には逆関数がありそうだと思えるぐらいの情報量があります。

それでは、証明を行います。

逆関数定理の証明

証明) 簡単のため, $a = 0, f(a) = 0$ とする. $\bar{f} = (Df (0))^{-1} \circ f$ とおくと, $\bar{f}$ は $C^{r}$ 級写像で, $\bar{f} (0) = 0$, $D \bar{f} (0) = I$(単位行列) である. $\bar{f}$ について証明すれば $f = D \bar{f}(0) \circ \bar{f}$ についても定理の結論を満たすため, $\bar{f}$ について証明する. $\bar{f}$ を改めて $f$ と書く.

$f$ は $0$ の近傍では恒等写像にかなり近いと思われる. また, 十分近い点では恒等写像とのずれがどの点でも大体同じと思われる. 従って, $f$ と恒等写像の差を $h(x) = f(x) -x$ とおき, $q \in W$ に対し, $f(p) = q$ を満たす $p \in U$ を以下のような考え方, 方針で求める。

  1. $p_0 = q$ とする. $q$ と $f(q)$ の差は $h(q) = f(q) -q$ であり, $q$ は $f$ によって $h(q)$ だけ動いた.
  2. $q$ の周りの点は $f$ によって大体 $h(q)$ だけ移動するだろうから、$q -h(q)$ は $f$ によって $q$ の近くに移されるはずである.
  3. $p_1 = q -h(q)$ とおく. $f(p_1)$ と $q$ の差を $p_1$ にフィードバックし $p_2 = p_1 -(f(p_1) -q) = q -h(p_1)$ とおく.
  4. これを繰り返し, $p_{m + 1} = q -h(q_m)$ とおく.
  5. $|q -f(p_m)|$ はどんどん小さくなるはずだから, $p_{m}$ は $m \to \infty$ で $p$ に収束し、$q = f(p)$ を満たすだろう.

この方針が正しいことを示すには、$p_m$ が $m \to \infty$ である点 $p$ に収束すること、そして $q = f(p)$ を満たすことを示せば良い。$p_m$ が収束することを示すために、まずは、$h$ について調べよう. $\varepsilon > 0$ に対し, $C(\varepsilon) \subset \mathbb{R}^n$ を

$$C(\varepsilon) = \{ (x_1, \dots, x_n) \in \mathbb{R}^n \mid |x_i| < \varepsilon, i = 1, \dots, n\}$$

とする. $\varepsilon$ を十分小さく取り, $C(\varepsilon) \subset A$ であり, さらに $h(x) = (h_1(x), \dots, h_n(x))$ とおくとき, $C(\varepsilon)$ の各点において

$$ \left| \frac{\partial h_i}{\partial x_j} \right| \leq \frac{1}{2 n^2}$$

を満たし, $\det Df$ が $C(\varepsilon)$ の各点において逆行列を持つとする. $x, \bar{x} \in C(\varepsilon)$ に対し, 平均値の定理より

\begin{align} \left| h_i(x) -h_i(\bar{x}) \right| &= \left| \sum_{j = 1}^{n} \frac{\partial h_i}{\partial x_j}(\bar{x} + \theta (x -\bar{x}))(x_j -\bar{x}_j) \right| \\ & \leq n \max_{i, j, \hat{x} \in C(\varepsilon)} \left | \frac{\partial h_i}{\partial x_j} (\hat{x})\right| \left| x -\bar{x} \right| \\ & < \frac{1}{2n} \left| x -\bar{x} \right| \end{align}

が成り立つ. ただし, $0 < \theta < 1$ である. よって

$$|h(x) -h(\bar{x})| < \frac{1}{2} |x -\bar{x}| \tag{*}$$

が成り立つ.

$q \in C(\varepsilon / 2)$ とし, $f(p) = q$ となる $p \in C(\varepsilon)$ が一意的に存在することを示そう. 前述のように $p_0 = q$ とし, $p_{m + 1} = q -h(p_m)$ とする. このとき, $p_m -p_{m-1} = -(h(p_{m-1}) -h(p_{m-2}))$ だから,

$$| p_m -p_{m-1} | < \frac {1}{2} | p_{m-1} -p_{m-2}|$$

が成り立ち, 点列 $p_0, p_1, \dots, p_m, \dots$ は Caucy列である. 従って $\mathbb{R}^n$ 上の点 $p$ に収束する. また, $p_{-1} = 0$ とおくと, $p_0 = q = q -h(p_{-1})$ であり,

\begin{align} | p_m | & = | (p_m -p_{m-1}) + \cdots + (p_0 -p_{-1})| \\ & < \sum_{i = 0}^m |p_m -p_{m-1}| \\ & = \sum_{i=0}^m \left(\frac{1}{2^m} \right) |p_0 -p_{-1}| \\ & < 2 |q| \end{align}

を満たす. よって $|p| \leq 2 |q|$ が成り立ち, $p \in C(\varepsilon)$ である.

$ p_{m + 1} = q -h(p_m)$ の両辺で $m \to \infty$ とすると,

$$p = q -h(p) = q -f(p) + p$$

だから,

$$f(p) = q$$

が成り立つ. この $p$ が一意的であることを示そう. もし $f(p^{\prime}) = q$ となる $p^{\prime} \neq p$ が存在したとする. このとき, $ h(p^{\prime}) -h(p) = -(p^{\prime} -p)$ だが, これは (*) に反する. よって $p$ は一意的である.

以上から, 写像 $g: C(\varepsilon / 2) \to C(\varepsilon)$ を $g(q) = p$ と定義すると, $f \circ g : C(\varepsilon /2 ) \to C(\varepsilon / 2)$ は恒等写像である. また,

\begin{align} |f(x) -f(x^{\prime})| & \geq |x -x^{\prime}| -|h(x) -h(x^{\prime})| \\ & \gt \frac{1}{2} |x -x^{\prime}| \end{align}

だから, $q, q^{\prime} \in C(\varepsilon /2)$ に対して

$$ |q -q^{\prime} | \gt \frac{1}{2} | g(q) -g(q^{\prime}) |$$

が成り立つ. よって $g$ は連続写像である.

次に, $g$ が $C^1$ 級であることを示す. $x, x^{\prime} \in g(C(\varepsilon / 2))$ として, $f(x)$ を $x^{\prime}$ で展開すると,

$$ f(x) = f(x^{\prime}) + Df(x^{\prime}) \cdot (x -x^{\prime}) + \alpha(x, x^{\prime})$$

となる. ここで, 第3項の $\alpha(x, x^{\prime})$ は

$$ \lim_{x \to x^{\prime}} \frac{\alpha (x, x^{\prime})}{| x -x^{\prime} | } = 0 $$

を満たす. $Df(x^{\prime})$ の逆行列を $T$, $y = f(x)$, $y^{\prime} = f(x^{\prime})$, $\bar{\alpha}(y, y^{\prime}) = -\alpha(x, y)$, とおくと,

$$ T \cdot (f(x) -f(x^{\prime})) = (x -x^{\prime}) + T \cdot \alpha(x, x^{\prime})$$

から,

$$f^{-1} (y) -f^{-1} (y^{\prime}) = T \cdot (y -y^{\prime}) + T \cdot \bar{\alpha}(y, y^{\prime})$$

となる. ここで,

$$\frac{\bar{\alpha}(y, y^{\prime}) }{|y -y^{\prime}|} = -\frac{\alpha(x, x^{\prime})}{|x -x^{\prime}|} \frac{|x -x^{\prime}|}{|y -y^{\prime}|}$$

であり, $|x -x^{\prime}| / |y -y^{\prime}| < 2$ だから,

$$\lim_{y \to y^{\prime}} \frac{\bar{\alpha}(y, y^{\prime})}{|y -y^{\prime}|} = 0$$

である. よって $f^{-1}$ は微分可能であって, $D(f^{-1})$ は

$$D(f^{-1})(y^{\prime}) = T = (Df(x^{\prime}))^{-1}$$

で与えられる. あとは $D(f^{-1})$ が $C(\varepsilon/2)$ 上で連続であることを示せば良い. $D(f^{-1})$ は

  1. $f^{-1}: C(\varepsilon/2) \to C(\varepsilon)$
  2. $Df: C(\varepsilon) \to GL(n, \mathbb{R})$
  3. $GL(n, \mathbb{R})$において逆行列をとる写像

の合成である. ここで, 1が連続であることは先ほど示し, 2は仮定より $C^{r-1}$ 級である. 3について, 逆行列の各成分は小行列式を行列式で割ったものである. 小行列式, 行列式は各成分の和, 差, 積で構成されるから, $C^{\infty}$ 級である. 行列式は $GL(n, \mathbb{R})$ 上で $0$ でないので, その商も $C^{\infty}$ 級である. 従って, $D(f^{-1})$ は連続であり, $f^{-1}$ は$C^1$ 級である.

最後に, $f^{-1}$ が $C^r$ 級であることだが, 先ほどの議論により $f^{-1}$ が $C^{r-1}$ 級であれば $C^{r}$ 級である. よって $f^{-1}$ は $C^r$ 級である. $\Box$

陰関数定理

逆関数定理の証明が長くなってしまいましたが、次は陰関数定理の証明を行います。陰関数定理は $f: A \subset \mathbb{R}^n \to \mathbb{R}^m$, $(n > m)$ についての定理で、逆関数定理と同様、微分が消えないなら局所的に綺麗な形をしているという定理です。具体的には、適当な座標変換のもとで $f$ が $1, \cdots, m$ 成分の射影になること、そして集合 $f^{-1} (b)$ が局所的に $m+1, \cdots, n$ 成分の関数のグラフとして表されるというものです。前者の性質は逆関数定理と同じで、一点での微分がその近傍の様子を決めているということです。後者の性質は、$m$ 個の方程式 $f_i (x) = b_i$ で定まる集合 $(=f^{-1}(b))$ は各点で $f$ の微分のランクが $m$ ならば $n -m$ 次元の多様体になります。逆関数定理にはなかった、$f$ で潰れてしまう部分の性質を決定します。

それでは陰関数定理の証明を行いましょう。

定理. 陰関数定理

$A$ を $\mathbb{R}^n$ の原点 $0$ を含む開集合とし, $f: A \to \mathbb{R}^m$ を $C^r$ 級写像 $(r \ge 1)$ で $f(0) = 0$ とする. ただし $n \ge m$ とする. $f$ の $0$ における微分 $Df(0)$ のランクが $m$ であるとき, $\mathbb{R}^n$ の $0$ の近傍 $U$ と $C^r$ 同相写像 $h: U \to h(U) \subset \mathbb{R}^m$ で次の条件を満たすものが存在する.

  1. $h(U) \subset A$, $h(0) = 0$
  2. $f \circ h (x_1, x_2, \dots, x_n) = (x_1, x_2, \dots, x_m)$

また, $0 \in \mathbb{R}^n$ の近傍 $V \times W$ $(V \subset \mathbb{R}^m, W \subset \mathbb{R}^{n-m})$ と $C^r$ 級写像 $g: W \to V$ が存在し, $f(p_1, p_2) = 0 \Leftrightarrow p_1 = g(p_2)$ $(p_1 \in V, p_2 \in W)$ を満たす.

証明) 必要があれば $\mathbb{R}^n$ の座標の順序を変えることで, 仮定から

$$\left| \frac{\partial (f_1, \dots, f_n)}{\partial (x_1, \dots, x_n)} \right| \neq 0$$

として良い. $\bar{f}: A \to \mathbb{R}^n$ を

$$ \bar{f} (x) = (f_1(x), \dots, f_m(x), x_{m+1}, \dots, x_n)$$

と定義する. $D\bar{f}(0) \neq 0$ なので, 逆関数定理から $\mathbb{R}^n$ における原点 $0$ の近傍 $U^{\prime} \subset A$ で $\bar{f} |_{U^{\prime}}: U^{\prime} \to \bar{f}(U^{\prime})$ が $C^r$ 同相写像となるものが存在する. よって $U = \bar{f} (U^{\prime})$, $h = (f |_{U})^{-1}$ とおくと, $x \in U$ に対して

$$\bar{f} \circ h (x) = x$$

である. $\pi: \mathbb{R}^n \to \mathbb{R}^m$ を最初の $m$ 成分の射影とすると, $f = \pi \circ \bar{f}$ だから,

$$f \circ h (x_1, \dots, x_n) = \pi \circ \bar{f} \circ h (x_1, \dots, x_n) = (x_1, \dots, x_m)$$

となる.

$V \subset \mathbb{R}^m$, $W \subset \mathbb{R}^{n-m}$ を, $V \times W \subset U^{\prime}$ を満たす開集合とする. $p_1 \in V$, $p_2 \in W$ が $f(p_1, p_2) = 0$ を満たすとする. このとき, $h = \bar{f}^{-1}$ だから

$$(p_1, p_2) = h \circ \bar{f} (p_1, p_2) = h(0, p_2) = (h_1(0, p_2), \dots, h_m(0, p_2), p_2)$$

を満たす.

$$g(p_2) = (h_1(0, p_2), \dots, h_m(0, p_2))$$

とおけば,

$$p_1 = g(p_2)$$

である. 逆に, 定義から

$$f(g(p_2), p_2) = f \circ h (0, p_2) = 0$$

を満たす. $g$ が $C^r$ 級であることは $h$ が $C^r$ 級であることから従う.$\Box$

正則値定理

最後に、陰関数定理の簡単な応用として正則値定理を証明します。その準備として正則値、臨界値の定義をします。$N$, $M$ を $C^r$ 多様体とし、$f: N \to M$ を $C^r$ 写像とします。点 $p \in N$ における微分 $Df(p): T_pN \to T_{f(p)}$ が全射のとき、$p$ を正則点、そうでないとき臨界点といいます。また、$q \in M$ は、$f^{-1}(q)$ に臨界点が含まれないとき正則値、含まれるとき臨界値と言います。

定理. 正則値定理

$N$, $M$ を $C^r$ 多様体で, それぞれの次元は $n$, $m$, $(n > m)$ であるとする. また, $f: N \to M$ を $C^r$ 写像とする. $q \in M$ が $f^{-1}(q) \neq \emptyset$ でかつ正則値であるならば, $f^{-1}(q)$ は $M$ の $n -m$ 次元部分多様体である.

証明) 微分が全射であることとランクが $m$ であることは同値である. $f^{-1}(q)$ の各点において陰関数定理を適用すると, その点の周りの座標系が得られる. $\Box$

この後の発展として、モース理論や高次元ポアンカレ予想の証明などが挙げられます。モース理論では多様体 $M$ 上の関数 $f$ ($M \to \mathbb{R}$ と見る) の正則点や臨界点の周り様子を詳しく調べることで $M$ の位相的性質を分析します。正則点の周りの構造は単純で、臨界値を跨がない限り正則値 $v$ の逆像 $f^{-1}(v)$ は同相になります。臨界値を跨がなければ、ベクトル場 $grad(f)$ のフローに沿った積分曲線により同相写像を得ることができます。臨界値を跨ぐときに $f^{-1}(v)$ の構造が変化しますが、それを詳しく調べるのが理論のポイントです。そこからさらに、ホモロジーの情報をもとに構造を単純化していくと高次元ポアンカレ予想の証明ができます。

逆関数定理の証明を詳しく書いている記事がなかったので書いてみましたが、予想通りかなり長くなってしまいました。逆関数定理と陰関数定理の証明は [田村] を大いに参考にしました。[田村] は高次元ポアンカレ予想の証明やエキゾチック微分構造など面白いトピックについて詳しく書かれている本です。学生のころに古本屋で見つけて必死に読んでいた記憶があります (今見ると難しくて正直なところ読む気力がおきません)。新装版が出ているようなので、興味がある方は読んでみてください。

参考文献

[田村] 田村 一郎. 微分位相幾何学