Prokhorov 距離と可分性、完備性、コンパクト性の遺伝

距離空間 $(S, d)$ 上の Borel 確率測度全体の集合 $\mathcal{P}(S)$ には距離を定義することができ、元の距離空間のいくつかの特徴を引き継ぐことが知られています。例えば、可分性や完備性、コンパクト性を引き継ぐことが知られています。

本記事は以下の記事の続きです。あまりにも長いので分離しました (2023/03/11)。

距離空間上の Borel 確率測度全体は距離空間になる

前記事では $\mathcal{P}(S)$ が Prokhorov 距離 $d_P$ により距離空間になることを説明しました。本記事では、可分性や完備性、コンパクト性が引き継がれることを説明します。

可分性について

距離空間 $(S, d)$ が可分であることと $(\mathcal{P}(S), d_P)$ が可分であることは同値になります。これを確認しましょう。

$S$ が可分 $\Rightarrow$ $\mathcal{P}(S)$ が可分

$(S, d)$ が可分ならば $(\mathcal{P}(S), d_P)$ も可分になります。これを確認しましょう。

$S$ の可算稠密部分集合を $E = \{e_1, e_2, \cdots\}$ とします。

$$\mathcal{M} = \{\sum_{i=1}^k \alpha_i \delta_{e_i} \mid \alpha_i \in \mathbb{Q} \cap [0, 1], \ \sum_{i=1}^k \alpha_i = 1,\ k \in \mathbb{N} \}$$

とおくと、$\mathcal{M}$ は $\mathcal{P}(S)$ の可算部分集合です。これが稠密であることを示します。

$E$ が稠密なので、任意の $n > 1$ に対し

$$X = \bigcup_{i = 1}^{\infty} B(e_i, \frac{1}{n})$$

を満たします。$\mu \in \mathcal{P}(S)$ を 1 つ固定すると、$k_n$ を十分大きくとれば、

$$\mu \left(\bigcup_{i = 1}^{k_n} B(e_i, \frac{1}{n})\right) > 1 -\frac{1}{n}$$

を満たします。さらに

$$A_j^n = B(e_j, \frac{1}{n}) \setminus \bigcup_{i=1}^{j-1} B(e_i, \frac{1}{n}) \quad (1 \leq j \leq k_n)$$

とおけば、$\bigcup_{i=1}^j A_j^n = \bigcup_{i=1}^j B(e_i, \frac{1}{n})$ かつ $j \neq l$ なら $A_j^n \cap A_l^n = \varnothing$ となります。特に

$$1 -\frac{1}{n} < \sum_{i=1}^{k_n} \mu(A_i^n) \leq 1$$

となります。このとき、

$$\alpha_i^n = \frac{\mu(A_i^n)}{\sum_{j=1}^{k_n} \mu(A_j^n)}$$

とおくと $0 \leq \alpha_i^n \leq 1$ なので、 $\overline{\alpha}_i^n \in \mathbb{Q} \cap [0, 1]$ で $|\alpha_i^n -\overline{\alpha}_i^n| \leq \mu(A_i^n) / n$ を満たすものが存在します ($\mu(A_i^n) = 0$ なら $\overline{\alpha}_i^n = 0$ となります)。

$$\mu_n = \sum_{i = 1}^{k_n}\overline{\alpha}_i^n \delta_{e_i}$$

とおくと、$\mu_n \in \mathcal{M}$ となります。

$\mu_n$ が $\mu$ に弱収束することを示します。その前に準備として $|\overline{\alpha}^n_i -\mu(A_i^n)|$ を計算すると

\begin{align} & |\overline{\alpha}^n_i -\mu(A_i^n)| &&\\ = \ & \left| \frac{\mu(A_i^n)}{\sum_{j=1}^{k_n} \mu(A_j^n)} -\mu(A_i^n) \right| + |\alpha_i^n -\overline{\alpha}_i^n| &&\\ \leq \ & \mu(A_i^n) \left(\frac{1}{\sum_{j=1}^{k_n} \mu(A_j^n)} -1 \right) + \frac{\mu(A_i^n)}{n} &&\\ \leq \ & \mu(A_i^n) \left(\frac{1}{1 -\frac{1}{n}} -1 \right) + \frac{\mu(A_i^n)}{n} &&(1 -\frac{1}{n} < \sum_{j=1}^{k_n} \mu(A_j^n) \textrm{ から}) \\ = \ & \mu(A_i^n)\left(\frac{n}{n -1} -1 \right) + \frac{\mu(A_i^n)}{n} \\ = \ & \frac{\mu(A_i^n)}{n -1} + \frac{\mu(A_i^n)}{n} \\ \leq \ & \frac{2 \mu(A_i^n)}{n -1} \end{align}

となります。$f \in C_b(S) \cap C_u(S)$ とし、$M = \max_{x \in S} f(x)$ とおくと、

\begin{align} & \left|\int_S f d \mu -\int_S f d \mu_n \right| \\ = \ & \left|\int_S f d \mu -\sum_{i=1}^{k_n} \overline{\alpha}^n_i f(e_i) \right| \\ \leq \ & \left|\int_S f d \mu -\sum_{i=1}^{k_n} \mu(A_i^n) f(e_i) \right| + \left|\sum_{i=1}^{k_n} \mu(A_i^n) f(e_i) -\sum_{i=1}^{k_n} \overline{\alpha}^n_i f(e_i) \right| \\ \leq \ & \left|\int_S f d \mu -\int_S \sum_{i=1}^{k_n} f(e_i) 1_{A_i^n} d\mu \right| + \left|\sum_{i=1}^{k_n} (\mu(A_i^n) -\overline{\alpha}^n_i) f(e_i) \right| \\ \leq \ & \left|\sum_{i=1}^{k_n} \int_S (f 1_{A_i^n} -f(e_i) 1_{A_i^n})d \mu + \int_S f 1_{(\bigcup_{i=1}^{k_n} A_i^n)^c} d\mu \right| + M \left|\frac{2 \sum_{i=1}^{k_n} \mu(A_i^n)}{n -1} \right| \\ \leq \ & \sum_{i=1}^{k_n} \sup_{x \in A_i^n}|f(x) -f(e_i)| \mu(A_i^n) + M \mu((\bigcup_{i=1}^{k_n} A_i^n)^c) + \frac{2 M}{n -1} \\ \leq \ & \sum_{i=1}^{k_n} \sup_{x \in A_i^n}|f(x) -f(e_i)| \mu(A_i^n) + \frac{3M}{n -1} \end{align}

となります。また、$f \in C_u(S)$ なので任意の $\varepsilon > 0$ に対して $n$ を十分大きくとれば、$d(x, y) < 1/n$ を満たす任意の $x, y \in S$ に対して $|f(x) -f(y)| < \varepsilon$ となります。$x \in A_i^n$ ならば $d(x, e_i) < 1 / n$ なので

$$\sup_{x \in A_i^n}|f(x) -f(e_i)| < \varepsilon$$

であり、

$$\left|\int_S f d \mu -\int_S f d \mu_n \right| \leq \varepsilon + \frac{3M}{n -1}$$

となります。よって $\mu_n$ は $\mu$ に弱収束します。よって $\mathcal{M}$ は $\mathcal{P}(S)$ の可算稠密部分集合であり、$\mathcal{P}(S)$ は可分です。

特に、デルタ測度の凸結合で表される測度の集合は $\mathcal{P}(S)$ 内で稠密になります。これは統計学においては重要な事実だと思われます。

$S$ が可分 $\Leftarrow$ $\mathcal{P}(S)$ が可分

逆に、$\mathcal{M}(S)$ が可分であれば、$S$ も可分になります。これは距離空間の性質のみでわかります。可分距離空間の部分集合が可分でなので、埋め込み $\iota: S \to \mathcal{M}(S)$ が存在することからわかります。

これで $S$ が可分であることと $\mathcal{P}(S)$ が可分であることが同値であることがわかりました。

補足: $S$ が可分 $\Rightarrow$ $\mathcal{M}^+_{\mathbb{R}}(S)$ が可分

$\mathcal{M}^+_{\mathbb{R}}(S)$ を $S$ 上の有限 Borel 測度全体とします。このとき、$S$ の稠密可算部分集合 $E = \{e_1, e_2, \cdots\}$ に対して

$$\mathcal{M} = \{\sum_{i=1}^k \alpha_i \delta_{e_i} \mid \alpha_i \in \mathbb{Q} \cap [0, \infty), \ k \in \mathbb{N} \}$$

とおくと、$\mathcal{M}$ は $\mathcal{M}^+_{\mathbb{R}}(S)$ の可算部分集合で、任意の $\mu \in \mathcal{M}^+_{\mathbb{R}}(S)$ に対して $\mu$ に弱収束する $\mathcal{M}$ の点列 $\{\mu_n\}$ が存在します。証明は $\mathcal{P}(S)$ のときとほぼ同様です。

$A_i^n$ を $\mathcal{P}(S)$ の証明のときと同様にとると、

$$\left(1 -\frac{1}{n}\right)\mu(S) < \sum_{i =1}^{k_n} \mu(A_i^n) < \mu(S)$$

を満たします。$\alpha_i^n \in \mathbb{Q}$ を

$$|\alpha_i^n -\mu(A_i^n)| \leq \frac{\mu(A_i^n)}{n}$$

を満たすように取ります。このとき

$$\mu_n = \sum_{i = i}^{k_n} \alpha_i^n \delta_{e_i}$$

とおくと、$\mu_n \in \mathcal{M}$ になります。このとき、任意の $f \in C_b(S) \cap C_u(S)$ に対して、$M = \max_{x \in S}f(s)$ とおくと

\begin{align} & \left|\int_S f d \mu -\int_S f d \mu_n \right| \\ = \ & \left|\int_S f d \mu -\sum_{i=1}^{k_n} \alpha^n_i f(e_i) \right| \\ \leq \ & \left|\int_S f d \mu -\sum_{i=1}^{k_n} \mu(A_i^n) f(e_i) \right| + \left|\sum_{i=1}^{k_n} \mu(A_i^n) f(e_i) -\sum_{i=1}^{k_n} \alpha^n_i f(e_i) \right| \\ \leq \ & \sum_{i=1}^{k_n} \sup_{x \in A_i^n}|f(x) -f(e_i)| \mu(A_i^n) + \frac{M \mu(S)}{n} + \frac{M\mu(S)}{n} \end{align}

となります。$f$ が一様連続なので $A_i^n$ の取り方から、任意の $i$ に対して

$$\sup_{x \in A_i^n}|f(x) -f(e_i)| < \varepsilon$$

とできます。よって

$$\left|\int_S f d \mu -\int_S f d \mu_n \right| \leq \left(\varepsilon + \frac{2M}{n} \right)\mu(S)$$

となり、$\mu_n$ は $\mu$ に弱収束します。

$\mathcal{M}^+_{\mathbb{R}}(S)$ の位相に言及していませんでしたが、弱位相という位相のもとで可分になります。弱位相については必要なときに説明します。

コンパクト性について

距離空間 $(S, d)$ がコンパクトであることと $\mathcal{P}(S)$ がコンパクトであることが同値になります。これを確認しましょう。

$S$ がコンパクト $\Rightarrow$ $\mathcal{P}(S)$ がコンパクト

ほぼ関数解析的な議論になります。$\mathcal{M}(S)$ を有限複素 Borel 測度全体とし、$\mathcal{R}(S)$ を有限複素 Radon 測度全体とします。この項での議論は $S$ が距離空間でなくとも、$\mathcal{M}(S) = \mathcal{R}(S)$ あれば成立します。また、Borel 確率測度の代わりに Radon 確率測度のみを考えれば、一般のコンパクトハウスドルフ空間で成立します。

$S$ がコンパクト距離空間なので $C_0(S) = C_b(S) = C(S)$ であり、かつ $\mathcal{M}(S) = \mathcal{R}(S)$ となります。よって Riesz-Markov-角谷の表現定理から $\mathcal{M}(S) = C(S)^*$ となります。さらに Alaoglu の定理から

$$\mathcal{M}_1(S) = \{\mu \in \mathcal{M}(S) \mid ||\mu||_{var} \leq 1\}$$

はコンパクトになります。

もし $\mathcal{P}(S) \subset \mathcal{M}_1(S)$ が閉集合であれば、コンパクト空間上の閉集合はコンパクトなので $\mathcal{P}(S)$ はコンパクトになります。従って、$\mathcal{P}(S)$ が閉集合であることを示せば十分です。

同型 $\mathcal{M}(S) \ni \mu \mapsto \varphi_{\mu} \in C(S)^*$ は

$$\varphi_{\mu}(f) = \int_S f d \mu \in \mathbb{C}$$

で与えられます。ここで、$\mu \in \mathcal{M}(S)$ が任意の非負実数値連続関数 $f \geq 0$ に対して $\varphi_{\mu}(f) \geq 0$ ならば、$\mu$ は測度であることを確認しましょう。

任意の閉集合 $F \in \mathfrak{B}_S$ に対して、(弱収束の一意性の証明時に用いたように) 非負実数値連続関数の減少列 $\{f_n\}$ で $f_n \to 1_F$ を満たすものが存在します。この $\{f_n\}$ に対してルベーグの収束定理から

$$\lim_{n \to \infty} \int_S f_n d\mu = \mu(F)$$

となります。$f_n$ の取り方から $\int_S f_n d\mu \geq 0$ なので $\mu(F) \geq 0$ となります。$\mu$ の正則性から任意の $A \in \mathfrak{B}_S$ に対して $\mu(A) \geq 0$ になります。よって $\mu$ は測度になります。

$\mu$ が測度であれば、$||\mu||_{var} = \varphi_{\mu}(1_S) = \mu(S)$ なので、$\varphi_{\mu}(1_S) = 1$ であることと確率測度であることは同値です。よって

$$\mathcal{P}(S) = \{\mu \in \mathcal{M}(S) \mid \varphi_{\mu}(1_S) = 1 \textrm{ かつ } f \geq 0 \textrm{ に対して } \varphi_{\mu}(f) \geq 0\}$$

となります。ここで、$f \in C(S)$ に対して $\tau(f): \mathcal{M}(S) \to \mathbb{C}$ を

$$\tau(f)(\mu) = \varphi_{\mu}(f) = \int_S f d \mu$$

とおくと、

$$\mathcal{P}(S) = \tau(1_S)^{-1}(\{1\}) \cap \bigcap_{f \in C(S), f \geq 0} \tau(f)^{-1}([0, \infty))$$

と表されます。$*$ 弱位相の定義から任意の $f \in C(S)$ に対して $\tau(f)$ は連続なので、$I \subset \mathbb{C}$ が閉集合ならば $\tau(f)^{-1}(I)$ も閉集合です。よって $\mathcal{P}(S)$ が閉集合であることがわかります。

これで $S$ がコンパクトならば $\mathcal{P}(S)$ はコンパクトであることがわかりました。

$S$ がコンパクト $\Leftarrow$ $\mathcal{P}(S)$ がコンパクト

埋め込み $\iota: S \to \mathcal{P}(S)$ が存在するため、$\mathcal{P}(S)$ がコンパクトで $\iota(S)$ が閉集合であれば、$S$ もコンパクトになります。よって $\iota(S)$ が閉集合であることを示しましょう。

任意の $S$ の点列 $\{x_n\}_n$ に対して、 $\delta_{x_n}$ がある $\mu \in \mathcal{P}(S)$ に距離 $d_P$ で収束すれば、$\mu \in \iota(S)$ であることを示しましょう。そうであれば $\overline{\iota(S)} = \iota(S)$ なので $\iota(S)$ は閉集合になります。

$\{x_n\}_n$ が収束する部分列を持たないとし、

$$A = \{x_1, x_2, \dots \}$$

とおきます。このとき $\overline{A} = A$ から $A$ は閉集合です。さらに

\begin{align} C_1 & = \{x_1, x_3, \dots, x_{2n -1}, \dots\}, \\ C_2 &= \{x_2, x_4, \dots, x_{2n}, \dots\} \end{align}

とおくと、$A = C_1 \cup C_2$ であり、$A$ と同様の理由で $C_1$, $C_2$ も閉集合です。$\delta_{x_n}$ は距離 $d_P$ で $\mu$ に収束するので、$\mu$ に弱収束します。よって

$$\mu(C_i) \leq \limsup_{n \to \infty} \delta_{x_n}(C_i) = 1 $$

となりますが、$\mu(A) = \mu(C_1) + \mu(C_2) \leq 2$ となり、$\mu$ が確率測度であることに反します。よって $\{x_n\}_n$ は収束する部分列を持ちます。

$\{x_n\}_n$ の部分列 $\{x_{k_n}\}$ が$x \in S$ に収束するとします。このとき、$\delta_{x_{k_n}} \to \delta_x$ であり、さらに $\delta_{x_{k_n}}$ が $\delta_{x_n}$ の部分列であることから $\delta_{x_{k_n}} \to \mu$ となります。よって $\mu = \delta_x \in \iota(S)$ となります。

以上で $S$ がコンパクトであることと $\mathcal{P}(S)$ がコンパクトであることが同値であることがわかりました。

Prokhorov の定理

完備性について述べる前に、準備として Prokhorov の定理を証明します。

$\Gamma$ を $\mathcal{P}(S)$ の部分集合とします。任意の $\varepsilon > 0$ に対して $S$ のコンパクト集合 $K$ が存在して、任意の $\mu \in \Gamma$ に対して

$$\mu(K) \geq 1 -\varepsilon$$

を満たすとき、$\Gamma$ はタイトであるといいます。

距離空間 $(S, d)$ が可分であるとき、$\Gamma \subset \mathcal{P}(S)$ に対して以下の (1) $\Rightarrow$ (2) が成り立ちます。$(S, d)$ が完備ならば (1) と (2) は同値になります。

  1. $\Gamma$ はタイトである。
  2. $\Gamma$ は相対コンパクトである。つまり $\overline{\Gamma}$ はコンパクトである。

これを Prokhorov の定理といいます。

この定理は、例えば点列の極限の存在の確認に用いられます。 $\mathcal{P}(S)$ 上の点列 $\{\mu_n\}_n$ があったとして、$\Gamma = \{\mu_1, \mu_2, \cdots\}$ がタイトであれば、$\overline{\Gamma}$ がコンパクトであることから、点列 $\{\mu_n\}_n$ は収束する部分列を持ちます。本記事で用いるのは (1) $\Rightarrow$ (2) のみですが、別の記事で逆も使うので証明します。

それでは Prokhorov の定理を証明します。

タイト $\Rightarrow$ 相対コンパクト

$S$ のコンパクト化 $\psi: S \hookrightarrow \gamma S$ で、$\gamma S$ が距離空間であるものが存在します (準備記事を参照してください)。その距離を $d_{\gamma}$ とおくと、$(\psi(S), d_{\gamma})$ と $(S, d)$ は同相になります (同値な距離でなくても良い)。$\gamma S$ はコンパクトなので $\mathcal{P}(\gamma S)$ もコンパクトであり、像測度をとる写像

$$\psi_*: \mathcal{P}(S) \hookrightarrow \mathcal{P}(\gamma S)$$

を考えると、任意の $\Gamma \subset \mathcal{P}(S)$ に対して $\overline{\psi_*(\Gamma)} \subset \mathcal{P}(\gamma S)$ はコンパクトになります。よって $\Gamma$ の点列 $\{\mu_n\}_n$ が存在して $\psi_*(\mu_n)$ はある $\nu \in \mathcal{P}(\gamma S)$ に弱収束します。この $\nu$ に対して $\psi_*(\mu) = \nu$ となる $\mu \in \mathcal{P}(S)$ を構成し、$\mu_n$ が $\mu$ に弱収束することを示します。それによって $\overline{\Gamma}$ が点列コンパクトであることがわかり、$\mathcal{P}(S)$ は距離空間なので $\overline{\Gamma}$ がコンパクトであることがわかります。

$\Gamma \subset \mathcal{P}(S)$ がタイトであるとします。 このとき、任意の $N \geq 1$ に対してコンパクト集合 $K_N \subset S$ が存在して、任意の $\mu_n$ に対して

$$\mu_n(K_N) = 1 -\frac{1}{N}$$

が成り立ちます。コンパクト集合の連続像はコンパクトなので $\psi(K_N)$ はコンパクトであり、さらに $\gamma S$ はコンパクトなので $\psi(K_N)$ は閉集合になります。$\psi_*(\mu_n)$ は $\nu$ に弱収束するので、

\begin{align} \nu(\psi(K_N)) & \geq \ \limsup_{n \to \infty} \psi_*(\mu_n)(\psi(K_N)) \\ & = \ \limsup_{n \to \infty} \mu_n(K_N) \\ & = \ 1 -\frac{1}{N} \end{align}

となります。よって $S_0 = \bigcup_{N = 1}^{\infty} K_N$ とおけば、

$$\psi(S_0) = \bigcup_{N=1}^{\infty} \psi(K_N) \in \mathfrak{B}_{\gamma S}$$

であり、$\nu(\psi(S_0)) = 1$ となります。この $S_0$ を用いて $\psi(\mu) = \nu$ を満たす $\mu \in \mathfrak{B}_S$ を構成します。

その準備として $A \in \mathfrak{B}_S$ に対して $\psi(A \cap S_0) \in \mathfrak{B}_{\gamma S}$ であることを確認しましょう。そのためには、

$$\mathfrak{F} = \{A \in \mathfrak{B}_S \mid \psi(A \cap S_0)\}$$

とおいて、$\mathfrak{F} = \mathfrak{B}_S$ であることを示せば十分です。$A \in \mathfrak{B}_S$ が閉集合の場合は、$A \cap K_N$ はコンパクトであり、$\psi(A \cap K_N)$ もコンパクトになります。よって $\psi(A \cap K_N)$ は閉集合であり、

$$\psi(A \cap S_0) = \bigcup_{N = 1}^{\infty} \psi(A \cap K_N) \in \mathfrak{B}_{\gamma S}$$

となります。したがって $\mathfrak{F}$ は任意の閉集合を含みます。

また、任意の $A \in \mathfrak{F}$ に対して

\begin{align} \psi((S \setminus A) \cap S_0) &= \psi(S_0 \setminus A) \\ & = \psi(S_0) \setminus \psi(S_0 \cap A) \\ & \in \mathfrak{B}_{\gamma S} \end{align}

が成り立つので、$S \setminus A \in \mathfrak{F}$ となります。

さらに、$A_k \in \mathfrak{F}$ に対して

$$\psi(\bigcup_{k=1}^{\infty} A_k \cap S_0) = \bigcup_{k=1}^{\infty} \psi(A_k \cap S_0)$$

が成り立つことから、$\bigcup_{k=1}^{\infty} A_k \in \mathfrak{F}$ となります。よって $\mathfrak{F}$ は全ての閉集合を含む $\sigma$-加法族であり、$\mathfrak{F} = \mathfrak{B}_S$ となります。

以上から、$\mu(A) = \nu(\psi(A \cap S_0))$ とおくと $\mu$ は $S$ 上の確率測度になります。このとき、任意の閉集合 $F \in S$ に対して $\psi(F) = Z \cap \psi(S)$ となる閉集合 $Z \subset \gamma S$ をとると、$\psi^{-1}(Z) = F$ であり、

\begin{align} \limsup_{n \to \infty} \mu_n(F) & \ = \limsup_{n \to \infty} \psi_*(\mu_n)(Z) \\ & \ \leq \nu(Z) \\ & \ = \nu(Z \cap \psi(S_0)) + \nu(Z \cap (\gamma S \setminus \psi(S_0))) \\ & \ = \mu(F) \end{align}

となります。よって $\mu_n$ は $\mu$ に弱収束し、$\overline{\Gamma}$ がコンパクトであることがわかりました。

相対コンパクト $\Rightarrow$ タイト

$S$ を完備距離空間とし、$\overline{\Gamma}$ はコンパクトであるとします。

$U_1, U_2, \cdots$ を $X$ の開被覆としたとき、任意の $\varepsilon > 0$ に対して $k \in \mathbb{N}$ が存在して、任意の $\mu \in \Gamma$ に対して

$$\mu \left(\bigcup_{i = 1}^k U_i \right) > 1 -\varepsilon$$

とできます。これを示すために、任意の $k \in \mathbb{N}$ に対して $\mu_k \in \Gamma$ が存在して

$$\mu_k \left(\bigcup_{i = 1}^k U_i \right) \leq 1 -\varepsilon$$

を満たすとします。$\overline{\Gamma}$ はコンパクトなので、$\{\mu_k\}_{k=1}^{\infty}$ の部分列で、$\mu \in \overline{\Gamma}$ に弱収束するものが存在します。このとき、任意の $n > 1$ に対して

\begin{align} \mu \left(\bigcup_{i=1}^n U_i \right) &\leq \liminf_{j \to \infty} \mu_{k_j} \left(\bigcup_{i=1}^n U_i \right) \\ & \leq \liminf_{j \to \infty} \mu_{k_j} \left(\bigcup_{i=1}^{k_j} U_i \right) \\ & \leq 1 -\varepsilon \end{align}

となりますが、$\bigcup_{i=1}^{\infty} U_i = X$ から

$$\mu \left(\bigcup_{i=1}^n U_i \right) \to \mu(S) = 1 \quad (n \to \infty)$$

なので矛盾します。

ここで $E = \{e_1, e_2, \dots\}$ を $S$ の可算稠密部分集合とし、$k_m \in \mathbb{N}$ を、任意の $\mu \in \Gamma$ に対して

$$\mu \left(\bigcup_{i=1}^{k_m} B(e_i, \frac{1}{m}) \right) > 1 -\frac{\varepsilon}{2^m}$$

を満たすように取ります。このとき

$$K = \bigcap_{m=1}^{\infty} \bigcup_{i=1}^{k_m} \overline{B}(e_i, \frac{1}{m})$$

とおくと、可分完備距離空間上の有限 Borel 測度の正則性を示したときと同様に、$K$ がコンパクトであることがわかります。よって

\begin{align} \mu(X \setminus K) &= \mu\left(\bigcup_{m=1}^{\infty} \left( \bigcup_{i=1}^{k_m} \overline{B}(e_i, \frac{1}{m}) \right)^c \right) \\ & \leq \sum_{m=1}^{\infty} \mu \left(\left( \bigcup_{i=1}^{k_m} \overline{B}(e_i, \frac{1}{m}) \right)^c \right) \\ &= \sum_{m=1}^{\infty} \left(1 -\mu \left( \bigcup_{i=1}^{k_m} \overline{B}(e_i, \frac{1}{m}) \right) \right) \\ & < \sum_{m=1}^{\infty} \frac{\varepsilon}{2^m} \\ &= \varepsilon \end{align}

となり、$\Gamma$ がタイトであることがわかります。

完備性について

$S$ が可分であれば、$S$ が完備であることと $\mathcal{P}(S)$ が完備であることは同値になります。

$S$ が可分完備 $\Rightarrow$ $\mathcal{P}(S)$ が可分完備

$(S, d)$ を可分完備とします。このとき、$\mathcal{P}(S)$ が可分であることはすでに確認しました。$\mathcal{P}(S)$ が完備であることを示します。

$\{\mu_n\}_n$ を $(\mathcal{P}(S), d_P)$ におけるコーシー列とします。

$$\Gamma = \{\mu_1, \mu_2, \cdots\}$$

とおいて、$\Gamma$ がタイトであることを示せば、$\mu_n$ が収束することがわかります。

$\varepsilon > 0$ と $\delta > 0$ を十分小さく取り、

$$\gamma = \frac{\min\{\varepsilon, \delta\}}{2}$$

とおきます。

コーシー列の定義から、ある $N > 1$ が存在して、$k, l \geq N$ ならば

$$d_P(\mu_k, \mu_l) < \gamma$$

が成り立ちます。このとき $d_P$ 定義から、任意の $A \in \mathfrak{B}_S$ に対して

\begin{align} \mu_k(A) & \leq \mu_l(A_{< \gamma}) + \gamma, \\ \mu_l(A) & \leq \mu_k(A_{< \gamma}) + \gamma \end{align}

が成り立ちます。$E = \{e_1, e_2, \cdots\}$ を $S$ の可算稠密部分集合すると、ある $M > 1$ が存在して、$1 \leq k \leq N$ に対して

$$\mu_k \left(\bigcup_{i=1}^{M} B(e_i, \delta / 2) \right) \geq 1 -\gamma$$

となります。このとき、任意の $k \geq N$ に対しては、

$$\left(\bigcup_{i=1}^M B(e_i, \delta / 2) \right)_{< \gamma} \subset \bigcup_{i=1}^M B(e_i, \delta / 2 + \gamma) \subset \bigcup_{i=1}^M B(e_i, \delta)$$

から

\begin{align} \mu_N \left(\bigcup_{i=1}^M B(e_i, \delta / 2) \right) & \leq \mu_k \left( \left(\bigcup_{i=1}^M B(e_i, \delta / 2)\right)_{< \gamma} \right) + \gamma \\ & \leq \mu_k \left(\bigcup_{i=1}^M B(e_i, \delta) \right) + \gamma \end{align}

が成り立ちます。よって

$$ \mu_k \left(\bigcup_{i=1}^M B(e_i, \delta) \right) \geq 1 -2\gamma \geq 1 -\varepsilon $$

が成り立ちます。$1 \leq k \leq N$ に対しても、

$$\mu_k \left(\bigcup_{i=1}^M B(e_i, \delta) \right) \geq \mu_k \left(\bigcup_{i=1}^M B(e_i, \delta/2) \right) \geq 1 -\gamma \geq 1 -\varepsilon$$

が成り立つので、任意の $\varepsilon, \delta > 0$ に対して有限個の点 $\{e_1, \cdots, e_M\}$ が存在して、任意の $\mu \in \Gamma$ に対して

$$\mu \left(\bigcup_{i=1}^M B(e_i, \delta) \right) \geq 1 -\varepsilon$$

が成り立つことがわかりました。$\bigcup_{i=1}^M B(e_i, \delta)$ をコンパクト集合に置き換えられれば、$\Gamma$ がタイトであることが示されます。

任意の $m \geq 1$ に対して、有限個の点 $\{e_1^m, e_2^m, \cdots, e_{n_m}^m\}$ で、任意の $\mu \in \Gamma$ に対して

$$\mu \left(\bigcup_{i=1}^{n_m} B(e_i, \frac{1}{m}) \right) > 1 -\frac{\varepsilon}{2^{m}}$$

を満たすように取ります。このとき

$$K = \bigcap_{m = 1}^{\infty} \left( \bigcup_{i = 1}^{n_m} \overline{B}(e_i, 1 / m) \right)$$

とおくと、可分完備距離空間上の有限 Borel 測度の正則性を示したときと同様に、$K$ がコンパクトであることがわかります。任意の $\mu \in \Gamma$ に対して

\begin{align} \mu(K) & = \lim_{M \to \infty} \mu \left( \bigcap_{m = 1}^{M} \bigcup_{i = 1}^{n_m} \overline{B}(e_i, 1 / m) \right) \\ &= 1 -\lim_{M \to \infty} \mu \left(\bigcup_{m = 1}^{M} (\bigcup_{i = 1}^{n_m} X \setminus \overline{B}(e_i, 1 / m))\right) \\ & \geq 1 -\lim_{M \to \infty} \sum_{m = 1}^M \mu \left(\bigcup_{i = 1}^{n_m} X \setminus \overline{B}(e_i, 1 / m)\right) \\ & \geq 1 -\sum_{m = 1}^M \frac{\varepsilon}{2^m} \\ & \geq 1 -\varepsilon \end{align}

が成り立ちます。よって $\Gamma$ はタイトになります。

$S$ が可分完備 $\Leftarrow$ $\mathcal{P}(S)$ が可分完備

可分性についてはすでに示しました。

コンパクト性のときの証明と同様に、埋め込み $\iota(S) \subset \mathcal{P}(S)$ が閉集合であることを用います。

$\{x_n\}$ を $S$ 上のコーシー列とします。この時 $\delta_{x_n}$ は $\mathcal{P}(S)$ 上のコーシー列となり、$\mathcal{P}(S)$ が完備なのである $\mu$ に収束します。$\iota(S)$ は閉集合なので、$\mu \in \iota(S)$ つまりある $x \in S$ が存在して $\mu = \delta_x$ となります。よって $\{x_n\}$ は $x$ に収束し、$S$ は完備になります。

まとめ

$S$ の可分性、完備性、コンパクト性と $\mathcal{P}(S)$ の可分性、完備性、コンパクト性が同値であることを確認しました。

可分完備距離空間はポーランド空間 (Polish space) と呼ばれ、確率論ではよく用いられるようです。本記事の主な目的は sanov の定理の証明の準備ですが、他の話題とも関連があります。

例えば、以下の記事で一般の可測空間の Giry モナドを考えましたが、ポーランド空間の Giry モナドも定義できるようです。

参考文献

[G] Onno van Gaans. Probability measures on metric spaces