距離空間上の Borel 確率測度全体は距離空間になる

距離空間 $(S, d)$ 上の Borel 確率測度全体の集合 $\mathcal{P}(S)$ には距離を定義することができ、元の距離空間のいくつかの特徴を引き継ぐことが知られています。例えば、可分性や完備性、コンパクト性を引き継ぐことが知られています。

大偏差原理は位相的な性質を用いて定式化されるので、$\mathcal{P}(S)$ における大偏差原理、例えば sanov の定理において、上記で述べた性質は重要です。

本記事では $\mathcal{P}(S)$ 上に距離をいれ、$S$ が可分であるときに、その距離による収束が弱収束と一致することを示します。可分性や完備性、コンパクト性を引き継ぐことは別の記事で解説します (記事が長くなったので分離しました 2023/03/11)。

この記事を読むために必要な事前知識は以下の記事にまとめています。

こちらの記事の内容を引用する場合はなるべくリンクを貼るようにします (別タブで開きます)。

測度の弱収束とは

$(S, d)$ を距離空間とし、$\mathcal{M}(S)$ を $S$ 上の複素有限 Borel 測度全体の集合とします。

$\mu_n, \mu \in \mathcal{M}(S)$ $(n = 1, 2, \cdots)$ とします。また、$C_b(S)$ を $S$ 上の有界な複素数値連続関数全体の集合とします。このとき、任意の $f \in C_b(S)$ に対して

$$\lim_{n \to \infty}\int_S f(x) d \mu_n(x) = \int_S f(x) d \mu(x)$$

を満たすとき、$\mu_n$ は $\mu$ に弱収束するといいます。

弱収束は $\mathcal{M}(S)$ の部分集合、特に Borel 確率測度全体の集合 $\mathcal{P}(S)$ や 有限 Borel 測度全体 $\mathcal{M}_{\mathbb{R}}^+(S)$ に対しても同様に定義することができます。有限測度や確率測度のみを考える状況においては、$f$ の実部と虚部を分けて考えることで、実数値関数のみを用いて弱収束を定義しても上記の定義と同値になります。

記事において弱収束の性質を述べるとき、$\mathcal{M}_{\mathbb{R}}^+(S)$ で成り立つ場合はなるべく $\mathcal{M}_{\mathbb{R}}^+(S)$ において証明します。その性質が $\mathcal{P}(S)$ でも成り立つかどうかは都度説明します。

ちなみに $\mathcal{P}(S)$ の列 $\{\mu_n\}_{n=1}^{\infty}$ が $\mu$ に弱収束するとき、$\mu \in \mathcal{P}(S)$ であることは

$$1 = \mu_n(S) = \int_S 1_S d \mu_n \xrightarrow[]{n \to \infty} \int_S 1_S d \mu = \mu(S)$$

であることからわかります。$\mathcal{M}_{\mathbb{R}}^+(S)$ についても同様です。

弱収束の一意性

$\mu, \nu \in \mathcal{M}_{\mathbb{R}}^+(S)$ が $\mu_n$ の弱収束先であれば、$\mu = \nu$ になります。これを確認しましょう。

まずは任意の閉集合 $F$ に対して $\mu(F) = \nu(F)$ を満たすことを示しましょう。もし有界な非負連続関数の減少列 $f_n$ で、$1_F$ に各点収束するものが存在すれば、ルベーグの収束定理から

$$\mu(F) = \lim_{n \to \infty} \int_S f_n d\mu = \lim_{n \to \infty} \int_S f_n d\nu = \nu(F)$$

が成り立ちます。そこで、$\varphi \in C_b(\mathbb{R})$ を

$$\varphi(t) = \begin{cases}1 & (t \leq 0) \\ 1 -t & (0 < t \leq 1) \\ 0 & (t > 1)\end{cases}$$

とおき、閉集合 $F \subset S$ と $n > 0$ に対して

$$f_n(x) = \varphi(n d(x, F))$$

とおきます。すると、$f_n \in C_b(S)$ であり、$x \in F$ のとき $f_n(x) = 1$ かつ $d(x, F) > 1 / n$ のとき $f_n(x) = 0$ になります。$f_n$ が有界な非負連続関数の減少列で、$1_F$ に各点収束するものになります。よって任意の閉集合 $F$ に対して $\mu(F) = \nu(F)$ となります。

距離空間上の有限 Borel 測度の弱内部正則性から、任意の開集合 $U$ に対して

\begin{align} \mu(U) & = \sup \{\mu(F) \mid F \subset U, F \textrm{ は閉集合} \} \\ & = \sup \{\nu(F) \mid F \subset U, F \textrm{ は閉集合} \} \\ & = \nu(U) \end{align}

が成り立ちます。さらに外部正則性から、任意の $A \subset \mathfrak{B}_{S}$ に対して

\begin{align} \mu(A) & = \inf \{\mu(U) \mid A \subset U, U \textrm{ は開集合} \} \\ & = \inf \{\nu(U) \mid A \subset U, U \textrm{ は開集合} \} \\ & = \nu(A) \end{align}

となります。従って弱収束先は一意になります。

$\mathcal{P}(S)$ においても同様に証明できます。

弱収束とノルム収束との関係

$\mu, \nu \in \mathcal{M}_{\mathbb{R}}^+(S)$ には全変動ノルム $||\cdot||_{var}$ により距離が入りますが、弱収束がこの距離による収束よりも弱いことを示しましょう。$\mu_n \in \mathcal{M}_{\mathbb{R}}^+(S)$ が全変動ノルムに関して $\mu$ に収束するとします。このとき、任意の $f \in C_b(S)$ に対して

$$\left| \int_S f d\mu -\int_S f d\mu_n \right| \leq \sup_{x \in S}|f(x)| \ ||\mu -\mu_n ||_{var}$$

ですが、$||\mu -\mu_n ||_{var} \to 0$ なので $\mu_n$ は $\mu$ に弱収束します。

一方 $x \in S$ に収束する $S$ 上の点列 $\{x_n\}$ に対し、デルタ測度の列 $\{\delta_{x_n}\}$ を考えると、任意の $f \in C_b(S)$ に対して

$$\left| \int_S f d\delta_{x} -\int_S f d\delta_{x_n} \right| = |f(x) -f(x_n)| \to 0$$

なので $\{\delta_{x_n}\}$ は $\delta_x$ に弱収束しますが、任意の $n$ に対して $||\delta_x -\delta_{x_n}||_{var} = 2$ なので $\{\delta_{x_n}\}$ は全変動ノルムに関して収束しません。

特にデルタ測度は $\mathcal{P}(S)$ の元なので、$\mathcal{P}(S)$ においても弱収束は全変動ノルムにおける収束よりも弱いです。

なぜ $C_b(S)$ なのか

説明の前に少し準備をします。

$C(S)$ を $S$ 上の複素数値連続関数全体の集合とます。$f \in C(S)$ と $\varepsilon > 0$ に対して

$$S_f(\varepsilon) = \{x \in S \mid |f| \geq \varepsilon\}$$

とおいて

$$C_0(S) = \{f \in C(S) \mid \textrm{任意の } \varepsilon > 0 \textrm{ に対して } S_f(\varepsilon) \textrm{ はコンパクト} \}$$

とおきます。$S$ がコンパクトなら $C_0(S) = C_b(S) = C(S)$ です。

さて、なぜ弱収束の定義に $C_b(S)$ を用いているのかについて説明します。

$\mathcal{M}(S)$ を $S$ 上の複素 Borel 測度全体の集合とすると、$\mathcal{P}(S) \subset \mathcal{M}(S)$ です。$\mathcal{M}(S)$ は全変動ノルムによりノルム空間となるのでした。弱収束の関数解析的な定義に従うと、$\mathcal{M}(S)$ の双対空間が $C_b(S)$ であることが期待されます。しかし、[K], [M] では $\mathcal{M}(S)^*$ はある extremally disconnected (開集合の閉包が開集合) な位相空間 $Y$ が存在し、$Y$ 上の有界連続関数 $C_b(Y)$ に一致すると述べられており、$C_b(S)$ には一致しません。

$S$ のストーンチェックコンパクト化 $i: S \hookrightarrow \beta S$ を考えます。$\beta S$ 上の複素 Radon 測度全体の集合を $\mathcal{R}(\beta S)$ とおくと、Riesz-Markov-角谷の定理から $C_0(\beta S)^* = \mathcal{R}(\beta S)$ となります。$\beta S$ はコンパクトなので $C_0(\beta S) = C(\beta S)$ であり、ストーンチェックコンパクト化の性質から $C(\beta S) = C_b(S)$ なので、$C_b(S)^* = \mathcal{R}(\beta S)$ となります。何らかの方法で $\mathcal{M}(S) \subset \mathcal{R}(\beta S)$ とみなすことができれば、上記の弱収束の定義は、関数解析的には $\mathcal{R}(\beta S)$ における $*$ 弱収束を考えていることになります。

ここで、$\mu \in \mathcal{M}(S)$ に対して像測度 $i_* (\mu) \in \mathcal{M}(\beta S)$ は

$$i_*(\mu)(A) = \mu(i^{-1}(A)) \quad (A \in \mathfrak{B}_{\beta S})$$

で与えられます。これが

  1. 単射であること。
  2. $i_* (\mu) \in \mathcal{R}(\beta S)$ であること。

が示されれば、$i_*: \mathcal{M}(S) \hookrightarrow \mathcal{R}(\beta S)$ となります。

本項では、$S$ が可分完備であるときに上記の1, 2 が成り立つことを示します。$S$ が可分完備なので $\mathcal{M}(S) = \mathcal{R}(S)$ であることに注意します。

単射であること

像測度を与える写像 $i_*: \mathcal{M}(S) \to \mathcal{M}(\beta S)$ が単射であることを確認しましょう。そのためには、$\mu_1, \mu_2 \in \mathcal{M}(S)$ が $i_* (\mu_1) = i_* (\mu_2)$ を満たすとき、$\mu_1 = \mu_2$ であることを示せば良いです。

$F \subset S$ を閉集合すると、$i^{-1}(\overline{i(F)}) = F$ を満たします。実際 $i(F)$ は相対位相で閉集合なので、ある閉集合 $F^{\prime}$ で $i(S) \cap F^{\prime} = i(F)$ を満たすものが存在し、閉包の最小性から $\overline{i(F)} \subset F^{\prime}$ となります。よって

$$i^{-1}(\overline{i(F)}) = i^{-1}(\overline{i(F)} \cap i(S)) = i^{-1}(i(F)) = F$$

となります。$\overline{i(F)} \in \mathfrak{B}_{\beta S}$ なので

$$i_* (\mu_1)(\overline{i(F)}) = i_* (\mu_2)(\overline{i(F)})$$

であり、従って任意の閉集合 $F$ に対して $\mu_1(F) = \mu_2(F)$ が成り立ちます。よって弱内部正則性から任意の開集合 $U$ に対して $\mu_1(U) = \mu_2(U)$ であり、外部正則性から任意の $A \in \mathfrak{B}_S$ に対して $\mu_1(A) = \mu_2(A)$ となります。従って $\mu_1 = \mu_2$ が成り立ちます。

$i_* (\mu) \in \mathcal{R}(\beta S)$ であること

$\mu \in \mathcal{M}(S)$ を測度とします。一般の複素測度 $\mu \in \mathcal{M}(S)$ に対しては、$i_*$ が線形であることと $\mu$ を分解することで示されます。

$i_* (\mu) \in \mathcal{R}(\beta S)$ を示すには、任意の $B \in \mathfrak{B}_{\beta S}$ と $\varepsilon > 0$ に対して開集合 $U^{\prime}$ とコンパクト集合 $K^{\prime}$ で

$$K^{\prime} \subset B \subset U^{\prime}, \quad \mu(U^{\prime} \setminus K^{\prime}) < \varepsilon$$

を満たすものが存在することを示せば十分です。距離空間の有限測度の正則性の証明と同様に、上記の条件を満たす $\beta S$ の Borel 集合の集合を $\mathfrak{G}$ とおいて、$\mathfrak{G} = \mathfrak{B}_{\beta S}$ を示します。

まず、任意の閉集合 $F$ に対して $F \in \mathfrak{G}$ を示します。$\mu$ は正則なので、任意の $n \geq 1$ に対して $\mu(K_n) > 1 -1 /n$ を満たすコンパクト集合 $K_n \subset S$ が存在します。コンパクト集合の連続像はコンパクトなので $i(K_n)$ はコンパクトであり、特に閉集合なので $i(K_n) \in \mathfrak{B}_{\beta S}$ となります。

$F \cap i(S) = \varnothing$ の場合、

$$\varnothing \subset F \subset \beta S \setminus i(K_n), \quad i_*(\mu)(\beta S \setminus i(K_n)) < \frac{1}{n}$$

を満たします。

$F \cap i(S) \neq \varnothing$ の場合、$i$ は連続写像なので $i^{-1}(F)$ は閉集合です。$S$ は距離空間なので、任意の $\varepsilon > 0$ に対して開集合 $U \subset S$ が存在して

$$i^{-1}(F) \subset U, \quad \mu(U \setminus i^{-1}(F)) < \varepsilon$$

が成り立ちます (準備記事参照)。開集合 $U^{\prime} \subset \beta S$ を $U^{\prime} \cap i(S) = i(U)$ を満たす開集合とし、$U^{\prime\prime} = U^{\prime} \cup (\beta S \setminus i(K_n))$ とおくと、

$$F \subset (F \cap i(S)) \cup (\beta S \setminus i(S)) \subset U^{\prime\prime}$$

であり、

$$\mu(U^{\prime\prime} \setminus F) < \varepsilon + \frac{1}{n}$$

となります。$F$ はコンパクト集合上の閉集合なのでコンパクトであり、$F \in \mathfrak{G}$ がわかります。

$X \in \mathfrak{G}$ や $A \in \mathfrak{G}$ に対して $X \setminus A \in \mathfrak{G}$ は明らかです。$A_n \in \mathfrak{G}$ に対して $\bigcup_{n=1}^{\infty} A_n \in \mathfrak{G}$ であれば $\mathfrak{G}$ は全ての閉集合を含む $\sigma$-加法族になり $\mathfrak{B}_{\beta S}$ に一致しますが、これは距離空間の有限測度の正則性の証明と同様に行えば良いです。

以上から、像測度をとることで $\mathcal{M}(S) \subset \mathcal{R}(\beta S)$ とみなせば、上記の弱収束の定義は、関数解析的には $\mathcal{R}(\beta S)$ における $*$ 弱収束を考えていることになります。

ちなみに Borel 測度ではなく Radon 測度に制限すれば、$S$ が可分完備でない場合にも $i_*: \mathcal{R}(S) \hookrightarrow \mathcal{R}(\beta S)$ が成り立ちます。

しかし $S$ が可分完備でない場合に $i_*: \mathcal{M}(S) \hookrightarrow \mathcal{R}(S)$ になるかどうかは確認できませんでした。その場合は弱収束と $\mathcal{R}(\beta S)$ における $*$ 弱収束は異なるかもしれません。

よって確率測度の弱収束を関数解析的に考察することは、本記事では極力避けます。

弱収束と同値な条件

$(S, d)$ 上の一様連続な関数全体を $C_u(S)$ とおきます。また、$\mathfrak{B}_S$ を $S$ のボレル集合族とします。このとき、$\mu_n, \mu \in \mathcal{M}_{\mathbb{R}}^+(S)$ に対して以下の条件はそれぞれ同値です。

  1. $\mu_n$ は $\mu$ に弱収束する。
  2. 任意の $f \in C_b(S) \cap C_u(S)$ で、実数値をとるものに対して
    $$\int_S f(x) d \mu_n(x) \to \int_S f(x) d \mu(x) \quad (n \to \infty)$$
    を満たす。
  3. 任意の $A \in \mathfrak{B}_S$ で $\mu (\partial A) = 0$ を満たすものに対して $$\mu_n(A) \to \mu(A)$$ が成り立つ。

条件 (2) は評価に用いる関数族を小さくできるということですが、$C_u(S)$ は距離の情報を含むので、純粋に位相的なものではありません。条件 (3) は積分を取らなくても測度の値のみで弱収束を判定できるということです。これを証明しましょう。証明の過程で以下の条件も同値であることが示されます。

  • 任意の閉集合 $F \subset S$ に対して
    $$\limsup_{n \to \infty} \mu_n(F) \leq \mu(F)$$
    が成り立つ。

まずは (1) $\Leftrightarrow$ (2) を示しましょう。

(1) $\Leftrightarrow$ (2) であること

(1) $\Rightarrow$ (2) は定義から明らかです。逆を示すために (2) $\Rightarrow$ ($\cdot$) $\Rightarrow$ (1) という経路をとります。

(2) $\Rightarrow$ ($\cdot$)

(2) $\Rightarrow$ ($\cdot$) を示します。弱収束の一意性を示したときのように、有界な非負連続関数の減少列で、$1_F$ に各点収束するものを取ります。取り方から $f_k \in C_b(S) \cap C_u(S)$ です。$f_k \geq 1_F$ なので

$$\int_S f_k d \mu_n \geq \mu_n(F)$$

となります。$n \to \infty$ とすると、(2) から

$$\int_S f_k d \mu \geq \limsup_{n \to \infty} \mu_n(F)$$

となりますが、$f_1(x)$ が可積分なので、ルベーグの収束定理から

$$\lim_{k \to \infty} \int_S f_k d \mu = \mu(F) \geq \limsup_{n \to \infty} \mu_n(F)$$

となり、($\cdot$) が成り立ちます。

($\cdot$) $\Rightarrow$ (1)

次に ($\cdot$) $\Rightarrow$ (1) を示します。$f \in C_b(S)$ を実数値関数とします。複素数値関数については実部と虚部に分けて同様の議論ができます。

$$M = \max_{x \in S} f(x) + 1, \quad m = \min_{x \in S} f(x)$$

とおいて

$$\bar{f}(x) = \frac{f(x) -m}{M -m}$$

とおくと、$0 \leq \bar{f}(x) < 1$ になります。$k \in \mathbb{N}$ を 1 つ固定し、$0 \leq j \leq k$ に対して $S$ の閉集合の減少列を

$$F_j = \{x \in S \mid \bar{f}(x) \geq \frac{j}{k}\}$$

とおきます。このとき、$F_j$ の取り方から

$$\sum_{j = 1}^k \frac{(j -1)}{k} \mu_n(F_{j-1} \setminus F_j) \leq \int_S \bar{f} d \mu_n \leq \sum_{j=1}^k \frac{j}{k} \mu_n(F_{j -1} \setminus F_j)$$

が成り立ちますが、整理すると

$$\frac{1}{k} \sum_{j = 1}^k \mu_n(F_j) \leq \int_S \bar{f} d \mu_n \leq \frac{1}{k} + \frac{1}{k} \sum_{j=1}^k \mu_n(F_j) \tag{**}$$

となります。$n \to \infty$ とすると、$F_j$ が閉集合であることと ($\cdot$) から

$$\limsup_{n \to \infty} \int_S \bar{f} d\mu_n \leq \frac{\mu(S)}{k} + \frac{1}{k}\sum_{j=1}^k \mu(F_j)$$

となります。式 $(**)$ は $\mu$ に対しても成り立つので、$\frac{1}{k} \sum_{j = 1}^k \mu(F_j) \leq \int_S \bar{f} d \mu$ から

$$\limsup_{n \to \infty} \int_S \bar{f} d\mu_n \leq \frac{\mu(S)}{k} + \int_S \bar{f} d \mu$$

となります。$k \to \infty$ とすれば、

$$\limsup_{n \to \infty} \int_S \bar{f} d\mu_n \leq \int_S \bar{f} d \mu$$

となります。上記の不等式は $\bar{f}$ を $f$ に置き換えても、$\int_S m d\mu_n = \int_S m d\mu = m$ なので成り立ちます。さらに $f$ を $-f$ に置き換えると

$$\int_S f d \mu \leq \liminf_{n \to \infty} \int_S f d\mu_n$$

が成り立つので、

$$\lim_{n \to \infty} \int_S f d\mu_n = \int_S f d \mu$$

が成り立ちます。

これで ($\cdot$) $\Rightarrow$ (1) が示され、(1) $\Leftrightarrow$ (2) が示されました。

(1) $\Leftrightarrow$ (3) であること

(1) $\Leftrightarrow$ (3) は ($\cdot$) $\Leftrightarrow$ (3) を示すことで証明します。

($\cdot$) $\Rightarrow$ (3)

($\cdot$) $\Rightarrow$ (3) を示しましょう。($\cdot$) において補集合を取ることで、任意の開集合 $U$ に対して

$$\liminf_{n \to \infty} \mu_n(U) \geq \mu(U)$$

が成り立ちます。$A \in \mathfrak{B}_S$ で $\mu(\partial A)$ を満たすものに対して、$\mathring{A}$ を $A$ の内点集合とすると、$\mathring{A} \subset A \subset \overline{A}$ であり、

$$\mu(\mathring{A}) \leq \liminf_{n \to \infty} \mu_n(A) \leq \limsup_{n \to \infty} \mu_n(A) \leq \mu(\overline{A})$$

が成り立ちます。ここで $\mu(\overline{A} \setminus \mathring{A}) = \mu(\partial{A}) = 0$ から $\mu(\overline{A}) = \mu(\mathring{A})$ であり、$\lim \mu_n(A) = \mu(A)$ となります。これで ($\cdot$) $\Rightarrow$ (3) が示されました。

(3) $\Rightarrow$ ($\cdot$)

(3) $\Rightarrow$ ($\cdot$) を示しましょう。$F$ が空集合の時は ($\cdot$) が成り立つことは明らかです。$F$ を空集合でない閉集合とし、$\delta > 0$ に対して

\begin{align} F_{\leq \delta} & = \{x \in S \mid d(x, F) \leq \delta\} \\ F_{=\delta} & = \{x \in S \mid d(x, F) = \delta\} \end{align}

とおきます。$\delta \neq \delta^{\prime}$ ならば $F_{=\delta} \cap F_{=\delta^{\prime}} = \varnothing$ です。$\mu(F_{=\delta}) > 0$ を満たす $0 < \delta < 1$ が高々可算個であるとします。すると、減少列 $\delta_l \searrow 0$ で $\mu(F_{=\delta_l}) = 0$ を満たすものが存在します。$\partial F_{\leq \delta} \subset F_{=\delta}$ なので、(3) と $F \subset F_{\leq \delta_l}$ から、

$$\mu(F_{\leq \delta_l}) = \lim_{n \to \infty} \mu_n(F_{\leq \delta_l}) \geq \limsup_{n \to \infty} \mu_n(F)$$

が成り立ちます。$\bigcap_{l=1}^{\infty} F_{\leq \delta_l} = F$ なので、$l \to \infty$ とすると

$$\mu(F) \geq \limsup_{n \to \infty} \mu_n(F)$$

となり、($\cdot$) が示されます。

最後に途中で仮定した、$\mu(F_{=\delta}) > 0$ を満たす $0 < \delta < 1$ が高々可算個であることを示しましょう。非可算個存在したとして矛盾を導きます。もし $\sup_{0 < \delta < 1} \mu(F_{=\delta}) = \infty$ とすると、列 $\{\delta_l\}_{l=1}^{\infty}$ で $\mu(\bigcup_{l=1}^{\infty} F_{=\delta_l}) \to \infty$ を満たすものを選ぶことで $\mu(\bigcup_{l=1}^{\infty} F_{=\delta_l}) = \infty$ となってしまうので、$\mu$ が確率測度であることに反します。よって $\sup_{0 < \delta < 1} \mu(F_{=\delta}) < \infty$ です。$\sup_{0 < \delta < 1} \mu(F_{=\delta}) = M$ とおき、

$$I_i = \left( \frac{M}{2^{i+1}}, \frac{M}{2^i} \right]$$

とおくと、$\bigcup_{i=0}^{\infty} I_i = (0, M]$ かつ $i \neq j$ なら $I_i \cap I_j = \varnothing$ となります。もし全ての $i$ に対して

$$\Delta_i = \{\delta \mid \mu(F_{=\delta}) \in I_i, 0< \delta < 1\}$$

が有限個であれば、$\mu(F_{=\delta}) > 0$ を満たす $0 < \delta < 1$ が非可算集合であることに反するので、ある $i$ が存在して $\Delta_i$ の濃度は可算無限になります。 $\Delta_i$ の中から列 $\{\delta_l\}_{l=1}^{\infty}$ を選べば、任意の $l$ に対して $\mu(F_{=\delta_l}) > \frac{M}{2^{i+1}}$ を満たします。この時 $\mu(\bigcup_{l=1}^{\infty} F_{=\delta_l}) = \infty$ なので $\mu$ が有限測度であることに反します。よって $\mu(F_{=\delta}) > 0$ を満たす $0 < \delta < 1$ は高々可算個になります。

以上で証明が完了しました。

$\mathcal{P}(S)$ においても成り立つことは、$\mathcal{P}(S)$ における点列の弱収束先が $\mathcal{P}(S)$ の元であることからわかります。

Prokhorov 距離

$S$ 上の Borel 確率測度全体の集合 $\mathcal{P}(S)$ に距離を定義しましょう。

$A \in \mathfrak{B}_S$, $\alpha > 0$ に対して

$$A_{< \alpha} = \begin{cases}\{x \in S \mid d(x, A) < \alpha\} & (A \neq \varnothing) \\\varnothing & (A = \varnothing) \end{cases}$$

とおきます。つまり、$A_{<\alpha}$ は $A$ を距離 $\alpha$ 分だけ膨らませた集合になります。

ここで、$d_P: \mathcal{P}(S) \times \mathcal{P}(S) \to \mathbb{R}_{\geq 0}$ を

\begin{align} d_P(\mu, \nu) = \inf \{\alpha > 0 \mid & \textrm{ 任意の } A \in \mathfrak{B}_S \textrm{ に対して } \\ & \mu(A) \leq \nu(A_{<\alpha}) + \alpha \textrm{ かつ } \nu(A) \leq \mu(A_{<\alpha}) + \alpha\} \end{align}

と定義すると $d_P$ は $\mathcal{P}(S)$ 上の距離になります。これを確認しましょう。

$d_P$ は距離である

示すべきことは、任意の $\mu, \nu \in \mathcal{P}(S)$ に対して

  1. $d_P(\mu, \nu) < \infty$ (定義の $\inf$ が存在すること)
  2. $d_P(\mu, \nu) \geq 0$ (非負性)
  3. $d_P(\mu, \nu) = d_P(\nu, \mu)$ (対称律)
  4. $d_P(\mu, \nu) = 0 \Leftrightarrow \mu = \nu$ (同一律)
  5. 三角不等式

です。まず 1 を確認しましょう。

条件 1 の確認

$\alpha \geq 1$ であれば条件を満たすので、任意の $\mu, \nu \in \mathcal{P}(S)$ に対して $d_P(\mu, \nu) \leq 1$ であり、特に定義の $\inf$ は存在します。

条件 2 と 3 の確認 (非負性と対称律)

2, 3 は定義から明らかです。

条件 4 の確認 (同一律)

4 の $(\Leftarrow)$ について、$d_P(\mu, \mu) = 0$ であることは任意の $\alpha > 0$ に対して $A \subset A_{<\alpha}$ であることからわかります。

$(\Rightarrow)$ を示しましょう。もし $d_P(\mu, \nu) = 0$ ならば、減少列 $\alpha_n \to 0$ が存在して、任意の $n$ に対して

\begin{align} \mu(A) & \leq \nu(A_{<\alpha_n}) + \alpha_n, \\ \nu(A) & \leq \mu(A_{<\alpha_n}) + \alpha_n \end{align}

が成り立ちます。このとき、$\bigcap_{n} A_{<\alpha_n}$ は $A$ の閉包 $\overline{A}$ と一致します。実際、$S \setminus \overline{A}$ は開集合なので、任意の $x \in S \setminus \overline{A}$ に対し十分小さい $\varepsilon > 0$ をとれば、$x$ を中心とする $\varepsilon$ 開球は $S \setminus \overline{A}$ に含まれます。よって $d(x, \overline{A}) > 0$ であり、十分大きな $n$ をとれば $x \notin A_{<\alpha_n}$ となります。従って

\begin{align} \mu(A) & \leq \nu(\overline{A}), \\ \nu(A) & \leq \mu(\overline{A}) \end{align}

が成り立ちます。特に $A$ が閉集合であれば $\mu(A) = \nu(A)$ が成り立ちます。距離空間における有限 Borel 測度の弱内部正則性から $A$ が開集合の場合も $\mu(A) = \nu(A)$ であり、外部正則性から任意の $A$ に対しても $\mu(A) = \nu(A)$ です。よって $\mu = \nu$ となります。

条件 5 の確認 (三角不等式)

最後に三角不等式を確認しましょう。$\mu, \nu, \eta \in \mathcal{P}(S)$ とし、$d(\mu, \nu) = \alpha$, $d(\nu, \eta) = \beta$ とします。$\varepsilon > 0$ を任意の正の実数とし、$\alpha^{\prime}$, $\beta^{\prime}$ を $\alpha^{\prime} < \alpha + \varepsilon$, $\beta^{\prime} < \beta + \varepsilon$ を満たす正の実数で、任意の $A \in \mathfrak{B}_S$ に対し、

\begin{align} \mu(A) & \leq \nu(A_{<\alpha^{\prime}}) + \alpha^{\prime}, \\ \nu(A) & \leq \mu(A_{<\alpha^{\prime}}) + \alpha^{\prime} \end{align}

\begin{align} \nu(A) & \leq \eta(A_{<\beta^{\prime}}) + \beta^{\prime}, \\ \eta(A) & \leq \nu(A_{<\beta^{\prime}}) + \beta^{\prime} \end{align}

を満たすものとします。このとき、

\begin{align} \mu(A) & \leq \nu(A_{<\alpha^{\prime}}) + \alpha^{\prime} \\ & \leq \eta((A_{<\alpha^{\prime}})_{<\beta^{\prime}}) + \alpha^{\prime} + \beta^{\prime} \end{align}

\begin{align} \eta(A) & \leq \nu(A_{<\beta^{\prime}}) + \beta^{\prime} \\ & \leq \mu((A_{<\beta^{\prime}})_{<\alpha^{\prime}}) + \alpha^{\prime} + \beta^{\prime} \end{align}

が成り立ちます。このとき、$(A_{<\alpha^{\prime}})_{<\beta^{\prime}} \subset A_{<\alpha^{\prime} + \beta^{\prime}}$ であることを確認しましょう。$x \in (A_{<\alpha^{\prime}})_{<\beta^{\prime}}$ ならば、ある $y \in A_{<\alpha^{\prime}}$ が存在して $d(x, y) < \beta^{\prime}$ を満たします。さらに、$y \in A_{<\alpha^{\prime}}$ であることから、ある $a \in A$ が存在して $d(y, a) < \alpha^{\prime}$ を満たします。よって

$$d(x, a) \leq d(x, y) + d(y, a) < \alpha^{\prime} + \beta^{\prime}$$

から、$x \in A_{<\alpha^{\prime} + \beta^{\prime}}$ となります。$(A_{<\beta^{\prime}})_{<\alpha^{\prime}} \subset A_{<\alpha^{\prime} + \beta^{\prime}}$ も同様です。

よって任意の $A \in \mathfrak{B}_S$ に対して

$$\mu(A) \leq \eta(A_{<\alpha^{\prime} +\beta^{\prime}}) + \alpha^{\prime} + \beta^{\prime}$$

$$\eta(A) \leq \mu(A_{<\alpha^{\prime} +\beta^{\prime}}) + \alpha^{\prime} + \beta^{\prime}$$

を満たし、$d(\mu, \eta) \leq \alpha^{\prime} + \beta^{\prime}$ であることがわかります。$\varepsilon$ は任意だったので、

$$d(\mu, \eta) \leq \alpha+ \beta = d(\mu, \nu) + d(\nu, \eta)$$

となり、三角不等式が示されました。

$d_P$ を Prokhorov 距離と言います。

$S$ の $\mathcal{P}(S)$ への埋め込み

定義だけ見ても $d_P$ に親しみが湧かないと思うので、距離空間の埋め込み $\iota: S \hookrightarrow \mathcal{P}(S)$ が存在することを見ましょう。$\iota$ は

$$\iota: S \ni x \mapsto \delta_x \in \mathcal{P}(S)$$

で与えられます。$\delta_x$ はディラック測度です。このとき、任意の $x, y \in S$ に対して

$$d_P(x, y) = \min\{d(x, y), 1\}$$

が成り立ちます。これを確認しましょう。

$d(x, y) = \alpha$ とします。このとき、任意の $\varepsilon > 0$ と任意の $A \in \mathfrak{B}_S$ に対して

\begin{align} x \in A & \Rightarrow y \in A_{< \alpha +\varepsilon}, \\ y \in A & \Rightarrow x \in A_{< \alpha + \varepsilon} \end{align}

が成り立ちます。よって

\begin{align} \delta_x(A) & \leq \delta_y(A_{< \alpha +\varepsilon}) + \alpha +\varepsilon, \\ \delta_y(A) & \leq \delta_x(A_{< \alpha +\varepsilon}) + \alpha +\varepsilon \end{align}

となり、$d_P(\delta_x, \delta_y) \leq \alpha +\varepsilon$ がわかります。$\varepsilon > 0$ は任意なので $d_P(\delta_x, \delta_y) \leq d(x, y)$ となります。$d_P(\delta_x, \delta_y) \leq 1$ は定義から明らかなので

$$d_P(\delta_x, \delta_y) \leq \min\{d(x, y), 1\}$$

が成り立ちます。

逆に $d_P(\delta_x, \delta_y) = \alpha$ とします。このとき任意の $\varepsilon > 0$ に対して $\alpha \leq \alpha^{\prime} < \alpha +\varepsilon$ が存在して、任意の $A \in \mathfrak{B}_S$ に対して

\begin{align} \delta_x(A) & \leq \delta_y(A_{< \alpha^{\prime}}) + \alpha^{\prime}, \\ \delta_y(A) & \leq \delta_x(A_{< \alpha^{\prime}}) + \alpha^{\prime} \end{align}

が成り立ちます。$A = \{x\}$ の場合、$x$ を中心とする半径 $r$ の開球 $B_r(x)$ を

$$B_r(x) = \{y \in S \mid d(y, x) < r\}$$

と定義すると、1 つ目の不等式から

$$1 \leq \delta_y(B_{\alpha^{\prime}}(x)) + \alpha^{\prime}$$

となりますが、$\alpha < 1$ ならば、この不等式が任意の $\varepsilon > 0$ に対して成り立つのは $y \in \overline{B_{\alpha}(x)}$ つまり $d(x, y) \leq \alpha$ のときです。

また、$\alpha = 1$ ならば、ある $A \in \mathfrak{B}_S$ が存在して、任意の $0 < \varepsilon < 1$ に対して

$$\delta_x(A) > \delta_y(A_{< 1 -\varepsilon}) + 1 -\varepsilon$$

が成り立ちます。この不等式が任意の $\varepsilon$ で成り立つのは $x \in A$ かつ $y \notin A_{< 1}$ のときのみであり、このとき $d(x, y) \geq 1$ が成り立ちます。よって

$$\min\{d(x, y), 1\} \leq d_P(\delta_x, \delta_y)$$

が成り立ちます。従って示したいことが示されました。

$d(x, y)$ と $\min\{d(x, y), 1\}$ は同値な距離なので、$S$ と $\iota(S)$ は同相になります。

Prokhorov 距離と弱収束

$d_P$ における収束と弱収束の関係を確認しましょう。

$d_P$ における収束 $\Rightarrow$ 弱収束

$\mu_n, \mu \in \mathcal{P}(S)$ が $d_P(\mu, \mu_n) \to 0$ を満たすとき、$\{\mu_n\}$ は $\mu$ に弱収束します。これを確認しましょう。

$d_P(\mu, \mu_n) \to 0$ なので、減少列 $\alpha_n \searrow0$ が存在し、任意の $A \in \mathfrak{B}_S$ に対して

\begin{align} \mu_n(A) & \leq \mu(A_{<\alpha_n}) + \alpha_n, \\ \mu(A) & \leq \mu_n(A_{<\alpha_n}) + \alpha_n \end{align}

を満たします。このとき、1 つ目の不等式から

\begin{align} \limsup_{n \to \infty} \mu_n(A) & \leq \limsup_{n \to \infty} (\mu(A_{< \alpha_n}) + \alpha_n) \\ & = \lim_{n \to \infty} \mu(A_{< \alpha_n}) \\ & = \mu(\overline{A}) \end{align}

となります。特に任意の閉集合 $F$ に対して $\limsup_{n \to \infty} \mu_n(F) \leq \mu(F)$ を満たしますが、これは $\mu_n$ が $\mu$ に弱収束することと同値です。

$d_P$ における収束 $\Leftarrow$ 弱収束

$S$ が可分であれば、逆に $\{\mu_n\}$ が $\mu$ に弱収束するとき $d_P(\mu, \mu_n) \to 0$ を満たします。次はこれを確認しましょう。

$x \in S$ と $\delta > 0$ に対して $B_{\delta}(x) = \{x\}_{< \delta}$ を $x$ を中心とする半径 $\delta$ の開球とします。まず、任意の $\delta > 0$ に対して $S$ を半径 $\delta$ 以下の可算個の開球 $B_i$ で、$\mu(\partial B_i) = 0$ をみたすもので覆えることを確認しましょう。

任意の $x \in S$ に対して $\delta / 2 < \delta^{\prime} < \delta$ のうち $\mu(B_{\delta^{\prime}}(x)) > 0$ を満たすものは高々可算なので、$\mu(\{x\}_{=\delta^{\prime}}) = 0$ を満たす $\delta^{\prime}$ を選ぶことができます。この $\delta^{\prime}$ に対し $B_\delta^{\prime}(x)$ は半径 $\delta$ 以下の開球で $\mu(\partial B_{\delta^{\prime}}(x)) = 0$ を満たします。

$S$ は可分なので、可算稠密集合 $E \subset S$ が存在します。それぞれの $e_i \in E$ に対して $\delta / 2 < \delta_i <\delta$ をうまく取って $B_i = B_{\delta_i}(e_i)$ とおけば、$\mu(\partial B_i) =0$ を満たし、かつ $E$ が稠密であることから $\bigcup_{i=1}^{\infty} B_i = S$ となります。

このとき、$k$ を十分大きくとれば

$$\mu(\bigcup_{i=1}^{k} B_i) \geq 1 -\delta $$

とできます。この $k$ を固定し、

$$\mathcal{E} = \{\bigcup_{i \in I} B_i \mid I \subset \{1, \cdots, k\}\}$$

とおくと、任意の $B \in \mathcal{E}$ に対して $\partial B \subset \bigcup_{i = 1}^k \partial B_i$ なので $\mu(\partial B) = 0$ を満たします。

$\mu_n$ は $\mu$ に弱収束するので、$n \to \infty$ で $\mu_n(B) \to \mu(B)$ となります。$\mathcal{E}$ は有限集合なので、$N$ を十分大きくとれば、任意の $n > N$ と任意の $B \in \mathcal{E}$ に対して $|\mu_n(B) -\mu(B)| < \delta$ を満たします。特に

$$\mu_n(\bigcup_{i=1}^{k} B_i) \geq \mu(\bigcup_{i=1}^{k} B_i) -\delta \geq 1 -2 \delta$$

を満たします。

$A \in \mathfrak{B}_S$ に対し、

$$B_A = \{\bigcup_i B_i \mid i \in \{1, \dots, k\}, B_i \cap A \neq \varnothing \}$$

とおくと、$B_A \in \mathcal{E}$ であり、$B_i$ の取り方から $B_A \subset A_{< 3\delta}$ となります。また、$A \cap (\bigcup_{i=1}^k B_i) \subset B_A$ から

$$A \subset B_A \cup (\bigcup_{i=1}^k B_i)^{c}$$

となります。

以上から、$n > N$ のとき

\begin{align} \mu(A) & \leq \mu(B_A) + \mu\left((\bigcup_{i=1}^k B_i)^c \right) & &(A \subset B_A \cup (\bigcup_{i=1}^k B_i)^{c} \textrm{ から}) \\ & \leq \mu(B_A) + \delta & &(\mu(\bigcup_{i=1}^k B_i) > 1 -\delta \textrm{ から}) \\ & \leq \mu_n(B_A) + 2\delta & &(|\mu(B_A) -\mu_n(B_A)| < \delta \textrm{ から}) \\ & \leq \mu_n(A_{< 3\delta}) + 2\delta & &(B_A \subset A_{< 3\delta} \textrm{ から}) \\ \end{align}

が成り立ちます。同様に

\begin{align} \mu_n(A) & \leq \mu_n(B_A) + \mu_n\left((\bigcup_{i=1}^k B_i)^c \right) \\ & \leq \mu_n(B_A) + 2\delta \\ & \leq \mu(B_A) + 3\delta \\ & \leq \mu(A_{< 3\delta}) + 3\delta \end{align}

なので、$\varepsilon = 3 \delta$ とおけば、任意の $A \in \mathfrak{B}_S$ に対して $n > N$ ならば $d_P(\mu, \mu_n) < \varepsilon$ を満たします。

よって、$S$ が可分であれば Prokhorov 距離による収束と弱収束が一致します。

まとめ

距離空間 $(S, d)$ の Borel 確率測度全体の集合 $\mathcal{P}(S)$ に Prokhorov 距離をいれ、その距離における収束と一致することを確認しました。

$S$ が可分、完備またはコンパクトであるときに、$\mathcal{P}(S)$ が可分、完備またはコンパクトであること (逆も成り立つ) は以下の記事で解説しています。

Prokhorov 距離と可分性、完備性、コンパクト性の遺伝

参考文献

[G] Onno van Gaans. Probability measures on metric spaces

[K] SAMUEL KAPLAN. THE SECOND DUAL OF THE SPACE OF CONTINUOUS FUNCTIONS. III

[M] JOHN MACK. THE ORDER DUAL OF THE SPACE OF RADON MEASURES

Dirk. Dual spaces of continuous functions