ポーランド空間上の有限 Borel 測度全体の位相的性質

ポーランド空間 (可分完備距離空間) $S$ 上の符号付有限 Borel 測度全体 $\mathcal{M}_{\mathbb{R}}(S)$ には全変動ノルム $||\cdot||_{var}$ による位相と弱位相の2つの位相が入ります。さらに、その部分集合である Borel 確率測度全体 $\mathcal{P}(S)$ には Prokhorov 距離が入ります。本記事では主にそれらの関係について述べます。

sanov の定理の証明において凸集合に関する補題がいくつか必要になりますので、それの証明も記載します。

本記事では以下のように表します。

  • $\mathcal{M}_{\mathbb{C}}(S)$ : $S$ 上の複素有限 Borel 測度全体
  • $\mathcal{M}_{\mathbb{R}}(S)$ : $S$ 上の符号付有限 Borel 測度全体
  • $\mathcal{M}_{\mathbb{R}}^+(S)$ : $S$ 上の有限 Borel 測度全体
  • $\mathcal{P}(S)$ : $S$ 上の Borel 確率測度全体
  • $C_{b, \mathbb{C}}(S)$ : $S$ 上の有界な複素数値連続関数全体
  • $C_{b, \mathbb{R}}(S)$ : $S$ 上の有界な実数値連続関数全体

局所凸空間

位相ベクトル空間

$\mathbb{K}$ を $\mathbb{C}$ または $\mathbb{R}$ とし、$X$ を $\mathbb{K}$ 上のベクトル空間とします。$X$ が位相空間であり、加法とスカラー倍

\begin{align} & X \times X \ni (x, y) \mapsto x + y \in X, \\ & \mathbb{K} \times X \ni (a, y) \mapsto ay \in X \end{align}

が $X$ の位相に関して連続であるとき、位相線形空間といいます。ただし、$X \times X$, $\mathbb{K} \times X$ には直積位相を入れます。

$X$ を位相線形空間とし、$X^*$ を $X$ の連続な線形関数全体の集合とします。$X^*$ には、任意の $x \in X$ に対して

$$\hat{x}: X^* \ni \lambda \mapsto \lambda(x) \in \mathbb{K}$$

が連続になる最小の位相が入っているとします。$X^*$ を双対空間といいます。

局所凸空間

$X$ を $\mathbb{K}$ 上のベクトル空間とします。$p: X \to \mathbb{R}$ が半ノルムであるとは、以下の性質を満たすことを言います。

  1. 任意の $x \in X$ に対して $p(x) \geq 0$ を満たす。
  2. 任意の $x \in X$, $a \in \mathbb{K}$ に対して $p(a x) = |a| p(x)$ を満たす。
  3. 任意の $x, y\in X$ に対して $p(x + y) \leq p(x) + p(y)$ を満たす。

2 番目から $p(0) = 0$ が成り立ちます。ノルムとの違いは $p(x) = 0$ でも $x = 0$ とは限らないことです。

半ノルム $p_{\alpha}: X \to \mathbb{R}$ と $y \in X$ に対して、写像 $p_{\alpha, y}: X \to \mathbb{R}$ を

$$p_{\alpha, y}(x) = p_{\alpha}(x -y)$$

と定義します。半ノルムの族 $\{p_{\alpha}\}_{\alpha \in A}$ に対して、すべての写像 $\{p_{\alpha,y}\}_{\alpha \in A, y \in X}$ が連続になる最弱の位相を入れたものを局所凸空間といいます。局所凸空間は位相ベクトル空間です。

局所凸という名前は、

$$U_{\alpha, \varepsilon} = \{x \in X \mid p_{\alpha}(x) < \varepsilon\}$$

が凸な開集合であり、$\{U_{\alpha, \varepsilon}\}_{\alpha \in A, \varepsilon > 0}$ が $0 \in X$ の局所基をなすことから来ています。半ノルムの代わりに凸集合により局所凸空間を定義することもできます。

局所凸空間の直積

局所凸空間 $(X, \{p_{\alpha}\})$, $(Y, \{q_{\beta}\})$ に対して、$X \times Y$ の半ノルムを

\begin{align} p^{\prime}_{\alpha}(x, y) &= p_{\alpha}(x) \\ q^{\prime}_{\beta}(x, y) &= q_{\beta}(x) \\ \end{align}

とおくと、半ノルムの族 $\{p^{\prime}_{\alpha}\} \cup \{q^{\prime}_{\beta}\}$ が定める位相は $X \times Y$ の (直積) 位相と一致します。よって $X \times Y$ は局所凸空間になります。

$\mathcal{M}_{\mathbb{C}}(S)$ の弱位相

弱位相と弱収束

$f \in C_{b, \mathbb{C}}(S)$ に対して

$$p_f: \mathcal{M}_{\mathbb{C}}(S) \ni \mu \mapsto \left| \int_S f d \mu \right| \in \mathbb{R}$$

と定義すると、$p_f$ は半ノルムになります。半ノルムの族 $\{p_f\}_{f \in C_{b, \mathbb{C}}(S)}$ を連続にする最弱の位相を入れることにより、$\mathcal{M}_{b, \mathbb{C}}(S)$ は局所凸空間になります。この位相を弱位相と言います。 (関数解析における弱位相とは少し異なります。$(\mathcal{M}_{\mathbb{C}}(S), ||\cdot||_{var})$ のノルム空間としての双対空間は $C_{\mathbb{C}, b}(S)$ ではありません。)

$\mathcal{M}_{\mathbb{C}}(S)$ の点列 $\{\mu_n\}_{n=1}^{\infty}$ が弱位相において $\mu$ に収束するとします。このとき、任意の $f \in C_b(S)$ に対して

\begin{align} p_f(\mu_n -\mu) &= \left| \int_S f d(\mu_n -\mu) \right|\\ &= \left| \int_S f d\mu_n -\int_S f d\mu \right| \\ & \to 0 \quad (n \to \infty) \end{align}

となります。よって

$$\int_S f d \mu_n \to \int_S f d \mu \quad (n \to \infty)$$

となり、別の記事で定義した弱収束と一致します。

$\mathcal{M}_{\mathbb{C}}(S)^* \simeq C_{b, \mathbb{C}}(S)$

$\mathcal{M}_{\mathbb{C}}(S)$ には弱位相が入っているものとします。このとき双対空間 $\mathcal{M}_{\mathbb{C}}(S)^*$ は $C_{b, \mathbb{C}}(S)$ と一致します。これを確認しましょう。

まず、$f \in C_{b, \mathbb{C}}(S)$ に対して

$$\alpha_f: \mathcal{M}_{\mathbb{C}}(S) \ni \mu \mapsto \int_S f d \mu \in \mathbb{C}$$

が連続線形写像であることを示しましょう。$\alpha_f$ が線形写像であることは明らかです。連続であることを示すには、$\mathbb{C}$ の開集合が

$$B_r(w) = \{z \in \mathbb{C} \mid |z -w| < r\}$$

の形の開集合で生成されることから、$\alpha_f^{-1}(B_r(w))$ が開集合であることを示せば良いです。ここで

$$\alpha_f^{-1}(B_r(w)) = \{\mu \in \mathcal{P}(S) \mid \left| \int_S f d \mu -w \right| < r\}$$

ですが、$f \equiv 0$ のとき $\alpha_f^{-1}(B_r(w))$ は全体または空集合になります。$f \not \equiv 0$ のときは、$f(x) \neq 0$ を適当に選んで、

$$\nu = \frac{w}{f(x)} \delta_{x}$$

とおくと、

\begin{align} \alpha_f^{-1}(B_r(w)) &= \{\mu \in \mathcal{P}(S) \mid \left| \int_S f d (\mu -\nu) \right| < r\} \\ &= p_{f, \nu}^{-1}([0, r)) \end{align}

となり、$p_{f, \nu}$ が連続であることから $\alpha_f^{-1}(B_r(y))$ が開集合であることがわかります。

逆に $\alpha \in \mathcal{M}_{\mathbb{C}}(S)^*$ に対して $\bar{\alpha} \in C_{b, \mathbb{C}}(S)$ が存在して、

$$\alpha(\mu) = \int_S \bar{\alpha} d \mu$$

を満たすことを示します。

連続関数の構成

埋め込み $\iota: S \to \mathcal{P}(S)$ により、$x \in S$ 収束する任意の点列 $\{x_n\}_{n=1}^{\infty}$ に対して、$\{\delta_{x_n}\}_{n=1}^{\infty}$ は $\delta_x$ に収束します。$\alpha \in \mathcal{M}_{\mathbb{C}}(S)^*$ に対して $\bar{\alpha}(x) = \alpha(\delta_x)$ とおくと、

\begin{align} \lim_{n \to \infty} \bar{\alpha}(x_n) & = \lim_{n \to \infty} \alpha (\delta_{x_n}) \\ & = \alpha(\lim_{n \to \infty} \delta_{x_n}) \\ & = \alpha(\delta_{x}) \\ & = \bar{\alpha}(x) \end{align}

となるので、$\bar{\alpha}$ は $S$ 上の連続関数になります。

有界であること

$\bar{\alpha}$ が有界であることは次のようにしてわかります。もし $\bar{\alpha}$ が有界でないとすると、$S$ の点列 $\{x_n\}_{n=1}^{\infty}$ で $|\bar{\alpha}(x_n)| > n$ を満たすものが存在します。ここで $\nu_n = \delta_{x_n} / n$ とおくと、任意の $f \in C_{b, \mathbb{C}}(S)$ に対して

$$\left| \int_S f d \nu_n \right| = \frac{|f(x_n)|}{n} \leq \frac{ \max_{x \in S} |f(x)| }{n} \to 0 \quad (n \to \infty) $$

なので、$\nu_n$ は $0$ に弱収束します。すると

\begin{align} |\alpha(0)| & = |\alpha(\lim_{n \to \infty} \nu_n)| \\ & = \lim_{n \to \infty} |\alpha(\nu_n)| \\ & = \lim_{n \to \infty} \frac{|\alpha(\delta_{x_n})|}{n} \\ & > 1 \end{align}

となり、$\alpha$ が線形写像であることに反します。よって $\bar{\alpha}$ は有界であり、$\bar{\alpha} \in C_{b, \mathbb{C}}(S)$ となります。

線形写像と積分の一致

最後に任意の $\mu \in \mathcal{M}_{\mathbb{C}}(S)$ に対して

$$\alpha(\mu) = \int_S \bar{\alpha} d \mu$$

となることを示します。

$$\mu = \mu^{1+} -\mu^{1-} + i(\mu^{2+} -\mu^{2-})$$

と Jordan 分解します。もし、それぞれに弱収束する列 $\{\mu^{i+}_n\}_{n =1}^{\infty}$, $\{\mu^{i-}_n\}_{n =1}^{\infty}$ $(i = 1, 2)$ が存在すれば、任意の $f \in C_{b, \mathbb{C}}(S)$ に対して

\begin{align} & \left| \int_S f d\mu -\int_S f d(\mu^{1+}_n -\mu^{1-}_n + i\mu^{2+}_n -\mu^{2-}_n) \right| \\ = \ & \left| \int_S f d(\mu^{1+} -\mu^{1+}_n) -\int_S f d(\mu^{1-} -\mu^{1-}_n) \right. \\ & \qquad \qquad + \left. i\left(\int_S f d(\mu^{2+} -\mu^{2+}_n) -\int_S f d(\mu^{2-} -\mu^{2-}_n) \right)\right| \\ \leq \ & \left|\int_S f d(\mu^{1+} -\mu^{1+}_n) \right| + \left|\int_S f d(\mu^{1-} -\mu^{1-}_n)\right| \\ & \qquad \qquad + \left|\int_S f d(\mu^{2+} -\mu^{2+}_n) \right| + \left|\int_S f d(\mu^{2-} -\mu^{2-}_n) \right| \\ \to \ & 0 \quad (n \to \infty) \end{align}

なので、

$$\mu_n = \mu^{1+}_n -\mu^{1-}_n + i(\mu^{2+}_n -\mu^{2-}_n)$$

は $\mu$ に弱収束します。

$S$ は可分距離空間においては、デルタ測度の線形結合は有限 Borel 測度全体 $\mathcal{M}^+_{\mathbb{R}}(S)$ において稠密です。$\mu^{i+}$, $\mu^{i-}$ $(i = 1, 2)$ は有限 Borel 測度なので、$\mu^{i+}$, $\mu^{i-}$ にそれぞれ収束する有限 Borel 測度の列 $\{\mu^{i+}_n\}_{n =1}^{\infty}$, $\{\mu^{i-}_n\}_{n =1}^{\infty}$ で、デルタ測度の線形結合で表されるようなものがとれます。よって、$\mu$ に弱収束する $\mathcal{M}(S)$ の列 $\{\mu_n\}_{n=1}^{\infty}$ で、デルタ測度の線形結合で表されるものがとれます。

ここで、

$$\mu_n = \sum_{i=1}^{k_n} \beta_{k_n} \delta_{x_{k_n}}$$

とおくと、

\begin{align} \alpha(\mu_n) &= \alpha(\sum_{i=1}^{k_n} \beta_{k_n} \delta_{x_{k_n}}) \\ & = \sum_{i=1}^{k_n} \beta_{k_n} \bar{\alpha}(x_{k_n}) \\ & = \int_S \bar{\alpha} d \mu_n \end{align}

となります。$\alpha$ は連続なので、

\begin{align} & \left| \alpha(\mu) -\int_S \bar{\alpha} d\mu \right| \\ = \ &\left| \alpha(\mu) -\alpha(\mu_n) + \int_S \bar{\alpha} d\mu_n -\int_S \bar{\alpha} d\mu \right|\\ \leq \ & |\alpha(\mu) -\alpha(\mu_n)| + \left| \int_S \bar{\alpha} d\mu_n -\int_S \bar{\alpha} d\mu \right| \\ \to \ & 0 \quad (n \to \infty) \end{align}

となります。よって任意の $\mu \in \mathcal{M}_{\mathbb{C}}(S)$ に対して

$$\alpha(\mu) = \int_S \bar{\alpha} d \mu$$

となります。$\bar{\alpha_f} = f$, $\alpha_\bar{\alpha} = \alpha$ は明らかなので、$\mathcal{M}_{\mathbb{C}}(S)^* \simeq C_{b, \mathbb{C}}(S)$ が成り立つことがわかりました。

補足

$f \in C_{b, \mathbb{C}}(S)$ に対応する $\mathcal{M}_\mathbb{C}(S)^*$ の元を $\alpha_f$ の代わりに $\hat{f}$ と表すこととします。

符号付有限 Borel 測度 $ \mathcal{M}_{\mathbb{R}}(S)$ についても同様のことが成り立ちます。 $f \in C_{b, \mathbb{R}}(S)$ に対して $\hat{f} \in \mathcal{M}_{\mathbb{R}}(S)$ であり、$\alpha \in \mathcal{M}_{\mathbb{R}}(S)$ に対して $\bar{\alpha} \in C_{b, \mathbb{R}}(S)$ なので、

$$\mathcal{M}_{\mathbb{R}}(S) \simeq C_{b, \mathbb{R}}(S)$$

であることがわかります。

$\mathcal{P}(S) \subset \mathcal{M}_{\mathbb{C}}(S)$ は閉集合である

$\mathcal{P}(S)$ が閉であることは、$S$ がコンパクトであるときに $\mathcal{P}(S)$ がコンパクトであることの証明の途中で示したときと同様に

  1. $\mu \in \mathcal{M}_{\mathbb{C}}(S)$ は、任意の $f \in C_{b, \mathbb{R}}(S)$, $f \geq 0$ に対して $\hat{f}(\mu) \geq 0$ なら測度であること。
  2. $\hat{f}$ は弱位相に関して連続であること。
  3. $\mathcal{P}(S)$ は閉集合の交わり
    $$\hat{1_S}^{-1}(\{1\}) \cap \bigcap_{f \in C_{b, \mathbb{R}}(S), f \geq 0} \hat{f}^{-1}([0, \infty))$$
    と一致すること。

により示されます。

全変動ノルムと Prokhorov 距離

全変動ノルムが Borel 可測であること

$\mathcal{M}_{\mathbb{C}}(S)$ は全変動ノルム $||\cdot||_{var}$ によりノルム空間になります。これが弱位相に対して Borel 可測であることを示します。特に任意の $\mu \in \mathcal{M}_{\mathbb{C}}(S)$ と $r > 0$ に対して

$$\{\nu \in \mathcal{M}_{\mathbb{C}}(S) \mid ||\nu -\mu||_{var} < r\} \in \mathcal{B}_{\mathcal{M}_{\mathbb{C}}(S)}$$

は可測になります。

まず、

$$||\mu||_{var} = \sup \{| \hat{f}(\mu) | \mid f \in C_b(S), ||f||_{\infty} \leq 1\}$$

であることを示しましょう。全変動ノルムの定義から、任意の $\varepsilon > 0$ に対して $S$ の有限個の分割 $A_1, \dots, A_m$ が存在して、

$$||\mu||_{var} -\varepsilon < \sum_{i=1}^m |\mu(A_i)|$$

を満たします。$\mu$ の Jordan 分解を

$$\mu = \mu^{1+} -\mu^{1-} + i(\mu^{2+} -\mu^{2-})$$

とおくと、$S$ は距離空間なので、有限 Borel 測度の正則性から、閉集合 $F_k \subset A_k$ で

$$\mu^{j+}(A_k \setminus F_k) < \frac{\varepsilon}{2^{k+2}}, \ \mu^{j-}(A_k \setminus F_k) < \frac{\varepsilon}{2^{k+2}} \quad (j = 1, 2)$$

を満たすものが存在します。このとき三角不等式から

\begin{align} & \big| |\mu(A_k)| -|\mu(F_k)| \big| \\ \leq \ & |\mu(A_k) -\mu(F_k)| \\ \leq \ & |\mu^{1+}(A_k) -\mu^{1+}(F_k)| +|\mu^{1-}(A_k) -\mu^{1-}(F_k)| \\ & \qquad +|\mu^{2+}(A_k) -\mu^{2+}(F_k)| +|\mu^{2-}(A_k) -\mu^{2+}(F_k)| \\ < \ & \frac{\varepsilon}{2^k} \end{align}

が成り立ちます。また、有限 Borel 測度の弱収束の一意性を証明したときのように、各 $F_k$ に対して $1_{F_k}$ に収束する $C_b(S)$ の減少列 $\{f^k_n\}_{n=1}^{\infty}$ が存在します。ここで、$\arg^{\prime}: \mathbb{C} \to \mathbb{C}$ を

$$\arg^{\prime}(z) = \begin{cases} \arg(z) & x \neq 0 \\ 0 & x = 0 \end{cases}$$

と定めて

$$f_n = \sum_{k=1}^m e^{-\arg^{\prime}(\mu(A_k))} f^k_n$$

とおきます。$f^k_n$ の取り方から、$n$ を十分大きくとれば $||f_n||_{\infty} \leq 1$ が成り立ちます。ルベーグの収束定理から

\begin{align} \lim_{n \to \infty} \int_S f_n(x) d \mu &= \sum_{i = 1}^m e^{-\arg^{\prime}(\mu(A_k))} \mu(F_k) \\ &= \sum_{k = 1}^m |\mu(F_k)| \end{align}

なので、$n$ を十分大きくとれば

\begin{align} \left| \int_S f_n d \mu \right|& > \sum_{k = 1}^m |\mu(F_k)| -\varepsilon \\ & > \sum_{k = 1}^m |\mu(A_k)| -\sum_{k = 1}^m \frac{\varepsilon}{2^k} -\varepsilon \\ & > ||\mu||_{var} -3\varepsilon \\ \end{align}

が成り立ちます。$||f||_{\infty} = 1$ であれば

$$\left| \int_S f d \mu \right| \leq ||\mu||_{var}$$

は明らかなので、

$$||\mu||_{var} = \sup \{|\hat{f}(\mu) | \mid f \in C_{b, \mathbb{C}}(S), ||f||_{\infty} \leq 1\} \tag{*}$$

が成り立ちます。このとき

$$ \{\mu \in \mathcal{M}_{\mathbb{C}}(S) \mid ||\mu||_{var} > r\} = \bigcup_{f \in C_{b, \mathbb{C}}, ||f||_{\infty} \leq 1} \hat{f}^{-1}((r, \infty))$$

が開集合なので、$||\cdot||_{var}$ は可測です。

ちなみに、$(*)$ から任意の $f \in C_{b, \mathbb{C}}(S)$ に対して $\int_S f d\mu = 0$ であれば $||\mu||_{var} = 0$ が成り立ちます。特に弱収束先は一意になります。

$\mathcal{P}(S)$ における全変動ノルム

全変動ノルム $||\cdot||_{var}$ を $\mathcal{P}(S)$ に制限すると、別の表現が得られます。

$\mu, \nu \in \mathcal{P}(S)$ に対して、全変動ノルムの定義から、任意の $\varepsilon > 0$ に対して $S$ の有限個の分割 $A_1, \dots, A_m$ が存在して、

$$||\mu -\nu||_{var} -\varepsilon < \sum_{i=1}^m |\mu(A_i) -\nu(A_i)|$$

を満たします。このとき、

$$A^+ = \bigcup_{\mu(A_i) \geq \nu(A_i)} A_i$$

とおいて、$A^- = S \setminus A^+$ とおくと、

\begin{align} & \sum_{i=1}^m |\mu(A_i) -\nu(A_i)| \\ = \ &\mu(A^+) -\nu(A^+) -(\mu(A^-) -\nu(A^-)) \\ = \ & \mu(A^+) -\mu(X \setminus A^+) -(\nu(A^+) -\nu(X \setminus A^+)) \\ = \ & \mu(A^+) -(1 -\mu(A^+)) -\big(\nu(A^+) -(1 -\nu(A^+)) \big)\\ = \ & 2(\mu(A^+) -\nu(A^+)) \end{align}

が成り立ちます。$\varepsilon$ は任意なので、

$$||\mu -\nu||_{var} = \sup_{A \in \mathfrak{B}_S} 2 |\mu(A) -\nu(A)|$$

となります。

Prokhorov 距離と全変動ノルムの関係

Prokhorov 距離と全変動ノルムの関係を調べましょう。$\mu, \nu \in \mathcal{P}(S)$ と $r > 0$ に対して

$$||\mu -\nu||_{var} = r$$

であるとします。このとき、任意の $A \in \mathfrak{B}_S$ に対して

$$-\frac{r}{2} \leq \mu(A) -\nu(A) \leq \frac{r}{2}$$

が成り立ちます。この不等式から

\begin{align}\mu(A) & \leq \nu(A) + \frac{r}{2} \leq \nu(A_{<\frac{r}{2}}) + \frac{r}{2} \\ \nu(A) & \leq \mu(A) + \frac{r}{2} \leq \mu(A_{<\frac{r}{2}}) + \frac{r}{2}\end{align}

が得られますので、Prokhorov 距離の定義から $d_P(\mu, \nu) \leq \frac{r}{2}$ となります。よって

$$2d_P(\mu, \nu) \leq ||\mu -\nu||_{var}$$

が成り立ちます。

$(\mathcal{P}(S), d_P)$ の凸集合について

$\mathcal{P}(S)$ 自体が凸であることは、任意の $\mu_1, \mu_0 \in \mathcal{P}(S)$ と $0 \leq t \leq 1$ に対して

$$t\mu_1 + (1 -t)\mu_2 \in \mathcal{P}(S)$$

であることからわかります。

凸結合と Prokhorov 距離

$\mu \in \mathcal{P}(S)$, $r > 0$ に対して、半径 $r$ の開球 $B_r(\mu)$ を

$$B_r(\mu) = \{\nu \in \mathcal{P}(S) \mid d_P(\nu, \mu) < r\}$$

とおきます。また、$r_0, r_1 > 0$, $\mu_0, \mu_1 \in \mathcal{P}(S)$ とし、$0 \leq t \leq 1$ に対して

$$t B_{r_1}(\mu_1) + (1 -t) B_{r_0}(\mu_0) = \{t \nu_1 + (1 -t) \nu_0 \mid \nu_1 \in B_{r_1}(\mu_1),\ \nu_2 \in B_{r_0}(\mu_0) \}$$

とおきます。このとき、

$$\mu_t = t \mu_1 +(1 -t)\mu_0$$

とおいて

$$t B_{r_1}(\mu_1) + (1 -t) B_{r_0}(\mu_0) \subset B_{\max\{r_0, r_1\}}(\mu_t)$$

が成り立つことを示します。

$\nu_0 \in B_{r_0}(\mu_0)$, $\nu_1 \in B_{r_1}(\mu_1)$ を取り、

\begin{align} \nu_t = t \nu_1 +(1 -t)\nu_0 \end{align}

とおきます。$\varepsilon > 0$ を

$$\varepsilon < \min\{r_0 -d_P(\nu_0, \mu_0), r_1 -d_P(\nu_1, \mu_1)\}$$

を満たすように取り、実数 $ r^{\varepsilon}_1$, $ r^{\varepsilon}_2$ を

$$d_P(\nu_i, \mu_i) < r^{\varepsilon}_i < d_P(\nu_i, \mu_i) + \varepsilon, \quad (i = 0, 1)$$

を満たし、任意の $A \in \mathfrak{B}_S$ に対して

\begin{align}\nu_i(A) &\leq \mu_i(A_{< r^{\varepsilon}_i}) + r^{\varepsilon}_i \\ \mu_i(A) &\leq \nu_i(A_{< r^{\varepsilon}_i}) + r^{\varepsilon}_i \end{align}

が成り立つように取ります。このとき、任意の $A \in \mathfrak{B}_S$ に対して

\begin{align} \nu_t(A) & \leq t (\mu_1(A_{ < r^{\varepsilon}_1}) + r^{\varepsilon}_1) +(1 -t)(\mu_0(A_{ < r^{\varepsilon}_0}) + r^{\varepsilon}_0) \\ & \leq t \mu_1(A_{< \max\{r^{\varepsilon}_0, r^{\varepsilon}_1\}}) + (1 -t)\mu_0(A_{< \max\{r^{\varepsilon}_0, r^{\varepsilon}_1\}}) + \max\{r^{\varepsilon}_1, r^{\varepsilon}_0\} \\ & = \mu_t(A_{< \max\{r^{\varepsilon}_0, r^{\varepsilon}_1\}}) + \max\{r^{\varepsilon}_0, r^{\varepsilon}_1\}, \\ \\ \mu_t(A) &\leq t (\nu_1(A_{ < r^{\varepsilon}_1}) + r^{\varepsilon}_1) +(1 -t)(\nu_0(A_{ < r^{\varepsilon}_0}) + r^{\varepsilon}_0) \\ & \leq t \nu_1(A_{ <\max\{r^{\varepsilon}_0, r^{\varepsilon}_1\}}) +(1 -t)\nu_0(A_{ < \max\{r^{\varepsilon}_0, r^{\varepsilon}_1\}}) + \max\{r^{\varepsilon}_0, r^{\varepsilon}_1\} \\ & = \nu_t(A_{<\max\{r^{\varepsilon}_0, r^{\varepsilon}_1\}}) + \max\{r^{\varepsilon}_0, r^{\varepsilon}_1\} \end{align}

が成り立つので、

$$d_P(\nu_t, \mu_t) \leq \max\{r^{\varepsilon}_0, r^{\varepsilon}_1\} < \max\{r_0, r_1\}$$

となります。したがって、

$$t B_{r_1}(\mu_1) + (1 -t) B_{r_0}(\mu_0) \subset B_{\max\{r_0, r_1\}}(\mu_t)$$

が成り立ちます。

開球は凸である

$\nu_1, \nu_0 \in B_r(\mu)$ とすると、任意の $0 \leq t \leq 1$ に対して

$$d_P(\nu_t, \mu) < r$$

なので $\nu_t \in B_r(\mu)$ となり、$B_r(\nu)$ が凸であることがわかります。

コンパクト集合の閉凸包はコンパクト

$\Gamma \subset \mathcal{P}(S)$ をコンパクト集合とします。このとき、Prokhorov の定理から $\Gamma$ はタイトになります。よって任意の $\varepsilon > 0$ に対して、コンパクト集合 $K \subset S$ で、任意の $\mu \in \Gamma$ に対して

$$\mu(K) > 1 -\varepsilon$$

を満たすものが存在します。$\Gamma$ の凸包

$$\mathrm{Conv}(\Gamma) = \{\sum_{i=1}^n r_i \mu_i \mid \mu_i \in \Gamma, \ r_i \geq 0, \ \sum_{i=1}^n r_i = 1, \ n \in \mathbb{N}\}$$

と定義します。このとき、$\nu \in \mathrm{Conv}(\Gamma)$ に対して $\nu =\sum_{i=1}^n r_i \mu_i$ とおくと、

$$\nu(K) = \sum_{i=1}^n r_i \mu_i(K) > \sum_{i=1}^n r_i(1 -\varepsilon) = 1 -\varepsilon$$

なので、$\mathrm{Conv}(\Gamma)$ もタイトになります。よって再び Prokhorov の定理から、$\Gamma$ の閉凸包 $\overline{\mathrm{Conv}(\Gamma)}$ はコンパクトになります。

参考文献

StackExchange: When do Borel ?-algebras generated by the total variation norm and the weak* topology coincide?

EDUARD A. NIGSCH. LOCALLY CONVEX SPACES