verum ipsum factum

sudillap's blog

$\int f(x)dg(x)$(リーマン=スティルチェス積分)について

確率や統計の文献のなかで稀に
$$
a = \int f(x) dg(x)
$$
のような形($dg(x)$の部分に注目)の積分が使われていて「???」となった方もいるかもしれません。$dg(x)$ではなく$dx$であれば、これは高校で習った積分
$$
a = \int f(x) dx
$$
になりお馴染みの形になりますが、$dg(x)$とは見慣れない形です。

実はこの積分は、リーマン=スティルチェス積分(Riemann Stieltjes integral)と呼ばれ、リーマン積分(高校で習った積分の正式名)を拡張したものです*1

この記事では、リーマン=スティルチェス積分の定義と確率学への応用について簡単に紹介します。なお、数学的な厳密性については無視しています。

リーマン=スティルチェス積分の定義

高校で習った積分の定義を少し一般化するとリーマン=スティルチェス積分の定義になります。

定義を書く前に記号をいくつか用意しておきます。

  • $f(x)$を区間$[a,b]$で有界な関数
  • $g(x)$を区間$[a,b]$で単調増加する関数
  • $P=\{x_0,x_1,\ldots,x_n\}$を区間$[a,b]$を分割したもの
  • $m_i$を区間$[x_{i-1},x_i]$上での$f(x)$の下限(最小値とほぼ同じ意味)
  • $M_i$を区間$[x_{i-1},x_i]$上での$f(x)$の上限(最大値とほぼ同じ意味)
  • $\Delta g_i=g(x_i)-g(x_{i-1})$

このとき

  • $$LS_P(f,g) = \sum_{i=1}^{n} m_i \Delta g_i$$
  • $$US_P(f,g) = \sum_{i=1}^{n} M_i \Delta g_i$$

とすると、 $f(x)$の$g(x)$に関するリーマン=スティルチェス積分$\int_{a}^{b} f(x) dg(x)$は
$$
\int_{a}^{b} f(x) dg(x)=\inf_{P} US_P(f,g) = \sup_{P} LS_P(f,g)
$$
で定義されます($\inf, \sup$はそれぞれ$\min, \max$とほぼ同じ意味です)。高校で習った積分の定義に似ていますね。

このとき次の関係式
$$
\int_{a}^{b} f(x) dg(x)=\int_{a}^{b} f(x) g'(x)dx
$$
が成り立ちます。
この式により高校で習った積分(リーマン積分)とリーマン=スティルチェス積分を関連付けることができます。

冒頭でリーマン=スティルチェス積分はリーマン積分の拡張と書きましたが、この式を使って本当にそうなのか確かめてみます。
$g(x)=x$とおくと$g'(x)=1$になり、これを上の式に代入すれば
$$
\begin{align}
\int_{a}^{b} f(x) dg(x)&=\int_{a}^{b} f(x) g'(x) dx\\
&=\int_{a}^{b} f(x) dx
\end{align}
$$
となりますので、リーマン積分はリーマン=スティルチェス積分で$g(x)=x$とした特別な場合に相当することがわかります。

確率論の応用

関数$h(x)$の期待値を数式で表現しようとすると、確率変数$X$が離散的な場合と連続な場合で次のように表現の仕方を変える必要があります。

  • $X$が離散確率変数のとき:$E[h(X)]=\sum_{i=1}^{n} h(c_i) p(c_i)$($p(x)$は確率分布関数)
  • $X$が連続確率変数のとき:$E[h(X)]=\int_{-\infty}^{+\infty} h(x) f(x) dx$($f(x)$は確率密度関数)

しかし、リーマン=スティルチェス積分を使えば、確率変数$X$が離散的・連続的にかかわらず$h(x)$の期待値を
$$
E[h(X)]=\int_{-\infty}^{+\infty} h(x) dF(x)
$$
と一つの式で表現でき便利です。

確率変数$X$が連続の場合に上の式が成り立つことは簡単に示せます。

実際、$F(x)$を累積確率密度関数とすると$F'(x)=f(x)$なので
$$
\begin{align}
E[h(X)]&=\int_{-\infty}^{+\infty} h(x) f(x) dx\\
&=\int_{-\infty}^{+\infty} h(x) F'(x) dx\\
&=\int_{-\infty}^{+\infty} h(x) dF(x)
\end{align}
$$
となり上の期待値の式が成り立つことが示せました。

確率変数$X$が離散的な場合でも上の期待値の式が成り立つことが示せますが、数式が若干複雑になるので省略します。
興味のある方は参考文献を参照してください。

参考文献
Khuri, Andre I. Advanced calculus with applications in statistics. Vol. 486. Wiley. com, 2003.

*1:リーマン積分を拡張する方法は他にもいろいろあります。その中でもとくに重要なのがルベーグ積分です。実際のところ、ルベーグ積分の方がはるかに重要です。ちなみに、リーマン=スティルチェス積分を一般化するとルベーグ=スティルチェス積分となります。