Paalonのブログ

ゲームと物理学と情報学のブログ

確率分布の累積分布関数と確率密度関数

要約

積分布関数は確率分布の累積表現で確率密度関数は確率分布の密度表現なので、それぞれ累積関数と密度関数と呼ぶべき。

確率分布って何?

私は確率分布と言われたときにどういう数学的な対象を指しているのか今の今まで理解していなかった。
その原因は私が今まで測度論的な話に踏み込んだことがなかったことが主だが、それ以外にもある。最たるものは確率論において通用されている諸概念のネーミングの悪さである。

確率分布の形式的な定義

確率空間 {\displaystyle (\Omega, \mathcal{A}, P)} から測度空間 {\displaystyle (S, \mathcal{S})} に対しての確率変数  {\displaystyle X: \Omega \to S} を考えると、測度空間 {\displaystyle S} から実数 {\displaystyle \mathbb{R}} への確率測度 {\displaystyle P \circ X^{-1}} が定まる。これを確率分布といい、{\displaystyle P^X} で表す。

累積表現と密度表現

つまり測度空間 {\displaystyle (S, \mathcal{S})} は晴れて確率空間 {\displaystyle (S, \mathcal{S}, P^X)} へと昇格し、その確率分布 {\displaystyle P^X} の具体的な形は累積分布関数 {\displaystyle F}確率密度関数 {\displaystyle p} で与えることができる。
つまり、累積分布関数 {\displaystyle F} は確率分布 {\displaystyle P^X} の累積表現を与えるのであり、確率密度関数 {\displaystyle p} は確率分布 {\displaystyle P^X} の密度表現を与えるのである。
何が言いたいのかというと累積分布関数も確率密度関数も確率分布の表現なのであるから、両方を分布関数と呼んでもおかしくないはずなのである。
しかし、数学者にとっては累積分布関数の方が一般的に扱いやすいからという理由で累積分布関数を分布関数と呼ぶ伝統になっている。
そのせいで確率分布を与える関数である確率密度関数を分布関数と呼ぶことができなくなってしまっている。
これは良くない。
私はこれから、累積分布関数を単に分布関数と呼ぶことはないだろう。
積分布関数と確率密度関数は確率分布の表現を与えるという意味で対等なものなのだから、表現方法は両者で対等にするべきである。
つまり、確率分布の累積表現関数と確率分布の密度表現関数とでも呼ぶのがふさわしいはずである。
短くするなら累積関数と密度関数とか、確率累積と確率密度とかと呼べばいいのだ。
とにかく、累積関数を分布関数と呼ぶのは気持ち悪い。私は密度関数を分布関数と感じているからだ。
統計学へと応用する視点では確率分布において密度関数の方が本質的であり直感的だと思うのは私だけだろうか?
共感してくれる人がいるならぜひとも累積表現の関数を分布関数呼ぶのをやめて累積関数、せめても累積分布関数と呼んで欲しい。

結局のところ、累積表現というのは積分形であって、密度表現というのは微分形であるというだけなのだが、微分方程式の本はたくさんあっても、積分方程式の本が少ないことが示すように、積分形の方が存在はいえるのかもしれないが、微分形と比べると表現力は乏しくなってしまう。つまりは微分形の方が扱いやすい。その意味では密度関数は累積関数に勝っている。それなのにもかかわらず、同じ分布の表現関数=分布関数である密度関数があたかも分布関数ではないかのように言われるのは言葉の本質を外している。