さとし日記

都内大学院生のブログ

ポアソン分布は離散分布で、指数分布は連続分布である。それぞれの意味について改めて考えてみた。

学部の卒業研究ではある素粒子の崩壊を扱った。

 

素粒子の崩壊数の確率分布はポアソン分布に従うので、ゼミではポアソン分布に関してもそれなりに勉強した。

 

また、ポアソン分布と似た文脈で指数分布という分布もよく登場する。

 

ゼミでは時間の都合上、指数分布は殆ど扱わなかったが、重要だと思うので今更ながら両者について再度勉強してみた。

 

 

 

1時間に平均10件の問い合わせが来るコールセンターがあるとする。

 

そのコールセンターで

A「ある1時間に問い合わせが0件である確率は?」

B「ある問い合わせが来てから、次の問い合わせが来るまでの時間が10分以内である確率は?」

という2つについて考えてみる。

 

まずはAについて。

「1時間に"平均"10件」なので、絶対に10件来るわけではない。

ある1時間では全く問い合わせが来ないかもしれないし、ある1時間では100件来るかもしれない。

 

そのバラツキに関して、それぞれの回数の確率分布を表したものをポアソン分布と呼ぶ。

平均が10回なのでそこに確率のピークが来て、0回や100回などは起こり得るけど確率は低い(下の画像は上記の条件を表したものではないが、概形の参考にはなる)。

 

f:id:satoshi86:20200519135140j:image

 

数学的には、ポアソン分布は

「単位時間あたり平均λ回起こる事象がちょうどk回起こる確率P(X=k)を

P(X=k) = λ^k*e^(-λ)/k!
と表記できる分布」

のことである。

 

次のその分布の導出をしてみる。

あるベルヌーイ試行について、平均λが一定という条件のもと、試行回数を無限大にすれば良い。
つまり二項分布の極限を考えてみる。

よって、

lim[λ=np, n→∞] nCk * p^k * (1-p)^(n-k) = λ^k*e^(-λ)/k!

となる([λ=np, n→∞]については、λがnpで一定になるようにnを無限大に飛ばすということ)。
これは「ポアソンの極限定理」と呼ばれる。

 

最後にAの条件について実際に解いてみると、

λ = 10, k=0

P(X=k) = λ^k*e^(-λ)/k!

に代入すれば良いので、

P(X=0) = 10^0 * e^(-10)/0! = 0.0000453… ≈ 0.0045 %

となる(思いの外低かった)。

 

 

次にBの問について考えてみる。

1時間(60分)に平均10件なので、およそ6分間につき1件来そうであるが、もちろん等時間間隔に問い合わせが来るわけではない。

ある程度バラツキが出るであろう。

 

その時間、つまりイベントが発生してから、次にそのイベントが発生するまでの時間の確率分布が指数分布となる(Aの時と同じく、下の画像はこの条件での分布を表したものではない)。

 

f:id:satoshi86:20200519135124j:image

 

 

数学的には、指数分布は

「単位時間あたりに平均λ回起こる事象の発生間隔がx単位時間である確率密度f(x)を
f(x) = λe^(-λx)
と表記できる分布」

のことである。

 

同様にその分布を導出してみる。

[0, x]の範囲ではそのイベントが起こらず、[x, x+Δx]でそのイベントが初めて発生する確率
f(x)Δx = (1 - ∫[0, x]f(x)dx) * λΔx
を考えてf(x)について、微分方程式を解けば求まる。

 

またx単位時間以内に発生する確率は、[0, x]の範囲で積分すれば良いので、累積密度関数F(x)は
F(x) = ∫[0, x]f(x)dx = 1-e^(-λx)

となる。

 

最後にBの条件について解いてみると、10分は1/6時間なので、
F(1/6) = 0.811... ≈ 81.1 %

となる。

平均で6分間に1回問い合わせが来ることを考えると、10分以内に問い合わせが来る確率が、80%を超えていることも直感的に納得できる。

 

 

最後に簡単にまとめてみる。

常に一定の割合でランダムに発生するものを「ポアソン過程」と呼ぶ。

そのポアソン過程において、発生する回数に注目するとポアソン分布になる。

また、「回数」に注目しているので、離散分布になる(1.8回発生とかは存在しないので)。

 

一方、そのポアソン過程において、事象が発生する間隔を見ようとすると指数分布になる。

時間という連続的な量を扱うので、分布は連続分布になる。

 

 

 

というわけで基本事項は一通り浚うことはできたのではないか。

少しは理解が深まったような気がする。