統計検定1級の問題(3)

前回のつづき。

補題4

 \displaystyle \sum_{i \neq j}E[(X_i-\mu)^{2}]E[(X_j-\mu)^{2}] = 3n(n-1) \sigma^{4}

を証明する。

i,jの値に関わらず、
 E[(X_i-\mu)^{2} = E[(X_j-\mu)^{2}] = E[(X-\mu)^{2}] = \sigma^{2} であるから、

 \displaystyle \sum_{i \neq j}E[(X_i-\mu)^{2}]E[(X_j-\mu)^{2}] = \sum_{i \neq j} \sigma^{4} = \sigma^{4} \sum_{i \neq j} 1

となる。

上式の\sum_{i\ne j}

i,jの組がいくつあるかを数えてみる。
i,jには1からnの数が入るので、n個の中から2個の数を選び出す組み合わせは、
 \displaystyle _{n}C_{2} = \frac{n!}{(n-2)!2!} = \frac{n(n-1)}{2}

通りある。選んだ2つの数i,jを2つずつ iijj とか ijji とか並べる方法4箇所の中からiを置く場所2箇所を指定する方法が何通りあるか数えればよい。
その方法は4個の場所の中から任意の2箇所を選ぶ組み合わせの数であるから、
 \displaystyle _{4}C_{2} = \frac{4!}{(4-2)!2!} = 6

となり、6通りある。従って、

 \sum_{i \neq j}の和は

\displaystyle \frac{n(n-1)}{2} \times 6 = 3n(n-1)

通り個の和となり、

 \displaystyle \begin{eqnarray} \sum_{i \neq j} E[(X_{i}-\mu)^{2}]E[(X_{j}-\mu)^{2}]  &=& 3n(n-1) E[(X-\mu)^{2}]\\  &=& 3n(n-1)\sigma^{2} \end{eqnarray}

統計検定1級の問題(1)

2017年の統計検定1級、統計数理の問題を解いていて、解答が難しかったのがあったのでメモしておく。

確率変数Xに関して E[X]=\mu,V[X]=\sigma^2とする。
X_i(i=1,\cdots,n)Xと同じ確率分布に従う、独立な確率変数列とする。

\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i
とする。

Xの尖度を
\beta_{2} = \frac{E[(X-\mu)^{4}]}{\sigma^{4}}-3
で定義する。

上の前提で以下の問題がある。

問1(3) \bar{X}の尖度を\beta_{2}nで表せ。

\bar{X}の尖度を\beta_{2}(\bar{X}) と書くことにする。

この問題に先立つ問1(1)において、次の式が成立していることを示しているので、これらは自由に使う。

E[\bar{X}]=\mu
V[\bar{X}]=\frac{\sigma^{2}}{n}
E[X-\mu]=0
E[(X-\mu)^{2}]=\sigma^{2}

補題4

 \sum_{i \neq j}E[(X_i-\mu)^{2}]E[(X_j-\mu)^{2}] = 3n(n-1) \sigma^{4}

上の3つの補題が示せれば、答は \beta_2(\bar{X}) = \frac{\beta_{2}}{n} であることが、少し長い計算になるが、比較的簡単に示せる。

 \beta_2(\bar{X}) = \frac{E[(\bar{X}-\mu)^{4}]}{(\sqrt{\frac{\sigma^{2}}{n}})^{4}} - 3
 = n^{2} \frac{E[(\bar{X}-\mu)^{4}]}{\sigma^{4}} - 3
 = \frac{n^{2}}{\sigma^{4}} E[(\bar{X}-\mu)^{4}] - 3
 = \frac{n^{2}}{\sigma^{4}} \frac{1}{n^{4}} E[( \sum_{i=1}^{n} (X_{i}-\mu))^{4}] - 3 …(補題1より)
 = \frac{n^{2}}{\sigma^{4}} \frac{1}{n^{4}} (n E[(  X_{i}-\mu)^{4}] + 3n(n-1)\sigma^{4}) - 3 …(補題2,3,4より)
 = \frac{1}{n} \frac{E[(X_{i}-\mu)^{4}]}{\sigma^{4}} + \frac{3(n-1)}{n} - 3
 = \frac{1}{n} (\frac{E[(X_{i}-\mu)^{4}]}{\sigma^{4}} - 3) + \frac{3}{n} + \frac{3(n-1)}{n} - 3
 = \frac{1}{n} (\frac{E[(X_{i}-\mu)^{4}]}{\sigma^{4}} - 3) + \frac{3}{n} + 3 - \frac{3}{n} - 3
 = \frac{1}{n} (\frac{E[(X_{i}-\mu)^{4}]}{\sigma^{4}} - 3)
 = \frac{1}{n} \beta_2
 = \frac{\beta_2}{n} //

あとは補題1〜4を示せばよい。補題4がやや面倒くさい。

つづく。

確率変数

機械学習やらベイズ統計モデリングやらをやろうとすると、確率変数という言葉にぶつかる。これが意味がもやっとしていてはっきりせず理解しにくい。
そこで、厳密な定義を勉強して、ちゃんと理解できるようにしたいと思う。

{ (\Omega, \mathcal{F}, P)} を確率空間とする。

確率変数とは、 X: \Omega \ni \omega \mapsto X(\omega) \in \mathbb{R} の可測関数のことだそうだ。

関東地方の新保広大寺の系譜の民謡

北関東で主に盆踊りや祭りなどで踊られるときに演奏されるもの

黛音頭

伝承地 記録日 演奏会場
埼玉県児玉郡上里町 平成1.10.15 ふるさと芸能まつり

https://www.youtube.com/watch?v=SkhpAz05wAs

中条節樽踊り

伝承地 記録日 演奏会場
埼玉県熊谷市上中条 平成11.9.15 中条地区敬老会

https://www.youtube.com/watch?v=oub3sKqwLtc

投げ節(村名づくし)

伝承地 記録日 演奏会場
群馬県邑楽郡明和町矢島 平成11.8.1 明和町文化祭

https://www.youtube.com/watch?v=7KEHg90_6FM

旗井盆唄

伝承地 記録日 演奏会場
埼玉県加須市旗井 平成10.8.14 旗井地区盆踊り会場

https://www.youtube.com/watch?v=iEblfgZZDcc

栗橋音頭

伝承地 記録日 演奏会場
埼玉県久喜市栗橋町地区 昭和47年頃 レコード

https://www.youtube.com/watch?v=NNRi_vrZI8g

富田節

伝承地 記録日 演奏会場
栃木県栃木市大平町富田 平成10.10.25 大平町文化祭

https://www.youtube.com/watch?v=mxNVQFUm-Eo

二段落とし(上州自慢、鈴木主水)

伝承地 記録日 演奏会場
高崎市並榎町 平成10.10.4 第4回高崎伝統民俗芸能まつり

https://www.youtube.com/watch?v=jZXIxkN1190

笠ぬき踊り

伝承地 記録日 演奏会場
茨城県筑西市下館 平成25.8.16 下館盆踊り大会

https://www.youtube.com/watch?v=alkmGLOllYY

リーマンの関係式(2)

リーマンの関係式(ii)

 H = \sqrt{-1} ^t\Omega J \bar{\Omega}とおくと、 Hはエルミート行列で、
 H = \sqrt{-1} ^t\Omega J \bar{\Omega} > 0 (正定値)

エルミート行列Hが正定値であることを示すには、
 \forall c = (c_1,\cdots,c_g) \in \mathcal{C}^gに対して
 c^{*}Hc = {}^t\bar{c}Hc > 0
を示せばよい。

 \displaystyle \begin{eqnarray} H &=& \sqrt{-1} ^t\Omega J \bar{\Omega} \\ &=& \sqrt{-1}  \begin{pmatrix} {}^t A & {}^t  B \end{pmatrix} \begin{pmatrix} O & I_g \\ -I_g & O \end{pmatrix} \begin{pmatrix} \bar{A} \\ \bar{B} \end{pmatrix} \\ &=& \sqrt{-1} \begin{pmatrix} {}^t A & {}^t  B \end{pmatrix} \begin{pmatrix} \bar{B} \\ -\bar{A} \end{pmatrix} \\ &=& \sqrt{-1} \begin{pmatrix} {}^t A\bar{B} - & {}^t B\bar{A} \end{pmatrix} \end{eqnarray}


したがって  Hi,j成分を H_{ij}と表すことにすれば、

 \displaystyle \begin{eqnarray} H_{ij} &=& \sqrt{-1} \({}^t A \bar{B} -  {}^t B\bar{A}\)_{ij} \\ &=& \sqrt{-1} \sum_{k=1}^{g} \( ({}^t A)_{ik} (\bar{B})_{kj} - ({}^t B)_{ik} (\bar{A})_{kj} \) \\ &=& \sqrt{-1} \sum_{k=1}^{g} \( a_{ki} \bar{b_{kj}} - b_{ki} \bar{a_{kj}} \) \\ &=& \sqrt{-1} \sum_{k=1}^{g} \(  \int_{\alpha_k} \omega_i \int_{\beta_k} \bar{\omega_j} - \int_{\beta_k} \omega_i \int_{\alpha_k} \bar{\omega_j} \) \end{eqnarray}

となる。

よって
 \omega = \sum_{i=1}^{g} \bar{c_i} \omega_iとおけば、

 \displaystyle \begin{eqnarray} c^{*}Hc &=& {}^t\bar{c}Hc \\ &=& \sum_{i=1}^{g} \sum_{j=1}^{g} \bar{c_i} H_{ij} c_j \\ &=& \sum_{i=1}^{g} \sum_{j=1}^{g} \bar{c_i} \(\sqrt{-1} \sum_{k=1}^{g} \(  \int_{\alpha_k} \omega_i \int_{\beta_k} \bar{\omega_j} - \int_{\beta_k} \omega_i \int_{\alpha_k} \bar{\omega_j} \) \) c_j \\ &=& \sqrt{-1} \sum_{i=1}^{g} \sum_{j=1}^{g} \bar{c_i} \(\sum_{k=1}^{g} \(  \int_{\alpha_k} \omega_i \int_{\beta_k} \bar{\omega_j} - \int_{\beta_k} \omega_i \int_{\alpha_k} \bar{\omega_j} \) \) c_j \\ &=& \sqrt{-1} \sum_{i=1}^{g} \sum_{j=1}^{g} \sum_{k=1}^{g} \(  \int_{\alpha_k} \bar{c_i} \omega_i \int_{\beta_k} c_j \bar{\omega_j} - \int_{\beta_k} \bar{c_i} \omega_i \int_{\alpha_k} c_j \bar{\omega_j} \) \\ &=& \sqrt{-1} \sum_{k=1}^{g} \(  \int_{\alpha_k} \sum_{i=1}^{g} \bar{c_i} \omega_i \int_{\beta_k} \sum_{j=1}^{g} c_j \bar{\omega_j} - \int_{\beta_k} \sum_{i=1}^{g} \bar{c_i} \omega_i \int_{\alpha_k} \sum_{j=1}^{g} c_j \bar{\omega_j} \) \\ &=& \sqrt{-1} \sum_{k=1}^{g} \(  \int_{\alpha_k} \sum_{i=1}^{g} \bar{c_i} \omega_i \int_{\beta_k} \bar{\sum_{j=1}^{g} \bar{c_j} \omega_j} - \int_{\beta_k} \sum_{i=1}^{g} \bar{c_i} \omega_i \int_{\alpha_k} \bar{ \sum_{j=1}^{g} \bar{c_j} \omega_j } \) \\ &=& \sqrt{-1} \sum_{k=1}^{g} \(  \int_{\alpha_k} \omega \int_{\beta_k} \bar{\omega} - \int_{\beta_k} \omega \int_{\alpha_k} \bar{ \omega } \) \end{eqnarray}

となる。

つづく