ホーム » Taiki Bessho の投稿 (ページ 13)

作者アーカイブ: Taiki Bessho

ノイズの計算 (準備)

ノイズについてより深く説明します.
#説明しながら数学も少し使います.

キーワード

  • 測定
  • ノイズ量を表す指標
  • 分散\sigma^2,標準偏差\sigma

まとめ

  • 測定値に含まれる誤差がノイズ
  • ノイズの量は分散\sigma^2と標準偏差\sigmaによって表される.
  • 天体写真がザラザラするのは標準偏差\sigmaがシグナルSに対して大きく,S/Nが小さいから

一度ノイズをより深く理解すると,非常に有益な多くの実用的な知識が芋づる式に分かります.例を挙げればきりがありませんが,例えば以下のことが分かるようになります.

  • S/Nについて理解が深まるため,天体写真でコンポジットを行うことが何故有効なのか
  • フラット画像を作る際は非常に多くの枚数をコンポジットする必要がある
  • ダーク減算をすると実は天体写真の背景ノイズが大きくなる場合がある

ノイズを理解するために,まずノイズの量を表す指標である分散\sigma ^2と標準偏差\sigmaについて説明します.

いきなり天体写真の場合について考えると難しいので,鉛筆の長さを定規で測る例を使って考えていきます.

アセット 1長さが150.0mmだと既に分かっている鉛筆をものさしで計ったところ,誤差により150.1mmと計れてしまったとしましょう.
この誤差0.1mmは「ものさしの当て方」,「目盛りを読み取るときのズレ」などが主な原因でしょう.これらは偶然発生したもので,再現性はないので偶然誤差(ノイズ)です.
再現性がないため次にもう一度計ると誤差の量が変わって今度は150.3mmや149.8mmに計れることもあるでしょう.

この例では鉛筆の長さ(真の値)が150.0mmであることがあらかじめ分かっていましたが,普通何かを測定する場合は真の値が分からないことがほとんどです.したがって測定値から真の値がどのあたりにありそうかを推定することになります.

そのためには測定値にどのくらいの誤差が含まれているか知る必要があります.

測定値に含まれる誤差の大きさを表す指標として分散\sigma ^2と標準偏差\sigmaというものがあります.それぞれ順に説明していきます.
(ギリシャ文字\sigmaは「シグマ」と読みます.)

先ほどの鉛筆をものさしで連続N回計ることを考えましょう.第i回目の測定値をX_iとします.つまりii=1,2,\dots,Nと何回目の測定かを表します.N回の測定の平均値を\muと書きます.つまり\mu = \frac{X_1+X_2+\cdots+X_N}{N}です.
(ギリシャ文字\muは「ミュー」と読みます).

このとき分散\sigma^2は次で定義されます:

(1)   \begin{align*} \sigma ^2 = \frac{(X_1-\mu)^2 + (X_2-\mu)^2 + \cdots + (X_N -\mu)^2}{N} \end{align*}

そして標準偏差\sigmaはその平方根で定義されます:

(2)   \begin{align*} \sigma = \frac{\sqrt{(X_1-\mu)^2 + (X_2-\mu)^2 + \cdots + (X_N -\mu)^2}}{\sqrt{N}} \end{align*}

文字のままだとイメージがわきにくいので,具体的に3回測定した場合(N=3)で計算してみましょう.
最初の測定値がX_1 = 150.1\text{mm}, 2回目がX_2 = 150.3\text{mm}, 3回目がX_3 = 149.8\text{mm}だったとします.このとき平均値は\mu=\frac{150.1+150.3+149.8}{3}=150.067 \fallingdotseq 150.1\text{mm}です.
これから分散\sigma^2を求めると:

(3)   \begin{align*} \sigma ^2 &= \frac{(150.1-150.07)^2 + (150.3-150.07)^2 + (149.8 -150.07)^2}{3}\\ &\fallingdotseq 0.04223\text{mm}^2 \end{align*}

と計算出来ます.
(計算式中で平均値\muの値として150.1ではなく150.07を用いたのは計算の精度を上げるためです)
標準偏差\sigmaを求めるにはこの平方根を取って:

(4)   \begin{align*} \sigma = \sqrt{\sigma ^2} = 0.2055\text{mm} \end{align*}

となります.

測定値とその誤差を表す際に今求めた標準偏差\sigma=0.2055\fallingdotseq 0.2\text{mm}を使って

    \[150.1\pm0.2\text{[mm]}\]

と書けます.

真の値150.0mmがちゃんと標準偏差\sigmaの範囲内で含まれているので,この3回の測定は悪くない測定だったと言うことが出来ます.


さて,数式や具体的な計算をしながら分散\sigma^2と標準偏差\sigmaを説明しました.ここで特に覚えておいて欲しいのは

「測定値に含まれる誤差の大きさを表すのに分散\sigma^2と標準偏差\sigmaが使われる」

ということです.


天体写真では写真の滑らかさを表すのにS/Nが使われますが,N=\sigmaなのです.

写真がノイズでザラザラに見えるのはシグナルSに対して標準偏差\sigmaが大きいからだと言えます.

ここで説明しているのは厳密には「標本平均」「標本分散」「標本の標準偏差」です.
本来ならば有限回の試行回数でものさしの測定精度を見積もるためには「不偏分散」「標準偏差の不偏推定量」を考えるべきですが,ここでは話を簡単にするため「標本分散」「標本の標準偏差」で代用しました.)