[このページの編集履歴]

はじめての誤差論

Top / はじめての誤差論

概要

以下は、筑波大学応用理工学類の1年生向けに開講されている 「物理学実験」という授業のオリエンテーションをかねて 1時間目に学ぶ「誤差論」の部分の教科書原稿です。

歴代の担当者が少しずつ手直ししてきた内容で、 最近はかなりの部分に武内の手も入っています。

物理学実験では確率密度分布や正規分布などを習ったことのない学生向けに 1.5〜2コマ程度で誤差論の概観を把握してもらおうという少し無茶な カリキュラムで教えているのですが、 2年生以降の学生さんが復習するにはちょうど良いかもしれませんので ここに上げておこうと思います。

誤差論

 長さ、時間、温度など、どんな物理量を測定する場合でも、種々の要因によって測定には不確かさが含まれ、 測定値は真の値に一致しない。この測定値真値(しんち)との差を誤差と呼ぶ。

 (1)  (誤差) = (測定値) - (真値)

また、誤差と真値との相対誤差と呼び、次元の異なる物理量の不確かさを比較したり、乗除算による誤差の伝播(でんぱ)を議論する際に用いられる。

 (2)  (相対誤差) = (誤差) / (真値) \sim ( 誤差) / (測定値)

相対誤差との混同を避けるため、式1.1で定義される誤差を絶対誤差と呼ぶこともある。

測定値に含まれる誤差の大きさを正しく見積もることは大変重要である。しかし、実際には真の値は分からないから、正確な誤差の大きさも分からない。そこで、誤差を評価するには測定値から真の値を推定し、また、誤差の大きさを推定することになる。

測定値の表し方

誤差を評価した後の測定結果は、真値の推定値 x と誤差の推定値 \delta x (\delta x>0) を用いて

 (3)  x\pm \delta x

のように表す。たとえば、真値の推定値が 27.32、誤差の推定値が 0.02 であれば、

 (4)  27.32 ± 0.02

となる。これを 27.32\pm 2\times 10^{-2} などと書いてしまうと、どの桁に誤差が含まれるかが分かりにくいため、真値と誤差の推定値は表示桁をあわせるべきである。

表示桁を合わせて書けば明らかなように、誤差の推定値に要求される精度は有効数字1桁〜2桁もあれば十分であり、数桁も求めても無意味である。

測定誤差とその原因

測定誤差はどのような原因によって生じるであろうか。振り子の周期 T から重力加速度 g を求める実験を例にとって、測定値に含まれる誤差の原因について考えてみよう。

長さ L=1.85\,\mathrm{m} の振り子を、初期角 \theta_0=2\,\mathrm{deg} から振動させる。おもりが最初に最下点を通過したときから測定を始めて、10回振動するのにかかる時間(振動周期の10倍)を、100分の1秒まで測れるストップウォッチで 50 回測定した。得られたデータは次の通りである。(単位は秒)

27.2626.9927.0627.1827.2527.2727.3427.2727.2227.25
27.2627.1827.4127.3127.2827.2727.2627.2427.2627.27
27.2127.2227.2427.2627.2727.2727.5727.3427.3827.28
27.2727.4427.3527.2827.1827.2227.2627.3727.2427.43
27.1827.2727.3127.3827.2527.1827.2927.3827.3127.35

50個の測定値を平均すると27.28秒となるが、個々の測定値は平均値の周りにランダムに分布している。この分布を調べるため、以下にヒストグラムを示した。

[添付]

ヒストグラムは、日本語で度数(どすう)分布グラフと呼ばれる。棒グラフの個々の棒((はしら)あるいは英語でビンと呼ばれる)の高さは、対応する範囲の測定値が得られた回数(度数)を表している。ここではヒストグラムの柱の幅(ビンサイズ)は 0.05秒であり、たとえば 26.95〜27.00 の間に描かれた高さ1の柱は、26.95以上、27.00未満の測定値が1つだけ存在したことを表している。同じ図に示されている曲線は、測定データと同じ平均値、標準偏差を持つ正規分布曲線である(後述)。

ヒストグラムによれば、測定値は平均値27.28秒の近くの 27.25 \le T \le 27.30 に集中しており、平均値から離れるに従って度数が減る。平均値のまわりで測定値がばらつくのは、さまざまな誤差が影響しているためである。また一般に、この平均値自体も真の値と一致しない

誤差の原因として、以下のようなものが考えられる。次にそれぞれを詳細に検討してみよう。

  1. 初期角が一定でなかった・精確でなかった
  2. 空気や支点での抵抗により周期が変化した
  3. ストップウォッチが不正確
  4. 振動回数の数え間違い
  5. ストップウォッチを押すときの癖、またはランダムなずれ

原因 1. についての検討

単振動近似を用いない正確な物理モデルに基づいて、初期角がわずかに異なった際に周期がどれだけ変化するかを数値計算で求めることができる。 L = 1.85\,\mathrm{m} の時の結果を以下に示す。

初期角(度)10543210.5
周期(s)2.73522.73122.73082.73042.73012.73002.7300

この結果によれば、初期角が 2^\circ を中心に \pm 1.5^\circ の範囲で変化しても、10周期にかかる時間の違いは100分の1秒以下であり、測定結果のばらつきの原因とは考えられない。

原因 2. についての検討

抵抗を考慮して理論式を解くことができる。振幅が半分になる時間を t_0 とすると、初期角が小さい場合の周期は \alpha=(\log 2)/t_0 を減衰定数として、

 (5)  T=\frac{2\pi}{\sqrt{(g/L)-\alpha^2}}\sim 2\pi\sqrt{L/g}\left\{1+\frac{\alpha^2}{2(g/L)}\right\}

となる。ただし、右辺は \alpha^2 が g/L に比べて小さいことを仮定して近似した結果である。たとえば、抵抗を大きく見積もって t_0 を60秒としても、 \alpha^2=1.3\times 10^{-4}\,\mathrm{Hz} に対して、 g/L\sim 5.30\,\mathrm{Hz}^2 であるから、 \alpha^2 g/L に比べて1万分の1以下である。したがって、周期を有効数字4桁で測定している場合、 t_0 が60秒程度かそれ以上であれば、周期に対する抵抗の影響は無視できる。

原因 3. についての検討

一般にはストップウォッチは測定に十分な精度を持つと考えられる。しかし、測定結果がどうしても説明できない場合は本当に正確かどうか調べる必要が出てくる。

原因 4. についての検討

周期がおおよそ2.7秒なので、半周期分間違うと誤差は1.4秒程度になる。先の測定例では数え間違いは無いと考えられる。

原因 5. についての検討

人間が振り子を目で見てストップウォッチを押す場合、この種の誤差は避けられない。この種の誤差を減らすためには、測定に熟達するか、あるいは測定手段自体を改良する必要がある。

誤差の分類

上で見たような各種の誤差は、系統誤差偶発誤差の2つに大別できる。

系統誤差

すべての測定結果に決まった関係で導入される誤差で、繰り返し測定を行えば毎回同じ値の誤差を生じる。系統誤差は、例えば次のような要因によって生じうる。

  • 理論(モデル)の誤り(理論誤差)
  • 測定器固有の特性(機械誤差)
  • 測定者の一定の癖(個人誤差)

上記の例では、原因 1. と関連して振り子を理想的な調和振動子として扱っている点や、原因 2. で抵抗を無視している点が理論誤差であり、原因 3. による誤差が機械誤差、原因 4. の癖に関する部分が個人誤差に相当する。そのほか、振り子の釣り紐の重さを無視していることなども理論誤差である。

系統誤差は測定値をばらつかせるのではなく、平均値をずらす形で測定に影響を与えるため、測定結果から誤差の存在に気づくのが困難な場合が多く、その大きさを評価することも難しい。しかし、誤差の原因が分かれば、測定や解析を改良する事で誤差を避けたり、後で補正することで誤差を完全に取り除くことができる場合もある。

偶発誤差(偶然誤差ともいう)

偶発的な原因によって測定結果に導入される誤差で、繰り返し測定を行えば毎回異なる値の誤差を生じる。偶発誤差は、次のような要因によって生じる。

  • 測定者の過失(過失誤差)
  • 測定者のランダムな測定むら、測定器の精度限界(読み取り誤差、必然的偶発誤差)

上記の例では、原因 4. による誤差が過失誤差、原因 5. による誤差が必然的偶発誤差に相当する。

偶発誤差は、系統誤差とは異なり、後から理論的に補正することができないものの、測定を繰り返した際に測定値のばらつきとして目に見える形で現れるため発見が容易であり、以下に示すように統計的な処理を行うことで大きさを評価したり、誤差を小さくすることが可能である。

系統誤差は測定対象や測定環境ごとに個々に検討する必要があり、統一した理論により扱うことが難しいのに対して、偶発誤差についてはそれを扱う統一的な手法が確立されている。 以下では系統誤差が十分に小さいか、あるいは何らかの方法ですでに取り除かれており、主に必然的偶発誤差が測定精度を決めている場合を考える。また、誤差とは必然的偶発誤差を意味するものとする。

誤差の分布(確率分布)

誤差を含む測定では、測定値 x は測定ごとに異なる値を取る。誤差論では、この測定値 x が、ある確率分布 f_x(x) を持つと仮定する。

確率分布 f_x(x) の意味するところは、一回の測定で x x_a<x<x_b の範囲に入る確率 P を、

 (6)  P\{x_a<x<x_b\}=\int_{x_a}^{x_b}f_x(x)dx

として求められるということである。

前ページの図に確率分布の例を示した。多くの場合、 f_x(x) は真値 x^\ast の周りで大きな値を取り、離れるにしたがって小さくなる。上の定義により、測定値が x のある範囲(ここでは x_a<x<x_b )に入る確率は、図のように f_x(x) で定義される面積に等しい。したがって、 f_x(x) が真値の周りで大きな値を取ることは、測定において真値に近い x が得られる確率が、真値から遠い x が得られる確率に比べて高いことを示している。

f_x(x) の形は測定対象により様々であるが、測定を行えば必ず何らかの値が得られることから、 f_x(x) を全範囲にわたって積分した値は常に1になる。

 (7)  P\{-\infty<x<\infty\}=\int_{-\infty}^\infty f_x(x)dx=1

また、 f_x(x) 期待値 \langle f_x(x)\rangle は次の形で定義される。

 (8)  \langle f_x(x)\rangle=\int_{-\infty}^\infty xf_x(x)dx

以下では f_x(x) は真値 x^\ast の周りで平均的に分布しており \langle f_x(x)\rangle x^\ast と一致する場合を考える。測定条件の設定に誤差が含まれたり、系統誤差が無視できない場合を除いて、妥当な仮定である。

 (9)  x^\ast=\langle f_x(x)\rangle

測定誤差の大きさは f_x(x) 標準偏差 \sigma_x^\ast で評価することができる。

 (10)  \sigma_x^\ast=\sqrt{\int_{-\infty}^{\infty} (x-x^\ast)^2f_x(x)dx}

\sigma_x^\ast が大きければ真値 x^\ast から離れた x が測定される確率が高く、測定誤差が大きいことになる。

標準偏差がどうしてこのような形で定義されるかに興味のある学生は、 「測定値の真値からのずれ」の期待値を単純に求めてしまうと、

\int_{-\infty}^{\infty} (x-x^\ast) f_x(x)dx=\int_{-\infty}^{\infty} x f_x(x)dx-x^\ast \int_{-\infty}^{\infty} f_x(x)dx=x^\ast - x^\ast \times 1 = 0

のようにゼロになってしまうことに注意せよ。

期待値がゼロにならないように「ずれの期待値」を定義する方法としては、

\int_{-\infty}^{\infty} |x-x^\ast| f_x(x)dx

のように「ずれの絶対値の期待値」を評価する方法もあるが、「ずれの2乗の期待値」を

{\sigma_x^\ast}^2=\int_{-\infty}^{\infty} (x-x^\ast)^2f_x(x)dx

として分散と呼び、その平方根を上記のように標準偏差とした方が数学的に扱いやすく、 さまざまな発展がある。このあたりは統計学の教科書を参考にすること。

測定値の統計処理

ある測定を行うにあたって、測定値の確率分布 f_x(x) は未知であるから、測定精度を高め、また誤差を評価するためには、同じ測定を多数回行い、それらの値から統計処理によって x^\ast \sigma^\ast を推定することになる。ここでは、 n 回の測定で測定値 \{x_k\}=x_1,x_2,\dots,x_n が得られたとしよう。

このとき、真値 x^\ast の最良推定値は測定値 \{x_k\} の平均値 \bar x で与えられる。

 (11)  \bar x=\frac{1}{n}\sum_{k=1}^n x_k=(x_1+x_2+\dots+x_n)/n

測定値 \{x_k\} 分散 \sigma_x^2 および標準偏差 \sigma_x は以下のように定義される。

 (12)  \sigma_x^2=\frac{1}{n}\sum_{k=1}^n (x_k-\bar x)^2=\left[\frac{1}{n}\sum_{k=1}^n x_k^2\right]-\bar x^2

 (13)  \sigma_x=\sqrt{\sigma_x^2}

f_x(x) の標準偏差 \sigma_x^\ast と測定値 \{x_k\} の標準偏差 \sigma_x とを区別して考える必要がある。一般に、 n が十分に大きいとき、 \sigma_x \sigma_x^\ast に近い値が得られることが期待される。しかし、 n が有限の時、 \sigma_x^\ast の最良推定値は \sigma_x ではない。正しい推定値は以下の形で与えられる。

 (14)  \sigma'_x=\sqrt{\frac{n}{n-1}}\sigma_x=\sqrt{\frac{1}{n-1}\sum_{k=1}^n (x-\bar x)^2}

大数の法則

式11から真値を、式14から確率分布の標準偏差を推定する事ができた。多数回の測定から推定した \bar x は、個々の測定で得られる x_k に比べ、より真値 x^\ast に近い値であることが期待される。しかし、いくら測定回数を増やしても誤差をゼロにする事はできない。つまり、平均値 \bar x 自体もある確率分布 f_{\bar x}(x) に従う。では、 \bar x に含まれる誤差はどのように推定すればよいだろうか?

大数の法則によれば、測定回数 n が大きいとき、 \bar x の確率分布 f_{\bar x}(x) は元の確率分布 f_x(x) の形によらず、

 (15)  f_{\bar x}(x)\rightarrow \frac{1}{\sqrt{2\pi}\sigma_{\bar x}^\ast}\exp\left\{-\frac{(x-x^\ast)^2}{2{\sigma_{\bar x}^\ast}^2}\right\}

の形に近づく。この右辺はガウス関数(ガウシアン)、あるいは正規分布関数と呼ばれ、この分布を正規分布と呼ぶ。 x^\ast x の期待値であるが、 \bar x の期待値も同じ値となる。一方、 \sigma_{\bar x}^\ast \bar x の標準偏差を与えるが、これは x の標準偏差 \sigma_x^\ast を用いて

 (16)  \sigma_{\bar x}^\ast=\frac{1}{\sqrt n}\sigma_x^\ast

と表せる。すなわち、 f_{\bar x}(x) f_x(x) と同じ値を中心として、 1/\sqrt n の幅を持つ関数となる。確率分布関数の幅が狭くなることは誤差が小さくなることを表すから、 n 回の測定の平均値を取ることで、偶発誤差を1回の測定の 1/\sqrt n にできると覚えると良い。

標準誤差

式14と式16より、多数回の測定から式11を使って求めた平均値 \bar x に含まれる誤差は、

 (17)  \sigma_{\bar x}'=\frac{1}{\sqrt n}\sigma_x'=\sqrt{\frac{1}{n(n-1)}\sum_{k=1}^n(x_k-\bar x)^2}

と推定でき、測定結果を式3にならって次の様に書ける。

 (18)  \bar x\pm \sigma_{\bar x}'

推定した測定誤差を \sigma_{\bar x}' を用いて表すとき、これを標準誤差と呼ぶ。先の振り子の測定例では、 \bar T=2.728\,\mathrm{[s]} \sigma_T'=0.0092\,\mathrm{[s]} n=50 であるから、標準誤差 \sigma_{\bar x}'=0.0013\,\mathrm{[s]} となる。

 (19)  T=2.728\pm 0.0013\,\mathrm{[s]}

別の表記法として、

 (20)  T=2.728(1)\,\mathrm{[s]}

という表し方もよく用いられる。

誤差推定の意味

ここまで「誤差の推定値」という言葉を正確に定義せずに用いてきた。正規分布では期待値からどんなにかけ離れた値を取る確率もゼロではない。つまり、運が悪ければ極端に真値からかけ離れた値が得られることもある。つまり「誤差の最大値」は存在しない。一方で、測定値の周りにある幅を持った領域を取れば、真値がその範囲に入る確率を予想する事ができる。正規分布は、

 (21)  \int_{\mu-\sigma}^{\mu+\sigma}\frac{1}{\sqrt{2\pi}\sigma}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\}dx\sim 0.683

となる性質があるため、得られた推定値 \bar x が真値 x^\ast の周りの \sigma_{\bar x}' の範囲に入る確率、つまり、実際の誤差が推定された標準誤差より小さくなる確率は約 68.3% である。逆に言えば、31.7% の確率で、実際の誤差が標準誤差 \sigma_{\bar x}' よりも大きくなる。

この様子を見るため、上で示した x のヒストグラムには測定値から予測された x の期待値 \bar x と、標準偏差 \sigma_x' を元にして、これらと同じ期待値、標準偏差を持つ正規分布曲線を重ねて示した。縦に等間隔に引かれた点線は、期待値 \bar x を中心に、標準誤差 \sigma_x' の間隔で引かれている。 \bar x\pm \sigma_x' の範囲の外にも多くのデータが分布している事が分かる。

範囲をこれより広く取り、平均値から \pm 2\sigma_x' \pm 3\sigma_x' の範囲を考えれば、測定点が範囲に入る確率が高くなり、それぞれ約95.5%、約99.7%の確率で、測定点がこれらの範囲に入る事になる。目的によっては、誤差の推定方法を明記した上で推定される測定誤差を 2\sigma 3\sigma で表すことも行われる。

このように、測定データに付けられた誤差範囲は、必ずその範囲に真の値があると主張するものではない。あくまで統計的に誤差の大きさを評価した物である事を覚えておく必要がある。

間接測定量の測定精度

長さや時間のように、直接測定できる物理量を直接測定量という。対して、直接測定量の関数として求められる量を間接測定量という。上の例では、振り子の長さ、重さ、10周期などが直接測定量であり、それらの値を使って計算で求める重力加速度や1周期が間接測定量である。後述の誤差伝播(でんぱ)の考え方を用いると、間接測定量の精度について検討することができる。ここでは、振り子の周期の誤差が重力加速度の測定精度にどの程度影響を与えるかを検討してみる。

振り子の振幅が小さいときに成り立つ関係式

 (22)  T=2\pi\sqrt{L/g}

より、

 (23)  g=4\pi^2LT^{-2}

と書ける。このとき、誤差伝播の式(付録の式E.4)から、最大誤差を次の形で書ける。

 (24)  \left|\frac{\delta g}{g}\right|\le2\left|\frac{\delta \pi}{\pi}\right|+\left|\frac{\delta L}{L}\right|+2\left|\frac{\delta T}{T}\right|

数学では \pi は定数で誤差はないが、実際の計算では無理数 \pi をある実数で近似するため、丸め誤差 \delta\pi が生じてしまう。

それでは、重力加速度 g 9.80\,\mathrm{m/s}^2 9.81\,\mathrm{m/s}^2 かを区別するためには、 \pi , L , T にどの程度の精度が必要であろうか。この2つの値を実験的に区別するには、およそ \left|\delta g/g\right|<0.01/9.8\sim 0.001 とする必要がある。式14の右辺に出てくる誤差はそれぞれ独立だから、少なくとも右辺の各項を 0.001 よりも小さくする必要がある。この条件は、それぞれ以下の制限を与える。

 (25)  |\delta\pi|<(0.001/2)\pi\sim 1.6\times 10^{-3}

 (26)  |\delta L|< 0.001\times 1.85\,\mathrm{m}\sim 1.85\,\mathrm{mm}

 (27)  |\delta T|<(0.001/2)\times 2.73\,\mathrm{s}\sim 1.36\times 10^{-3}\,\mathrm{s}

したがって、 \pi については 3.14 としたのでは不十分であり、少なくとも 3.1416 として計算する必要がある。また、振り子の長さ L については 1 mm 程度の精度で測定しなければならない。周期 T については、先の測定例における標準誤差は 0.0013 (s) であるから、上記の精度を満足している。しかし、もし測定回数が10回であるとしたら、標準誤差が 0.0029 (s) となり、精度が足りない。


Last-modified: 2012-10-23 (火) 01:43:54 (680d)