はじめての誤差論のバックアップ差分(No.4)

更新
追加された行はこの色です。
削除された行はこの色です。
#contents

* 概要 [#h3852247]

以下は、筑波大学応用理工学類の１年生向けに開講されている
「物理学実験」という授業のオリエンテーションをかねて
１時間目に学ぶ「誤差論」の部分の教科書原稿です。

当初の執筆者がどなたか、歴代の担当者がどこをどう手直ししてきたかについて
把握できていないのですが、このたび武内が大幅に改訂してまとめました。

確率密度分布や正規分布などを習ったことのない学生向けに１．５〜２コマ程度で
誤差論の概観を把握してもらおうという少し無茶なカリキュラムです。
２年生以降の学生さんが復習するにはちょうど良いかもしれませんので、
ここに上げておこうと思います。

* 誤差論 [#rccd9a95]

　長さ、時間、温度など、どんな物理量を測定する場合でも、種々の要因によって測定には不確かさが含まれ、
''測定値は真の値に一致しない''。この''測定値''と''&ruby(しんち){真値};''との差を''誤差''と呼ぶ。

(1.1)　
&math((誤差) = (測定値) - (真値));

また、誤差と真値との''比''を''相対誤差''と呼び、次元の異なる物理量の不確かさを比較したり、乗除算による誤差の''&ruby(でんぱ){伝播};''を議論する際に用いられる。

(1.2)　
&math((相対誤差) = (誤差) / (真値) \sim ( 誤差) / (測定値));

相対誤差との混同を避けるため、式1.1で定義される誤差を''絶対誤差''と呼ぶこともある。

測定値に含まれる誤差の大きさを正しく見積もることは大変重要である。しかし、実際には''真の値は分からない''から、正確な''誤差の大きさも分からない''。そこで、誤差を評価するには測定値から''真の値を推定し''、また、''誤差の大きさを推定する''ことになる。

* 測定値の表し方 [#e39d2324]

誤差を評価した後の測定結果は、真値の推定値&math(x);と誤差の推定値&math(\delta x); &math((\delta x>0));を用いて

(1.3)　
&math(x\pm \delta x);

のように表す。たとえば、真値の推定値が 27.32、誤差の推定値が 0.02 であれば、

(1.4)　
27.32 ± 0.02

となる。これを &math(27.32\pm 2\times 10^{-2}); などと書いてしまうと、どの桁に誤差が含まれるかが分かりにくいため、真値と誤差の推定値は表示桁をあわせるべきである。

表示桁を合わせて書けば明らかなように、''誤差の推定値に要求される精度''は有効数字１桁〜２桁もあれば十分であり、数桁も求めても無意味である。

* 測定誤差とその原因 [#d4a507a2]

測定誤差はどのような原因によって生じるであろうか。振り子の周期 &math(T); から重力加速度 &math(g); を求める実験を例にとって、測定値に含まれる誤差の原因について考えてみよう。

長さ &math(L=1.85\,\mathrm{m}); の振り子を、初期角 &math(\theta_0=2\,\mathrm{deg}); から振動させる。おもりが最初に最下点を通過したときから測定を始めて、10回振動するのにかかる時間(振動周期の10倍)を、100分の1秒まで測れるストップウォッチで 50 回測定した。得られたデータは次の通りである。（単位は秒）

|27.26|26.99|27.06|27.18|27.25|27.27|27.34|27.27|27.22|27.25|
|27.26|27.18|27.41|27.31|27.28|27.27|27.26|27.24|27.26|27.27|
|27.21|27.22|27.24|27.26|27.27|27.27|27.57|27.34|27.38|27.28|
|27.27|27.44|27.35|27.28|27.18|27.22|27.26|27.37|27.24|27.43|
|27.18|27.27|27.31|27.38|27.25|27.18|27.29|27.38|27.31|27.35|

50個の測定値を平均すると27.28秒となるが、個々の測定値は平均値の周りにランダムに分布している。この分布を調べるため、以下に''ヒストグラム''を示した。

&attachref;

ヒストグラムは、日本語で''&ruby(どすう){度数};分布グラフ''と呼ばれる。棒グラフの個々の棒（''&ruby(はしら){柱};''あるいは英語で''ビン''と呼ばれる）の高さは、対応する範囲の測定値が得られた回数（''度数''）を表している。ここではヒストグラムの''柱の幅（ビンサイズ）''は 0.05秒であり、たとえば 26.95〜27.00 の間に描かれた高さ１の柱は、26.95以上、27.00未満の測定値が１つだけ存在したことを表している。同じ図に示されている曲線は、測定データと同じ平均値、標準偏差を持つ正規分布曲線である（後述）。

ヒストグラムによれば、測定値は平均値27.28秒の近くの &math(27.25 \le T \le 27.30); に集中しており、平均値から離れるに従って度数が減る。平均値のまわりで''測定値がばらつくのは、さまざまな誤差が影響しているため''である。また一般に、この''平均値自体も真の値と一致しない''。

誤差の原因として、以下のようなものが考えられる。次にそれぞれを詳細に検討してみよう。
+ 初期角が一定でなかった・精確でなかった
+ 空気や支点での抵抗により周期が変化した
+ ストップウォッチが不正確
+ 振動回数の数え間違い
+ ストップウォッチを押すときの癖、またはランダムなずれ

** 原因 1. についての検討 [#a6e5e06b]

単振動近似を用いない正確な物理モデルに基づいて、初期角がわずかに異なった際に周期がどれだけ変化するかを数値計算で求めることができる。&math(L = 1.85\,\mathrm{m}); の時の結果を以下に示す。

|初期角(度)|10    |5     |4     |3     |2     |1     |0.5   |
|周期(s)   |2.7352|2.7312|2.7308|2.7304|2.7301|2.7300|2.7300|

この結果によれば、初期角が &math(2^\circ); を中心に &math(\pm 1.5^\circ); の範囲で変化しても、10周期にかかる時間の違いは100分の1秒以下であり、測定結果のばらつきの原因とは考えられない。

** 原因 2. についての検討 [#e1ea471a]

抵抗を考慮して理論式を解くことができる。振幅が半分になる時間を &math(t_0); とすると、初期角が小さい場合の周期は &math(\alpha=(\log 2)/t_0); を減衰定数として、

(1.5)　&math(T=\frac{2\pi}{\sqrt{(g/L)-\alpha^2}}\sim 2\pi\sqrt{L/g}\left\{1+\frac{\alpha^2}{2(g/L)}\right\});

となる。ただし、右辺は &math(\alpha^2); が g/L に比べて小さいことを仮定して近似した結果である。たとえば、抵抗を大きく見積もって &math(t_0); を60秒としても、&math(\alpha^2=1.3\times 10^{-4}\,\mathrm{Hz}); に対して、&math(g/L\sim 5.30\,\mathrm{Hz}^2);であるから、 &math(\alpha^2); は &math(g/L); に比べて１万分の１以下である。したがって、周期を有効数字４桁で測定している場合、 &math(t_0); が60秒程度かそれ以上であれば、周期に対する抵抗の影響は無視できる。

** 原因 3. についての検討 [#ad8328bb]

一般にはストップウォッチは測定に十分な精度を持つと考えられる。しかし、測定結果がどうしても説明できない場合は本当に正確かどうか調べる必要が出てくる。

** 原因 4. についての検討 [#wae28d8f]

周期がおおよそ2.7秒なので、半周期分間違うと誤差は1.4秒程度になる。先の測定例では数え間違いは無いと考えられる。

** 原因 5. についての検討 [#tc0abf6d]

人間が振り子を目で見てストップウォッチを押す場合、この種の誤差は避けられない。この種の誤差を減らすためには、測定に熟達するか、あるいは測定手段自体を改良する必要がある。

* 誤差の分類 [#q9eab509]

上で見たような各種の誤差は、''系統誤差''と''偶発誤差''の２つに大別できる。

** 系統誤差 [#y410e098]

すべての測定結果に決まった関係で導入される誤差で、繰り返し測定を行えば''毎回同じ値の誤差を生じる''。系統誤差は、例えば次のような要因によって生じうる。
- 理論（モデル）の誤り（理論誤差）
- 測定器固有の特性（機械誤差）
- 測定者の一定の癖（個人誤差）

上記の例では、原因 1. と関連して振り子を理想的な調和振動子として扱っている点や、原因 2. で抵抗を無視している点が理論誤差であり、原因 3. による誤差が機械誤差、原因 4. の癖に関する部分が個人誤差に相当する。そのほか、振り子の釣り紐の重さを無視していることなども理論誤差である。

系統誤差は測定値をばらつかせるのではなく、''平均値をずらす''形で測定に影響を与えるため、測定結果から''誤差の存在に気づくのが困難''な場合が多く、その大きさを評価することも難しい。しかし、誤差の原因が分かれば、測定や解析を改良する事で誤差を避けたり、後で補正することで''誤差を完全に取り除く''ことができる場合もある。

** 偶発誤差（偶然誤差ともいう） [#d0705213]

偶発的な原因によって測定結果に導入される誤差で、繰り返し測定を行えば''毎回異なる値の誤差''を生じる。偶発誤差は、次のような要因によって生じる。
- 測定者の過失（過失誤差）
- 測定者のランダムな測定むら、測定器の精度限界（読み取り誤差、必然的偶発誤差）

上記の例では、原因 4. による誤差が過失誤差、原因 5. による誤差が必然的偶発誤差に相当する。

偶発誤差は、系統誤差とは異なり、後から理論的に補正することができないものの、測定を繰り返した際に''測定値のばらつき''として目に見える形で現れるため''発見が容易''であり、以下に示すように''統計的な処理''を行うことで''大きさを評価''したり、''誤差を小さくする''ことが可能である。

系統誤差は測定対象や測定環境ごとに個々に検討する必要があり、統一した理論により扱うことが難しいのに対して、偶発誤差についてはそれを扱う統一的な手法が確立されている。
以下では系統誤差が十分に小さいか、あるいは何らかの方法ですでに取り除かれており、主に必然的偶発誤差が測定精度を決めている場合を考える。また、誤差とは必然的偶発誤差を意味するものとする。

* 誤差の分布（確率分布） [#a2360208]

誤差を含む測定では、測定値 &math(x); は測定ごとに異なる値を取る。誤差論では、この測定値 &math(x); が、ある''確率分布'' &math(f_x(x)); を持つと仮定する。

確率分布 &math(f_x(x)); の意味するところは、一回の測定で &math(x); が &math(x_a<x<x_b); の範囲に入る確率 &math(P); を、

(1.6)　
&math(P\{x_a<x<x_b\}=\int_{x_a}^{x_b}f_x(x)dx);

として求められるということである。

前ページの図に確率分布の例を示した。多くの場合、&math(f_x(x)); は真値 &math(x^\ast); の周りで大きな値を取り、離れるにしたがって小さくなる。上の定義により、測定値が &math(x); のある範囲（ここでは &math(x_a<x<x_b); ）に入る確率は、図のように &math(f_x(x)); で定義される''面積に等しい''。したがって、&math(f_x(x)); が真値の周りで大きな値を取ることは、測定において真値に近い &math(x); が得られる確率が、真値から遠い &math(x); が得られる確率に比べて高いことを示している。

&math(f_x(x)); の形は測定対象により様々であるが、測定を行えば必ず何らかの値が得られることから、
&math(f_x(x)); を全範囲にわたって積分した値は常に１になる。

(1.7)　
&math(P\{-\infty<x<\infty\}=\int_{-\infty}^\infty f_x(x)dx=1);

また、&math(f_x(x)); の''期待値'' &math(\langle f_x(x)\rangle); は次の形で定義される。

(1.8)　
&math(\langle f_x(x)\rangle=\int_{-\infty}^\infty xf_x(x)dx);

以下では &math(f_x(x)); は真値 &math(x^\ast); の周りで平均的に分布しており &math(\langle f_x(x)\rangle); が &math(x^\ast); と一致する場合を考える。測定条件の設定に誤差が含まれたり、系統誤差が無視できない場合を除いて、妥当な仮定である。

(1.9)　
&math(x^\ast=\langle f_x(x)\rangle);

測定誤差の大きさは &math(f_x(x)); の''標準偏差'' &math(\sigma_x^\ast); で評価することができる。

(1.10)　
&math(\sigma_x^\ast=\sqrt{\int_{-\infty}^{\infty} (x-x^\ast)^2f_x(x)dx});

&math(\sigma_x^\ast); が大きければ真値 &math(x^\ast); から離れた &math(x); が測定される確率が高く、測定誤差が大きいことになる。

標準偏差がどうしてこのような形で定義されるかに興味のある学生は、
「測定値の真値からのずれ」の期待値を単純に求めてしまうと、

&math(\int_{-\infty}^{\infty} (x-x^\ast) f_x(x)dx=\int_{-\infty}^{\infty} x f_x(x)dx-x^\ast \int_{-\infty}^{\infty} f_x(x)dx=x^\ast - x^\ast \times 1 = 0);

のようにゼロになってしまうことに注意せよ。

期待値がゼロにならないように「ずれの期待値」を定義する方法としては、

&math(\int_{-\infty}^{\infty} |x-x^\ast| f_x(x)dx);

のように「ずれの絶対値の期待値」を評価する方法もあるが、「ずれの２乗の期待値」を

&math({\sigma_x^\ast}^2=\int_{-\infty}^{\infty} (x-x^\ast)^2f_x(x)dx);

として''分散''と呼び、その平方根を上記のように標準偏差とした方が数学的に扱いやすく、
さまざまな発展がある。このあたりは統計学の教科書を参考にすること。

* 測定値の統計処理 [#g98966f0]

ある測定を行うにあたって、測定値の確率分布 &math(f_x(x)); は未知であるから、測定精度を高め、また誤差を評価するためには、''同じ測定を多数回行い''、それらの値から''統計処理''によって &math(x^\ast); や &math(\sigma^\ast); を推定することになる。ここでは、&math(n); 回の測定で測定値 &math(\{x_k\}=x_1,x_2,\dots,x_n); が得られたとしよう。

このとき、真値 &math(x^\ast); の最良推定値は測定値 &math(\{x_k\}); の平均値 &math(\bar x); で与えられる。

(1.11)　
&math(\bar x=\frac{1}{n}\sum_{k=1}^n x_k=(x_1+x_2+\dots+x_n)/n);

測定値 &math(\{x_k\}); の''分散'' &math(\sigma_x^2); および''標準偏差'' &math(\sigma_x); は以下のように定義される。

(1.12)　
&math(\sigma_x^2=\frac{1}{n}\sum_{k=1}^n (x_k-\bar x)^2=\left[\frac{1}{n}\sum_{k=1}^n x_k^2\right]-\bar x^2);

(1.13)　
&math(\sigma_x=\sqrt{\sigma_x^2});

&math(f_x(x)); の標準偏差 &math(\sigma_x^\ast); と測定値 &math(\{x_k\}); の標準偏差 &math(\sigma_x); とを区別して考える必要がある。一般に、&math(n); が十分に大きいとき、&math(\sigma_x); は &math(\sigma_x^\ast); に近い値が得られることが期待される。しかし、&math(n); が有限の時、''&math(\sigma_x^\ast); の最良推定値は &math(\sigma_x); ではない''。正しい推定値は以下の形で与えられる。

(1.14)　
&math(\sigma'_x=\sqrt{\frac{n}{n-1}}\sigma_x=\sqrt{\frac{1}{n-1}\sum_{k=1}^n (x-\bar x)^2});

* 大数の法則 [#fde95c6e]
Counter: 473588 (from 2010/06/03), today: 64, yesterday: 0