Zスコア計算機

03仕組み

この計算を行う理由

Zスコアは統計学で最も一般的に使用される標準化手法です。観測値を母集団の平均からの標準偏差の数に変換することで、異なる単位を持つ分布間での直接比較が可能になります。あるクラスの成績78点と別のクラスの85点は、クラスの平均とばらつきを知るまでは比較できませんが、Zスコアを使えば比較できます。Zスコアは標準正規分布に直接結びついています。観測値の95%は±1.96σの範囲内に収まり、±3σは99.7%ルールを示します。シックスシグマ品質管理、IQスコア、成長チャート（小児の身長/体重）、心理測定テスト、およびほとんどのA/Bテストは、Zスコアの算術に基づいています。この計算機は、x、μ、σからZスコア、パーセンタイル、片側確率、両側p値を計算し、観測値以下の領域を塗りつぶした正規分布曲線による可視化も提供します。

式

Zスコア: z = (x − μ) / σ。

xは観測値、μは平均、σは標準偏差（0より大きい必要がある）です。zは無次元です。

標準正規分布の累積分布関数 Φ(z): 標準正規確率変数が≤ zである確率。erf近似（Abramowitz & Stegun）により計算されます：erf(x) = 1 − (a₁t + a₂t² + a₃t³ + a₄t⁴ + a₅t⁵) e^(−x²)。ここでt = 1 / (1 + p·x)で、定数p = 0.3275911、aᵢは指定された通りです。Φ(z) = ½(1 + erf(z / √2))。精度は1.5 × 10⁻⁷です。

出力: - z: 標準化された値。 - パーセンタイル: Φ(z) × 100、値が≤ xである母集団の割合。 - P(X ≤ x): パーセンタイル/100と同じ。 - P(X > x): 1 − Φ(z)。 - 両側p値: 2 × min(Φ(z), 1 − Φ(z)) — 仮説検定に有用な、偶然によって|z|以上の値が得られる確率。

解釈の帯: |z| < 0.5 非常に一般的; 0.5–1 一般的; 1–2 注目すべき; 2–3 珍しい; > 3 極端。

使用方法

観測値 x、母集団平均 μ、および標準偏差 σ を入力します。結果パネルには、Zスコア（見出し）、パーセンタイル、両側p値、両方の片側確率、および口頭による解釈が表示されます。チャートは標準正規曲線を描画し、z以下の領域を塗りつぶし、垂直線でzの位置を示します。

計算例

IQスコア120、μ = 100、σ = 15（標準IQスケーリング）。

z = (120 − 100) / 15 = +1.333。
Φ(z) = 0.9088 → 90.88 %ile。
P(X ≤ 120) = 90.88 %; P(X > 120) = 9.12 %。
両側p値: 2 × 9.12 % = 18.24 %。
解釈: 注目すべき (1 < |z| < 2)。

テストの成績78、μ = 70、σ = 10。

z = +0.8。
Φ(0.8) = 0.7881 → 78.81 %ile。

外れ値: 245、μ = 100、σ = 25。

z = (245 − 100) / 25 = +5.8。
Φ(5.8) ≈ 1（計算機精度）; P(X > 5.8 σ) ≈ 3.3 × 10⁻⁹。
解釈: 極端 — 仮定された正規モデルの下でこの規模の事象は事実上不可能である。

注意点

正規性の仮定。パーセンタイルとp値は、基になる分布が正規分布であることを必要とします。非正規データ（歪んだ、裾が重い、多峰性）の場合、Zスコアは計算可能ですが、その確率的解釈は破綻します。実質所得、ウェブリクエスト時間、株式リターンは正規分布ではありません — 「リターンの99パーセンタイル」のZスコアは、正規モデルが予測する+2.33よりもはるかに小さくなる可能性があります。

母集団σ vs. 標本σ。この式では母集団のσを使用します。もし標本があり、標本標準偏差sを使用した場合は、Zスコアではなくt統計量（スチューデントのt分布）を計算していることになります。標本が大きい場合（n > 30）は両者はほぼ同一ですが、標本が小さい場合は明示的にt分布表を使用してください。

外れ値への感度。μとσの両方とも外れ値に敏感です — 単一の極端な値がμを引き寄せ、σを拡大し、すべてのZスコアを歪める可能性があります。ロバストな代替手段（中央値、MAD）は影響を受けにくいです。

近似の限界。計算機内のerf近似は10⁻⁷まで正確です。深い裾の確率（z > 6）については、専門ライブラリ（mpmath、scipy.stats.norm）を使用してください。

両側p値 vs. 片側p値。両側: P(|Z| ≥ |z|)、帰無仮説が「μと異なる」場合に使用されます。片側: P(Z ≥ z)またはP(Z ≤ z)、対立仮説が具体的に「μより大きい」または「μより小さい」場合に使用されます。計算機は両方を表示します。仮説に一致する方を選択してください。

多重検定。100個の観測値に対してZスコアを計算し、「|z| > 2となるものはありますか？」と尋ねた場合、帰無仮説の下でも純粋な偶然によって約5個が期待されます。多重比較にはボンフェローニ補正またはFDR補正が必要です。

標準化は正規分布への変換ではない。非正規変数をZスコア化しても正規分布にはなりません。単にシフトおよびリスケールされるだけです。形状は変わりません。

σ = 0 のエッジケース。σ = 0の場合、計算機は拒否します（分散がない、Zスコアなし）。すべての観測値はμにあります。

非常に大きな|z|。|z| > 38の場合、JSの倍精度浮動小数点数はオーバーフローします。パーセンタイルは0%または100%に飽和します。現実世界のZスコアはめったに8を超えることはありません。

信頼区間 vs. Zスコア。95% CIはz = 1.96を使用します。99% CIはz = 2.576を使用します。これらは観測値ではなく分位数です。計算機は観測値を取り、Zスコアを計算します。逆ではありません。

バリエーション

逆累積分布関数（分位関数）: パーセンタイルが与えられた場合に、対応するzを見つける。異なる問題。
スチューデントのt統計量: 標本σを使用する小標本のアナログ。
標本サイズ計算機: 信頼区間のZスコアを使用。
外れ値検出: Zスコアまたは修正Zスコア（中央値 + MAD）で外れ値をフラグ付け。
シックスシグマCpk指数: 仕様限界までのZ距離に基づくプロセス能力指数。

この計算を行う理由

式

使用方法

計算例

注意点

バリエーション

関連計算機