简单来说,标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
例如,两组数的集合{0,5,9,14}和{5,6,8,9}其平均值都是7,但第二个集合具有较小的标准差。
标准差的大小是根据数据的变化程度来界定的。
标准差越大,说明数据的分布越分散,标准差越小,说明数据的分布越集中。
具体来说,标准差的大小可以通过对数据的变异系数或离散系数进行计算来确定。
一般来说,数据的标准差与平均值的关系越密切,标准差的大小就越能体现数据的变化程度。
另外,在统计学中,标准差的大小还可以用来确定正态分布的范围,进而推导出一个有用的基本原理——68-95-99.7法则,即一组服从正态分布的数据中,约有68%的数据会分布在平均值的正负一个标准差范围内,95%的数据会分布在平均值的正负两个标准差范围内,99.7%的数据会分布在平均值的正负三个标准差范围内。
标准差合理范围约等于数据的四分之一。随着样本数(或测量次数)n的增大,标准差趋向某个稳定值,即样本标准差s越接近总体标准差σ,而标准误则随着样本数(或测量次数)n的增大逐渐减小,即样本平均数越接近总体平均数μ。标准偏差是一种度量数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。