描述性统计
原理 / Principle
描述性统计是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体特征,是复杂统计分析的基础。
分析的项目主要包括均值、方差、标准差、最大值、最小值、中位数、偏度、峰度等。
用途 / Noun
在做数据分析的时候,一般首先要对数据进行描述性统计分析,以便于描述测量样本的各种特征及其所代表的总体的特征以及发现其数据的内在规律,再选择进一步分析的方法。描述性统计分析很重要,可以让读者了解你的数据和研究对象的特征,进而帮助更好的分析数据的集中程度及分散程度及正态分布检验,了解进一步的统计分析的结果,有利于查看整体数据的分布特点。
主要参数解释 / Parameter Interpretation
描述性统计的均值为样本的平均值,表示一系列数据或统计总体的平均特征的值。中位数为将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值就是中位数。标准差为总体各单位标志值对其算术平均数离差平方的算术平均数的平方根又称均方差或均方根差。方差为标准差的平方。标准差衡量的是样本的离散程度。标准差主要有两点作用:对样本进行标准化处理和确定异常值。最大值和最小值分别是样本的最大值和最小值。峰度是描述总体中所有取值分布形态陡缓程度的统计量。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。偏度的绝对值数值越大表示其分布形态的偏斜程度越大。