设计网站页面,临夏州建设厅官方网站,网站技术团队,西宁网站建设的企业一、数据的概括性度量
1、统计学概括#xff1a;
统计学是应用数学的一个分支#xff0c;主要通过利用概率论建立数学模型#xff0c;收集所观察系统的数据#xff0c;进行量化的分析、总结#xff0c;并进而进行推断和预测#xff0c;为相关决策提供依据和参考。统计学主…一、数据的概括性度量
1、统计学概括
统计学是应用数学的一个分支主要通过利用概率论建立数学模型收集所观察系统的数据进行量化的分析、总结并进而进行推断和预测为相关决策提供依据和参考。统计学主要又分为描述统计学和推断统计学。给定一组数据统计学可以摘要并且描述这份数据这个用法称作为描述统计学。另外观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型以之来推论研究中的步骤及母体这种用法被称做推论统计学。
2、数据的概括性度量
1集中趋势的度量
众数众数(Mode)是一组数据中出现次数最多的数值叫众数有时众数在一组数中有好几个。用M表示。
中位数中位数(Median)是指将数据按大小顺序排列起来形成一个数列居于数列中间位置的那个数据。中位数用Me表示。计算公式
四分位数四分位数Quartile把所有数值由小到大排列并分成四等份处于三个分割点位置的数值就是四分位数。QL下四分位数即第25百分位数 n / 4QU上四分位数即第75百分位数 3n / 4。
平均数算术平均数arithmetic mean算术平均数是指资料中各观测值的总和除以观测值个数所得的商简称平均数或均数。
2离散趋势的度量
四分位差四分位差(quartile deviation)也称为内距或四分间距(inter-quartile range)它是上四分位数(QU即位于75%)与下四分位数(QL即位于25%)的差。
极差全距(Range)又称极差是用来表示统计资料中的变异量数(measures of variation)其最大值与最小值之间的差距
方差方差variance)样本方差是各个数据分别与其平均数之差的平方的和的平均数通常以σ2表示方差的计算公式为
标准差标准差 (Standard Deviation)也称均方差Mean square error
。
离散系数离散系数又称变异系数CV(Coefficient of Variance)表示。CV(Coefficient of Variance)标准差与均值的比值。离散系数越小数据的离散程度就越小反之亦然。
3偏度与峰度的度量
偏态系数偏度(Skewness)亦称偏态、偏态系数偏度是统计数据分布偏斜方向和程度的度量是统计数据分布非对称程度的数字特征。Sk 0时分布呈正偏态右偏Sk0时分布呈负偏态左偏。
峰态系数Kurtosis)峰度系数是用来反映频数分布曲线顶端尖峭或扁平程度的指标。在正态分布情况下峰度系数值是3。 3的峰度系数说明观察量更集中有比正态分布更短的尾部3的峰度系数说明观测量不那么集中有比正态分布更长的尾部类似于矩形的均匀分布。峰度系数的标准误用来判断分布的正态性。峰度系数与其标准误的比值用来检验正态性。如果该比值绝对值大于2将拒绝正态性。
3、Python代码实现
import numpy as np
import stats as sts
scores [31, 24, 23, 25, 14, 25, 13, 12, 14, 23,
32, 34, 43, 41, 21, 23, 26, 26, 34, 42,
43, 25, 24, 23, 24, 44, 23, 14, 52,32,
42, 44, 35, 28, 17, 21, 32, 42, 12, 34]
#集中趋势的度量
print(求和,np.sum(scores))
print(个数,len(scores))
print(平均值:,np.mean(scores))
print(中位数:,np.median(scores))
print(众数:,sts.mode(scores))
print(上四分位数,sts.quantile(scores,p0.25))
print(下四分位数,sts.quantile(scores,p0.75))
#离散趋势的度量
print(最大值:,np.max(scores))
print(最小值:,np.min(scores))
print(极差:,np.max(scores)-np.min(scores))
print(四分位差,sts.quantile(scores,p0.75)-sts.quantile(scores,p0.25))
print(标准差:,np.std(scores))
print(方差:,np.var(scores))
print(离散系数:,np.std(scores)/np.mean(scores))
#偏度与峰度的度量
print(偏度:,sts.skewness(scores))
print(峰度:,sts.kurtosis(scores))
以上这篇Python统计学一数据的概括性度量详解就是小编分享给大家的全部内容了希望能给大家一个参考。