除了方差、标准差,表示统计资料中一组数据分散情形的还经常用到四分位距(interquartile range, IQR),又称四分差;极差,又称范围误差或全距(range)。将总体的全部数据按大小顺序排列后,如果将全部数据分成相等的两部分,可用1个中位数表示;如果分成四等分,可分别用Q1、Q2、Q3共3个四分位数来表示,数据占比分别为25%、50%、75%。而计算四分位距的公式为IQR = Q3 − Q1。计算极差的公式为=最大值-最小值。
Excel中提供了计算四分位数的函数Quartile。
014 quartile
助记:英文的“quartile”
类别:统计
语法:
quartile(array,quart)
参数:2个参数
说明:
如果数组为空,返回错误值A#NUM!。quart4时,返回错误值A#NUM!;不是整数时,截尾取整。
用法:返回数据集的四分位数。
1)四分位数的确定,有不同的方法。自Excel 2010版起,Excel2007版的四分位数函数QUARTILE被QUARTILE.INC取代,基于N-1的方法;并且增加了一个新函数QUARTILE.EXC,基于 N+1 的方法。公式分别为:
其中的n表示数据个数,p表示Q1、Q2、Q3对应的数据占比,分别为25%、50%、75%。
2)新建一个工作表,输入四分位位置和占比数据,A列从A3开始向下填充n的个数,B3输入公式“=1+($A3=1)*B$2” ,然后拖动B3单元格右下角的填充柄向右填充到D列,在向下填充。
3)我们还是使用左轮手枪射击的例子,输入橙色背景的已知数据;B2公式“=randbetween(1,10)”,填充到B7;D2输入N-1法的公式“=1+(count($B$2:$B$7)-1)*C2/4”,填充到C6,包括了0%和100%;E2公式“=quartile($B$2:$B$7,C2)”,填充到D6,包括5个参数。按F9自动产生新的随机数。
4)头、中、尾的最小值、中位数、最大值很容易明白,Q1和Q3稍微麻烦一点。第三四分位置是4.75,说明这个值在第4、第5数据之间,即5和8之间,但更偏向于8。将两数之差平均分成四份=(8-5)/4=3/4,使用插值法可得出=5+3*3/4=8-3/4=7.25。而第一四分位数位置是2.25,由于都是3,差为0,得到3。
5)四分位距便是Q3-Q1,很简单,把标题和公式“=E5-E3”填入D7、E7。极差的公式没有加,因为下期有更简洁的函数。
6)四分位数常用来绘制箱形图。
7)我们用Excel里面的股价图来近似看一下,按照股价图的顺序排列数据如图,日期下面输入公式“=today()”,开盘“=E3”,盘高“=E6”,盘低“=E2”,收盘“=E5”。
8)选择F1:J2区域,插入-其他图表-股价图的第二种。
9)如图所示,中间的矩形高度就是四分位距,整个图形的高度就是极差。把纵轴最大值固定为10,按F9产生随机数,列出几个典型图形看看。
顶天立地的不稳定水平
数据比较离散
数据相对集中的稳定水平
中值更加集中的水平
10)美中不足的是中位数没有在图形上得到体现。另外从图形上可以看出,极差的缺点是太走极端,没有考虑中间数值,描述数据时不太稳定,所以游泳比赛要去掉极值。
(待续)
———END———
限 时 特 惠: 本站每日持续更新海量各大最新【内部创业教程】,一年会员只需 98 元,全站资源免费下载 点击查看详情
站 长 微 信: webprojs_com