如何写论文?写好论文?免费论文网提供各类免费论文写作素材!
当前位置:免费论文网 > 范文百科 > 非参数假设检验

非参数假设检验

来源:免费论文网 | 时间:2016-10-27 14:51:10 | 移动端:非参数假设检验

篇一:非参数假设检验法及其运用

非参数假设检验法及其运用

摘要:在国际金融危机下,以中国股市数据为依据,运用S-plus 统计分析软件和 Excel ,对中国股市正态分布假设进行了Kolmogorv拟合优度检验,运用方差平方秩检验方法,比较分析了上证指数和深证综指的波动性。

关键字:股市;Kolmogorov拟合优度检验;秩检验。

引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验。王金玉、李霞、潘德惠(2005)通过引入一种新的估计方法“非参数假设检验方法”, 以达到对证券投资咨询机构,对证券市场大盘走势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验,对上证指数与深成指间协整关系进行了研究,结论是:上证指数与深圳成指之间确实存在非线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市波动性特征的合适的统计模型。

在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用 Kolmogorov拟合优度检验,对中国股市进行了正态分布假设检验;运用方差平方秩检验方法,比较分析了上海指数和深圳综指的波动性。

正文:

一、Kolmogorov拟合优度检验以及方差的平方秩检验方法。

(一) Kolmogorov拟合优度检验

1. 原假设和备择假设

原假设H0:样本来自于正态分布总体。

备择假设H1:样本不是来自于正态分布总体。

2. 检验统计量

令S (x) 是样本X1、X2、?Xn、的经验分布函数 ,F*(x)是完全已知的假设分布函数, 则检验统计量T为S (x) 与F*(x)的最大垂直距离, 即:T = sup| F*(x)- S (x)|。

3. P值计算

近似P值可以通过在表A13中插值得到,或者利用2倍的单边检验的P值。

[n(1?t)]

单边 P值=?j?1?n??j???1?t????j?n????n?jj???t???n?j?1这里t的是检验统计量的观测值,[n(1-t)]且是小于等于n(1-t)的最大整数。 当给定的显著性水平?大于或等于P值时,拒绝原假设 。

在本文中,该检验是运用S-plus 统计分析软件实现的。

(二) 方差的平方秩检验

1. 原假设和备择假设

( 1 ) 双边检验

1

原假设H0:除了它们的均值可能不同外,X和Y同分布。

备择假设H1: V a r (X) ≠V a r (Y)。

( 2 ) 左边检验

原假设H0: 除了它们的均值可能不同外,x和 y同分布。

备择假设H1:v a r ( x) < v a r ( Y)。

2. 检验统计量

记X1、X2、?Xn、为来自总体l 、样本容量为n的随机样本,

Y1、Y2、?Ym、 为来自总体2 、 容量为 m的随机样本,

将Xi和Yj转换为它到均值的绝对离差 Ui和 Vj。Ui=|Xi-u1|,Vj=|Yj-u2|,u1和u2是总体 1和2的均值,若未知, 可用样本均值来代替。以通常方式将秩 1 到 n + m赋给U和V的合并样本。 如果 U的值与v的值没有结, 则赋给总体1的秩的平方和 可以用作检验统计量。 其中,T=

当样本容量大??R?U??ii?1n2。 时,T的近似分位数于10

WP=n?N?1??2N?1?nmN?12N?18N?11 (1 ),其中,N=n+m,ZP为?ZP6180

标准正态分布分位数。

3. 拒绝域

对于双边检验,在显著性水平?下,求出拒绝域:T ( T1) < T?2或 T ( T1) > T1??2 。对于左边检验, 拒绝域:T ( T1) < T?。

4.作出判断

对于双边检验,根据样本观测值计算T ,若T ( T1) < T?2 或 T ( T1) > T1??2。 ,则拒绝原假设。对于单边检验,根据样本观测值计算 T ( T1) ,若 T ( T1) < T?,则拒绝原假设。

在本文中,该检验是借助于E x c e l 完成的。

二、实证研究

(一) 数据的选取及预处理

由于2008年的国际金融危机,改变了世界经济的运行状态,所以选取2009年1月5日

2

到2011年6月30日上海指数和深圳指数收盘价为样本,分析同际金融危机,后中国股市的统计特征。

将收盘价化为以2009年1月5日为基期的收益率序列 ,其中,计算收益率采用的是对

?= 数收益率?,log?Pt? ( Pt为第 t 期的收盘价) 。采用对数收益率的主要原因, 是logPt?1对数收益率具有可加性和连续复利收益率的优点。

( 二 ) Kolmogorov拟合优度检验

通过S—plus软件,对上海指数和深圳指数进行 Kolmogorov 拟合优度检验,检验结果如表1 所示。

表1

假设,即上海指数和深圳指数都不服从正态分布。

( 三) 方差的平方秩检验

方差的平方秩检验是基于E x c e l ,根据方差的平方秩检验步骤,计算上海指数和指深圳数日收益率序列的均值,将上海指数日收益率序列X和深圳日收益率序列 Y转化为序列U和 V,然后将U和V合并,从小到大排序并赋秩,正好 U和V都没有结,将总体 l的秩的平方和作为检验统计量,运用E x c e l ,计算出检验统计量T = 272423095。 由于 X和 Y的样本容量为604, 远大于10,所以检验计量的分位数计算通过公式( 1 ) 得到。

对于双边检验,在 5 %的显著性水平下,T的 1 ?aa 分位数为308999979 ,T的分22

位数为279326825 拒绝域为 (T< 279326825 )?( T> 308999979 ) , 由于 T = 272423095<279326825, 所以,在 5 %的显著性水平下,拒绝原假设, 即上海指数和深圳指数收益率序列的方差不相等。

对于左边检验,在 5 %的显著性水平下,T的a分位数281712032,拒绝域为T< 281712032 ,由于 T= 272423095 < 28l7l2032 , 所以拒绝原假设, 接受备择假设,即: Va r ( X) < V a r ( Y ) , 也就是说,上海指数日收益率序列的波动性小于深圳指数日收益率序列的波动性。

三、 结论

3

( 一) 国际金融危机后, 中国股市收益率序列不服从正态分布。

( 二) 国际金融危机后, 上海指数收益率的波动性和深圳指数收益率的波动性不同, 上海

指数日收益率的波动性小于深圳指数日收益率序列的波动性。

即:在上海证券交易所上市的股票整体波动性, 小于在深圳证券交易所上市的股票的波动性。

小节:

1. 注意kolmogorov拟合优度检验的具体做法:比较实际频数与理论频数的积累率间的差

距,找出最大距离,根据这个值来判断实际频数分布是否服从理论频数分布。在小样本中,根据渐进分布计算P值的误差会增大,应该通过相应的设定要求软件输出精确检验的P值,像例子中那样带入软件中。

2. 方差的平方秩检验可以按照同样的思想对正太分布或者任何想象的其他分布进行检验,

但主要用于对定性变量的检验,且可以用于对两个总体分布的比较。

3. 运用 Kolmogorov拟合优度检验,进行了正态分布假设检验;运用方差平方秩检验方法,

比较分析。在其他问题上都是非常好的检验方法。

参考文献:

(1) 艾克凤. 股票收益率的非正态性检验与分布拟合.

商业时代 , 2006 , ( 31 ) : 57 — 58 .

(2)王建华、王玉玲、柯开明.中国股票收益率的稳定分布拟合与检验.

武汉理工大学学报 , 2003, ( 10 ) : 99 — 102 .

(3)王宁、 劳兰珊.中国股票市场风险和收益风格效应的非参数检验.

上海管理科学, 2007, ( 02 ) : 1 2 — 1 4 .

(4)王金玉、李霞、潘德惠.非参数假设检验在证券投资分析中的应用 .

数学的实践与认识 , 2005 , ( 12 ) : 57 — 61 .

(5)周明磊. 上海指数与深圳指数间协整关系的非参数检验 .

统计与决策,2004, ( 08 ) : 24 — 25 .

(6)方国斌.中国股市波动性聚类特征参数与非参数分析 .

技术经济, 2007 , ( 10 ) : 84 — 88 .

4

篇二:非参数假设检验

非参数假设检验

上节讨论了母体分布类型为已知时的参数假设检验问题.一般在进行参数假设检验之前,需要对母体的分布进行推断.本节将讨论母体分布的假设检验问题.因为所用的方法适用于任何分布或者仅有微弱假定分布,实质上是不依赖于分布的.在数理统计学中不依赖于分布的统计方法统称为非参数统计方法.这里所讨论的问题就是非参数假设检验问题.这里所研究的检验是如何用子样去似全母体分布,所以又称为分布拟合扰度检验,一般有两种:一是拟合母体的分布函数;另一是拟合母体分布的概率函数.这里我们只介绍三种检验方法:概率图纸法.

?2-拟合优度检验和柯尔莫哥洛夫斯米尔诺夫检验.

一, 概率图纸法

这是一种比较直观和简便的检验方法.它适合于在现场使用.目前常见的概率图纸有正态,对数正态,二项分布,指数分布和威布尔分布概率图纸等.这里我们只介绍正态概率图纸,关于其它分布的概率图纸的构造原理和使用方法都是类似的

1. 正态概率图纸的构造原理

设母体?有分布函数F(x),{N(?,?2)}表示正态分布族.需要检验假设

H0:F(x)?{N(?,?2)}

这里?和?2均为未知常数.在原假设H0为真时,通过中心化变换

F(x)?

即?(?)?

?21

x

??

e

?

(t??)22?

2

dt?

12x??

?

?

??

e

?

?22

du??(

x??

?

)

???

服从正态N(0,1).函数u(x)是x的线性函数. ?

???

(7.13) ?(?)??

1

在(x,u(x))直角坐标平面上是一条直线.这条直线过(?,0),且斜率为

2. 检验步骤.

?

.

事实上,我们知道的不是母体?取出的一组子样观察值x1,?,xn由格里汶科定理知道子样的经验分布函数Fn(x)依概率收剑于母体分布函数F(x).所以在检验母分体布函数F(x)是否属于正态分布族时,我们以大子样的经验分布函数Fn(x)作为母体分布的近似.若H0:F(x) ∈{N(?,?2)}为真,那末点(xi,F(xi)),i?1,?,n,在正态概率图纸上应该在一条直线上.所以根据上述经验分布函数Fn(x)是母体分布函数F(x)很好的近似,点(xi,F(xi)),i?1,?,n,在正态概率图纸上也应该近似地在一条直线附近.倘若点列(xi,F(xi)),不是近似地在一条直线附近,那末只能说明F(x)不属于正态分布族.根据上述想法,用正态概率图纸去检验假设

H0的具体步骤如下.

(1) 整理数据 (2) 描点

(3) 目测这些点的位置, 3. 未知参数?与?2的估计.

若通过概率图纸检验已经知道母体服从正态分布,我们就凭目测在概率图纸上画出最靠近各点(x(i),Fn(x(i))),i?1,?,n,的一条直线l,因为?(?)?

???

服从正态N(0,1),所以当?

?(x)?

???

?0,即x=?时对应的概率F=0.5.因此,只要在概率图纸上面一条F=0.5的水平?

直线.这条直线与直线l的交点的横坐标x0.5就可以作为参数为?的估计.又由?(x)=1时所对应的概率F=0.8413的水平直线,这条直线与直线l的交点的横坐标为x0.8413.这个x0.8413显然满足?0.8413?

x0.8413??

?

?1即??x0.8413??因此可以用差x0.8413?x0.5估计?.

例 7.8 (略)见P338 二, ?的似体检验法

前面介绍了直观而简便的概率图纸法,它不需要很多计算就能对母体分布族作出一个统计推断,并且还能对分布所含的参数作出估计.但是这种方法因人而异,且精度不高,又不能控制犯错误的概率.这里介绍?-拟合检验法,它能够像各种显著性检验一样控制犯第一类错误的概率.

设母体?的分布函数为具有明确表达式的F(x),.我们把随机变量?的值域R分成k个互不相容的区间A1??a0,a1?,A2??a1,a2?,?,Ak??ak?1,ak?这些区间不一定有相同的长度.

设x1,?,xn是容量为n的子样的一组观测值.ni为子样观测值x1,?,xn中落入Ai的频数.

2

2

?ni?n在这n次事件Ai出现的频率为

i?1

n

ni

. n

我们现在检验原假设H0:F(x)?F0(x).设在原假设H0成立下,母体?落入区间Ai的概率为Pi,即

Pi?P(Ai)?F0(ai)?F0(ai?1),i?1,?k(7.14)

此时n个观察值中,恰有n1个值落入A1内,n2的观察值落入A2内,?nk个观察值落入Ak内的概率为

n!

P1n1P2n2?Pnnk

n1!n2!?nk!

这是一个多项分布.

按大数定理,在H0为真时,频率计量

ni

与概率Pi的差异不应太大.根据这个思想构造一个统n

(ni?nPi)2

(7.15) ?=?nPii?1

2

k

称做?-统计量.往后可以看到,用?表示这一统计量不是没有原因的.因为它的极限分布就是自由度为k-1的?-分布.

为了能够把?-统计量用来作检验的统计量,我们必须知道它的抽样分布.我们先k=2的简单情形.在H0成立下,

2

2

22

P(A1)?Pi,P(A2)?P2

其中P1?P2?1

这时,频数n1?n2?n我们考察

2

(n1?nP(n2?nP2)21)??? (7.16)

nPnP122

Y1?n1?nP1,Y2?n2?nP2(7.17)

显然

Y1?Y2?n1?n2?n(P1?P2)?0(7.18)

由此可见Y1与Y2不是线性独立,且Y1??Y2.于是

Y12Y22Y12

????

nPnPnPP1212

2

?n1?nP?1?? (7.19) ?1(1?P1)??nP?

根据德莫弗-拉普拉斯极限定理,当n充分大时,随机变量

2

n1?nP1nP1(1?P1)

的分布是接近于正

态的,从而推得k=2情形的分布,当n充分大时,是接近于自由度为1的?-分布.

对于一般情形有如下的定理.

定理 7.1 当H0为真时,即P1,?,Pk为母体的真实概率时,由(7.15)式所定义的统计量?的渐近分布是自由度为k-1的?-分布,即密度函数为

k?3x

??1

x2e2,?k?1

?k?1?f(x)??22?? (7.20) ????2??0,?

2

2

2

证 因为在n个观测值中恰有n1个观测值落入A1内, n2的观察值落入A2内,?nk个观察值落入Ak内的概率为

n!

P1n1P2n2?Pnnk

n1!n2!?nk!

这里n1?n2???nk?n.其特征函数

it??2(t1,?,tk)??Pe??j? (7.21)

j

??

k

??

n

j?1

Yj?

于是有

nj?nPj

nPj

,j?1,2?,k(7.22)

???

2

j?1

k

(nj?nPj)2

nPj

??Yj2 (7.23)

j?1

k

?Y

j?1

k

j

Pj=0 (7.24)

由此式看出,诸随机变量Yj不是线性独立的.(Y1,?,Yk)的联合分布的特征函数具有形状

?(t1,?,tk)?exp????itj

?

j?1

?

k

?itj??k

?nPj??Pexp???j?nP

???j?j?1??

??(7.25) ????

2

两边取对数得

ln?(t1,?,tn)??in?tj

j?1

k

?k?itj

Pj?nln??Pjexp?

?nP?j?1

j????

?? (7.26) ????

利用指数数函和对数函在tj?0处的泰勒展开:

?itjexp???npj

?itjt2?1?j

??1??????

nPj2nPj?n???

x2

ln(1?x)?x???(x2)

2

于是

k?ik1k21???

Pj?nln???in?tjPj???1?n?tjPj?2n?tj?????n??j?1j?1j?1?

ln?(t1,?,tk)??in?tj

j?1

k

2

?ik?kk??11i2

???(1)?n??tjPj??tj??tjPj????2nj?12?nj?1????nj?1?

当n??时

2

??1?k2?k

?ln?(t1,?,tk)????tj??tjPj????2?j?1

?j?1????

2

?1?k??k????2

?????(t,?,t)?exp?t?tP??(7.26) ??1kjjj?lim?2?n???j?1????j?1????

作一正交变换:

k

?

Zl??aljYj,l?1,?,k?1??j?1

(7.27) ?k

?Zk??PjY?j?1?

其中alj应该满足

?1,l?ra?a?l,r?1,?,k?1 ??ljrj

0,l?rj?1?

k

?a

j?1

k

lj

Pj?0,l?1,?,k?1

篇三:第七章 非参数的假设检验

第七章 非参数的假设检验

上一章讲的参数假设是在假设总体分布已知的情况下进行的,但在实际生活中,那种对总体的分布的假定并不是能随便做出的。数据并不是来自所假定分布的总体,或者,数据根本并不是来自一个总体;还有可能数据因为种种原因被严重污染。这样,在假定总体分布已知的情况下进行推断的做法就可能产生错误甚至得出灾难性的结论。于是,人们希望在不对总体分布做出假定的情况下,尽量从数据本身来获得所需要的信息,这就是非参数统计推断的宗旨。本章分别就单一样本、两样本及多样本的位置参数与尺度参数给出一些非参数的检验方法。

7.1 单总体位置参数的检验

设X1,X2,,Xn为来自总体X的容量为n的样本,在有了样本观测值x1,x2,,xn之后,很自然地想要知道她所代表的总体的“中心”在哪里?它所代表的总体的分布是否与我们所希望的分布一样?这些问题中不涉及分布具体形式的假定,因此属于非参数的假设检验问题。我们先考虑前一问题,分别介绍两常用的中位数符号和对称中心的Wilcoxon符号检验,后面一节在介绍分布的拟合优度检验。


非参数假设检验》由:免费论文网互联网用户整理提供;
链接地址:http://www.csmayi.cn/show/82739.html
转载请保留,谢谢!
相关文章