衛(wèi)生統(tǒng)計學-電子教材:第十章

來源：河北醫(yī)科大學精品課程網(wǎng)

衛(wèi)生統(tǒng)計學:電子教材第十章:第十章基于秩次的非參數(shù)檢驗參數(shù)：描述總體的指標稱為參數(shù)。參數(shù)統(tǒng)計：許多統(tǒng)計推斷方法，要求來自總體分布型是已知的，在這種假設基礎上，對總體進行統(tǒng)計推斷（進行估計和檢驗)稱為參數(shù)統(tǒng)計。非參數(shù)檢驗：不依賴于總體分布類型，也不對總體參數(shù)進行統(tǒng)計推斷的假設檢驗的方法稱為非參數(shù)檢驗。參數(shù)統(tǒng)計內容：參數(shù)估計：1.正態(tài)分布的均數(shù)和方差（μ和σ)2.二項分布的總體率π3.泊松分布的均數(shù)λ與參數(shù)有關的檢驗：1.t檢驗

第十章基于秩次的非參數(shù)檢驗

參數(shù)：描述總體的指標稱為參數(shù)。

參數(shù)統(tǒng)計：許多統(tǒng)計推斷方法，要求來自總體分布型是已知的，在這種假設基礎上，對總體進行統(tǒng)計推斷（進行估計和檢驗)稱為參數(shù)統(tǒng)計。

非參數(shù)檢驗：不依賴于總體分布類型，也不對總體參數(shù)進行統(tǒng)計推斷的假設檢驗的方法稱為非參數(shù)檢驗。

參數(shù)統(tǒng)計內容：

•參數(shù)估計：1.正態(tài)分布的均數(shù)和方差（μ和σ)

•2.二項分布的總體率π

•3.泊松分布的均數(shù)λ

•與參數(shù)有關的檢驗：1.t檢驗

• 2.F檢驗

• 3.相關系數(shù)檢驗

• 4.回歸系數(shù)檢驗

非參檢驗的優(yōu)缺點：

•優(yōu)點：1、計算簡單便于掌握。

• 2、應用范圍廣。

• 3、收集資料方便。

•缺點：1、損失信息。

• 2、檢驗效率低。

非參數(shù)適用哪些資料：

•1、分布型未知

•2、能以嚴重程度、優(yōu)劣等級、效果大小和名次先后等等級資料。

•3、分布極度偏態(tài)。

•4、本組內個別變量值偏離過大，遠離本組其它變量值。

•5、方差不齊時。

•6、篩選或只需獲得初步結果。

第一節(jié) 配對設計和單樣本資料的符號秩和檢驗（Wilcoxon配對法)

一、配對設計資料的符號秩和檢驗

例10-1 某研究欲研究保健食品對小鼠抗疲勞作用，將同種屬的小鼠按性別和年齡相同、體重相近配成對子，共10對，并將每對中的兩只小鼠隨機分到保健食品兩個不同的劑量組，過一定時期將小鼠殺死，測得其肝中糖原含量(mg/100g)，結果見表10-1，問不同劑量組的小鼠肝糖原含量有無差別？

表10－1　不同劑量組的小鼠肝糖原含量(mg/100g)

小鼠號	中劑量組	高劑量組	差值d	差值為正	差值為負
（1)	（2)	（3)	（4)	秩次（5)	秩次（6)
1	620.16	958.47	338.31	10
2	866.50	838.42	-28.08		-5
3	641.22	788.90	147.68	8
4	812.91	815.20	2.29	1.5
5	738.96	783.17	44.21	6
6	899.38	910.92	11.54	3.5
7	760.78	758.49	- 2.29		-1.5
8	694.95	870.80	175.85	9
9	749.92	862.26	112.34	7
10	793.94	805.48	11.54	3.5

•1、檢驗步驟：

•（1)假設：H₀：差值總體中位數(shù)M_d=0

•H₁: M_d_≠0

•（2)求差值：

•（3)編秩：

•（4)求秩和并確定檢驗統(tǒng)計量：分別求正負秩次之和,正秩次的和以T₊表示,負秩次的和以T_-表示.本例T₊為48.5,T_-為6.5,以絕對值較小秩和作檢驗統(tǒng)計量,本例取T=6.5.當n小于等于50時,查T界值表.注意：

•當n<5時，應用秩和檢驗不能得出雙側有統(tǒng)計學意義的概率故n必須大于或等于5

3、正態(tài)近似法：

•若n>50超過附表9的范圍，可用u 檢驗。

式中t_j_：第j個相同差值的個數(shù)，假定差值中有2個4，5 個6，3個7則t₁=2， t₂=5,t₃=3,

本法基本思想：

假定從一總體中隨機抽取n=5 的樣本，按例題9.1的方法和步驟，可求出T₊_、T_-_，當重復抽取所有可能組合情況.如T=5可有三種情況,一是最大的差值為正,其余4個為負,故正秩和等于5;二是差值的絕對值排在第一位及第四位,其余為負,即T=1+4；二是差值的絕對值排在第三位和第二位,其余為負,即T=2+3。
由此可看出T分布為以均數(shù)為中心對稱的非連續(xù)分布。隨著n值的增大，T的分布逐漸接近均數(shù)為n(n+1)/4,方差為n(n+1)(2n+1)/24的正態(tài)分布（n>25)，即然為正態(tài)分就可按正態(tài)分布的原理進行T的推斷。

•二、一組樣本資料的符號秩和檢驗

• 若單組隨機樣本來自正態(tài)總體，比較其總體均數(shù)與常數(shù)是否不同，可t檢驗若樣本來自非正態(tài)總體或總體分布無法確定，也可用Wilcoxon符號秩和檢驗，檢驗總體中位數(shù)是否等于某已知數(shù)值。

•例10-2 已知某地正常人尿氟含量中位數(shù)為2.15mmol/L。今在該地某廠隨機抽取12名工人測得尿氟含量(mmol/L)，結果見表10-2。問該廠工人的尿氟含量是否高于當?shù)卣Ｈ耍?/p>

表10－2　12名工人尿氟含量(mmol/L)測定結果

尿氟含量	差值d	秩次
（1)	（2)	（3)
2.15	0
2.10	-0.05	-2.5
2.20	0.05	2. 5
2.12	-0.03	-1
2.42	0.27	4
2.52	0.37	5
2.62	0.47	6
2.72	0.57	7
2.99	0.84	8
3.19	1.04	9
3.37	1.22	10
4.57	2.42	11

•1、檢驗步驟：

•（1)假設：H₀：差值總體中位數(shù)M_d=0

• H₁: M_d≠0

•（2)求差值：

•（3)編秩：

•（4)求秩和并確定檢驗統(tǒng)計量：分別求正負秩次之和,正秩次的和以T₊表示,負秩次的和以T_-表示.本例T₊為62.5,T_-為3.5,以絕對較小秩和作檢驗統(tǒng)計量,本例取T=3.5.當n小于等于50時.

•(5)確定P值并做出推斷結論,查T界值表.

•，得P<0.005，按a=0.05水準，拒絕H₀，接受H₁，可認為該廠工人尿氟含量高于當?shù)卣Ｈ恕?/p>

第二節(jié) 完全隨機化設計兩獨立樣本比較的秩和檢驗

（Wilconxon兩樣本比較法)

一、兩組連續(xù)變量資料的秩和檢驗

完全隨機化設計兩獨立樣本比較的秩和檢驗，目的是推斷兩樣本分別代表的總體分布是否不同。

例10-3 在河流監(jiān)測斷面優(yōu)化研究中，研究者從某河流甲乙兩個斷面分別隨機抽取10個和15個樣品，測得其亞硝酸鹽氮(mg/L)的含量如表10-3，問比較甲乙兩河流斷面亞硝酸鹽氮的含量有無差別？

表10-3 某河流甲乙斷面亞硝酸鹽氮含量 (mg/L )的含量


亞硝酸鹽氮含量	秩次	亞硝酸鹽氮含量	秩次	亞硝酸鹽氮含量	秩次
0.014	1.0	0.018	2.5	0.036	17.0
0.018	2.5	0.019	4.0	0.037	18.0
0.024	8.5	0.020	5.0	0.055	21.0
0.025	10.5	0.022	6.0	0.064	22.5
0.027	12.0	0.023	7.0	0.067	24.0
0.034	15.0	0.024	8.5
0.038	19.0	0.025	10.5
0.043	20.0	0.028	13.0
0.064	22.5	0.030	14.0
0.100	25.0	0.035	16.0

（1)假設：H_0:兩組總體分布相同

H_1:兩組總體分布不同 α=0.05

（2) 編秩：

（3) 求秩和并確定檢驗統(tǒng)計量：

（4)確定P值和作出推斷結論：當樣本例數(shù)不等時,以樣本例數(shù)小的那個組的秩次之和為統(tǒng)計量T,當兩組樣本例數(shù)相等時,可任取一組的秩次之和為統(tǒng)計量T.本例河流甲斷面的樣本例數(shù)為10,河流乙斷面的樣本例數(shù)為15,檢驗統(tǒng)計量就為136.然后查,T界值表.

正態(tài)近似法

•如果n₁或n₂-n₁，超出附表范圍，可按正態(tài)近似計算u值

二、有序變量資料（或等級資料)的兩樣本比較

•例10-4 某研究者欲評價新藥按摩樂口服液治療高甘油三酯血癥的療效，將高甘油三酯血癥患者189例隨機分為兩組，分別用按摩樂口服液和山楂精降脂片治療，數(shù)據(jù)如表10-4，問兩藥物治療高甘油三酯血癥的療效有無不同？

表10-4 兩種藥物治療甘油三酯血癥的療效

療效	人數(shù)	秩次范圍	平均秩次	秩和
按摩樂口服液	山楂精降脂片	合計	按摩樂口服液	山楂精降脂片
(1)	(2)	(3)	(4)	(5)	(6)	(7)	(8)
無效	17	70	87	1~87	44	748	3080
好轉	25	13	38	88~125	106.5	2662.5	1384.5
顯效	27	37	94	126~189	157.5	4252.5	5827.5
合計	69	120	189			7663	10292

（1)假設：H₀：兩組藥物總體分布相同

H₁：兩組藥物總體分布不相同 α=0.05

(2) 編秩：

（3) 求秩和并確定檢驗統(tǒng)計量：

（4)確定P值和作出推斷結論：

第三節(jié) 完全隨機化設計多個樣本的秩和檢驗

一、多組連續(xù)變量資料的秩和檢驗

例10-5 某研究者欲研究A、B兩菌種對小鼠巨噬功能的激活作用，將60只小鼠隨機分為三組，其中一組為生理鹽水對照組，用常規(guī)巨噬功能的監(jiān)測方法，獲得三組的吞噬指數(shù)，試比較三組吞噬指數(shù)有無差別?

表10-5 不同菌種對小鼠巨噬細胞的吞噬指數(shù)

m.gydjdsj.org.cn/sanji/


吞噬指數(shù)	秩次	吞噬指數(shù)	秩次	吞噬指數(shù)	秩次	吞噬指數(shù)	秩次	吞噬指數(shù)	秩次	吞噬指數(shù)	秩次
1.30	1.0	2.30	26.5	1.80	14.5	2.68	44.5	1.50	4.0	2.60	40.0
1.40	2.0	2.30	26.5	1.80	14.5	2.70	47.0	1.80	14.5	2.60	40.0
1.50	4.0	2.30	26.5	2.20	20.5	2.80	49.5	1.80	14.5	2.60	40.0
1.50	4.0	2.40	33.5	2.20	20.5	3.00	49.5	1.80	17.0	2.70	47.0
1.60	6.5	2.40	33.5	2.20	20.5	3.10	51.0	2.00	26.5	2.70	47.0
1.60	6.5			2.20	20.5	3.10	54.5	2.30	26.5	3.10	54.5
1.70	10.0			2.30	26.5	3.10	54.5	2.30	33.5	3.10
1.70	10.0			2.30	26.5	3.10	54.5	2.40	33.5
1.70	10.0			2.30	26.5	3.20	54.5	2.40	33.5
1.70	10.0			2.66	42.5	4.30	58.0	2.40	33.5
1.70	10.0			2.66	42.5	4.30	29.5	2.40	37.5
2.10	18.0			2.68	44.5	4.30	59.5	2.50	37.5
R_i
n_i

（1)假設：H₀：三個總體分布相同.
H₁：三個總體分布不同或不全相同. α=0.05
(2) 編秩：
（3) 求秩和并確定檢驗統(tǒng)計量

（4)確定P值和作出推斷結論

計算檢驗統(tǒng)計量H值：

H值的校正：

確定P值和作出統(tǒng)計推斷結論

•若組數(shù)等于k=3，每組例數(shù)小于等于5時，可查H界值表得出P值。若最小樣本數(shù)大于5時，或組數(shù)大于3時則H分布近似服從n=k-1卡方分布，查卡方界值表，得出P值。本例每組樣本例數(shù)均大于5,所以查卡方界值表,其自由度為2,得P<0.005.按0.05水準拒絕H₀,故認為三個不同菌種對小鼠巨噬指數(shù)的作用有差別.

二、多個樣本比較的有序資料的秩和檢驗

•例10-6 四種病人痰液內嗜酸性粒細胞的檢查結果見表10－6。問四種疾病患者痰液內嗜酸粒細胞的等級有無差別?

表10-6四種疾病痰液嗜酸粒細胞等級比較



－	0	3	5	3	11	1~11	6	0	30	30	18
＋	2	5	7	5	19	12~30	21	42	147	147	105
＋＋	9	5	3	3	20	31~50	40.5	364..5	202.5	121.5	121.5
＋＋＋	6	2	2	0	10	51~60	55.5	333	111	111	0
合計	17	15	17	11	60	_	_	739.5	436.5	409.5	244.5

第四節(jié) 隨機區(qū)組設計資料的秩和檢驗

隨機區(qū)組設計的秩和檢驗(M檢驗(Friedman)、F檢驗)

例10-7 欲用學生的綜合評分來評價四種教學方式的不同，按照年齡、性別、年級、社會經(jīng)濟、地位、學習動機相同和智力水平、學習情況相近作為配對條件，將4名學生分一組，共8組，每區(qū)組的4名學生隨機分到四種不同的教學實驗組，經(jīng)相同的一段時間后，測得學習成績的綜合評分，試比較四種教學方式對學習成績的綜合評分影響有無不同?

表10-7 不同區(qū)組4種教學方式對學生學習綜合評分比較

區(qū)組編號	教學方式A	教學方式B	教學方式C	教學方式D
綜合評分	秩	綜合評分	秩	綜合評分	秩	綜合評分	秩
1	8.4	1	9.6	2	9.8	3	11.7	4
2	11.6	1	12.7	4	11.8	2	12.0	3
3	9.4	2	9.1	1	10.4	4	9.8	3
4	9.8	2	8.7	1	9.9	3	12.0	4
5	8.3	2	8.0	1	8.6	3.5	8.6	3.5
6	8.6	1	9.8	3	9.6	2	10.6	4
7	8.9	1	9.0	2	10.6	3	11.4	4
8	8.3	2	8.2	1	8.5	3	10.8	4
R_i		12		15		23.5		29.5

M檢驗(Friedman法)
計算步驟:
1、將每個區(qū)組的數(shù)據(jù)由小到大分別編秩,遇相同數(shù)據(jù)取平均秩次:
2、計算各處理組的秩和R_i:
3、求平均秩: b:區(qū)組數(shù);k:處理組數(shù);
4、計醫(yī)學考研網(wǎng)算各處理組的 ;
5、求M:
6、 1)查表法：查M值界值表(附表12),M大于或等于表中數(shù)據(jù)則差別有統(tǒng)計意義.
2)卡方分布近似法：

當處理組數(shù)k或區(qū)組數(shù)b超出M界值表的范圍時，可采用近似卡方分布法：R_j第j處理組的秩和，故總秩和為
當H₀成立時，第j列秩的期望與方差為：
大樣本時，統(tǒng)計量近似服從標準正態(tài)分布；但k個Z_j的加權和服從自由度為K-1的卡方分布，

當各區(qū)組秩次較多時，需校正公式：

第五節(jié) 多個樣本兩兩比較秩和檢驗

•無論是對完全隨機設計多個樣本比較，還是對隨機化區(qū)組設計的多個可樣本比較，當經(jīng)過多個樣本比較的秩和檢驗拒絕H₀,認為各總體分布位置不同或不全相同時,常需作兩兩比較的秩和檢驗是否相同,以判斷哪兩個總體分布相同,哪兩個總體分布不同.

•一、完全隨機設計多個樣本間的多重比較

•例10-8 以例10-5說明對完全隨機設計資料進行多重比較的步驟

•它的步驟為:

1、檢驗假設
H₀:第i組與第j組所代表的總體中位數(shù)相同
H₁:第i組與第j組所代表的總體中位數(shù)不相同
2、計算檢驗統(tǒng)計量并確定P值設R_i和R_j分別為比較的第i組和第j組樣本的秩和，其平均秩和分別為
1)精確法
2)正態(tài)近似法：樣本含量較大時，計算統(tǒng)計量：
3、做出統(tǒng)計推斷結論將某兩組比較所得P值與調整以后的檢驗水準比較，若P< ，則拒絕H₀。
4、檢驗水準的調整

通常有兩種情況：

1)多組間的兩兩比較

2)實驗組與同一對照組的比較

表10-5的資料進行兩兩比較，按a=0.05總的檢驗水準，每次比較必須采用調整的檢驗水準

表10-8 三組樣本秩和的兩兩比較

對比組				P
(1)	(2)	(3)	(4)	(5)
對照組與A菌組	25.8248	5.5362	4.66	<0.002
對照組與B菌組	19.3917	5.8304	3.33	<0.002
B菌組與A菌組	6.4331	5.3629	1.20	>0.200

•二、隨機區(qū)組設計多個樣本間的多重比較

•對于隨機區(qū)組設計資料，當拒絕H₀,認為各總體分布位置不同或不全相同時,同樣需對各處理間進行多重比較，與完全隨機設計秩和檢驗多重比較類似，只是正態(tài)近似檢驗中的估計方差的算法不同。

•現(xiàn)通過例10-7說明基的方法和步驟:

1、檢驗假設
H₀:任兩組學習成績綜合評分總體中位數(shù)相同
H₁:任兩組學習成績綜合評分總體中位數(shù)不相同
2、計算檢驗統(tǒng)計量并確定P值設R_i和R_j分別為比較的第i組和第j組樣本的秩和，其平均秩和分別為
1)精確法
2)正態(tài)近似法：樣本含量較大時，計算統(tǒng)計量：
3、做出統(tǒng)計推斷結論將某兩組比較所得P值與調整以后的檢驗水準比較，若P< ，則拒絕H₀。
4、檢驗水準的調整
表10-7的資料進行兩兩比較，按a=0.05總的檢驗水準，每次比較必須采用調整的檢驗水準
表10-9 不同教學方式間的兩兩比較

對比組		P
(1)	(2)	(3)
方式A與方式B	4.66	>0.5
方式A與方式C	2.23	0.01<P<0.05
方式A與方式D	3.39	<0.0017
方式B與方式C	1.65	>0.05
方式B與方式D	2.81	0.0017<P<0.0083
方式C與方式D	1.16	>0.2