第十章基于秩次的非參數(shù)檢驗
參數(shù):描述總體的指標稱為參數(shù)。
參數(shù)統(tǒng)計:許多統(tǒng)計推斷方法,要求來自總體分布型是已知的,在這種假設基礎上,對總體進行統(tǒng)計推斷(進行估計和檢驗)稱為參數(shù)統(tǒng)計。
非參數(shù)檢驗:不依賴于總體分布類型,也不對總體參數(shù)進行統(tǒng)計推斷的假設檢驗的方法稱為非參數(shù)檢驗。
參數(shù)統(tǒng)計內容:
•參數(shù)估計:1.正態(tài)分布的均數(shù)和方差(μ和σ)
•2.二項分布的總體率π
•3.泊松分布的均數(shù)λ
•與參數(shù)有關的檢驗:1.t檢驗
• 2.F檢驗
• 3.相關系數(shù)檢驗
• 4.回歸系數(shù)檢驗
非參檢驗的優(yōu)缺點:
•優(yōu)點:1、計算簡單便于掌握。
• 2、應用范圍廣。
• 3、收集資料方便。
•缺點:1、損失信息。
• 2、檢驗效率低。
非參數(shù)適用哪些資料:
•1、分布型未知
•2、能以嚴重程度、優(yōu)劣等級、效果大小和名次先后等等級資料。
•3、分布極度偏態(tài)。
•4、本組內個別變量值偏離過大,遠離本組其它變量值。
•5、方差不齊時。
•6、篩選或只需獲得初步結果。
第一節(jié) 配對設計和單樣本資料的符號秩和檢驗(Wilcoxon配對法)
一、配對設計資料的符號秩和檢驗
例10-1 某研究欲研究保健食品對小鼠抗疲勞作用,將同種屬的小鼠按性別和年齡相同、體重相近配成對子,共10對,并將每對中的兩只小鼠隨機分到保健食品兩個不同的劑量組,過一定時期將小鼠殺死,測得其肝中糖原含量(mg/100g),結果見表10-1,問不同劑量組的小鼠肝糖 原含量有無差別?
表10-1 不同劑量組的小鼠肝糖 原含量(mg/100g)
小鼠號 | 中劑量組 | 高劑量組 | 差值d | 差值為正 | 差值為負 |
(1) | (2) | (3) | (4) | 秩次(5) | 秩次(6) |
1 | 620.16 | 958.47 | 338.31 | 10 | |
2 | 866.50 | 838.42 | -28.08 | -5 | |
3 | 641.22 | 788.90 | 147.68 | 8 | |
4 | 812.91 | 815.20 | 2.29 | 1.5 | |
5 | 738.96 | 783.17 | 44.21 | 6 | |
6 | 899.38 | 910.92 | 11.54 | 3.5 | |
7 | 760.78 | 758.49 | - 2.29 | -1.5 | |
8 | 694.95 | 870.80 | 175.85 | 9 | |
9 | 749.92 | 862.26 | 112.34 | 7 | |
10 | 793.94 | 805.48 | 11.54 | 3.5 |
•1、檢驗步驟:
•(1)假設:H0:差值總體中位數(shù)Md=0
•H1: Md≠ 0
•(2)求差值:
•(3)編秩:
•(4)求秩和并確定檢驗統(tǒng)計量:分別求正負秩次之和,正秩次的和以T+表示,負秩次的和以T-表示.本例T+為48.5,T-為6.5,以絕對值較小秩和作檢驗統(tǒng)計量,本例取T=6.5.當n小于等于50時,查T界值表.注意:
•當n<5時,應用秩和檢驗不能得出雙側有統(tǒng)計學意義的概率故n必須大于或等于5
3、正態(tài)近似法:
•若n>50超過附表9的范圍,可用u 檢驗。
式中tj:第j個相同差值的個數(shù),假定差值中有2個4,5 個6,3個7則t1=2, t2=5,t3=3,
本法基本思想:
假定從一總體中隨機抽取n=5 的樣本,按例題9.1的方法和步驟,可求出T+、T-,當重復抽取所有可能組合情況.如T=5可有三種情況,一是最大的差值為正,其余4個為負,故正秩和等于5;二是差值的絕對值排在第一位及第四位,其余為負,即T=1+4;二是差值的絕對值排在第三位和第二位,其余為負,即T=2+3。
由此可看出T分布為以均數(shù)為中心對稱的非連續(xù)分布。隨著n值的增大,T的分布逐漸接近均數(shù)為n(n+1)/4,方差為n(n+1)(2n+1)/24的正態(tài)分布(n>25),即然為正態(tài)分就可按正態(tài)分布的原理進行T的推斷。
• 若單組隨機樣本來自正態(tài)總體,比較其總體均數(shù)與常數(shù)是否不同,可t檢驗若樣本來自非正態(tài)總體或總體分布無法確定,也可用Wilcoxon符號秩和檢驗,檢驗總體中位數(shù)是否等于某已知數(shù)值。
•例10-2 已知某地正常人尿氟含量中位數(shù)為2.15mmol/L。今在該地某廠隨機抽取12名工人測得尿氟含量(mmol/L),結果見表10-2。問該廠工人的尿氟含量是否高于當?shù)卣H耍?/p>
表10-2 12名工人尿氟含量(mmol/L)測定結果
尿氟含量 | 差值d | 秩次 |
(1) | (2) | (3) |
2.15 | 0 | |
2.10 | -0.05 | -2.5 |
2.20 | 0.05 | 2. 5 |
2.12 | -0.03 | -1 |
2.42 | 0.27 | 4 |
2.52 | 0.37 | 5 |
2.62 | 0.47 | 6 |
2.72 | 0.57 | 7 |
2.99 | 0.84 | 8 |
3.19 | 1.04 | 9 |
3.37 | 1.22 | 10 |
4.57 | 2.42 | 11 |
•1、檢驗步驟:
•(1)假設:H0:差值總體中位數(shù)Md=0
• H1: Md≠0
•(2)求差值:
•(3)編秩:
•(4)求秩和并確定檢驗統(tǒng)計量:分別求正負秩次之和,正秩次的和以T+表示,負秩次的和以T-表示.本例T+為62.5,T-為3.5,以絕對較小秩和作檢驗統(tǒng)計量,本例取T=3.5.當n小于等于50時.
•(5)確定P值并做出推斷結論,查T界值表.
•,得P<0.005,按a=0.05水準,拒絕H0,接受H1,可認為該廠工人尿氟含量高于當?shù)卣H恕?/p>
第二節(jié) 完全隨機化設計兩獨立樣本比較的秩和檢驗
(Wilconxon兩樣本比較法)
一、兩組連續(xù)變量資料的秩和檢驗
完全隨機化設計兩獨立樣本比較的秩和檢驗,目的是推斷兩樣本分別代表的總體分布是否不同。
例10-3 在河流監(jiān)測斷面優(yōu)化研究中,研究者從某河流甲乙兩個斷面分別隨機抽取10個和15個樣品,測得其亞硝酸鹽氮(mg/L)的含量如表10-3,問比較甲乙兩河流斷面亞硝酸鹽氮 的含量有無差別?
表10-3 某河流甲乙斷面亞硝酸鹽氮含量 (mg/L )的含量
亞硝酸鹽氮含量 | 秩次 | 亞硝酸鹽氮含量 | 秩次 | 亞硝酸鹽氮含量 | 秩次 |
0.014 | 1.0 | 0.018 | 2.5 | 0.036 | 17.0 |
0.018 | 2.5 | 0.019 | 4.0 | 0.037 | 18.0 |
0.024 | 8.5 | 0.020 | 5.0 | 0.055 | 21.0 |
0.025 | 10.5 | 0.022 | 6.0 | 0.064 | 22.5 |
0.027 | 12.0 | 0.023 | 7.0 | 0.067 | 24.0 |
0.034 | 15.0 | 0.024 | 8.5 | ||
0.038 | 19.0 | 0.025 | 10.5 | ||
0.043 | 20.0 | 0.028 | 13.0 | ||
0.064 | 22.5 | 0.030 | 14.0 | ||
0.100 | 25.0 | 0.035 | 16.0 |
(1)假設:H0:兩組總體分布相同
H1:兩組總體分布不同 α=0.05
(2) 編秩:
(3) 求秩和并確定檢驗統(tǒng)計量:
(4)確定P值和作出推斷結論:當樣本例數(shù)不等時,以樣本例數(shù)小的那個組的秩次之和為統(tǒng)計量T,當兩組樣本例數(shù)相等時,可任取一組的秩次之和為統(tǒng)計量T.本例河流甲斷面的樣本例數(shù)為10,河流乙斷面的樣本例數(shù)為15,檢驗統(tǒng)計量就為136.然后查,T界值表.
正態(tài)近似法
•如果n1或n2-n1,超出附表范圍,可按正態(tài)近似計算u值
二、有序變量資料(或等級資料)的兩樣本比較
•例10-4 某研究者欲評價新藥按摩樂口服液治療高甘油三酯血癥的療效,將高甘油三酯血癥患者189例隨機分為兩組,分別用按摩樂口服液和山楂精降脂片治療,數(shù)據(jù)如表10-4,問兩藥物治療高甘油三酯血癥的療效有無不同?
表10-4 兩種藥物治療甘油三酯血癥的療效
療效 | 人數(shù) | 秩次 范圍 | 平均秩次 | 秩和 | |||
按摩樂 口服液 | 山楂精 降脂片 | 合計 | 按摩樂口服液 | 山楂精 降脂片 | |||
(1) | (2) | (3) | (4) | (5) | (6) | (7) | (8) |
無效 | 17 | 70 | 87 | 1~87 | 44 | 748 | 3080 |
好轉 | 25 | 13 | 38 | 88~125 | 106.5 | 2662.5 | 1384.5 |
顯效 | 27 | 37 | 94 | 126~189 | 157.5 | 4252.5 | 5827.5 |
合計 | 69 | 120 | 189 | 7663 | 10292 |
(1)假設:H0:兩組藥物總體分布相同
H1:兩組藥物總體分布不相同 α=0.05
(2) 編秩:
(3) 求秩和并確定檢驗統(tǒng)計量:
(4)確定P值和作出推斷結論:
第三節(jié) 完全隨機化設計多個樣本的秩和檢驗
一、多組連續(xù)變量資料的秩和檢驗
例10-5 某研究者欲研究A、B兩菌種對小鼠巨噬功能的激活作用,將60只小鼠隨機分為三組,其中一組為生理鹽水對照組,用常規(guī)巨噬功能的監(jiān)測方法,獲得三組的吞噬指數(shù),試比較三組吞噬指數(shù)有無差別?
表10-5 不同菌種對小鼠巨噬細胞的吞噬指數(shù)
吞噬 指數(shù) | 秩次 | 吞噬 指數(shù) | 秩次 | 吞噬指數(shù) | 秩次 | 吞噬 指數(shù) | 秩次 | 吞噬 指數(shù) | 秩次 | 吞噬 指數(shù) | 秩次 |
1.30 | 1.0 | 2.30 | 26.5 | 1.80 | 14.5 | 2.68 | 44.5 | 1.50 | 4.0 | 2.60 | 40.0 |
1.40 | 2.0 | 2.30 | 26.5 | 1.80 | 14.5 | 2.70 | 47.0 | 1.80 | 14.5 | 2.60 | 40.0 | m.gydjdsj.org.cn/sanji/
1.50 | 4.0 | 2.30 | 26.5 | 2.20 | 20.5 | 2.80 | 49.5 | 1.80 | 14.5 | 2.60 | 40.0 |
1.50 | 4.0 | 2.40 | 33.5 | 2.20 | 20.5 | 3.00 | 49.5 | 1.80 | 17.0 | 2.70 | 47.0 |
1.60 | 6.5 | 2.40 | 33.5 | 2.20 | 20.5 | 3.10 | 51.0 | 2.00 | 26.5 | 2.70 | 47.0 |
1.60 | 6.5 | 2.20 | 20.5 | 3.10 | 54.5 | 2.30 | 26.5 | 3.10 | 54.5 | ||
1.70 | 10.0 | 2.30 | 26.5 | 3.10 | 54.5 | 2.30 | 33.5 | 3.10 | |||
1.70 | 10.0 | 2.30 | 26.5 | 3.10 | 54.5 | 2.40 | 33.5 | ||||
1.70 | 10.0 | 2.30 | 26.5 | 3.20 | 54.5 | 2.40 | 33.5 | ||||
1.70 | 10.0 | 2.66 | 42.5 | 4.30 | 58.0 | 2.40 | 33.5 | ||||
1.70 | 10.0 | 2.66 | 42.5 | 4.30 | 29.5 | 2.40 | 37.5 | ||||
2.10 | 18.0 | 2.68 | 44.5 | 4.30 | 59.5 | 2.50 | 37.5 | ||||
Ri | |||||||||||
ni |
(1)假設:H0:三個總體分布相同.
H1:三個總體分布不同或不全相同. α=0.05
(2) 編秩:
(3) 求秩和并確定檢驗統(tǒng)計量
(4)確定P值和作出推斷結論
計算檢驗統(tǒng)計量H值:
H值的校正:
確定P值和作出統(tǒng)計推斷結論
•若組數(shù)等于k=3,每組例數(shù)小于等于5時,可查H界值表得出P值。若最小樣本數(shù)大于5時,或組數(shù)大于3時則H分布近似服從n=k-1卡方分布,查卡方界值表,得出P值。本例每組樣本例數(shù)均大于5,所以查卡方界值表,其自由度為2,得P<0.005.按0.05水準拒絕H0,故認為三個不同菌種對小鼠巨噬指數(shù)的作用有差別.
二、多個樣本比較的有序資料的秩和檢驗
•例10-6 四種病人痰液內嗜酸性粒細胞的檢查結果見表10-6。問四種疾病患者痰液內嗜酸粒細胞的等級有無差別?
表10-6四種疾病痰液嗜酸粒細胞等級比較
- | 0 | 3 | 5 | 3 | 11 | 1~11 | 6 | 0 | 30 | 30 | 18 |
+ | 2 | 5 | 7 | 5 | 19 | 12~30 | 21 | 42 | 147 | 147 | 105 |
++ | 9 | 5 | 3 | 3 | 20 | 31~50 | 40.5 | 364..5 | 202.5 | 121.5 | 121.5 |
+++ | 6 | 2 | 2 | 0 | 10 | 51~60 | 55.5 | 333 | 111 | 111 | 0 |
合計 | 17 | 15 | 17 | 11 | 60 | _ | _ | 739.5 | 436.5 | 409.5 | 244.5 |
第四節(jié) 隨機區(qū)組設計資料的秩和檢驗
隨機區(qū)組設計的秩和檢驗(M檢驗(Friedman)、F檢驗)
例10-7 欲用學生的綜合評分來評價四種教學方式的不同,按照年齡、性別、年級、社會經(jīng)濟、地位、學習動機相同和智力水平、學習情況相近作為配對條件,將4名學生分一組,共8組,每區(qū)組的4名學生隨機分到四種不同的教學實驗組,經(jīng)相同的一段時間后,測得學習成績的綜合評分,試比較四種教學方式對學習成績的綜合評分影響有無不同?
表10-7 不同區(qū)組4種教學方式對學生學習綜合評分比較
區(qū)組編號 | 教學方式A | 教學方式B | 教學方式C | 教學方式D | ||||
綜合評分 | 秩 | 綜合評分 | 秩 | 綜合評分 | 秩 | 綜合評分 | 秩 | |
1 | 8.4 | 1 | 9.6 | 2 | 9.8 | 3 | 11.7 | 4 |
2 | 11.6 | 1 | 12.7 | 4 | 11.8 | 2 | 12.0 | 3 |
3 | 9.4 | 2 | 9.1 | 1 | 10.4 | 4 | 9.8 | 3 |
4 | 9.8 | 2 | 8.7 | 1 | 9.9 | 3 | 12.0 | 4 |
5 | 8.3 | 2 | 8.0 | 1 | 8.6 | 3.5 | 8.6 | 3.5 |
6 | 8.6 | 1 | 9.8 | 3 | 9.6 | 2 | 10.6 | 4 |
7 | 8.9 | 1 | 9.0 | 2 | 10.6 | 3 | 11.4 | 4 |
8 | 8.3 | 2 | 8.2 | 1 | 8.5 | 3 | 10.8 | 4 |
Ri | 12 | 15 | 23.5 | 29.5 |
M檢驗(Friedman法)
計算步驟:
1、將每個區(qū)組的數(shù)據(jù)由小到大分別編秩,遇相同數(shù)據(jù)取平均秩次:
2、計算各處理組的秩和Ri:
3、求平均秩: b:區(qū)組數(shù);k:處理組數(shù);
4、 計醫(yī)學考研網(wǎng)算各處理組的 ;
5、求M:
6、 1)查表法:查M值界值表(附表12),M大于或等于表中數(shù)據(jù)則差別有統(tǒng)計意義.
2)卡方分布近似法:
當處理組數(shù)k或區(qū)組數(shù)b超出M界值表的范圍時,可采用近似卡方分布法:Rj第j處理組的秩和,故總秩和為
當H0成立時,第j列秩的期望與方差為:
大樣本時,統(tǒng)計量近似服從標準正態(tài)分布;但k個Zj的加權和服從自由度為K-1的卡方分布,
當各區(qū)組秩次較多時,需校正公式:
第五節(jié) 多個樣本兩兩比較秩和檢驗
•無論是對完全隨機設計多個樣本比較,還是對隨機化區(qū)組設計的多個可樣本比較,當經(jīng)過多個樣本比較的秩和檢驗拒絕H0,認為各總體分布位置不同或不全相同時,常需作兩兩比較的秩和檢驗是否相同,以判斷哪兩個總體分布相同,哪兩個總體分布不同.
•一、完全隨機設計多個樣本間的多重比較
•例10-8 以例10-5說明對完全隨機設計資料進行多重比較的步驟
•它的步驟為:
1、檢驗假設
H0:第i組與第j組所代表的總體中位數(shù)相同
H1:第i組與第j組所代表的總體中位數(shù)不相同
2、計算檢驗統(tǒng)計量并確定P值 設Ri和Rj分別為比較的第i組和第j組樣本的秩和,其平均秩和分別為
1)精確法
2)正態(tài)近似法:樣本含量較大時,計算統(tǒng)計量:
3、做出統(tǒng)計推斷結論 將某兩組比較所得P值與調整以后的檢驗 水準 比較,若P< ,則拒絕H0。
4、檢驗水準的調整
通常有兩種情況:
1)多組間的兩兩比較
2)實驗組與同一對照組的比較
表10-5的資料進行兩兩比較,按a=0.05總的檢驗水準,每次比較必須采用調整的檢驗水準
表10-8 三組樣本秩和的兩兩比較
對比組 | P | |||
(1) | (2) | (3) | (4) | (5) |
對照組與A菌組 | 25.8248 | 5.5362 | 4.66 | <0.002 |
對照組與B菌組 | 19.3917 | 5.8304 | 3.33 | <0.002 |
B菌組與A菌組 | 6.4331 | 5.3629 | 1.20 | >0.200 |
•二、隨機區(qū)組設計多個樣本間的多重比較
•對于隨機區(qū)組設計資料,當拒絕H0,認為各總體分布位置不同或不全相同時,同樣需對各處理間進行多重比較,與完全隨機設計秩和檢驗多重比較類似,只是正態(tài)近似檢驗中的估計方差的算法不同。
•現(xiàn)通過例10-7說明基的方法和步驟:
1、檢驗假設
H0:任兩組學習成績綜合評分總體中位數(shù)相同
H1:任兩組學習成績綜合評分總體中位數(shù)不相同
2、計算檢驗統(tǒng)計量并確定P值 設Ri和Rj分別為比較的第i組和第j組樣本的秩和,其平均秩和分別為
1)精確法
2)正態(tài)近似法:樣本含量較大時,計算統(tǒng)計量:
3、做出統(tǒng)計推斷結論 將某兩組比較所得P值與調整以后的檢驗水準 比較,若P< ,則拒絕H0。
4、檢驗水準的調整
表10-7的資料進行兩兩比較,按a=0.05總的檢驗水準,每次比較必須采用調整的檢驗水準
表10-9 不同教學方式間的兩兩比較
對比組 | P | |
(1) | (2) | (3) |
方式A與方式B | 4.66 | >0.5 |
方式A與方式C | 2.23 | 0.01<P<0.05 |
方式A與方式D | 3.39 | <0.0017 |
方式B與方式C | 1.65 | >0.05 |
方式B與方式D | 2.81 | 0.0017<P<0.0083 |
方式C與方式D | 1.16 | >0.2 |
第八節(jié) 小結
1、檢驗方法的選擇:
1)一組樣本資料
2)配對設計資料
3)兩獨立樣本
4)多組獨立樣本
5)隨機區(qū)組設計
2、檢驗功效