上述抽樣模擬試驗表明,從同一總體中以固定n隨機抽樣,由于抽樣誤差的影響,樣本均數(shù)x與總體均數(shù)μ往往不相等,且兩個樣本均數(shù)x1和x2也往往不相等。因此在實際工作中遇到樣本均數(shù)與總體均數(shù)間或樣本均數(shù)與樣本均數(shù)間不相等時,要考慮兩種可能:①由于抽樣誤差所致;②兩者來自不同總體。如何作出判斷?統(tǒng)計上是通過假設檢驗(hypothesis testing),又稱顯著性檢驗(significance test),來回答這個問題。
下面以樣本均數(shù)x與總體均數(shù)μ比較的假設檢驗為例,介紹假設檢驗的基本步驟。
一、建立假設和確定檢驗水準
假設有二。一是無效假設(null hypothesis),符號為H0。假設兩總體均數(shù)相等(μ=μ0),即樣本均數(shù)x所代表的總體均數(shù)μ與假設和總體均數(shù)μ0相等。x和μ0差別僅僅由抽樣誤差所致;二是備擇假設(alternative hypothesis),符號為H1。二者都是根據(jù)推斷的目的提出的對總體特征的假設。這里還有雙側檢驗和單側檢驗之分,需根據(jù)研究目的和專業(yè)知識而定:若目的是推斷兩總體是否不等(即是否μ≠μ0),并不關心μ>μ0還是μ<μ0,應用雙側檢驗,H0:μ=μ0,H1:μ≠μ0;若從專業(yè)知識已知μ>μ0,不會μ<μ0(或已知μ<μ0不會μ>μ0),或目的是推斷是否μ>μ0(或μ<μ0),則用單側檢驗,H0:μ=μ0,H1:u>μ0(或μ<μ0)。一般認為雙側檢驗較為穩(wěn)妥,故較常用。
檢驗水準(size of a test)亦稱顯著性水準(significance level),符號為α,是假設檢驗時發(fā)生第一類錯誤的概率。α常取0.05或0.01。
二、選定檢驗方法和計算統(tǒng)計量
根據(jù)研究設計的類型、資料類型及分析目的選用適當?shù)臋z驗方法。如配對設計的兩樣本均數(shù)比較,選用配對t檢驗;完全隨機設計的兩樣本均數(shù)比較,選用u檢驗(大樣本時)或t檢驗(小樣本時)等。
不同的檢驗方法有不同的檢驗假設以及不同的公式。根據(jù)公式計算現(xiàn)有樣本統(tǒng)計量,如t值、u值等。
三、確定P值,作出推斷結論
用算得的統(tǒng)計量與相應的界值作比較,確定P值。P值是指在由H0所規(guī)定的總體中隨機抽樣,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計量的概率。根據(jù)P值大小作出拒絕或不拒絕H0的統(tǒng)計結論。