一、暴露組選擇
暴露組應(yīng)已處在某種暴露因素中或已有某種特殊暴露史,并能提供可靠的暴露因素的歷史,且便于追蹤與觀察。
(一)特殊暴露的人群
選擇由于職業(yè)關(guān)系或其他原因暴露于某危險因素特別嚴重的人作為定群研究對象,不但所需要的人數(shù)較少,而且較易發(fā)現(xiàn)暴露與患病之間是否存在聯(lián)系。如研究放射線與白血病的關(guān)系時,選用接受放射線治療的患者;研究聯(lián)苯胺與膀胱癌的關(guān)系時,選用染料工人;研究肺癌的危險因素時,選用石棉工人。
。ǘ)一個地區(qū)的全部人口或其樣本
有時可在一地區(qū)人群中進行定群研究。選擇條件首先是便于研究。例如,在美國馬薩諸塞州的Framingham鎮(zhèn)已進行多年的心臟病定群研究,在1948年開始時以當時30~59歲人口的2/3的一個隨機樣本作為研究對象。因為當?shù)厝丝诹鲃有孕,居民配合,有一所高水平的醫(yī)院等,便于隨訪,能得到完整的資料。
一個可疑病歷必須有較高的人群暴露率,并且所研究的病又有較高的發(fā)病率或死亡率才適合于用全人群作定群研究。
。ㄈ)便于隨訪的人群
為了便于隨訪,往往選擇一個團體,或以醫(yī)療就診和隨訪觀察結(jié)果方面特別方便的人群作為研究對象,可以節(jié)省人力、物力,并可提高隨訪質(zhì)量和結(jié)果判斷的可靠程度。例如Doll和Hill選擇了所有登記注冊的開業(yè)醫(yī)生。選擇屬于團體的人群,樣本代表全人群的可能性稍差,但是能降低失訪率,同時提高調(diào)查結(jié)果的可靠性。
二、對照組的選擇
對照組的設(shè)立是為了與暴露組比較。對照組與暴露組應(yīng)具有可比性,即對照組人群除暴露因素的影響外,其他各種因素的影響或人群的特征,如年齡、性別、職業(yè)、民族等,都應(yīng)盡可能與暴露組相似。同時在資料收集完畢,進行分析時,還應(yīng)作一次均衡檢驗,以考核兩組資料的可比性。
對照組常用以下幾種形式:
(一)內(nèi)對照
若調(diào)查對象是一個整體人群,人群內(nèi)部暴露于某因素的便為暴露組,而非暴露或以暴露級別最低的一組便為對照組;不需另外設(shè)對照組或非暴露組。例如,調(diào)查人群中血脂水平,可以水平最低的組列為對照。
。ǘ)人群對照
不另設(shè)對照,而是以人群為對照。在職業(yè)流行病學(xué)研究中,常以某職業(yè)人群為暴露組,與該地區(qū)整個人群的發(fā)病(或死亡)率進行比較分析。以人群為對照,應(yīng)注意對照組與暴露組人群在地理與時間的一致性。
特殊暴露人群人數(shù)一般不多,不能得到可靠的分年齡、性別和原因的專率供直接比較,一般須采用標化死亡比或標化發(fā)病比作間接比較,兩者均須計算標準誤并作顯著性檢驗。
。ㄈ)另設(shè)對照組
選擇一個與暴露組在年齡、性別、民族、居住地區(qū)等方面相似的非暴露組作為對照組進行隨訪,作為與暴露組比較的基準。例如研究放射線對放射科醫(yī)師死亡率的影響時,可以在同地區(qū)醫(yī)院內(nèi)眼科醫(yī)師作對照組。
。ㄋ)多種對照
為了增強判斷依據(jù),可將上述方法綜合起來,設(shè)立多種對照,進行多重比較。如內(nèi)對照、人群對照、非暴露組對照等。這樣可以增加判斷的依據(jù)。
三、樣本大小的估計
定群研究樣本大小的估計應(yīng)根據(jù):
1.暴露組的事件發(fā)生率(P1)的估計值;
2.非暴露組的事件發(fā)生率(P0)的估計值;
3.第一類錯誤概率α;
4.第二類錯誤概率β。
在該4個數(shù)值確定后,可用下式估計暴露組與非暴露組需觀察的人數(shù)。
公式中N為每一組所需調(diào)查人數(shù)。
Q1=1-P1,Q0=1-P0
P=(P0+P1)/2,Q=1-P
Kα與Kβ分別為α及β值的正態(tài)分布分位數(shù),該數(shù)可從正態(tài)分布的分位數(shù)表中查出。
非暴露組的發(fā)病率P0可以根據(jù)人群一般發(fā)病水平來代替。而暴露組的發(fā)病率P1難以估計,若能夠估計相對危險度(RR),則P1=RR×P0,RR可從預(yù)調(diào)查或文獻資料中估計,也可用OR來代替,P1=OR×P0,OR可從病例對照研究中得來。
例 擬用定群研究方法研究孕婦暴露于某種藥物與嬰兒先天性心臟病之間的聯(lián)系。假定已知非暴露組的發(fā)病概率P0=0.08,估計RR=2,當α=0.05,β=0.10時,估計需要的樣本含量。
Kα=1.960,Kβ=1.282
P0=0.008,RR=2,P1=2×0.008=0.016
P=(0.008+0.016) /2=0.012
Q=0.988,Q1=0.984,Q2=0.992
代入公式:
即每組需要樣本含量為3892人。
四、資料的來源與收集
確定暴露組與非暴露組后,需收集對疾病的發(fā)生或死亡頻率可能有影響的一般資料,如年齡、性別、婚姻、文化程度、經(jīng)濟收入、家庭人口、人口遷移等。
。ㄒ)從查閱現(xiàn)有的記錄收集
特殊暴露人群的職業(yè)史或醫(yī)療記錄常有暴露水平或個體暴露劑量的的資料,這是暴露史的唯一可靠來源。查閱現(xiàn)有記錄不僅可了解研究對象本人暴露的性質(zhì)和劑量,同時其主要優(yōu)點是具有較高的客觀性。
。ǘ)調(diào)查詢問收集
有時被研究對象的有些研究因素無現(xiàn)成記錄,例如煙、酒、飲食等生活習(xí)慣、體力活動等,必須向被研究對象本人了解。通常采用調(diào)查表方式由調(diào)查員詢問時填寫或通信調(diào)查。
(三)通過醫(yī)學(xué)檢查或檢驗收集
有些研究因素屬于被研究對象對生理特征或生化指標,必須通過檢查或檢驗才能獲得數(shù)據(jù),例如血壓、身高、體重、血脂、血糖等。
。ㄋ)從環(huán)境資料收集
環(huán)境資料包括家庭環(huán)境、居住環(huán)境、工作環(huán)境、區(qū)域環(huán)境等。根據(jù)不同的研究假設(shè),可作不同暴露的測定。
。ㄎ)追蹤結(jié)局收集
追蹤確定各成員的結(jié)局,采用隨訪的方法進行。隨訪的方法有直接方法,即通過函件調(diào)查、訪問調(diào)查、定期調(diào)查等。間接方法就是利用醫(yī)院病歷、死亡登記、疾病報告、勞保資料等,根據(jù)結(jié)局的性質(zhì)選用。判斷結(jié)局的標準必須在隨訪開始時規(guī)定,應(yīng)保持穩(wěn)定,以便前后比較。隨訪時間的長短,根據(jù)不同疾病的潛隱期、疾病的自然史及已暴露時間來確定。
五、定群研究資料分析
定群研究資料分析主要是計算各組發(fā)病率、發(fā)病密度或死亡率,其次對組間率的差異進行統(tǒng)計學(xué)檢查,差異有統(tǒng)計學(xué)意義則進一步確定因素與疾病聯(lián)系的強度。定群研究資料歸納見表30-2。
表30-2 定群研究資料歸納表
組別 |
病例 |
非病例 |
合計 |
發(fā)病率 |
暴露組 |
a |
b |
a+b=N1 |
a/N1 |
非暴露組 |
c |
d |
c+d=N0 |
c/N0 |
a+c=m1 |
b+d=m0 |
定群研究所比較的是發(fā)病率或死亡率即a/N1,與c/N0,如a/N1>c/N0,則某因素與發(fā)病有聯(lián)系,甚至是因果聯(lián)系。
。ㄒ)率的計算
1.累積發(fā)病率(cumulative incidence)觀察期間人群比較固定,且能穩(wěn)定地維持在一個較長的觀察期,可用累積發(fā)病率(或死亡率)。計算公式為:
2.發(fā)病密度(ivcidence density)若暴露人口不固定,人群產(chǎn)生了較大的變動,例如由于工作調(diào)動、死于其他疾病、中途加入等,應(yīng)將變動著的人群轉(zhuǎn)變?yōu)槿藭r數(shù)代替人數(shù)業(yè)計算,此種發(fā)病率稱發(fā)病密度。人時就是將人與時間因素結(jié)合起來作為率分母的單位,常用的單位是人年,是一個觀察對象被觀察滿一年計為一人年。分子為觀察期間發(fā)病或死亡人數(shù)。
。ǘ)暴露人年計算
定群研究觀察時間較長,其間人口有動態(tài)變化,應(yīng)采取一定方法計算“暴露人年數(shù)”,才能計算發(fā)病率;否則,兩組成員由于進入開始觀察的時間不同,或因死亡、遷出及其他原因或早或晚地退出該組,而造成觀察時間的不同,即各組成員的暴露時間不同,可使發(fā)病率出現(xiàn)誤差。
1.大樣本中暴露人年的計算計算原則為:從觀察對象中剔除死亡、遷移及失去聯(lián)系的人數(shù),補充新加入的人數(shù)來折算人年。
可以年末12月31日的人數(shù)為終點及起點計算。上年12月31日觀察人數(shù)減去次年內(nèi)所有死亡、遷移、失去聯(lián)系及新加入人數(shù)的總和,得到次年末12月31日的觀察人數(shù)。兩個人數(shù)之和除以2,即得到該年內(nèi)暴露人年數(shù)。表30-3為例說明不同年齡9年的合計暴露人年數(shù)。
表30-3 男性各年齡各年末存活人數(shù)
年齡組 |
1972.
12.31 |
1973.
12.31 |
1974.
12.31 |
1975
12.31 |
1976.
12.31 |
1977.
12.31 |
1978.
12.31 |
1979.
12.31 |
1980.
12.31 |
1981.
12.31 |
合計暴露 人年數(shù) |
<45 | 607 | 547 | 471 | 392 | 324 | 246 | 210 | 179 | 148 | 110 | 2875.5 |
45~54 | 598 | 596 | 604 | 599 | 603 | 625 | 598 | 562 | 538 | 510 | 5279 |
55~64 | 369 | 406 | 433 | 472 | 493 | 496 | 519 | 524 | 513 | 526 | 4303.5 |
65及以上 | 62 | 75 | 95 | 111 | 132 | 158 | 180 | 210 | 251 | 286 | 1386 |
合計 | 1636 | 1624 | 1603 | 1574 | 1552 | 1525 | 1507 | 475 | 1450 | 1432 | 13844 |
(李婉先等,1984)
以小于45歲組為例計算合計暴露人年數(shù):
。607+547)÷2+(547+471)÷2+(471+392)÷2(392+324)÷2+(324+246)÷2+(246+210)÷2+(210+179)÷2+(179+148)÷2+(148+110)÷2= 2875.5
如此9年內(nèi)共有3名45歲以下男性死亡,男性45歲以下組的死亡率為:3÷2875.5×10萬=104.3/10萬人年。
2.小樣本可以直接計算若樣本不大,且各人隨訪年數(shù)不同,可先算出各人隨訪人年數(shù),再計算總?cè)四陻?shù);而且因為隨訪期內(nèi)各人的年齡在增長,到一定的日期年齡超過原屬年齡組上限時,會進入下一年齡組。所以還可以算出各年齡組的總?cè)四陻?shù)以及不同的年份的總?cè)四陻?shù),結(jié)合同年齡或同年份發(fā)生的病例數(shù),則可算出各年齡組或年份的發(fā)病率。
例有3人從開始觀察日起至1981年1月1日止,逐個計算人年的方法。上例并得出不同年齡組的暴露人年,見表30-4、表30-5。
表30-4 3例出生日期與進出研究時間
對象編號 |
出生日期 |
進入研究時間 |
退出研究時間 |
1 |
1927.03.21 |
1966.07.19 |
1977.09.14(遷居外地) |
2 |
1935.04.09 |
1961.11.11 |
1973.12.01(死亡) |
3 |
1942.11.12 |
1970.02.01 |
1981.01.01(觀察結(jié)束時健在) |
資料來源:錢宇平;流行病學(xué)第二版1986
表30-5 3例人年的計算
對象1
1927年3月21日出生 |
對象2
1935年4月9日出生 |
對象3
1942年11月12日出生 |
暴露
人年 | |
25~ | 61.11.11~65.04.08
共3年4個月27天即3.41人年 |
70.02.01~72.11.11
共2年9個月10天即2.78人年 |
6.19 | |
30~ | 65.04.09~70.04.08
共5.00人年 |
72.11.12~77.11.11
共5.00人年 |
10.00 | |
35~ | 66.07.19~67.03.20
共8個月即0.67人年 |
70.04.09~73.12.01
共3年7個月22天即3.65人年 |
77.11.12~81.01.01
共3年1個月20天即3.14人年 |
7.46 |
40~ | 67.03.21~72.03.20
共5.00人年 |
5.00 | ||
45~ | 72.03.21~77.03.20
共5.00人年 |
5.00 | ||
50~54 | 77.03.21~77.09.14
共5個月24天即0.48人年 |
0.48 | ||
累計 | 66.07.19~77.09.14
共11.15人年 |
61.11.11~73.12.1
共12.06人年 |
70.0201~81.01.01
共10.92人年 |
34.13
人年 |
資料來源:錢宇平:流行病學(xué)第二版1986
。ㄈ)統(tǒng)計學(xué)檢驗
暴露組與非暴露組間率的差異要進行統(tǒng)計學(xué)檢驗。當發(fā)病率高時,可用u檢驗。如果發(fā)病率比較低,則改用二項分布或泊松分布檢驗。檢驗方法查閱有關(guān)統(tǒng)計學(xué)書籍。
。ㄋ)聯(lián)系強度的測量
為了估計疾病死亡與暴露的聯(lián)系強度,常用的測量指標有相對危險度、特異危險度、人群特異危險度。
1.相對危險度(relative risk)又稱“危險比”(risk ratio)或“率比”(rate ratio)。是暴露組發(fā)病率(或死亡率)與非暴露組發(fā)病率(或死亡率)的比值,簡稱RR。
式中Ie=暴露組發(fā)病率,Iu=非暴露組發(fā)病率。
它說明暴露組發(fā)病或死亡為非暴露組的倍數(shù)。
RR>1,說明暴露因素與疾病有“正”的聯(lián)系。暴露越多,發(fā)病越多,可能是致病因素。
RR=1,說明暴露因素與疾病無聯(lián)系。
RR<1,說明暴露因素與疾病有“負”的聯(lián)系。暴露越多,疾病越少,具有保護意義。
表30-6中提供的判斷數(shù)據(jù)可供參考。
表30-6 相對危險度與聯(lián)系強度
相對危險度 |
聯(lián)系的強度 | |
0.9~1.0 | 1.0~1.1 | 無 |
0.7~0.8 | 1.2~1.4 | 弱 |
0.4~0.6 | 1.5~2.9 | 中等 |
0.1~0.3 | 3.0~9.0 | 強 |
<0.1 | 10~ | 很強 |
2.特異危險度(attributable risk)又稱歸因危險度或率差(rate difference),簡稱AR。特異危險度為暴露組發(fā)。ɑ蛩劳)率與非暴露組發(fā)。ɑ蛩劳)率之差。
AR=Ie-Iu=a/N1-c/N0
特異危險度表示完全由暴露因素所致之危險度。
3.人群特異危險度(population attributable risk)簡稱PAR。
PAR=It-Iu
It=全人群某病發(fā)病率或死亡率
Iu=非暴露者某病發(fā)病率或死亡率
人群特異危險度是測量在人群中因暴露于某因素所致的發(fā)病率或死亡率。