前面幾章介紹了常用的統(tǒng)計方法。在實驗工作中,必須根據(jù)研究目的與資料性質(zhì),并結(jié)合專業(yè)知識,恰當?shù)剡\用統(tǒng)計方法,才能做出正確的、符合實際的結(jié)論。例如:某院為探明胃液及胃組織的瘤胚抗原(Carcino embryonic Antigen CEA)在胃癌診斷、癌前病變篩選及隨訪方面的意義,胃液、胃組織CEA含量的相互關系,以及CEA與胃組織病理學改變的關系,測定了各種胃病患者的胃液、胃組織及血清中CEA含量,并用同樣方法測定了部分正常人胃液CEA含量作為對照。表1、表2是測量結(jié)果的一部分。下面我們簡要介紹統(tǒng)計處理的一般程序及統(tǒng)計方法的選擇。
表1 三組不同人員胃液癌胚抗原(CEA)測定結(jié)果
組別 |
胃液CEA含量(ng/ml) |
定性結(jié)果 | ||||||
陽性 |
陰性 | |||||||
正常人組 |
20.4 |
30.2 |
210.4 |
365.0 |
56.8 |
37.8 |
2 |
30 |
265.3 |
175.0 |
169.8 |
256.4 |
254.0 |
262.3 | |||
170.5 |
360.0 |
78.4 |
86.4 |
128.0 |
24.1 | |||
28.5 |
108.5 |
472.5 |
158.6 |
238.7 |
253.6 | |||
57.0 |
189.6 |
59.3 |
259.3 |
380.2 |
210.5 | |||
64.6 |
87.3 |
|||||||
萎縮性胃炎組 |
281.0 |
377.1 |
230.0 |
537.9 |
248.7 |
571.4 |
21 |
14 |
766.2 |
495.o |
87.3 |
389.8 |
423.9 |
577.3 | |||
66.8 |
521.3 |
327.8 |
421.4 |
149.7 |
47.5 | |||
425.7 |
270.8 |
378.5 |
228.0 |
538.4 |
245.6 | |||
584.1 |
648.8 |
485.6 |
110.8 |
398.7 |
452.6 | |||
587.7 |
86.8 |
532.1 |
311.6 |
442.2 |
||||
胃癌組 |
480.0 |
488.9 |
350.7 |
652.8 |
1400.0 |
850.0 |
24 |
4 |
725.6 |
590.0 |
765.0 |
1200.0 |
231.2 |
485.3 | |||
600.0 |
1380.0 |
438.5 |
652.4 |
432.8 |
296.1 | |||
608.8 |
688.5 |
630.5 |
750.0 |
815.0 |
664.0 | |||
348.6 |
550.0 |
640.0 |
464.8 |
表2 10例胃癌患者胃液CEA含量與胃組織腫瘤CEA含量的關系
病例號 |
胃液CEA含量 |
胃組織腫瘤CEA含量 |
(ng/ml) |
(cm2·ng/mg) | |
1 |
432.8 |
6.6 |
2 |
488.9 |
8.2 |
3 |
600.0 |
15.7 |
4 |
608.4 |
14.8 |
5 |
640.2 |
16.2 |
6 |
750.0 |
15.8 |
7 |
815.0 |
18.2 |
8 |
1200.0 |
20.0 |
9 |
1380.0 |
20.0 |
10 |
1400.0 |
20.0 |
一、了解研究目的、資料搜集情況、數(shù)據(jù)意義、整理分析要解決什么問題
無論動物實驗、臨床觀察或現(xiàn)場調(diào)查,應當目的明確,周密設計,精心操作,認真記錄,務必使獲得的原始資料完整、準確、真實、可靠。如果是替別人整理分析資料,在接受任務時,也首先必須把這些問題搞清楚,才能做出正確的、符合要求的分析。若發(fā)現(xiàn)某些資料不全或有可疑數(shù)值,應及時查明原因,加以改進,必要時補做實驗或重新調(diào)查。本例研究目的已如上述。所觀察的病人診斷都是明確的,標本采集,數(shù)據(jù)測定都是在實驗室進行,儀器性能穩(wěn)定,操作者技術熟練,資料是可靠的。統(tǒng)計分析的主要目的在于比較正常人、良性胃病患者、胃癌病人的胃液CEA含量有無顯著差別,從而考慮該項指標能否作為胃癌早期診斷的一個輔助指標和隨訪的一個手段。此外,對胃液與胃組織腫瘤CEA含量作相關分析,找出它們間有無直線關系。
二、區(qū)分資料類型
這就是要分清所得到的資料哪部分是計量資料,哪部分是計數(shù)資料,爾后分別采用不同的統(tǒng)計分析方法來處理。本例表1左半部分是胃液中CEA含量,屬計量資料;右半部分是以95%正常值范圍單側(cè)上限值370(ng/ml)為界限,凡≥370(ng/ml)者為陽性,<370(ng/ml)者為陰性,然后清點每組陽性、陰性例數(shù),這是計數(shù)資料。表2是對確診的10例胃癌患者,既測定了胃液中CEA含量,又測定并計算出胃組織腫瘤CEA含量(根據(jù)前人經(jīng)驗用腫瘤面積與胃粘膜中CEA含量相乘,cm2·ng/ml)。顯然,這是兩個變量的問題。為方便敘述。我們按資料類型依次分析。
三、計量資料的處理
先要了解樣本含量與頻數(shù)分布情況。因為大樣本或小樣本、正態(tài)分布或偏態(tài)分布,統(tǒng)計方法的選擇與統(tǒng)計指標的計算都有所不同。本例三組例數(shù)都在30左右,各組觀察值分布比較均勻、對稱,必要時可作正態(tài)性檢驗,故可按小樣本、正態(tài)分布處理。
。ㄒ)計算平均數(shù)與標準差,以說明各觀察值的集中趨勢與變異情形。若觀察值呈偏態(tài)分布,則應計算中位數(shù);若系對數(shù)正態(tài)分布或等比資料,則計算幾何均數(shù)。本例見表3第(3)第(4)欄。
(二)作為正常對照,用估計正常值范圍的方法計算正常人組單側(cè)上限95%正常值。宜用正態(tài)分布法;172.47+1.645×119.50=369.05,故以370(ng/ml)作為單側(cè)上限值。但由于例數(shù)較少,穩(wěn)定性受到影響,因而還不能作為正常值范圍來推廣應用。
(三)計算標準誤,以說明樣本均數(shù)的散布情形,描述抽樣誤差的大小。必要時,用平均數(shù)與標準誤結(jié)合,計算可信區(qū)間,以估計總體均數(shù)所在范圍。見表3第(5)、第(6)欄。
表3 各組平均數(shù)、標準差、標準誤及95%可信區(qū)間
組別 |
N |
X |
S |
Sχ |
95%可信區(qū)間 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
正常人組 |
32 |
172.47 |
119.50 |
21.12 |
129.38<μ<215.55 |
萎縮性胃炎組 |
35 |
378.52 |
182.33 |
30.82 |
315.89<μ<441.15 |
胃癌組 |
28 |
649.25 |
285.66 |
53.98 |
538.48<μ<760.02 |
(四)均數(shù)之間的比較:自身對照或配對設計資料(即成對計量資料)用個別比較t檢驗,兩組均數(shù)比較用團體比較t檢驗,三組以上均數(shù)比較用方差分析。在方差分析前應作方差齊性檢驗,若方差不齊,則應用秩和檢驗,或經(jīng)變量代換后再作方差分析。本例三組資料經(jīng)代入式(8.5)與式(8.6)求得校正χ2值為21.04,χ2>χ20.01,2,P<0.01,三組方差在α=0.01的水準上相差顯著,故不宜用方差分析。所以我們用秩和檢驗,經(jīng)代入式(10.8)得H=50.321,H>χ20.01,2,P<0.01,在α=0.01的水準上相差顯著。再用式(10.7)作兩組之間的比較,結(jié)果正常人組與萎縮性胃炎組之間u=4.475,萎縮性胃炎組與胃癌組之間u=4.150,正常人組與胃癌組之間u=6.253,均在α=0.01的水準上相差顯著,正常人組最低,萎縮性胃炎次之,胃癌組最高。
四、計數(shù)資料的處理
。ㄒ)計算有關的相對數(shù),常用的是率與百分比。如本例,可求出三組的陽性率,見表4。
表4 三組胃液CEA陽性率(%)
組 別 |
檢查例數(shù) |
陽性例數(shù) |
陰性例數(shù) |
陽性率(%) |
正常人組 |
32 |
2 |
30 |
6.25 |
萎縮性胃炎組 |
35 |
21 |
14 |
60.00 |
胃 癌 組 |
28 |
24 |
4 |
85.71 |
合 計 |
95 |
47 |
48 |
49.47 |
(二)必要時,也可以計算率的標準誤,以描述率的抽樣誤差大;然后根據(jù)樣本大小,分別用計算法或查表法求得率的可信區(qū)間,以估計總體率所在范圍。
(三)幾個率之間的比較,常用χ2檢驗。僅有兩組的用四格表計算(當樣本較大時也可用u檢驗),三組以上的用2×K表計算。本例共有三組,每組分為陽性、陰性兩種類型,所以應用2×K表專用公式求χ2值。結(jié)果χ2=40.18,χ2>χ20.01,2,P<0.01,說明三組陽性率在α=0.01的水準上相差顯著。再用四格表進行檢驗,結(jié)果正常人組與萎縮性胃炎組之間得χ2=19.10,χ2>χ20.01,1,P<0.01;正常人組與胃癌組之間得χ2=25.53,χ2>χ20.01,1,P<0.01。以上均在α=0.01的水準上相差顯著,而萎縮性胃炎組與胃癌組之間得χ2=3.86,χ2>χ20.05,1,P<0.05,相差顯著。我們在前面對三組胃液CEA含量用秩和檢驗作兩兩比較,結(jié)果都是在α=0.01的水準上相差顯著,這說明計量資料獲得信息多些。
五、兩個變量間直線關系的分析
如果兩變量的關系是相互的,分不清自變量與應變量,沒有理由用一個變量去推算另一個變量,就只計算相關系數(shù),不建立回歸方程。如果兩變量間存在直線關系,且需要從一個變量推算另一個變量時,可再建立回歸方程,必要時還可以編制用一個變量估計另一個變量的對照表,本例10名胃癌患者胃液CEA含量與胃組織腫瘤CEA含量屬于兩個變量的關系問題,先計算相關系數(shù),得r=0.818,r>r0.01,8,P<0.01,在α=0.01的水準上相關顯著。這說明腫瘤越大,胃組織病變越嚴重,胃液中CEA含量就越高,所以,若需要根據(jù)胃液中CEA含量推算病變嚴重程度,亦可計算回歸方程。
根據(jù)以上統(tǒng)計分析,本例可得出如下結(jié)論:①胃癌病人的胃液CEA明顯升高,提示可作為胃癌診斷的一個輔助指標,在早期胃癌診斷中可能有一定作用;其含量高低與腫瘤大小及胃組織CEA含量有關。②胃癌良性病變,胃液CEA含量也增高,提示該項指標可作為胃癌前疾病篩選和隨訪的一個手段。③良性病變與惡性病變胃液CEA含量重疊較多,所以應用該項指標作良性與惡性病變的鑒別診斷,尚待深入研究。