為了判斷觀察到的一組計量數(shù)據(jù)是否與其總體均數(shù)接近,兩者的相差系同一總體中樣本與總體之間的誤差,相差不大;還是已超出抽樣誤差的一般允許范圍而存在顯著差別?應(yīng)進行假設(shè)檢驗,下面通過實例介紹t檢驗的方法步驟。
例7.1 根據(jù)大量調(diào)查得知,健康成年男子脈搏均數(shù)為72次/分,某醫(yī)生在某山區(qū)隨機抽查健康成年男子25人,其脈搏均數(shù)為74.2次/分,標準差為6.5次/分。根據(jù)這個資料能否認為某山區(qū)健康成年男子的脈搏數(shù)與一般健康成年男子的不同?
在醫(yī)學(xué)領(lǐng)域中有一些公認的生理常數(shù)如本例提到的健康成人平均脈搏次數(shù)72次/分,一般可看作為總體均數(shù)μ。已知在總體均數(shù)μ和總體標準差σ已知的情況下可以予測樣本均數(shù)分布情況,現(xiàn)缺總體標準差,則需用樣本標準差來估計它,那么樣本均數(shù)圍繞總體均數(shù)散布的情況服從t分布(尤其當(dāng)樣本含量n較小時,)。t分布的基本公式即6.5。
從式中可知,t是樣本均數(shù)與總體均數(shù)之差(以標準誤為單位),t的絕對值越大也即X距μ越遠。在t分布中距μ越遠的樣本均數(shù)分布得越少(所占百分比小,P值小),后面附表3右上角的示意圖中展示了這種關(guān)系,如欲知各自由度下t值與其相應(yīng)的P值可查附表3。
下面回答本例提出的問題而進行假設(shè)檢驗。按一般步驟:
(1)提出檢驗假設(shè)H0與備擇假設(shè)H1。本例H0為某山區(qū)成年男子的脈搏均數(shù)與一般成年男子的相等,μ=μ0=72次/分;H1為兩者不相等μ≠μ0,即μ大于或小于μ0(這是雙側(cè)檢驗,如果事先已肯定山區(qū)人的脈搏不可能低于一般人,只檢驗它是否高于一般人,則應(yīng)用單側(cè)檢驗,H1必為μ>μ)。
(2)定顯著性水準α,并查出臨界t值。α是:若檢驗假設(shè)為真但被錯誤地拒絕的概率。現(xiàn)令α=0.05,本例自由度ν=n-1=25-1=24、查附表3得t0.05,24=2.064。若從觀察資料中求出的∣t∣值小于此數(shù),我們就接受H0;若等于或大于此值則在α=0.05水準處拒絕H0而接受H1。
(3)求樣本均數(shù)X、標準差S及標準誤Sχ并進而算出檢驗統(tǒng)計量t,F(xiàn)已知X=74.2次/分,S=6.5次/分,只要求出Sχ及t值即可。
(4)下結(jié)論:因∣t∣t0.05,24=2.064,所以檢驗假設(shè)H0得以接受,從而認為就本資料看,尚不能得出山區(qū)健康成年人的脈搏數(shù)不同于一般人而具有顯著差別的結(jié)論。
上面介紹了已知總體均數(shù)時的顯著性檢驗方法,但有時我們并不知道總體均數(shù),且醫(yī)學(xué)數(shù)據(jù)資料中更為常見的是成對資料,若一批某病病人治療前有某項測定記錄,治療后再次測定以觀察療效,這樣,觀察n例就有n對數(shù)據(jù),這即是成對資料(也可對動物做成病理模型進行治療實驗以收集類似的成對資料);如果有兩種處理要比較,將每一份標本分成兩份各接受一種處理,這樣觀察到的一批數(shù)據(jù)也是成對資料,醫(yī)學(xué)科研中有時無法對同一批對象進行前后或?qū)?yīng)觀察,而只得將病人(或?qū)嶒瀯游?配成對子,盡量使同對中的兩者在性別、年齡或其它可能會影響處理效果的各種條件方面極為相似,然后分別給以一種不同的處理后觀察反應(yīng),這樣獲得的許多對不可拆散的數(shù)據(jù)同樣是成對資料。由于成對資料可控制個體差異使之較小,故檢驗效率是較高的。
關(guān)于成對資料,每對數(shù)據(jù)始終相聯(lián)這是它的特點,我們可以先初步觀察每對數(shù)據(jù)的差別情況,進一步算出平均相差作為樣本均數(shù),再與假設(shè)的總體均數(shù)比較看相差是否顯著,下面舉實例說明檢驗過程。
表 7.1 豚鼠注入上腺素前后每分鐘灌流滴數(shù)
豚鼠號 | 每分鐘灌流滴數(shù) | ||
用藥前 | 用藥后 | 增加數(shù)d | |
1 | 30 | 46 | 16 |
2 | 38 | 50 | 12 |
3 | 48 | 52 | 4 |
4 | 48 | 52 | 4 |
5 | 60 | 58 | -2 |
6 | 46 | 64 | 18 |
7 | 26 | 56 | 30 |
8 | 58 | 54 | -4 |
9 | 46 | 54 | 8 |
10 | 48 | 58 | 10 |
11 | 44 | 36 | -8 |
12 | 46 | 54 | 8 |
總 計 | — | — | 96 |
例7.2 為了驗證腎上腺素有無降低呼吸道阻力的作用,以豚鼠12只,進行支氣管灌流實驗,在注入定量腎上腺素前后,測定每分鐘灌流滴數(shù),結(jié)果見表7.1,問用藥后灌流速度有無顯著增加?
(1)假設(shè)用藥前后灌流滴數(shù)相同,則相差的payment-defi.com/jianyan/總體均數(shù)μ為0;即H0:μ=μ0;H1:μ≠μ0。
(2)令顯著性水準α=0.05,由本例ν=12-1=11查得臨界值t0.05,11=2.201。
(3)求樣本統(tǒng)計量平均相差數(shù)d、差數(shù)的標準差Sd、標準誤Sd及檢驗統(tǒng)計量t值。
(4)下結(jié)論。今∣t∣t0.05,11,p <0.05,故認為檢驗假設(shè)μ=μ0難以接受,在α=0.05水準外拒絕HO而接受H1,相差顯著,注入腎上腺素后每分鐘灌流滴數(shù)比注射前要多。
例7.3 從以往資料發(fā)現(xiàn),慢性支氣管炎病人血中膽堿酯酶活性常常偏高。某校藥理教研室將同性別同年齡的病人與健康人配成8對,測量該值加以比較,資料如下。問可否通過這一資料得出較為明確的結(jié)論?
表7.2 慢性氣管炎病人與健康人血液膽堿酯酶活性測定(μM/ml)
對子序號 | 病人組,X1 | 健康人組,X2 | 差數(shù) D=X1-X2 |
1 | 3.28 | 2.36 | 0.92 |
2 | 2.60 | 2.40 | 0.20 |
3 | 3.32 | 2.40 | 0.92 |
4 | 2.72 | 2.52 | 0.20 |
5 | 2.38 | 3.04 | -0.66 |
6 | 3.64 | 2.64 | 1.00 |
7 | 2.98 | 2.56 | 0.42 |
8 | 4.40 | 2.40 | 2.00 |
(1)檢驗假設(shè)H0:μ=μ0;H1:μ>μ0
(2)令α=0.05,得t0.05,7=1.895(單側(cè))
(3)用差數(shù)求統(tǒng)計量
(4)結(jié)論∣t∣=2.264>t0.05,7=1.895,P<0.05,在α=0.05水準處拒絕H0,接受備擇假設(shè),認為慢性氣管炎病人血中膽堿酯酶高于正常人。
上例用了單側(cè)檢驗是因為事先并不認為該類病人血中膽堿酯含量會出現(xiàn)低于健康人的情況。
在日常工作中,我們經(jīng)常要比較某兩組計量資料的均數(shù)間有無顯著差別,如研究不同療法的降壓效果或兩種不同制劑對殺滅鼠體內(nèi)鉤蟲的效果(條數(shù))等。這時假若事先難以找到年齡、性別等條件完全一樣的人(或動物)作配對比較,那么不能求每對的差數(shù)只能先算出各組的均數(shù),然后進行比較。兩組例數(shù)可以相等也可稍有出入。檢驗的方法同樣是先假定兩組相應(yīng)的總體均數(shù)相等,看兩組均數(shù)實際相差與此假設(shè)是否靠近,近則把相差看成抽樣誤差表現(xiàn),遠到一定界限則認為由抽樣誤差造成這樣大的相差的可能性實在太小,拒絕假設(shè)而接受H1,作出兩總體不相等的結(jié)論。
例7.4 為觀察中成藥青黛明礬片對急性黃疸肝炎的退黃效果,以單用輸液保肝的病人作為對照進行了觀察,兩組患者均為成人,黃疸指數(shù)在30-50之間,各人退黃天數(shù)如下,試比較用藥組(1組)與對照組(2組)退黃天數(shù)有無顯著差別。
表7.3 急性黃疸性肝炎病人的退黃天數(shù)
中藥組,X1 | 5 | 10 | 14 | 21 | 17 | ∑X1=67 | |
對照組,X2 | 18 | 21 | 30 | 23 | 22 | 22 | ∑X2=136 |
(1)檢驗假設(shè) 設(shè)該藥對縮短退黃天數(shù)無效,兩組的總體均數(shù)相等,即H0=μ1=μ2;H1:μ1≠μ2。
(2)求自由度ν
ν=n1+n2-2
=5+6-2=9 (7.1)
定α=0.05,ν=9時的t值為t0.05,9=2.262
(3)計算各組均數(shù),合并方差S2c及兩均數(shù)相差的標準誤Sχ1-χ2,然后求t值。
合并方差: (7.2)
代入得
兩均數(shù)相差的標準誤:
(7.3)
代入得
求t:
(7.4)
(4)下結(jié)論 因│t┃>t0.05,9,P<0.02,所以我們在α=0.05水準處拒絕H0而接受H1,兩者平均退黃天數(shù)和有顯著差別,服青黛明礬片藥的病人退黃天數(shù)較短。如果檢驗假設(shè)屬實,這樣的結(jié)論也還可能下錯,但概率在2%以下。
上例為兩組資料均數(shù)間的比較,與前面成對資料的t檢驗有些區(qū)別。前者每對中兩數(shù)據(jù)不能分離,后者任一組中的各數(shù)據(jù)可以在組內(nèi)前后互換位置;前者只有一個樣本平均差數(shù)d對應(yīng)于一個假設(shè)的總體平均差數(shù)μ0,后者,認為X1為第一個總體的隨機樣本均數(shù),X2則來自μ2,所以后者要計算兩組合并的方差Swww.med126.com2c(方差是標準差的平方)。再者,與前者相比標準誤、自由度的計算方法也不相同。
例7.5 某人測定半歲至1歲小兒、7至8歲兒童各9人的免疫球蛋白IgG(國際單位/ml),算得平均數(shù)與標準差前者(第1組)為55.1± 11.5,后者(第2組)為 95.5 ±17.8,試檢驗這兩種不同年齡的人免疫球蛋白IgG有無顯著差別。
(1)檢驗假設(shè)H0:μ1=μ2;H1:μ1≠μ2。
(2)令α=0.01,查自由度ν=9+9-2=16時的臨界值,得t0.01,16=2.921
(3)求統(tǒng)計量 已知X1=55.1,X2=95.5,至于求t值時作為分母的標準誤,在暫缺原始數(shù)據(jù)時由已知的兩個標準差先推算出合并方差Sc2進而求出Sχ1-χ2即可,方法如下;
①一般方法;根據(jù)標準差算式
則
于是
由式(7.2)
由式(7.3)
②在兩組例數(shù)相等時也可直接用S1、S2代入下式求Sχ1-χ2,結(jié)果一樣。
現(xiàn)已有了均數(shù)及標準誤可由X1、X2、Sχ1-χ2求出t值。
(4)結(jié)論 │t│>=5.719>t0.01,16=2.921,P<0.001,在α=0.01水準處拒絕H0,接受H1,兩年齡組的人免疫球蛋白IgG的均數(shù)相差顯著,7-8歲組的高于小幾組。
關(guān)于檢驗水準α定在0.05還是0.01或其它處,要看檢驗者事先對結(jié)論的可靠性要求之高低而定。本例定α=0.01,要求是較高的,最后查出P值小于0.001就更說明X1-X2=-40.4隨機來自μ1-μ2=0的假設(shè)總體的可能性是很小的。