南方醫(yī)科大學(xué)教案首頁
授課題目 | 假設(shè)檢驗(yàn) | 授課形式 | 講授 |
授課時間 | 授課學(xué)時 | 3 | |
教學(xué)目的 與 要 求 | 目的的要求:掌握假設(shè)檢驗(yàn)的基本原理,t檢驗(yàn)的各類應(yīng)用。 | ||
基本內(nèi)容 | (一)掌握內(nèi)容 1.假設(shè)檢驗(yàn)的基本原理 2.t檢驗(yàn)的方法應(yīng)用于單樣本、配對、兩組獨(dú)立樣本的資料比較 3.有關(guān)概念(如I、II類錯誤)及注意事項(xiàng)。 (二)熟悉內(nèi)容 兩樣本方差齊性檢驗(yàn)。 (三)了解內(nèi)容 1.總體方差不等時的兩樣本均數(shù)的比較; 2.二項(xiàng)分布、泊松分布資料的Z檢驗(yàn) | ||
重 點(diǎn) 難 點(diǎn) | 重點(diǎn): 1.假設(shè)檢驗(yàn)的基本原理 2.t檢驗(yàn)應(yīng)用于單樣本、配對、兩組獨(dú)立樣本的資料處理 3.I、II類錯誤 難點(diǎn): i. 兩組獨(dú)立樣本資料的t檢驗(yàn) ii. 假設(shè)檢驗(yàn)功效 | ||
主要教學(xué) 媒 體 | 采用課堂講授,習(xí)題練習(xí) ppt演示 | ||
主 要 外 語 詞 匯 | Significance test t-test | ||
有關(guān)本內(nèi)容的新進(jìn)展 | |||
主要參考資料或相關(guān)網(wǎng)站 | http://www.smmu.edu。cn/zykj/~statistics/index/index.htm 1. 徐勇勇主編. 醫(yī)學(xué)統(tǒng)計學(xué)(第二版). 北京:高等教育出版社,2004 2. 楊樹勤主編. 衛(wèi)生統(tǒng)計學(xué)(第二版). 北京:人民衛(wèi)生出版社,1991 3. 方積乾主編. 醫(yī)學(xué)統(tǒng)計學(xué)與電腦實(shí)驗(yàn)(第二版). 上海:上?茖W(xué)技術(shù)出版社,2001 4. 孫振球主編. 醫(yī)學(xué)統(tǒng)計學(xué)(供研究生用). 北京:人民衛(wèi)生出版社,2004 | ||
系、教研室 審查意見 | |||
課后體會 |
南方醫(yī)科大學(xué)教案
教學(xué)內(nèi)容 | 時間分配和 媒體選擇 |
一、假設(shè)檢驗(yàn)的概念 二、假設(shè)檢驗(yàn)的基本步驟 三、計量資料的假設(shè)檢驗(yàn) 1、單樣本t檢驗(yàn) 2、配對t檢驗(yàn) 3、兩樣本t檢驗(yàn) 四、假設(shè)檢驗(yàn)應(yīng)注意的問題 (1)要有嚴(yán)密的研究設(shè)計,這是假設(shè)檢驗(yàn)的前提。 (2)不同變量或資料應(yīng)選用不同的檢驗(yàn)方法。 (3)正確理解“顯著性”一詞的含義。 (4)作結(jié)論不能絕對化。 (5) 統(tǒng)計“顯著性”與醫(yī)學(xué)/臨床/生物學(xué)“顯著性” 五、小結(jié) | 幻燈片20分鐘 幻燈片30分鐘 幻燈片40分鐘 幻燈片20分鐘 幻燈片10分鐘 |
教學(xué)過程
教 學(xué) 內(nèi) 容 | 教學(xué)活 動方式 |
假設(shè)檢驗(yàn) 一、假設(shè)檢驗(yàn)的概念 統(tǒng)計推斷包括兩大方面的內(nèi)容,其一為參數(shù)估計(如總體均數(shù)的估計),另一方面,即假設(shè)檢驗(yàn)(hypothesis test)。假設(shè)檢驗(yàn)過去亦稱顯著性檢驗(yàn)(significance test)。其基本原理和步驟用以下實(shí)例說明。 例 為研究某山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù)。某醫(yī)生在一山區(qū)隨機(jī)抽查了 25名健康成年男子,求得其脈搏的均數(shù)為 74.2次/分,標(biāo)準(zhǔn)差為6.0次/分。根據(jù)大量調(diào)查,已知健康成年男子脈搏均數(shù)為72次/分;能否據(jù)此認(rèn)為該山區(qū)成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)? 本例可用下圖表示。 顯然,本例其目的是判斷是否μ>μ0。從所給條件看,樣本均數(shù)X與已知總體均數(shù)μ0不等,造成兩者不等的原因有二: ①非同一總體,即μ#μ0; ②同一總體即μ=μ0,兩個均數(shù)不相等的原因在于抽樣誤差。 假設(shè)檢驗(yàn)的目的就是要判斷造成上面兩個均數(shù)不等的原因是哪一個。也就是說,是解決樣本均數(shù)代表性如何的問題。上例是,樣本均數(shù)比已知總體均數(shù)大,有可能是由于抽樣誤差引起,也有可能是由于所調(diào)查的樣本人群的生活環(huán)境、生活習(xí)慣、遺傳或其他原因所致,如何判斷呢,這就需要利用統(tǒng)計學(xué)方法----假設(shè)檢驗(yàn)方法。假設(shè)檢驗(yàn)也是統(tǒng)計分析的重要組成部分。 (提問:統(tǒng)計分析包括參數(shù)估計和假設(shè)檢驗(yàn)) 下面我們以例題所提出的問題學(xué)習(xí)假設(shè)檢驗(yàn)的基本步驟,同時學(xué)習(xí)樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)。 假設(shè)檢驗(yàn)一般都是有“名”的,比如t檢驗(yàn),大家要知道假設(shè)檢驗(yàn)的命名通常是以所要計算的統(tǒng)計量來命名的,如t檢驗(yàn)、F檢驗(yàn)、X2檢驗(yàn)等。后面有進(jìn)一步介紹。 二、假設(shè)檢驗(yàn)的基本步驟 建立檢驗(yàn)假設(shè) 假設(shè)有兩種: 一種是檢驗(yàn)假設(shè),常稱無效假設(shè),用 H0表示。這種假設(shè)的含義是假設(shè)兩個指標(biāo)(樣本指標(biāo)與總體指標(biāo)、或兩個樣本指標(biāo))是相等的,它們的差別是由于抽樣誤差引起的。另一種是備擇假設(shè),常稱對立假設(shè),常用H1表示,是與H0相對立的假設(shè),假設(shè)兩個指標(biāo)不相等,它們的差別不是由于抽樣誤差引起的,若無效假設(shè)被否決則該假設(shè)成立。 在建立檢驗(yàn)假設(shè)時,應(yīng)當(dāng)注意: ① 檢驗(yàn)假設(shè)是針對總體而言,而不是針對樣本; ②H0和 H1是相互聯(lián)系、對立的假設(shè),后面的結(jié)論是根據(jù) HO和 H1作出的,因此兩者不是可有可無,而是缺一不可; ③H0為無效假設(shè),其假定通常是:某兩個(或多個)總體參數(shù)相等,或某兩個總體參數(shù)之差等于0; H1的內(nèi)容反映出檢驗(yàn)的單雙側(cè)。若H1假設(shè)為μ>μ0或μ<μ0,則此檢驗(yàn)為單側(cè)檢驗(yàn)(one-sided test)。它不僅考慮有無差異,而且還考慮差異的方向。如上例研究者只關(guān)心山區(qū)成年男子的脈搏數(shù)是否高于一般;若H1為μ#μ0,則此檢驗(yàn)為雙側(cè)檢驗(yàn)(two-sided test)。例如研究者對山區(qū)成年男子的脈搏數(shù)高于一般和低于一般同樣關(guān)心。 單雙側(cè)檢驗(yàn)首先應(yīng)根據(jù)專業(yè)知識來確定,同時也應(yīng)考慮所要解決問題的目的。若從專業(yè)知識判斷一種方法的結(jié)果不可能低于或高于另一種方法的結(jié)果,擬用單側(cè)檢驗(yàn)。在尚不能從專業(yè)知識判斷兩種結(jié)果誰高準(zhǔn)低時,則用雙側(cè)檢驗(yàn)。一般認(rèn)為雙側(cè)檢驗(yàn)較保守和穩(wěn)妥。現(xiàn)以樣本均數(shù)的比較為例,用符號表示如下: 樣本均數(shù)所代表的未知總體µ與已知總體均數(shù)µ0的比較 目的 H0 H1 雙側(cè)檢驗(yàn) 是否µ#µ0 µ=µ0 µ#µ0 是否µ>µ0 µ=µ0 µ>µ0 單側(cè)檢驗(yàn) 是否µ<µ0 µ=µ0 µ<µ0 兩樣本均數(shù)所代表的未知總體均數(shù)µ1與µ2的比較 目的 H0 H1 雙側(cè)檢驗(yàn) 是否µ1#µ2 µ1=µ2 µ1#µ2 是否µ1>µ2 µ1=µ2 µ1>µ2 單側(cè)檢驗(yàn) 是否µ1<µ2 µ1=µ2 µ1<µ2 (二)確定檢驗(yàn)水準(zhǔn)(size of a test),代號α,過去稱顯著性水準(zhǔn)(significance level),是一個接受或拒絕H0的概率標(biāo)準(zhǔn),是預(yù)先規(guī)定的概率值,它確定了小概率事件標(biāo)準(zhǔn)。在實(shí)際工作中一般取α=0.05。但α的取值并非一成不變,可根據(jù)不同研究目的給予不同設(shè)置,如方差齊性檢驗(yàn)、正態(tài)性檢驗(yàn)等常取α等于0.10、0.20,甚至更高。 (三)選定檢驗(yàn)方法,計算檢驗(yàn)統(tǒng)計量 應(yīng)根據(jù)研究目的、變量或資料類型、設(shè)計方案、檢驗(yàn)方法的適用條件等選擇檢驗(yàn)方法,并計算統(tǒng)計量(test statistic)。如兩均數(shù)比較可選用t檢驗(yàn),(當(dāng)樣本含量較大,如n>100時可用u檢驗(yàn);兩樣本方差比較可選用F檢驗(yàn)、率的比較可選用u檢驗(yàn)或x2檢驗(yàn)。 (四)確定P值 從假設(shè)檢驗(yàn)的整個邏輯推理過程可看出,P的含義是指從由H0規(guī)定的總體中隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計量值(如 t或u)的概率,可以簡單地理解P的含義是H0成立的概率。 (五)作出統(tǒng)計推斷 根據(jù)計算出的檢驗(yàn)統(tǒng)計量,查相應(yīng)的界值表即可得概率P。如上例,算得t=1.833,查表14-16,t界值表,先從橫標(biāo)目找到自由度υ=24一行,1. 833在界值1.711與2.064之間,相對應(yīng)縱標(biāo)目的單尾P值分別為0.05與0.025,得本例0.025< P< 0.05;余類推。 將獲得的事后概率P,與事先規(guī)定的概率——檢驗(yàn)水準(zhǔn)α進(jìn)行比較而得出結(jié)論。一般來說,推斷的結(jié)論應(yīng)包含統(tǒng)計結(jié)論和專業(yè)結(jié)論兩部分。統(tǒng)計結(jié)論只說明有統(tǒng)計學(xué)意義(statistical significance)或無統(tǒng)計學(xué)意義(statistical significance),而不能說明專業(yè)上的差異大小。它必須和專業(yè)結(jié)論有機(jī)地相結(jié)合,才能得出恰如其分、符合客觀實(shí)際的最終結(jié)論。若P≤α,則結(jié)論為按所取的α檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差別有統(tǒng)計學(xué)意義(統(tǒng)計結(jié)論),可認(rèn)為……不同或不等(專業(yè)結(jié)論)。如例題得到0.025<P<0.05,按所取檢驗(yàn)水準(zhǔn)0.05,則拒絕H0,接受H1,有統(tǒng)計學(xué)意義,可認(rèn)為該山區(qū)健康成年男子脈搏均數(shù)高于一般健康成年男子。若P>a,則結(jié)論為按α檢驗(yàn)水準(zhǔn),不拒絕H。,無統(tǒng)計學(xué)意義(統(tǒng)計結(jié)論),還不能認(rèn)為……不同或不等(專業(yè)結(jié)論)。 P>α過去稱“無顯著性”,在文獻(xiàn)中常用 NS(non- significant/no- significant。)表示,也就是人們常說的“陰性結(jié)論”。注意:①雖然否定之否定為肯定,但不拒絕H0不等于完全接受H。,此時,尚沒有足夠的證據(jù)認(rèn)為H。成立。從決策的觀點(diǎn):可認(rèn)為暫時“接受”它,或“陰性待觀察”。②下結(jié)論時,對H0只能說:拒絕(reject)或不拒絕(not reject);而對 H1只能說:接受 H1,除此之外的其它說法均不妥當(dāng)。 三.計量資料的假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)的具體方法,通常以選定的檢驗(yàn)統(tǒng)計量來命名。如檢驗(yàn)統(tǒng)計量t和u分別對應(yīng)于t檢驗(yàn)(t-test,亦稱 Student’s t-test)和 u檢驗(yàn)(u-test,亦稱 Z-test)。假設(shè)檢驗(yàn)方法的選擇應(yīng)根據(jù)不同的資料類型和性質(zhì),研究的目的等來確定。實(shí)際應(yīng)用時,應(yīng)弄清各種檢驗(yàn)方法的用途、適用條件和注意事項(xiàng)。 前面我們學(xué)過,統(tǒng)計資料可分為計量資料、計數(shù)資料和等級資料三種,這三種不同類型的資料都有其相應(yīng)的假設(shè)檢驗(yàn)方法: 計量資料:常用t檢驗(yàn)(u檢驗(yàn))、F檢驗(yàn)(方差分析)等; 計數(shù)資料:X2檢驗(yàn)等; 等級資料:秩和檢驗(yàn)。 我們首先學(xué)習(xí)計量資料的假設(shè)檢驗(yàn)。同樣是計量資料,還有不同的檢驗(yàn)方法,這主要是要根據(jù)具體的資料內(nèi)容的研究目的來確定。一般來說,兩均數(shù)比較用t檢驗(yàn),而兩個以上均數(shù)的比較就必須用方差分析了。 t檢驗(yàn)的應(yīng)用條件:當(dāng)樣本含量n較小時(如n< 50=,理論上要求樣本取自正態(tài)總體,兩小樣本均數(shù)比較時還要求兩樣本總體方差相等。但在實(shí)際應(yīng)用時,與上述條件略有偏離,只要其分布為單峰近似對稱分布,則對結(jié)果亦影響不大。u檢驗(yàn)的應(yīng)用條件:樣本含量n較大, 一般要求n>50。其實(shí),u檢驗(yàn)和t檢驗(yàn)都屬同類,其方法步驟也基本相同,不同的地方僅在于確定P值時界值的選擇。 (一)樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn) 下面我們以例題提出的問題為例,學(xué)習(xí)假設(shè)檢驗(yàn)的一般步驟方法、掌握樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)的過程。 在例題中,某醫(yī)生在一山區(qū)隨機(jī)抽查了 25名健康成年男子,其脈搏的均數(shù)為 74.2次/分,標(biāo)準(zhǔn)差為6.0次/分,這是一個樣本。而已知的一般健康成人脈搏均數(shù)72次/分可作為總體均數(shù)。這是一個樣本均數(shù)與已知總體均數(shù)比較的問題,故選用t檢驗(yàn)方法。(有的同學(xué)會問,不是說總體均數(shù)一般為未知的嗎?是的,但醫(yī)學(xué)上也有一些數(shù)據(jù)比較穩(wěn)定、經(jīng)過長時間研究應(yīng)用的常數(shù),如醫(yī)學(xué)正常值、理論值、標(biāo)準(zhǔn)值,這些有時可作為總體均數(shù)來應(yīng)用。) ①建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn) H0:µ=µ0,即山區(qū)成年男子平均脈搏數(shù)與一般成年男子相等 H1:µ>µ0,即山區(qū)成年男子平均脈搏數(shù)高于一般成年男子 ②確定檢驗(yàn)水準(zhǔn) 取α=0.05 ③選定檢驗(yàn)方法,計算檢驗(yàn)統(tǒng)計量 因該例為計量資料且 n=25<50,故選用樣本均數(shù)與總體均數(shù)比較的 t檢驗(yàn)。 已知 X=74.2次/分,S=6.0次/分,按下式計算統(tǒng)計量: t=(X-µ)/sx=1.833 ④確定P值 按自由度υ=n-1=25-1=24查t界值表得: 單側(cè)t0.05,24=1.711; t0.01,24=2.492 t0.05,24=1.711<t< t0.01,24 故單側(cè)0.01<P<0.05。 ⑤統(tǒng)計推斷,下結(jié)論 因0.01<P<0.05,按α=0.05的水準(zhǔn)拒絕H0,接受H1,差別有統(tǒng)計學(xué)意義?烧J(rèn)為該山區(qū)健康成年男子脈搏數(shù)高于一般成年男子。 這個例題是一個單側(cè)t檢驗(yàn),就是說研究者只關(guān)心山區(qū)健康成年男子脈搏數(shù)是否高于一般成年男子,并不認(rèn)為相反結(jié)果會成立。但是醫(yī)學(xué)上的大部分研究都必須關(guān)心到正反兩種結(jié)果,如一種新療法與傳統(tǒng)療法的療效比較等,所以,除非有確實(shí)必要或?qū)I(yè)知識的要求,我們一般都要用雙側(cè)檢驗(yàn)。雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)的區(qū)別在于①建立假設(shè)時的敘述;②確定P值時查表是用單側(cè)或是雙側(cè) (二)配對資料的t檢驗(yàn) 有以下兩種不同的配對資料:①將實(shí)驗(yàn)對象配成對子,分別給予不同的處理,以推斷兩種處理是否有區(qū)別;②對同一實(shí)驗(yàn)對象,比較其處理前后的差別,以推斷某種處理有無作用,如臨床上病人治療前后某個指標(biāo)的對比。 (三)兩樣本均數(shù)的t檢驗(yàn) 又稱成組t檢驗(yàn),適用于完全隨機(jī)設(shè)計兩樣本均數(shù)的比較。完全隨機(jī)設(shè)計是分別從兩個研究總體中隨機(jī)抽取樣本,對這payment-defi.com/yishi/兩個樣本均數(shù)進(jìn)行比較,以推斷它們所代表的總體是否一致。 其他的還有兩大樣本比較的u檢驗(yàn)、兩幾何均數(shù)比較的t檢驗(yàn)等。這些檢驗(yàn)思路、方法基本相同,只不過是計算統(tǒng)計量的公式不同而已。 四.假設(shè)檢驗(yàn)應(yīng)注意的問題 (1)要有嚴(yán)密的研究設(shè)計,這是假設(shè)檢驗(yàn)的前提。組間應(yīng)具可比性,也就是除對比的主要因素(如用新藥和用安慰劑)外,其它可能影響結(jié)果的因素(如年齡,性別,病程,病情輕重等),在對比組間應(yīng)盡可能相同或相近;應(yīng)保證樣本是從同質(zhì)總體中隨機(jī)抽取。 (2)不同變量或資料應(yīng)選用不同的檢驗(yàn)方法。應(yīng)根據(jù)分析目的、資料(變量)類型和分布、設(shè)計方案、樣本含量大小等選用適當(dāng)?shù)臋z驗(yàn)方法。如:配對設(shè)計的計量資料采用配對t檢驗(yàn),而完全隨機(jī)的兩樣本定量(變量)資料,若為小樣本(即任一組 n< 50)且方差齊,則選用兩小樣本t檢驗(yàn);若方差不齊,則選用近似t'檢驗(yàn)(Cochran&Cox法或Satterthwaite法);若為大樣本(每組n>50),則可選用大樣本u檢驗(yàn)。 (3)正確理解“顯著性”一詞的含義。差別有統(tǒng)計學(xué)意義,過去稱差別有“顯著性”,不能理解為差異大。假設(shè)檢驗(yàn)的結(jié)醫(yī)學(xué)招聘網(wǎng)果并不指差異的大小,只能反映兩者是否相同或不同,因此一般采用“有無統(tǒng)計學(xué)意義”一詞表達(dá)。差異的大小只能根據(jù)專業(yè)知識予以確定。 (4)作結(jié)論不能絕對化。因統(tǒng)計結(jié)論具有概率性質(zhì),不宜用“肯定”,“一定”,“必定”等詞。在報告結(jié)論時,最好應(yīng)列出檢驗(yàn)統(tǒng)計量的值,盡量寫出P值的確切范圍(并注明單側(cè)還是雙側(cè)),如寫成0.025<P<0.05,以便讀者與同類研究進(jìn)行比較。 (5) 統(tǒng)計“顯著性”與醫(yī)學(xué)/臨床/生物學(xué)“顯著性”(statistical vs medical/ clinical/ biological significance)。統(tǒng)計“顯著性”對應(yīng)于統(tǒng)計結(jié)論,而醫(yī)學(xué)/臨床/生物學(xué)“顯著性”對應(yīng)于專業(yè)結(jié)論。假設(shè)檢驗(yàn)是為各專業(yè)服務(wù)的,統(tǒng)計結(jié)論必須和專業(yè)結(jié)論有機(jī)的相結(jié)合,才能得出恰如其分、符合客觀實(shí)際的最終結(jié)論。若統(tǒng)計結(jié)論和專業(yè)結(jié)論一致,則最終結(jié)論就和這兩者均一致(即均有或均無意義);若統(tǒng)計結(jié)論和專業(yè)結(jié)論不一致,則最終結(jié)論需根據(jù)實(shí)際情況加以考慮。當(dāng)統(tǒng)計結(jié)論有意義,而專業(yè)結(jié)論無意義,則可能由于樣本含量過大或設(shè)計存在嚴(yán)重的偏倚(偏性),那么最終結(jié)論則沒有意義。例如:有人欲比較A、B兩種降壓藥物的降壓效果,隨機(jī)抽取了高血壓病人各100名,分別測定兩組病人服藥后舒張壓的改變值,得兩組舒張壓改變值之差的平均數(shù)為0.11kPa。作兩大樣本u檢驗(yàn)得u=6.306,P《0.001,有統(tǒng)計學(xué)意義。但因A、B兩組高血壓病人服藥后舒張壓改變值之差較小,僅0.11kPa,不足有臨床意義的差值0.67kPa,故最終結(jié)論并無實(shí)際意義。相反,統(tǒng)計結(jié)論無意義,而專業(yè)結(jié)論被認(rèn)為有意義,那就應(yīng)當(dāng)檢查設(shè)計是否合理、統(tǒng)計分析方法應(yīng)用是否恰當(dāng)?shù)鹊,并進(jìn)一步加以驗(yàn)證。 小 結(jié) t檢驗(yàn)的基本步驟: ① 建立假設(shè):H0、H1 ② 確定檢驗(yàn)水準(zhǔn):α=0.05 ③ 計算統(tǒng)計量t:根據(jù)不同的資料選用相應(yīng)的計算公式 ④ 查t值表,確定P值: t ≥ tα,υ P≤α t ≤ tα,υ P≥α ⑤統(tǒng)計推斷結(jié)論 P>0.05,接受H0,差別無顯著意義; 0.01<P≤0.05,拒絕H0,接受H1,差別有顯著意義; P≤0.01 拒絕H0,接受H1,差別有非常顯著意義。 t檢驗(yàn)的注意事項(xiàng) ① 資料必須有可比性; ② 必須是計量資料; ③ 資料必須呈正態(tài)或近似正態(tài)分布; ④ 要根據(jù)不同的資料類型選用不同的計算公式; 要正確理解統(tǒng)計結(jié)論的含義。 | 版書 版書 10’ 幻燈 幻燈 10’ 講解 10’ 提問 版書 幻燈 10’ 幻燈 10’ 幻燈 10’ 幻燈 幻燈 10’ 10’ 10’ 講解 版書 10’ 幻燈 10’ 幻燈 10’ |