簡介:第五章假設(shè)檢驗,統(tǒng)計推斷,隨機抽樣,,參數(shù),統(tǒng)計量,(?、?、?),(X、S、P),參數(shù)估計假設(shè)檢驗,,通過樣本統(tǒng)計量推斷總體參數(shù)之間是否存在差異,其推斷過程稱為假設(shè)檢驗。,教學(xué)目的與要求,掌握假設(shè)檢驗原理單樣本正態(tài)資料的假設(shè)檢驗兩樣本正態(tài)資料的假設(shè)檢驗二項分布與POISSON分布資料的Z檢驗假設(shè)檢驗應(yīng)注意的問題了解置信區(qū)間與假設(shè)檢驗的關(guān)系,教學(xué)內(nèi)容提要,重點講解假設(shè)檢驗原理單樣本正態(tài)資料的假設(shè)檢驗兩樣本正態(tài)資料的假設(shè)檢驗Z檢驗假設(shè)檢驗應(yīng)注意的問題介紹置信區(qū)間與假設(shè)檢驗的關(guān)系,假設(shè)檢驗的基本任務(wù)事先對總體分布或總體參數(shù)作出假設(shè),利用樣本信息判斷原假設(shè)是否合理,從而決定是否拒絕或接受原假設(shè)。參數(shù)檢驗PARAMETRICTEST若總體分布類型已知,需要對總體的未知參數(shù)進行假設(shè)檢驗。非參數(shù)檢驗若總體分布類型未知,需要對未知分布函數(shù)的總體的分布類型或其中的某些未知參數(shù)進行假設(shè)檢驗。,假設(shè)檢驗(HYPOTHESISTEST)的基本思想,亦稱顯著性檢驗(SIGNIFICANCETEST)是先對總體的特征(如總體的參數(shù)或分布、位置)提出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值、總體均數(shù)(或總體率)相等、總體服從某種分布、兩總體分布位置相同等等,然后根據(jù)隨機樣本提供的信息,運用“小概率原理”推斷假設(shè)是否成立。,“概率很小(接近于零)的事件在一次抽樣中不太可能出現(xiàn),故可以認(rèn)為小概率事件在一次隨機抽樣中是不會發(fā)生的”。,“小概率原理”,例如在2000粒中藥丸中只有一粒是蟲蛀過的,現(xiàn)從中隨機取一粒,則取得“蟲蛀過的藥丸”的概率是1/2000,這個概率是很小的,因此也可以將這一事件看作在一次抽樣中是不會發(fā)生的。若從中隨機抽取一粒,恰好是蟲蛀過的,這種情況發(fā)生了,我們自然可以認(rèn)為“假設(shè)”有問題,即蟲蛀率P不是1/2000,從而否定了假設(shè)。否定假設(shè)的依據(jù)就是小概率事件原理。由此我們得到一個推理方法如果在某假設(shè)(記為H0)成立的條件下,事件A是一個小概率事件,現(xiàn)在只進行一次試驗,事件A就發(fā)生了,我們就認(rèn)為原來的假設(shè)(H0)是不成立的。,例如,根據(jù)大量調(diào)查,已知正常成年男性平均脈搏數(shù)為72次/分,現(xiàn)隨機抽查了20名肝陽上亢成年男性病人,其平均脈搏為84次/分,標(biāo)準(zhǔn)差為64次/分。問肝陽上亢男病人的平均脈搏數(shù)是否較正常人快以上兩個均數(shù)不等有兩種可能第一,由于抽樣誤差所致;第二,由于肝陽上亢的影響。,例如,已知正常成年男子脈搏平均為72次/分,現(xiàn)隨機檢查20名慢性胃炎所致脾虛男病人,其脈搏均數(shù)為75次/分,標(biāo)準(zhǔn)差為64次/分,問此類脾虛男病人的脈搏快于健康成年男子的脈搏抽樣誤差脾虛,假設(shè)檢驗1、原因2、目的3、原理4、過程(步驟)5、結(jié)果,第一節(jié)假設(shè)檢驗原理,某事發(fā)生了是由于碰巧還是由于必然的原因統(tǒng)計學(xué)家運用顯著性檢驗來處理這類問題。,1、假設(shè)檢驗的原因,由于總體不同或因個體差異的存在,在研究中進行隨機抽樣獲得的樣本均數(shù),X1、X2、X3、X4,不同。樣本均數(shù)不同有兩種(而且只有兩種)可能(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性(差別無統(tǒng)計學(xué)意義)(2)分別所代表的總體均數(shù)不同。差別有顯著性(差別有統(tǒng)計學(xué)意義),,,,,2、假設(shè)檢驗的目的判斷是由于何種原因造成的不同,以做出決策。,,反證法當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實A,這時否定另一種可能B,則間接的肯定了A。概率論(小概率)如果一件事情發(fā)生的概率很小,那么在進行一次試驗時,我們說這個事件是“不會發(fā)生的”。從一般的常識可知,這句話在大多數(shù)情況下是正確的,但是它一定有犯錯誤的時候,因為概率再小也是有可能發(fā)生的。,3、假設(shè)檢驗的原理,4、假設(shè)檢驗的步驟,▲建立假設(shè)(反證法),確定顯著性水平(?)▲計算統(tǒng)計量U,T,?2▲確定概率P值▲做出推論,【例51】,已知正常成年男子脈搏平均為72次/分,現(xiàn)隨機檢查20名慢性胃炎所致脾虛男病人,其脈搏均數(shù)為75次/分,標(biāo)準(zhǔn)差為64次/分,推斷此類脾虛男病人的脈搏是否不同于健康成年男子的脈搏。,(1)建立假設(shè),選定檢驗水準(zhǔn)假設(shè)兩種一種是檢驗假設(shè),假設(shè)差異完全由抽樣誤差造成,常稱無效假設(shè),用H0表示。另一種是和H0相對立的備擇假設(shè),用H1表示。假設(shè)檢驗是針對H0進行的。,確定雙側(cè)或單側(cè)檢驗,H0此類脾虛病對脈搏數(shù)無影響,H0Μ72次/分H1脾虛病人的脈搏數(shù)不同于正常人,H1Μ≠72次/分,選定檢驗水準(zhǔn)Α005Α是在統(tǒng)計推斷時,預(yù)先設(shè)定的一個小概率值,是當(dāng)H0為真時,允許錯誤地拒絕H0的概率。,,雙側(cè)與單側(cè)檢驗界值比較,,2選定適當(dāng)?shù)臋z驗方法,計算檢驗統(tǒng)計量值,T檢驗Z檢驗,設(shè)計類型資料的類型和分布統(tǒng)計推斷的目的N的大小如完全隨機設(shè)計實驗中,已知樣本均數(shù)與總體均數(shù)比較,N又不大,可用T檢驗,計算統(tǒng)計量T值。,3計算P值,P值是在H0成立時,取得大于或等于現(xiàn)有檢驗統(tǒng)計量值的概率。,(3)計算概率值(P)將計算得到的Z值或T值與查表得到Z?或T?,Ν,比較,得到P值的大小。根據(jù)U分布和T分布我們知道,如果|Z|Z?或|T|T?,則P?。,當(dāng)P≤Α時,統(tǒng)計學(xué)結(jié)論為按所取Α檢驗水準(zhǔn)拒絕H0,接受H1,稱“差異有顯著性”(“差異有統(tǒng)計學(xué)意義”)。當(dāng)PΑ時,沒有理由懷疑H0的真實性,統(tǒng)計學(xué)結(jié)論為按所取Α檢驗水準(zhǔn)不拒絕H0,稱“差異無顯著性”(“差異無統(tǒng)計學(xué)意義”)。,4作出推斷結(jié)論,Α與P異同,相同Α與P都是用檢驗統(tǒng)計量分布的尾部面積大小表示。不同Α是在統(tǒng)計推斷時,預(yù)先設(shè)定的一個小概率值,是當(dāng)H0為真時,允許錯誤地拒絕H0的概率,是檢驗水準(zhǔn)。P值是由實際樣本決定的,是指從由H0所規(guī)定的總體中隨機抽樣,獲得大于及等于(或小于)現(xiàn)有樣本檢驗統(tǒng)計量值的概率。,5、兩類錯誤(I型錯誤與Ⅱ型錯誤),統(tǒng)計推斷可能出現(xiàn)的4種結(jié)果,I型錯誤(?。?推斷正確(1-?。?推斷正確(1-Β),Ⅱ型錯誤(Β),(假陽性錯誤),(假陰性錯誤),(檢驗效能、把握度),(可信度),無效假設(shè)(H0)備擇假設(shè)(H1),兩類錯誤Ⅰ型錯誤與Ⅱ型錯誤Ⅰ型錯誤H0原本是正確的拒絕H0棄真假陽性錯誤誤診用Α表示Ⅱ型錯誤H0原本是錯誤的不拒絕H0存?zhèn)渭訇幮藻e誤漏診用Β表示,,,,,,,,,兩均數(shù)的假設(shè)檢驗,樣本均數(shù)與總體均數(shù)的比較成對資料均數(shù)的T檢驗成組資料兩樣本均數(shù)的比較方差不齊時兩小樣本均數(shù)的比較,第二節(jié)單樣本正態(tài)資料的假設(shè)檢驗,,,不,滿足,,不,滿足,,滿足,,滿足,,,,Σ,已知,,,,正態(tài)性,,,,非參數(shù),檢驗,,,,變量替換,,,,,結(jié)論,,,,,不,滿足,,,,大樣本,,,,U,檢驗,,,,T,檢驗,,滿足,,,,,,,,,Z,思路,一、正態(tài)總體均數(shù)的假設(shè)檢驗,方法,1、大樣本【例52】一般女性平均身高1601CM。某大學(xué)隨機抽取100名女大學(xué)生,測量其身高,身高的均數(shù)是16374CM,標(biāo)準(zhǔn)差是380CM。請問某大學(xué)18歲女大學(xué)生身高是否與一般女性不同。,▲目的比較樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)有無差別▲計算公式Z統(tǒng)計量,▲適用條件1已知一個總體均數(shù);2可得到一個樣本均數(shù);3可得到該樣本標(biāo)準(zhǔn)誤;4樣本量不小于100。,,,假設(shè)檢驗▲建立假設(shè),確定顯著性水平(?)檢驗假設(shè)某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)相同,H0ΜΜ0;備擇假設(shè)某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)不同,H1Μ≠Μ0?005,▲做出推論Z958196,PT00515,P00482。??=005N=5,=1414,S=00882,DF=N-1=4,查統(tǒng)計用表6得單側(cè)概率PT0059PΜ0Μ的上側(cè)95%置信區(qū)間為T005,DFS/如例43,H0Μ=Μ0(Μ072次/分);H1ΜΜ0。Α=005。-T005(DF)S/=75172964/=7252Μ的上側(cè)95%置信區(qū)間為Μ7252,現(xiàn)Μ0=72次/分不在此區(qū)間范圍內(nèi),故按Α=005水準(zhǔn)拒絕H0,接受H1,結(jié)論與前述T檢驗結(jié)果一致。(2)若關(guān)心的是ΜΜ0Μ的下側(cè)95%置信區(qū)間為T005(DF)S/,二、置信區(qū)間比假設(shè)檢驗有可提供更多信息之處,,三、置信區(qū)間不能完全取代假設(shè)檢驗,置信區(qū)間用作假設(shè)檢驗只能在規(guī)定的Α水準(zhǔn)上揭示差異有無統(tǒng)計學(xué)意義。假設(shè)檢驗可得到的P值,可以精確地說明結(jié)論的概率保證,可以估計假陰性率Β。,最好同時給出假設(shè)檢驗的檢驗統(tǒng)計量值、P值和置信區(qū)間,
下載積分: 4 賞幣
上傳時間:2024-01-06
頁數(shù): 72
大?。?0.46(MB)
子文件數(shù):