簡介:第五章假設(shè)檢驗(yàn),統(tǒng)計(jì)推斷,隨機(jī)抽樣,,參數(shù),統(tǒng)計(jì)量,(?、?、?),(X、S、P),參數(shù)估計(jì)假設(shè)檢驗(yàn),,通過樣本統(tǒng)計(jì)量推斷總體參數(shù)之間是否存在差異,其推斷過程稱為假設(shè)檢驗(yàn)。,教學(xué)目的與要求,掌握假設(shè)檢驗(yàn)原理單樣本正態(tài)資料的假設(shè)檢驗(yàn)兩樣本正態(tài)資料的假設(shè)檢驗(yàn)二項(xiàng)分布與POISSON分布資料的Z檢驗(yàn)假設(shè)檢驗(yàn)應(yīng)注意的問題了解置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系,教學(xué)內(nèi)容提要,重點(diǎn)講解假設(shè)檢驗(yàn)原理單樣本正態(tài)資料的假設(shè)檢驗(yàn)兩樣本正態(tài)資料的假設(shè)檢驗(yàn)Z檢驗(yàn)假設(shè)檢驗(yàn)應(yīng)注意的問題介紹置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系,假設(shè)檢驗(yàn)的基本任務(wù)事先對總體分布或總體參數(shù)作出假設(shè),利用樣本信息判斷原假設(shè)是否合理,從而決定是否拒絕或接受原假設(shè)。參數(shù)檢驗(yàn)PARAMETRICTEST若總體分布類型已知,需要對總體的未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)。非參數(shù)檢驗(yàn)若總體分布類型未知,需要對未知分布函數(shù)的總體的分布類型或其中的某些未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)。,假設(shè)檢驗(yàn)(HYPOTHESISTEST)的基本思想,亦稱顯著性檢驗(yàn)(SIGNIFICANCETEST)是先對總體的特征(如總體的參數(shù)或分布、位置)提出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值、總體均數(shù)(或總體率)相等、總體服從某種分布、兩總體分布位置相同等等,然后根據(jù)隨機(jī)樣本提供的信息,運(yùn)用“小概率原理”推斷假設(shè)是否成立。,“概率很?。ń咏诹悖┑氖录谝淮纬闃又胁惶赡艹霈F(xiàn),故可以認(rèn)為小概率事件在一次隨機(jī)抽樣中是不會發(fā)生的”。,“小概率原理”,例如在2000粒中藥丸中只有一粒是蟲蛀過的,現(xiàn)從中隨機(jī)取一粒,則取得“蟲蛀過的藥丸”的概率是1/2000,這個(gè)概率是很小的,因此也可以將這一事件看作在一次抽樣中是不會發(fā)生的。若從中隨機(jī)抽取一粒,恰好是蟲蛀過的,這種情況發(fā)生了,我們自然可以認(rèn)為“假設(shè)”有問題,即蟲蛀率P不是1/2000,從而否定了假設(shè)。否定假設(shè)的依據(jù)就是小概率事件原理。由此我們得到一個(gè)推理方法如果在某假設(shè)(記為H0)成立的條件下,事件A是一個(gè)小概率事件,現(xiàn)在只進(jìn)行一次試驗(yàn),事件A就發(fā)生了,我們就認(rèn)為原來的假設(shè)(H0)是不成立的。,例如,根據(jù)大量調(diào)查,已知正常成年男性平均脈搏數(shù)為72次/分,現(xiàn)隨機(jī)抽查了20名肝陽上亢成年男性病人,其平均脈搏為84次/分,標(biāo)準(zhǔn)差為64次/分。問肝陽上亢男病人的平均脈搏數(shù)是否較正常人快以上兩個(gè)均數(shù)不等有兩種可能第一,由于抽樣誤差所致;第二,由于肝陽上亢的影響。,例如,已知正常成年男子脈搏平均為72次/分,現(xiàn)隨機(jī)檢查20名慢性胃炎所致脾虛男病人,其脈搏均數(shù)為75次/分,標(biāo)準(zhǔn)差為64次/分,問此類脾虛男病人的脈搏快于健康成年男子的脈搏抽樣誤差脾虛,假設(shè)檢驗(yàn)1、原因2、目的3、原理4、過程(步驟)5、結(jié)果,第一節(jié)假設(shè)檢驗(yàn)原理,某事發(fā)生了是由于碰巧還是由于必然的原因統(tǒng)計(jì)學(xué)家運(yùn)用顯著性檢驗(yàn)來處理這類問題。,1、假設(shè)檢驗(yàn)的原因,由于總體不同或因個(gè)體差異的存在,在研究中進(jìn)行隨機(jī)抽樣獲得的樣本均數(shù),X1、X2、X3、X4,不同。樣本均數(shù)不同有兩種(而且只有兩種)可能(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性(差別無統(tǒng)計(jì)學(xué)意義)(2)分別所代表的總體均數(shù)不同。差別有顯著性(差別有統(tǒng)計(jì)學(xué)意義),,,,,2、假設(shè)檢驗(yàn)的目的判斷是由于何種原因造成的不同,以做出決策。,,反證法當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實(shí)A,這時(shí)否定另一種可能B,則間接的肯定了A。概率論(小概率)如果一件事情發(fā)生的概率很小,那么在進(jìn)行一次試驗(yàn)時(shí),我們說這個(gè)事件是“不會發(fā)生的”。從一般的常識可知,這句話在大多數(shù)情況下是正確的,但是它一定有犯錯誤的時(shí)候,因?yàn)楦怕试傩∫彩怯锌赡馨l(fā)生的。,3、假設(shè)檢驗(yàn)的原理,4、假設(shè)檢驗(yàn)的步驟,▲建立假設(shè)(反證法),確定顯著性水平(?)▲計(jì)算統(tǒng)計(jì)量U,T,?2▲確定概率P值▲做出推論,【例51】,已知正常成年男子脈搏平均為72次/分,現(xiàn)隨機(jī)檢查20名慢性胃炎所致脾虛男病人,其脈搏均數(shù)為75次/分,標(biāo)準(zhǔn)差為64次/分,推斷此類脾虛男病人的脈搏是否不同于健康成年男子的脈搏。,(1)建立假設(shè),選定檢驗(yàn)水準(zhǔn)假設(shè)兩種一種是檢驗(yàn)假設(shè),假設(shè)差異完全由抽樣誤差造成,常稱無效假設(shè),用H0表示。另一種是和H0相對立的備擇假設(shè),用H1表示。假設(shè)檢驗(yàn)是針對H0進(jìn)行的。,確定雙側(cè)或單側(cè)檢驗(yàn),H0此類脾虛病對脈搏數(shù)無影響,H0Μ72次/分H1脾虛病人的脈搏數(shù)不同于正常人,H1Μ≠72次/分,選定檢驗(yàn)水準(zhǔn)Α005Α是在統(tǒng)計(jì)推斷時(shí),預(yù)先設(shè)定的一個(gè)小概率值,是當(dāng)H0為真時(shí),允許錯誤地拒絕H0的概率。,,雙側(cè)與單側(cè)檢驗(yàn)界值比較,,2選定適當(dāng)?shù)臋z驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量值,T檢驗(yàn)Z檢驗(yàn),設(shè)計(jì)類型資料的類型和分布統(tǒng)計(jì)推斷的目的N的大小如完全隨機(jī)設(shè)計(jì)實(shí)驗(yàn)中,已知樣本均數(shù)與總體均數(shù)比較,N又不大,可用T檢驗(yàn),計(jì)算統(tǒng)計(jì)量T值。,3計(jì)算P值,P值是在H0成立時(shí),取得大于或等于現(xiàn)有檢驗(yàn)統(tǒng)計(jì)量值的概率。,(3)計(jì)算概率值(P)將計(jì)算得到的Z值或T值與查表得到Z?或T?,Ν,比較,得到P值的大小。根據(jù)U分布和T分布我們知道,如果|Z|Z?或|T|T?,則P?。,當(dāng)P≤Α時(shí),統(tǒng)計(jì)學(xué)結(jié)論為按所取Α檢驗(yàn)水準(zhǔn)拒絕H0,接受H1,稱“差異有顯著性”(“差異有統(tǒng)計(jì)學(xué)意義”)。當(dāng)PΑ時(shí),沒有理由懷疑H0的真實(shí)性,統(tǒng)計(jì)學(xué)結(jié)論為按所取Α檢驗(yàn)水準(zhǔn)不拒絕H0,稱“差異無顯著性”(“差異無統(tǒng)計(jì)學(xué)意義”)。,4作出推斷結(jié)論,Α與P異同,相同Α與P都是用檢驗(yàn)統(tǒng)計(jì)量分布的尾部面積大小表示。不同Α是在統(tǒng)計(jì)推斷時(shí),預(yù)先設(shè)定的一個(gè)小概率值,是當(dāng)H0為真時(shí),允許錯誤地拒絕H0的概率,是檢驗(yàn)水準(zhǔn)。P值是由實(shí)際樣本決定的,是指從由H0所規(guī)定的總體中隨機(jī)抽樣,獲得大于及等于(或小于)現(xiàn)有樣本檢驗(yàn)統(tǒng)計(jì)量值的概率。,5、兩類錯誤(I型錯誤與Ⅱ型錯誤),統(tǒng)計(jì)推斷可能出現(xiàn)的4種結(jié)果,I型錯誤(?。?推斷正確(1-?。?推斷正確(1-Β),Ⅱ型錯誤(Β),(假陽性錯誤),(假陰性錯誤),(檢驗(yàn)效能、把握度),(可信度),無效假設(shè)(H0)備擇假設(shè)(H1),兩類錯誤Ⅰ型錯誤與Ⅱ型錯誤Ⅰ型錯誤H0原本是正確的拒絕H0棄真假陽性錯誤誤診用Α表示Ⅱ型錯誤H0原本是錯誤的不拒絕H0存?zhèn)渭訇幮藻e誤漏診用Β表示,,,,,,,,,兩均數(shù)的假設(shè)檢驗(yàn),樣本均數(shù)與總體均數(shù)的比較成對資料均數(shù)的T檢驗(yàn)成組資料兩樣本均數(shù)的比較方差不齊時(shí)兩小樣本均數(shù)的比較,第二節(jié)單樣本正態(tài)資料的假設(shè)檢驗(yàn),,,不,滿足,,不,滿足,,滿足,,滿足,,,,Σ,已知,,,,正態(tài)性,,,,非參數(shù),檢驗(yàn),,,,變量替換,,,,,結(jié)論,,,,,不,滿足,,,,大樣本,,,,U,檢驗(yàn),,,,T,檢驗(yàn),,滿足,,,,,,,,,Z,思路,一、正態(tài)總體均數(shù)的假設(shè)檢驗(yàn),方法,1、大樣本【例52】一般女性平均身高1601CM。某大學(xué)隨機(jī)抽取100名女大學(xué)生,測量其身高,身高的均數(shù)是16374CM,標(biāo)準(zhǔn)差是380CM。請問某大學(xué)18歲女大學(xué)生身高是否與一般女性不同。,▲目的比較樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)有無差別▲計(jì)算公式Z統(tǒng)計(jì)量,▲適用條件1已知一個(gè)總體均數(shù);2可得到一個(gè)樣本均數(shù);3可得到該樣本標(biāo)準(zhǔn)誤;4樣本量不小于100。,,,假設(shè)檢驗(yàn)▲建立假設(shè),確定顯著性水平(?)檢驗(yàn)假設(shè)某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)相同,H0ΜΜ0;備擇假設(shè)某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)不同,H1Μ≠Μ0?005,▲做出推論Z958196,PT00515,P00482。??=005N=5,=1414,S=00882,DF=N-1=4,查統(tǒng)計(jì)用表6得單側(cè)概率PT0059PΜ0Μ的上側(cè)95%置信區(qū)間為T005,DFS/如例43,H0Μ=Μ0(Μ072次/分);H1ΜΜ0。?。?05。-T005(DF)S/=75172964/=7252Μ的上側(cè)95%置信區(qū)間為Μ7252,現(xiàn)Μ0=72次/分不在此區(qū)間范圍內(nèi),故按?。?05水準(zhǔn)拒絕H0,接受H1,結(jié)論與前述T檢驗(yàn)結(jié)果一致。(2)若關(guān)心的是ΜΜ0Μ的下側(cè)95%置信區(qū)間為T005(DF)S/,二、置信區(qū)間比假設(shè)檢驗(yàn)有可提供更多信息之處,,三、置信區(qū)間不能完全取代假設(shè)檢驗(yàn),置信區(qū)間用作假設(shè)檢驗(yàn)只能在規(guī)定的Α水準(zhǔn)上揭示差異有無統(tǒng)計(jì)學(xué)意義。假設(shè)檢驗(yàn)可得到的P值,可以精確地說明結(jié)論的概率保證,可以估計(jì)假陰性率Β。,最好同時(shí)給出假設(shè)檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量值、P值和置信區(qū)間,
下載積分: 4 賞幣
上傳時(shí)間:2024-01-06
頁數(shù): 72
大?。?0.46(MB)
子文件數(shù):