-
簡介:衛(wèi)生統(tǒng)計(jì)學(xué)案例分析,201505,中藥治療再生障礙性貧血,治療前后血紅蛋白結(jié)果見下面數(shù)據(jù)。某醫(yī)生計(jì)算出治療前后的差值,均數(shù)為35,故認(rèn)為治療后血紅蛋白含量高于治療前?;颊呔幪?23456789治療前686555755070766572治療后12882801121251108580105(1)該資料屬于什么資料類型(2)該資料屬于何種設(shè)計(jì)方案(3)比較治療前后血紅蛋白是否有差別可采用什么統(tǒng)計(jì)方法用這些方法的條件是什么(4)該醫(yī)生的結(jié)論是否正確為什么(5)請比較治療前后血紅蛋白是否有差別,寫出分析步驟,并下結(jié)論。,案例一,,定量資料自身配對設(shè)計(jì)差值服從正態(tài)分布,配對T檢驗(yàn);不服從正態(tài)分布,配對設(shè)計(jì)秩和檢驗(yàn);應(yīng)用條件略錯誤,沒有進(jìn)行統(tǒng)計(jì)推斷,直接用樣本信息下結(jié)論。該資料首先檢驗(yàn)差值是否服從正態(tài)分布,然后選擇合適檢驗(yàn)方法進(jìn)行統(tǒng)計(jì)推斷本題差值服從正態(tài)分布,用配對T檢驗(yàn)吧,T478,P0001,治療前后血紅蛋白差別有統(tǒng)計(jì)學(xué)意義。,案例二,研究2種單味中藥對小鼠細(xì)胞免疫功能的影響,并設(shè)一個空白對照組,將30只小鼠隨機(jī)分為3組,每組10只,雌雄各半,用藥15天后,測定E玫瑰結(jié)形成率(),結(jié)果如下。研究者對該資料采用了兩樣本均數(shù)的T檢驗(yàn)進(jìn)行兩兩比較,得結(jié)論為除黨參與黃芪兩組差異沒有統(tǒng)計(jì)學(xué)意義(P>005),其余兩組間差異有統(tǒng)計(jì)學(xué)意義(P<005)。對照組1410121613141210139黨參組21241817221918232018黃芪組24202218172118221923(1)這是什么資料該資料屬于何種設(shè)計(jì)方案(2)擬比較三組小鼠細(xì)胞免疫功能是否有差異,可以采用哪些統(tǒng)計(jì)方法用該方法的條件是什么思想是什么請寫出三組小鼠細(xì)胞免疫功能比較的分析步驟,并下結(jié)論。(3)如果想知道黨參組和黃芪組小鼠細(xì)胞免疫功能是否有差異,可以采用哪些統(tǒng)計(jì)方法(4)該研究者的統(tǒng)計(jì)處理方法是否正確為什么,定量資料,完全隨機(jī)設(shè)計(jì)完全隨機(jī)設(shè)計(jì)方差分析,多個獨(dú)立樣本秩和檢驗(yàn)。應(yīng)用條件略。思想略。經(jīng)檢驗(yàn)服從正態(tài)分布,方差齊,F(xiàn)2549,P0000多個樣本均數(shù)的兩兩比較,LSD,SNK不正確,方法錯誤。三組均數(shù)比較用T檢驗(yàn)增大犯一類錯誤概率。,案例三,分別測得13名健康人和13名Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量G/L如下表。某研究者根據(jù)此資料先計(jì)算差值并進(jìn)行正態(tài)性檢驗(yàn),服從統(tǒng)計(jì)后應(yīng)用配對T檢驗(yàn)T5276,P0000,故認(rèn)為Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量高于健康人。表213名健康人和13名Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量G/L,(1)請計(jì)算健康人和Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量的均數(shù)和標(biāo)準(zhǔn)差(請注明步驟)。(2)欲比較兩組抗胰蛋白酶含量是否有差異,可以采用哪些統(tǒng)計(jì)方法用這些方法的條件是什么(3)該研究者的統(tǒng)計(jì)處理方法是否正確為什么(4)比較兩組抗胰蛋白酶含量是否有差異,請寫出分析步驟,并下結(jié)論。,健康人均數(shù)215,標(biāo)準(zhǔn)差106;Ⅲ度肺氣腫病人均數(shù)432,標(biāo)準(zhǔn)差111兩獨(dú)立樣本T檢驗(yàn)、兩獨(dú)立樣本秩和檢驗(yàn),應(yīng)用條件略該研究者結(jié)論錯誤,首先應(yīng)該做正態(tài)及方差齊性檢驗(yàn)。滿足正態(tài)方差齊,可用兩獨(dú)立樣本T檢驗(yàn)做統(tǒng)計(jì)推斷。服從正態(tài)、方差齊,用兩獨(dú)立樣本T檢驗(yàn)做統(tǒng)計(jì)推斷。T509,P0000,差異有統(tǒng)計(jì)學(xué)意義。,案例四,已知正常成年男子血紅蛋白均值為140G/L,今隨機(jī)調(diào)查某廠成年男子60人,測其血紅蛋白均值為125G/L,標(biāo)準(zhǔn)差15G/L。故認(rèn)為該廠成年男子血紅蛋白均值低于一般成年男子。(1)該結(jié)論是否正確為什么(2)有研究者根據(jù)該資料估計(jì)該地成年男子血紅蛋白均值為125G/L,該結(jié)論是否正確為什么(3)解決此類問題可采用哪些統(tǒng)計(jì)分析方法這些方法有什么區(qū)別和聯(lián)系(4)擬比較該廠成年男子血紅蛋白均值與一般成年男子是否有差異,請寫出分析步驟,并下結(jié)論。,不正確,案例五,某地隨機(jī)抽樣調(diào)查了部分健康成人的血紅蛋白含量(G/L),結(jié)果見表1表1某地健康成人的血紅蛋白含量(G/L),(1)有人認(rèn)為該地男女性血紅蛋白含量均低于上表的標(biāo)準(zhǔn)值(若測定方法相同)且男性血紅蛋白含量低于女性,你是否同意該結(jié)論(2)可采用什么方法比較男和女血紅蛋白含量是否有差異如果男和女血紅蛋白含量有差異,是否有實(shí)際意義(3)請制定該人群的參考值范圍制定參考值范圍需要注意什么總體均數(shù)的置信區(qū)間和參考值范圍有何區(qū)別,結(jié)論不完全正確,研究者想通過抽樣調(diào)查了解總體特征,但是沒有考慮抽樣誤差,直接用樣本均數(shù)作為總體的估計(jì)值,用單樣本T檢驗(yàn)或通過置信區(qū)間回答。假設(shè)檢驗(yàn)、兩組大樣本均數(shù)比較,用U檢驗(yàn),假設(shè)檢驗(yàn)只能說明有無統(tǒng)計(jì)學(xué)意義,不能說明實(shí)際意義。制定參考值范圍需要注意1、所謂正常人指的是排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。2、選擇有足夠大的人群作為調(diào)查對象樣本數(shù)理足夠大3、確定單側(cè)還是雙側(cè)正常值范圍;選擇適當(dāng)?shù)陌俜纸缦?,選擇正確的方法(百分位數(shù)或近似正態(tài)法,,,案例六,,案例七,,,,謝謝,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 17
大?。?0.44(MB)
子文件數(shù):
-
簡介:1,第十章多個樣本均數(shù)比較方差分析ANALYSISOFVARIANCE,學(xué)習(xí)目的和要求1、掌握方差分析的基本思想和應(yīng)用條件2、掌握完全隨機(jī)設(shè)計(jì)方差分析的計(jì)算過程。3、熟悉隨機(jī)區(qū)組設(shè)計(jì)方差分析的設(shè)計(jì)方法和總變異和自由度的組成情況,4、熟悉方差齊性檢驗(yàn)的作用。,2,,用途比較某實(shí)驗(yàn)處理因素不同水平樣本均數(shù)間差別有無統(tǒng)計(jì)學(xué)意義,從而說明該實(shí)驗(yàn)因素某水平是否有作用的方法。,種類根據(jù)實(shí)驗(yàn)因素的數(shù)量分為單因素方差分析多因素兩因素及以上方差分析,方差分析由RAFISHER英首創(chuàng),又稱F檢驗(yàn)縮寫ANOVA,3,第一節(jié)方差分析的基本思想和應(yīng)用條件,4,一、名詞解釋,處理因素和水平研究者對研究對象人為地施加某種干預(yù)措施,稱為處理因素FACTOR或?qū)嶒?yàn)因素;處理因素所處的不同狀態(tài)稱為水平LEVEL。處理因素的水平數(shù)≥2,即實(shí)驗(yàn)的組數(shù)。,5,三組戰(zhàn)士行軍后體溫增加數(shù)℃不飲水定量飲水不限量飲水191409181207161109171411151109161309131108141010161209,處理因素飲水方式水平數(shù)3,6,單因素實(shí)驗(yàn)實(shí)驗(yàn)中的處理因素只有一個,這個處理因素包括CC≥2個水平,分析不同水平實(shí)驗(yàn)結(jié)果的差別是否有統(tǒng)計(jì)學(xué)意義。,多因素實(shí)驗(yàn)實(shí)驗(yàn)中的處理因素≥2,各處理因素的水平≥2,分析各處理因素各水平的實(shí)驗(yàn)結(jié)果有無差別、有無交互作用。,7,,1、完全隨機(jī)設(shè)計(jì)的單因素方差分析用途用于完全隨機(jī)設(shè)計(jì)的多個樣本均數(shù)間的比較,其統(tǒng)計(jì)推斷是推斷各樣本所代表的各總體均數(shù)是否相等。2、隨機(jī)區(qū)組設(shè)計(jì)的兩因素方差分析用途用于隨機(jī)區(qū)組設(shè)計(jì)的多個樣本均數(shù)比較,其統(tǒng)計(jì)推斷是推斷各樣本所代表的各總體均數(shù)是否相等。,8,,組間變異,總變異,組內(nèi)變異,,,,二、方差分析的基本思想單因素重點(diǎn),9,,首先按照設(shè)計(jì)類型將全部觀察值的總變異按影響實(shí)驗(yàn)結(jié)果的諸因素分解為若干部分變異,每部分都與特定的因素(處理因素或隨機(jī)因素)相聯(lián)系,然后以某處理因素與隨機(jī)因素之比構(gòu)造檢驗(yàn)統(tǒng)計(jì)量F,通過比較F值與臨界值的大小做出對總體均數(shù)的推斷,10,完全隨機(jī)設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu),處理因素的分組水平合計(jì)12CX11X21XC1X12X22XC2X1N1X2N2XCNCNIN1N2NC,,,,,,11,,用II1,2,3,C)表示C個不同的處理分組(即水平組)的第I組,第I組的樣本含量為NI(各NI可以不相等)總樣本含量為N=N1+N2++NCXIJ表示第I組第J個值J1,2,3,NI)表示第I組的均值。表示總均值,12,三組戰(zhàn)士行軍后體溫增加數(shù)℃不飲水定量飲水不限量飲水191409181207161109171411151109161309131108141010161209,,,,,,,C=3,N1=N2=N3=8,13,組間變異SS組間(SSTR不同處理組樣本均數(shù)之間的差異用組間離均差平方和處理因素隨機(jī)誤差,,組內(nèi)變異SS組內(nèi)(SS誤差或SSE組內(nèi)離均差平方和隨機(jī)誤差,總變異SS總(SST總離均差平方和(所有觀察值與總均值之差的平方和),離均差平方和SS,14,,重點(diǎn),15,如果每個處理組的觀察值XIJ分別服從相同方差Σ2的正態(tài)分布N(Μ1,Σ2),N(Μ2,Σ2),┄,N(ΜC,Σ2),那么MEANSQUARE,MS(均方),16,,(非常重要,不要記反),17,,如果處理因素?zé)o作用組間變異=組內(nèi)變異F1如果處理因素有作用組間變異>組內(nèi)變異F>1,18,19,三、應(yīng)用條件(重點(diǎn)),1各樣本是相互獨(dú)立的隨機(jī)樣本;2各樣本數(shù)據(jù)均服從正態(tài)分布;3相互比較的各樣本的總體方差相等,即方差齊性HOMOGENEITYOFVARIANCE。,20,,,,,,,,21,第二節(jié)完全隨機(jī)設(shè)計(jì)資料的方差分析,22,一、完全隨機(jī)設(shè)計(jì)COMPLETELYRANDOMDESIGN,,各組例數(shù)可以相等或不等,,甲處理(N1),乙處理(N2),丙處理(N3),?,試驗(yàn)對象(N),隨機(jī)化分組,23,完全隨機(jī)設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu),處理因素的分組水平合計(jì)12CX11X21XC1X12X22XC2X1N1X2N2XCNCNIN1N2NC,,,,,,24,二、變異分解,25,完全隨機(jī)設(shè)計(jì)資料方差分析公式,變異來源SS?MSF值,校正數(shù),,,,N-1,總變異,組間,C-1,組內(nèi),N-C,26,表1033組大鼠腎組織中NO水平/ΜMOLL1,正常對照組腎缺血腎缺血60分鐘合計(jì)60分鐘組再灌注組437983227528404285754645119490???309602887621972338833866714317NI1212123641067839434331170011167211436935866613292755339883943821836501552223,,,,,27,,,三、分析步驟,1、建立假設(shè)H0?1?2?3(各組大鼠NO含量總體均值相等)H1?I不等或不全相等?0052、計(jì)算統(tǒng)計(jì)量,28,,29,,30,表104方差分析表,變異來源SS?MSFF001總18608357835組間469259502234629755564532組內(nèi)139157628334216898,,,,(3)求P值作出結(jié)論附表3,結(jié)論按?005水平,拒絕H0,接受H1,認(rèn)為3組NO水平不同。但只能說明3組NO水平有差異,不能認(rèn)為任何兩組之間有差別,31,注意當(dāng)拒絕H0,接受H1,不能說明各組總體均數(shù)兩兩間都有差別,要進(jìn)行多個均數(shù)間多重比較。,32,第三節(jié)隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析,33,隨機(jī)區(qū)組設(shè)計(jì),將全部受試對象按某種或某些特性分為若干個區(qū)組,使每個區(qū)組內(nèi)的觀察對象與研究對象的水平盡可能相近,減少了個體間差異對研究結(jié)果的影響,比成組設(shè)計(jì)更容易檢驗(yàn)出處理因素(因素A)間的差別,提高了研究效率。(復(fù)習(xí)配對資料)是配對資料的擴(kuò)充。,34,隨機(jī)選擇9窩中年大鼠,每窩中取兩只雌性大鼠隨機(jī)地分入甲、乙兩組,甲組大鼠不接受任何處理即空白對照,乙組中的每只大鼠接受3MG/KG的內(nèi)毒素。分別測得兩組大鼠的肌酐MG/L測定結(jié)果如下。,窩別編號123456789甲對照組623758273961677838乙處理組753863435373567972,,,,配對設(shè)計(jì)計(jì)量資料,35,按性別相同、年齡相近、病情相近把33例某病患者配成11個區(qū)組,每區(qū)組3個患者,分別給予A藥、B藥和C藥治療。治療后患者血漿中的IGA含量見表。問經(jīng)三種不同藥物治療后該病患者血漿中IGA含量有無差別,隨機(jī)區(qū)組設(shè)計(jì)計(jì)量資料,36,又稱配伍組設(shè)計(jì)是配對設(shè)計(jì)的擴(kuò)大,因素A為處理因素,因素B為區(qū)組因素,是影響實(shí)驗(yàn)結(jié)果的主要非處理因素先按影響實(shí)驗(yàn)結(jié)果的非處理因素(如性別、體重、年齡、職業(yè)、病情、病程等將受試對象配成區(qū)組,再分別將區(qū)組內(nèi)的受試對象隨機(jī)分配到各處理組或?qū)φ战M。,一、隨機(jī)區(qū)組設(shè)計(jì)RANDOMIZEDBLOCKDESIGN,將因素B產(chǎn)生的變異從組內(nèi)變異中分離出來,減少了組內(nèi)變異,達(dá)到分析因素A的作用時排除因素B的干擾作用提高了統(tǒng)計(jì)檢驗(yàn)效率。,37,例比較不同產(chǎn)地石棉毒性的大小,處理因素不同產(chǎn)地的石棉(甲、乙、丙)實(shí)驗(yàn)對象及例數(shù)雌性WISTAR大鼠36只實(shí)驗(yàn)效應(yīng)肺泡巨噬細(xì)胞存活率()控制因素WISTAR大鼠月齡、體重實(shí)驗(yàn)設(shè)計(jì)隨機(jī)區(qū)組設(shè)計(jì)方法將月齡體重相近的3只大鼠配為一個區(qū)組,共12個區(qū)組;在區(qū)組內(nèi)隨機(jī)分配處理因素。,38,表106不同產(chǎn)地石棉處理后大鼠的肺泡巨噬細(xì)胞存活率()石棉產(chǎn)地(因素A)C,,,,,,合計(jì),?,,39,二、變異分解,40,重點(diǎn)掌握,41,隨機(jī)區(qū)組設(shè)計(jì)資料方差分析公式,變異來源SS?MSF值,,,,N-1,總變異,處理,C-1,誤差,R1C1,區(qū)組,R-1,42,,校正數(shù)C∑X2/N。C為因素A的水平數(shù)R為因素B的水平數(shù)(因素A每個水平觀察例數(shù))隨機(jī)區(qū)組設(shè)計(jì)中因素A每個水平觀察例數(shù)等于因素B的水平數(shù)R;因素B每個水平觀察例數(shù)等于因素A的水平數(shù)C,43,表106不同產(chǎn)地石棉處理后大鼠的肺泡巨噬細(xì)胞存活率()R石棉產(chǎn)地(因素A)C,,,,,,合計(jì),?,,44,,,三、分析步驟,H0?1?2?3H1?I不等或不全相等?005本例C3,R12N36,45,,46,,47,,48,方差分析表,變異來源SS?MSFP總377737535處理間24413862122069331588<001區(qū)組間48581211441651143005誤差8501772238644,,,,49,,對于不同產(chǎn)地石棉間,按查附表12方差分析F界值表,1143則P005,按?005水平,不拒絕H0,尚不能認(rèn)為不同區(qū)組大鼠的肺泡巨噬細(xì)胞存活率不同,50,第六節(jié)多個樣本均數(shù)間的多重比較,51,當(dāng)方差分析結(jié)果的處理因素間有統(tǒng)計(jì)學(xué)意義,只說明各總體均數(shù)不全相等;若了解各總體均數(shù)兩兩之間差別情況,需作多個樣本均數(shù)間多重比較。目的方法1一對或幾對在專業(yè)上有LSDT檢驗(yàn)特殊意義樣本均數(shù)比較2各實(shí)驗(yàn)組與一個對照組DUNNETTT檢驗(yàn)樣本均數(shù)多重比較3多個樣本均數(shù)兩兩間的SNKQ檢驗(yàn)全面比較,,,,52,多個樣本均數(shù)間比較不能采用T檢驗(yàn),否則將增大犯1類錯誤概率。,對某一資料中3組數(shù)據(jù)用T檢驗(yàn)作兩兩比較比較組別檢驗(yàn)水準(zhǔn)不犯1型錯誤概率A組與B組?005(1?005)A組與C組?005(1?005)B組與C組?005(1?005)3次均不犯1型錯誤概率為1?0053總的檢驗(yàn)水準(zhǔn)為Α1?1?0053014,,,,53,一、SNKQ檢驗(yàn),,SNKSTUDENTNEWMANKEULS檢驗(yàn),亦稱Q檢驗(yàn)。,和分別為兩個對比組的樣本均數(shù),MS誤差為算得的誤差均方(組內(nèi)均方),NA,NB分別為兩對比組的樣本例數(shù)。V誤差為誤差均方的自由度,54,表106不同產(chǎn)地石棉處理后大鼠的肺泡巨噬細(xì)胞存活率()石棉產(chǎn)地(因素A)C,,,,,,合計(jì),?,,55,例103三組大鼠的的肺泡巨噬細(xì)胞存活率均值兩兩之間有無差別,,,不同產(chǎn)地甲地乙地丙地肺泡巨噬細(xì)胞存活率均值485557136865從大到小序次321應(yīng)用Q檢驗(yàn)進(jìn)行兩兩比較,計(jì)算如下,列在表108中,,56,,57,三種藥物抑瘤效果比較,比較組AQQ005,22Q001,22P丙-甲201031120358464SS組內(nèi)DMS組間MS組內(nèi)EΝ組間Ν組內(nèi),71,方差分析與T檢驗(yàn)的聯(lián)系,一、方差分析與T檢驗(yàn)的聯(lián)系完全隨機(jī)設(shè)計(jì)的兩個樣本均數(shù)比較的T檢驗(yàn),可以用完全水機(jī)設(shè)計(jì)的方差分析代替。兩者的計(jì)算結(jié)果有如下關(guān)系,72,,二、方差分析與T檢驗(yàn)的區(qū)別完全隨機(jī)設(shè)計(jì)的兩樣本均數(shù)比較的T檢驗(yàn),可以用完全隨機(jī)設(shè)計(jì)的方差分析代替;反之,則不成立,即多個樣本均數(shù)比較的方法,應(yīng)該用方差分析,而不能用兩個樣本均數(shù)比較的T檢驗(yàn)代替,否則增大了犯Ⅰ型錯誤的概率,即可能會錯誤得出兩個總體均數(shù)有差別的結(jié)論。,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 72
大小: 0.55(MB)
子文件數(shù):
-
簡介:醫(yī)學(xué)統(tǒng)計(jì)學(xué)(MEDICALSTATISTICS),“不明于計(jì)數(shù),而欲舉大事,猶無舟楫而欲經(jīng)于水險(xiǎn)也?!?管仲,“統(tǒng)計(jì)學(xué)是追求科學(xué)的人從荊棘叢生的困難阻擋中,開辟出道路的最好的工具?!?FRANCISGALTON,“統(tǒng)計(jì)根據(jù)科學(xué)方法,以繁賾事實(shí),列記之,整理之;從大量,得共相;由已知,測未知;使樊然者,呈整齊之相;棼如者,有跡可循;復(fù)雜變量,燭照無遺;紛紜事態(tài),一目了然,此其功也?!?陳善林,第一章緒論CHARPTER1INTRODUCTION,“數(shù)字雖然枯燥,但卻能說明問題”統(tǒng)計(jì)學(xué)是一門與數(shù)據(jù)有關(guān)或研究數(shù)據(jù)的學(xué)科。,統(tǒng)計(jì)學(xué)是一門收集、分析、解釋與呈現(xiàn)數(shù)據(jù)資料的科學(xué)。,STATISTICS“ASCIENCEDEALINGWITHTHECOLLECTION,ANALYSIS,INTERPRETATIONANDPRESENTATIONOFMASSESOFNUMERICALDATA”WEBSTER國際大辭典,一、統(tǒng)計(jì)學(xué)與醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法,統(tǒng)計(jì)學(xué)(STATISTICS),運(yùn)用概率論、數(shù)理統(tǒng)計(jì)的原理和方法,研究數(shù)據(jù)的收集、整理、分析和推斷的科學(xué)。,醫(yī)學(xué)統(tǒng)計(jì)學(xué)(MEDICALSTATISTICS),用統(tǒng)計(jì)學(xué)原理和方法研究生物醫(yī)學(xué)問題的一門學(xué)科。,生物統(tǒng)計(jì)學(xué)(BIOSTATISTICS),應(yīng)用于整個生物學(xué)范疇,側(cè)重于人的生物方面。,衛(wèi)生統(tǒng)計(jì)學(xué)(HEALTHSTATISTICS),用于醫(yī)學(xué)和衛(wèi)生學(xué)領(lǐng)域,側(cè)重于人的社會方面,如健康狀況統(tǒng)計(jì)和衛(wèi)生服務(wù)統(tǒng)計(jì)。,,1計(jì)數(shù)資料2計(jì)量資料3等級資料,二、醫(yī)學(xué)統(tǒng)計(jì)學(xué)中常用的數(shù)據(jù)類型,計(jì)數(shù)資料COUNTDATA,變量值表現(xiàn)為按某屬性劃分的定性類別,清點(diǎn)各類別個數(shù)后得到的資料。,數(shù)據(jù)表現(xiàn)兩分類陽性或陰性;存活或死亡;有效或無效;男性或女性多分類如血型O,A,B,AB計(jì)數(shù)資料(血型)100527832,計(jì)量資料MEASUREMENTDATA,1連續(xù)變量身高值CM165,170158,體重值KG52,55,61,2比率變量腦電圖波形變化率29,37,,用儀器、工具或其他定量方法準(zhǔn)確獲得的定量結(jié)果,一般帶有計(jì)量單位。,等級資料ORDINALDATA,例病情分級X1Ⅰ,Ⅱ,Ⅲ療效X2痊愈、顯效、有效、無效病人滿意度X3好、中、差人數(shù)50255,變量值按變化程度大小劃分分類,清點(diǎn)各分類的個數(shù)后得到的資料。,,MEASUREMENTDATA計(jì)量資料,,COUNTDATA計(jì)數(shù)資料,,ORDINALDATA等級資料,,實(shí)例數(shù)據(jù)1,實(shí)例數(shù)據(jù)2,100例高血壓患者治療后臨床記錄,患者年齡性別治療組舒張壓體溫療效編號X1X2X3X4X5X6137男A1127375顯效245女B1253370有效343男A1093365有效459女B1467378無效10054男B1680376無效,,,,實(shí)例數(shù)據(jù)3,三類數(shù)據(jù)類型間的轉(zhuǎn)換,例一組20?40歲成年人的血壓,以12KPA為界分為正常與異常兩組,統(tǒng)計(jì)每組例數(shù),8低血壓8?正常血壓12?輕度高血壓15?中度高血壓17?重度高血壓,簡稱變量VARIABLE,統(tǒng)計(jì)上習(xí)慣用大寫拉丁字母表示,如X、Y、Z、。變量值習(xí)慣用小寫拉丁字母表示,如性別X1=1男、X2=1男、X3=0女、。,三、統(tǒng)計(jì)學(xué)基本概念,(一)隨機(jī)變量RANDOMVARIABLE,隨機(jī)變量的分類,離散型變量DISCRETEVARIABLE,在一定區(qū)間變量取值為有限個,相當(dāng)于計(jì)數(shù)資料連續(xù)性變量CONTINUOUSVARIABLE,在一定區(qū)間變量取值為無限個,相當(dāng)于計(jì)量資料有序變量ORDINALVARIABLE,相當(dāng)于等級資料,(二)同質(zhì)與變異HOMOGENEITYANDVARIATION,同質(zhì)指事物的性質(zhì)、影響條件或背景相同或非常相近。變異指同質(zhì)的個體之間的差異。,同質(zhì)與變異的例子,例1調(diào)查2004年上海市7歲男童的身高和體重同質(zhì)2004年、上海市、7歲男童變異身高和體重各不相同例2研究某降壓藥的療效同質(zhì)高血壓患者、用某藥治療變異療效各不相同,120名正常成年男子紅細(xì)胞計(jì)數(shù)值1012/L,(三)總體與樣本POPULATIONANDSAMPLE,總體根據(jù)研究目的確定的同質(zhì)研究對象的全體集合。分有限總體與無限總體。,有限總體總體中的所有研究對象事先可確定而且有限時,為一個確定的總體。,無限總體總體中的所有研究對象事先無法全部獲得而且無限時,為一個假設(shè)的總體。,樣本從總體中隨機(jī)抽取有代表性的部分觀察單位,(三)總體與樣本POPULATIONANDSAMPLE,隨機(jī)抽樣RANDOMSAMPLING為了保證樣本的可靠性和代表性,需要采用隨機(jī)的抽樣方法(在總體中每個個體具有相同的機(jī)會被抽到)。,抽樣研究目的樣本觀察值結(jié)論推論總體的情況,,從總體中隨機(jī)抽取樣本,根據(jù)樣本信息來推斷總體特征的方法,即抽樣研究。,抽樣研究SAMPLINGRESEARCH,參數(shù)總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為Μ、Σ。固定的常數(shù)。,推斷,統(tǒng)計(jì)量樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為。參數(shù)附近波動的隨機(jī)變量。,(四)參數(shù)與統(tǒng)計(jì)量PARAMETERANDSTATISTIC,(五)誤差,,誤差ERROR指實(shí)測值與真值之差、樣本指標(biāo)與總體指標(biāo)之差。,誤差的類型,1隨機(jī)誤差2非隨機(jī)誤差,,反映數(shù)據(jù)的質(zhì)量,隨機(jī)誤差,非隨機(jī)誤差,,,過失誤差如記錄、操作等人為因素。,系統(tǒng)誤差病例選擇、儀器、方法的不一致,原因,誤差(ERROR),多種尚無法控制的因素所引起的數(shù)據(jù)變異,醫(yī)學(xué)中主要是個體差異和測量誤差,,可避免否,不能,可控制而縮小或消除,由于樣本的隨機(jī)性引起的統(tǒng)計(jì)量與參數(shù)的差別,或同一總體的相同統(tǒng)計(jì)量之間的差別。,抽樣誤差SAMPLINGERROR,確定性現(xiàn)象在一定條件下,一定會發(fā)生或一定不會發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。,隨機(jī)現(xiàn)象在同樣條件下可能會出現(xiàn)兩種或多種結(jié)果,究竟會發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨機(jī)事件。隨機(jī)事件的特征①隨機(jī)性;②規(guī)律性每次發(fā)生的可能性的大小是確定的。,概率隨機(jī)事件發(fā)生的可能性大小,用大寫的P表示;取值0,1。,(六)頻率與概率FREQUENCYANDPROBABILITY,必然事件P1不可能事件P0隨機(jī)事件0P1P≤005(5%)稱為小概率事件習(xí)慣,統(tǒng)計(jì)學(xué)上認(rèn)為不大可能發(fā)生。,,小概率事件,頻率FREQUENCY樣本的實(shí)際發(fā)生率稱為頻率。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行N次試驗(yàn),事件A出現(xiàn)F次,則事件A出現(xiàn)的頻率為F/N。,用途醫(yī)學(xué)中常用頻率作為某事件概率的估計(jì)值。統(tǒng)計(jì)推斷結(jié)論是基于一定可信程度下的概率推斷。,頻率與概率間的關(guān)系樣本頻率總是圍繞概率上下波動樣本含量N越大,波動幅度越小,頻率越接近概率。,根據(jù)研究目的,1研究設(shè)計(jì),2收集資料,3整理資料,4分析資料,研究對象、指標(biāo)、例數(shù)、如何準(zhǔn)確得到數(shù)據(jù)。,日常工作記錄、病歷。專門的調(diào)查和實(shí)驗(yàn)。,使資料系統(tǒng)化,便于進(jìn)一步統(tǒng)計(jì)分析,用統(tǒng)計(jì)方法分析資料,闡述規(guī)律性,得出結(jié)論。,,,,,四、統(tǒng)計(jì)工作的基本步驟,五、統(tǒng)計(jì)在醫(yī)學(xué)中的應(yīng)用,(一)變異的描述,數(shù)據(jù)的變異特征1數(shù)據(jù)的分布范圍2數(shù)據(jù)的分布規(guī)律,102名7歲男童坐高分布,(二)觀察對比,FARR發(fā)現(xiàn)地勢與霍亂的關(guān)系,當(dāng)18481849年倫敦地區(qū)霍亂流行時,統(tǒng)計(jì)學(xué)家FARR對觀察結(jié)果進(jìn)行數(shù)據(jù)分析,發(fā)現(xiàn)居民居住的地勢越高,霍亂的死亡率越低“瘴氣”學(xué)說混濁空氣致病。,(二)觀察對比,SNOW發(fā)現(xiàn)自來水污染與霍亂死亡人數(shù)的關(guān)系,,(二)觀察對比,DOLL與HILL發(fā)現(xiàn)的吸煙與肺癌的關(guān)系,1964年DOLL和HILL將接受調(diào)查的4萬名英國注冊醫(yī)生分為吸煙和不吸煙兩組,通過以后的腫瘤統(tǒng)計(jì)發(fā)現(xiàn),吸煙組和不吸煙組肺癌的年平均發(fā)病率分別為166和007,相對危險(xiǎn)度RR166/007237,強(qiáng)烈提示吸煙的致癌作用,為吸煙致癌更深入的研究提供了形成研究假說的基礎(chǔ)。,兩組人群發(fā)病率比較,(三)實(shí)驗(yàn)性研究,英國海軍軍醫(yī)LIND治療牙齦潰爛的研究,1747年5月20日,LIND醫(yī)生將12名病情相似的患者帶到一艘船上?;颊叩闹饕Y狀是牙齦潰爛,皮膚有出血點(diǎn),雙膝無力。LIND將12名患者分為6組,分別給予A、B、C、D、E、F組干預(yù)。6月16日船返回英國時,所有患者的病情都有好轉(zhuǎn),其中E組恢復(fù)的最快、最好,其中一人到第6天就可以工作了。B組也有一人比登船時健康。,(三)實(shí)驗(yàn)性研究,法國醫(yī)生LOUIS對放血療法治療肺炎的研究,1835年,LOUIS對當(dāng)時流行的“放血”療法治療肺炎的效果進(jìn)行了比較,發(fā)現(xiàn)“放血”的療效不如預(yù)期的那么好,而且早期“放血”和晚期“放血”組比較,患者的診斷、病情、病程、年齡等方面的差異很大,比較平均治愈時間意義不大。因?yàn)橥砥凇胺叛苯M的平均治愈時間長,但該組患者病情重、病程長、年齡大。,(三)實(shí)驗(yàn)性研究,英國評價(jià)鏈霉素治療肺結(jié)核療效的隨機(jī)對照試驗(yàn),1948年,英國首次采用隨機(jī)對照試驗(yàn)評價(jià)鏈霉素治療肺結(jié)核療效。研究對象是1530歲肺雙側(cè)進(jìn)行性肺結(jié)核患者,共抽取了107例患者。試驗(yàn)時將患者隨機(jī)分為兩組,分到試驗(yàn)組的55例患者用鏈霉素治療,分到對照組的52例患者用常規(guī)方法。治療6個月后,試驗(yàn)組、對照組的生存率分別為93、73。,六、醫(yī)學(xué)論文中的統(tǒng)計(jì),錯誤統(tǒng)計(jì)方法產(chǎn)生的嚴(yán)重后果,胃冰凍療法治療胃潰瘍,“非常痛心地看到,因?yàn)閿?shù)據(jù)分析的缺陷和錯誤,那么多好的生物研究工作面臨著被葬送的危險(xiǎn)”。,--YATES和HEALY,統(tǒng)計(jì)方法的應(yīng)用情況,國外6080年代調(diào)查顯示,不同醫(yī)學(xué)雜志發(fā)表論文有統(tǒng)計(jì)錯誤的最高達(dá)72,最低也有20。,1966年,據(jù)對美國醫(yī)師協(xié)會雜志(JAMA)等醫(yī)學(xué)雜志的來稿的統(tǒng)計(jì)顯示,149篇投稿論文中,僅有28可以接受,67有統(tǒng)計(jì)缺陷但尚可以糾正,5不可救藥。,“調(diào)查結(jié)果反映了醫(yī)學(xué)論文作者統(tǒng)計(jì)知識和統(tǒng)計(jì)水平的低下,也再次強(qiáng)調(diào)了生物統(tǒng)計(jì)學(xué)者不是令人生畏的檢查官。恰恰相反,生物統(tǒng)計(jì)學(xué)者是我們的可貴盟友。生物統(tǒng)計(jì)學(xué)不是遠(yuǎn)離我們的數(shù)學(xué),而是現(xiàn)代醫(yī)學(xué)的一門基本學(xué)科,就像大廈中的一個支柱”。,--美國醫(yī)師協(xié)會雜志編輯,統(tǒng)計(jì)數(shù)據(jù)造假問題,1976年NEWSCIENCE雜志關(guān)于科研舞弊行為的調(diào)查,74的調(diào)查表反映有不正當(dāng)修改數(shù)據(jù)的情況。其中,17拼湊實(shí)驗(yàn)結(jié)果,7憑空捏造數(shù)據(jù),2故意曲解結(jié)果。,舍恩SCHON事件貝爾實(shí)驗(yàn)室兩種超重元素發(fā)現(xiàn)造假事件勞倫斯伯克利實(shí)驗(yàn)室,統(tǒng)計(jì)學(xué)的未來,社會需要生物統(tǒng)計(jì)學(xué)“統(tǒng)計(jì)學(xué)的年輕人有足夠的就業(yè)機(jī)會,學(xué)術(shù)界、工業(yè)部門、政府機(jī)構(gòu)”?!霸诿绹?,很高比例的統(tǒng)計(jì)研究生出生于外國,畢業(yè)后留在美國”。NATIONALSCIENCEFOUNDATION1998REPORT9895,統(tǒng)計(jì)學(xué)的未來,“對生物統(tǒng)計(jì)學(xué)的需求從來沒有象今天這樣大,特別是美國。美國NATIONALRESEARCHCOUNCIL研究結(jié)論在所有的衛(wèi)生科研行業(yè),最最缺乏生物統(tǒng)計(jì)學(xué)和流行病學(xué)人才”。(ZELEN,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 48
大小: 0.56(MB)
子文件數(shù):
-
簡介:單因素方差分析的SPSS操作,2,,SPSS單因素方差分析過程,3,,1完全隨機(jī)設(shè)計(jì)資料的方差分析ONEWAYANOVA,,例某高原研究組將籍貫相同、年齡相同、身高體重接近的30名新戰(zhàn)士隨機(jī)分為三組,甲組為對照組,按常規(guī)訓(xùn)練,乙組為鍛煉組,每天除常規(guī)訓(xùn)練外,接受中速長跑與健身操鍛煉,丙組為藥物組,除常規(guī)訓(xùn)練外,服用抗疲勞藥物,一月后測定第一秒用力肺活量L,結(jié)果見表。試比較三組第一秒用力肺活量有無差別。,4,5,N行2列(指標(biāo)變量、分組變量),數(shù)據(jù)格式,6,ANALYZE→COMPAREMEANS→ONEWAYANOVA,檢驗(yàn)步驟,,7,ONEWAYANOVA對話框,200701,8,,POSTHOCMULTIPLECOMPARISONS對話框,,9,OPTION對話框,,10,點(diǎn)擊“OK”,運(yùn)行結(jié)果,,200701,11,,結(jié)果輸出,,12,基本統(tǒng)計(jì)描述,,13,方差齊性檢驗(yàn),,14,方差分析表,,15,多重比較(LSD法),,16,多重比較(SNK法),,,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 16
大?。?0.74(MB)
子文件數(shù):
-
簡介:第十章統(tǒng)計(jì)表與統(tǒng)計(jì)圖STATISTICALTABLEB縱軸為對數(shù)尺度。,4.直方圖HISTOGRAM,以直方面積描述各組頻數(shù)的多少,面積的總和相當(dāng)于各組頻數(shù)之和,適合表示數(shù)值變量的頻數(shù)分布。直方圖的橫軸尺度是數(shù)值變量值,縱軸是頻數(shù)。注意如各組的組距不等時,要折合成等距后再繪圖,即將頻數(shù)除以組距得到單位組距的頻數(shù)作為直方的高度,組距為直方的寬度。另一種表示數(shù)值變量資料頻數(shù)分布的方式是將各組段觀察頻數(shù)除以總觀察頻數(shù)得到各組段的頻率,以各組段頻率除以組距得到的頻率密度作為直方圖高度,繪制的直方圖稱為頻率直方圖,它以各直方面積表示各組頻率,其面積的總和為1。,例1091997年某地共報(bào)告乙型病毒性腦炎104例,其年齡分布如表106。,,圖1061997年某地乙型病毒性腦膜炎病例的年齡分布,箱式圖BOXPLOT,使用5個統(tǒng)計(jì)量反映原始數(shù)據(jù)的分布特征,即數(shù)據(jù)分布中心位置、分布、偏度、變異范圍和異常值。箱式圖的箱子兩端分別是上四分位數(shù)和下四分位數(shù),中間橫線是中位數(shù),兩端連線分別是除異常值外的最小值和最大值。另外標(biāo)記可能的異常值。,顯然箱子越長,數(shù)據(jù)變異程度越大。中間橫線在箱子中點(diǎn)表明分布對稱,否則不對稱。,例1011某地調(diào)查不同類型化妝品廠車間內(nèi)粉塵數(shù),結(jié)果繪制成圖108。圖中顯示粉塵數(shù)的分布呈偏態(tài)分布,凈化廠粉塵數(shù)較少,非凈化廠粉塵數(shù)較多。,,圖108某地不同類型化妝品廠車間粉塵數(shù)分布箱式圖,謝謝大家,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 61
大?。?0.52(MB)
子文件數(shù):
-
簡介:1,【例71】某研究人員為研究不同地區(qū)的人群血型分類構(gòu)成是否一樣,收集了亞洲,歐洲和北美洲人的A,B,O,AB的血型資料。,2,第七章列聯(lián)表資料分析,,列聯(lián)表由兩個或兩個以上的變量進(jìn)行交叉分類的頻數(shù)分布表。,3,列聯(lián)表(行列表)資料模式,橫向變量R類,縱向變量C類,簡稱R?C表,4,教學(xué)目的與要求,掌握Χ2檢驗(yàn)的基本思想和用途四格表獨(dú)立性檢驗(yàn)配對四格表獨(dú)立性檢驗(yàn)了解FISHER精確概率法的計(jì)算單變量擬合度檢驗(yàn)頻數(shù)分布的擬合度檢驗(yàn),5,教學(xué)內(nèi)容提要,重點(diǎn)講解Χ2檢驗(yàn)的基本思想四格表獨(dú)立性檢驗(yàn)配對四格表獨(dú)立性檢驗(yàn)介紹FISHER精確概率法的計(jì)算擬合度檢驗(yàn),6,第一節(jié)列聯(lián)表?2檢驗(yàn),?2檢驗(yàn)及原理四格表資料的?2檢驗(yàn)雙向無序行?列表的?2檢驗(yàn)配對計(jì)數(shù)資料的?2檢驗(yàn)四格表確切概率法,7,雙向無序列聯(lián)表資料單向有序列聯(lián)表資料雙向有序且屬性相同列聯(lián)表資料雙向有序且屬性不同列聯(lián)表資料,一、列聯(lián)表(行列表)資料類型,8,三組消化性潰瘍住院病人四種證型的構(gòu)成,,1雙向無序列聯(lián)表資料,9,2單向有序列聯(lián)表資料,10,,3雙向有序且屬性不同列聯(lián)表資料,11,4雙向有序且屬性相同列聯(lián)表資料,12,四格表資料,13,二、四格表資料的?2檢驗(yàn),?2檢驗(yàn)是一種檢驗(yàn)實(shí)際頻數(shù)(ACTUALFREQUECY)與理論頻數(shù)(THEORETICALFREQUECY)之間偏離度的方法。偏離度用?2值(統(tǒng)計(jì)量)表示。,?2?(AT)2/T,1?2檢驗(yàn)的基本思想,14,2四格表資料的?2檢驗(yàn),比較兩個樣本率、兩種治療方法之間的差異有無顯著性。這類資料由4個基本數(shù)據(jù)構(gòu)成兩種治療方法的有效例數(shù)和無效例數(shù),統(tǒng)計(jì)學(xué)稱這類資料為四格表資料。,15,2四格表資料的?2檢驗(yàn),四格表資料的模式,16,【例72】為了解鉛中毒病人是否有尿棕色素增加現(xiàn)象,分別對病人組和對照組的尿液作尿棕色素定性檢查,結(jié)果如下,問鉛中毒病人和對照人群的尿棕色素陽性率有無差別兩組人群尿棕色素陽性率比較,①建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)H0總體陽性率Π1Π2H1Π1≠Π2Α005②計(jì)算檢驗(yàn)統(tǒng)計(jì)量,其中為AI實(shí)際頻數(shù),TI為理論頻數(shù),NR是行合計(jì),NC是列合計(jì),N是四格之和。,【例72】假設(shè)檢驗(yàn)步驟,理論頻數(shù)是在H0成立的條件下每個格子理論上的數(shù)據(jù)。(Π1Π2兩樣本合計(jì)率)若H0成立,則合計(jì)的陽性率為38/735205則鉛中毒病人呈陽性的理論上應(yīng)有T113638/731874人,?2值的大小決定于(1)AT的差值;(2)格子數(shù)(嚴(yán)格地說是DF)的多少。,T121726T211926T2217742312③確定P值ΝR1C11,查?2界值表(附表6)得P40,T值?24125?確定P值?作推論,【例74】某礦石粉廠當(dāng)生產(chǎn)一種礦石粉石時,在數(shù)天內(nèi)即有部分工人患職業(yè)性皮膚炎,在生產(chǎn)季節(jié)開始,隨機(jī)抽取15名車間工人穿上新防護(hù)服,其余仍穿原用的防護(hù)服,生產(chǎn)進(jìn)行一個月后,檢查兩組工人的皮膚炎患病率,結(jié)果如下,穿新舊兩種防護(hù)服工人的皮膚炎患病率比較,,問兩組工人的皮膚炎患病率有無差別,①H0Π1Π2;H1Π1≠Π2。Α005②計(jì)算最小的理論頻數(shù)T111511/43384,140,所以宜用?2值的校正公式294③查?2界值表,得005<P<010④按Α005水平不拒絕H0,尚不能認(rèn)為穿不同防護(hù)服的皮膚炎患病率有差別。若不校正,?2433P005,【例75】研究復(fù)方哌唑嗪對高血壓病治療效果的臨床試驗(yàn)并與復(fù)方降壓片和安慰劑作對照,結(jié)果如下表,問三種藥物效果有無差別,,三種藥物治療高血壓病的有效率比較,27,【例76】某省為了解花生黃曲霉素污染,隨機(jī)觀察了三個地區(qū)的花生受黃曲霉素B1污染的情況,結(jié)果見下表。請問這三個地區(qū)花生的黃曲霉素B1污染率是否不同某省三個地區(qū)花生的黃曲霉素B1污染率,28,三、雙向無序列聯(lián)表的?2檢驗(yàn),1列聯(lián)表的?2值計(jì)算?2ΝR1C1,29,【例75】三種藥物治療高血壓病有效率比較,2多個率的比較,,H0三種藥物的總體有效率相等,即Π1Π2Π3H1Π1、Π2、Π3不相等或不全相等Α005,?2Ν21312查?2界值表得P0005,按Α005水平拒絕H0,認(rèn)為三種藥物的治療效果不相同或不全相同。,31,【例77】1979年某地爆發(fā)松毛蟲病,333例患者按年齡以14歲為界分成2組,資料如表,試考察兩組病人病變類型的構(gòu)成比有無差別,某地兩組松毛蟲病患者型別構(gòu)成比較,3構(gòu)成比的比較,32,AH0兩組患者中患各型松毛蟲病的構(gòu)成比相同H1兩組患者中患各型松毛蟲病的構(gòu)成比不同Α005B?27014C查表得P0005D按Α005水平拒絕H0,認(rèn)為兩組患者中患各型松毛蟲病的構(gòu)成比不同。,3構(gòu)成比的比較,△行列表的?2檢驗(yàn)要求理論頻數(shù)T不宜太小,要求不宜有1/5以上的格子的T<5,或有一個T<1?!魅绻陨蠗l件不能滿足,可采用◇增加樣本含量◇刪去某行或某列◇合理地合并部分行或列◇用精確概率法△多個率或構(gòu)成比比較的?2檢驗(yàn),結(jié)論為拒絕H0時,僅表示幾組有差別,并非任2組之間都有差別。若要了解之,可進(jìn)行多個率之間的兩兩比較如?2表的分割法。,4行列表的?2檢驗(yàn)注意事項(xiàng)*,34,5多個率構(gòu)成比兩兩比較行列表的分割(略),【例75】三種藥物治療高血壓病的有效率比較,?2,35,分割表1分割表2,210583?2221873,【例78】(續(xù))哌唑嗪組與降壓片組的有效率接近,將此2組合并,再與另一個樣本比較,得到2個分割表,?2005,1384,36,可以得出?21?2222456約等于原來的?22236,兩者不相等是由于分割表中理論頻數(shù)的數(shù)值與總表中理論頻數(shù)不同所致。結(jié)論哌唑嗪與降壓片總體有效率相同,但與安慰劑的有效率不相同。,37,例題考察一種新型透析療法的效果,,四、22列聯(lián)表資料的?2檢驗(yàn),,,,38,【例78】用兩種檢驗(yàn)方法對某食品作沙門氏菌檢驗(yàn),結(jié)果如下,試比較兩種方法的陽性結(jié)果是否有差別配對設(shè)計(jì)兩種方法結(jié)果比較,,39,配對設(shè)計(jì)的計(jì)量資料(觀察值)比較,比較兩總體均數(shù)的差異,用配對T檢驗(yàn)配對設(shè)計(jì)的計(jì)數(shù)資料,我們用22列聯(lián)表資料的?2檢驗(yàn),40,122列聯(lián)表資料的?2檢驗(yàn),配對四格表資料分析略(1)獨(dú)立性檢驗(yàn)(是否有關(guān)聯(lián))用四格表?2檢驗(yàn)法(2)優(yōu)勢性檢驗(yàn)(是否相同)用MCNEMAR檢驗(yàn)法(3)一致性檢驗(yàn)用KAPPA檢驗(yàn)法,41,【例78】用兩種檢驗(yàn)方法對某食品作沙門氏菌檢驗(yàn),結(jié)果如下,試比較兩種方法的陽性結(jié)果是否有差別配對設(shè)計(jì)兩種方法結(jié)果比較,,著眼于兩法結(jié)果不一致的部分。,42,兩法結(jié)果不一致的部分H0總體BC;H1總體B≠C檢驗(yàn)統(tǒng)計(jì)量,當(dāng)BC≥40時?2當(dāng)BC40時?2Ν1樣本例數(shù)較少時還可以用精確概率法,原理同配對設(shè)計(jì)的符號檢驗(yàn)。,43,H0甲法陽性乙法陰性例數(shù)與甲法陰性乙法陽性例數(shù)相同,即總體BC;H1總體B≠CΑ005?21290查?2界值表P0005,拒絕H0,認(rèn)為兩法檢驗(yàn)結(jié)果不一樣,熒光抗體法陽性結(jié)果高于常規(guī)培養(yǎng)法。,,44,配對(列聯(lián)表)資料的?2檢驗(yàn),【例79】有93份咽喉涂抹標(biāo)本,每份標(biāo)本分別接種在甲乙兩種白喉?xiàng)U菌培養(yǎng)基上,觀察其生長情況,結(jié)果如下表,試分析兩種培養(yǎng)基的效果是否不同表5甲乙兩種培養(yǎng)基的生長情況,45,1建立假設(shè)H0BC;H1B≠C確定顯著性水平?0052計(jì)算統(tǒng)計(jì)量BC101929?40,校正公式?2(|BC|1)2/(BC)2207?(21)(21)13確定P值4作推斷,46,五、四格表的確切概率法,【例710】在某牧區(qū)觀察慢性布魯氏病患者植物血凝素皮膚試驗(yàn)反應(yīng),資料如下,問活動型與穩(wěn)定型布氏患者反應(yīng)陽性率有無差別,47,五、四格表的確切概率法,★適用條件四格表資料N<40時;四格表中有A0時;四格表中有T<1時;用其它檢驗(yàn)方法所得概率接近檢驗(yàn)水準(zhǔn)時。,48,五、四格表的確切概率法,【例710】在某牧區(qū)觀察慢性布魯氏病患者植物血凝素皮膚試驗(yàn)反應(yīng),資料如下,問活動型與穩(wěn)定型布氏患者反應(yīng)陽性率有無差別,49,五、四格表的確切概率法,基本思想,,,,,,,50,H0兩型陽性率相等,即Π1Π2H1Π1≠Π2在將原四格表周邊數(shù)字(行和與列和)不變的情況下,變動A值,以得到不同情況,51,P為|AT|大于等于原來表中的|AT|值(014)的情況下的PI的和,即PP0P1P402668按Α005水準(zhǔn)接受H0,認(rèn)為兩型陽性率相等。,計(jì)算每種情況下的|AT|和|AT|大于等于原來表中的|AT|值(014)的PI值,PI值按下列公式來計(jì)算,52,【例711】某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒宮內(nèi)感染HBV的效果,將33例HBSAG陽性孕婦隨機(jī)分為預(yù)防注射組和非預(yù)防組,結(jié)果見下表。問兩組新生兒的HBV總體感染率有無差別,53,,2211,T116AT20,54,第二節(jié)分類資料的擬合優(yōu)度檢驗(yàn),此例只有兩種分類。因此應(yīng)有理論次數(shù)總數(shù)/分類項(xiàng)數(shù),即700535(人),,,,【例712】隨機(jī)抽取70名學(xué)生,調(diào)查他們對高中分文理科的意見,回答贊成的有42人,反對的有28人。問對分科的意見有無差異,一、單變量擬合優(yōu)度檢驗(yàn),55,二、頻數(shù)分布的擬合優(yōu)度檢驗(yàn),1建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0評定結(jié)果服從正態(tài)分布,H1評定結(jié)果不服從正態(tài)分布?005,,【例713】今對某校100名學(xué)生進(jìn)行操行評定,分優(yōu)、良、中、差四等,評定結(jié)果為優(yōu)19人、良39人、中35人、差7人。試檢驗(yàn)其分布的形式是否屬于正態(tài)分布,2計(jì)算值,第一等分(優(yōu))15Σ~3Σ之間的面積比率為04987-0433200655,即7。第二等分(良)0~15Σ之間面積比率為04332,即43。第三等分(中)0~-15Σ之間面積比率為04332。第四等分(差)位于-3Σ~-15Σ之間的面積比率為04987-0433200655,即7。,1首先需求出理論次數(shù)??蓪⒄龖B(tài)分布底線長度從-3Σ至+3Σ分為四個等分,每等分為15Σ,其面積比率為,57,3統(tǒng)計(jì)推斷DF413。781,>以?=005水準(zhǔn)拒絕,認(rèn)為此評定結(jié)果不服從正態(tài)分布。,,,2根據(jù)各等分的面積比率,乘以總?cè)藬?shù),即可得出理論次數(shù)。如優(yōu)的人數(shù)為71007。3計(jì)算,58,完,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 58
大?。?0.65(MB)
子文件數(shù):
-
簡介:基本內(nèi)容,,相關(guān)與回歸,第九章,用于研究和解釋變量之間相互關(guān)系的,掌握積差相關(guān)等級相關(guān)線性回歸的概念線性回歸方程的計(jì)算回歸系數(shù)的假設(shè)檢驗(yàn)相關(guān)與回歸的區(qū)別與聯(lián)系了解曲線擬合,教學(xué)目的和要求,重點(diǎn)講解積差相關(guān)等級相關(guān)線性回歸的概念回歸系數(shù)的假設(shè)檢驗(yàn)相關(guān)與回歸的區(qū)別與聯(lián)系介紹曲線擬合,教學(xué)內(nèi)容提要,第一節(jié)兩變量相關(guān),,相關(guān)分析是研究客觀事物或現(xiàn)象之間關(guān)系的密切程度(不存在函數(shù)關(guān)系)。,線性相關(guān)是研究兩變量之間是否存在線性關(guān)系。,為研究父親與成年兒子身高之間的關(guān)系,皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標(biāo)上。X上的數(shù)代表父親身高,Y上的數(shù)代表兒子的身高。1078個點(diǎn)形成圖形是一個散點(diǎn)圖。,一、積差相關(guān),1、散點(diǎn)圖,一、積差相關(guān)1、散點(diǎn)圖,2、積差相關(guān)系數(shù),定量描述X與Y兩變量間直線相關(guān)方向和相關(guān)密切程度的統(tǒng)計(jì)指標(biāo)。,PEARSON相關(guān)系數(shù),簡稱相關(guān)系數(shù),適用于X、Y都服從正態(tài)分布(稱為雙變量正態(tài)分布)的資料。,積差相關(guān)系數(shù)的計(jì)算,,R沒有單位取值范圍1≤R≤1,LXY∑XY∑X∑Y/NLXX∑X2∑X2/NLYY∑Y2∑Y2/N,R的特點(diǎn)沒有單位1≤R≤1R1完全負(fù)相關(guān),1≤R<0負(fù)相關(guān)R1完全正相關(guān),0<R≤1正相關(guān)R0零相關(guān),散點(diǎn)圖,【例91】一個產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān)。于是設(shè)想,通過測量待產(chǎn)婦尿中雌三醇含量,可以預(yù)測產(chǎn)兒體重,以便對低出生體重進(jìn)行預(yù)防。因此收集了31例待產(chǎn)婦24小時的尿,測量其中的雌三醇含量,同時記錄產(chǎn)兒的體重。問尿中雌三醇含量與產(chǎn)兒體重之間是否存在相關(guān)關(guān)系是正相關(guān)還是負(fù)相關(guān),,3、積差相關(guān)分析,13,待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系,,,,1繪制散點(diǎn)圖,2積差相關(guān)系數(shù)的計(jì)算,∑X534;∑Y992;∑X29876∑Y23248;∑XY1750;,3相關(guān)系數(shù)的假設(shè)檢驗(yàn),上例中R061,說明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個樣本,由此得到的相關(guān)系數(shù)會存在抽樣誤差。?0時,由于抽樣誤差,可能導(dǎo)致R≠0。對R進(jìn)行假設(shè)檢驗(yàn),判斷R≠0是由于抽樣誤差所致,還是兩個變量之間確實(shí)存在相關(guān)關(guān)系。,3相關(guān)系數(shù)的假設(shè)檢驗(yàn),,總體相關(guān)系數(shù)Ρ0表示總體中兩變量X和Y無直線相關(guān)關(guān)系,,R的標(biāo)準(zhǔn)誤為SR=,,,用R和自由度V=N2,查附表18,相關(guān)系數(shù)界值表,H0Ρ0H1Ρ≠0ΝN231229查附表7,T00005/2,2839351,T00002/2,2842754,00002<P<00005,拒絕H0,接受H1,認(rèn)為待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間有正相關(guān)關(guān)系。,第二節(jié)直線回歸,一、回歸方程二、回歸系數(shù)三、回歸系數(shù)的假設(shè)檢驗(yàn)四、直線回歸的應(yīng)用,一個人的快樂,不是因?yàn)樗麚碛械亩?,而是因?yàn)樗?jì)較的少,休息,二、等級相關(guān)(秩相關(guān)),①不服從正態(tài)分布的資料;②總體分布類型不知的資料;③用等級或相對數(shù)表示的資料;④數(shù)據(jù)一端或兩端有不確定值的資料用等級相關(guān)(或稱秩相關(guān))分析(屬非參數(shù)統(tǒng)計(jì)法)。,秩相關(guān)系數(shù),SPEARMAN相關(guān)系數(shù)(RS)KENDALL相關(guān)系數(shù)(RK),,用等級相關(guān)系數(shù)表示兩個變量間直線關(guān)系密切程度和方向。,先分別將兩個變量按原始數(shù)值由小到大編秩(遇相同觀察值時取平均秩),計(jì)算每對觀察值的秩之差D。,N為對子數(shù);D為配對秩次之差;TX(或TY)=ΣTJ3-TJ/12;TJ為X(或Y)中第J個相同秩次的個數(shù)。查附表19確定P的大小。,1)SPEARMAN相關(guān)系數(shù)(RS),【例92】12名27歲急性白血病患兒的血小板數(shù)與出血癥狀資料見下表,分析兩者之間有無直線關(guān)系,H0Ρ=0,H1Ρ≠0,查統(tǒng)計(jì)用附表19,R005/212=0587,P>005不能以?=005水準(zhǔn)拒絕H0,不能認(rèn)為2~7歲急性白血病患兒的血小板數(shù)與出血癥狀之間有直線相關(guān)關(guān)系。,2)KENDALL相關(guān)系數(shù),在X的秩從小到大排列后,計(jì)算配對的Y每個秩下面更大者的個數(shù),合計(jì)值記為S,計(jì)算RK并在相同秩次較多時校正,,其中,N為對子數(shù),UX或UY=∑TJ2-TJ/2,TJ為第J個相同秩次的個數(shù)。查附表20確定P的大小。,三、相關(guān)系數(shù)應(yīng)用注意事項(xiàng)有實(shí)際意義在兩個變量的變化范圍內(nèi)進(jìn)行相關(guān)不是因果關(guān)系,但可做為進(jìn)一步考證有無因果關(guān)系的基礎(chǔ),四、直線相關(guān)的應(yīng)用,一般說來,當(dāng)N100,并對R進(jìn)行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時∣R∣>07,則表示兩個變量高度相關(guān);04<∣R∣≤07時,則表示兩個變量之間中度相關(guān);02<∣R∣≤04時,則兩個變量低度相關(guān)。,,待產(chǎn)婦尿中雌三醇含量和產(chǎn)兒體重之間成正相關(guān)。那么,如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能推斷出產(chǎn)兒的體重嗎或產(chǎn)兒的體重可能在什么范圍內(nèi)呢身高與體重之間也成正相關(guān)關(guān)系。那么,身高每增加1厘米,體重增加多少克呢上面的相關(guān)關(guān)系分析不能提供給我們需要的答案。這些要用直線回歸的方法來解決。,某保險(xiǎn)公司承保汽車5萬量,平均每量保費(fèi)收入為1000元,則該保險(xiǎn)公司汽車承??偸杖霝?000萬元。承??偸杖隮承保汽車量數(shù)XY1000XX與Y兩個變量間完全表現(xiàn)為一種確定性關(guān)系,即函數(shù)關(guān)系。,第二節(jié)一元回歸,銀行的1年期存款利息年息為225,存入的本金用X表示,到期的本息用Y表示,則YX225X這里Y與X仍表現(xiàn)為一種線性函數(shù)關(guān)系。,另外一種情況兩事物之間有著密切的聯(lián)系,但密切的程度并沒有達(dá)到由一個可以完全確定另一個的程度。例如生長發(fā)育階段動物體重增量與食量廣告費(fèi)支出與商品銷售額,由于其它因素的干擾,許多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱這種關(guān)系式為一元回歸方程,這種關(guān)系為一元回歸。,第二節(jié)一元回歸,一、直線回歸分析,繪制散點(diǎn)圖求直線回歸方程繪制回歸直線回歸系數(shù)的假設(shè)檢驗(yàn),用直線方程描述兩個變量間的數(shù)量依存關(guān)系。,①一般形式A截距B回歸系數(shù)(回歸直線斜率),1直線回歸方程的求法,B0X↑Y↑;B0X↑Y↓B意義為X每變化一個單位,Y變化的平均值X自變量,要求容易測定、容易控制Y的估計(jì)值,Y稱因變量,要求在不同的X的時候其分布為正態(tài)分布,②A、B的計(jì)算(用最小二乘法原理估計(jì)BN對子數(shù)(數(shù)據(jù)對),剩余誤差,殘差各實(shí)測值Y至回歸直線縱向距離。剩余平方和或殘差平方和最小。,SSE=ΣY2,SS總SSRSSE,決定系數(shù)(DETERMININGCOEFFICIENT,R2)回歸平方和在總平方和中所占的比例。,R2SS回/SS總,R2是評價(jià)回歸強(qiáng)度的一個重要指標(biāo)。0≤R2≤1,→1,回歸效果越好,強(qiáng)度↑。臨床研究中,R2≥07認(rèn)為回歸效果不錯。,2回歸方程擬合效果評價(jià)(決定系數(shù)),,,1繪制散點(diǎn)圖2求直線回歸方程,3繪制回歸直線,在自變量的變化范圍內(nèi)選兩點(diǎn)做直線(0,A)(X,Y)這兩點(diǎn)可以用來核對圖線繪制是否正確。,,,例題中得到的直線回歸方程一定經(jīng)過(0,215)(1723,32)兩點(diǎn)。,直線回歸方程從樣本資料計(jì)算而得,有抽樣誤差。需要對樣本的回歸系數(shù)B進(jìn)行假設(shè)檢驗(yàn),以判斷B是否從回歸系數(shù)為零的總體中抽得??傮w的回歸系數(shù)一般用Β表示。,是否能說明雌三醇與產(chǎn)兒體重之間一定存在回歸關(guān)系,T檢驗(yàn)H0Β0(直線回歸方程不成立)H1Β≠0(直線回歸方程成立),進(jìn)行Β0的假設(shè)檢驗(yàn)(即X與Y間無直線回歸關(guān)系)T檢驗(yàn)或F檢驗(yàn)相關(guān)系數(shù)的檢驗(yàn)代替,4回歸系數(shù)的假設(shè)檢驗(yàn),ΥN2,H0Β0H1Β≠0Α005,,Υ31229,查表T00005/2,2839351,P<00005拒絕H0,接受H1,認(rèn)為待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間存在直線回歸關(guān)系。,二、直線回歸方程的應(yīng)用,估計(jì)描述兩變量間的依存關(guān)系通過回歸系數(shù)的假設(shè)檢驗(yàn),若認(rèn)為兩變量之間存在直線回歸關(guān)系,則可用直線回歸來描述。利用回歸方程進(jìn)行預(yù)測把自變量代入回歸方程,對應(yīng)變量進(jìn)行估計(jì)。例如,已知某待產(chǎn)婦的尿雌三醇濃度,估計(jì)產(chǎn)兒的體重范圍。利用回歸方程進(jìn)行統(tǒng)計(jì)控制胰島素與血糖制定正常值范圍血細(xì)胞,血紅蛋白等,三、曲線擬合,對呈曲線關(guān)系的資料,可用散點(diǎn)圖分析曲線的類型,建立曲線回歸方程。常用曲線的類型對數(shù)=A+BLNX指數(shù)LN=A+BX冪函數(shù)LN=A+BLNXLOGISTIC,,四、相關(guān)與回歸分析注意事項(xiàng),1實(shí)際意義進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無關(guān)系的兩個事物或現(xiàn)象用來作相關(guān)回歸分析。2相關(guān)關(guān)系相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系。例如,同一父母生的兄弟,往往哥高弟也高,這主要與遺傳因素及生活條件相關(guān),而不能說哥高是弟高的原因。但如果事物之間存在因果關(guān)系,則兩者必然是相關(guān)的。,3利用散點(diǎn)圖對于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點(diǎn)圖,在圖上看它們有無關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負(fù)相關(guān),然后再進(jìn)行相關(guān)回歸分析。4變量范圍相關(guān)分析和回歸方程僅適用于樣本的原始數(shù)據(jù)范圍之內(nèi),出了這個范圍,我們不能得出兩變量的相關(guān)關(guān)系和原來的回歸關(guān)系。,資料要求直線回歸要求應(yīng)變量Y是服從正態(tài)分布的隨機(jī)變量,X是可以精確測量和嚴(yán)格控制的變量,一般稱為I型回歸;直線相關(guān)要求X和Y服從雙變量正態(tài)分布,二者間若進(jìn)行回歸分析,則稱為II型回歸。參與相關(guān)分析的兩個變量無主次之分,參與回歸分析的兩個變量則有自變量和應(yīng)變量之分。,★五、相關(guān)與回歸的區(qū)別,應(yīng)用說明兩變量間的關(guān)聯(lián)關(guān)系用相關(guān)分析;說明兩者數(shù)量上的依存關(guān)系則用回歸分析。意義B表示X每改變一個單位,Y平均改變B個單位;R說明具有線性關(guān)聯(lián)的兩個變量間關(guān)系的密切程度和相關(guān)方向。R的絕對值越大,散點(diǎn)圖中的點(diǎn)越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。B的絕對值越大,回歸直線越陡,說明當(dāng)X變化一個單位時,Y的平均變化就越大。,★五、相關(guān)與回歸的區(qū)別,計(jì)算方法取值范圍單位R無量綱;B有量綱。,★五、相關(guān)與回歸的區(qū)別,六、相關(guān)與回歸的聯(lián)系,關(guān)系能進(jìn)行回歸分析的變量之間存在相關(guān)關(guān)系。所以,對于兩組新數(shù)據(jù)(兩個變量)可先做散點(diǎn)圖,求出它們的相關(guān)系數(shù),對于確有相關(guān)關(guān)系的變量再進(jìn)行回歸分析,求出回歸方程。,六、相關(guān)與回歸的聯(lián)系,相關(guān)系數(shù)R與回歸系數(shù)B1)R與B的符號一致。R為正時,B也為正,表示兩變量是正相關(guān),是同向變化。R為負(fù)時,B也為負(fù),表示兩變量是負(fù)相關(guān),是反向變化。2)R與B的假設(shè)檢驗(yàn)結(jié)果一致,可用R的顯著檢驗(yàn)代替B的顯著性檢驗(yàn)。3)已知X、Y的標(biāo)準(zhǔn)差SX、SY時,積差相關(guān)系數(shù)R與回歸系數(shù)B可以相互推算。,RBSX/SY,BRSY/SX,回歸強(qiáng)度和相關(guān)強(qiáng)度可以互相解釋決定系數(shù)R2,【習(xí)題】查醫(yī)宗金鑒中治積聚處方,得下表資料,用建立回歸方程方法得到19670735X具有統(tǒng)計(jì)學(xué)意義,R209996。擬合度達(dá)9996??梢?,用回歸方程描述名醫(yī)治病用藥的配伍規(guī)律準(zhǔn)確有效。,,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 58
大?。?1.08(MB)
子文件數(shù):
-
簡介:第五章假設(shè)檢驗(yàn),統(tǒng)計(jì)推斷,隨機(jī)抽樣,,參數(shù),統(tǒng)計(jì)量,(?、?、?),(X、S、P),參數(shù)估計(jì)假設(shè)檢驗(yàn),,通過樣本統(tǒng)計(jì)量推斷總體參數(shù)之間是否存在差異,其推斷過程稱為假設(shè)檢驗(yàn)。,教學(xué)目的與要求,掌握假設(shè)檢驗(yàn)原理單樣本正態(tài)資料的假設(shè)檢驗(yàn)兩樣本正態(tài)資料的假設(shè)檢驗(yàn)二項(xiàng)分布與POISSON分布資料的Z檢驗(yàn)假設(shè)檢驗(yàn)應(yīng)注意的問題了解置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系,教學(xué)內(nèi)容提要,重點(diǎn)講解假設(shè)檢驗(yàn)原理單樣本正態(tài)資料的假設(shè)檢驗(yàn)兩樣本正態(tài)資料的假設(shè)檢驗(yàn)Z檢驗(yàn)假設(shè)檢驗(yàn)應(yīng)注意的問題介紹置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系,假設(shè)檢驗(yàn)的基本任務(wù)事先對總體分布或總體參數(shù)作出假設(shè),利用樣本信息判斷原假設(shè)是否合理,從而決定是否拒絕或接受原假設(shè)。參數(shù)檢驗(yàn)PARAMETRICTEST若總體分布類型已知,需要對總體的未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)。非參數(shù)檢驗(yàn)若總體分布類型未知,需要對未知分布函數(shù)的總體的分布類型或其中的某些未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)。,假設(shè)檢驗(yàn)(HYPOTHESISTEST)的基本思想,亦稱顯著性檢驗(yàn)(SIGNIFICANCETEST)是先對總體的特征(如總體的參數(shù)或分布、位置)提出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值、總體均數(shù)(或總體率)相等、總體服從某種分布、兩總體分布位置相同等等,然后根據(jù)隨機(jī)樣本提供的信息,運(yùn)用“小概率原理”推斷假設(shè)是否成立。,“概率很?。ń咏诹悖┑氖录谝淮纬闃又胁惶赡艹霈F(xiàn),故可以認(rèn)為小概率事件在一次隨機(jī)抽樣中是不會發(fā)生的”。,“小概率原理”,例如在2000粒中藥丸中只有一粒是蟲蛀過的,現(xiàn)從中隨機(jī)取一粒,則取得“蟲蛀過的藥丸”的概率是1/2000,這個概率是很小的,因此也可以將這一事件看作在一次抽樣中是不會發(fā)生的。若從中隨機(jī)抽取一粒,恰好是蟲蛀過的,這種情況發(fā)生了,我們自然可以認(rèn)為“假設(shè)”有問題,即蟲蛀率P不是1/2000,從而否定了假設(shè)。否定假設(shè)的依據(jù)就是小概率事件原理。由此我們得到一個推理方法如果在某假設(shè)(記為H0)成立的條件下,事件A是一個小概率事件,現(xiàn)在只進(jìn)行一次試驗(yàn),事件A就發(fā)生了,我們就認(rèn)為原來的假設(shè)(H0)是不成立的。,例如,根據(jù)大量調(diào)查,已知正常成年男性平均脈搏數(shù)為72次/分,現(xiàn)隨機(jī)抽查了20名肝陽上亢成年男性病人,其平均脈搏為84次/分,標(biāo)準(zhǔn)差為64次/分。問肝陽上亢男病人的平均脈搏數(shù)是否較正常人快以上兩個均數(shù)不等有兩種可能第一,由于抽樣誤差所致;第二,由于肝陽上亢的影響。,例如,已知正常成年男子脈搏平均為72次/分,現(xiàn)隨機(jī)檢查20名慢性胃炎所致脾虛男病人,其脈搏均數(shù)為75次/分,標(biāo)準(zhǔn)差為64次/分,問此類脾虛男病人的脈搏快于健康成年男子的脈搏抽樣誤差脾虛,假設(shè)檢驗(yàn)1、原因2、目的3、原理4、過程(步驟)5、結(jié)果,第一節(jié)假設(shè)檢驗(yàn)原理,某事發(fā)生了是由于碰巧還是由于必然的原因統(tǒng)計(jì)學(xué)家運(yùn)用顯著性檢驗(yàn)來處理這類問題。,1、假設(shè)檢驗(yàn)的原因,由于總體不同或因個體差異的存在,在研究中進(jìn)行隨機(jī)抽樣獲得的樣本均數(shù),X1、X2、X3、X4,不同。樣本均數(shù)不同有兩種(而且只有兩種)可能(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性(差別無統(tǒng)計(jì)學(xué)意義)(2)分別所代表的總體均數(shù)不同。差別有顯著性(差別有統(tǒng)計(jì)學(xué)意義),,,,,2、假設(shè)檢驗(yàn)的目的判斷是由于何種原因造成的不同,以做出決策。,,反證法當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實(shí)A,這時否定另一種可能B,則間接的肯定了A。概率論(小概率)如果一件事情發(fā)生的概率很小,那么在進(jìn)行一次試驗(yàn)時,我們說這個事件是“不會發(fā)生的”。從一般的常識可知,這句話在大多數(shù)情況下是正確的,但是它一定有犯錯誤的時候,因?yàn)楦怕试傩∫彩怯锌赡馨l(fā)生的。,3、假設(shè)檢驗(yàn)的原理,4、假設(shè)檢驗(yàn)的步驟,▲建立假設(shè)(反證法),確定顯著性水平(?)▲計(jì)算統(tǒng)計(jì)量U,T,?2▲確定概率P值▲做出推論,【例51】,已知正常成年男子脈搏平均為72次/分,現(xiàn)隨機(jī)檢查20名慢性胃炎所致脾虛男病人,其脈搏均數(shù)為75次/分,標(biāo)準(zhǔn)差為64次/分,推斷此類脾虛男病人的脈搏是否不同于健康成年男子的脈搏。,(1)建立假設(shè),選定檢驗(yàn)水準(zhǔn)假設(shè)兩種一種是檢驗(yàn)假設(shè),假設(shè)差異完全由抽樣誤差造成,常稱無效假設(shè),用H0表示。另一種是和H0相對立的備擇假設(shè),用H1表示。假設(shè)檢驗(yàn)是針對H0進(jìn)行的。,確定雙側(cè)或單側(cè)檢驗(yàn),H0此類脾虛病對脈搏數(shù)無影響,H0Μ72次/分H1脾虛病人的脈搏數(shù)不同于正常人,H1Μ≠72次/分,選定檢驗(yàn)水準(zhǔn)Α005Α是在統(tǒng)計(jì)推斷時,預(yù)先設(shè)定的一個小概率值,是當(dāng)H0為真時,允許錯誤地拒絕H0的概率。,,雙側(cè)與單側(cè)檢驗(yàn)界值比較,,2選定適當(dāng)?shù)臋z驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量值,T檢驗(yàn)Z檢驗(yàn),設(shè)計(jì)類型資料的類型和分布統(tǒng)計(jì)推斷的目的N的大小如完全隨機(jī)設(shè)計(jì)實(shí)驗(yàn)中,已知樣本均數(shù)與總體均數(shù)比較,N又不大,可用T檢驗(yàn),計(jì)算統(tǒng)計(jì)量T值。,3計(jì)算P值,P值是在H0成立時,取得大于或等于現(xiàn)有檢驗(yàn)統(tǒng)計(jì)量值的概率。,(3)計(jì)算概率值(P)將計(jì)算得到的Z值或T值與查表得到Z?或T?,Ν,比較,得到P值的大小。根據(jù)U分布和T分布我們知道,如果|Z|Z?或|T|T?,則P?。,當(dāng)P≤Α時,統(tǒng)計(jì)學(xué)結(jié)論為按所取Α檢驗(yàn)水準(zhǔn)拒絕H0,接受H1,稱“差異有顯著性”(“差異有統(tǒng)計(jì)學(xué)意義”)。當(dāng)PΑ時,沒有理由懷疑H0的真實(shí)性,統(tǒng)計(jì)學(xué)結(jié)論為按所取Α檢驗(yàn)水準(zhǔn)不拒絕H0,稱“差異無顯著性”(“差異無統(tǒng)計(jì)學(xué)意義”)。,4作出推斷結(jié)論,Α與P異同,相同Α與P都是用檢驗(yàn)統(tǒng)計(jì)量分布的尾部面積大小表示。不同Α是在統(tǒng)計(jì)推斷時,預(yù)先設(shè)定的一個小概率值,是當(dāng)H0為真時,允許錯誤地拒絕H0的概率,是檢驗(yàn)水準(zhǔn)。P值是由實(shí)際樣本決定的,是指從由H0所規(guī)定的總體中隨機(jī)抽樣,獲得大于及等于(或小于)現(xiàn)有樣本檢驗(yàn)統(tǒng)計(jì)量值的概率。,5、兩類錯誤(I型錯誤與Ⅱ型錯誤),統(tǒng)計(jì)推斷可能出現(xiàn)的4種結(jié)果,I型錯誤(?。?推斷正確(1-?。?推斷正確(1-Β),Ⅱ型錯誤(Β),(假陽性錯誤),(假陰性錯誤),(檢驗(yàn)效能、把握度),(可信度),無效假設(shè)(H0)備擇假設(shè)(H1),兩類錯誤Ⅰ型錯誤與Ⅱ型錯誤Ⅰ型錯誤H0原本是正確的拒絕H0棄真假陽性錯誤誤診用Α表示Ⅱ型錯誤H0原本是錯誤的不拒絕H0存?zhèn)渭訇幮藻e誤漏診用Β表示,,,,,,,,,兩均數(shù)的假設(shè)檢驗(yàn),樣本均數(shù)與總體均數(shù)的比較成對資料均數(shù)的T檢驗(yàn)成組資料兩樣本均數(shù)的比較方差不齊時兩小樣本均數(shù)的比較,第二節(jié)單樣本正態(tài)資料的假設(shè)檢驗(yàn),,,不,滿足,,不,滿足,,滿足,,滿足,,,,Σ,已知,,,,正態(tài)性,,,,非參數(shù),檢驗(yàn),,,,變量替換,,,,,結(jié)論,,,,,不,滿足,,,,大樣本,,,,U,檢驗(yàn),,,,T,檢驗(yàn),,滿足,,,,,,,,,Z,思路,一、正態(tài)總體均數(shù)的假設(shè)檢驗(yàn),方法,1、大樣本【例52】一般女性平均身高1601CM。某大學(xué)隨機(jī)抽取100名女大學(xué)生,測量其身高,身高的均數(shù)是16374CM,標(biāo)準(zhǔn)差是380CM。請問某大學(xué)18歲女大學(xué)生身高是否與一般女性不同。,▲目的比較樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)有無差別▲計(jì)算公式Z統(tǒng)計(jì)量,▲適用條件1已知一個總體均數(shù);2可得到一個樣本均數(shù);3可得到該樣本標(biāo)準(zhǔn)誤;4樣本量不小于100。,,,假設(shè)檢驗(yàn)▲建立假設(shè),確定顯著性水平(?)檢驗(yàn)假設(shè)某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)相同,H0ΜΜ0;備擇假設(shè)某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)不同,H1Μ≠Μ0?005,▲做出推論Z958196,PT00515,P00482。??=005N=5,=1414,S=00882,DF=N-1=4,查統(tǒng)計(jì)用表6得單側(cè)概率PT0059PΜ0Μ的上側(cè)95%置信區(qū)間為T005,DFS/如例43,H0Μ=Μ0(Μ072次/分);H1ΜΜ0。?。?05。-T005(DF)S/=75172964/=7252Μ的上側(cè)95%置信區(qū)間為Μ7252,現(xiàn)Μ0=72次/分不在此區(qū)間范圍內(nèi),故按Α=005水準(zhǔn)拒絕H0,接受H1,結(jié)論與前述T檢驗(yàn)結(jié)果一致。(2)若關(guān)心的是ΜΜ0Μ的下側(cè)95%置信區(qū)間為T005(DF)S/,二、置信區(qū)間比假設(shè)檢驗(yàn)有可提供更多信息之處,,三、置信區(qū)間不能完全取代假設(shè)檢驗(yàn),置信區(qū)間用作假設(shè)檢驗(yàn)只能在規(guī)定的Α水準(zhǔn)上揭示差異有無統(tǒng)計(jì)學(xué)意義。假設(shè)檢驗(yàn)可得到的P值,可以精確地說明結(jié)論的概率保證,可以估計(jì)假陰性率Β。,最好同時給出假設(shè)檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量值、P值和置信區(qū)間,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 72
大?。?0.46(MB)
子文件數(shù):
-
簡介:醫(yī)學(xué)統(tǒng)計(jì)學(xué)2,方法的類型,研究和應(yīng)用程度,統(tǒng)計(jì)學(xué),理論統(tǒng)計(jì)學(xué),應(yīng)用統(tǒng)計(jì)學(xué),描述統(tǒng)計(jì)學(xué),推斷統(tǒng)計(jì)學(xué),,在中醫(yī)藥科研實(shí)踐中通過觀察、調(diào)查、實(shí)驗(yàn)等方式搜集到的各種資料含有大量信息,由此揭示或表達(dá)樣本信息特征,不僅需要依據(jù)相關(guān)專業(yè)知識,還需借助適當(dāng)?shù)慕y(tǒng)計(jì)學(xué)方法和手段。統(tǒng)計(jì)描述又稱描述性統(tǒng)計(jì),是運(yùn)用適宜的統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對研究對象變量的分布類型和數(shù)量特征進(jìn)行展示的過程。通過統(tǒng)計(jì)描述,可了解研究對象的基本特征,便于對樣本資料作進(jìn)一步的統(tǒng)計(jì)分析。,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計(jì)描述分類變量的統(tǒng)計(jì)描述統(tǒng)計(jì)表統(tǒng)計(jì)圖,頻數(shù)表及頻數(shù)圖是統(tǒng)計(jì)描述的基本內(nèi)容,也是揭示樣本數(shù)據(jù)分布特征的基本手段。,頻數(shù)表又稱頻數(shù)分布表,是將某變量各組段及其相應(yīng)的頻數(shù)按一定順序排列而成的表格形式,主要用于描述數(shù)據(jù)的分布特征,是對樣本含量較大的資料進(jìn)行統(tǒng)計(jì)描述的常用方法。,【例21】隨機(jī)抽取某年某地120例正常人血清銅的含量,見表21,試編制頻數(shù)表。,1數(shù)值資料頻數(shù)表的編制,1找出120例血清鐵數(shù)據(jù)的最小值923)與最大值(1984)。2計(jì)算全距(RANGE,R),也稱為極差。R最大值一最小值1984-923=10613確定組段數(shù)K組段數(shù)應(yīng)根據(jù)研究目的和觀察值多少而定,當(dāng)N100時,通常取1015組,不宜過粗或過細(xì)。本例N120,可先將原始資料粗略定為11組。4確定組距I組距等于全距比組數(shù),一般等距分組。IR/K本例中I1061/110965≈1,頻數(shù)表的手工編制方法,5確定組段第一組段應(yīng)包括最小值,最后一個組段應(yīng)包括最大值。每一組段的起始值稱為下限,終點(diǎn)值稱為上限即下一組段的下限,為避免匯總時的重復(fù),組段不包括本組段的“上限”,但最后一個組段應(yīng)同時寫出下限和上限。如本例最小值為923,為計(jì)算方便,第一組段的下限取900,然后每隔一個組距列一個組段,直至最后一個組段19002000。6列表并統(tǒng)計(jì)頻數(shù),還可計(jì)算頻率、累計(jì)頻數(shù)和累計(jì)頻率,見表22。,表中組中值上組段下限值下組段下限值/2;頻數(shù)即各組段內(nèi)觀察值的個數(shù);頻率即各組段頻數(shù)與總觀察值個數(shù)之比,一般用百分?jǐn)?shù)表示;累計(jì)頻數(shù)是由上至下將頻數(shù)累加;累計(jì)頻率是由上至下將頻率累加。從本例的分布可見以第六組段1400分布的數(shù)據(jù)最多,22例,占183,且以該組段為中心呈對稱分布,小于1500UMOL/L的數(shù)據(jù)占591。,SPSS軟件繪制頻數(shù)表,對【例21】資料進(jìn)行統(tǒng)計(jì)描述,,,,,,,2分類資料頻數(shù)表的編制,1一維頻數(shù)表用分類資料的分類水平代替上述數(shù)值資料頻數(shù)表的組段,然后通過分類計(jì)數(shù)便可編制其頻數(shù)表,見表23。,(2)二維頻數(shù)表分類資料的二維頻數(shù)表在各種醫(yī)學(xué)雜志中較為常見。按分類資料的分類水平特征,可組合成各種不同的二維表,不同二維表名稱見表24。,(3)配對設(shè)計(jì)分類資料的頻數(shù)表同一研究對象同時接受兩種不同的處理,觀測的結(jié)果為屬性相同的分類資料時,這樣就形成了配對設(shè)計(jì)的分類資料,可用行數(shù)與列數(shù)相同的方形表歸納其頻數(shù)分布,見表25。,頻數(shù)圖是在頻數(shù)表基礎(chǔ)上,以直方或直條的面積大小表示頻數(shù)的多少或頻率的大小的圖形,可直觀顯示數(shù)據(jù)的分布類型和特征。,1數(shù)值資料頻數(shù)圖直方圖的繪制,1等距分組橫軸表示隨機(jī)變量,縱軸表示頻數(shù)或頻率。表21資料的頻數(shù)圖,見圖21。,SPSS繪制頻數(shù)圖,,,(2)不等距分組橫軸表示變量,縱軸是每個橫軸單位的頻數(shù)。表26資料的頻數(shù)圖,見圖22。,2分類資料頻數(shù)圖直條圖的繪制,頻數(shù)表和頻數(shù)圖的用途,1描述頻數(shù)分布的類型資料的頻數(shù)分布類型有對稱分布和偏態(tài)分布兩種。如果頻數(shù)分布集中位置單峰最高處在中間,左右兩側(cè)頻數(shù)大體對稱,稱為對稱分布。如果頻數(shù)分布不對稱,集中位置偏向一側(cè),則稱為偏態(tài)分布。若集中位置偏向觀察值小的一側(cè),稱為正偏態(tài),又稱右偏態(tài)。若集中位置偏向觀察值大的一側(cè),稱為負(fù)偏態(tài),又稱左偏態(tài)。不同資料的頻數(shù)分布類型,見圖24。對于不同頻數(shù)分布類型的資料,應(yīng)選用不同的統(tǒng)計(jì)方法進(jìn)行分析。,描述頻數(shù)分布形態(tài)的統(tǒng)計(jì)量有兩個峰度系數(shù)和偏度系數(shù)。理論上總體偏度系數(shù)為0時,分布是對稱的;取正值時,分布為負(fù)偏態(tài);取負(fù)值時,分布為正偏態(tài)。正態(tài)分布的總體峰度系數(shù)為0;取負(fù)值時,分布為平闊峰;取正值時,分布為尖峭峰。正態(tài)分布是一種特殊的以集中性、對稱性和均勻變動性為特點(diǎn)的對稱分布,故無論尖峭峰或平闊峰,均為非正態(tài)分布。,2展示頻數(shù)分布的特征頻數(shù)分布有兩個重要特征一是集中趨勢,反映一組觀察值的中心位置或平均水平;二是離散趨勢,反映觀察值之間參差不齊的程度。對數(shù)值變量資料作統(tǒng)計(jì)描述,就是用統(tǒng)計(jì)指標(biāo)將這兩個重要特征數(shù)量化。3便于發(fā)現(xiàn)某些特大或特小的異常值對資料中出現(xiàn)的異常值應(yīng)謹(jǐn)慎對待,必要時對原始資料進(jìn)行核實(shí),并再次進(jìn)行觀察或測量。若條件不允許再次觀察或測量,在有充分依據(jù)的前提下,可將異常值予以剔除,然后再做統(tǒng)計(jì)描述和分析。4有利于進(jìn)一步計(jì)算有關(guān)指標(biāo)和統(tǒng)計(jì)分析處理,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計(jì)描述分類變量的統(tǒng)計(jì)描述統(tǒng)計(jì)表統(tǒng)計(jì)圖,正態(tài)分布是生物醫(yī)學(xué)和統(tǒng)計(jì)學(xué)上極其重要的一種分布,醫(yī)學(xué)研究的很多指標(biāo)都服從或近似服從正態(tài)分布。在統(tǒng)計(jì)學(xué)上,很多分布都是由正態(tài)分布導(dǎo)出,同時正態(tài)分布又是多種分布的極限分布。,正態(tài)分布NORMALDISTRIBUTION是描述連續(xù)型隨機(jī)變量最重要的分布。其分布曲線叫正態(tài)分布曲線,呈中間高,兩邊低,左右基本對稱的“鐘型”曲線,又稱高斯分布。,正態(tài)分布由德國數(shù)學(xué)家GAUSS在描述誤差分布時所發(fā)現(xiàn),并加以推廣,所以通常稱為高斯分布GAUSSDISTRIBUTION。,高斯,10馬克的錢幣,,正態(tài)分布的公式,Μ和Σ是正態(tài)分布的兩個參數(shù),Μ和Σ決定了X的概率分布;習(xí)慣上用NΜ,Σ2表示均數(shù)為Μ,標(biāo)準(zhǔn)差為Σ的正態(tài)分布。,,正態(tài)分布的特征,1集中性正態(tài)分布是一條單峰分布,高峰位置在均數(shù)處。2對稱性正態(tài)分布以均數(shù)為中心,左右完全對稱。3正態(tài)分布曲線的形態(tài)取決于兩個參數(shù),即總體均數(shù)Μ和總體標(biāo)準(zhǔn)差Σ。4正態(tài)分布曲線下的面積分布具有一定的規(guī)律性。,當(dāng)Σ固定不變時,Μ越大,曲線沿橫軸越向右移動;反之,Μ越小,則曲線沿橫軸越向左移動,所以Μ叫正態(tài)曲線N(Μ,Σ2)的位置參數(shù),。,1位置參數(shù)Μ,正態(tài)分布位置隨參數(shù)Μ變換示意圖,2形狀參數(shù)Σ,正態(tài)分布形態(tài)隨參數(shù)Σ變換示意圖,當(dāng)Μ固定不變時,Σ越大,曲線越平闊;Σ越小,曲線越尖峭,Σ叫正態(tài)曲線N(Μ,Σ2)的形狀參數(shù)。,正態(tài)分布面積分布規(guī)律,(1)正態(tài)分布曲線與橫軸所夾面積為1。(2)區(qū)間在(ΜΣ,ΜΣ)內(nèi)的面積或概率為0683,此區(qū)間之外概率為0317,左右兩側(cè)各01585。(3)區(qū)間在(Μ196Σ,Μ196Σ)內(nèi)的面積或概率為095,此區(qū)間之外概率為005,左右兩側(cè)各0025。(4)區(qū)間在(Μ258Σ,Μ258Σ)內(nèi)的面積或概率為099,此區(qū)間之外概率為001,左右兩側(cè)各0005。,正態(tài)分布應(yīng)用于以下3個方面1制定醫(yī)學(xué)參考值范圍2質(zhì)量控制3統(tǒng)計(jì)方法的理論基礎(chǔ),正態(tài)分布的應(yīng)用,1制定醫(yī)學(xué)參考值范圍,參考值范圍(REFERENCERANGE指所謂“正常人”的解剖、生理、生化等指標(biāo)的波動范圍。,制定方法制定參考值范圍時,首先要確定一批樣本含量足夠大的“正常人”。測量樣本人群相應(yīng)指標(biāo)的值,測量的過程中要嚴(yán)格控制各種誤差。而后根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值,根據(jù)研究目的和使用要求選定適當(dāng)?shù)陌俜纸缰?,常?5。,單側(cè)臨界值標(biāo)準(zhǔn)正態(tài)分布單側(cè)尾部面積等于Α時所對應(yīng)的正側(cè)變量值,記作ZΑ。,雙側(cè)臨界值標(biāo)準(zhǔn)正態(tài)分布雙側(cè)尾部面積之和等于Α時所對應(yīng)的正側(cè)變量值,記作ZΑ/2。,以不同的方法計(jì)算參考值范圍,舉例1調(diào)查某地120名健康女性血紅蛋白,直方圖顯示其分布近似正態(tài),均數(shù)X1174,標(biāo)準(zhǔn)差S102,試估計(jì)該地健康女性血紅蛋白的95參考值范圍。,解析,1分布近似正態(tài),2過高過低均為異常,3求上、下界值,上界,下界,所以,該地健康女性血紅蛋白的95參考值范圍是(9741,13739)G/L。,,舉例2某地調(diào)查120名健康成年男性的第一秒肺通氣量得均數(shù)X42L,標(biāo)準(zhǔn)差S07L,試據(jù)此估計(jì)其第一秒肺通氣量的95參考值范圍。,解析,1分布近似正態(tài),2僅過低為異常,3求下界值,下界,所以,該地健康成年男子第一秒肺通氣量的95參考值范圍為不低于305(L)。,,2質(zhì)量控制,基本原理許多臨床檢驗(yàn)指標(biāo),當(dāng)影響某一指標(biāo)的隨機(jī)因素很多,而每個因素所起的作用均不太大時,這個指標(biāo)的隨機(jī)波動屬于隨機(jī)誤差,則往往服從正態(tài)分布。,質(zhì)量控制領(lǐng)域的“3Σ原則”其意義是指正常情況下檢測誤差服從正態(tài)分布,根據(jù)正態(tài)分布的曲線面積或概率分布理論可知,3Σ之外的觀察值出現(xiàn)的概率不到3‰,如果超過這一值,則提示測量或產(chǎn)品質(zhì)量有問題。統(tǒng)計(jì)學(xué)規(guī)定以X為中心線,X±2S為警戒線,X±3S為控制線,根據(jù)以上的規(guī)定還可以繪制出質(zhì)量控制圖。,,,中心線,警戒線,控制線,控制線,警戒線,3統(tǒng)計(jì)方法的理論基礎(chǔ)T分布、F分布、X2分布都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來的,U檢驗(yàn)也是以正態(tài)分布為基礎(chǔ)的。二項(xiàng)分布、POISSON分布的極限為正態(tài)分布,在一定條件下,可以按正態(tài)分布原理來處理。,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計(jì)描述分類變量的統(tǒng)計(jì)描述統(tǒng)計(jì)表統(tǒng)計(jì)圖,從數(shù)值資料的頻數(shù)表和頻數(shù)圖中雖可以看出觀察值的分布情況,但為了揭示數(shù)據(jù)的基本特征,還需用可量化指標(biāo)作進(jìn)一步的統(tǒng)計(jì)描述分析。數(shù)值資料的統(tǒng)計(jì)描述,它包括集中趨勢和離散趨勢的統(tǒng)計(jì)描述。,(一)集中趨勢的統(tǒng)計(jì)描述,描述數(shù)值資料集中趨勢的代表性指標(biāo)為平均數(shù)。平均數(shù)是反映一組觀察值變量值集中趨勢、中心位置或平均水平的重要統(tǒng)計(jì)指標(biāo),其主要作用包括①作為一組觀察值的代表值,表明該組觀察值集中趨勢的特征。②便于對同類研究對象進(jìn)行對比分析。,按使用條件和計(jì)算方法不同,平均數(shù)分為許多種。常用的有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)等。1算術(shù)均數(shù)ARITHMETICMEAN,簡稱均數(shù)MEAN,它等于所有觀察值之和除以觀察值的個數(shù)。表示一組性質(zhì)相同的觀察值在數(shù)量上的平均水平,適用于呈對稱分布,尤其是正態(tài)分布的數(shù)值資料的集中趨勢描述。如正常人生理、生化的大多數(shù)指標(biāo),如身高、體重、血紅蛋白含量、白細(xì)胞計(jì)數(shù)等均適合用均數(shù)描述其集中趨勢。總體均數(shù)用希臘字母Μ表示,樣本均數(shù)用X讀作XBAR表示。,,計(jì)算方法有兩種,,2幾何均數(shù)GEOMETRICMEAN,是N個數(shù)值乘積的N次方根,表示一組資料在比例或倍數(shù)上的平均,用G表示。適用于對數(shù)正態(tài)分布資料有些數(shù)值資料,原始數(shù)據(jù)不服從正態(tài)分布,若將數(shù)據(jù)轉(zhuǎn)換成對數(shù)后的資料服從正態(tài)分布和觀察值之間呈等比關(guān)系的資料。如某些疾病的潛伏期、抗體滴度或平均效價(jià)等。,SPSS計(jì)算幾何均數(shù),,,,,3中位數(shù)MEDIAN,將一組觀察值從小到大按順序排列,位次居中的觀察值就是中位數(shù),用M表示。它表示位次上的平均,不受兩端極值的影響。中位數(shù)適用于任何一種分布的數(shù)值變量資料,一般多用于描述偏態(tài)分布或數(shù)據(jù)一端或兩端無確切值的開口資料如N60的集中趨勢。,百分位數(shù)PERCENTILE是一個位置指標(biāo),用PX表示。把一組變量值由小到大依次排列,將位次平均分成100等份,與第X百分位數(shù)相應(yīng)的變量值稱為第X百分位數(shù)。一個百分位數(shù)可將一組變量值分為兩部分,理論上有NX個變量值比它小,有N1X個變量值比它大。所以百分位數(shù)是一個界值或分割值。百分位數(shù)常用于描述一組偏態(tài)分布的大樣本資料在某個百分位置上的水平及確定偏態(tài)分布資料的醫(yī)學(xué)正常值范圍。中位數(shù)是一個特定的百分位數(shù),即P50。計(jì)算百分位數(shù)的公式為,,,,百分位數(shù)示意圖,,,,,運(yùn)用平均數(shù)的注意事項(xiàng),1了解各醫(yī)學(xué)專業(yè)平均數(shù)的習(xí)慣用法。例如,兒童齲齒個數(shù)雖然呈偏態(tài)分布,但在口腔預(yù)防保健統(tǒng)計(jì)中,習(xí)慣上計(jì)算算術(shù)均數(shù)。2同一資料有時可能同時滿足幾個平均數(shù)指標(biāo)的應(yīng)用條件。例如,對于某些偏態(tài)分布的資料,幾何均數(shù)和中位數(shù)比較接近。出現(xiàn)這種情況時,除了專業(yè)上的習(xí)慣用法外,統(tǒng)計(jì)上的處理原則是如果均數(shù)與中位數(shù)接近、幾何均數(shù)與中位數(shù)接近,最終采用均數(shù)或幾何均數(shù)作為平均數(shù)指標(biāo)。反之,則采用中位數(shù)作為平均數(shù)指標(biāo)。3計(jì)算和運(yùn)用平均數(shù)時,要注意極端值的影響,如算術(shù)平均數(shù)受極端值的影響較大。為了正確反映觀察值的特征,當(dāng)存在過大或過小的極端值時,應(yīng)予以剔除,然后將其余數(shù)值計(jì)算平均數(shù)。通常稱這種去除極端值再平均的方法為切尾平均法。該法在文藝、體育比賽評分時應(yīng)用較多。4平均數(shù)只反映變量的集中趨勢,只有把平均指標(biāo)與變異指標(biāo)相結(jié)合,才能全面反映研究對象的數(shù)量特征。,(二)離散趨勢的統(tǒng)計(jì)描述,離散趨勢是反映一組觀察值之間參差不齊的程度,即變異度?!纠?9】有三組同齡男孩的身高值CM如下,其平均身高均為100CM,試分析其離散程度。甲組9095100105110甲的平均值100CM乙組9698100102104乙的平均值100CM丙組9699100101104丙的平均值100CM由資料可見,雖然三組的均數(shù)相同,即集中趨勢相同,但各組數(shù)據(jù)參差不齊的程度并不相同,即離散趨勢不同。所以要反映數(shù)值資料的整體特征,既要考慮集中趨勢,還要考慮離散趨勢。常用的離散趨勢指標(biāo)有極差、四分位數(shù)間距、方差和標(biāo)準(zhǔn)差、變異系數(shù)等。,1極差RANGE,R,又稱全距,是一組觀察值中最大值與最小值之差。適用于任何分布類型的資料(開口資料除外)。極差越大,說明變異程度越大。計(jì)算公式見式21用極差描述資料的離散趨勢雖然計(jì)算簡單,但除了最大值和最小值,不能反映組內(nèi)其他數(shù)據(jù)的變異,且易受極端值和樣本含量的影響,所以常用于資料的粗略估計(jì)和小樣本數(shù)據(jù)。,2四分位數(shù)間距,將全部觀察值按其位次分為四等份,有三個分點(diǎn)第一個分點(diǎn)是下四分位數(shù)即P25,常用QL表示;第二個分點(diǎn)即中位數(shù)M,記為P50,第三個分點(diǎn)也稱上四分位數(shù),即P75,常用QU表示。四分位數(shù)間距QUARTILCINTERVAL,Q即指上、下四分位數(shù)之差,用Q表示。四分位數(shù)間距示意圖,見圖25。,四分位數(shù)間距適用于任何分布類型的資料,尤其是呈偏態(tài)分布的大樣本資料,常與中位數(shù)一起描述偏態(tài)分布資料的分布特征。它作為描述數(shù)據(jù)分布離散程度的指標(biāo),比極差穩(wěn)定,但仍未考慮到每個數(shù)據(jù)的大小。,3方差和標(biāo)準(zhǔn)差,為了全面考察每個觀察值的變異情況,克服極差和四分位數(shù)間距的缺點(diǎn),需要計(jì)算總體中每個觀察值X與總體均數(shù)Μ的差值(XΜ),稱為離均差。由于?(XΜ)0時,不能反映變異度大小,需將離均差平方后再求和,即?(XΜ)2,稱為離均差平方和。同時考慮到觀察值個數(shù)N的影響,取其均數(shù),稱為總體方差,用?2表示,計(jì)算公式為,由于在實(shí)際研究中很難得到總體均數(shù)和總例數(shù),只能用樣本均數(shù)和樣本例數(shù)來代替,計(jì)算出樣本方差S2作為總體方差的估計(jì)值。為了克服S2對?2的有偏估計(jì),統(tǒng)計(jì)學(xué)家提出用N1代替N來校正,計(jì)算公式為,式中,N1稱為自由度DEGREEOFFREEDOM,統(tǒng)計(jì)符號為Ν,表示在計(jì)算某一統(tǒng)計(jì)量時可以自由取值的變量個數(shù)或觀察值個數(shù)。設(shè)某統(tǒng)計(jì)量的變量X共有N個取值,則VN;若它們受到K個條件限制K005表示符合正態(tài)分布,,,箱圖顯示最小值、最大值、第75、50、25百分位數(shù),及異常值。,4、統(tǒng)計(jì)分析時的描述輸出,描述統(tǒng)計(jì)是統(tǒng)計(jì)檢驗(yàn)的基礎(chǔ),所以任何統(tǒng)計(jì)分析方法,輸出統(tǒng)計(jì)推斷結(jié)論,輸出結(jié)果的同時,軟件系統(tǒng)自動會輸出主要的統(tǒng)計(jì)指標(biāo)。,,,,(四)數(shù)值變量的報(bào)告規(guī)范,,X±S算術(shù)均數(shù)±標(biāo)準(zhǔn)差,算術(shù)均數(shù)是一組呈正態(tài)分布的變量值的平均水平,代表集中趨勢,標(biāo)準(zhǔn)差代表離散趨勢。通過均數(shù)和標(biāo)準(zhǔn)差的大小關(guān)系,可以大致看出是否符合正態(tài)分布,進(jìn)而判斷出使用統(tǒng)計(jì)方法是否正確。,,(四)數(shù)值變量的報(bào)告規(guī)范,,,如何在WORD中寫出X,1、輸入英文小寫字母X,并將其改為斜體X,,,,如何在WORD中寫出X,2、選中X后,單擊菜單欄中的【格式】→【中文版式】→【拼音指南】,,如何在WORD中寫出X,3、在【拼音指南】對話框的【基準(zhǔn)文字】項(xiàng)可以看到X,在【拼音文字】項(xiàng)下第一行輸入“_”。,,,,如何在WORD中寫出X,,,G±GSD幾何均數(shù)±標(biāo)準(zhǔn)差,幾何均數(shù)可反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈正態(tài)分布的變量值在數(shù)量上的平均水平,在醫(yī)學(xué)研究中常適用于免疫指標(biāo)。,,MIN,MAX,最小、最大值相當(dāng)于報(bào)告數(shù)值的區(qū)間,如年齡1870歲。最小18,最大70。有助于發(fā)現(xiàn)離群值,或異常值。,M中位數(shù)QLQU(Q1Q3)四分位間距,中位數(shù)是將N個變量從小到大排序,位置居中的那個數(shù),適用于偏態(tài)和一端或兩端無確切值的資料。與之相適應(yīng)的統(tǒng)計(jì)圖為箱式圖,,,,,,MIN,MEDIAN,P75,MAX,P25,QL,QU,,,,,,,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計(jì)描述分類變量的統(tǒng)計(jì)描述統(tǒng)計(jì)表統(tǒng)計(jì)圖,分類資料是按研究對象的名義、類別或性質(zhì)清點(diǎn)數(shù)目而得,常見的數(shù)據(jù)形式是絕對數(shù)ABSOLUTENUMBER。絕對數(shù)指標(biāo)又稱總量指標(biāo),表示被描述對象的規(guī)模。廣義的絕對數(shù)指標(biāo)指總體變量值或標(biāo)志值之和;狹義的絕對數(shù)指標(biāo)通常指數(shù)值資料的合計(jì)值或分類資料的合計(jì)頻數(shù)。絕對數(shù)指標(biāo)的缺點(diǎn)是缺乏可比性。例如,甲、乙兩個醫(yī)院某病住院人數(shù)不同時,比較兩醫(yī)院該病的死亡人數(shù)沒有意義,需要在絕對數(shù)的基礎(chǔ)上計(jì)算相對數(shù)。相對數(shù)RELATIVENUMBER指標(biāo)是兩個有聯(lián)系的絕對數(shù)指標(biāo)數(shù)值之比形式表示。相對數(shù)指標(biāo)從數(shù)量上反映兩個相互關(guān)聯(lián)現(xiàn)象之間的對比關(guān)系或聯(lián)系強(qiáng)度,有助于分析和闡明研究現(xiàn)象的規(guī)律性。相對數(shù)的意義是將絕對數(shù)指標(biāo)轉(zhuǎn)換成基數(shù)相同的相對數(shù)指標(biāo)如每千人發(fā)病人數(shù)、每百例患者死亡人數(shù)等,以便相互比較。常用的相對數(shù)有率、構(gòu)成比和相對比等比例指標(biāo)。,一率率RATE是反映某現(xiàn)象的強(qiáng)度、密度和普遍程度的指標(biāo),特點(diǎn)是比例基數(shù)較靈活。,比例基數(shù)的選擇一是根據(jù)習(xí)慣用法,如患病率通常用百分率、嬰兒死亡率用千分率、腫瘤死亡率以十萬分率表示等;二是使計(jì)算的結(jié)果能保留12位整數(shù),以便閱讀。注意計(jì)算率時,分子必須是分母的一部分,而且通常先確定分母作為觀察對象,然后再在一定條件下清點(diǎn)某現(xiàn)象的實(shí)際發(fā)生數(shù),如陽性檢出率、治愈率、病死率等。當(dāng)分母較大時,比率近似等于概率。,【例215】某醫(yī)院2005年在某社區(qū)調(diào)查全部成年居民1379例,體檢發(fā)現(xiàn)高血脂癥患者為341例,則該社區(qū)成年居民高血脂癥患病率為341/1379X1002473。,1發(fā)病率INCIDENCERATE,IR,即在一定時期內(nèi),可能發(fā)生某病的人群中新發(fā)生某病的強(qiáng)度,可表示發(fā)病危險(xiǎn),常用于疾病危險(xiǎn)因素的探討和疾病防治效果的評價(jià)。計(jì)算公式為,特殊情況下,要注意分母中“可能發(fā)生某病”的含義,是指對某種疾病具有發(fā)病風(fēng)險(xiǎn)者,而不包括不可能發(fā)生某病者。以計(jì)算麻疹發(fā)病率為例,由于麻疹基本為終生免疫,故在計(jì)算分母時,應(yīng)除去已患過麻疹者。,2患病率PREVALENCERATE,PR,又稱為現(xiàn)患率,是指某時點(diǎn)上受檢人數(shù)中現(xiàn)患某種疾病的頻率,分為時點(diǎn)患病率POINTPREVALENCERATE和期間患病率PERIODPREVALENCERATE。計(jì)算公式為,與發(fā)病率分子的計(jì)算方法不同,患病率的分子中不僅包括某種疾病的新發(fā)病例“新病例”,還包括原有病例“舊病例”。,3死因別死亡率CAUSESPECIFLCDEATHRATE,CSDR,又稱某死因死亡率,是指由某種原因或疾病所導(dǎo)致的死亡率,主要用于死因分析,可反映各種病傷損害對居民生命健康的危害程度。計(jì)算公式為,4某病病死率(CASEFATALITYRATE,CFR,是在特定時間內(nèi)通常為1年某病患者中因該病而死亡者所占的百分比,亦用于死因分析,一方面反映某種疾病的嚴(yán)重程度,另一方面反映醫(yī)療質(zhì)量和水平。計(jì)算公式為,二構(gòu)成比,構(gòu)成比PROPORTION又稱百分比PERCENTAGE,用來說明事物內(nèi)部各構(gòu)成部分在整體中所占的比重。特點(diǎn)是以100為比例基數(shù),分子是分母的一部分,取值范圍為01。計(jì)算公式為,注意構(gòu)成比不能說明事物發(fā)生的頻率或強(qiáng)度。,【例216】辨證治療高血壓病176例,其中肝陽上亢型45例,肝陽上亢型占高血壓病5種中醫(yī)辨證分型的構(gòu)成比為45/1762557。,率與構(gòu)成比的區(qū)別,9/227,9/1045,三相對比,相對比RELATIVERATIO是兩個有關(guān)聯(lián)的指標(biāo)之比,特點(diǎn)是常以倍數(shù)或百分?jǐn)?shù)表示。計(jì)算公式為,式中,A、B分別表示兩個總量指標(biāo)。A和B可以是絕對數(shù)、相對數(shù)和平均數(shù),其量綱可以相同,也可不同,但A和B互不包含(如某人群中男女性別比)?!纠?17】某醫(yī)院用中西醫(yī)結(jié)合療法及西藥療法治療腦梗死的病死率分別為743和1621。則西藥療法的病死率為中西醫(yī)結(jié)合療法的218倍1621/743;或中西醫(yī)結(jié)合療法的病死率是西藥療法的4584。,四應(yīng)用注意事項(xiàng),1計(jì)算相對數(shù)應(yīng)有足夠數(shù)量即分母不宜過小,一般來說,樣本數(shù)量較多,計(jì)算的相對數(shù)可靠性也較大。當(dāng)觀察例數(shù)很少時N30例會使相對數(shù)波動較大,不宜計(jì)算率。在臨床試驗(yàn)中,各種偶然因素都可能導(dǎo)致計(jì)算結(jié)果的較大變化,因此例數(shù)很少的情況下最好用絕對數(shù)直接表示;否則,應(yīng)同時寫出其置信區(qū)間。,2正確區(qū)分率和構(gòu)成比構(gòu)成比只能說明某事物內(nèi)部各組成部分的比重或分布,不能說明該事物某一部分發(fā)生的強(qiáng)度與頻率。構(gòu)成比與率的區(qū)別在于①構(gòu)成比是對已有的觀察結(jié)果分類。例如,某醫(yī)院對胃潰瘍住院病人的職業(yè)按工人、農(nóng)民、干部和軍人進(jìn)行分析,得出工人患病率高、干部患病率低的結(jié)論是錯誤的,因?yàn)榇藭r只能得出職業(yè)所占的構(gòu)成比。②率則是在未知觀察結(jié)果的情況下先確定觀察對象。例如,將觀察對象先按職業(yè)分組,然后統(tǒng)計(jì)有無胃潰瘍,計(jì)算出工人的患病率、農(nóng)民患病率、干部的患病率、軍人的患病率。,3正確計(jì)算合計(jì)率對分組資料計(jì)算合計(jì)率或稱平均率時,不能簡單地由各組率相加或平均而得,而應(yīng)是各組分子之和與各組分母之和的比。例如,用某療法治療肝炎,甲醫(yī)院治療150例,治愈30例,治愈率為20。乙醫(yī)院治療100例,治愈30例,治愈率為30。兩個醫(yī)院合計(jì)治愈率應(yīng)該是3030/150100X10024。若計(jì)算為203050或(2030/225,則是錯的。,4資料的可比性在比較相對數(shù)時,除了要對比的因素如不同的藥物,其余的影響因素應(yīng)盡可能相同或相近。遵循均衡和隨機(jī)原則是資料可比性的重要保證。下列因素可能影響對比組之間的可比性L觀察對象是否同質(zhì)研究方法是否相同,觀察時間是否相等,地區(qū)、周圍環(huán)境、風(fēng)俗習(xí)慣和經(jīng)濟(jì)條件是否一致或相近等。,2觀察對象內(nèi)部結(jié)構(gòu)是否相同若兩組資料的年齡、性別等構(gòu)成不同,可以分別進(jìn)行同年齡別、同性別的小組率比較或?qū)偮屎嫌?jì)率進(jìn)行標(biāo)準(zhǔn)化后再作比較。3不同時期的資料客觀條件是否相同例如,在比較兩組病人的治愈率時,應(yīng)檢查各病例診斷標(biāo)準(zhǔn)是否一致等;居民因醫(yī)療普及,就診機(jī)會增加,或診斷技術(shù)提高,也會引起發(fā)病率“升高”。因此在分析討論時,應(yīng)根據(jù)各方面情形全面考慮,慎重對待。,5樣本率或構(gòu)成比的抽樣誤差不能僅憑數(shù)字表面相差大小下結(jié)論,應(yīng)進(jìn)行樣本率或構(gòu)成比差別的假設(shè)檢驗(yàn)。,N例數(shù),例數(shù),表示研究對象的數(shù)量。每一項(xiàng)研究,只要涉及到研究對象,例數(shù)是必不可少的、必須報(bào)告的統(tǒng)計(jì)指標(biāo)。,五分類資料的報(bào)告規(guī)范,頻數(shù),百分比,頻數(shù),表示分類資料各類別的例數(shù)。百分比,表示分類資料各類別的例數(shù)占總例數(shù)的百分比。當(dāng)小樣本資料時,不適宜計(jì)算百分比,而需用相對頻數(shù)來表示。,,,頻數(shù),百分比,,,,頻數(shù),百分比,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計(jì)描述分類變量的統(tǒng)計(jì)描述統(tǒng)計(jì)表統(tǒng)計(jì)圖,統(tǒng)計(jì)表,在科研或臨床工作中,將統(tǒng)計(jì)分析的事物及指標(biāo)用表格的形式列出稱為統(tǒng)計(jì)表。廣義上的統(tǒng)計(jì)表包括原始資料調(diào)查表、整理資料表、統(tǒng)計(jì)資料計(jì)算用表及表達(dá)結(jié)果的統(tǒng)計(jì)表。狹義上的統(tǒng)計(jì)表特指表達(dá)統(tǒng)計(jì)結(jié)果的報(bào)告表。,1、統(tǒng)計(jì)表的意義統(tǒng)計(jì)表用簡明的表格形式,有條理地羅列數(shù)據(jù)和統(tǒng)計(jì)量,方便閱讀、比較和計(jì)算。在統(tǒng)計(jì)描述過程中,統(tǒng)計(jì)表展示統(tǒng)計(jì)數(shù)據(jù)的結(jié)構(gòu)、分布和主要特征,便于在進(jìn)一步分析中選擇和計(jì)算統(tǒng)計(jì)量。在學(xué)術(shù)報(bào)告和論文中常用統(tǒng)計(jì)表代替冗長的文字?jǐn)⑹觯磉_(dá)主要研究結(jié)果、數(shù)據(jù)、指標(biāo)和統(tǒng)計(jì)量,方便讀者作比較和掌握主要研究結(jié)果。,2統(tǒng)計(jì)表的基本格式統(tǒng)計(jì)表的基本格式為三條線頂線、標(biāo)目線、底線、三部分標(biāo)題、標(biāo)目、數(shù)字,具有如此基本格式的表格通常簡稱為“三線”表格。,3統(tǒng)計(jì)表的基本結(jié)構(gòu)包括①表號②標(biāo)題③標(biāo)目④線條⑤數(shù)字⑥備注,4統(tǒng)計(jì)表的種類可分為簡單表和組合表。1簡單表SIMPLETABLE只按一個標(biāo)志或特征分組。,2組合表(COMBINATIVETABLE)又稱復(fù)合表,是按兩個或兩個以上的標(biāo)志或特征結(jié)合分組。表215是按性別、病程、年齡、突出部
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 192
大?。?8.25(MB)
子文件數(shù):
-
簡介:,,醫(yī)學(xué)統(tǒng)計(jì)學(xué)MEDICALSTATISTICS,醫(yī)學(xué)統(tǒng)計(jì)學(xué)講授內(nèi)容第一章緒論第二章計(jì)量資料的統(tǒng)計(jì)描述第三章總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)第四章多個樣本均數(shù)比較的方差分析第五章計(jì)數(shù)資料的統(tǒng)計(jì)描述第六章幾種離散型變量的分布及其應(yīng)用第七章檢驗(yàn)第八章秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)第九章雙變量回歸與相關(guān)第十章統(tǒng)計(jì)表與統(tǒng)計(jì)圖,第十一章多因素試驗(yàn)資料的方差分析第十二章重復(fù)測量設(shè)計(jì)資料的方差分析第十五章多元線性回歸分析第十六章LOGISTIC回歸分析第十七章生存分析第十八章判別分析第十九章聚類分析第二十三章常用綜合評價(jià)方法第二十四章量表研制與量表資料的統(tǒng)計(jì)分析方法,“非常痛心地看到,因?yàn)閿?shù)據(jù)分析的缺陷和錯誤,那么多好的生物研究工作面臨著被葬送的危險(xiǎn)”。FYATES,MJRHEALY,統(tǒng)計(jì)知識的運(yùn)用,撰寫論文報(bào)告自己觀察或?qū)嶒?yàn)的研究結(jié)果。,閱讀論文吸收新知識,了解學(xué)術(shù)進(jìn)展。,為什么要學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué),60年代到80年代,國外醫(yī)學(xué)雜志調(diào)查表明2072的論文有統(tǒng)計(jì)錯誤。1984年對中華醫(yī)學(xué)雜志、中華內(nèi)科雜志、中華外科雜志、中華婦產(chǎn)科雜志、中華兒科雜志595篇論文的調(diào)查結(jié)果為相對數(shù)誤用占112,抽樣方法誤用占159,統(tǒng)計(jì)圖表誤用占1171996年對4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會系列雜志占69),數(shù)據(jù)分析方法誤用達(dá)557。2001年中華預(yù)防醫(yī)學(xué)雜志中華醫(yī)學(xué)會系列雜志誤用約54(1995)。,1996年,有機(jī)構(gòu)對申報(bào)科技成果的4586篇科研論文分析,統(tǒng)計(jì)方法使用率為76。醫(yī)學(xué)論文中統(tǒng)計(jì)運(yùn)用錯誤,除了影響論文的科學(xué)性,還可能導(dǎo)致嚴(yán)重的倫理學(xué)問題。,為什么要學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué),英國統(tǒng)計(jì)學(xué)家RAFISHER(18901962)對遺傳學(xué)家MENDEL(18221884)雜交試驗(yàn)結(jié)果的評價(jià),MENDEL的豌豆雜交試驗(yàn)父本母本第一代YGYG第二代Y/YY/GG/YG/G,雜交試驗(yàn)結(jié)果綠色種子的頻率2001/8023期望值8023?0252006,標(biāo)準(zhǔn)差39PROP2001520115011,結(jié)合MENDEL歷次報(bào)告的其它實(shí)驗(yàn)結(jié)果,每次都有如此好的吻合的概率約10萬分之4。,為什么要學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué),緒論INTRODUCTION,講授內(nèi)容一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義二、統(tǒng)計(jì)學(xué)中的幾個基本概念三、統(tǒng)計(jì)資料的類型四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義,1統(tǒng)計(jì)學(xué)(STATISTICS)應(yīng)用數(shù)學(xué)的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學(xué),對不確定性數(shù)據(jù)作出科學(xué)的推斷。2醫(yī)學(xué)統(tǒng)計(jì)學(xué)(STATISTICSOFMEDICINE)統(tǒng)計(jì)學(xué)的原理與方法應(yīng)用于醫(yī)學(xué)科研與實(shí)踐。,一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義,3統(tǒng)計(jì)學(xué)方法的特點(diǎn)1用數(shù)量反映質(zhì)量1體格檢查量血壓、脈搏)→個體健康質(zhì)量2)考試分?jǐn)?shù)→個體學(xué)習(xí)質(zhì)量3期望壽命反映人群健康狀況的指標(biāo)4嬰兒死亡率反映衛(wèi)生服務(wù)質(zhì)量的指標(biāo),一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義,2用群體歸納個體請同學(xué)們回答2002年長沙市7歲男孩有多高,17歲男孩身高有高有矮2N100,平均身高1195CM95的長沙市7歲男孩的身高在11020CM12920CM之間,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,1、研究單位(觀察單位、UNIT)和變量VARIABLE)、變量值(VALUEOFVARIABLE)(1)、研究單位(UNIT)研究中的個體(INDIVIDUAL),是根據(jù)研究目的確定的。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,例如研究7歲男孩身高的正常值范圍一個人研究大學(xué)生視力一只眼睛研究水污染情況一毫升水研究細(xì)胞變性一個細(xì)胞研究肝癌的地區(qū)分布一個地區(qū),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(2)變量VARIABLE)研究單位的研究特征。例如研究7歲男孩身高的正常值范圍變量身高(3)變量值(VALUEOFVARIABLE),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,變量值(VALUEOFVARIABLE)變量的觀察結(jié)果。例如研究7歲男孩身高變量值測得的身高值(1202CM,1186CM,1218CM,研究某人群性別構(gòu)成變量值男、女。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,2、同質(zhì)(HOMOGENEITY)和變異(VARIATION)(1)、同質(zhì)(HOMOGENEITY)根據(jù)研究目的給研究單位確定的相同性質(zhì)。研究長沙市2004年7歲男孩身高的正常值范圍同質(zhì)同長沙市、同7歲、同男孩、同無影響身高的疾病。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(2)、變異(VARIATION)變異(VARIATION)同質(zhì)研究單位中變量值間的差異。例如1)長沙市2004年7歲男孩身高有高有矮2)相同的藥方治療相同的疾病的病人,療效有好有壞,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,3、總體(POPULATION)和樣本(SAMPLE)(1)、總體(POPULATION)是根據(jù)研究目的確定的同質(zhì)研究單位的全體。更確切地說是同質(zhì)研究單位某種變量值的集合。例如調(diào)查某地2002年正常成年男子的紅細(xì)胞數(shù)的正常值范圍,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,研究單位一個人變量紅細(xì)胞數(shù)同質(zhì)同某地、同2002年、同成年男子、同正常??傮w1)某地所有的正常成年男子2)某地所有的正常成年男子的紅細(xì)胞數(shù),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,1)有限總體(FINITEPOPULATION)研究單位數(shù)是有限的例如調(diào)查某地2002年正常成年男子的紅細(xì)胞數(shù)的正常值范圍2)無限總體(INFINITEPOPULATION)研究單位數(shù)是無限的例如高血壓患者←無時間、空間限制。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(2)樣本(SAMPLE)是總體中抽取的有代表性的一部分。注意隨機(jī)抽樣(無主觀性)樣本含量(SAMPLESIZE)樣本中包含的研究單位數(shù)。例如某藥治療高血壓患者30名樣本含量(N)為30,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,4、參數(shù)(PARAMETER)和統(tǒng)計(jì)量(STATISTIC)(1)參數(shù)(PARAMETER)根據(jù)總體個體值統(tǒng)計(jì)計(jì)算出來的描述總體的特征量。一般用希臘字母表示(2)、統(tǒng)計(jì)量(STATISTIC)根據(jù)樣本個體值統(tǒng)計(jì)計(jì)算出來的描述樣本的特征量。一般用拉丁字母表示,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,總體參數(shù)一般是不知道的統(tǒng)計(jì)學(xué)抽樣研究的目的就是樣本統(tǒng)計(jì)量→總體參數(shù),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,5、系統(tǒng)誤差(SYSTEMATICERROR)、非系統(tǒng)誤差(NONSYSTEMATICERROR)、抽樣誤差(SAMPLINGERROR)誤差(ERROR)是指實(shí)際觀察值與觀察真值之差、樣本指標(biāo)與總體指標(biāo)之差。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(1)、系統(tǒng)誤差(SYSTEMATICERROR)由于儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。例如測量血糖,有斑氏法和葡萄糖氧化法,斑氏法的測量結(jié)果偏高←易受體內(nèi)還原性物質(zhì)的影響。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,這類誤差可以通過實(shí)驗(yàn)設(shè)計(jì)和技術(shù)措施來消除或使之減少。觀察性研究由于組間不可比性產(chǎn)生的系統(tǒng)誤差稱為偏倚(BIAS),如吸煙組的平均年齡大于吸煙組,兩組死亡率的差異包含年齡偏倚。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(2)、非系統(tǒng)誤差(NONSYSTEMATICERROR)由于研究者偶然失誤而造成的誤差。例如儀器失靈、抄錯數(shù)據(jù)、點(diǎn)錯小數(shù)點(diǎn)、寫錯單位等,亦稱過失誤差(GROSSERROR)這類誤差應(yīng)當(dāng)通過認(rèn)真檢查核對予以清除,否則將會影響研究結(jié)果的準(zhǔn)確性。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(3)、抽樣誤差(SAMPLINGERROR)由于抽樣所造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差別。例如?1200CMN100N5萬→1186CM特點(diǎn)1不可避免性2有統(tǒng)計(jì)規(guī)律性,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,產(chǎn)生原因個體差異生物變異,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,6、頻率(RELATIVEFREQUENCY)、概率(PROBABILITY)、小概率事件.(1)、頻率(RELATIVEFREGUENCY)一次隨機(jī)試驗(yàn)有幾種可能結(jié)果,在重復(fù)進(jìn)行試驗(yàn)時,個別結(jié)果看來是偶然發(fā)生的,但當(dāng)重復(fù)試驗(yàn)次數(shù)相當(dāng)多時,將顯現(xiàn)某種規(guī)律性。例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種,現(xiàn)在,我們看一擲幣模擬試驗(yàn),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,實(shí)驗(yàn)者投擲次數(shù)出現(xiàn)“正面”次數(shù)頻率HUPINGCHENG1110000HUPINGCHENG2000000HUPINGCHENG3206667HUPINGCHENG4307500HUPINGCHENG5306000HUPINGCHENG6204000HUPINGCHENG7405714BUFFON4040204805069KPEARSON12000601905016KPEARSON240001201205005,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,可見,在相同條件下重復(fù)試驗(yàn),試驗(yàn)結(jié)果為“正面”或“反面”雖不能事先斷定,但我們知道試驗(yàn)的所有可能結(jié)果只有兩種。在重復(fù)多次后,出現(xiàn)“正面”或“反面”這個結(jié)果的比例稱之為頻率。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,.2、概率(PROBABILITY)概率是度量隨機(jī)事件發(fā)生可能性大小的一個數(shù)值。設(shè)在相同條件下,獨(dú)立地重復(fù)N次試驗(yàn),隨機(jī)事件A出現(xiàn)次,則稱為隨機(jī)事件A出現(xiàn)的頻率。當(dāng)N逐漸增大時,頻率趨向于一個常數(shù),則稱該常數(shù)為隨機(jī)事件A的概率,可記為P(A),簡記為。0≤P(A)≤1,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,0<P(A)<1隨機(jī)事件P(A)1必然事件P(A)0不可能事件。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,頻率是就樣本而言的,而概率從總體的意義上說的,M/N是概率P(A)的估計(jì)值。試驗(yàn)次數(shù)越多,估計(jì)越可靠。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(3)小概率事件統(tǒng)計(jì)分析中的很多結(jié)論都基于一定置信程度下的概率推斷,習(xí)慣上將稱為小概率事件,我們認(rèn)為小概率事件在一次試驗(yàn)中不可能發(fā)生。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,湖南風(fēng)采中獎概率大約為1/671萬交通事故發(fā)生概率為1/20萬,三、統(tǒng)計(jì)資料的類型,變量與統(tǒng)計(jì)資料的分類方法1概述2數(shù)值變量NUMERICALVARIABLE和計(jì)量資料MEASUREMENTDATA3無序分類變量UNORDEREDCATEGORIESVARIABLE和計(jì)數(shù)資料ENUMERATIONDATA4有序分類變量ORDINALCATEGORIESVARIABLE和等級資料RANKEDDATA,三、統(tǒng)計(jì)資料的類型,1概述數(shù)值變量構(gòu)成計(jì)量資料分類變量無序分類變量構(gòu)成計(jì)數(shù)資料有序分類變量構(gòu)成等級資料,,,三、統(tǒng)計(jì)資料的類型,2數(shù)值變量與計(jì)量資料1數(shù)值變量NUMERICALVARIABLE變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如身高CM、體重KG、血壓PA、坐高/身高。2計(jì)量資料MEASUREMENTDATA由一群個體的數(shù)值變量值構(gòu)成的資料,即一群變量值。如長沙市99年7歲男孩身高值(1202CM,1186CM,1218CM,三、統(tǒng)計(jì)資料的類型,3無序分類變量與計(jì)數(shù)資料1無序分類變量UNORDEREDCATEGORIESVARIABLE變量值是定性的,有類別。特點(diǎn)類別是客觀存在的,各類無秩序,可任意排列;類與類之間界限清楚,(理論上不會錯判。如性別男、女。血型O、A、B、AB。2計(jì)數(shù)資料ENUMERATIONDATA一群個體按無序分類變量的類別清點(diǎn)每類有多少個個體,即分類個體數(shù)。如衛(wèi)生統(tǒng)計(jì)學(xué)教研室教師性別構(gòu)成男6,女7。某人群血型構(gòu)成O20A35B30AB10,三、統(tǒng)計(jì)資料的類型,4有序分類變量與等級資料1有序分類變量ORDINALCATEGORIESVARIABLE變量值是定性的、分等級。特點(diǎn)等級是主觀劃分的,各級沒有大小但有秩序,必須從低到高或由高到低;級和級之間界限模糊,可能錯判。如療效無效、好轉(zhuǎn)、顯效、治愈。血清反應(yīng)–、、、2等級資料RANKEDDATA一群個體按有序分類變量的級別清點(diǎn)每級有多少個個體,即分級個體數(shù)。如某地某人群EB病毒抗體反應(yīng)–65231,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,1、設(shè)計(jì)(DESIGN)專業(yè)設(shè)計(jì)統(tǒng)計(jì)設(shè)計(jì)調(diào)查設(shè)計(jì)醫(yī)學(xué)科研設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)臨床實(shí)驗(yàn)設(shè)計(jì),,,醫(yī)學(xué)科研設(shè)計(jì)的程序,科研選題選題又叫立題,確定所要研究的問題。選題是科研的起點(diǎn),也是關(guān)系到成敗的關(guān)鍵。(1)題意產(chǎn)生綜述背景材料來源個人經(jīng)驗(yàn)的積累;向有關(guān)專家請教;文獻(xiàn)檢索等,專業(yè)設(shè)計(jì),文獻(xiàn)檢索的要點(diǎn),1)有助于認(rèn)識本課題的重要性(2)了解有關(guān)的既往研究工作情況(3)了解有關(guān)研究現(xiàn)狀(4)尋找可借鑒的研究方法(5)注意有關(guān)的不同見解與爭論。如與商榷類文章,專業(yè)設(shè)計(jì),文獻(xiàn)檢索的幾種查法,(1)先查國內(nèi)文獻(xiàn),再查國外文獻(xiàn)(2)先查綜述性文章,后原始文章。(3)先近期后遠(yuǎn)期(4)先核心期刊后一般期刊。,專業(yè)設(shè)計(jì),綜述性文章是收集大量文獻(xiàn)資料經(jīng)過分析綜合,結(jié)合自己的工作和體會整理成的文章。它是對某一課題或新進(jìn)展作出的總結(jié),并指明發(fā)展方向,有較大的參考價(jià)值,是專題性文獻(xiàn)資料最集中的表現(xiàn)形式。,專業(yè)設(shè)計(jì),科研選題的原則,(1)創(chuàng)新性包括探索和創(chuàng)新兩個連續(xù)的過程,創(chuàng)新就是選擇前人沒有解決或沒有完全解決的問題。是本學(xué)科的空白點(diǎn),或者將會在理論上或應(yīng)用上有新的發(fā)展和補(bǔ)充。(2)科學(xué)性以科學(xué)理論為指導(dǎo),符合客觀規(guī)律。(3)先進(jìn)性先進(jìn)性是相對的,有國際先進(jìn)和國內(nèi)先進(jìn)。更重要的是結(jié)合實(shí)際條件選擇適合的先進(jìn)技術(shù)。(4)可行性研究課題的主要技術(shù)指標(biāo)實(shí)現(xiàn)的可能性。它包括人、財(cái)、物的支持和工作基礎(chǔ)。,專業(yè)設(shè)計(jì),選題方法,(1)從招標(biāo)范圍中選題。(2)從碰到的問題中選題(3)從文獻(xiàn)的空白點(diǎn)選題(4)從已有的課題延伸中選題(5)從改變研究內(nèi)容組合中選題(6)從其他學(xué)科移植中選題。,專業(yè)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,統(tǒng)計(jì)設(shè)計(jì)的內(nèi)容要包括資料的收集、整理和分析全過和的設(shè)想和安排。例如研究目的和假說研究對象和研究單位研究因素(變量)收集哪些原始資料用什么方式和方法取得這些原始資料怎樣整理匯總和計(jì)算統(tǒng)計(jì)指標(biāo)如何控制誤差預(yù)期會得到什么結(jié)果需要多少經(jīng)費(fèi),統(tǒng),統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,在研究者對統(tǒng)計(jì)設(shè)計(jì)的構(gòu)思過程中,有以下幾個問題最為關(guān)鍵如何進(jìn)行抽樣如何安排設(shè)計(jì)所規(guī)定的干預(yù)措施或稱處理(TREATMENT)。要達(dá)到研究目的應(yīng)抽取多少個觀察單位如何在諸多的影響因素中,分離出研究同素對結(jié)果的效應(yīng),統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,(1)、對照的原則對照(CONTROL)原則,即在均衡條件下實(shí)現(xiàn)實(shí)驗(yàn)組與對照組間科學(xué)對比的原則,它回答如何從諸多影響因素中,分離出研究因素對實(shí)驗(yàn)結(jié)果的效應(yīng)問題。所謂均衡性,即可比性,是指在對比組中,除研究因素不同外,或施加的處理不同外,其他影響實(shí)驗(yàn)結(jié)果的非研究因素,包括實(shí)驗(yàn)過程中的實(shí)驗(yàn)條件和輔助措施,都應(yīng)相同。,統(tǒng)計(jì)設(shè)計(jì),無對照的研究夸大了門腔分流手術(shù)的作用表12關(guān)于門腔分流手術(shù)的51次研究結(jié)果對照方式門腔分流手術(shù)的價(jià)值小計(jì)非常支持支持不支持無對照247132非隨機(jī)對照103215隨機(jī)對照0134合計(jì)3411651,統(tǒng)計(jì)設(shè)計(jì),,統(tǒng)計(jì)學(xué)家STUDENT1930年2月至6月主持的牛奶營養(yǎng)試驗(yàn)的現(xiàn)場觀察研究對照組(1萬兒童)飲奶組(1萬兒童),,對照組飲奶組,年齡(歲),體重(磅),結(jié)論對照組體重>飲奶組,統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,(2)、重復(fù)(REPETITION)的原則重復(fù)(REPETITION)原則,即確定樣本含量的原則,它回答至少應(yīng)抽取多少個觀察單位的問題。,統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,(3)、隨機(jī)化(RANDOMIZATION)的原則1)、隨機(jī)抽樣(RANDOMIZEDSAMPLING)指總體中的每一個觀察單位都有同等機(jī)會進(jìn)入樣本;2)、隨機(jī)分配(RANDOMIZEDALLOCATION)指本次研究所選定的實(shí)驗(yàn)受試對象都有同等機(jī)會進(jìn)入根據(jù)研究目的而設(shè)定的處理組和對照組。,統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,2、收集資料(COLLECTIONOFDATA)(1)資料來源第一手資料1)經(jīng)常性統(tǒng)計(jì)報(bào)表(傳染病報(bào)表、職業(yè)病報(bào)表、醫(yī)院工作報(bào)表、死亡登記、疫情報(bào)告等),工作記錄(衛(wèi)生監(jiān)督記錄、健康檢查記錄、病歷等);2)一時性專題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。第二手資料已公布的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計(jì)資料。,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,(2)、資料要求1).完整觀察單位及觀察項(xiàng)目完整。2)準(zhǔn)確即真實(shí)、可靠。真實(shí)是統(tǒng)計(jì)學(xué)的靈魂。3).及時即時限性。如人口普查規(guī)定調(diào)查開始日期和截止日期。,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,3、整理(SORTINGDATA)資料整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過程。,DATACOLLECTION,DATAANALYSIS,THEISSUESSHOULDBECONCERNEDINDATASCREENING,THEACCURACYOFTHEDATAMISSINGDATAOUTLIERSTHEFITBETWEENYOURDATAANDTHEASSUMPTIONSPERFECTORNEARPERFECTCORRELATIONSAMONGVARIABLES,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,4、分析(ANALYSISOFDATA)資料任務(wù)計(jì)算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特征、闡明事物的內(nèi)在聯(lián)系和規(guī)律。工具1)FOXBASE數(shù)據(jù)庫2)SPSSFORWINDOWS1103)SAS,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,統(tǒng)計(jì)描述統(tǒng)計(jì)分析統(tǒng)計(jì)推斷參數(shù)估計(jì)假設(shè)檢驗(yàn),,,五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)研究的是群體的數(shù)量特征↑適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)2、學(xué)會統(tǒng)計(jì)學(xué)的思維方法抽樣研究→抽樣誤差→結(jié)論具有概率性↑醫(yī)學(xué)專業(yè)知識解釋,五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,3、正確選用統(tǒng)計(jì)學(xué)方法(1)資料類型不同→統(tǒng)計(jì)學(xué)方法不同(2)設(shè)計(jì)類型不同→統(tǒng)計(jì)學(xué)方法不同(3)研究目的不同→統(tǒng)計(jì)學(xué)方法不同,五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,4、不管公式來源、推導(dǎo),只要求了解其意義、用途和應(yīng)用條件。舉例1)看電視,知道開、關(guān)就行。2)牛吃的是草,擠出來的是牛奶?!鼣?shù)據(jù)結(jié)果,THANKYOU,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 67
大?。?1.52(MB)
子文件數(shù):
-
簡介:第十六章LOGISTIC回歸分析,暨南大學(xué)醫(yī)學(xué)院醫(yī)學(xué)統(tǒng)計(jì)教研室林漢生,內(nèi)容,LOGISTIC回歸的概念應(yīng)用舉例預(yù)備知識OR值與RR值LOGISTIC回歸對資料的要求模型的建立與變量篩選LOGISTIC回歸分析的結(jié)果表達(dá)LOGISTIC回歸應(yīng)用的注意事項(xiàng)LOGISTIC回歸的應(yīng)用LOGISTIC回歸的種類LOGISTIC回歸分析資料主要來源,一、LOGISTIC回歸的概念,在醫(yī)學(xué)研究中經(jīng)常遇到應(yīng)變量為二項(xiàng)分類的資料,如治愈與未愈、生存與死亡、發(fā)病與未發(fā)病等,可以概括為陽性與陰性兩種互斥的結(jié)果,同時可能存在對分類結(jié)果發(fā)生概率產(chǎn)生影響的因素即自變量。研究1個二分類觀察結(jié)果與多個影響因素之間關(guān)系的多變量分析方法。,二、應(yīng)用舉例,探討疾病發(fā)生的危險(xiǎn)因素、篩選與疾病預(yù)后有關(guān)的因素、綜合多個指標(biāo)進(jìn)行診斷試驗(yàn),等。如非胰島素依賴型糖尿病的危險(xiǎn)因素分析301例急性心肌梗死病人急性期預(yù)后因素的LOGISTIC模型分析運(yùn)動試驗(yàn)LOGISTIC回歸分析對冠心病的診斷價(jià)值,三、預(yù)備知識OR值與RR值,預(yù)備知識OR值,OR值(ODDSRATIO)比值比或優(yōu)勢比比值(ODDS)是指某事物發(fā)生的概率與不發(fā)生的概率之比。病例組和對照組有暴露史與無暴露史的概率分別為A/AB,B/ABA/BC/CD,D/CDC/DOR(A/B)/(C/D)(AD)/(BC)(76?44)/(10?40)836出生時有窒息缺氧史兒童,發(fā)生低智的危險(xiǎn)是對照兒童的836倍(要經(jīng)過假設(shè)檢驗(yàn))。,OR值與RR值,RR(RELATIVERISK)暴露人群發(fā)病率P1與非暴露人群發(fā)病率P0之比。當(dāng)P1和P0都很小時,OR值接近RR值。RR1說明暴露越多,發(fā)病越多,可能是致病因素;RR1說明暴露越少,發(fā)病越少,可能是抑制發(fā)病因素。,四、LOGISTIC回歸對資料的要求,Y取值0,1X1,X2,X3,,XM的取值計(jì)數(shù)、計(jì)量和等級資料。,五、模型的建立與變量篩選,將回歸效果顯著的自變量選入模型,不顯著的自變量則排除在模型外,使建立的模型比較穩(wěn)定和便于解釋。,,,實(shí)習(xí)指導(dǎo)例題,例某研究人員在探討腎細(xì)胞癌轉(zhuǎn)移的有關(guān)臨床病理因素研究中,收集了一批行根治性腎切除患者的腎癌標(biāo)本資料,現(xiàn)從中抽取26例資料作為示例進(jìn)行LOGISTIC回歸分析。,有關(guān)符號意義說明如下,I標(biāo)本序號X1確診時患者年齡X2腎細(xì)胞血管內(nèi)皮生長因子,分3個等級X3腎細(xì)胞癌組織內(nèi)微血管數(shù)X4腎癌細(xì)胞核組織學(xué)分級,分4級X5腎細(xì)胞癌分期,分4期Y腎細(xì)胞癌轉(zhuǎn)移情況(1轉(zhuǎn)移;0無轉(zhuǎn)移),1SPSS的數(shù)據(jù)工作表,2SPSS的操作步驟ANALYZE?REGRESSION?BINARYLOGISTIC,LOGISTICREGRESSION對話框,將Y選入DEPENDENT欄,X1X5選入COVARIATE欄,選擇FORWARDLR法。單擊OPTIONS按鈕。,OPTIONS對話框,單擊CONTINUE按鈕,單擊OK按鈕,3SPSS的結(jié)果與分析(1)數(shù)據(jù)基本情況,數(shù)據(jù)基本情況為26例納入分析,沒有缺失值,,(2)0步時的分析結(jié)果,,變量篩選第0步的SCORE檢驗(yàn)結(jié)果,可作為單變量LOGISTIC回歸分析的結(jié)果。如進(jìn)行單變量LOGISTIC回歸分析,在?005水準(zhǔn),變量X2、X4和X5有統(tǒng)計(jì)學(xué)意義。,,,,(3)擬合優(yōu)度用決定系數(shù)R2描述,(4)分類表只有1個分錯類,即觀察值為0類,而預(yù)測值為1類,Y的觀察值和預(yù)測值的符合情況觀測值為0時(腎癌未轉(zhuǎn)移),預(yù)測的準(zhǔn)確率為941;觀測值為1時(腎癌轉(zhuǎn)移),預(yù)測的準(zhǔn)確率為1000;總的預(yù)測準(zhǔn)確率為962。該指標(biāo)可以評價(jià)LOGISTIC模型的擬合優(yōu)度。,(5)模型中的變量,B回歸系數(shù)。當(dāng)其他變量保持不變時,XJ每增加或減少1個單位時,OR值自然對數(shù)的平均變化量。EXPBOR值(經(jīng)校正的,或調(diào)整的OR值,ADJUSTEDODDSRATIO)SE回歸系數(shù)的標(biāo)準(zhǔn)誤WALD值對回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)的統(tǒng)計(jì)量,最重要的結(jié)果,選入模型的變量X2和X4的OR值都大于1,故等級越高,腎癌轉(zhuǎn)移的風(fēng)險(xiǎn)越大??傮wOR值的95可信區(qū)間太寬,提示例數(shù)太少??梢詫2和X4的取值代入下式,計(jì)算腎癌轉(zhuǎn)移的可能性。判斷的截?cái)帱c(diǎn)默認(rèn)為050,大于050,則預(yù)測為腎癌轉(zhuǎn)移(分類表中的結(jié)果)。,(6)未引入模型的變量,沒有引入模型的變量,最小的P值為0197。即使將引入變量的檢驗(yàn)水準(zhǔn)放寬到010,也不能引入新變量。,,多因素LOGISTIC回歸分析結(jié)果,該表可以改進(jìn)嗎,表1腎細(xì)胞癌轉(zhuǎn)移的多因素LOGISTIC回歸分析,表1腎細(xì)胞癌轉(zhuǎn)移的多因素LOGISTIC回歸分析,小結(jié),用多因素LOGISTIC回歸分析的似然比前進(jìn)法篩選變量,引入變量的檢驗(yàn)水準(zhǔn)為?010。在所研究的5個有關(guān)臨床病理因素中,入選模型的因素有2個腎細(xì)胞血管內(nèi)皮生長因子表達(dá)等級是腎細(xì)胞癌轉(zhuǎn)移的危險(xiǎn)因素(經(jīng)校正的OR值為1117,95CI為10711645,P0044);腎癌細(xì)胞核組織學(xué)分級也是腎細(xì)胞癌轉(zhuǎn)移的危險(xiǎn)因素(經(jīng)校正的OR值為814,95CI為0976862,P0054)。,六、LOGISTIC回歸分析的結(jié)果表達(dá),賦值表單因素分析多因素分析,例162(P339),為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素,對26例冠心病病人和28例對照者進(jìn)行病例對照研究,各因素的說明及資料見表。試用LOGISTIC回歸分析方法篩選危險(xiǎn)因素。,冠心病危險(xiǎn)因素的病例-對照調(diào)查資料,表1冠心病的相關(guān)因素與賦值,(一)相關(guān)因素與賦值,(二)單因素分析,單獨(dú)分析每個自變量X與應(yīng)變量Y是否有關(guān)聯(lián)。檢驗(yàn)水準(zhǔn)可以放寬到010。對單因素有統(tǒng)計(jì)學(xué)意義的變量,進(jìn)行多因素LOGISTIC回歸分析。當(dāng)某個自變量有缺失值時,不影響對其它自變量進(jìn)行分析??梢苑治雒總€自變量與應(yīng)變量的關(guān)聯(lián)對自變量進(jìn)行初步篩選,為多因素分析做準(zhǔn)備。當(dāng)例數(shù)較少,而自變量較多,缺失值較多時,初步篩選更有必要。,單因素分析方法,無序分類資料卡方檢驗(yàn)有序分類資料卡方檢驗(yàn)中的線性趨勢檢驗(yàn)計(jì)量資料T檢驗(yàn)每次引入1個自變量進(jìn)行LOGISTIC回歸分析(任意類型資料)當(dāng)缺失值沒有或很少時,逐步多因素LOGISTIC回歸0步時的分析結(jié)果(任意類型資料),1卡方檢驗(yàn),Y?COLUMNS,CHISQUARE?卡方檢驗(yàn)RISK?求OR值或RR值,列聯(lián)表及行百分?jǐn)?shù),8個變量,例數(shù)54,無缺失值,年齡等級資料;病例組與對照組的年齡構(gòu)成,線性趨勢檢驗(yàn)?zāi)挲g與冠心病的發(fā)病呈線性關(guān)系(?2=568,P=0017)等級資料,不能計(jì)算OR值,A型性格與冠心病OR2115/13521/13/5/15485,,?2=682,P=0009OR485142,1651,表中的因素都是2分類變量,如果是計(jì)量資料,則百分率改為,?2改為T,2每次引入1個自變量進(jìn)行LOGISTIC回歸分析,OR為485,95CI為142~1651,P0012,SCORE統(tǒng)計(jì)量的結(jié)果與卡方檢驗(yàn)一致WALD統(tǒng)計(jì)量的結(jié)果與卡方檢驗(yàn)很接近,3當(dāng)缺失值沒有或很少時,逐步多因素LOGISTIC回歸0步時的分析結(jié)果,結(jié)果,沒有缺失值,SCORE統(tǒng)計(jì)量的結(jié)果與卡方檢驗(yàn)一致(無缺失值的情況下),(三)多因素分析,篩選獨(dú)立的自變量進(jìn)入模型例如,動物脂肪攝入和體重指數(shù)在單因素分析都有統(tǒng)計(jì)學(xué)意義,但多因素分析時,只有動物脂肪攝入這個因素被引入模型。說明動物脂肪攝入與體重指數(shù)可能有聯(lián)系,動物脂肪攝入提供的信息取代了體重指數(shù)。,,多因素LOGISTIC回歸分析結(jié)果,,結(jié)果簡潔清楚,七、LOGISTIC回歸應(yīng)用的注意事項(xiàng),危險(xiǎn)因素分析時,將計(jì)量指標(biāo)轉(zhuǎn)變?yōu)榈燃壔蚨诸愔笜?biāo)(如年齡,腫瘤轉(zhuǎn)移的淋巴結(jié)個數(shù)),使OR值的實(shí)際意義明確。無序分類變量的賦值方法啞變量樣本含量經(jīng)驗(yàn)上,病例和對照的人數(shù)應(yīng)至少各有30~50例。,SPSS中啞變量的設(shè)置,CATEGORICAL按鈕的使用,例(P352),1352名少年兒童肥胖癥危險(xiǎn)因素調(diào)查資料肥胖癥無;有(根據(jù)體重指數(shù)BMI劃分)性別男;女年齡組79歲;1012歲;1315歲;16歲及以上膽固醇低;高甘油三脂低;高,數(shù)據(jù)文件,多因素LOGISTIC回歸分析,年齡的OR值為0782,什么含義,,CROSSTAB肥胖發(fā)生風(fēng)險(xiǎn)并非隨年齡增加而減少??梢?~9歲年齡組為參照,7~9歲年齡組為參照單擊CATEGORICAL,選擇FIRST17~9歲年齡組,單擊CHANGE,單擊CONTINUE,單擊OK,啞變量自動生成FREQUENCY是分層的數(shù)目,總共有64層,其中有7層的例數(shù)為0,,,,,,,結(jié)果解釋,年齡的參照組為7~9歲年齡組1的OR值為253,P=0001。即在校正了其它因素后,10~12歲兒童患肥胖癥的風(fēng)險(xiǎn)是7~9歲兒童的252倍。13~15歲和16歲及以上兒童患肥胖癥的風(fēng)險(xiǎn)與7~9歲兒童比較,差異無統(tǒng)計(jì)學(xué)意義。性別的OR值為0607(1男性;2女性)甘油三酯的OR值為202(1低;2高),是每個年齡組都是男性肥胖率高于女性嗎,,八、LOGISTIC回歸的應(yīng)用,篩選疾病預(yù)后或發(fā)生的有關(guān)因素診斷模型的建立校正混雜因素如臨床試驗(yàn)數(shù)據(jù)分析當(dāng)評價(jià)指標(biāo)為二值變量(有效,無效),非處理因素在試驗(yàn)組和對照組中分布可能不均衡時??梢岳肔OGISTIC回歸分析得到調(diào)整后的藥物評價(jià)結(jié)果。YGROUP年齡病情(0無效;1有效)1常規(guī)療法;2新療法)(不均衡),九、LOGISTIC回歸的種類,非條件LOGISTIC回歸分析簡稱LOGISTIC回歸分析,即前面介紹的內(nèi)容,應(yīng)用最廣泛。條件LOGISTIC回歸分析為消除混雜因素對研究結(jié)果的影響,對每1例病人選擇1至數(shù)例在混雜因素的暴露水平上相一致的,合乎研究條件的,未患病的人作為對照,共同組成一個匹配組。統(tǒng)計(jì)分析按匹配組進(jìn)行。多項(xiàng)分類LOGISTIC回歸分析有序多分類LOGISTIC回歸分析,十、LOGISTIC回歸分析資料主要來源,回顧性資料(研究開始前病歷等資料已經(jīng)存在,但可能不完整)前瞻性資料(可按設(shè)計(jì)要求收集臨床和實(shí)驗(yàn)室數(shù)據(jù))現(xiàn)況研究(橫斷面研究在某一特定人群中,調(diào)查收集特定時間內(nèi)某種疾病的患病情況及其有關(guān)因素)如“醫(yī)學(xué)高校知識分子高血壓及相關(guān)危險(xiǎn)因素LOGISTIC分析”;“山西省居民高血壓患病情況及危險(xiǎn)因素調(diào)查”病例對照研究如“山東省大腸癌影響因素病例對照研究”,“宮頸癌危險(xiǎn)因素的病例對照研究”(罕見疾病的病因研究),作業(yè),簡答題P3501,2,3,4,5上機(jī)練習(xí)實(shí)習(xí)十八LOGISTIC回歸P339例162,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 77
大?。?0.84(MB)
子文件數(shù):
-
簡介:醫(yī)學(xué)統(tǒng)計(jì)學(xué)(7),,兩個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)多個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)配對樣本比較的非參數(shù)檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)多個樣本比較的非參數(shù)檢驗(yàn),診斷試驗(yàn)ROC曲線分析,基于秩次的非參數(shù)檢驗(yàn),非參數(shù)檢驗(yàn)又稱為任意分布檢驗(yàn),這類方法并不依賴總體分布的具體形式,應(yīng)用時可以不考慮研究變量為何種分布以及分布是否已知,進(jìn)行的不是參數(shù)之間的檢驗(yàn),故稱非參數(shù)檢驗(yàn)。,基本特點(diǎn)與分布無關(guān)基本方法Χ2檢驗(yàn)基于秩等級,RANK的方法基于特定參照點(diǎn)(如中位數(shù))的方法,非參數(shù)檢驗(yàn)的優(yōu)點(diǎn),①適用范圍廣②受限條件少。參數(shù)檢驗(yàn)對總體分布等有特別限定,而非參數(shù)檢驗(yàn)的假定條件少,也不受總體分布的限制,更適合一般的情況。③具有穩(wěn)健性。參數(shù)檢驗(yàn)是建立在嚴(yán)格的假設(shè)條件基礎(chǔ)之上的,一旦不符合假設(shè)條件,其推斷的正確性將受到懷疑;而非參數(shù)檢驗(yàn)都是帶有最弱的假定,所受的限制很少,穩(wěn)健性好。,①對符合用參數(shù)檢驗(yàn)的資料,如用非參數(shù)檢驗(yàn),會丟失部分信息。②雖然非參數(shù)檢驗(yàn)計(jì)算簡便,但有些問題的計(jì)算仍顯繁冗。,非參數(shù)檢驗(yàn)的缺點(diǎn),已知總體分布類型,對未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷,,依賴于特定分布類型,比較的是參數(shù),,參數(shù)檢驗(yàn)(PARAMETRICTEST),非參數(shù)檢驗(yàn)(NONPARAMETRICTEST),對總體的分布類型不作嚴(yán)格要求,,不受分布類型的影響,比較的是總體分布位置,,優(yōu)點(diǎn)方法簡便、易學(xué)易用,易于推廣使用、應(yīng)用范圍廣;可用于參數(shù)檢驗(yàn)難以處理的資料如等級資料,或含數(shù)值“50MG”等,,缺點(diǎn)方法比較粗糙,對于符合參數(shù)檢驗(yàn)條件者,采用非參數(shù)檢驗(yàn)會損失部分信息,其檢驗(yàn)效能較低;樣本含量較大時,兩者結(jié)論常相同,,應(yīng)用非參數(shù)檢驗(yàn)的情況,1不滿足正態(tài)和方差齊性條件的小樣本資料;2總體分布類型不明的小樣本資料;3一端或兩端是不確定數(shù)值(如<0002、>65等)的資料(必選);4單向(雙向)有序列聯(lián)表資料;5各種資料的初步分析。,方法的起點(diǎn)--排隊(duì)與秩次,統(tǒng)計(jì)描述中排秩思想的成功應(yīng)用百分位數(shù)、中位數(shù)排隊(duì)的優(yōu)點(diǎn)廣泛適用于多種分布排隊(duì)的結(jié)果將原始數(shù)據(jù)的比較轉(zhuǎn)化為秩次的比較,秩次RANK將數(shù)值變量值從小到大,或等級變量值從弱到強(qiáng)所排列的序號。例111只大鼠存活天數(shù)存活天數(shù)4,10,7,50,3,15,2,9,13,60,60例29名肺炎病人的治療結(jié)果療效治愈治愈死亡無效治愈有效治愈有效無效,秩次3649281571011105105,平均秩次25259752555255575,秩次129735468,,SPSS中的菜單位置,,兩個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)多個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)配對樣本比較的非參數(shù)檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)多個樣本比較的非參數(shù)檢驗(yàn),診斷試驗(yàn)ROC曲線分析,基于秩次的非參數(shù)檢驗(yàn),1.建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)ΑH0兩總體分布相同H1兩總體分布不同Α005。,2.編秩按數(shù)值由小到大排列,若有相同數(shù)據(jù),取平均秩。,分析步驟,基本思想,兩樣本來自同一總體,任一組秩和不應(yīng)太大或太小,,假定兩組樣本的總體分布形狀相同,T與平均秩和應(yīng)相差不大,,3.計(jì)算秩和,確定檢驗(yàn)統(tǒng)計(jì)量秩和T值,當(dāng)N110或(N2N1)10時,則可采用正態(tài)近似法求U(Z)值來確定P值,其公式如下,4.確定P值和作出推斷結(jié)論當(dāng)N1146,PΑT在界值范圍外P3或NI5時,H值的分布近似于自由度為K1的Χ2分布,此時可查Χ2界值表得到P值。最后按P值作出推斷結(jié)論。,分析步驟,【例3】比較小白鼠接種三種不同菌型傷寒桿菌9D、11C和DSC1后存活日數(shù),結(jié)果見表。問小白鼠接種三種不同菌型傷寒桿菌的存活日數(shù)有無差別,P1CDFCHISQ997,2,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步非參數(shù)檢驗(yàn),,第四步結(jié)果解讀,結(jié)果解讀X29940,P0007,,,【例4】四種疾病患者痰液內(nèi)嗜酸性白細(xì)胞的檢查結(jié)果見表。問四種疾病患者痰液內(nèi)的嗜酸性白細(xì)胞有無差別,P1CDFCHISQ1552,3,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步加權(quán)個案,第四步非參數(shù)檢驗(yàn),,第五步結(jié)果解讀,結(jié)果解讀X215506,P0001,,,【例5】某臨床藥理基地觀察5組接受不同治療的婦科病人,結(jié)果見表。問5組療效有無差別,P1CDFCHISQ19550,4,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步加權(quán)個案,第四步非參數(shù)檢驗(yàn),,第五步結(jié)果解讀,結(jié)果解讀X2195504,P0000,,,,兩個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)多個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)配對樣本比較的非參數(shù)檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)多個樣本比較的非參數(shù)檢驗(yàn),診斷試驗(yàn)ROC曲線分析,基于秩次的非參數(shù)檢驗(yàn),配對設(shè)計(jì)差值比較的符號秩和檢驗(yàn)由WILCOXON1945年提出,又稱WILCOXON符號秩和檢驗(yàn),常用于檢驗(yàn)差值的總體中位數(shù)是否等于零。,(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)HO差值總體中位數(shù)MD0H1差值總體中位數(shù)MD≠0Α005,分析步驟,(2)編秩求差值編秩方法依差值的絕對值從小到大編秩。編秩時注意兩點(diǎn)遇差值為0者,舍去不計(jì),N相應(yīng)減少差值的絕對值相等,符號不同者應(yīng)取平均秩次編秩后,按差值的正負(fù)給秩次冠上符號。,(3)求差值為正或負(fù)的秩和差值為正的秩和以T表示差值為負(fù)的秩和以T表示。TTNN1/2TMIN(T,T)(4)確定P值和作出推斷結(jié)論當(dāng)N≤50時,查T界值表T在界值范圍內(nèi)PΑT在界值范圍外P50,可采用正態(tài)近似法,計(jì)算U值。,正態(tài)近似法,若相同秩次較多,應(yīng)作校正計(jì)算。Z或式中,TJ為第J(J1,2,)個相同差值的個數(shù)。,正態(tài)近似法,【例6】對10名患者分別用甲法與乙法,測得血汞值。問兩種方法的結(jié)果有無差別,,N1019,TMIN265,185185N9P005,,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步非參數(shù)檢驗(yàn)(1),第三步非參數(shù)檢驗(yàn)(2),第四步結(jié)果解讀(1),結(jié)果解讀例數(shù)、均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、四分位間距等。標(biāo)準(zhǔn)差較大,第四步結(jié)果解讀(2),結(jié)果解讀Z0474,P0635,,,【例7】對12份血清分別用原方法(檢測時間20分鐘)和新方法(檢測時間10分鐘)測谷丙轉(zhuǎn)氨酶,結(jié)果見表。問兩法所得結(jié)果有無差別,,,TMIN545,115115N11P005,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步非參數(shù)檢驗(yàn)(1),第三步非參數(shù)檢驗(yàn)(2),第四步結(jié)果解讀(1),結(jié)果解讀例數(shù)、均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、四分位間距等。標(biāo)準(zhǔn)差較大,第四步結(jié)果解讀(2),結(jié)果解讀Z1913,P0056,,,,兩個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)多個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)配對樣本比較的非參數(shù)檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)多個樣本比較的非參數(shù)檢驗(yàn),診斷試驗(yàn)ROC曲線分析,基于秩次的非參數(shù)檢驗(yàn),隨機(jī)區(qū)組設(shè)計(jì)資料比較,如果觀察結(jié)果不滿足方差分析條件,可用FRIEDMAN檢驗(yàn)(FRIEDMANTEST)。,1建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)2編秩先在每一配伍組內(nèi)將數(shù)據(jù)從小到大編秩,如有相同數(shù)據(jù),取平均秩次;再求各處理組秩和RI,I1,2,,G。,分析步驟,3計(jì)算檢驗(yàn)統(tǒng)計(jì)量M值(1)查表法N≤15,G≤15MΣ(RJR)2(RΣRJ/G)M界值表基于Χ2分布近似法得到Χ2值查有關(guān)的Χ2界值表(2)Χ2分布近似法,分析步驟,,自由度為(G1),當(dāng)各區(qū)組間出現(xiàn)相同秩次時,需進(jìn)行校正,校正公式為,,,B為區(qū)組個數(shù),K為處理組個數(shù),4.確定P值和作出推斷結(jié)論,【例8】8名受試對象在相同實(shí)驗(yàn)條件下分別接受4種不同頻率聲音的刺激,他們的反應(yīng)率()資料見表。問4種頻率聲音刺激的反應(yīng)率是否有差別,,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步非參數(shù)檢驗(yàn)(1),第三步非參數(shù)檢驗(yàn)(2),第四步結(jié)果解讀(1),結(jié)果解讀例數(shù)、均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、四分位間距等。,第四步結(jié)果解讀(2),結(jié)果解讀X215152,P0002,,,一個討論案例,【例9】某中醫(yī)醫(yī)院采用中西醫(yī)結(jié)合方法治療228例不同病情的腦卒中患者,療效情況如下表。,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步加權(quán)個案,1、不同病情的腦卒中患者,療效有無差別,第三步秩和檢驗(yàn),,第四步結(jié)果解讀,結(jié)果解讀X224319,P0000,,,2、腦卒中患者病情與療效有無相關(guān),第三步等級相關(guān)分析,,,第四步結(jié)果解讀,結(jié)果解讀RS0311,P0000,,3、腦卒中患者病情與療效變化趨勢如何,第三步線性趨勢檢驗(yàn)(1),第三步線性趨勢檢驗(yàn)(2),輸出4種卡方檢驗(yàn)結(jié)果1、PEARSON卡方2、卡方值的校正值3、似然比卡方,一般用于對數(shù)線性模型。4、FISHER的精確檢驗(yàn),,線性趨勢檢驗(yàn),第四步結(jié)果解讀,結(jié)果解讀X221797,P0000,,線性趨勢檢驗(yàn),計(jì)量資料線性回歸等級有序資料線性趨勢檢驗(yàn)基本原則將X2值進(jìn)行分解,將總變異分為線性回歸分量和偏離線性回歸分量。,,,總變異,線性回歸分量,,兩個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)多個獨(dú)立樣本比較的非參數(shù)檢驗(yàn)配對樣本比較的非參數(shù)檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)多個樣本比較的非參數(shù)檢驗(yàn),診斷試驗(yàn)ROC曲線分析,基于秩次的非參數(shù)檢驗(yàn),診斷試驗(yàn)的概念,評價(jià)某種疾病診斷方法的臨床試驗(yàn)。診斷試驗(yàn)的用途診斷疾病篩選無癥狀的病人判斷疾病的嚴(yán)重程度估計(jì)疾病臨床過程及預(yù)后估計(jì)對治療的反應(yīng)判斷治療效果,,,金標(biāo)準(zhǔn),目標(biāo)人群,,病人,非病人,,,,,,,,,,,,,,,待評價(jià)診斷方法,,,,,評價(jià)指標(biāo),診斷試驗(yàn)原理,+,-,+,-,確定金標(biāo)準(zhǔn),當(dāng)前醫(yī)學(xué)界公認(rèn)的診斷某疾病最可靠、準(zhǔn)確度最高的診斷方法。常用的金標(biāo)準(zhǔn)包括病理學(xué)診斷(活檢、尸檢)外科手術(shù)或診斷性操作特殊的影像學(xué)診斷權(quán)威機(jī)構(gòu)頒布的綜合診斷標(biāo)準(zhǔn),選擇研究對象,要求代表性好、盲法試驗(yàn)組經(jīng)金標(biāo)準(zhǔn)確診為某疾病的患者,具有反應(yīng)該疾病的全部特征,如病情、病程、癥狀體征、并發(fā)癥、治療或未治療等。對照組經(jīng)金標(biāo)準(zhǔn)證實(shí)未患該疾病的患者(可患其它疾?。┗蛘H?。,診斷試驗(yàn)結(jié)果表,診斷試驗(yàn)的評價(jià)指標(biāo),基本指標(biāo)靈敏度、特異度、誤診率、漏診率預(yù)測值陽性預(yù)測值、陰性預(yù)測值綜合評價(jià)指標(biāo)正確率、約登指數(shù)、優(yōu)勢比、似然比陽性似然比、陰性似然比,靈敏度(SENSITIVITY,SE)計(jì)算公式SEA/AC又稱真陽性率將實(shí)際有病的人正確判斷為患者的能力漏診率(OMISSIONDIAGNOSTIC,?)計(jì)算公式?C/AC又稱假陰性率將實(shí)際有病的人錯誤判斷為非患者的比例,高靈敏度試驗(yàn)的適用范圍漏診可能造成嚴(yán)重后果排除某病的其他診斷篩檢無癥狀病人而且該病發(fā)病率較低,特異度(SPECIFICITY,SP)計(jì)算公式SPD/BD又稱真陰性率將實(shí)際無病的人正確判斷為非患者的能力誤診率(MISTAKEDIAGNOSTICRATE,?)計(jì)算公式?B/BD又稱假陽性率將實(shí)際無病的人錯誤判斷為患者的比例,高特異度試驗(yàn)的適用范圍假陽性會使病人受到嚴(yán)重危害確診某病,靈敏度和特異度的關(guān)系,都是反映診斷試驗(yàn)準(zhǔn)確性的最基本指標(biāo)提高一方面水平,會降低另一方面水平一般選擇敏感度和特異度都較高的試驗(yàn)作為診斷依據(jù)根據(jù)研究目的,調(diào)整靈敏度和特異度來確定臨界值以產(chǎn)生漏診和誤診之和最小時的數(shù)據(jù)確定臨界值,ROC曲線評價(jià)方法,受試者工作特征曲線(RECEIVEROPERATORCHARACTERISTICCURVE,簡稱ROC曲線)表示一個特定的診斷方法對區(qū)別特定的患者組與非患者組樣本的檢測性能。表示不同診斷水平的真陽性率對假陽性率的函數(shù)關(guān)系。,受試者工作特征曲線RECEIVEROPERATINGCHARACTERISTICCURVE,ROC,1080604020020406081,,,,,,,,,,,,,,,,完全無價(jià)值的診斷試驗(yàn)其ROC曲線與機(jī)會線重合,而ROC曲線越偏離機(jī)會線,ROC曲線下面積就越大,則診斷試驗(yàn)的真實(shí)性也就越好。,ROC曲線評價(jià)方法,以靈敏度和假陽性率為兩個軸的取值作的圖性;通常用于測定值為連續(xù)或等級數(shù)據(jù);常用于確定最佳臨界值,也可用于比較兩種和兩種以上診斷試驗(yàn)的診斷價(jià)值。以試驗(yàn)靈敏度為Y軸,以假陽性率為X軸,由不同決策界值產(chǎn)生圖中各個點(diǎn),采用線段連接圖中所有的點(diǎn),繪制而成的線圖。圖中反映了隨著靈敏度的增加,假陽性率也隨之增加。,ROC曲線的特點(diǎn),綜合了靈敏度和特異度兩個指標(biāo);不受患病率的影響;考慮了所有可能的診斷臨界值的影響;全面客觀地評價(jià)診斷試驗(yàn)的準(zhǔn)確性;描述了診斷試驗(yàn)區(qū)分事件發(fā)生與不發(fā)生的固有能力。,ROC曲線下的面積,AREAUNDERCURVE,簡稱AUC以點(diǎn)0,0、1,0、0、1和1,1圍成的面積做為1或100%。ROC曲線和X軸圍成的面積占總面積的百分比作為曲線面積的估計(jì)值。ROC曲線下面積的取值在0~1之間。,曲線越接近左上角,面積越接近1,說明試驗(yàn)的準(zhǔn)確度越高;越接近對角線,越接近05,則說明試驗(yàn)的準(zhǔn)確度越差;一般認(rèn)為面積在05~07之間時診斷價(jià)值較低,在07~09之間時診斷價(jià)值中等,在09以上時診斷價(jià)值較高。,ROC曲線下的面積,最佳診斷界值的確定,ROC曲線上最靠近左上角的點(diǎn)所對應(yīng)的靈敏度和特異度都是較大的,該點(diǎn)為ROC曲線的正切線與曲線相交的點(diǎn),常以此點(diǎn)所對應(yīng)的診斷界值作為最佳診斷界值。靈敏度特異度最大的點(diǎn)就是最佳診斷界值。通過解擬合ROC曲線的方程尋找該點(diǎn)。,,A.理想的正常人群與糖尿病病人血糖水平分布B.現(xiàn)實(shí)的正常人群與糖尿病病人血糖水平分布,采用不同血糖陽性界值所致假陽性和假陰性,,病人與非病人某項(xiàng)診斷指標(biāo)數(shù)值分布示意圖,,ROC分析,ROC分析主要做三件事計(jì)算ROC曲線下面積及其95CI繪制ROC曲線圖尋找截?cái)帱c(diǎn)(CUTOFF),【例10】為評價(jià)紅細(xì)胞平均容積(MCV)對缺鐵性貧血患者的診斷價(jià)值,以100例可疑為缺鐵性貧血患者作診斷,并以骨髓診斷作為金標(biāo)準(zhǔn)。將金標(biāo)準(zhǔn)確診為缺鐵性貧血的34例作為病例組,其余66例作為對照組。然后對每組的每一例測量紅細(xì)胞平均容積(MCV)。,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步ROC分析(1),,,,第四步初步結(jié)果,第五步ROC分析(2),,第六步結(jié)果解讀(1),結(jié)果解讀基本的例數(shù)描述,第六步結(jié)果解讀(2),結(jié)果解讀ROC曲線圖,第六步結(jié)果解讀(3),結(jié)果解讀ROC曲線下面積大小及統(tǒng)計(jì)學(xué)意義,,,,ROC曲線下面積的臨床意義,小于07,表示診斷準(zhǔn)確度較低;0709,表示診斷準(zhǔn)確度為中等;大于09,表示診斷準(zhǔn)確度較高。,第六步結(jié)果解讀(4),結(jié)果解讀給出不同截?cái)帱c(diǎn)的靈敏度和1特異度大小。,截?cái)帱c(diǎn)(CUTOFF)的選擇,在該截?cái)帱c(diǎn)下作的診斷誤診率與漏診率之和為最?。换蜢`敏度與特異度之和最大。,第七步尋找截?cái)帱c(diǎn)(1),將SPSS結(jié)果復(fù)制到EXCEL中,,第七步尋找截?cái)帱c(diǎn)(2),利用EXCEL的函數(shù)功能進(jìn)行計(jì)算(靈敏度特異度)的值,,第七步尋找截?cái)帱c(diǎn)(3),按照(靈敏度特異度)由大到小排序,,第七步尋找截?cái)帱c(diǎn)(4),按照(靈敏度特異度)由大到小排序。(靈敏度特異度)值最大的點(diǎn)所對應(yīng)的MCV結(jié)果值就是截?cái)帱c(diǎn)值。本例815就是所要找的截?cái)帱c(diǎn)。,,兩條ROC曲線的比較,可信區(qū)間法計(jì)算兩條曲線AUC的可信區(qū)間如果兩個可信區(qū)間有重合部分,則表示兩種方法診斷價(jià)值的差異無統(tǒng)計(jì)學(xué)意義;反之則AUC值大的那種方法的價(jià)值更高。,謝謝,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 155
大?。?5.71(MB)
子文件數(shù):
-
簡介:醫(yī)學(xué)統(tǒng)計(jì)學(xué)(11),META分析,第二部分,,生存分析,第一部分,,,,生存分析,第一部分,在醫(yī)學(xué)研究中,常常用追蹤的方式來研究事物發(fā)展的規(guī)律。如了解某藥物的療效,了解手術(shù)的存活時間,了解某醫(yī)療儀器設(shè)備使用壽命等等。,生存資料的特點(diǎn),1包含有結(jié)局和時間兩個方面的信息。2結(jié)局資料一般為二分類資料,即結(jié)局是兩對立相互排斥的事件,如生存與死亡、有效與無效等。3生存資料一般需經(jīng)過前瞻性隨訪觀察才能獲得,隨訪往往從某統(tǒng)一的時點(diǎn)開始,到某規(guī)定的時點(diǎn)結(jié)束,所以生存資料有時也稱為隨訪資料。4由于失訪等原因使一些研究對象的生存時間難判斷,導(dǎo)致部分生存時間數(shù)據(jù)不完整。,生存資料的數(shù)據(jù)類型,按觀察對象生存時間的完整性可分為兩種類型。1完全數(shù)據(jù)指觀察起點(diǎn)到發(fā)生結(jié)局事件的時間明確、完整的資料,即具有明確完整生存時間的數(shù)據(jù)。2截尾數(shù)據(jù)指由于其他因素非研究因素導(dǎo)致觀察對象的生存時間難以明確判斷,這種生存時間數(shù)據(jù)稱為截尾數(shù)據(jù)。也稱為截尾值、刪失值或終檢值。不論截尾數(shù)據(jù)的產(chǎn)生原因?yàn)楹危匚采鏁r間的計(jì)算均為觀察起點(diǎn)至截尾點(diǎn)所經(jīng)歷的時間,而且一般情況下其準(zhǔn)確的生存時間要長于截尾時間,常在此類數(shù)據(jù)的右上角標(biāo)記“”。,生存分析基本概念,起始事件是反映生存時間起始特征的事件,如疾病確診、某種疾病治療開始、接觸毒物等。在生存分析隨防研究過程中,一部分研究對象可觀察到死亡,可以得到準(zhǔn)確的生存時間,它提供的信息是完全;這種事件稱為失效事件,也稱之為死亡事件、終點(diǎn)事件。,生存時間(SURVIVALTIME是指任何兩個有聯(lián)系事件之間的時間間隔,常用T表示。狹義的生存時間指患某疾病的病人從發(fā)病到死亡所經(jīng)歷的時間跨度,廣義的生存時間定義為從某種起始事件到終點(diǎn)事件所經(jīng)歷的時間跨度。,如急性白血病病人從治療開始到復(fù)發(fā)為止之間的緩解期,冠心病病人兩次發(fā)作之間的時間間隔,戒煙開始到重新吸煙之間的時間間隔,接觸危險(xiǎn)因素到發(fā)病的時間間隔等。生存分析中最基本的問題就是計(jì)算生存時間,要明確規(guī)定事件的起點(diǎn)、終點(diǎn)及時間的測度單位,否則就無法分析比較。,中位生存時間是指壽命中位數(shù),表示有且只有50的觀察對象還可以活這么長時間。由于截尾數(shù)據(jù)的存在,中位生存期的計(jì)算不同于普通的中位數(shù),它可以利用生存函數(shù)公式或生存曲線圖,令生存率為50時,推算出生存時間。,生存函數(shù)生存概率又稱為生存率或生存函數(shù),它表示一個病人的生存時間長于時間T的概率,用ST表示。以時間T為橫坐標(biāo),ST為縱坐標(biāo)所作的曲線稱為生存率曲線,它是一條下降的曲線,下降的坡度越陡,表示生存率越低或生存時間越短,其斜率表示死亡速率。,死亡函數(shù)表示死亡速率的大小。如以T為橫坐,F(xiàn)T為縱坐標(biāo)作出的曲線稱為密度曲線,由曲線上可看出不同時間的死亡速率及死亡高峰時間??v坐標(biāo)越大,其死亡速率越高,如曲線呈現(xiàn)單調(diào)下降,則死亡速率越來越小,如呈現(xiàn)峰值,則為死亡高峰。,生存分析的主要內(nèi)容1描述生存過程(估計(jì)生存函數(shù))2比較生存過程(比較生存函數(shù))3影響生存時間的因素分析,SPSS中的菜單位置,生存率的估計(jì)方法有參數(shù)法和非參數(shù)法。常用非參數(shù)法,非參數(shù)法主要有二個,即乘積極限法與壽命表法。乘積極限法,又稱KAPLANMEIER法,主要用于觀察例數(shù)較少(N1,危險(xiǎn)因素X4為緩解出院后的鞏固治療(0無,1有),RR|T|95CONFINTERVALSLOPE|4270146286694149019730995581163985BIAS|0547229947982006095623821432491589,META分析,,系統(tǒng)綜述和META分析的基本概念系統(tǒng)綜述的基本步驟介紹META分析,軟件操作REVMAN,REVMAN軟件是COCHRANE國際協(xié)作網(wǎng)制作和保存COCHRANE系統(tǒng)評價(jià)的一個程序,由北歐COCHRANE中心制作和更新,是COCHRANE系統(tǒng)評價(jià)的一體化、標(biāo)準(zhǔn)化軟件。該軟件的主要特點(diǎn)可制作和保存COCHRANE系統(tǒng)評價(jià)的計(jì)劃書和全文;可對錄入的數(shù)據(jù)進(jìn)行META分析并將森林圖的分析結(jié)果以圖表形式展示;可對COCHRANE系統(tǒng)評價(jià)進(jìn)行更新。,HTTP//IMSCOCHRANEORG/REVMAN/DOWNLOAD,,也可以在OA上下載安裝后使用,,賬號密碼,1熟悉界面(1),,1熟悉界面(2),,,干預(yù)評價(jià),,診斷試驗(yàn)評價(jià),,方法學(xué)評價(jià),,同類系統(tǒng)評價(jià),,1熟悉界面(3),1熟悉界面(3),菜單欄,工具欄,文章結(jié)構(gòu),正文,,摘要,,,概要,語言更通俗,可供免費(fèi)下載,,背景和目的,,研究方法,,研究結(jié)果,,討論,2撰寫正文標(biāo)題,,2撰寫正文作者,,雙擊,1若已經(jīng)注冊,則登錄ARCHIE作者數(shù)據(jù)庫調(diào)出信息;2還沒注冊,則手動輸入信息,2撰寫正文作者,,,2撰寫正文時間,2撰寫正文摘要、方法、結(jié)果、討論,3從NE數(shù)據(jù)庫中導(dǎo)出文獻(xiàn),,4導(dǎo)入文獻(xiàn)到REVMAN,,4導(dǎo)入文獻(xiàn)到REVMAN,,,,,4畫流程圖,,,4畫流程圖,5META分析1,,,5META分析1,5META分析2,,二分類變量RR/OR/HR/RD,,,,期望方差法,一般倒方差法,連續(xù)型變量加權(quán)均數(shù)WMD、標(biāo)準(zhǔn)化均差SMD,5META分析2,,,,分類資料,小概率事件、實(shí)驗(yàn)組和對照組樣本量嚴(yán)重不平衡,分類資料,較為穩(wěn)健,應(yīng)用廣泛,,連續(xù)型變量資料,,,5META分析3,,,,,,5META分析4,,,5META分析5,,LOWORUNCLEARRISK,HIGHRISK,,5META分析5,,,,5META分析5,,,5META分析5,5META分析5,,,,5META分析5,5META分析5,,,,,謝謝,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 178
大?。?7.13(MB)
子文件數(shù):
-
簡介:MEDICALSTATISTICS醫(yī)學(xué)統(tǒng)計(jì)學(xué),童新元中國人民解放軍總醫(yī)院2005年10月12日,供臨床醫(yī)學(xué)碩士研究生教學(xué)用,面對復(fù)雜的醫(yī)學(xué)問題怎樣處理,“當(dāng)人類科學(xué)探索者在問題的叢林中遇到難以逾越的障礙時,唯有統(tǒng)計(jì)工具可為其開辟一條前進(jìn)的通道”。英國著名遺傳學(xué)家GALTON18221911,為何開設(shè)醫(yī)學(xué)統(tǒng)計(jì)課,講課的內(nèi)容,統(tǒng)計(jì)學(xué)學(xué)科發(fā)展概論醫(yī)學(xué)統(tǒng)計(jì)學(xué)課程按排醫(yī)學(xué)統(tǒng)計(jì)學(xué)學(xué)習(xí)方法醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)知識,一、統(tǒng)計(jì)學(xué)概論漫談”統(tǒng)計(jì)”,1什么是統(tǒng)計(jì),日常生活中,我們常聽到很多關(guān)于“統(tǒng)計(jì)”的詞匯例如國家統(tǒng)計(jì)局公布,2004年全國GDP增長9國家氣象局預(yù)報(bào),明天北京天氣陰,降水概率40,報(bào)刊統(tǒng)計(jì)信息文摘,2003年,北京市人平壽命7793歲,嬰兒死亡率為556‰,兒童計(jì)劃免疫接種率98這些主要健康指標(biāo)已接近或超過中等發(fā)達(dá)國家的水平北京日報(bào)京報(bào)網(wǎng),2003年11月20,常遇見的統(tǒng)計(jì)問題,癌癥病人不做手術(shù)或做術(shù)后能生存多久新藥的用量、用法如何,療效怎樣判定吸煙對人類的危害到底多大我考取醫(yī)學(xué)研究生的機(jī)會多大考試合格的可能性多大,典型統(tǒng)計(jì)案例1,,時間2004年11月2日,總統(tǒng)大選中的統(tǒng)計(jì)學(xué)從2004年美國總統(tǒng)大選談“統(tǒng)計(jì)”,總統(tǒng)大選記事,2004年總統(tǒng)角逐已作為一場耗時最長、花錢最多的總統(tǒng)選戰(zhàn)而載入歷史。,時間從9月30日至11月2日費(fèi)用50億美元,誰會當(dāng)總統(tǒng),主要候選人共和黨布什,民主黨克里和獨(dú)立候選人納德爾,誰當(dāng)總統(tǒng)由選民投票決定參加投票選民12億,在投票前很多人和集團(tuán)想知道,誰會當(dāng)總統(tǒng),以便支持誰,民調(diào)許多公司在選舉開始前進(jìn)行調(diào)查,“民調(diào)”有多準(zhǔn),在美國總統(tǒng)大選中,決定民調(diào)可靠程度的關(guān)鍵是抽樣調(diào)查的人數(shù)和對象。,在美國一個可靠的全國性調(diào)查將對1000名至3000名可能投票的選民進(jìn)行調(diào)查,抽樣誤差不超過3。,,2004年美國總統(tǒng)大選,CNN的選民信息是采取科學(xué)的統(tǒng)計(jì)抽樣方法,深入全國每一個縣(州取得。盡量保證統(tǒng)計(jì)模型與真實(shí)情況吻合。,2004年美國總統(tǒng)大選三人角逐2004年10月31日,選舉最后結(jié)果,候選人選舉人票百分比布什286票53克里252票47,大選中四種主要人物,候選人總統(tǒng)與副總統(tǒng)合格選民參加投票新聞記者文字描寫與推測統(tǒng)計(jì)學(xué)家數(shù)據(jù)管理與分析,大選及民調(diào)中的統(tǒng)計(jì)學(xué)問題,一、統(tǒng)計(jì)設(shè)計(jì)總體與樣本、樣本的大小怎樣抽樣、抽樣誤差二、數(shù)據(jù)管理和質(zhì)量控制如何搜集數(shù)據(jù)、整理數(shù)據(jù)、系統(tǒng)誤差、過失誤差、質(zhì)量控制方法三、數(shù)據(jù)分析數(shù)據(jù)描述(投票率)、統(tǒng)計(jì)推斷、決策(大選的有效性、誰勝誰負(fù)),現(xiàn)代社會中,大到國家重大政策的制定,小到人們的日常生活,幾乎都離不開統(tǒng)計(jì)學(xué)提供的信息。,,統(tǒng)計(jì)學(xué)的知識已滲透到自然科學(xué)、社會科學(xué)以及人類生活的各個領(lǐng)域。,(2)三類現(xiàn)象,自然界和人類社會活動中,普遍存在三類現(xiàn)象。確定性現(xiàn)象在相同的條件下出現(xiàn)相同的結(jié)果,稱為確定性現(xiàn)象或必然現(xiàn)象。如自由落體。隨機(jī)性現(xiàn)象在相同的條件下出現(xiàn)不同的結(jié)果,但結(jié)果是確定的,稱為隨機(jī)性現(xiàn)象。如擲硬幣。模糊性現(xiàn)象在相同的條件下出現(xiàn)不確定的結(jié)果,稱為模糊性現(xiàn)象。如美人與丑人。,不同現(xiàn)象與研究方法,現(xiàn)象研究方法確定性現(xiàn)象---經(jīng)典數(shù)學(xué)隨機(jī)性現(xiàn)象---概率統(tǒng)計(jì)學(xué)模糊性現(xiàn)象---模糊數(shù)學(xué),(3)什么是統(tǒng)計(jì)學(xué),統(tǒng)計(jì)學(xué)的英語單詞是STATISTICS,來源于STATE,即指政府,官方所要求的信息。統(tǒng)計(jì)學(xué)是研究隨機(jī)現(xiàn)象規(guī)律性的方法學(xué)。統(tǒng)計(jì)學(xué)是一門關(guān)于如何收集、分析、解釋和表達(dá)數(shù)據(jù)的科學(xué)。WEBSTER’SINTERNATIONALDICTIONARY,統(tǒng)計(jì)學(xué)是“對令人困惑費(fèi)解的問題做出數(shù)字設(shè)想的藝術(shù)?!泵绹鳧AVIDFREEDMAN統(tǒng)計(jì)學(xué)是一門處理數(shù)據(jù)中變異性的科學(xué)和藝術(shù)。JOHNMLASTADICTIONARYOFEPIDEMIOLOGY,(4)常見的統(tǒng)計(jì)學(xué)試驗(yàn),奧運(yùn)會比賽中,各項(xiàng)球運(yùn)動誰先開球,體操、跳水運(yùn)動員出場的順序怎樣決定的,經(jīng)典統(tǒng)計(jì)試驗(yàn)擲硬幣、抽簽、骰子,,為什么采用這樣“統(tǒng)計(jì)試驗(yàn)”方式?jīng)Q定呢,“公正、公平、公開”,自由經(jīng)濟(jì)或市場經(jīng)濟(jì)社會倡導(dǎo)的三公原則其內(nèi)部蘊(yùn)藏著統(tǒng)計(jì)學(xué)的思想。體育彩票、球足彩票、福利彩票、抽獎等博彩活動中,都運(yùn)用了統(tǒng)計(jì)學(xué)的知識?!坝少€局引的一門學(xué)問,居然會為人類知最重要的研究對象,這實(shí)在令人非常驚奇?!狈▏鴶?shù)學(xué)家LAPLACE17451827,在現(xiàn)實(shí)生活中,經(jīng)常會遇到各種不確定性的問題,人們常常憑直覺和經(jīng)驗(yàn)來處理問題。直覺,經(jīng)驗(yàn)對于人們的審美生活、觀察研究很重要。,(5)直覺經(jīng)驗(yàn)與統(tǒng)計(jì),直覺與統(tǒng)計(jì),1某商場調(diào)查100名顧客,詢問她們對A,B,C三種化妝品的喜好,結(jié)果如下有2/3的顧客喜歡A而不喜歡B,有2/3的顧客喜歡B而不喜歡C問是否喜歡A而不喜歡選C的最多,,A對B不對,這個問題來源于著名的阿諾悖論,肯尼思阿諾由此證明,一個十全十美的民主選舉系統(tǒng)是不可能實(shí)現(xiàn)的,1972年獲諾貝爾經(jīng)濟(jì)學(xué)獎,直覺與統(tǒng)計(jì),2一家有兩個小孩,問已知一個是女孩,另一個也女孩的可能性多大,A1/2B1/3C1/4D1/5,直覺與統(tǒng)計(jì),3一個班有100同學(xué),問至少有兩個同學(xué)生日相同的可能性多大,A5B50C95D99,,直覺雖重要,但有時直覺會產(chǎn)生錯覺。直覺經(jīng)驗(yàn)≠規(guī)律進(jìn)行科學(xué)研究活動時,需要直覺來發(fā)現(xiàn)問題,產(chǎn)生靈感,但必須采用科學(xué)的方法進(jìn)行實(shí)驗(yàn),經(jīng)過嚴(yán)格的驗(yàn)證后,才能得出事物內(nèi)在的客觀規(guī)律。,6統(tǒng)計(jì)學(xué)的應(yīng)用,統(tǒng)計(jì)學(xué)的理論是隨著人類社會生產(chǎn)的需要而產(chǎn)生,同時也隨著人類社會生產(chǎn)的發(fā)展而更新,特別是近二十年來,統(tǒng)計(jì)學(xué)的理論方法和應(yīng)用方面得到迅速的發(fā)展。統(tǒng)計(jì)學(xué)與各個專業(yè)結(jié)合形成數(shù)十個學(xué)科分支,如人口統(tǒng)計(jì)學(xué)、心理統(tǒng)計(jì)學(xué)、遺傳統(tǒng)計(jì)學(xué)、社會統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)統(tǒng)計(jì)學(xué)、衛(wèi)生統(tǒng)計(jì)學(xué)、醫(yī)學(xué)統(tǒng)計(jì)學(xué)、生物統(tǒng)計(jì)學(xué)等。,第2節(jié),醫(yī)學(xué)統(tǒng)計(jì)學(xué)是統(tǒng)計(jì)學(xué)與醫(yī)學(xué)結(jié)合形成的一門學(xué)科,是統(tǒng)計(jì)學(xué)在醫(yī)學(xué)中的應(yīng)用。衛(wèi)生部定為醫(yī)學(xué)專業(yè)碩士研究生必修課。生物統(tǒng)計(jì)學(xué)是統(tǒng)計(jì)與生物醫(yī)學(xué)結(jié)合形成的一門學(xué)科,(7)統(tǒng)計(jì)學(xué)的重要性,1983年12月8日第六屆全國人民代表大會常務(wù)委員會第三次會議通過了中華人民共和國統(tǒng)計(jì)法。對發(fā)揮統(tǒng)計(jì)信息、咨詢、監(jiān)督的作用提供了重要的法律保障,對發(fā)展我國統(tǒng)計(jì)事業(yè)具有重要意義和作用。1998年9月國家教育部頒布的普通高等學(xué)校本科專業(yè)目錄和專業(yè)介紹將統(tǒng)計(jì)學(xué)列為理學(xué)類一級學(xué)科。,,2001年,中國國家教育部為推進(jìn)基礎(chǔ)教育改革而推出新課程標(biāo)準(zhǔn),將統(tǒng)計(jì)學(xué)納入新的小學(xué)數(shù)學(xué)課程。要求小學(xué)生要“經(jīng)歷運(yùn)用數(shù)據(jù)描述信息、作出推理的過程,發(fā)展統(tǒng)計(jì)觀念”。法國政府已將統(tǒng)計(jì)學(xué)列入二十一世紀(jì)影響法國社會發(fā)展的十個重大領(lǐng)域之一。,據(jù)調(diào)查,新英格蘭醫(yī)學(xué)雜志(NEWENGLANDJMEDICAL)、美國醫(yī)學(xué)雜志(JAMA、英國醫(yī)學(xué)雜志(BRITISHJMEDICAL)和LANCETT等著名醫(yī)學(xué)雜志發(fā)表的文章中,有70應(yīng)用了統(tǒng)計(jì)學(xué),而且雜志有統(tǒng)計(jì)學(xué)的常務(wù)編審。一些著名醫(yī)科大學(xué)和醫(yī)院中,要求碩士和博士畢業(yè)論文的開題報(bào)告有統(tǒng)計(jì)方面的思考和統(tǒng)計(jì)學(xué)家參加,畢業(yè)論文答辯前要求請統(tǒng)計(jì)學(xué)家進(jìn)行審閱。,“統(tǒng)計(jì)學(xué)是現(xiàn)代醫(yī)學(xué)大廈的一個重要支柱”。美國醫(yī)學(xué)會雜志(JAMA)主編,(8)醫(yī)學(xué)統(tǒng)計(jì)學(xué)發(fā)展簡史,19世紀(jì)初,現(xiàn)代科學(xué)思想和科學(xué)方法在醫(yī)學(xué)研究中的應(yīng)用初見端倪。代表性人物法國醫(yī)生PCALOUIS。典型統(tǒng)計(jì)案例2代表性研究“放血”療法治療肺炎的效果,,1835年,LOUIS對當(dāng)時流行的“放血”療法治療肺炎的效果進(jìn)行了比較發(fā)現(xiàn)“放血”的療效不象預(yù)期的那么好。而且早期“放血”和晚期“放血”組比較,患者的診斷、病情、病程、年齡等方面的差異很大,比較平均治愈時間意義不大。因?yàn)橥砥凇胺叛苯M的平均治愈時間長,但該組患者病情重、病程長、年齡大。,,LOUIS的研究雖然沒有徹底否定“放血”療法,使在西方延續(xù)了2000余年的“放血”療法一直持續(xù)到20世紀(jì)初。但他對醫(yī)學(xué)研究的方法學(xué)作出了很大貢獻(xiàn)用數(shù)字的方法表示疾病的特征和預(yù)后;提出了臨床療效對比的前瞻性原則;提出抽樣誤差和混雜(CONFOUNDING)概念。其中前瞻性研究和減少混雜,分別成為當(dāng)今臨床試驗(yàn)和流行病學(xué)研究的基本研究方法。,世界第一部醫(yī)學(xué)統(tǒng)計(jì)學(xué)教科書,在著名法國數(shù)字家SDPOISSON(17811840)的學(xué)生JGAVARRET的協(xié)助下,LOUIS的數(shù)字方法發(fā)展為“概率框架”,GAVARRET于1840年在巴黎出版了世界第一部醫(yī)學(xué)統(tǒng)計(jì)學(xué)教科書。,現(xiàn)代生物統(tǒng)計(jì)的產(chǎn)生,20世紀(jì)20年代,英國統(tǒng)計(jì)學(xué)家RAFISHER爵士(18901962)在倫敦附近的ROTHAMSTED農(nóng)業(yè)實(shí)驗(yàn)站,創(chuàng)立了實(shí)驗(yàn)設(shè)計(jì)方法和統(tǒng)計(jì)分析技術(shù),奠定現(xiàn)代生物統(tǒng)計(jì)的基礎(chǔ)。1948年,英國發(fā)表了評價(jià)鏈霉素治療肺結(jié)核療效的隨機(jī)對照臨床試驗(yàn)報(bào)告,第一次采用生物統(tǒng)計(jì)方法進(jìn)行臨床干預(yù)試驗(yàn)。,我國第一部醫(yī)學(xué)統(tǒng)計(jì)的教科書,生物統(tǒng)計(jì)方法在我國醫(yī)學(xué)界的傳播與運(yùn)用也始于20世紀(jì)初。1945年,郭祖超教授(19121999)編著的醫(yī)學(xué)與生物統(tǒng)計(jì)方法,是我國第一部醫(yī)學(xué)統(tǒng)計(jì)方法的教科書?,F(xiàn)在醫(yī)學(xué)統(tǒng)計(jì)的教科書很多,但適合臨床醫(yī)學(xué)的比較少。,二、醫(yī)學(xué)統(tǒng)計(jì)學(xué)課程按排與要求,課程名<醫(yī)學(xué)統(tǒng)計(jì)學(xué)>碩士研究生必修課授課單位解放軍總醫(yī)院醫(yī)學(xué)統(tǒng)計(jì)教研室授課教員童新元、張高魁醫(yī)學(xué)統(tǒng)計(jì)教研室簡介承擔(dān)任務(wù)教學(xué)碩士必修課碩士選修課博士必修課以及統(tǒng)計(jì)學(xué)思想的普及和統(tǒng)計(jì)培訓(xùn)工作咨詢醫(yī)學(xué)及科研工作者的統(tǒng)計(jì)咨詢科研醫(yī)學(xué)統(tǒng)計(jì)學(xué)專業(yè)的研究地點(diǎn)301醫(yī)院門診樓740#電話937716,授課課時共33次課128學(xué)時其中大課講授18次課72學(xué)時)上機(jī)12次課48學(xué)時)復(fù)習(xí)1次課4學(xué)時)考試2次課8學(xué)時)授課學(xué)分3學(xué)分授課時間2005年10月12日至2006年1月19日授課地點(diǎn)科學(xué)文化中心實(shí)習(xí)地點(diǎn)計(jì)算機(jī)中心三層實(shí)習(xí)教室,(1)教師授課說明,大課講授18次課72學(xué)時統(tǒng)計(jì)方法典型統(tǒng)計(jì)案例,目的講授醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本理論“三基”“基本概念、基本原理和方法”培養(yǎng)統(tǒng)計(jì)思維與邏輯思維的能力培養(yǎng)討論、跨學(xué)科交流協(xié)作的精神,(2)計(jì)算機(jī)上機(jī)實(shí)習(xí)說明,共12次課(48學(xué)時)分4批進(jìn)行每個同學(xué)上機(jī)6次,每次15小時分批由老師與班長商定上機(jī)嚴(yán)格按批按座位進(jìn)行。,目的統(tǒng)計(jì)理論與實(shí)驗(yàn)相結(jié)合為科研和畢業(yè)論文提供分析工具,(3)考試說明,考試分兩部分筆試考試閉卷50分上機(jī)考試開卷50分,目的檢驗(yàn)醫(yī)學(xué)統(tǒng)計(jì)學(xué)掌握的程度檢驗(yàn)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的教學(xué)效果,2004級碩士醫(yī)學(xué)統(tǒng)計(jì)學(xué)成績情況,2004級碩士醫(yī)學(xué)統(tǒng)計(jì)學(xué)成績講評,考試70分以上合格,85分以上方能提前轉(zhuǎn)博優(yōu)秀率37,合格率967人不極格4,下一年重學(xué)一次進(jìn)行補(bǔ)考其中4人因有兩門不及格退學(xué),(4)教學(xué)期間要求,遵守軍隊(duì)和醫(yī)院的規(guī)章制度,遵守課堂紀(jì)律。特別提示如下嚴(yán)禁上課接打手機(jī);嚴(yán)禁計(jì)算機(jī)實(shí)習(xí)時做與統(tǒng)計(jì)無關(guān)的其它事;嚴(yán)禁遲到和早退,有事須向授課教師報(bào)告。教學(xué)過程中若發(fā)現(xiàn)問題,請及時同教研室聯(lián)系聯(lián)系電話937716,三、醫(yī)學(xué)統(tǒng)計(jì)學(xué)學(xué)習(xí)方法,,發(fā)現(xiàn)不少醫(yī)務(wù)工作者曾多次學(xué)習(xí)統(tǒng)計(jì)學(xué)課程,但仍然對統(tǒng)計(jì)學(xué)知識理解很模糊。有的學(xué)員統(tǒng)計(jì)知識學(xué)習(xí)成績很好,但是遇到很簡單的實(shí)際問題也不會解決。,怎樣學(xué)好醫(yī)學(xué)統(tǒng)計(jì)學(xué),思想觀念學(xué)習(xí)方法學(xué)習(xí)時間,(1)思想觀念,統(tǒng)計(jì)學(xué)不神秘,不可怕,不難學(xué)好,統(tǒng)計(jì)學(xué)既很有用,也很有趣。熱愛是最好的老師,歷史上很多非統(tǒng)計(jì)專業(yè)人員,通過對統(tǒng)計(jì)學(xué)的學(xué)習(xí)和研究,在專業(yè)和統(tǒng)計(jì)學(xué)取得有很深的造詣。物理學(xué)家愛因斯坦學(xué)習(xí)和研究統(tǒng)計(jì),將統(tǒng)計(jì)學(xué)思想應(yīng)用于他的物理學(xué)和哲學(xué)研究中。生物學(xué)家達(dá)爾文學(xué)習(xí)和研究統(tǒng)計(jì),進(jìn)化論方面的工作在本質(zhì)而言是屬于生物統(tǒng)計(jì)學(xué)。護(hù)理學(xué)的奠基人NIGHTINGALE學(xué)習(xí)和研究統(tǒng)計(jì),出版世界上第一部醫(yī)院統(tǒng)計(jì)的專著醫(yī)院統(tǒng)計(jì)與醫(yī)院規(guī)劃。,(2)學(xué)習(xí)方法,2重視典型案例的系統(tǒng)學(xué)習(xí),重點(diǎn)掌握“三基”“基本概念、基本原理和方法”不需要記公式和公式推導(dǎo),3重視理論與實(shí)踐上機(jī)實(shí)習(xí)相結(jié)合,,(3)學(xué)習(xí)時間,必須花足夠的時間認(rèn)真學(xué)習(xí)建議授課與自學(xué)時間比例13,四統(tǒng)計(jì)學(xué)基礎(chǔ)知識,,(1)統(tǒng)計(jì)學(xué)的基本內(nèi)容,一、試驗(yàn)設(shè)計(jì)二、數(shù)據(jù)管理和質(zhì)量控制三、數(shù)據(jù)分析,2同質(zhì)和變異,同質(zhì)(HOMOGENEITY)就是性質(zhì)相同,它是進(jìn)行統(tǒng)計(jì)分析的前提變異研究對象之間的差異,3總體、個體與樣本,總體(POPULATION)是根據(jù)研究目的性質(zhì)相同的所有觀察單位集合個體(INDIVIDUAL)是總體中的基本觀察單位(OBSERVATIONUNIT),可以是一個人、一個動物、一個家庭、一個地區(qū)、一份樣品等,樣本SAMPLE是從總體中隨機(jī)抽取的部分觀察單位的集合。,4統(tǒng)計(jì)量和參數(shù),統(tǒng)計(jì)量(STATISTIC)是反映樣本特征的數(shù)量參數(shù)(PARAMETER)是反映總體特征的數(shù)量,5頻率和概率,頻率的定義在N次相同試驗(yàn)中,事件A發(fā)生的次數(shù)占試驗(yàn)總數(shù)的比例,稱為事件A發(fā)生的頻率(FREQUENCY),記為F。頻率的大小反映了事件A發(fā)生的頻繁程度,頻率大,則事件A發(fā)生就頻繁,這意味著A在一次試驗(yàn)中發(fā)生的可能性就大。,,概率(PROBABILITY)是隨機(jī)事件發(fā)生可能性大小的度量,簡記為P。試求,擲一個硬幣出現(xiàn)正面的概率為多少擲一個骰子出現(xiàn)小于5的概率為多少,概率的計(jì)算,擲一個硬幣出現(xiàn)正面的概率為1/2擲一個骰子出現(xiàn)小于5的概率為4/6實(shí)際應(yīng)用中,很多事件的概率P是很難得到的,如某癌癥的發(fā)病率,頻率與概率的關(guān)系,拋擲硬幣的試驗(yàn),試驗(yàn)結(jié)果如下表,━━━━━━━━━━━━━━━━━━━━━試驗(yàn)者拋擲次數(shù)N出現(xiàn)正面次數(shù)K頻率K/N─────────────────────TONGXY5408010303020703530110374016040502104210052052━━━━━━━━━━━━━━━━━━━━━━,歷史上許多名家做過拋擲硬幣的試驗(yàn),拋擲硬幣試驗(yàn)結(jié)果如表,━━━━━━━━━━━━━━━━━━━━━試驗(yàn)者拋擲次數(shù)N出現(xiàn)正面次數(shù)K頻率K/N─────────────────────DEMORGAN2,0481,0610518BUFFON4,0402,04805069PEARSON12,0006,01905016PEARSON24,00012,01205005━━━━━━━━━━━━━━━━━━━━━,大量實(shí)事表明,并可以證明若當(dāng)試驗(yàn)次數(shù)N充分大以后,頻率K/N穩(wěn)定地在概率P的附近擺動。,實(shí)際工作中,可用頻率作為概率的近似值PA≈FAK/N,頻率與概率的關(guān)系,6隨機(jī)變量及其概率分布,隨機(jī)變量出現(xiàn)變異性的量稱為隨機(jī)變量,簡稱為變量。例如,用X表示擲硬幣出現(xiàn)的結(jié)果,1表示出現(xiàn)正面,0表示出現(xiàn)反面。X稱為隨機(jī)變量1,0稱為變量X的取值。,拋擲硬幣的試驗(yàn),試驗(yàn)結(jié)果的概率分布,━━━━━━━━━━━━━━━━━━━━━變量X01─────────────────────概率PX0505━━━━━━━━━━━━━━━━━━━━━,概率分布一個隨機(jī)變量的所有取值與其出現(xiàn)概率的排列稱為變量的概率分布例如,,拋擲兩個骰子的試驗(yàn),試驗(yàn)結(jié)果的概率分布,━━━━━━━━━━━━━━━━━━━━━概率PX─────────────────────X2345......━━━━━━━━━━━━━━━━━━━━━,思考題拋擲兩個骰子的隨機(jī)試驗(yàn)中,試問1)其和可能的結(jié)果有多少種2)哪種可能性最小,哪種可能性最大3)列出試驗(yàn)結(jié)果的概率分布表.,統(tǒng)計(jì)課堂教學(xué)形式,提倡獨(dú)立思考與自由討論,交流,信息交流,1、教師信息發(fā)布,網(wǎng)址HTTP//WEBMAIL301HOSPITALCOMCN。共公郵箱STATEDU301HOSPITALCOMCN,秘碼STAT網(wǎng)址HTTP//MAILCHISSCN共公郵箱STATCHISSCN,秘碼STAT2、問題咨詢發(fā)給STATDEPT301HOSPITALCOMCN,TONGXYCHISSCN兩個信箱。3、網(wǎng)上討論HTTP//WWWCHISSCN奇思論壇生物醫(yī)學(xué)與統(tǒng)計(jì)欄進(jìn)行統(tǒng)計(jì)學(xué)交流和討論。,謝謝,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 74
大小: 0.3(MB)
子文件數(shù):
-
簡介:中醫(yī)藥統(tǒng)計(jì)學(xué),第一章緒論,引子概率應(yīng)用示例,隨機(jī)50個人聚在一起,其中有兩個人生日是同一天的概率在97以上,幾乎可以說50個人中一定有兩個人是同一天的生日。神奇吧計(jì)算如下,統(tǒng)計(jì)應(yīng)用示例,李穎同學(xué)的中醫(yī)基礎(chǔ)理論與傷寒論成績分別為87分與80分,李穎同學(xué)所在班的這兩門課程的平均成績分別為80分和65分,標(biāo)準(zhǔn)差分別為7分和10分。那么,在班里,李穎同學(xué)擅長中醫(yī)基礎(chǔ)理論還是傷寒論的學(xué)習(xí)標(biāo)準(zhǔn)正態(tài)分布下,,李穎同學(xué)在班里中醫(yī)基礎(chǔ)理論成績排在前16,傷寒論成績排在前7,可見李穎同學(xué)比較擅長傷寒論的學(xué)習(xí)。耐人尋味吧,醫(yī)藥統(tǒng)計(jì)應(yīng)用示例,小兒麻痹癥在沒有研制出疫苗之前是一種癱瘓或死亡率很高的疾病。在疫苗人體試驗(yàn)的過程中,科學(xué)家隨機(jī)抽取了400000名兒童并隨機(jī)分成兩組,試驗(yàn)組注射疫苗,對照組注射安慰劑。結(jié)果發(fā)現(xiàn)試驗(yàn)組和對照組分別有56、138名兒童患上該病。56與138的差別是由隨機(jī)抽樣造成的,還是由疫苗的免疫作用所致的統(tǒng)計(jì)推斷分析結(jié)論是二者的差別超出了隨機(jī)性本身所能解釋的范圍,疫苗有效。從此以后,這種疫苗普遍接種,在許多國家根除了小兒麻痹癥。這是統(tǒng)計(jì)學(xué)為醫(yī)學(xué)研究提供有力支持的代表實(shí)例之一。,,脊髓灰質(zhì)炎病毒是引起脊髓灰質(zhì)炎的病毒。該疾病傳播廣泛,是一種急性傳染病。病毒常侵犯中樞神經(jīng)系統(tǒng),損害脊髓前角運(yùn)動神經(jīng)細(xì)胞,導(dǎo)致肢體松弛性麻痹,多見于兒童,故又名小兒麻痹癥。,,統(tǒng)計(jì)思維總有一天會像讀與寫一樣成為一個有效率公民的必備能力。至理名言HGWELLS赫伯特喬治威爾斯HERBERTGEORGEWELLS18661946,英國著名小說家,尤以科幻小說創(chuàng)作聞名于世。1895年出版時間機(jī)器一舉成名,隨后又發(fā)表了莫洛博士島、隱身人、星際戰(zhàn)爭等多部科幻小說。謹(jǐn)與同學(xué)們共享共勉,第一節(jié)概述,中醫(yī)藥統(tǒng)計(jì)學(xué)的概念統(tǒng)計(jì)學(xué)的發(fā)展簡史統(tǒng)計(jì)學(xué)的研究對象中醫(yī)藥統(tǒng)計(jì)學(xué)的主要內(nèi)容統(tǒng)計(jì)學(xué)的特點(diǎn)和基本思想,三類現(xiàn)象,,數(shù)學(xué)研究方法,,,,統(tǒng)計(jì)學(xué)STATISTICS,是研究隨機(jī)現(xiàn)象數(shù)量規(guī)律性的應(yīng)用數(shù)學(xué),是從隨機(jī)現(xiàn)象數(shù)據(jù)中提取信息、知識的一門科學(xué)與藝術(shù),是一門方法性學(xué)科。它分為理論統(tǒng)計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)兩大類。,理論統(tǒng)計(jì)學(xué)THEORETICALSTATISTICS,即數(shù)理統(tǒng)計(jì)學(xué)MATHEMATICALSTATISTICS,是以概率論為基礎(chǔ),從純理論的角度,對統(tǒng)計(jì)方法加以推導(dǎo)論證,中心的內(nèi)容是統(tǒng)計(jì)推斷問題,實(shí)質(zhì)是以歸納方法研究隨機(jī)現(xiàn)象的一般規(guī)律。,應(yīng)用統(tǒng)計(jì)學(xué)APPLIEDSTATISTICS,是數(shù)理統(tǒng)計(jì)學(xué)的原理方法在不同學(xué)科領(lǐng)域的具體應(yīng)用。數(shù)理統(tǒng)計(jì)學(xué)在生物學(xué)中的應(yīng)用形成了生物統(tǒng)計(jì)學(xué)BIOSTATISTICS;在醫(yī)學(xué)中的應(yīng)用形成醫(yī)學(xué)統(tǒng)計(jì)學(xué)(MEDICALSTATISTICS、衛(wèi)生統(tǒng)計(jì)學(xué)HEALTHSTATISTICS和中醫(yī)藥統(tǒng)計(jì)學(xué)STATISTICSFORTRADITIONALCHINESEMEDICINE等。,中醫(yī)藥統(tǒng)計(jì)學(xué)(STATISTICSFORTRADITIONALCHINESEMEDICINE,是研究中醫(yī)藥領(lǐng)域中隨機(jī)現(xiàn)象客觀規(guī)律的一門方法性學(xué)科,它運(yùn)用數(shù)理統(tǒng)計(jì)學(xué)的基本原理與方法,結(jié)合醫(yī)藥實(shí)際,闡述中醫(yī)藥領(lǐng)域研究設(shè)計(jì)、收集資料、整理資料、分析資料、結(jié)果報(bào)告與結(jié)論表達(dá)。它屬于應(yīng)用統(tǒng)計(jì)學(xué),是醫(yī)藥科學(xué)研究的重要工具與手段。,,,統(tǒng)計(jì)學(xué)的發(fā)展簡史,人類實(shí)踐是統(tǒng)計(jì)學(xué)產(chǎn)生的源泉,人類認(rèn)識是統(tǒng)計(jì)學(xué)發(fā)展的動力。遠(yuǎn)古時代,人類利用手指、石子、貝殼、小木棍以及繩索等工具進(jìn)行的計(jì)數(shù)活動就蘊(yùn)藏著統(tǒng)計(jì)萌芽,但是,人類由統(tǒng)計(jì)實(shí)踐上升到統(tǒng)計(jì)學(xué),卻只有300多年的歷史。,,17世紀(jì)中葉至18世紀(jì)初期為古典統(tǒng)計(jì)學(xué)的發(fā)展時期。統(tǒng)計(jì)學(xué)一詞源于STATE,統(tǒng)計(jì)學(xué)意指國家國情的敘述,其研究方法主要采用文字記述和形式邏輯比較法,用于人口、國力等情況的統(tǒng)計(jì)和分析。,,18世紀(jì)后葉至20世紀(jì)初期為近代統(tǒng)計(jì)學(xué)的發(fā)展時期。誤差理論和大數(shù)法則得到了應(yīng)用和發(fā)展,其研究方法主要是建立在大樣本上的大量觀察法,重視運(yùn)用統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)圖表對數(shù)字資料進(jìn)行統(tǒng)計(jì)描述。,,20世紀(jì)初期至今為現(xiàn)代統(tǒng)計(jì)學(xué)的發(fā)展時期。1908年,英國統(tǒng)計(jì)學(xué)家戈賽特(WSGOSSET,18761937)在生物統(tǒng)計(jì)雜志“BIOMETRIKA”上以筆名STUDENT發(fā)表了T分布,開創(chuàng)了小樣本的研究,從而使統(tǒng)計(jì)學(xué)由“描述統(tǒng)計(jì)”向“推斷統(tǒng)計(jì)”發(fā)展,開創(chuàng)了現(xiàn)代統(tǒng)計(jì)學(xué)的新紀(jì)元。20世紀(jì)50年代,電子計(jì)算機(jī)技術(shù)的發(fā)展和應(yīng)用,促進(jìn)了統(tǒng)計(jì)方法的應(yīng)用與發(fā)展。,,當(dāng)今,現(xiàn)代統(tǒng)計(jì)學(xué)的發(fā)展有如下幾個明顯趨勢隨著數(shù)學(xué)的發(fā)展,統(tǒng)計(jì)學(xué)依賴和吸收的數(shù)學(xué)方法越來越多;統(tǒng)計(jì)方法與計(jì)算機(jī)技術(shù)相結(jié)合,已滲透到了所有學(xué)科部門,以統(tǒng)計(jì)學(xué)為基礎(chǔ)的邊緣學(xué)科不斷形成;統(tǒng)計(jì)與實(shí)質(zhì)性學(xué)科(如社會、經(jīng)濟(jì)、生物、醫(yī)學(xué)等)、統(tǒng)計(jì)軟件、現(xiàn)代信息相結(jié)合,所發(fā)揮的功效日益增強(qiáng);統(tǒng)計(jì)學(xué)的作用與功能已從描述事物現(xiàn)狀、反映事物規(guī)律,向抽樣推斷、預(yù)測未來變化方向發(fā)展,已成為具有方法論性質(zhì)的綜合性學(xué)科。,統(tǒng)計(jì)學(xué)的研究對象,統(tǒng)計(jì)學(xué)所研究的對象是具有變異的事物,其變異為同質(zhì)基礎(chǔ)上的變異。同質(zhì)(HOMOGENEITY)指觀察單位間被研究指標(biāo)的影響因素相同。(可控因素)變異(VARIATION)指在同質(zhì)基礎(chǔ)上各觀察單位間某觀察指標(biāo)的差異。統(tǒng)計(jì)學(xué)是處理變異數(shù)據(jù)的科學(xué),沒有變異就無需統(tǒng)計(jì)學(xué)。,,醫(yī)藥事物(現(xiàn)象)大多數(shù)都是具有變異的事物(現(xiàn)象),概率論稱具有變異的事物(現(xiàn)象)為隨機(jī)事件。中醫(yī)藥統(tǒng)計(jì)學(xué)可將醫(yī)藥隨機(jī)事件通過一定數(shù)量的觀察、對比、分析與推斷,由偶然性(不確定性)現(xiàn)象的剖析,發(fā)現(xiàn)事物內(nèi)在的必然性(確定性)規(guī)律。,中醫(yī)藥統(tǒng)計(jì)學(xué)的主要內(nèi)容,中醫(yī)藥統(tǒng)計(jì)學(xué)以研究統(tǒng)計(jì)設(shè)計(jì)和統(tǒng)計(jì)方法為主要內(nèi)容。研究統(tǒng)計(jì)設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)、臨床試驗(yàn)設(shè)計(jì)以及調(diào)查設(shè)計(jì)等統(tǒng)計(jì)方法包括統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷和關(guān)系分析等。,統(tǒng)計(jì)學(xué)的特點(diǎn)和基本思想,統(tǒng)計(jì)學(xué)認(rèn)識事物現(xiàn)象有如下特點(diǎn)數(shù)量性、群體性、具體性和概率性等。統(tǒng)計(jì)學(xué)的基本思想可歸納為變異、隨機(jī)抽樣研究和概率的思想。統(tǒng)計(jì)結(jié)論中沒有“證明”,只有在一定概率水平上的推論。,第二節(jié)統(tǒng)計(jì)學(xué)幾個基本概念,總體與樣本參數(shù)與統(tǒng)計(jì)量誤差概率,總體與樣本,總體(POPULATION)是根據(jù)研究目的所確定的同質(zhì)觀察單位的全體。有限總體與無限總體樣本(SAMPLE)是從總體中隨機(jī)抽取的具有代表性的個體的集合。抽樣研究(SAMPLINGSTUDY)是從總體中抽取樣本,通過對樣本的定量或定性測量結(jié)果來推斷總體。,,抽樣研究的目的是用樣本的特征正確可靠地推斷總體的特征,所以樣本必須對總體具有良好的代表性,抽樣研究應(yīng)注意如下幾點(diǎn)樣本含量足夠大遵循隨機(jī)抽樣原則樣本的構(gòu)成分布應(yīng)基本上與總體構(gòu)成分布保持一致,參數(shù)與統(tǒng)計(jì)量,反映總體的統(tǒng)計(jì)指標(biāo)稱為參數(shù)(PARAMETER),用希臘字母表示,如反映樣本的統(tǒng)計(jì)指標(biāo)稱為統(tǒng)計(jì)量STATISTICS,用拉丁字母或英文字母表示,如,,對某一事物而言,總體參數(shù)是該事物本身固有的、不變的,而統(tǒng)計(jì)量則隨著實(shí)驗(yàn)不同而不同,但統(tǒng)計(jì)量的分布是有規(guī)律的,如小樣本均數(shù)服從T分布,大樣本均數(shù)服從正態(tài)分布等,這些規(guī)律是統(tǒng)計(jì)推斷的理論基礎(chǔ)。,誤差,誤差(ERROR)泛指觀測值與真實(shí)值之差以及樣本統(tǒng)計(jì)量與總體參數(shù)之差。主要分為非隨機(jī)誤差與隨機(jī)誤差,非隨機(jī)誤差包括系統(tǒng)誤差和過失誤差,隨機(jī)誤差包括隨機(jī)測量誤差和隨機(jī)抽樣誤差。,,系統(tǒng)誤差(SYSTEMATICERROR)是指在實(shí)際觀測過程中,由受試對象、研究者、儀器設(shè)備、研究方法、非實(shí)驗(yàn)因素影響等原因造成的有一定傾向性或規(guī)律性的誤差。如儀器初始狀態(tài)未調(diào)整到零、標(biāo)準(zhǔn)試劑未經(jīng)校正所致誤差。其特點(diǎn)為觀察值有系統(tǒng)性、方向性、周期性的偏離真值。這類錯誤可以通過嚴(yán)格的實(shí)驗(yàn)設(shè)計(jì)和技術(shù)措施消除。,,過失誤差(GROSSERROR)由于觀察過程中不仔細(xì)造成的錯誤判斷或記錄。應(yīng)認(rèn)真檢查核對,否則將會影響研究結(jié)果的準(zhǔn)確性。,,隨機(jī)測量誤差(RANDOMMEASUREMENTERROR)是指各種偶然因素(如電壓、環(huán)境溫度等)的影響造成對同一對象多次測定的結(jié)果不完全一樣,或同一樣品不同觀察者之間的差異。該誤差不可避免,但要控制在容許范圍內(nèi)。提高操作者熟練程度可以減少這種誤差。,,隨機(jī)抽樣誤差(RANDOMSAMPLINGERROR)簡稱抽樣誤差(SAMPLINGERROR),是由于隨機(jī)抽樣所引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差異以及各樣本統(tǒng)計(jì)量之間的差異。醫(yī)學(xué)現(xiàn)象的變異總是客觀存在的,因而在抽樣研究中,抽樣誤差總是不可避免的,它雖無方向性,但有一定的分布規(guī)律,是可估計(jì)、可控制的,其大小可通過計(jì)算標(biāo)準(zhǔn)誤間接地反映出來。樣本對總體的代表性越好,抽樣誤差越小,反之,抽樣誤差越大。抽樣誤差揭示樣本距總體的實(shí)際值可能有多遠(yuǎn)。,準(zhǔn)確度、精確度、效度、信度,,,,概率,頻率(FREQUENCY)概率(PROBABILITY)在概率論上稱頻率收斂于概率。概率是反映隨機(jī)事件發(fā)生的可能性大小的度量,用P表示,取值范圍為0,1。隨機(jī)事件的概率為01;必然事件的概率等于1;不可能事件的概率等于0。,,統(tǒng)計(jì)學(xué)通常把等于小于005或001的隨機(jī)事件稱為小概率事件。(人為規(guī)定)一般認(rèn)為小概率事件在一次試驗(yàn)中是不大可能發(fā)生的,這就是小概率原理,它是統(tǒng)計(jì)推斷的重要原理。,第三節(jié)資料類型,數(shù)值資料分類資料相互轉(zhuǎn)換,,資料(DATA)又稱數(shù)據(jù),由變量及其變量值組成。資料類型與變量類型相對應(yīng)。變量(VARIABLE)是指觀察單位的某種特征或?qū)傩裕囱芯康捻?xiàng)目或指標(biāo)。變量的測定結(jié)果稱為變量值(VALUEOFVARIABLE)或觀察值(OBSERVEDVALUE)。,,數(shù)值資料(NUMERICALDATA)又稱定量資料(QUANTITATIVEDATA)或計(jì)量資料(MEASUREMENTDATA),是由儀器、工具或其它定量方法測定的某項(xiàng)指標(biāo)量的大小所得到的資料。例如測量100名男大學(xué)生的身高所獲得的資料就是數(shù)值資料。,,分類資料(CATEGORICALDATA)又稱定性資料QUALITATIVEDATA或計(jì)數(shù)資料(COUNTDATA),是將事物按不同的屬性歸類,清點(diǎn)每一類的數(shù)量多少所得到的資料。根據(jù)類別數(shù)的不同,計(jì)數(shù)資料分為二分類資料(BINARYDATA)、無序多分類資料(UNORDEREDCATEGORICALDATA)和有序多分類資料(ORDEREDCATEGORICALDATA),后者也稱等級資料。例如將100名大學(xué)生按性別分組男53例,女47例,此資料就是二分類資料;按ABO血型分組A型39例、B型20例、O型17例、AB型24例,此資料就是無序多分類資料。,,等級資料ORDINALDATA又稱半定量資料(SEMIQUANTITATIVEDATA)或有序多分類資料(ORDEREDCATEGORICALDATA),是將事物屬性按組別之間有程度或等級差別進(jìn)行歸類所得到的資料。例如用某中藥治療某種疾病患者50名,按臨床療效等級分為痊愈26例、顯效12例、好轉(zhuǎn)7例、無效5例,此資料就為等級資料或有序多分類資料。,,根據(jù)分析的需要,各種資料可進(jìn)行相互轉(zhuǎn)化??蓪?shù)值資料轉(zhuǎn)化為分類資料或等級資料,反過來,分類資料和等級資料可通過數(shù)字編碼或賦值,即數(shù)值化方式,轉(zhuǎn)化為數(shù)值資料。需要注意的是數(shù)值資料變?yōu)榉诸愘Y料或等級資料時信息量將減少,因此在收集數(shù)據(jù)階段應(yīng)盡量收集數(shù)值數(shù)據(jù),并用原始數(shù)值資料建立數(shù)據(jù)集。,,連續(xù)型隨機(jī)變量是指在某一區(qū)間可取任何值的變量,如身高(CM)、體重(KG)、血壓(KPA)等;離散型隨機(jī)變量是指在某一區(qū)間只可取有限的幾個值的變量如家庭人口數(shù)、脈搏(次/分)等。數(shù)值資料對應(yīng)的數(shù)值變量可以是連續(xù)型隨機(jī)變量,也可以是離散型隨機(jī)變量;分類資料和等級資料對應(yīng)的分類變量和等級變量只能是離散型隨機(jī)變量。,,無序多分類變量又稱名義變量(NOMINALVARIABLE),意指各種被命好的分類,在各種分類中沒有隱含的順序,這與等級變量不同。但是,等級變量中各分類之間的差異不能被認(rèn)為是相等的。,第四節(jié)基本步驟,研究設(shè)計(jì)收集資料整理資料分析資料結(jié)果報(bào)告與結(jié)論表達(dá),第四節(jié)基本步驟,醫(yī)藥研究中的統(tǒng)計(jì)工作步驟包括研究設(shè)計(jì)、收集資料、整理資料、分析資料、結(jié)果報(bào)告與結(jié)論表達(dá)等。這幾個步驟是密切聯(lián)系不可分割的,任何一個環(huán)節(jié)發(fā)生缺陷都會影響研究結(jié)果的質(zhì)量和認(rèn)證。,研究設(shè)計(jì),研究設(shè)計(jì)(RESEARCHDESIGN)就是擬訂一份合理的實(shí)驗(yàn)計(jì)劃,將有關(guān)的研究方法與步驟的綱目擬訂出來,用以保證取得一個較為客觀的研究結(jié)果。根據(jù)對研究對象是否施加干預(yù)措施,可將研究分為觀察研究和實(shí)驗(yàn)研究兩大類。,,專業(yè)設(shè)計(jì)SPECIALIZEDDESIGN是指用什么方式、方法驗(yàn)證假說或回答有關(guān)專業(yè)問題。目的在于保證成果的實(shí)用性、可行性和創(chuàng)新性。做好專業(yè)設(shè)計(jì)一般需要具有過硬的專業(yè)知識、較強(qiáng)的查閱文獻(xiàn)能力和善于多學(xué)科交流與合作的能力。,,統(tǒng)計(jì)設(shè)計(jì)STATISTICALDESIGN是指如何合理地安排實(shí)驗(yàn)內(nèi)容,選擇實(shí)驗(yàn)對象,計(jì)算樣本含量,對實(shí)驗(yàn)結(jié)果進(jìn)行有效的分析。目的在于保證結(jié)果的經(jīng)濟(jì)性、重復(fù)性、可靠性和科學(xué)性。實(shí)驗(yàn)統(tǒng)計(jì)設(shè)計(jì),應(yīng)遵循隨機(jī)、對照、重復(fù)和均衡四個基本原則。臨床試驗(yàn)研究還要遵從盲法的原則。,,研究者一定要樹立“設(shè)計(jì)優(yōu)先”的思想,只有縝密完善的研究設(shè)計(jì),才能獲得真實(shí)可靠的研究結(jié)果。中醫(yī)藥統(tǒng)計(jì)學(xué)用于醫(yī)藥科學(xué)研究,應(yīng)從研究設(shè)計(jì)階段開始,而不是在需要數(shù)據(jù)處理時。實(shí)驗(yàn)完成后再找統(tǒng)計(jì)學(xué)家無異于請統(tǒng)計(jì)學(xué)家為實(shí)驗(yàn)進(jìn)行“尸體解剖”,統(tǒng)計(jì)學(xué)家或許只能告訴你失敗的原因。,收集資料,收集資料DATACOLLECTION是指根據(jù)研究目的,按照設(shè)計(jì)要求去準(zhǔn)確、及時和完整地收集原始資料。醫(yī)藥研究資料來源大致有日常醫(yī)療工作記錄和報(bào)告卡,統(tǒng)計(jì)報(bào)表,專題調(diào)查與實(shí)驗(yàn)或試驗(yàn)研究資料,公共或共享的其它資料。,,收集資料的過程實(shí)際上是具體調(diào)查或?qū)嶒?yàn)實(shí)施的過程,要有科學(xué)的態(tài)度,實(shí)事求是的精神,如實(shí)收集資料,并應(yīng)用通用或共享的數(shù)據(jù)庫軟件(如EXCEL,ACCESS,SQL,EPIDATA等)將收集到的資料及時建立電子數(shù)據(jù)庫。,整理資料,整理資料SORTINGDATA是把收集到的原始資料,有目的、有計(jì)劃地進(jìn)行科學(xué)的加工(如分組或匯總),使其系統(tǒng)化、條理化,以便更好地揭示所研究事物的規(guī)律性,有利于統(tǒng)計(jì)分析。整理資料包括資料核查和設(shè)計(jì)分組與匯總等。首先檢查原始記錄,及時糾錯補(bǔ)漏;其次是標(biāo)記可疑值,必要時對可疑值重新觀測。根據(jù)資料的性質(zhì)或數(shù)量特征,對資料進(jìn)行分組,需要時按不同組段對原始資料進(jìn)行歸納計(jì)數(shù)。,分析資料,分析資料(ANALYSISDATA)就是對資料進(jìn)行統(tǒng)計(jì)分析。主要包括統(tǒng)計(jì)描述STATISTICALDESCRIPTION與統(tǒng)計(jì)推斷STATISTICALINFERENCE。統(tǒng)計(jì)描述是指用適合資料性質(zhì)的統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖表等,對資料的數(shù)量特征及其分布規(guī)律進(jìn)行表達(dá),以反映變量值的水平、頻率、聯(lián)系強(qiáng)度。統(tǒng)計(jì)推斷是通過抽樣研究,根據(jù)樣本資料所提供的信息,對未知總體做出具有一定概率性的估計(jì)和推斷,它包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩方面。,結(jié)果報(bào)告與結(jié)論表達(dá),信息時代,醫(yī)藥科研設(shè)計(jì)、資料數(shù)據(jù)庫的建立與管理、統(tǒng)計(jì)分析的大多數(shù)任務(wù)可以交給計(jì)算機(jī)完成,正確領(lǐng)悟統(tǒng)計(jì)思想以及統(tǒng)計(jì)軟件所輸出的結(jié)果,并在研究報(bào)告和論文中作出適當(dāng)?shù)慕忉屌c表達(dá)顯得越來越重要。,,統(tǒng)計(jì)學(xué)既是一門科學(xué)又是一門藝術(shù),其藝術(shù)性是通過表達(dá)來體現(xiàn)的。醫(yī)學(xué)研究性論文主要由摘要、引言、材料與方法、結(jié)果和討論5個部分組成,而每一部分或多或少都涉及統(tǒng)計(jì)表達(dá),需要明確指出所使用的統(tǒng)計(jì)設(shè)計(jì)與分析方法,觀察對象的納入與剔除標(biāo)準(zhǔn),是否隨機(jī)抽樣與隨機(jī)分組,使用的何種統(tǒng)計(jì)軟件及其版本,樣本統(tǒng)計(jì)量、總體參數(shù)可信區(qū)間,檢驗(yàn)統(tǒng)計(jì)量、值,并結(jié)合各學(xué)科專業(yè)知識對統(tǒng)計(jì)分析結(jié)果作出合理的解釋,進(jìn)而得出可信賴的專業(yè)結(jié)論。另外,可借助統(tǒng)計(jì)圖表直觀、形象表達(dá)統(tǒng)計(jì)結(jié)果。統(tǒng)計(jì)結(jié)果的規(guī)范化報(bào)告和結(jié)論的正確表達(dá),能提高研究的認(rèn)證度,也便于各層次的學(xué)術(shù)交流與研究。,第五節(jié)作用與學(xué)習(xí)方法,中醫(yī)藥統(tǒng)計(jì)學(xué)的作用學(xué)習(xí)方法,中醫(yī)藥統(tǒng)計(jì)學(xué)的作用,醫(yī)學(xué)統(tǒng)計(jì)學(xué)是醫(yī)學(xué)科學(xué)研究的重要工具與手段,為醫(yī)學(xué)科學(xué)研究提供統(tǒng)計(jì)思維、統(tǒng)計(jì)設(shè)計(jì)和統(tǒng)計(jì)分析方法。其思維和方法已滲透到醫(yī)藥研究和管理決策的方方面面。,,①中醫(yī)學(xué)基礎(chǔ)研究氣、血、營、衛(wèi)的研究,經(jīng)絡(luò)的研究指標(biāo)的選擇與比較,證指標(biāo)的客觀化。②臨床方面臨床經(jīng)驗(yàn)的總結(jié),藥物的配伍和最佳劑量等用藥規(guī)律的探索,各種致病因素對某疾病的影響程度比較分析。③新藥的開發(fā)研制動物實(shí)驗(yàn)、有效成分確定、質(zhì)量標(biāo)準(zhǔn)制定、工藝篩選等。我國藥品注冊管理辦法規(guī)定,新藥臨床試驗(yàn)必須自始至終有統(tǒng)計(jì)學(xué)人員參與,生物醫(yī)藥實(shí)驗(yàn)室研究、臨床研究、流行病學(xué)探索和醫(yī)藥公共事業(yè)管理均需統(tǒng)計(jì)學(xué)的支持。④在醫(yī)藥雜志上發(fā)表科研論文涉及數(shù)據(jù)分析都需要統(tǒng)計(jì)學(xué)處理。醫(yī)藥領(lǐng)域的抽樣研究數(shù)據(jù)不經(jīng)過統(tǒng)計(jì)學(xué)分析處理而得出的結(jié)論是不科學(xué)的,是不可信的。,,醫(yī)學(xué)統(tǒng)計(jì)學(xué)的全部功能僅在于幫助我們認(rèn)識醫(yī)學(xué)研究客觀上存在的規(guī)律而不能“創(chuàng)造”規(guī)律。重視原始資料的完整性和準(zhǔn)確性,對數(shù)據(jù)處理持嚴(yán)肅、認(rèn)真、實(shí)事求是的科學(xué)態(tài)度,反對偽造和篡改統(tǒng)計(jì)數(shù)據(jù),要防止利用統(tǒng)計(jì)軟件進(jìn)行資料分析“垃圾進(jìn),垃圾出”的現(xiàn)象發(fā)生。,學(xué)習(xí)方法,醫(yī)學(xué)生學(xué)習(xí)中醫(yī)藥統(tǒng)計(jì)學(xué)的目的并非要使自己成為統(tǒng)計(jì)專業(yè)人員,而是使自己樹立統(tǒng)計(jì)思想,學(xué)會統(tǒng)計(jì)思維,從不確定性和概率的角度去考慮問題,能結(jié)合醫(yī)學(xué)問題合理設(shè)計(jì),認(rèn)真觀察,準(zhǔn)確收集資料,有效整理資料,正確運(yùn)用統(tǒng)計(jì)方法分析資料,恰如其分解釋統(tǒng)計(jì)結(jié)果,得出可信賴的結(jié)論,寫出具有一定學(xué)術(shù)水平的研究報(bào)告或科學(xué)論文,從而提高自身科學(xué)素養(yǎng)和研究能力。,,,,在學(xué)習(xí)中醫(yī)藥統(tǒng)計(jì)學(xué)的過程中,醫(yī)學(xué)生要重視對統(tǒng)計(jì)基本概念、基本原理、基本方法的理解,對統(tǒng)計(jì)公式主要了解其意義、用途和應(yīng)用條件,不必深究其數(shù)學(xué)推導(dǎo),也不需要死記硬背。,,統(tǒng)計(jì)工作貫穿醫(yī)學(xué)研究的全過程,要本著“設(shè)計(jì)優(yōu)先”的原則,弄清資料來自何種統(tǒng)計(jì)設(shè)計(jì),資料的屬性是什么,是否滿足參數(shù)檢驗(yàn)的條件,用何種統(tǒng)計(jì)方法分析比較適宜等。要理論聯(lián)系實(shí)際,重視理論學(xué)習(xí)與上機(jī)練習(xí)的有機(jī)統(tǒng)一。總之思想重視、觀念正確、方法得當(dāng),兩個堅(jiān)持(認(rèn)真聽課、及時上機(jī)實(shí)驗(yàn)練習(xí)。),學(xué)以致用就能學(xué)好本課程。,小結(jié),,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 68
大?。?1.31(MB)
子文件數(shù):