-
簡介:一元線性回歸課后習題講解,第九組,111從某一行業(yè)中隨機抽取12家企業(yè),所得產(chǎn)量與生產(chǎn)費用的數(shù)據(jù)如下,產(chǎn)量和費用存在正的線性相關(guān)系數(shù),(1)繪制產(chǎn)量與生產(chǎn)費用的散點圖,判斷二者之間的關(guān)系形態(tài)。,R09202,2)計算產(chǎn)量與生產(chǎn)費用之間的線性相關(guān)系數(shù)。,1、提出假設(shè)H0???;H1??0,2、計算檢驗的統(tǒng)計量,,根據(jù)顯著性水平?=005,查T分布表得T???N222281由于?T?7435453T???12222281,拒絕H0,產(chǎn)量與生產(chǎn)費用之間存在著顯著的正線性相關(guān)關(guān)系,(3)對相關(guān)系數(shù)的顯著性進行檢驗(?=005,并說明二者之間的關(guān)系強度。,T???12222281,112學生在期末考試之前用于復習的時間(單位小時)和考試分數(shù)(單位分)之間是否有關(guān)系為研究這一問題,一位研究者抽取了由8名學生構(gòu)成的一個隨機樣本,取得的數(shù)據(jù)如下,復習時間和考試分數(shù)存在正的線性相關(guān)關(guān)系,要求(1)繪制復習時間和考試分數(shù)的散點圖,判斷二者之間的關(guān)系形態(tài)。,R08621,(2)計算相關(guān)系數(shù),說明兩個變量之間的關(guān)系強度。,113、根據(jù)一組數(shù)據(jù)建立的線性回歸方程要求1)解釋截距的意義。1)解釋斜率的意義。2)當6時的E(Y)1)表示在沒有自變量X的影響時其他各種因素對因變量Y的影響為102)斜率的意義在于自變量X變化對Y影響程度?;貧w方程中,當X增加一個單位時,Y將減少05個單位。3)X6時,代入方程,則,Y100567,,,114設(shè)SSR36,SSE4,N18要求1)計算判定系數(shù)R2并解釋其意義回歸直線對觀測值的擬合程度為09,說明變量Y的變異性中有90是由自變量X引起的。2)計算估計標準誤差并解釋其意義,表示實際值與估計值之間的差異程度是05,115一家物流公司的管理人員想研究貨物的運輸距離和運輸時間的關(guān)系,為此,他抽出了公司最近10個卡車的運貨記錄的隨機樣本,得到運送距離(單位KM)和運送時間(單位天)的數(shù)據(jù)如下表,1繪制運送距離和運送時間的散點圖,判斷二者之間的關(guān)系形態(tài)2計算線性相關(guān)系數(shù),說明兩個變量之間的關(guān)系強度。3利用最小二乘法求出估計的回歸方程,并解釋回歸系數(shù)的實際意義。,根據(jù)圖表顯示,二者可能存在正線性相關(guān)關(guān)系,1繪制運送距離和運送時間的散點圖,判斷二者之間的關(guān)系形態(tài),X與Y的簡單相關(guān)系數(shù)是09489,兩變量之間呈現(xiàn)高度正相關(guān)關(guān)系,2計算線性相關(guān)系數(shù),說明兩個變量之間的關(guān)系強度,最小二乘估計Y?0?1X,將表中數(shù)據(jù)代入公式得,∴Y01181290003585X,3利用最小二乘法求出估計的回歸方程,并解釋回歸系數(shù)的實際意義。,,,,Y關(guān)于X的回歸方程為Y01181290003585X表示運輸距離每增加1公里,運送時間平均增加0003585天。,116下面是7個地區(qū)2000年的人均國內(nèi)生產(chǎn)總值(GDP)和人均消費水平的統(tǒng)計數(shù)據(jù),要求1人均GDP作自變量,人均消費水平作因變量,繪制散點圖,并說明二者之間的關(guān)系形態(tài)。,,產(chǎn)量和生產(chǎn)費用之間存在著正的線性相關(guān)關(guān)系,2計算兩個變量之間的線性相關(guān)系數(shù),說明兩個變量之間的關(guān)系強度。,說明兩個變量之間高度相關(guān),3利用最小二乘法求出估計的回歸方程,并解釋回歸系數(shù)的實際意義。,Y73469280308683X,回歸系數(shù)的含義人均GDP每增加1元,人均消費增加0309元。,4計算判定系數(shù),并解釋其意義。,人均GDP對人均消費的影響達到996。,5檢驗回歸方程線性關(guān)系的顯著性A005。,提出假設(shè)H0?10人均消費水平與人均GDP之間的線性關(guān)系不顯著計算檢驗統(tǒng)計量F,確定顯著性水平?005,并根據(jù)分子自由度1和分母自由度72找出臨界值F?661作出決策若FF?,拒絕H0,線性關(guān)系顯著,6如果某地區(qū)的人均GDP為5000元,預測其人均消費水平。,某地區(qū)的人均GDP為5000元,預測其人均消費水平為22781078元。,7求人均GDP為5000元時,人均消費水平95%的置信區(qū)間和預測區(qū)間。,解已知N7,T???7225706置信區(qū)間為,人均GDP為5000元時,人均消費水平95%的置信區(qū)間為199074915,256546399,199074915T???2201,拒絕H0,回歸系數(shù)顯著,提出假設(shè)H0B10H1B1?0計算檢驗的統(tǒng)計量,3)檢驗回歸系數(shù)的顯著性(A005),2201,解已知N10,T???1022306置信區(qū)間為,計算得,4)如果航班正點率為80,估計顧客投訴次數(shù),5)求航班正點率為80,顧客投訴次數(shù)95的置信區(qū)間和預測區(qū)間,已知N10,T???1022306預測區(qū)間為,計算得,118下面是20個城市寫字樓出租率和每平方米月租金的數(shù)據(jù)。設(shè)月租金為自變量,出租率為因變量,用EXCEL進行回歸,并對結(jié)果進行解釋和分析。,119某汽車生產(chǎn)商欲了解廣告費用X對銷售量Y的影響,收集了過去12年的有關(guān)數(shù)據(jù)。通過計算得到下面的有關(guān)結(jié)果,方差分析表,參數(shù)估計表,1完成上面的方差分析表。,SSRSSTSSE164286667401580716027086MSRSSR/116027086MSESSE/104015807FMSR/MSE3991000065,2汽車銷售量的變差中有多少是由于廣告費用的變動引起的,汽車銷售量的變差中有9756是由于廣告費用的變動引起的,3銷售量與廣告費用之間的相關(guān)系數(shù)是多少,4寫出估計的回歸方程并解釋回歸系數(shù)的實際意義。,回歸系數(shù)的意義廣告費用每增加一個單位,汽車銷量就增加142個單位。,5檢驗線性關(guān)系的顯著性A=005。,P217E09<Α,顯著。,1110根據(jù)下面的數(shù)據(jù)建立回歸方程,計算殘差,判定R2,估計標準誤差SE,并分析回歸方程的擬合程度。,殘差,估計標準誤差SE,本題判定系數(shù)R20937348,可以看出擬合程度好。,判定R2,1111從20的樣本中得到的有關(guān)回歸結(jié)果是SSR60,SSE40。要檢驗X與Y之間的線性關(guān)系是否顯著,即檢驗假設(shè),。,1線性關(guān)系檢驗的統(tǒng)計量F值是多少,解(1)SSR的自由度為1;SSE的自由度為N218;F,,27,2給定顯著性水平A=005,F(xiàn)A是多少,,,441,3是拒絕原假設(shè)還是不拒絕原假設(shè),拒絕原假設(shè),線性關(guān)系顯著。,4假定X與Y之間是負相關(guān),計算相關(guān)系數(shù)R,R,,07746,由于是負相關(guān),因此R07746,5檢驗X與Y之間的線性關(guān)系是否顯著,從F檢驗看線性關(guān)系顯著。,F,27,441,1112從N20的樣本中得到的有關(guān)回歸結(jié)果是Y53X,12,,要求1)當X4時,構(gòu)建Y的平均值的95的置信區(qū)間,,,2)當X4時,構(gòu)建Y的平均值的95的預測區(qū)間,1113一家公司擁有多家子公司,公司的管理者想通過廣告支出來估計銷售收入,為此抽取了8家子公司,得到廣告支出和銷售收入的數(shù)據(jù)如下(單位萬元),建立線性回歸模型,當X40萬元時,構(gòu)建銷售收入95的置信區(qū)間。,Y04629181523977X當X40萬元時E(Y0)462918152397740563299TΑ/2T0025624469,置信區(qū)間為441559,685039,1114從兩個回歸分析中得到的殘差如下,繪制殘差圖,你會得出什么結(jié)論。,回歸1,觀察圖像可以看出,殘差值基本上集中在兩條平行線之間,表明對于所有值,方差都相同,所以認定其假定描述變量X和Y之間關(guān)系的回歸模型是合理的。,回歸2,對于不同的X值殘差相差也較大,且其殘差值基本上集中在兩條曲線之間,這就意味著其違背了方差相等的,表明所選擇的回歸模型不合理,應該考慮曲線回歸或多元回歸。,1115隨機抽取7家超市,得到其廣告費支出和銷售額數(shù)據(jù)如下,1115隨機抽取7家超市,得到其廣告費支出和銷售額數(shù)據(jù)如下,解(1),1用廣告費支出作自變量X,銷售額作因變量Y,求出估計的回歸方程。,(2)回歸直線的F檢驗,顯著。,2檢驗廣告費支出與銷售額之間的線性關(guān)系是否顯著A=005。,廣告費支出與銷售額之間的線性關(guān)系顯著,顯著。,回歸系數(shù)的T檢驗,3繪制關(guān)于X的殘差圖,你覺得關(guān)于誤差項的假定被滿足了嗎,3大約有95的標準化殘差在22之間表明誤差項假定的條件成立。從圖中可以看出不滿足這個條件,所以關(guān)于誤差項的假定沒有被滿足。,4你是選用這個模型,還是另尋找一個更好的模型,4可考慮選用非線性模型,
下載積分: 6 賞幣
上傳時間:2024-01-07
頁數(shù): 53
大?。?0.51(MB)
子文件數(shù):
-
簡介:●,甲、乙二人賭博,各出賭注30元,共60元,每局甲、乙勝的機會均等,都是1/2。約定誰先勝滿3局則他贏得全部賭注60元,現(xiàn)已賭完3局,甲2勝1負,而因故中斷賭局,問這60元賭注該如何分給2人,才算公平,分賭注問題,帕斯卡和費爾馬一邊親自賭博,一邊仔細分析計算賭博中出現(xiàn)的各種問題,終于完整地解決了“分賭注問題”,并將此題的解法向更一般的情況推廣,從而建立了概率論的一個基本概念數(shù)學期望。,分賭注問題,而惠更斯經(jīng)過多年的潛心研究,解決了擲骰子中的一些數(shù)學問題。1657年,他將自己的研究成果寫成了專著論擲骰子游戲中的計算。這本書迄今為止被認為是概率論中最早的論著。,分賭注問題,在他們之后,對概率論這一學科做出貢獻的是瑞士數(shù)學雅可布貝努利。他在前人研究的基礎(chǔ)上,繼續(xù)分析賭博中的其他問題,給出了“賭徒輸光問題”的詳盡解法,并證明了被稱為“大數(shù)定律”的一個定理,這是研究等可能性事件的古典概率論中的極其重要的結(jié)果。,分賭注問題,概率的意義,了解發(fā)生意外事故的可能性大小,確定保險金額;了解來商場購物的顧客人數(shù)的各種可能性大小,合理配置服務人員;了解每年最大洪水超警戒線可能性大小,合理確定堤壩高度;了解學生報道率,以確定床位數(shù),基本概念,在自然界和人類社會生活中,普遍存在著兩類現(xiàn)象,一類是在一定條件下必然出現(xiàn)的現(xiàn)象,稱為確定性現(xiàn)象;另一類則是我們事先無法準確預知其結(jié)果的現(xiàn)象,稱為隨機現(xiàn)象(帶有隨機性、偶然性的現(xiàn)象)。,隨機現(xiàn)象,基本概念,隨機現(xiàn)象的特點當人們在一定的條件下對它加以觀察或進行試驗時,觀察或試驗的結(jié)果是多個可能結(jié)果中的某一個。而且在每次試驗或觀察前都無法確知其結(jié)果,即呈現(xiàn)出偶然性?;蛘哒f,出現(xiàn)哪個結(jié)果“憑機會而定”。,隨機現(xiàn)象,基本概念,下面那些現(xiàn)象是隨機現(xiàn)象A明天的最高溫度B在地面上拋物體會下落C新生嬰兒的體重D太陽從東方升起,隨機現(xiàn)象,基本概念,由于隨機現(xiàn)象的結(jié)果事先不能預知,初看似乎毫無規(guī)律。然而人們發(fā)現(xiàn)同一隨機現(xiàn)象大量重復出現(xiàn)時,其每種可能的結(jié)果出現(xiàn)的頻率具有穩(wěn)定性,從而表明隨機現(xiàn)象也有其固有的規(guī)律性。人們把隨機現(xiàn)象在大量重復出現(xiàn)時所表現(xiàn)出的量的規(guī)律性稱為隨機現(xiàn)象的統(tǒng)計規(guī)律性。,隨機現(xiàn)象,基本概念,拋硬幣實驗,隨機現(xiàn)象,基本概念,“天有不測風云”和“天氣可以預報”有矛盾嗎天有不測風云隨機現(xiàn)象一次實現(xiàn)的偶然性天氣可以預報研究者從大量的氣象資料來探索這些偶然現(xiàn)象的規(guī)律性從表面上看,隨機現(xiàn)象的每一次觀察結(jié)果都是隨機的,但多次觀察某個隨機現(xiàn)象,便可以發(fā)現(xiàn),在大量的偶然之中存在著必然的規(guī)律。,隨機現(xiàn)象,基本概念,為了對隨機現(xiàn)象的統(tǒng)計規(guī)律性進行研究,就需對隨機現(xiàn)象進行重復觀察,我們把對隨機現(xiàn)象的觀察稱為隨機試驗,并簡稱為試驗,記為E。例如,觀察某射手對固定目標進行射擊;拋一枚硬幣三次,觀察出現(xiàn)正面的次數(shù);記錄某市120急救電話一晝夜接到的呼叫次數(shù)等,均為隨機試驗。,隨機試驗,基本概念,可重復性試驗可以在相同的條件下重復進行;可觀察性試驗結(jié)果可觀察,所有可能的結(jié)果是明確的;不確定性每次試驗出現(xiàn)的結(jié)果事先不能準確預知。,隨機試驗,基本概念,我們把隨機試驗的每個基本結(jié)果稱為樣本點,記作E或Ω全體樣本點的集合稱為樣本空間。樣本空間用S或Ω表示,樣本空間,樣本點E,基本概念,例如如果試驗是將一枚硬幣拋擲兩次,則樣本空間由如下四個樣本點組成S{正,正,正,反,反,正,反,反},樣本空間,樣本空間在如下意義上提供了一個理想試驗的模型在每次試驗中必有一個樣本點出現(xiàn)且僅有一個樣本點出現(xiàn)。,基本概念,如果試驗是測試某種燈泡的壽命則樣本點是一非負數(shù),由于不能確知壽命的上界,所以可以認為任一非負實數(shù)都是一個可能結(jié)果,故樣本空間S{T∣T≥0},樣本空間,基本概念,在隨機試驗中,人們除了關(guān)心試驗的結(jié)果本身外,還關(guān)心試驗的結(jié)果是否具備某一指定的可觀察的特征,概率論中將這一可觀察的特征稱為一個事件隨機事件在試驗中可能發(fā)生也可能不發(fā)生的事件必然事件在每次試驗中都必然發(fā)生的事件不可能事件在任一次試驗中都不可能發(fā)生的事件。,隨機事件,基本概念,在拋擲一枚骰子的試驗中,假設(shè)我們關(guān)心出現(xiàn)的點數(shù)是否為奇數(shù),“點數(shù)為奇數(shù)”就是一個事件。它在試驗中可能發(fā)生也可能不發(fā)生,是一隨機事件。同樣,“點數(shù)小于7”與“點數(shù)為8”也分別是一個事件,前者在試驗中是必然發(fā)生的,即是必然事件,后者在試驗中是不可能發(fā)生的,即是不可能事件。,隨機事件,基本概念,引入樣本空間后,事件便可表示為樣本空間的子集。用A,B,來表示。例如,擲一顆骰子,觀察出現(xiàn)的點數(shù)樣本空間S{1,2,3,4,5,6}事件B“點數(shù)小于5”→B{1,2,3,4};事件B就是S的一個子集。B發(fā)生當且僅當B中的樣本點1,2,3,4中的某一個出現(xiàn)。,集合表示,基本概念,稱僅含一個樣本點的事件為基本事件;稱含有兩個或兩個以上樣本點的事件為復合事件。,集合表示,基本概念,事件關(guān)系,關(guān)系,符號,概率論中的意義,集合論,包含,若A發(fā)生必有B發(fā)生(B不發(fā)生則A必不發(fā)生),A是B的子集,等價,事件A包含B事件B包含A,A與B相等,基本概念,事件關(guān)系,關(guān)系,符號,概率論中的意義,集合論,互不相容(互斥),對立(逆事件),事件A與B不能同時發(fā)生,A與B無公共元素,事件“非A”,A的余集,基本概念,事件運算,運算,符號,概率論中的意義,集合論,事件的和(并),事件A與B至少有一個發(fā)生,A與B的并集,事件的積(交),事件A與B同時發(fā)生,A與B的交集,事件的差,事件A發(fā)生,B不發(fā)生,A與B的差集,基本概念,韋恩圖,基本概念,假定某個試驗有有限個可能的結(jié)果,E1,E2,,EN,假定從該試驗的條件及實施方法上去分析,我們找不到任何理由認為其中某一結(jié)果例如EI,比任一其它結(jié)果EJ,更有優(yōu)勢,則我們只好認為所有結(jié)果在試驗中有同等可能的出現(xiàn)機會,即1/N的出現(xiàn)機會。,古典概率,基本概念,定義若隨機試驗滿足下述兩個條件1它的樣本空間只有有限多個樣本點;2每個樣本點出現(xiàn)的可能性相同。稱這種試驗模型為等可能概型或古典概型。,古典概率,基本概念,古典概率,則事件A發(fā)生的概率,稱此概率為古典概率,,這種確定概率的方法稱為,古典方法,設(shè)事件A包含其樣本空間S中K個基本事件,,即,基本概念,古典概率,把C、C、E、E、I、N、S七個字母分別寫在七張同樣的卡片上,并且將卡片放入同一盒中,現(xiàn)從盒中任意一張一張地將卡片取出,并將其按取到的順序排成一列,假設(shè)排列結(jié)果恰好拼成一個英文單詞,C,I,S,N,C,E,E,基本概念,古典概率,拼成英文單詞SCIENCE的情況數(shù)為,故該結(jié)果出現(xiàn)的概率為,這個概率很小,如果多次重復這一抽卡試驗,則我們所關(guān)心的事件在1260次試驗中大約出現(xiàn)1次。,解七個字母的排列總數(shù)為7,古典概率,例一個袋子中裝有10個大小相同的球,其中3個黑球,7個白球,求1從袋子中任取一球,這個球是黑球的概率;2從袋子中任取兩球,剛好一個白球一個黑球的概率以及兩個球全是黑球的概率。,古典概率,1從袋子中任取一球,這個球是黑球的概率;,1,解,10個球中任取一個,,從,而根據(jù)古典概率計算,,的概率為,古典概率,2從袋子中任取兩球,剛好一個白球一個黑球的概率以及兩個球全是黑球的概率。,解,2,10個球中任取兩球的取法有,種,,其中,種取法,,事件“剛好取到一個白球一個黑球”,,古典概率,2從袋子中任取兩球,剛好一個白球一個黑球的概率以及兩個球全是黑球的概率。,解,2,10個球中任取兩球的取法有,種,,其中,兩個球均是黑球的取法有,種,,為,球均為黑球”,則,事件“兩個,頻率的定義,次數(shù)為,頻率具有下述基本性質(zhì),1,2,3,則,定義若在相同條件下進行N次試驗,,其中發(fā)生的,頻率的穩(wěn)定性,在充分多次試驗中,事件的頻率總在一個定值附近擺動,而且,試驗次數(shù)越多,一般來說擺動越小這個性質(zhì)叫做頻率的穩(wěn)定性。頻率在一定程度上反映了事件發(fā)生的可能性大小。盡管每進行一連串(N次)試驗,所得到的頻率可以各不相同,但只要N相當大,頻率與概率是會非常接近的。,,定義,在相同條件下進行N次重復試驗,,若事件A,發(fā)生的頻率,隨著試驗次數(shù)N的增大而,穩(wěn)定地在某個常數(shù)P附近擺動,,則稱P為事件A的概率,,記為PA,概率的統(tǒng)計定義,,概率被視為頻率的穩(wěn)定值,,從而應具有與頻率相應的,性質(zhì),1,,2,3,則,概率的統(tǒng)計定義,,例如,若我們希望知道某射手中靶的概率,應對這個射手在同樣條件下大量射擊情況進行觀察記錄。,若他射擊N發(fā),中靶M發(fā),當N很大時,可用頻率M/N作為他中靶概率的估計。,概率的統(tǒng)計定義,,例從某魚池中取100條魚,做上記號后再放入該魚池中。先從該池中任意捉來40條魚,發(fā)現(xiàn)其中兩條有記號,問池內(nèi)大約有多少條魚,解,設(shè)池內(nèi)有N條魚,,則從池中捉到一條有記號魚的,概率為100/N,,它近似于捉到有記號魚的頻率2/40,,即,,故池內(nèi)大約有2000條魚,概率的統(tǒng)計定義,概率的統(tǒng)計定義,,拋硬幣試驗中正反面出現(xiàn)的概率各是1/2,如果你做了100次試驗,出現(xiàn)正面這個事件發(fā)生了20次,你會有什么想法如果另外一位同學做了100次試驗,前99次都是正面,你又會有什么想法,基本概念,主觀概率,一些概率既不能由等可能性來計算,也不可能從試驗得出。比如,你五年內(nèi)去歐洲旅游的概率等。這種概率稱為主觀概率SUBJECTIVEPROBABILITY??梢哉f,主觀概率是一次事件的概率?;驗榛谒莆盏男畔?,某人對某事件發(fā)生的自信程度。,概率的性質(zhì),性質(zhì)1,概率的性質(zhì),性質(zhì)4,例,某城市中發(fā)行2種報紙,經(jīng)調(diào)查,,在這,2種報紙的訂戶中,,訂閱,求只訂一種報紙的概率,例,例,條件概率,MONTYHALLPROBLEM,條件概率,如在事件A發(fā)生的條件下求事件B發(fā)生的概率,將此概率記作PB|A,PB1/6,,例如,擲一顆均勻骰子,B{擲出2點},,A{擲出偶數(shù)點},,PB|A,已知事件A發(fā)生,此時試驗所有可能結(jié)果構(gòu)成的集合就是A,,于是PB|A1/3,A中共有3個元素,它們的出現(xiàn)是等可能的,其中只有1個在集A中,,條件概率,定義,設(shè)A、B是兩個事件,,且,則稱,1,為在事件A發(fā)生的條件下,,事件B的條件概率,注,若事件A已,發(fā)生,且又是B中的樣本點,則此點,必屬于AB,因已知A已發(fā)生,,故A成為新的樣本空間。,用韋恩圖表達1式,條件概率,定義,設(shè)A、B是兩個事件,,且,則稱,為在事件A發(fā)生的條件下,,事件B的條件概率,PAB為事件A、B同時發(fā)生的概率,即聯(lián)合概率。,PA或PB為事件A或B的邊緣概率。,,條件概率的計算,,1用定義計算,條件概率的計算,條件概率的計算,,2從加入條件后改變了的情況去算,PA|B),B發(fā)生后的縮減樣本空間所含樣本點總數(shù),在縮減樣本空間中A所含樣本點個數(shù),條件概率,MONTYHALLPROBLEM,聯(lián)合概率,由條件概率的定義,即若PA0,則PABPAPB|A,而PABPBA,將A、B的位置對調(diào),有,故PB0,則PABPBPA|B,若PB0,則PBAPBPA|B,條件概率,例設(shè)某種動物由出生算起活到20年以上的概率為08,活到25年以上的概率為04問現(xiàn)年20歲的這種動物,它能活到25歲以上的概率是多少,解設(shè)A{能活20年以上},B{能活25年以上},依題意,PA08,PB04,所求為PB|A,一場精彩的足球賽將要舉行,5個球迷好不容易才搞到一張入場券。大家都想去,只好用抽簽的方法來解決。,5張同樣的卡片,只有一張上寫有“入場券”,其余的什么也沒寫。將它們放在一起,洗勻,讓5個人依次抽取。,到底誰說的對呢,“先抽的人當然要比后抽的人抽到的機會大”,“大家不必爭先恐后,你們一個一個按次序來,誰抽到入場券的機會都一樣大”,事件的獨立性,顯然PA|BPA,這就是說,已知事件B發(fā)生,并不影響事件A發(fā)生的概率,這時稱事件A、B獨立。,A{第二次擲出6點},B{第一次擲出6點},,將一顆均勻骰子連擲兩次,,設(shè),事件的獨立性,由乘法公式知,當事件A、B獨立時,有PABPAPB,PABPBPA|B,定義若兩事件A、B滿足PABPAPB則稱A、B獨立,或稱A、B相互獨立。,例從一副不含大小王的撲克牌中任取一張,記A{抽到K},B{抽到的牌是黑色的},問事件A、B是否獨立,可見,PABPAPB,,由于PA4/521/13,,說明事件A、B獨立。,解,PAB2/521/26,PB26/521/2,例5有三個箱子,分別編號為1,2,3,1號箱裝有1個紅球4個白球,2號箱裝有2紅3白球,3號箱裝有3紅球。某人從三箱中任取一箱,從中任意摸出一球,求取得紅球的概率。,1,,,,,2,,,,,3,,,,,,解記AI{球取自I號箱},I1,2,3B{取得紅球},即BA1BA2BA3B,且A1B、A2B、A3B兩兩互斥,B發(fā)生總是伴隨著A1,A2,A3之一同時發(fā)生,,PBPA1BPA2BPA3B,運用加法公式得,將此例中所用的方法推廣到一般的情形,就得到在概率計算中常用的全概率公式。,對求和中的每一項運用乘法公式得,PBPA1BPA2BPA3B,代入數(shù)據(jù)計算得PB8/15,全概率公式,設(shè)S為隨機試驗的樣本空間,A1,A2,,AN是兩兩互斥的事件,且有PAI0,I1,2,,N,,稱滿足上述條件的A1,A2,,AN為完備事件組,則對任一事件B,有,全概率公式,全概率公式的來由,不難由上式看出“全”部概率PB被分解成了許多部分之和。,它的理論和實用意義在于在較復雜情況下直接計算PB不易,但B總是伴隨著某個AI出現(xiàn),適當?shù)厝?gòu)造這一組AI往往可以簡化計算,全概率公式,某一事件B的發(fā)生有各種可能的原因I1,2,,N,如果B是由原因AI所引起,則B發(fā)生的概率是,每一原因都可能導致B發(fā)生,故B發(fā)生的概率是各原因引起B(yǎng)發(fā)生概率的總和,即全概率公式,PBPAIPB|AI,我們還可以從另一個角度去理解全概率公式,例(敏感性問題的調(diào)查)學生閱讀黃色書刊和看黃色影像會影響學生身心健康發(fā)展,但這些都是避開家長進行的,屬于個人隱私行為。要調(diào)查觀看黃色書刊和影像的學生在全體學生中所占的比例P是一件難事。這里的關(guān)鍵是要設(shè)計一個調(diào)查方案,使被調(diào)查者愿意做出真實的回答又能保守個隱私。,STANLEYLWARNER發(fā)明了一種可以消除人們抵觸情緒的隨機化應答方法。調(diào)查方案的核心是如下兩個問題問題A你的生日是否在7月1日之前問題B你是否看過黃色書刊或影像,被調(diào)查者事先從一個裝有黑球和白球的箱子中隨機抽取一個球,看過顏色后又放回。若抽出白球則回答問題A;若抽出黑球則回答問題B。,箱中黑球所占比率A是已知的,即P{任意抽取一個是黑球}AP{任意抽取一個是白球}1A,被調(diào)查者無論回答A題或B,都只需在一張只有“是”和“否”兩個選項的答卷上作出選擇,然后投入密封的投票箱內(nèi)。,上述抽球和答卷都在一間無人的房間內(nèi)進行,任何人都不知道被調(diào)查者抽到什么顏色的球以及在答卷中如何選擇,這樣就不會泄露個人秘密,從而保證了答卷的真實可靠性。,當有較多的人參加調(diào)查后,打開投票箱進行統(tǒng)計。設(shè)共有N張有效答卷,其中K張選擇“是”,則可用頻率K/N估計回答“是”的概率Β,記為,ΒP{答’是’}K/N,回答是有兩種情況一種是摸到白球?qū)栴}A回答是,也就是被調(diào)查者“生日在7月1日之前”的概率,一般認為是05,即P{答是|抽白球}05,另一種是摸到黑球后對問題B回答是,這個條件概率就是看不健康書刊或影像的學生在參加調(diào)查的學生中的比率P,即P{答是|抽黑球}P,利用全概率公式得P{答是}P{抽白球}P{答是|抽白球}+P{抽黑球}P{答是|抽黑球},如在一項調(diào)查大學生看過不健康書刊或影像的調(diào)查時共有全校1583名學生參加,最后統(tǒng)計答卷,全部有效。其中回答“是”的有389張,據(jù)此可估算出,假設(shè)箱子中共有50個球,其中30個黑球,則A06。,實際中還有下面一類問題,是“已知結(jié)果求原因”,這一類問題在實際中更為常見已知某結(jié)果發(fā)生條件下,求各原因發(fā)生可能性大小。,某人從任一箱中任意摸出一球,發(fā)現(xiàn)是紅球,求該球是取自1號箱的概率。,或者問該球取自哪號箱的可能性最大,有三個箱子,分別編號為1,2,3,1號箱裝有1個紅球4個白球,2號箱裝有2紅球3白球,3號箱裝有3紅球。某人從三箱中任取一箱,從中任意摸出一球,發(fā)現(xiàn)是紅球,求該球是取自1號箱的概率。,記AI{球取自I號箱},I1,2,3B{取得紅球},求PA1|B,運用全概率公式計算PB,將這里得到的公式一般化,就得到,貝葉斯公式,貝葉斯公式,該公式于1763年由貝葉斯BAYES給出。它是在觀察到事件B已發(fā)生的條件下,尋找導致B發(fā)生的每個原因的概率。,則對任一事件,有,例某一地區(qū)患有癌癥的人占0005,患者對一種試驗反應是陽性的概率為095,正常人對這種試驗反應是陽性的概率為004,現(xiàn)抽查了一個人,試驗反應是陽性,問此人是癌癥患者的概率有多大,則表示“抽查的人不患癌癥”,解,設(shè)C{抽查的人患有癌癥},A{結(jié)果是陽性},由貝葉斯公式,可得,代入數(shù)據(jù)計算得PC|A01066,現(xiàn)在來分析一下結(jié)果的意義,檢出陽性是否一定患有癌癥,這種試驗對于診斷一個人是否患有癌癥有無意義,如果不做試驗,抽查一人是患者的概率PC0005,患者陽性反應的概率是095,若試驗后得陽性反應,則根據(jù)試驗得來的信息,此人是患者的概率為PC|A01066,這種試驗對于診斷一個人是否患有癌癥有意義,從0005增加到01066,將近增加約21倍,1試驗對于診斷一個人是否患有癌癥有無意義,2檢出陽性是否一定患有癌癥,,試驗結(jié)果為陽性,此人確患癌癥的概率為PC|A01066,即使某人檢出陽性,尚可不必過早下結(jié)論他有癌癥,這種可能性只有1066,此時醫(yī)生常要通過再試驗來確認。,貝葉斯公式從數(shù)量上刻畫了這種變化。,在貝葉斯公式中,PAI和PAI|B分別稱為原因的先驗概率和后驗概率。,PAII1,2,,N是在沒有進一步信息(不知道事件B是否發(fā)生)的情況下,人們對諸事件發(fā)生可能性大小的認識。當有了新的信息(知道B發(fā)生),人們對諸事件發(fā)生可能性大小PAI|B有了新的估計。,,在不了解案情細節(jié)事件B之前,偵破人員根據(jù)過去的前科,對他們作案的可能性有一個估計,設(shè)為,例如,某地發(fā)生了一個案件,懷疑對象有甲、乙、丙三人,甲,乙,丙,PA1,PA2,PA3,但在知道案情細節(jié)后,這個估計就有了變化。,PA1|B,知道B發(fā)生后,PA2|B,PA3|B,,,,,
下載積分: 6 賞幣
上傳時間:2024-01-07
頁數(shù): 90
大?。?5.38(MB)
子文件數(shù):
-
簡介:2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,第二章計量資料的統(tǒng)計描述,集中趨勢描述均數(shù)對稱分布,特別是正態(tài)分布資料幾何均數(shù)等比級數(shù)資料,對數(shù)正態(tài)分布資料中位數(shù)不適合用幾何均數(shù)描述的偏態(tài)分布資料末端有不確定數(shù)據(jù)的正態(tài)分布資料離散趨勢描述極差不穩(wěn)定四分位數(shù)間距用于偏態(tài)分布資料方差與標準差用于正態(tài)分布資料,描述平均變異\絕對變異變異系數(shù)用于正態(tài)分布資料變異度對比\相對變異,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,例21從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇的測量結(jié)果如下,試編制頻數(shù)分布表。,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,編制步驟,求極差極差(RANGE)也稱全距確定組段數(shù)和組距根據(jù)組距寫出組段分組劃記并統(tǒng)計頻數(shù),,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,表22115名正常成年女子血清轉(zhuǎn)氨酶(MMOL/L)含量分布,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,頻數(shù)表和頻數(shù)分布圖的用途,描述頻數(shù)分布的類型描述頻數(shù)分布的特征便于發(fā)現(xiàn)一些特大或特小的可疑值便于進一步做統(tǒng)計分析和處理,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,集中趨勢的描述–均數(shù),直接計算法頻數(shù)表法,,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,集中趨勢的描述–幾何均數(shù),公式,,,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,集中趨勢的描述–中位數(shù),N為奇數(shù)N為偶數(shù),,,,,,,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,離散趨勢描述極差\四分位距,極差R最大值與最小值之差四分位距,,,,,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,離散趨勢描述方差\標準差,總體方差與總體標準差樣本標準差,,,,,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,離散趨勢描述變異系數(shù),不同均數(shù)資料的變異度比較不同度量單位資料的變異度比較,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,一、常用相對數(shù),強度相對數(shù)率某時期內(nèi)發(fā)生某現(xiàn)象的觀察單位數(shù)同期可能發(fā)生某現(xiàn)象的觀察單位總數(shù)結(jié)構(gòu)相對數(shù)構(gòu)成比某一組成部分的觀察單位數(shù)同一事物各組成部分的觀察單位總數(shù)相對比甲指標/乙指標,,,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,二、計算相對數(shù)的注意事項,結(jié)構(gòu)相對數(shù)不能代替強度相對數(shù)(以比代率)計算相對數(shù)應有足夠數(shù)量正確計算合并率注意資料的可比性相對數(shù)的抽樣誤差,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,SPSS軟件簡介,常用窗口數(shù)據(jù)窗\程序窗\結(jié)果輸出窗口變量定義變量名不超過8個字符,最好以英文字母加數(shù)字組成,避免用中文變量類型數(shù)值型\日期型\字符型小數(shù)位數(shù)缺失值定義變量標簽可用中文值標簽分類變量需要定義值標簽文件類型數(shù)據(jù)文件SAV程序文件SPS結(jié)果文件SPO,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,產(chǎn)生新變量,數(shù)據(jù)排序SORT,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,數(shù)據(jù)庫建立,設(shè)計正確的數(shù)據(jù)庫,保證統(tǒng)計軟件能識別數(shù)據(jù)庫一般為行列表第一行為變量名一個CASE占用一行一個VARIABLE占一列盡可能采用數(shù)據(jù)形式錄入,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,數(shù)據(jù)的前處理,數(shù)據(jù)庫數(shù)據(jù)的儲存\備份\使用權(quán)限數(shù)據(jù)雙輸?shù)谋匾獢?shù)據(jù)庫名稱,變量定義,必要的說明原始數(shù)據(jù)的重要性電子數(shù)據(jù)庫\紙質(zhì)數(shù)據(jù)庫數(shù)據(jù)考察數(shù)據(jù)類型分布異常值缺失數(shù)據(jù)的處理數(shù)據(jù)清理與鎖定數(shù)據(jù)庫軟件ACCESS,EPIDATA,ORACAL統(tǒng)計軟件中的數(shù)據(jù)庫,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,描述性統(tǒng)計,計量資料圖表形式箱式圖、直方圖指標形式集中趨勢均數(shù)、中位數(shù)、幾何均數(shù)離散趨勢極差、四分位距、方差、標準差、變異系數(shù)分類資料圖標形式直方圖、線圖指標形式率、比,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,數(shù)據(jù)庫一般操作,數(shù)據(jù)庫合并MERGE追加變量、追加病例數(shù)據(jù)庫拆分SPLIT衍生數(shù)據(jù)產(chǎn)生新的變量,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,常用命令_衍生數(shù)據(jù)命令,產(chǎn)生新變量TRANSFORMRECODENUMERICSTRINGCOMPUTECONSTANTFUNCTIONSDATE/TIME,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,常用命令_數(shù)據(jù)步命令1,數(shù)據(jù)步INSERTVARIABLESINSERTCASEGOTOCASESORTCASES,SELECTCASESGIVESOMECONDITIONSWEIGHTCASESJUSTUSEDFORGROUPEDDATABASE,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,常用命令_數(shù)據(jù)步命令2,FILECOMMANDSSPLITFILESPLITFILEINTOSUBDATABASEACCORDINGTOTHECATEGORICALVARIABLESMERGEFILESADDCASESTHEFILESSHOULDBEHAVESAMESTRUCTURESADDVARIABLESKEYVARIABLEUNIQUEIDENTIFICATIONNUMBERFORTHEOBSERVATIONS,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,常用命令_數(shù)據(jù)步命令2,數(shù)據(jù)庫架構(gòu)改變TRANSPOSEROWCOLUMNTRANSPOSEROWSANDCOLUMNSRESTRUCTURELONGSHORTREPEATEDMEASUREMENT,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,描述性統(tǒng)計過程,DESCRIPTIVESTATISTICSFREQUENCIESCONTINUOUSVARIABLESCATEGORICALVARIABLESDESCRIPTIVECONTINUOUSVARIABLESNORMALDISTRIBUTEDEXPLORECONTINUOUSVARIABLESCROSSTABSCATEGORICALVARIABLES,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,基本統(tǒng)計圖,GRAPHSBARGRAPHCONTINUOUS/CATEGORICALVARIABLESCOMPARISONPIEGRAPHCATEGORICALVARIABLESCONSTITUENTRATIOLINEGRAPHPROPORTIONSANDTIMEVARIABLESTIMETRENDHISTOGRAMCONTINUOUSVARIABLESFREQUENCYDISTRIBUTIONSCATTERPLOTCONTINUOUSVARIABLESCORRELATIONANALYSISBOXPLOTCONTINUOUSVARIABLESCHECKMEDIAN,QUARTILES,MAXIMUM,MINIMUM,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,統(tǒng)計圖_連續(xù)型變量,MEASURESTHATARERECORDEDONANATURALLYOCCURRINGNUMBERSCALEBOXPLOTSHISTOGRAM,2024/3/21,XIANJIAOTONGUNIVERSITYMEDICALSCHOOL,GRAPHCOMMANDS,HISTOGRAMHORIZONTALSCALEREPRESENTSTHEVALUEOFTHEVARIABLETHEVERTICALSCALEREPRESENTSTHEFREQUENCYORRELATIVEFREQUENCYINEACHINTERVALRECTANGULARBARSAREJOINEDTOGETHERPRACTICEHISTOGRAMFORHBCONCENTRATIONOFGIRLS,
下載積分: 6 賞幣
上傳時間:2024-01-07
頁數(shù): 29
大小: 0.3(MB)
子文件數(shù):
-
簡介:第一章概率論基礎(chǔ)知識,授課教師楊衛(wèi)華博士,第一節(jié)隨機事件及其概率,基本概念,隨機試驗(RANDOMTRIALORRANDOMEXPERIMENT)基本事件(ELEMENTARYEVENT)一次隨機試驗的可能結(jié)果,也稱基本隨機事件樣本空間(SAMPLESPACE)所有基本事件所組成的集合,基本概念,隨機事件(RANDOMEVENT)一些基本事件所組成的集合不相容事件(MUTUALLYEXCLUSIVEEVENTS)在隨機試驗中,不能同時發(fā)生的幾個事件,或其交集為空集的幾個事件,稱為不相容事件。概率(PROBABILITY)對事件出現(xiàn)的可能性大小的一種嚴格的度量“嚴格”指從無限次重復角度看,度量結(jié)果具有唯一性。,概率的含義,事件A的概率是一個介于0和1之間的一個值,用以度量試驗完成時事件A發(fā)生的可能性大小,記為PA當試驗的次數(shù)很多時,概率PA可以由所觀察到的事件A發(fā)生次數(shù)頻數(shù)的比例來逼近在相同條件下,重復進行N次試驗,事件A發(fā)生了M次,則事件A發(fā)生的概率可以寫為,例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)N的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右,主觀概率,主觀概率是指對一些無法重復的試驗,確定其結(jié)果的概率只能根據(jù)以往的經(jīng)驗,人為確定這個事件的概率。,某企業(yè)想投資個新的項目,那么投資成功的可能性有多大呢投資成功的概率為07,投資失敗的概率為03,第二節(jié)概率性質(zhì)與運算法則,概率的性質(zhì),非負性對任意事件A,有0≤P(A)≤1規(guī)范性必然事件的概率為1;不可能事件的概率為0。即P?1;P?0可加性若A與B互斥,則PA∪BPAPB推廣到多個兩兩互斥事件A1,A2,,AN,有PA1∪A2∪3∪ANPA1PA2PAN,事件的補及其概率,事件的補COMPLEMENT事件A不發(fā)生的事件,稱為事件A的補事件或稱逆事件,記為?A。它是樣本空間中所有不屬于事件A的樣本點的集合。,P?A1PA,加法公式,加法公式對任意兩個隨機事件A和B,它們和的概率為兩個事件分別概率的和減去兩個事件交的概率,即PA∪BPAPBPA∩B,兩個事件的并,兩個事件的交,,,條件概率CONDITIONALPROBABILITY,在事件B已經(jīng)發(fā)生的條件下事件A發(fā)生的概率,稱為已知事件B時事件A的條件概率,記為PA|B,事件B及其概率PB,S,,事件A?B及其概率PA?B,事件A,事件B,,一旦事件B發(fā)生,,,,,,,,,條件概率例題分析1,設(shè)A顧客購買食品,B顧客購買其他商品依題意有PA080;PB060;PAB035,【例】一家超市所作的一項調(diào)查表明,有80的顧客到超市是來購買食品,60的人是來購買其他商品,35的人既購買食品也購買其他商品。求1已知某顧客購買食品的條件下,也購買其他商品的概率2已知某顧客購買其他商品的條件下,也購買食品的概率,1,2,條件概率例題分析2,【例】一家電腦公司從兩個供應商處購買了同一種計算機配件,質(zhì)量狀況如下表所示從這200個配件中任取一個進行檢查,求1取出的一個為正品的概率2取出的一個為供應商甲的配件的概率3取出一個為供應商甲的正品的概率4已知取出一個為供應商甲的配件,它是正品的概率,,條件概率例題分析2,解設(shè)A取出的一個為正品B取出的一個為供應商甲供應的配件1234,乘法公式MULTIPLICATIONTHEOREM,用來計算兩事件交的概率以條件概率的定義為基礎(chǔ)設(shè)A,B為兩個事件,若PB0,則PABPBPA|B或PABPAPB|A,乘法公式例題分析,【例】一家報紙的發(fā)行部已知在某社區(qū)有75的住戶訂閱了該報紙的日報,而且還知道某個訂閱日報的住戶訂閱其晚報的概率為50。求某住戶既訂閱日報又訂閱晚報的概率,解設(shè)A某住戶訂閱了日報B某住戶訂閱了晚報依題意有PA075;PB|A050PABPAPB|A075050375,獨立事件與乘法公式INDEPENDENTEVENTS,若PA|BPA或PB|APB,則稱事件A與事件B獨立,或稱獨立事件若兩個事件相互獨立,則這兩個事件同時發(fā)生的概率等于它們各自發(fā)生的概率之積,即PABPAPB若事件A1,A2,?,AN相互獨立,則PA1,A2,?,ANPA1PA2?PAN,獨立事件與乘法公式例題分析,【例】假定我們是從兩個同樣裝有3個紅球2個白球的盒子摸球。每個盒子里摸1個。求連續(xù)兩次摸中紅球的概率,解設(shè)A從第一個盒子里摸到紅球B從第二個盒子里摸到紅球依題意有PA3/5;PB|A3/5PABPAPB|A3/53/5036,事件的獨立性與互斥,互斥事件一定是相互依賴不獨立的,但相互依賴的事件不一定是互斥的。不互斥事件可能是獨立的,也可能是不獨立的,然而獨立事件不可能是互斥的。,全概率公式(LAWOFTOTALPROBABILITY,全概公式,A1A5完備事件組,或樣本的一個劃分,B,,先找樣本劃分,再找條件概率,全概率公式例題分析,【例】某電子設(shè)備制造廠所用的元件是由三家元件制造廠提供的,根據(jù)以往的記錄有以下數(shù)據(jù)在倉庫中隨機取一個元件,求它是次品的概率,,解設(shè)B表示取到的是一個次品,AI(I1,2,3)表示所取到的產(chǎn)品是第I家工廠提供的。A1,A2,A3是樣本空間的一個劃分,且有P(A1)015,P(A2)080,P(A3)005,P(B∣A1)002,P(B∣A2)001,P(B∣A3)003全概公式P(B)P(B∣A1)P(A1)P(B∣A2)P(A2)P(B∣A3)P(A3),貝葉斯公式,貝葉斯公式,PAK被稱為事件AK的先驗概率PRIORPROBABILITYPAK|B被稱為事件AK的后驗概率POSTERIORPROBABILITY,貝葉斯公式例題分析,【例】某考生回答一道四選一的考題,假設(shè)他知道正確答案的概率為1/2,而他不知道正確答案時猜對的概率應該為1/4??荚嚱Y(jié)束后發(fā)現(xiàn)他答對了,那么他知道正確答案的概率是多大呢,解設(shè)A該考生答對了,B該考生知道正確答案依題意有PB1/2;P?B11/21/2PA|?B1/4PA|B1,第三節(jié)離散型隨機變量及其分布,隨機變量RANDOMVARIABLES,,表征隨機試驗結(jié)果的變量所有基本事件所對應的值【例】投擲兩枚硬幣出現(xiàn)正面的數(shù)量,設(shè)隨機變量為XX0;X1;X2,隨機變量的取值可以是數(shù)值或字符串,,離散型隨機變量DISCRETERANDOMVARIABLES,,隨機變量X取有限個值或所有取值都可以逐個列舉出來X1,X2,以確定的概率取這些不同的值離散型隨機變量的一些例子,離散型隨機變量的概率分布(PROBABILITYDISTRIBUTION,,列出離散型隨機變量X的所有可能取值列出隨機變量取這些值的概率通常用下面的表格來表示,PXXIPI稱為離散型隨機變量的概率函數(shù)PI?0;,離散變量的累積概率CUMULATIVEPROBABILITY,累積概率P(X≤X),累積概率分布,離散型隨機變量的數(shù)學期望EXPECTEDVALUE,,離散型隨機變量X的所有可能取值XI與其取相對應的概率PI乘積之和(也叫均值);描述離散型隨機變量取值的集中程度;記為?或EX;計算公式為,離散型隨機變量的方差VARIANCE,,隨機變量X的每一個取值與期望值的離差平方和的數(shù)學期望,記為?2或DX描述離散型隨機變量取值的分散程度計算公式為方差的平方根稱為標準差,記為?,離散系數(shù),用來比較不同期望值的總體之間的離中趨勢。,離散系數(shù)標準差除以期望離散系數(shù)越小,變異越小,例題如果投資項目A的預期回報率為7,標準差為5%;而投資項目B的預期回報率為12%,標準差為7%,試問哪個投資項目風險較大,根據(jù)離散系數(shù)判斷A為7/50714B為12/70583,離散變量聯(lián)合分布和邊緣分布,邊緣分布,,,聯(lián)合分布,,典型的離散變量分布,兩點分布(01分布),,一個離散型隨機變量X只取0和1兩個可能的值它們的概率分布為或,二項分布BINOMIALDISTRIBUTION,重復進行N次試驗,出現(xiàn)“成功”的次數(shù)的概率分布稱為二項分布,記為XBN,P設(shè)X為N次重復試驗中出現(xiàn)成功的次數(shù),X取K的概率為,,二項分布數(shù)學期望和方差,,數(shù)學期望?EXNP方差?2DXNPQ,01分布和二項分布的應用,P(X1)P;P(X0)1P;,,,,,應用領(lǐng)域,P(XX)P;二項分布,01分布的兩個重要統(tǒng)計量,從01分布的總體中,隨機抽取N個樣本,X1,X2,XN,建立均值函數(shù),隨機變量的均值就是01分布的均值P,隨機變量的方差就是01分布方差的1/N,高收入人群的比例,,,,,,,,,,,,,,,,,,,,,,,,,,,,總體,,高收入判斷標準月收入超過5000元,“是”X1,“否”X0,第一次抽樣M個人,X11,X20,XM1,抽樣N次后,01分布的“樣本和函數(shù)”,,,,,,,,,,,,,,,,,,,,,,,,,,,,總體,,高收入判斷標準月收入超過5000元,“是”X1,“否”X0,抽樣N個人,X11,X20,XN1,想知道這次抽樣中高收入的人有多少,樣本和函數(shù),樣本和函數(shù)服從二項分布BN,P,超幾何分布,設(shè)有N件產(chǎn)品,其中有M件次品。現(xiàn)從中任取N件(N≤N),則在N件中所含次品件數(shù)XM服從超幾何分布。,泊松分布POISSONDISTRIBUTION,,1837年法國數(shù)學家泊松DPOISSON,17811840首次提出用于描述在一指定時間范圍內(nèi)或在一定的長度、面積、體積之內(nèi)某一事件出現(xiàn)次數(shù)的分布泊松分布的例子一定時間段內(nèi),某航空公司接到的訂票電話數(shù)一定時間內(nèi),到車站等候公共汽車的人數(shù)一定時間段內(nèi),放射性物質(zhì)放射的粒子數(shù)一定路段內(nèi),路面出現(xiàn)大損壞的次數(shù)一匹布上發(fā)現(xiàn)的疵點個數(shù)一定頁數(shù)的書刊上出現(xiàn)的錯別字個數(shù),泊松分布概率分布函數(shù),,?給定的時間間隔、長度、面積、體積內(nèi)“成功”的平均數(shù)E271828K給定的時間間隔、長度、面積、體積內(nèi)“成功”的次數(shù),泊松分布數(shù)學期望和方差,,數(shù)學期望EX?方差DX?,第四節(jié)連續(xù)型隨機變量及其分布,連續(xù)型隨機變量CONTINUOUSRANDOMVARIABLES,,可以取一個或多個區(qū)間中任何值所有可能取值不可以逐個列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點連續(xù)型隨機變量的一些例子,連續(xù)型隨機變量的概率分布,,它取任何一個特定的值的概率都等于0不能列出每一個值及其相應的概率通常研究它取某一區(qū)間值的概率PX1?X?X2)用概率密度函數(shù)的形式和分布函數(shù)的形式來描述,注意,連續(xù)型隨機變量的累積概率,F(X)P(X≤X0)P,概率密度函數(shù)PROBABILITYDENSITYFUNCTION,,設(shè)X為一連續(xù)型隨機變量,X為任意實數(shù),X的概率密度函數(shù)記為FX,它滿足條件,FX不是概率,密度函數(shù),密度函數(shù)FX表示X的所有取值X及其頻數(shù)FX,概率密度函數(shù),,在平面直角坐標系中畫出FX的圖形,則對于任何實數(shù)X1X2,PX1X?X2是該曲線下從X1到X2的面積,概率是密度函數(shù)曲線下的面積,分布函數(shù)DISTRIBUTIONFUNCTION,,連續(xù)型隨機變量的概率可以用分布函數(shù)FX來表示分布函數(shù)定義為,根據(jù)分布函數(shù),PAXB可以寫為,分布函數(shù)與密度函數(shù)的圖示,概率密度函數(shù)曲線下的面積等于1分布函數(shù)是曲線下小于X0的面積,連續(xù)型隨機變量的期望和方差,,連續(xù)型隨機變量的數(shù)學期望方差,連續(xù)變量聯(lián)合分布和邊緣分布,聯(lián)合分布,X的邊緣分布,Y的邊緣分布,,連續(xù)變量條件概率密度,相互獨立的連續(xù)變量,典型的連續(xù)變量分布,均勻分布UNIFORMDISTRIBUTION,若隨機變量X的概率密度函數(shù)為稱X在A,B上服從均勻分布,記為XUA,B數(shù)學期望和方差,均勻分布,均勻分布的分布函數(shù)為,均勻分布概率計算,隨機變量X在某取值范圍A,B的任一子區(qū)間C,D上取值的概率為同樣有,指數(shù)分布,用來表示獨立隨機事件發(fā)生的時間間隔,比如旅客進機場的時間間隔。許多電子產(chǎn)品的壽命分布一般服從指數(shù)分布。有的系統(tǒng)的壽命分布也可用指數(shù)分布來近似。,指數(shù)分布,分布函數(shù),指數(shù)分布的期望為1/Λ,方差為1/Λ2,正態(tài)分布NORMALDISTRIBUTION,由CF高斯CARLFRIEDRICHGAUSS,17771855作為描述誤差相對頻數(shù)分布的模型而提出描述連續(xù)型隨機變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述可用于近似離散型隨機變量的分布例如二項分布經(jīng)典統(tǒng)計推斷的基礎(chǔ),概率密度函數(shù),,FX隨機變量X的頻數(shù)?正態(tài)隨機變量X的均值??正態(tài)隨機變量X的方差?31415926E271828X隨機變量的取值?X?,?和?對正態(tài)曲線的影響,,正態(tài)分布函數(shù)的性質(zhì),圖形是關(guān)于X?對稱鐘形曲線,且峰值在X?處均值?和標準差?一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個完整的“正態(tài)分布族”均值?可取實數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標準差決定曲線的“陡峭”或“扁平”程度。?越大,正態(tài)曲線越扁平;?越小,正態(tài)曲線越高越陡峭當X的取值向橫軸左右兩個方向無限延伸時,曲線的兩個尾端也無限漸近橫軸,理論上永遠不會與之相交正態(tài)隨機變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1,正態(tài)分布的概率,概率是曲線下的面積,,,標準正態(tài)分布STANDARDIZETHENORMALDISTRIBUTION,標準正態(tài)分布的概率密度函數(shù),隨機變量具有均值為0,標準差為1的正態(tài)分布任何一個一般的正態(tài)分布,可通過下面的線性變換轉(zhuǎn)化為標準正態(tài)分布,標準正態(tài)分布的分布函數(shù),標準正態(tài)分布,標準正態(tài)分布表的使用,,對于標準正態(tài)分布,即ZN0,1,有PA?Z?B???B????A?P|Z|?A?2??A??1對于負的Z,可由?Z?????Z?得到對于一般正態(tài)分布,即XN?,?,有,標準化的例子P5?X?62,本章重點小結(jié),隨機事件主觀概率的含義互斥和獨立的關(guān)系隨機變量期望和方差的含義離散系數(shù)的計算主要的離散變量和連續(xù)變量的概率分布有哪些重點掌握正態(tài)分布的特點標準化的作用是什么會對數(shù)據(jù)進行標準化,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 76
大小: 1.05(MB)
子文件數(shù):
-
簡介:第四章統(tǒng)計比率與指數(shù),,概念,相對指標STATISTICALRATIO是兩個有聯(lián)系的指標對比的比值,反映事物的數(shù)量特征和數(shù)量關(guān)系。,(1)反映總體內(nèi)在的結(jié)構(gòu)特征,(3)反映事物發(fā)展變化的過程和趨勢。,(2)用于不同對象的比較評價;,,作用,,種類,計劃完成相對數(shù),結(jié)構(gòu)相對數(shù),比例相對數(shù),比較相對數(shù),強度相對數(shù),動態(tài)相對數(shù),,,六種相對數(shù)指標的比較,,,,,不同時期比較,動態(tài)相對數(shù),強度相對數(shù),不同現(xiàn)象比較,,,,不同總體比較,比較相對數(shù),同一總體中,,,,部分與部分比較,部分與總體比較,實際與計劃比較,比例相對數(shù),結(jié)構(gòu)相對數(shù),計劃完成相對數(shù),同一時期比較,同類現(xiàn)象比較,,應用原則,(1)正確選擇對比的基數(shù);(2)必須注意統(tǒng)計的可比性;(3)相對指標要與總量指標相結(jié)合。,概念總指數(shù)的編制指數(shù)的因素分析指數(shù)的應用案例,指數(shù),,,,指數(shù)(INDEXNUMBER)是研究現(xiàn)象差異或變動的重要統(tǒng)計方法。它起源于18世紀歐洲關(guān)于物價波動的研究。至今,已被廣泛應用于社會經(jīng)濟生活各方面;一些重要的指數(shù)已成為社會經(jīng)濟發(fā)展的晴雨表。,主要內(nèi)容,,,,概念,概念,廣義指數(shù),狹義指數(shù),反映現(xiàn)象數(shù)量差異或變動程度的相對數(shù)。,例如,動態(tài)相對數(shù),比較相對數(shù)、計劃完成程度相對數(shù)。,,反映不能直接相加的復雜現(xiàn)象綜合變動程度的相對數(shù)。,例如,零售物價指數(shù),消費價格指數(shù)、股價指數(shù)。,反映復雜的社會經(jīng)濟現(xiàn)象總體的綜合變動;測定現(xiàn)象總變動中各個因素的影響;對多指標復雜現(xiàn)象綜合測評。,作用,按對象的范圍分,按指標的性質(zhì)分,按采用的基期分,,個體指數(shù),組指數(shù),總指數(shù),種類,,數(shù)量指標指數(shù),質(zhì)量指標指數(shù),定基指數(shù),環(huán)比指數(shù),,總指數(shù)的編制,一、綜合指數(shù),,,概念,綜合指數(shù)是總指數(shù)的基本形式。它是通過引入一個同度量因素將不能相加的變量轉(zhuǎn)化為可相加的總量指標,而后對比所得到的相對數(shù)。,綜合指數(shù),指數(shù)化因素同度量因素,指數(shù)化因素同度量因素,總量指標,總量指標,,=,=,,,,,,,,所要研究其變動程度的兩個時期的某一經(jīng)濟變量,引入一個同一時期的經(jīng)濟量,起到媒介或權(quán)數(shù)的作用,,,,,,綜合指數(shù)平均數(shù)指數(shù),,綜合指數(shù)的編制,1、數(shù)量指標的綜合指數(shù)(例銷售量指數(shù)),,,,報告期和基期的銷售量,為指數(shù)化因素,基期價格作為同度量因素,基期實際銷售額,以基期價格計算的報告期銷售額,,,,,,該指數(shù)說明多種商品銷售量的綜合變動程度。,,分子、分母之差,說明由產(chǎn)量變動帶來的銷售額的增(減)量,2、質(zhì)量指標的綜合指數(shù)(例價格指數(shù)),報告期和基期的價格,為指數(shù)化因素,報告期銷售量作為同度量因素,報告期實際銷售額,以報告期銷售量計算的基期銷售額,,,,,,該指數(shù)說明多種商品價格的綜合變動程度。,,分子、分母之差,說明由價格變動帶來的銷售額的增(減)量。,,,,3、其他形式的綜合指數(shù)公式,拉氏公式,派氏公式,馬歇爾艾奇沃斯公式,費暄的“理想公式”,固定價格的物量指數(shù),固定物量的價格指數(shù),,編制綜合指數(shù)的一般方法原則,(1)同度量因素與指數(shù)化因素相乘后必須是有實際經(jīng)濟意義的總量指標;,(2)數(shù)量指標指數(shù)以質(zhì)量指標為同度量因素;質(zhì)量指標指數(shù)以數(shù)量指標為同度量因素;,(3)同度量因素的固定時期必須以指數(shù)的經(jīng)濟意義為依據(jù)。,二、平均數(shù)指數(shù),是以總量指標為權(quán)數(shù)對個體指數(shù)進行加權(quán)平均的總指數(shù)。,,概念,,編制方法,1、加權(quán)算求平均數(shù)指數(shù),通常用來計算數(shù)量指標指數(shù)(如銷售量指數(shù)),,銷售量個體指數(shù),與銷售量個體指數(shù)相對應的銷售額占總銷售額的比重,,,2、加權(quán)調(diào)和平均數(shù)指數(shù),通常用來計算質(zhì)量指標指數(shù)(如價格指數(shù)),,價格個體指數(shù),與價格個體指數(shù)相對應的產(chǎn)品銷售額占總銷售額的比重,,,銷售量指數(shù),價格指數(shù),比較用哪種公式好,,,,實際工作中,常采用相對固定的權(quán)數(shù)。,某個經(jīng)濟發(fā)展較穩(wěn)定時期的產(chǎn)值或銷售額的結(jié)構(gòu)。,三種指數(shù)的比較,性質(zhì),資料,計算方法,差額分析,,綜合指數(shù),平均數(shù)指數(shù),狹義指數(shù),廣義指數(shù),全面資料,樣本資料,先綜合后對比,先對比后綜合,,分子、分母之差為總量差異有經(jīng)濟意義,分子、分母之差,不形成實際總量,無經(jīng)濟意義,,,,,,,總平均數(shù)指數(shù),廣義指數(shù),,分組資料,三種形式的總平均數(shù)對比自成體系,分子、分母之差為平均數(shù)差異,有意義,,指數(shù)的因素分析,一、總量指標指數(shù)的因素分析,1、方法,這是利用綜合指數(shù)的指數(shù)體系進行的因素分析。,構(gòu)造有實際經(jīng)濟意義的指標體系,分析對象SAB(因素指標),將指標體系轉(zhuǎn)換為指數(shù)體系,分析某一因素變動影響時,將其他因素固定,分析相對變動影響時,也分析絕對差額影響,方法步驟,,A1A0B0B1B0A1,A1B0A1B1,A0B0A1B0,___________,2、舉例,兩因素分析,,產(chǎn)值產(chǎn)量價格,產(chǎn)值指數(shù)產(chǎn)量指數(shù)價格指數(shù),,,,指數(shù)體系,,代入資料計算得到,151331266711947770400370萬元,,,注意(1)固定因素時期的選擇要滿足平衡的要求;,(2)因素的排序要使相鄰兩變量能分能合。,SABC;,DC,,或SABC,AE,,,,原材料支出總額指數(shù)產(chǎn)量指數(shù)單耗指數(shù)原材料單價指數(shù),原材料支出總額產(chǎn)量單耗原材料單價,,,,,代入資料計算得到10853109178837112502420260036003420(萬元),指數(shù)體系,,多因素分析,二、平均數(shù)指標指數(shù)的因素分析,1。特點,總平均數(shù)指數(shù)是對總平均指標變動程度的測定,(1)屬于廣義指數(shù);,(2)以組平均數(shù)為基礎(chǔ),突出結(jié)構(gòu)因素;,(3)有三種形式。,,可變構(gòu)成指數(shù),固定構(gòu)成指數(shù),結(jié)構(gòu)變動影響指數(shù),,,,2、例,某企業(yè)成本變動總指數(shù),(1)可變構(gòu)成指數(shù)(包含組平均數(shù)變動和結(jié)構(gòu)變動雙重影響),某企業(yè)報告期和基期單位成本,報告期和基期各車間產(chǎn)量所占比重,,,,,,,,即雙重因素影響企業(yè)單位成本變動。,(2)固定構(gòu)成指數(shù)(只反映各車間平均單位成本變動影響),,,各車間報告期、基期單位成本,,,代入資料計算,代入資料計算,即由于各車間單位成本的平均變動帶來的企業(yè)總成本的增加。,(3)結(jié)構(gòu)變動影響指數(shù),,,,代入資料計算,報告期和基期各車間產(chǎn)量所占比重,,即由于企業(yè)產(chǎn)量結(jié)構(gòu)變動帶來的企業(yè)平均單位成本的減少。,三個指數(shù)的關(guān)系,可變構(gòu)成指數(shù)固定構(gòu)成指數(shù)結(jié)構(gòu)變動影響指數(shù),,勞動生產(chǎn)率變動的差額,三、將綜合指數(shù)同平均數(shù)指數(shù)結(jié)合進行多因素分析。混合型因素分析,,例某煤礦公司產(chǎn)量增長因素分析。,煤產(chǎn)量指數(shù)勞動生產(chǎn)率指數(shù)工人人數(shù)指數(shù),代入資料計算得到2071419918104150014440560(千噸),式中的,即勞動生產(chǎn)率可變構(gòu)成指數(shù),代入產(chǎn)量指數(shù)分解式,,代入資料計算得到20714176621153910415000122002240560(千噸),為了維護本課件多媒體的版權(quán),本網(wǎng)站僅上傳每章節(jié)若干頁講義,望大家諒解。,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 23
大?。?0.82(MB)
子文件數(shù):
-
簡介:衛(wèi)生統(tǒng)計學,,,,,1掌握統(tǒng)計學的主要內(nèi)容和工作步驟,導學GUIDING,3了解統(tǒng)計學的發(fā)展史和學習統(tǒng)計學的意義,2熟悉統(tǒng)計學的基本概念與分類;統(tǒng)計學的基本研究方法,,第一章緒論,2024/3/21,3,,第一章緒論,2024/3/21,學統(tǒng)計學,最高境界是具備統(tǒng)計學思維用統(tǒng)計學的眼光看待實際問題如用統(tǒng)計學思維看待醫(yī)學現(xiàn)象,,第一章緒論,在終極的分析中,一切知識都是歷史,在抽象的意義下,一切科學都是數(shù)學,在理性的基礎(chǔ)上,所有的判斷都是統(tǒng)計學,,,,日常用語中統(tǒng)計人數(shù),定義統(tǒng)計學是處理數(shù)據(jù)中變異性和復雜性的科學和藝術(shù),國際韋氏大辭典中WHAT’STHESTATISTICS,,1統(tǒng)計學的概念,,一、統(tǒng)計學的概念與分類,,統(tǒng)計學是處理數(shù)據(jù)中變異性HOMOGENEITY和復雜性COMPLICACY的科學和藝術(shù),在數(shù)據(jù)日益成為一種重要信息的信息社會里,統(tǒng)計學不僅是專業(yè)知識的講授與運用,更重要的是學會如何正確地進行統(tǒng)計思維,形成用數(shù)據(jù)說話的科學態(tài)度。,6,,一、統(tǒng)計學的概念與分類,,作為一門藝術(shù)必須在概率論和數(shù)理統(tǒng)計理論的指導下,正確運用統(tǒng)計思維,針對數(shù)據(jù)特點,選用適宜統(tǒng)計分析方法,讓科學發(fā)展更縝密、更完美、更實用,,作為一門科學必須如實反映現(xiàn)狀,無論從實施統(tǒng)計方法或進行科學研究的角度,目的都在于得到真實、可靠的的數(shù)據(jù),,,,,2024/3/21,,2統(tǒng)計學的分類,理論統(tǒng)計學主要探討統(tǒng)計學的數(shù)學原理和統(tǒng)計公式的來源。側(cè)重統(tǒng)計學理論與方法的數(shù)理證明。其實質(zhì)是以歸納方法研究隨機變量的一般規(guī)律,中心內(nèi)容是統(tǒng)計推斷,THEORETICALSTATISTICS,EG,生物統(tǒng)計學BIOSTATISTICS,衛(wèi)生統(tǒng)計學HYGEIANSTATISTICS,中醫(yī)統(tǒng)計學TCMSTATISTICS,,應用統(tǒng)計學側(cè)重于統(tǒng)計理論與方法在各個實踐領(lǐng)域中的應用,較少涉及統(tǒng)計公式推導及理論上的證明,著重介紹各種統(tǒng)計方法在各學科中的應用條件和具體應用,及其統(tǒng)計計算結(jié)果的解釋,APPLIEDSTATISTICS,統(tǒng)計學,國際醫(yī)學界把生命科學研究、臨床醫(yī)學研究和預防醫(yī)學研究中的統(tǒng)計學稱為生物統(tǒng)計學,醫(yī)學統(tǒng)計學MEDICINALSTATISTICS,7,,一、統(tǒng)計學的概念與分類,,2024/3/21,統(tǒng)計學的理論是隨著人類社會生產(chǎn)的需要而產(chǎn)生,同時也隨著人類社會生產(chǎn)的發(fā)展而更新。由統(tǒng)計實踐上升到統(tǒng)計學,僅有300余年的歷史人類最初利用手指、石子、貝殼、小木棍以及繩索等工具進行的計數(shù)活動就蘊藏著統(tǒng)計萌芽,,1統(tǒng)計發(fā)展史,8,,二、統(tǒng)計學發(fā)展史,,,二、統(tǒng)計學發(fā)展史,古典統(tǒng)計學的萌芽時期1670STO1800S,近代統(tǒng)計學的形成時期1800STO1900S,現(xiàn)代統(tǒng)計學的發(fā)展時期1900S,按統(tǒng)計方法的歷史演變順序,統(tǒng)計學的發(fā)展史可分為3個階段,阿痕瓦爾(德國,17191772),LOUIS醫(yī)生(17871872),KARLPEARSON18571936,DOLL和HILL的研究,RONALDAFISHER18901962,反應停事件(1960年代初),,二、統(tǒng)計學發(fā)展史,,2統(tǒng)計學發(fā)展過程中的重大歷史人物和事件,2024/3/21,11,,,,研究設(shè)計RESEARCHDESIGN按照研究目的和統(tǒng)計學要求制定具有針對性、具體性、專業(yè)性的工作方案,統(tǒng)計描述STATISTICALDESCRIPTION用統(tǒng)計指標、統(tǒng)計圖、統(tǒng)計表等方法描述樣本資料的數(shù)據(jù)特征及其分布規(guī)律,統(tǒng)計推斷STATISTICALINFERENCE用樣本信息推論總體特征的歸納過程,統(tǒng)計學的主要內(nèi)容,,三、統(tǒng)計學的主要內(nèi)容,,,專業(yè)設(shè)計SPECIALIZEDDESIGN用什么方式、方法等內(nèi)容驗證假說或回答有關(guān)的專業(yè)問題,統(tǒng)計學設(shè)計STATISTICALDESIGN如何合理地安排實驗內(nèi)容,對實驗結(jié)果如何進行有效地分析。,目的保證成果的實用性(舉例1)可行性創(chuàng)新性,目的保證結(jié)果的經(jīng)濟性重復性科學性(舉例2),2024/3/21,,正確的科研設(shè)計是正確應用統(tǒng)計方法的前提,12,,三、統(tǒng)計學的主要內(nèi)容,,1研究設(shè)計RESEARCHDESIGN,,,基本方法頻數(shù)表FREQUENCYTABLE頻數(shù)圖FREQUENCYGRAPH描述數(shù)據(jù)分布形態(tài)特征與規(guī)律,常用指標集中趨勢CENTRALTENDENCY離散趨勢TENDENCYOFDISPERSION絕對數(shù)ABSOLUTENUMBER相對數(shù)RELATIVENUMBER揭示數(shù)據(jù)的基本特征,,13,,三、統(tǒng)計學的主要內(nèi)容,,2統(tǒng)計描述STATISTICALDESCRIPTION,,,參數(shù)估計ESTIMATIONOFPARAMETER以樣本指標數(shù)值統(tǒng)計量STATISTIC推斷總體指標數(shù)值參數(shù)PARAMETER范圍。統(tǒng)計學關(guān)注總體參數(shù)的大小,其依據(jù)卻是統(tǒng)計量,假設(shè)檢驗HYPOTHESISTESTING利用樣本信息,根據(jù)一定的概率水準,推斷指標間的差別有無統(tǒng)計學意義的分析方法,2024/3/21,14,,三、統(tǒng)計學的主要內(nèi)容,,3統(tǒng)計推斷STATISTICALINFERENCE,圖12,2024/3/21,15,在統(tǒng)計實踐經(jīng)驗的基礎(chǔ)上不斷地概括,形成了統(tǒng)計方法體系及工作步驟,參見圖12,基本研究方法是歸納推斷法由觀測的個體特征歸納關(guān)于總體的某種信息,,1統(tǒng)計工作的基本步驟與研究方法,,四、統(tǒng)計工作步驟和基本研究方法,統(tǒng)計研究的過程及其意義參見圖18。,2024/3/21,16,圖13統(tǒng)計研究過程及其意義,,2統(tǒng)計研究過程,,四、統(tǒng)計工作步驟和基本研究方法,,1變量和變量值,變量RANDOMVARIABLE隨機事件各種不同的結(jié)果,變量值VARIABLEVALUE隨機變量的觀測值。構(gòu)成數(shù)據(jù)或資料,2024/3/21,17,,五、統(tǒng)計學的基本概念,EG白細胞計數(shù)原屬數(shù)值變量按正常、異常分組→無序分類變量按過低<4000、正常4000~10000、過高>10000分組→有序分類變量,,變量轉(zhuǎn)化,變量類型不是一成不變的,可根據(jù)研究分析的需要進行轉(zhuǎn)換。但是,只能由高級向低級轉(zhuǎn)換。,分類變量也可數(shù)量化EG可將病人的惡心反應以0、1、2、3表示,連續(xù),有序,分類,二分,18,,五、統(tǒng)計學的基本概念,2024/3/21,19,,,EG測得5人的WBC個/M3數(shù)如下,12345,300050006000800012000,數(shù)值變量,分類變量,過低正常正常正常過高,正常3人,異常2人,二分類變量,過低1人,正常3人,過高1人,有序分類變量,,五、統(tǒng)計學的基本概念,,變量轉(zhuǎn)化,2024/3/21,,2同質(zhì)與變異,同質(zhì)HOMOGENEITY構(gòu)成總體的各觀測單位在某一方面或幾方面性質(zhì)相同或基本相同,同質(zhì)是相對的,研究對象只是在某一方面是性質(zhì)相同的,同類的觀測對象之間往往也存在著變異,變異是絕對的、客觀存在的,變異VARIATION同質(zhì)基礎(chǔ)上各觀測單位或個體之間的差異,統(tǒng)計學設(shè)計的目的就是創(chuàng)造相同,比較不同變異是統(tǒng)計學研究的基礎(chǔ),統(tǒng)計學是在同質(zhì)的基礎(chǔ)上研究變異,沒有變異就無需統(tǒng)計學,20,,五、統(tǒng)計學的基本概念,2024/3/21,,3總體與樣本,總體POPULATION根據(jù)研究目的確定的同質(zhì)觀測單位的集合,,五、統(tǒng)計學的基本概念,無限總體INFINITEPOPULATION,無空間和時間范圍限制,其觀測單位的全體數(shù)只是理論上存在有限總體FINITEPOPULATION,限定于特定的空間、時間與人群范圍內(nèi)的有限個觀測單位。總體內(nèi)個體數(shù)值的分布即總體分布POPULATIONDISTRIBUTION總體的指標數(shù)值,稱為參數(shù)PARAMETER,樣本SAMPLE從統(tǒng)計總體中隨機抽取的、有代表性的REPRESENTATIVE部分觀測單位的集合,樣本量SAMPLESIZE樣本所包含的觀測單位數(shù)樣本分布SAMPLEDISTRIBUTION樣本內(nèi)個體數(shù)值的分布樣本的指標數(shù)值,稱為統(tǒng)計量STATISTIC,2024/3/21,22,圖13樣本對總體的代表性,,五、統(tǒng)計學的基本概念,2024/3/21,23,,4誤差及其分類,誤差ERROR實際觀測值與真值之差或樣本指標與總體指標之差,,五、統(tǒng)計學的基本概念,2024/3/21,24,,,,,,實測值,真實值,非隨機誤差,隨機誤差,均數(shù),頻數(shù),圖15誤差示意圖,,五、統(tǒng)計學的基本概念,2024/3/21,25,圖16幾種情況下測量誤差,,五、統(tǒng)計學的基本概念,,,,,5事件EVENT,確定性事件CERTAINTYEVENT,隨機事件RANDOMEVENT可能發(fā)生也可能不發(fā)生的事件0<P<1概率越接近1,表明某事件發(fā)生的可能性越大EG醫(yī)生治療疾病時每一種可能的結(jié)果結(jié)果不確定,不可能事件IMPOSSIBLEEVENT不可能事件P=0,必然事件CERTAINEVENTP=1,2024/3/21,,確定性事件與隨機事件的共同特點是事物本身的含義確定隨機事件與模糊事件的共同特點是不確定性,26,,五、統(tǒng)計學的基本概念,,模糊事件FUZZYEVENT事物本身的含義不確定的現(xiàn)象。如“健康”與“不健康”,“年青”與“年老”,事物發(fā)生的某種情況或在調(diào)查、觀察和實驗中獲得的某種結(jié)果,27,從總體來說,我國公民的預期壽命是穩(wěn)定的。而且女性的預期壽命也穩(wěn)定地比男性高幾年規(guī)律性,,隨機性RANDOMICITY和規(guī)律性,預期壽命的穩(wěn)定性,說明了隨機之中有規(guī)律性。這種規(guī)律就是統(tǒng)計規(guī)律,你可能活過這個壽命,也可能活不到這個年齡隨機性,,五、統(tǒng)計學的基本概念,,,,,,6頻率、概率與小概率事件,頻率FREQUENCY某種現(xiàn)象發(fā)生的次數(shù)對于隨機事件A,在相同的條件下進行了N次實驗,事件A發(fā)生的次數(shù)為M,比值M/N為,記為FNA,概率PROBABILITY某隨機事件A發(fā)生的可能性大小。記為PA,當N→∝時,頻率FNA→概率PA,統(tǒng)計符號為PP值的取值范圍為0≤P≤1,2024/3/21,28,,五、統(tǒng)計學的基本概念,事實表明,若當試驗次數(shù)N充分大以后,頻率K/N穩(wěn)定地在概率P的附近擺動。,實際工作中,可用頻率作為概率的近似值PA≈FA=K/N,歷史上許多名家做過拋擲硬幣試驗,結(jié)果如表1。,,頻率與概率的關(guān)系,29,,五、統(tǒng)計學的基本概念,小概率事件一般是指發(fā)生概率≤005檢驗水準?的事件由于事件A發(fā)生的概率是如此之小,以至于在一次試驗抽樣時,我們往往認為它事件A不會發(fā)生小概率事件原理,在假設(shè)檢驗中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,則懷疑無效假設(shè)的真實性,,小概率事件,30,,五、統(tǒng)計學的基本概念,2024/3/21,31,,1醫(yī)學實踐中所面臨的一些問題CDTPI,治療TREATMENT如何總結(jié)自己的治療經(jīng)驗如何考證民間驗方的優(yōu)劣,,預后PROGNOSIS如何對某種疾病的最后結(jié)果進行預測,,調(diào)查INVESTIGATE如何進行社區(qū)或人群調(diào)查,,診斷DIAGNOSIS如何正確理解與制定醫(yī)學指標的正常參考值范圍如何證實自己提出的診斷方法不亞于現(xiàn)有方法,病因CAUSEOFDISEASE如何確定病因,,,,六、學習衛(wèi)生統(tǒng)計學的意義,2024/3/21,32,,,,,,,,,,,,眼到,心到,手到,用最小的風險、最低的成本、最高的信度得到最大的效益即用辨證思維去觀察事物、透過現(xiàn)象看本質(zhì)的思維模式不確定性思維概率的思想,,,,在統(tǒng)計工作過程中時時想到統(tǒng)計學方法。EG,在試驗設(shè)計時要想到設(shè)計中存在的偏移,如何在試驗中去控制這些偏移等等,不斷的學習統(tǒng)計學方法,學習別人怎么用,并且時時持批判的眼光去發(fā)現(xiàn)別人應用時的合理性和不合理性,強調(diào)實踐,從具體的統(tǒng)計工作過程中發(fā)現(xiàn)一些沒想到的、今后需要留意的問題,,統(tǒng)計思維的培養(yǎng)需要做到“三到”,,2培養(yǎng)統(tǒng)計思維,,六、學習衛(wèi)生統(tǒng)計學的意義,2024/3/21,33,,3拓寬研究思路,掌握的統(tǒng)計學理論和方法越多,其研究和分析的思路越廣,統(tǒng)計學的重要作用之一是通過嚴謹?shù)慕y(tǒng)計學設(shè)計控制研究中出現(xiàn)的各種誤差或偏倚,確保研究結(jié)果真實性VALIDITY、可靠性RELIABILITY和重復性REPEATABILITY,因此,無論問題如何復雜,統(tǒng)計學離不開總體、樣本、推斷和可靠性四個要素,,六、學習衛(wèi)生統(tǒng)計學的意義,2024/3/21,34,統(tǒng)計結(jié)論的可靠性RELIABILITY需要通過實踐去檢驗,,數(shù)據(jù)之間在專業(yè)上是否有本質(zhì)聯(lián)系,應當借助專業(yè)知識和具體實驗說明,,對于已經(jīng)公布的統(tǒng)計資料需要結(jié)合醫(yī)學理論去進行分析和利用,,統(tǒng)計學不可能創(chuàng)造規(guī)律,只能幫助人們揭示隱藏在數(shù)據(jù)內(nèi)部的規(guī)律性,,統(tǒng)計學主要用于分析不能夠直接表示為“是”、“非”的因果關(guān)系,統(tǒng)計方法是歸納性的,其結(jié)論永遠帶有一定的概率性,數(shù)據(jù)之間在專業(yè)上是否有本質(zhì)聯(lián)系,應當借助專業(yè)知識和具體實踐說明,,4做出正確推論,,六、學習衛(wèi)生統(tǒng)計學的意義,,結(jié)束語,得不足喜,失不足憂,總以發(fā)憤讀書為主須有志有恒,乃有成就曾國藩最有影響的家書中國戲劇出版社,北史編,2002版,2024/3/21,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 36
大小: 5.84(MB)
子文件數(shù):
-
簡介:醫(yī)學統(tǒng)計學,歡迎學習,,醫(yī)學統(tǒng)計學,第六章X2檢驗,學習要點●X2檢驗的基本思想●兩個樣本率比較●配對設(shè)計兩樣本率比較●多個樣本率比較●樣本構(gòu)成比的比較●兩個分類變量間的相關(guān)分析,X2檢驗用途,,1、推斷兩個或兩個以上的總體率或總體構(gòu)成比之間有無差別;2、推斷兩種屬性或兩個變量之間有無關(guān)聯(lián)性計數(shù)資料的相關(guān)分析);3、頻數(shù)分布的擬合優(yōu)度檢驗。,,X2檢驗類型,1、四格表資料X2檢驗;2、配對計數(shù)資料X2檢驗;3、行列(RC)表資料X2檢驗;4、行列(RC)列聯(lián)表X2檢驗。,,,,,第一節(jié)四格表資料X2檢驗,,用途推斷兩個總體率有無差異。,表61兩種藥物治療牙科術(shù)后疼痛控制有效率比較組別有效無效合計有效率A藥68(6371)22(2629)907556B藥58(6229)30(2571)886591合計126521787079注括號內(nèi)為理論頻數(shù),,,,,為何稱為四格表指哪四格,有效無效,A藥,B藥,以下資料的A、B、C、D是哪個,一、檢驗基本思想值的計算方法(通用公式),,式中A為實際數(shù),T為理論數(shù),根據(jù)H0的假設(shè)推算出來。,如本例H0假設(shè)兩種藥物鎮(zhèn)痛的有效率相等,如果H0成立則總的有效率126/178070797079總的無效率52/178029212921A藥理論有效人數(shù)90126/178(7079%)6371A藥理論無效人數(shù)9052/178(2921%)2629B藥理論有效人數(shù)88126/178(7079%)6229B藥理論無效人數(shù)8852/178(2921%)2571注算出一個格子的理論數(shù)后,其他格子的理論數(shù)可以用減法推算出來。,為R行C列的理論數(shù);NR為T所在行合計數(shù);NC為T所在列合計數(shù)。,T1190126/178(7079%)6371T129063712629T2112663716229T228862292571,從X2值計算公式可以看出,X2檢驗是檢驗實際分布A和理論分布T的吻合程度。若H0假設(shè)成立,則實際分布(A實際值和理論分布T理論值相差不大,X2值應較?。蝗鬑0假設(shè)不成立,則實際分布(A和理論分布T相差較大,X2值應較大。另外X2值的大小尚與格子數(shù)(自由度)有關(guān),格子數(shù)越多,X2值越大??梢愿鶕?jù)X2分布原理,由X2值確定P值,從而作出推論。V行數(shù)1列數(shù)1,X2檢驗過程,1、建立假設(shè)H0Π1=Π2H1Π1≠Π2Α=0052、計算X2值(用基本公式計算)T11=90126/178=6371T12=906371=2629T21=126-6371=6229T22=886229=2571,200,3、查X2界值表確定P值按V=1,查附表5,X2界值表得X2005,1384X201,1271X2025,1132X201,1X2X2025,1,025P014、推斷結(jié)論025P01,按?。?05,不拒絕H0,差異無統(tǒng)計學意義,還不能認為兩藥對控制牙科術(shù)后疼痛的療效不同。,(二)四格表資料X2檢驗專用公式,式中A、B、C、D為四個實際數(shù),其中A、C為陽性數(shù),B、D為陰性數(shù),N為總例數(shù)。,為省去計算理論數(shù)的麻煩,可用以下公式計算。,四格表資料X2檢驗專用公式,有效無效,A藥,B藥,,,2用專用公式計算A68、B22、C58、D30、N178,3、查X2界值表確定P值按V=1,查附表5,X2界值表得X2005,1384X201,1271X2025,1132X201,1X2X2025,1,025P014、推斷結(jié)論025P01,按?。?05,不拒絕H0,差異無統(tǒng)計學意義,還不能認為兩藥對控制牙科術(shù)后疼痛的療效不同。,(三)四格表資料X2檢驗的校正,1、四格表資料X2檢驗條件(1)當N≥40且所有T≥5,用普通X2檢驗,(2)當N≥40,但1≤T005,按?。?05水準,接受H0,尚不能認為兩種藥物的有效率有差別。如不校正,X2475,X2005,1384,P,PX20005,21060PP005,按Α005水準,不拒絕H0,故尚不能認為胃十二指腸疾病患者與健康輸血員血型構(gòu)成比不同,即尚不能認為血型與胃十二指腸疾病發(fā)病有關(guān)。,,,,,,,X2676,,,,,,,,,010,005,,,三雙向有序分類資料的關(guān)聯(lián)性檢驗1、22列聯(lián)表資料的關(guān)聯(lián)性檢驗,表65兩種血清學檢驗結(jié)果比較甲法乙法合計+-+45(A)22(B)67-6(C)20(D)26合計514293,,,,,,H0甲、乙兩種方法無相關(guān)H1甲、乙兩種方法有相關(guān)Α005V1,,,PX20005,,P0,可認為肺門密度級別有隨著矽肺期別增高而增加的趨勢。,,,PEARSON列聯(lián)系數(shù)計算公式,,例66N492,X216301,RS取值0~1;RS1,完全關(guān)聯(lián);RS0完全不關(guān)聯(lián);RS越大,關(guān)聯(lián)度越高。,RS07,高度相關(guān),,四、行列表X2檢驗注意事項,1、不宜有1/5以上格子理論數(shù)小于5,或有一個理論數(shù)小于1?!锢碚摂?shù)太小的處理方法(1)增加樣本的含量(2)刪除理論數(shù)太小的行和列(3)合理合并理論數(shù)太小的行或列第(2)和第(3)種處理方法損失信息和損害隨機性,故不宜作為常規(guī)處理方法。,2、對于單向有序行列表,行列表的X2檢驗只說明各組的效應在構(gòu)成比上有無差異,如果要比較各組的效應有無差別,需應用秩和檢驗。例─────────────────────治愈顯效無效死亡合計─────────────────────治療組A1B1C1D1N1對照組A1B2C2D2N2─────────────────────合計ABCDN─────────────────────X2檢驗只說明兩組的四種療效在總治療人數(shù)所占比例有無差別;秩和檢驗說明兩組療效有無差別。解決此問題方法X2分割法。,3、當三個及以上率(或構(gòu)成比)比較,結(jié)論拒絕H0時,只能總的說有差別,但不能說明它們彼此間都有差別,或某兩者間有差別。解決此問題方法X2分割法。X2分割法原理把原行列表分割為若干個分割表(四格表),各分割表的自由度之和等于原行列表的自由度,其X2值之和約等于原行列表的X2值。,X2分割方法(1)把率(或構(gòu)成比)相差最小的樣本分割出來四格表,計算X2值;(2)差異無顯著性時,把它合并為一個樣本,再把它與另一較相近的樣本比較;(3)差異有顯著性時,作出結(jié)論,再把它與另一較相近的樣本比較;(4)如此進行下去直到結(jié)束。,表653種療法對尿路感染患者的治療效果━━━━━━━━━━━━━━━━━━━━━療法陰轉(zhuǎn)人數(shù)未陰轉(zhuǎn)人數(shù)合計陰轉(zhuǎn)率─────────────────────甲301444682乙93645200丙321244727─────────────────────合計7162133534━━━━━━━━━━━━━━━━━━━━━,表86X2分割計算───────────────────────地區(qū)轉(zhuǎn)陰數(shù)未轉(zhuǎn)陰數(shù)合計污染率X2值P值───────────────────────甲301444682022005丙321244727──────────────────────合計622688705──────────────────────甲丙6226887053046PB時,H1ΠAΠB,則P單PR,即當PAPB時,H1ΠAΠB,則P單PL,四格表概率P的計算公式ABCDACBDP=────────────ABCDN,為階乘。例如,3321=6,554321120,01,例88表67兩型慢性布氏病的PHA皮試反應━━━━━━━━━━━━━━━━━━━分型陽性數(shù)陰性數(shù)合計陽性率───────────────────活動型1241412615667穩(wěn)定型316784103000───────────────合計421251600━━━━━━━━━━━━━━━━━━━,各種組合的四格表0151511415213153121541115461037102810191001010421254212542125421254212512345|AT|值2414040616PI001660142301079,,,,,,,,樣本四格表,計算P值1510421P1=──────=0016601546251510421P2=──────=0142311437251510421P5=──────=0107941101025P=P1+P2+P5=02668,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 91
大?。?1.48(MB)
子文件數(shù):
-
簡介:第八章秩轉(zhuǎn)換的非參數(shù)檢驗(NONPARAMETRICTEST),WILCOXONSIGNEDRANKTESTWILCOXONRANKSUMTESTKRUSKALWALLISHTESTFRIEDMANMTEST,CONTENT,如果總體分布為已知的數(shù)學形式,對其總體參數(shù)作假設(shè)檢驗。如T檢驗和F檢驗。,對總體分布不作嚴格假定,又稱任意分布檢驗(DISTRIBUTIONFREETEST),它直接對總體分布作假設(shè)檢驗。,參數(shù)檢驗,非參數(shù)檢驗,推斷一個總體表達分布位置的中位數(shù)M(非參數(shù))和已知M0、兩個或多個總體的分布是否有差別。先將數(shù)值變量從小到大,或等級從弱到強轉(zhuǎn)換成秩后,再計算檢驗統(tǒng)計量。,秩轉(zhuǎn)換的非參數(shù)檢驗,特點假設(shè)檢驗的結(jié)果對總體分布的形狀差別不敏感,只對總體分布的位置差別敏感。,應用范圍,對于計量資料1不滿足正態(tài)和方差齊性條件的小樣本資料;2分布不明的小樣本資料;3一端或二端是不確定數(shù)值(如<05、>50等)的資料(必選);對于等級資料若選行列表資料的檢驗,只能推斷構(gòu)成比差別,而選秩轉(zhuǎn)換的非參數(shù)檢驗,可推斷等級強度差別。,注意如果已知其計量資料滿足(或近似滿足)檢驗或檢驗條件,當然選檢驗或檢驗,因為這時若選秩轉(zhuǎn)換的非參數(shù)檢驗,會降低檢驗效能。,,,非參檢驗的優(yōu)缺點,,,非參數(shù)檢驗的優(yōu)缺點優(yōu)點1、計算簡單便于掌握。2、應用范圍廣。3、收集資料方便。缺點1、損失信息。2、檢驗效率低。,第一節(jié),配對樣本比較的WILCOXON符號秩檢驗,1.配對樣本差值的中位數(shù)和0比較,目的是推斷配對樣本差值的總體中位數(shù)是否和0有差別,即推斷配對的兩個相關(guān)樣本所來自的兩個總體中位數(shù)是否有差別。方法步驟見例81。,例81對12份血清分別用原方法(檢測時間20分鐘)和新方法(檢測時間10分鐘)測谷丙轉(zhuǎn)氨酶,結(jié)果見表81的(2)、(3)欄。問兩法所得結(jié)果有無差別,1建立檢驗假設(shè),確定檢驗水平,2求檢驗統(tǒng)計量T值,①省略所有差值為0的對子數(shù),令余下的有效對子數(shù)為N,見表81第(4)欄,本例N11;,檢驗步驟,若多個差值為0,可通過提高測量工具的精度來解決。,②按差值的絕對值從小到大編秩,然后分別冠以正負號。遇差值絕對值相等則取平均秩,稱為相同秩(TIES)(樣本較小時,如果相同秩較多,檢驗結(jié)果會存在偏性,因此應提高測量精度,盡量避免出現(xiàn)較多的相同秩),表81第(4)欄差值的絕對值為2有2個,其秩依次應為1,2,皆取平均秩為15,見表81第(5)、(6)欄;,③任取正秩和或負秩和為T,本例取T115。,3確定P值,作出推斷結(jié)論,當N≤50時,查T界值表(附表9),判斷原則內(nèi)大外小。,若當N>50,超出附表9范圍,可用正態(tài)近似法作U檢驗。,配對等級資料采用符號秩檢驗最好選用大樣本。,注意,2.單個樣本中位數(shù)和總體中位數(shù)比較,目的是推斷樣本所來自的總體中位數(shù)M和某個已知的總體中位數(shù)M0是否有差別。用樣本各變量值和M0的差值,即推斷差值的總體中位數(shù)和0是否有差別。方法步驟見例82。,例82已知某地正常人尿氟含量的中位數(shù)為4530。今在該地某廠隨機抽取12名工人,測得尿氟含量見表82第(1)欄。問該廠工人的尿氟含量是否高于當?shù)卣H说哪蚍?檢驗步驟,據(jù)表82第(3)、(4)欄,取T15。,第二節(jié),兩個獨立樣本比較的WILCOXON秩和檢驗,1.原始數(shù)據(jù)的兩樣本比較,例83對10例肺癌病人和12例矽肺0期工人用X光片測量肺門橫徑右側(cè)距RD值(CM),結(jié)果見表85。問肺癌病人的RD值是否高于矽肺0期工人的RD值,表85肺癌病人和矽肺0期工人的RD值(CM)比較,檢驗步驟,求檢驗統(tǒng)計量T值,確定P值,作出推斷結(jié)論,,2.頻數(shù)表資料和等級資料的兩樣本比較,例8439名吸煙工人和40名不吸煙工人的碳氧血紅蛋白HBCO含量見表86。問吸煙工人的HBCO含量是否高于不吸煙工人的HBCO含量,計量資料為頻數(shù)表資料,是按數(shù)量區(qū)間分組;等級資料是按等級分組?,F(xiàn)以等級資料為例,方法步驟見例84。,表86吸煙工人和不吸煙工人的HBCO含量比較,①先確定各等級的合計人數(shù)、秩范圍和平均秩,見表86的(4)欄、(5)欄和(6)欄,再計算兩樣本各等級的秩和,見(7)欄和(8)欄;②本例T1917;,,③計算U值,,第三節(jié),完全隨機設(shè)計多個樣本比較的KRUSKALWALLISH檢驗,一、多個獨立樣本比較的KRUSKALWALLISH檢驗,1.原始數(shù)據(jù)的多個樣本比較,例85用三種藥物殺滅釘螺,每批用200只活釘螺,用藥后清點每批釘螺的死亡數(shù)、再計算死亡率(),結(jié)果見表89。問三種藥物殺滅釘螺的效果有無差別,表89三種藥物殺滅釘螺的死亡率()比較,求檢驗統(tǒng)計量H值,,,本例,例86比較小白鼠接種三種不同菌型傷寒桿菌9D、11C和DSC1后存活日數(shù),結(jié)果見表810。問小白鼠接種三種不同菌型傷寒桿菌的存活日數(shù)有無差別,表810小白鼠接種三種不同菌型傷寒桿菌的存活日數(shù)比較,例87四種疾病患者痰液內(nèi)嗜酸性白細胞的檢查結(jié)果見表811。問四種疾病患者痰液內(nèi)的嗜酸性白細胞有無差別,2.頻數(shù)表資料和等級資料的多個樣本比較,表811四種疾病患者痰液內(nèi)的嗜酸性白細胞比較,檢驗步驟,,二、多個獨立樣本兩兩比較的NEMENYI法檢驗,例88對例86資料(表810)作三個樣本間的兩兩比較。,第四節(jié),隨機區(qū)組設(shè)計多個樣本比較的FRIEDMANM檢驗,一、多個相關(guān)樣本比較的FRIEDMANM檢驗,例898名受試對象在相同實驗條件下分別接受4種不同頻率聲音的刺激,他們的反應率()資料見表812。問4種頻率聲音刺激的反應率是否有差別,表8128名受試對象對4種不同頻率聲音刺激的反應率(),求檢驗統(tǒng)計量M值①將每個區(qū)組的數(shù)據(jù)由小到大分別編秩,遇數(shù)據(jù)相等者取平均秩;②計算各樣本的秩和,平均秩和為;,③按下式求M值。,對例89,N8,G4,已算得M1995,則,二、多個相關(guān)樣本兩兩比較的檢驗,例810對例89資料(表812)作四個樣本間的兩兩比較。,,本例根據(jù)表812有N8,G4,,,表815表812相關(guān)樣本的兩兩比較,練習題P178一、最佳選擇題全做三、計算分析題全做,謝謝大家,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 73
大小: 0.91(MB)
子文件數(shù):
-
簡介:醫(yī)學統(tǒng)計學(07)X2檢驗,季聰華20121115,,,中華醫(yī)學雜志對來稿統(tǒng)計學處理的有關(guān)要求,卡方檢驗CHISQUARETEST,Χ2檢驗是現(xiàn)代統(tǒng)計學的創(chuàng)始人之一,英國人KARLPEARSON于1900年提出的一種具有廣泛用途的統(tǒng)計方法??捎糜趦蓚€或多個率間的比較,計數(shù)資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗等等。,,X2分布,卡方分布圖形特征,卡方分布的形狀依賴于自由度Ν的大小當自由度Ν≤2時,曲線呈“L”型;隨著Ν的增加,曲線逐漸趨于對稱;當自由度Ν→∞時,曲線逼近于正態(tài)曲線,卡方檢驗基本思想,用卡方值的大小來衡量實際頻數(shù)和理論頻數(shù)之間的吻合程度。在零假設(shè)H0成立的條件下,實際頻數(shù)與理論頻數(shù)相差不應該很大,即X2值不應該很大。若實際計算出的X2值較大,說明實際頻數(shù)和理論頻數(shù)吻合程度小,相差大,則有理由懷疑H0的真實性,從而拒絕H0,接受H1。,X2檢驗,單個樣本構(gòu)成比的X2檢驗擬合優(yōu)度檢驗獨立樣本四格表的X2檢驗行列的X2檢驗配對設(shè)計分類資料的X2檢驗多維分類資料的X2檢驗,X2檢驗,,單個樣本構(gòu)成比的X2檢驗擬合優(yōu)度檢驗獨立樣本四格表的X2檢驗行列的X2檢驗配對設(shè)計分類資料的X2檢驗多維分類資料的X2檢驗,在中醫(yī)藥科研中,經(jīng)常遇到同一個樣本中兩個或多個構(gòu)成比比較的問題,在滿足卡方檢驗的要求條件下,可用卡方檢驗來分析實際頻數(shù)的比率是否符合理論比率。,【例1】為探索高血壓患者中醫(yī)證型構(gòu)成,調(diào)查原發(fā)性高血壓患者3578例,中醫(yī)證型構(gòu)成見表。問原發(fā)性高血壓患者中醫(yī)證型內(nèi)部構(gòu)成是否相同,,,A,T,X2392514V514P1CDFCHISQ392514,40000,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案例數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗,選擇分析→非參數(shù)檢驗→卡方中醫(yī)證型→檢驗變量列表,第5步結(jié)果解讀,結(jié)果解讀X2392514,P0000,說明原發(fā)性高血壓患者中醫(yī)證型內(nèi)部構(gòu)成不相同。,,,注意事項,進行擬合優(yōu)度X2檢驗,一般要求有足夠的樣本含量,理論頻數(shù)不小于5。理論頻數(shù)小于5時,需要合并計算。,X2檢驗,,單個樣本構(gòu)成比的X2檢驗獨立樣本四格表的X2檢驗行列的X2檢驗配對設(shè)計分類資料的X2檢驗多維分類資料的X2檢驗,四格表的卡方檢驗,也是通過計算代表實際頻數(shù)A與理論頻數(shù)T之間的吻合程度的卡方值來進行檢驗的。理論頻數(shù)T采用兩組的合并情況來計算。,【例2】某醫(yī)院把慢性支氣管炎患者376名,隨機分為2組,分別用中西醫(yī)結(jié)合法和西醫(yī)法治療,結(jié)果見表。問兩種療法治療慢性支氣管炎病人的治愈率是否有差別,理論值T的計算,345/376(總的治愈率)27625324,,,276253242276,,345/376(總的治愈率)1009176,,1009176824,卡方值的計算,卡方值的影響因素1、格子數(shù)2、實測值與理論值的差距,,專用公式的推導,T11AC/ABCD(AB),,,T12BD/ABCD(AB),,T21AC/ABCD(CD),,T22BD/ABCD(CD),專用公式的推導,,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案頻數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗(1),選擇分析→交叉表交叉表對話框組別和療效分別進入行和列,輸出4種卡方檢驗結(jié)果1、PEARSON卡方2、卡方值的校正值3、似然比卡方,一般用于對數(shù)線性模型。4、FISHER的精確檢驗,,輸出2種相關(guān)系數(shù)1、PEARSON相關(guān)系數(shù)2、SPEARMAN相關(guān)系數(shù),,,列聯(lián)系數(shù)分析行與列之間的關(guān)聯(lián)程度,KAPPA一致性檢驗,,,風險計算相對危險度(RR)和比數(shù)比(OR)。,,MCNEMAR優(yōu)勢性檢驗。,,第4步X2檢驗(2),選擇統(tǒng)計量按鈕在交叉表統(tǒng)計量對話框勾上卡方,,第4步X2檢驗(3),選擇單元格按鈕在交叉表單元顯示對話框勾上觀察值、百分比行、列,,第5步結(jié)果解讀(1),結(jié)果解讀中西醫(yī)組的治愈率為982,西醫(yī)組的治愈率為740。,,,第5步結(jié)果解讀(2),結(jié)果解讀X256772,P0000兩種療法治療慢性支氣管炎病人的治愈率的差別有統(tǒng)計學意義,四格表X2檢驗結(jié)果的選擇,1)當N≥40,所有理論值≥5時,用PEARSON卡方檢驗;或者確切概率法。2)當N≥40,但有理論頻數(shù)1≤理論值<5時,用連續(xù)校正的卡方檢驗;或者確切概率法。3)N40X2|BC|12/BCN40,一致性檢驗KAPPA分析,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案頻數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗(1),選擇分析→交叉表交叉表對話框甲法和乙法分別進入行和列,第4步X2檢驗(2),選擇統(tǒng)計量按鈕在交叉表統(tǒng)計量對話框勾上卡方、相關(guān)系數(shù)、KAPPA、MCNEMAR,第4步X2檢驗(3),選擇單元格按鈕在交叉表單元顯示對話框勾上觀察值、期望值、百分比行、總計,第5步結(jié)果解讀(1),結(jié)果解讀兩種方法交叉的例數(shù)關(guān)系。甲法陽性率650,乙法陽性率483。,,,第5步結(jié)果解讀(2),結(jié)果解讀配對設(shè)計選用優(yōu)勢性檢驗結(jié)果,P0031。甲組的陽性率高于乙組的陽性率。,第5步結(jié)果解讀(3),結(jié)果解讀關(guān)聯(lián)性RP0395,P0001一致性KAPPA0406,P0004,KAPPA的意義002差002輕微020尚可040中等060好080100幾乎完全一致,【例9】下表為外側(cè)半月板撕裂的膝關(guān)節(jié)鏡診斷(金標準)與MRI(核磁共振成像)診斷的結(jié)果,試對兩種診斷方法進行分析。,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案頻數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗(1),選擇分析→交叉表交叉表對話框MRI診斷和關(guān)節(jié)鏡診斷分別進入行和列,第4步X2檢驗(2),選擇統(tǒng)計量按鈕在交叉表統(tǒng)計量對話框勾上卡方、相關(guān)系數(shù)、KAPPA、MCNEMAR,第4步X2檢驗(3),選擇單元格按鈕在交叉表單元顯示對話框勾上觀察值、期望值、百分比行、總計,第5步結(jié)果解讀(1),結(jié)果解讀兩種方法交互的例數(shù)關(guān)系。,,,,,,,第5步結(jié)果解讀(2),結(jié)果解讀優(yōu)勢性檢驗P0268。兩種診斷方法的診斷結(jié)果差異無統(tǒng)計學意義。,第5步結(jié)果解讀(3),結(jié)果解讀關(guān)聯(lián)性RP0580,P0000一致性KAPPA0515,P0000,X2檢驗,,單個樣本構(gòu)成比的X2檢驗獨立樣本四格表的X2檢驗獨立樣本多個率和構(gòu)成比的X2檢驗配對設(shè)計分類資料的X2檢驗多維分類資料的X2檢驗,【例10】某藥業(yè)集團研制了一種治療慢性皮炎的新藥,為了解該藥的藥物療效,同某種常用藥物的療效作了比較,資料如表。問該新藥與常用藥物的療效有無差異,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案頻數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗(1),選擇分析→交叉表交叉表對話框組別、療效和中心分別進入行、列和層1的1,第4步X2檢驗(2),選擇統(tǒng)計量按鈕在交叉表統(tǒng)計量對話框勾上卡方及CMH統(tǒng)計量。,第4步X2檢驗(3),選擇單元格按鈕在交叉表單元顯示對話框勾上觀察值、百分比行、列,第5步結(jié)果解讀(1),結(jié)果解讀每個中心的描述。,第5步結(jié)果解讀(2),結(jié)果解讀每個中心的卡方檢驗。,第5步結(jié)果解讀(3),結(jié)果解讀中心效應X21642,P0650,第5步結(jié)果解讀(4),結(jié)果解讀X25531,P0019考慮分層(多中心)混雜因素影響后的卡方值。,,第5步結(jié)果解讀(5),結(jié)果解讀如果是病例對照研究,或者隊列研究,OR值及其95CI。,,,,謝謝,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 144
大小: 2.94(MB)
子文件數(shù):
-
簡介:醫(yī)學統(tǒng)計學(6),,,中華醫(yī)學雜志對來稿統(tǒng)計學處理的有關(guān)要求,卡方檢驗CHISQUARETEST,Χ2檢驗是現(xiàn)代統(tǒng)計學的創(chuàng)始人之一,英國人KARLPEARSON于1900年提出的一種具有廣泛用途的統(tǒng)計方法??捎糜趦蓚€或多個率間的比較,計數(shù)資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗等等。,卡方檢驗基本思想,用卡方值的大小來衡量實際頻數(shù)和理論頻數(shù)之間的吻合程度。在零假設(shè)H0成立的條件下,實際頻數(shù)與理論頻數(shù)相差不應該很大,即X2值不應該很大。若實際計算出的X2值較大,說明實際頻數(shù)和理論頻數(shù)吻合程度小,相差大,則有理由懷疑H0的真實性,從而拒絕H0,接受H1。,X2檢驗,單個樣本構(gòu)成比的X2檢驗擬合優(yōu)度檢驗獨立樣本四格表的X2檢驗行列的X2檢驗配對設(shè)計分類資料的X2檢驗多維分類資料的X2檢驗,X2檢驗,,單個樣本構(gòu)成比的X2檢驗擬合優(yōu)度檢驗獨立樣本四格表的X2檢驗行列的X2檢驗配對設(shè)計分類資料的X2檢驗多維分類資料的X2檢驗,在中醫(yī)藥科研中,經(jīng)常遇到同一個樣本中兩個或多個構(gòu)成比比較的問題,在滿足卡方檢驗的要求條件下,可用卡方檢驗來分析實際頻數(shù)的比率是否符合理論比率。,【例1】為探索高血壓患者中醫(yī)證型構(gòu)成,調(diào)查原發(fā)性高血壓患者3578例,中醫(yī)證型構(gòu)成見表。問原發(fā)性高血壓患者中醫(yī)證型內(nèi)部構(gòu)成是否相同,,,A,T,X2392514V514P1CDFCHISQ392514,40000,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案例數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗,選擇分析→非參數(shù)檢驗→卡方中醫(yī)證型→檢驗變量列表,第5步結(jié)果解讀,結(jié)果解讀X2392514,P0000,說明原發(fā)性高血壓患者中醫(yī)證型內(nèi)部構(gòu)成不相同。,,,注意事項,進行擬合優(yōu)度X2檢驗,一般要求有足夠的樣本含量,理論頻數(shù)不小于5。理論頻數(shù)小于5時,需要合并計算。,X2檢驗,,單個樣本構(gòu)成比的X2檢驗獨立樣本四格表的X2檢驗行列的X2檢驗配對設(shè)計分類資料的X2檢驗多維分類資料的X2檢驗,四格表的卡方檢驗,也是通過計算代表實際頻數(shù)A與理論頻數(shù)T之間的吻合程度的卡方值來進行檢驗的。理論頻數(shù)T采用兩組的合并情況來計算。,【例2】某醫(yī)院把慢性支氣管炎患者376名,隨機分為2組,分別用中西醫(yī)結(jié)合法和西醫(yī)法治療,結(jié)果見表。問兩種療法治療慢性支氣管炎病人的治愈率是否有差別,理論值T的計算,345/376(總的治愈率)27625324,,,276253242276,,345/376(總的治愈率)1009176,,1009176824,卡方值的計算,卡方值的影響因素1、格子數(shù)2、實測值與理論值的差距,,專用公式的推導,T11AC/ABCD(AB),,,T12BD/ABCD(AB),,T21AC/ABCD(CD),,T22BD/ABCD(CD),專用公式的推導,,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案頻數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗(1),選擇分析→交叉表交叉表對話框組別和療效分別進入行和列,輸出4種卡方檢驗結(jié)果1、PEARSON卡方2、卡方值的校正值3、似然比卡方,一般用于對數(shù)線性模型。4、FISHER的精確檢驗5、線性趨勢檢驗,,輸出2種相關(guān)系數(shù)1、PEARSON相關(guān)系數(shù)2、SPEARMAN相關(guān)系數(shù),,,列聯(lián)系數(shù)分析行與列之間的關(guān)聯(lián)程度,KAPPA一致性檢驗,,,風險計算相對危險度(RR)和比數(shù)比(OR)。,,MCNEMAR優(yōu)勢性檢驗。,,CMH多維卡方檢驗,第4步X2檢驗(2),選擇統(tǒng)計量按鈕在交叉表統(tǒng)計量對話框勾上卡方,,第4步X2檢驗(3),選擇單元格按鈕在交叉表單元顯示對話框勾上觀察值、百分比行、列,,第5步結(jié)果解讀(1),結(jié)果解讀中西醫(yī)組的治愈率為982,西醫(yī)組的治愈率為740。,,,第5步結(jié)果解讀(2),結(jié)果解讀X256772,P0000兩種療法治療慢性支氣管炎病人的治愈率的差別有統(tǒng)計學意義,四格表X2檢驗結(jié)果的選擇,1)當N≥40,所有理論值≥5時,用PEARSON卡方檢驗。2)當N≥40,但有理論頻數(shù)1≤理論值<5時,用連續(xù)校正的卡方檢驗;或者確切概率法。3)N40X2|BC|12/BCN40,一致性檢驗KAPPA分析,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案頻數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗(1),選擇分析→交叉表交叉表對話框甲法和乙法分別進入行和列,第4步X2檢驗(2),選擇統(tǒng)計量按鈕在交叉表統(tǒng)計量對話框勾上卡方、相關(guān)系數(shù)、KAPPA、MCNEMAR,第4步X2檢驗(3),選擇單元格按鈕在交叉表單元顯示對話框勾上觀察值、期望值、百分比行、總計,第5步結(jié)果解讀(1),結(jié)果解讀兩種方法交叉的例數(shù)關(guān)系。甲法陽性率650,乙法陽性率483。,,,第5步結(jié)果解讀(2),結(jié)果解讀配對設(shè)計選用優(yōu)勢性檢驗結(jié)果,P0031。甲組的陽性率高于乙組的陽性率。,第5步結(jié)果解讀(3),結(jié)果解讀關(guān)聯(lián)性RP0395,P0001一致性KAPPA0406,P0004,KAPPA的意義002差002輕微020尚可040中等060好080100幾乎完全一致,【例9】下表為外側(cè)半月板撕裂的膝關(guān)節(jié)鏡診斷(金標準)與MRI(核磁共振成像)診斷的結(jié)果,試對兩種診斷方法進行分析。,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案頻數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗(1),選擇分析→交叉表交叉表對話框MRI診斷和關(guān)節(jié)鏡診斷分別進入行和列,第4步X2檢驗(2),選擇統(tǒng)計量按鈕在交叉表統(tǒng)計量對話框勾上卡方、相關(guān)系數(shù)、KAPPA、MCNEMAR,第4步X2檢驗(3),選擇單元格按鈕在交叉表單元顯示對話框勾上觀察值、期望值、百分比行、總計,第5步結(jié)果解讀(1),結(jié)果解讀兩種方法交互的例數(shù)關(guān)系。,,,,,,,第5步結(jié)果解讀(2),結(jié)果解讀優(yōu)勢性檢驗P0268。兩種診斷方法的診斷結(jié)果差異無統(tǒng)計學意義。,第5步結(jié)果解讀(3),結(jié)果解讀關(guān)聯(lián)性RP0580,P0000一致性KAPPA0515,P0000,X2檢驗,,單個樣本構(gòu)成比的X2檢驗獨立樣本四格表的X2檢驗獨立樣本多個率和構(gòu)成比的X2檢驗配對設(shè)計分類資料的X2檢驗多維分類資料的X2檢驗,【例10】某藥業(yè)集團研制了一種治療慢性皮炎的新藥,為了解該藥的藥物療效,同某種常用藥物的療效作了比較,資料如表。問該新藥與常用藥物的療效有無差異,SPSS軟件操作,第1步定義變量,第2步輸入原始數(shù)據(jù),第3步定義頻數(shù),選擇數(shù)據(jù)→加權(quán)個案頻數(shù)→加權(quán)個案(頻數(shù)變量),第4步X2檢驗(1),選擇分析→交叉表交叉表對話框組別、療效和中心分別進入行、列和層1的1,第4步X2檢驗(2),選擇統(tǒng)計量按鈕在交叉表統(tǒng)計量對話框勾上卡方及CMH統(tǒng)計量。,第4步X2檢驗(3),選擇單元格按鈕在交叉表單元顯示對話框勾上觀察值、百分比行、列,第5步結(jié)果解讀(1),結(jié)果解讀每個中心的描述。,第5步結(jié)果解讀(2),結(jié)果解讀每個中心的卡方檢驗。,第5步結(jié)果解讀(3),結(jié)果解讀中心效應X21642,P0650,第5步結(jié)果解讀(4),結(jié)果解讀X25531,P0019考慮分層(多中心)混雜因素影響后的卡方值。,,第5步結(jié)果解讀(5),結(jié)果解讀如果是病例對照研究,或者隊列研究,OR值及其95CI。,,,,謝謝,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 143
大?。?5.11(MB)
子文件數(shù):
-
簡介:第四章定性數(shù)據(jù)的統(tǒng)計描述,學習要點1掌握率、構(gòu)成比、相對比三個相對數(shù)的概念、計算方法;2掌握率的標準化意義、基本思想,熟悉其計算方法。3掌握計算相對數(shù)時應注意的事項。,統(tǒng)計資料類型計數(shù)資料先將研究對象按其性質(zhì)或特征分類,再分別計數(shù)每一類的例數(shù)。,,計量資料(定量資料),計數(shù)資料(定性資料),收集到的計數(shù)資料,表現(xiàn)為絕對數(shù),絕對數(shù)說明事物發(fā)生的實際水平,是進行統(tǒng)計分析的基礎(chǔ),但不便于事物進行深入地分析比較。,第四章定性數(shù)據(jù)的統(tǒng)計描述,如某病用A法治療100人,有效80人;B法治療150人,有效100人;比較兩藥的療效。有效率A法80/10010080B法100/150100667,相對數(shù)定義兩個有關(guān)的絕對數(shù)之比,也可以是兩個有關(guān)聯(lián)統(tǒng)計指標之比。相對數(shù)的性質(zhì)取決于其分子和分母的意義,不同類型的相對數(shù)具有不同的性質(zhì)。計算相對數(shù)的意義主要是把基數(shù)化作相等,便于相互比較。常用的相對數(shù)指標有率、構(gòu)成比和相對比。,第一節(jié)常用的相對數(shù),,第一節(jié)常用相對數(shù),率說明某現(xiàn)象發(fā)生的頻率或強度。,構(gòu)成比說明某一事物內(nèi)部各組成部分所占的比重。,相對比說明一個指標是另一個指標的幾倍或百分之幾。,K為比例基數(shù),可以是百分率()、千分率(‰)、萬分率(1/萬)或十萬分率(1/10萬)。,,公式中的“比例基數(shù)”通常依據(jù)習慣而定。需要注意的是,率在更多情況下是一個具有時間概念的指標,即用于說明在某一段時間內(nèi)某現(xiàn)象發(fā)生的強度或頻率,如出生率、死亡率、發(fā)病率、患病率等,這些指標通常是指在1年時間內(nèi)發(fā)生的頻率。,RATE,例41某單位在2009年有3128名職工,該單位每年對職工進行體檢,在這一年新發(fā)生高血壓病人12例,則,RATE,例如,100000/10萬,某年全市宮頸癌新病例數(shù),同年全市女性人口數(shù),鼻咽癌發(fā)病率100000/10萬,某年全市鼻咽癌新病例數(shù),同年全市人口數(shù),宮頸癌發(fā)病率,構(gòu)成比(PROPORTION)又稱構(gòu)成指標,說明一事物內(nèi)部各個組成部分所占的比重或分布,常以百分數(shù)表示,又稱百分比。,,某醫(yī)院1980年與1982年各科病床情況科別1980年1982年病床數(shù)構(gòu)成比病床數(shù)構(gòu)成比內(nèi)科200500300600外科100250100200兒科100250100200合計40010005001000,,,,,,,構(gòu)成比兩個特點1)一組構(gòu)成比之和等于100%或1;2)某部分構(gòu)成增加或減少,則其它部分構(gòu)成就相應減少或增加。,例42某醫(yī)院某月住院病人數(shù)、死亡人數(shù)及統(tǒng)計指標如下表所示。,表41某月某醫(yī)療機構(gòu)住院病人數(shù)及死亡人數(shù)統(tǒng)計,,PROPORTION,相對比(RATIO)是A、B兩個有關(guān)指標之比,說明A是B的多少倍或百分之幾。A與B的性質(zhì)可以相同,也可以不同??梢允墙^對數(shù)也可以是相對數(shù)或平均數(shù)。,,,例,,,,年度(1),發(fā)病人數(shù)(2),病死人數(shù)(3),病死率()(4),構(gòu)成比()(5),相對比(6),1993584813788,199457110175110128,1998109524219264160,199571412168132123,199674816214176156,199794221223230163,,合計4654911961000,19931998年某地損傷與中毒病死率與構(gòu)成比,例如我國2010年人口普查的男性人口數(shù)為686852572,女性人口數(shù)為652872280人,則即男性人口數(shù)是女性的1052倍。,1兩類別例數(shù)之比,RELATIVERATIO,相對危險度(RELATIVERISK,RR)是流行病學前瞻性研究中常用的指標,表示在兩種不同條件下某疾病發(fā)生的概率之比,反映暴露組發(fā)病或死亡的危險是非暴露組的多少倍,說明疾病與暴露之間關(guān)聯(lián)強度。其計算公式為P1為暴露組的發(fā)病率;P0非暴露組的發(fā)病率。,2相對危險度,例43某地市區(qū)非吸煙女性飲酒者和不飲酒者的肺癌發(fā)病資料如下表所示,試計算其相對危險度。,說明該地市區(qū)非吸煙女性飲酒者的肺癌發(fā)病率是非吸煙女性不飲酒者的115倍。,表42某地市區(qū)非吸煙女性飲酒者和不飲酒者的肺癌發(fā)病資料,RELATIVERISK,比數(shù)比(ODDSRATIO,OR)常用于流行病學中病例對照研究資料,表示病例組和對照組中的暴露比例與非暴露比例的比值之比,是反映疾病與暴露之間關(guān)聯(lián)強度的指標。其計算公式為,P1為病例組的暴露比例或在暴露狀態(tài)下的發(fā)病率P0為對照組的暴露比例或在非暴露狀態(tài)下的發(fā)病率,3比數(shù)比,例44母親圍孕期是否有發(fā)熱或感冒病史與嬰兒神經(jīng)血管畸形關(guān)系的病例對照研究的資料如下表所示。試計算母親圍孕期是否有發(fā)熱或感冒病史引起嬰兒神經(jīng)血管畸形的比數(shù)比。,表43母親圍孕期有否發(fā)熱或感冒病史與嬰兒神經(jīng)血管畸形關(guān)聯(lián),,ODDSRATIO,病例組中的暴露比例與非暴露比例分別為對照組的暴露比例與非暴露比例分別為由OR計算公式可以得出本例母親圍孕期是否有發(fā)熱或感冒病史引起嬰兒神經(jīng)血管畸形的優(yōu)勢比為363倍。,,,,,,,,ODDSRATIO,四、率的標準化(P30),表44甲、乙兩醫(yī)院治愈率的比較,一、標準化率的意義,率標準化法的基本思想采用統(tǒng)一的內(nèi)部構(gòu)成計算標準化率,以消除內(nèi)部構(gòu)成不同對指標的影響,使算得的標準化率具有可比性。,如比較兩人群的死亡率、出生率、患病率時,常要考慮人群性別、年齡的構(gòu)成是否相同。再如在比較試驗組和對照組治愈率時,常要考慮兩組病情輕重、年齡、免疫狀態(tài)等因素的構(gòu)成是否相同。,二、標準化率的計算,(一)直接法直接法的應用條件為已知各年齡組的實際發(fā)病率已知標準人口數(shù)已知標準人口構(gòu)成,,,,(二)間接法,已知死亡總數(shù)及年齡別人口數(shù),但不知道各年齡組的實際死亡率。是被標化組實際死亡數(shù)與預期死亡數(shù)之比,稱為標準化死亡比(STANDARDMORTALITYRATIO),簡稱為SMR。,,,標準化率的步驟,1根椐已知條件選擇直接法或間接法。2選擇標準。3選擇合適的公式計算標準化率。,2標準構(gòu)成的選取標準化法計算的關(guān)鍵是選擇統(tǒng)一的標準構(gòu)成,選取標準的方法通常有下面三種(1)選取有代表性的、較穩(wěn)定的、數(shù)量較大的人群構(gòu)成為標準,如全國范圍或全省范圍的數(shù)據(jù)作為標準構(gòu)成;(2)選擇相互比較的各組例數(shù)合計作為標準構(gòu)成;(3)從比較的各組中任選其一作為標準構(gòu)成。,STANDARDIZATIONRATE,表45消除構(gòu)成影響后兩醫(yī)院治愈率的比較,上例以各層例數(shù)的合計作為標準構(gòu)成,計算得到甲醫(yī)院標準化后的總治愈率為乙醫(yī)院標準化后的總治愈率為由上可見,甲醫(yī)院標準化后的總治愈率高于乙醫(yī)院標準化后的總治愈率。,STANDARDIZATIONRATE,(三)應用標準化法的注意事項,1當各比較組內(nèi)部構(gòu)成(如年齡、性別、職業(yè)、民族等)不同,并足以影響總率的比較時,應對率進行標準化,然后再作比較。2率的標準化的目的是采用統(tǒng)一的標準,消除混雜因素的影響,使其具有可比性。,3兩樣本標準化率的比較也應作假設(shè)檢驗。4各年齡組對應的率出現(xiàn)明顯交叉如低年齡組死亡率甲地高于乙地,而高年齡組則甲地低于乙地此時宜分別比較各年齡組死亡率,而不用標準化進行比較。,一、死亡統(tǒng)計指標1死亡率(DEATHRATE)又稱粗死亡率,表示某地某年每千人口中的死亡人數(shù),反映當?shù)鼐用窨偟乃劳鏊?,計算公式為同年平均人口為年初人口和年末人口的平均值?第二節(jié)醫(yī)學中常用的相對數(shù)指標自學,2年齡別死亡率(AGESPECIFICDEATHRATE)表示某地某年齡組每千人口中的死亡數(shù),它消除了人口年齡構(gòu)成不同對死亡水平的影響,計算公式為,3死因別死亡率(CAUSEPECIFICDEATHRATE表示某年每10萬人中因某種疾病死亡的人數(shù),它反映各類病傷死亡對居民生命的危害程度,是死因分析的重要指標,其計算公式為,4死因構(gòu)成(PROPORTIONOFDYINGOFASPECIFICCAUSE)也稱相對死亡比,全部死亡人數(shù)中,死于某死因者占總死亡數(shù)的百分比,反映各種死因的相對重要性。計算公式為,1發(fā)病率(INCIDENCERATE)表示在一定期間內(nèi),一定人群中某病新發(fā)生的病例出現(xiàn)的頻率,是反映疾病對人群健康影響和描述疾病分布狀態(tài)的一項測量指標。計算公式為需要注意的是,分母中所規(guī)定的平均人口是指可能會發(fā)生該病的人群。,二、疾病統(tǒng)計指標,2患病率也稱現(xiàn)患率,表示某一時點某人群人口中患某病的頻率,通常用來表示病程較長的慢性病的發(fā)生或流行情況,其計算公式為以上比例基數(shù)可為100、1000‰、10000/萬、100000/10萬,實際中患病率的分母通常為調(diào)查的總?cè)藬?shù),分子為患病的人數(shù)。,PREVALENCERATE,3病死率(CAUSEFATALITYRATE)表示某期間內(nèi),某病患者中因某病死亡的頻率,表明該疾病的嚴重程度和醫(yī)療水平等,多用于急性傳染病。計算公式為4治愈率(CURERATE)表示接受治療的病人中治愈的頻率,計算公式為,,第三節(jié)應用相對數(shù)時的注意事項,1計算相對數(shù)的分母不宜過小,例如某醫(yī)生用組織埋藏法治療了2例視網(wǎng)膜炎患者,1例有效,即報道有效率為50。這顯然是不可靠的,不能正確反映事實真相,這時最好用絕對數(shù)表示。,,,,例附院2001年15000個門診病人中,分類后有胃炎病人350人,腎炎病人150人,據(jù)此可認為百色市胃炎的患病率350/15000高于腎炎的患病率150/15000。,,2不要把構(gòu)成比與率相混淆;,(例如下表),,,,工齡(年)檢查人數(shù)患者數(shù)百分比患病率()(1)(2)(3)(4),151015,340254432136,17307327,1156204149661837,500118116901985,,合計1162147100001265,某化工廠慢性氣管炎患病與專業(yè)工齡的關(guān)系,某醫(yī)院各科的病死率科別患者數(shù)死亡數(shù)病死率()外科1500180120內(nèi)科5002040傳染科4002460合計240022473(1204060)/310073,,,,,平均率224/240010093,,,,,3觀察單位數(shù)不等的幾個率的平均率不等于這幾個率的算術(shù)平均值。,4注意資料的可比性;(除了研究因素外,其余的影響因素應盡可能相同或相近。),5樣本率或構(gòu)成比存在抽樣誤差。,1定性資料的變量形式包括多分類變量和兩分類變量,這些變量可以通過相對數(shù)進行統(tǒng)計描述。2常用的相對數(shù)指標有率、構(gòu)成比和相對比。相對數(shù)的性質(zhì)取決于其分子和分母的意義,不同的相對數(shù)其指標的定義和結(jié)果解釋是不同的。,小結(jié),3標準化法的目的是消除重要因素的構(gòu)成不同對粗率比較的影響,選擇統(tǒng)一的“標準”,計算標準化率。4醫(yī)學人口統(tǒng)計和疾病統(tǒng)計中有關(guān)人口死亡和疾病的一系列指標是定性資料統(tǒng)計描述的應用。這些統(tǒng)計指標在確定衛(wèi)生政策、了解人群健康水平和評價衛(wèi)生工作效果、反映疾病負擔和醫(yī)療質(zhì)量方面等具有重要作用。,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 47
大?。?1.19(MB)
子文件數(shù):
-
簡介:醫(yī)學統(tǒng)計學(04)T檢驗與單因素方差分析,季聰華20121018,假設(shè)檢驗步驟,1建立假設(shè)、確定檢驗水準1零假設(shè)或無效假設(shè)H0ΜΜ0,即兩總體均數(shù)相同。2備擇假設(shè)或有統(tǒng)計學意義假設(shè)H1Μ≠Μ0,即兩總體均數(shù)不同。根據(jù)專業(yè)知識及數(shù)據(jù)特征,備擇假設(shè)H1也有單側(cè)形式ΜΜ0。選擇雙側(cè)檢驗,還是單側(cè)檢驗需依據(jù)數(shù)據(jù)特征和專業(yè)知識進行確定。,2選擇檢驗方法、計算統(tǒng)計量假設(shè)檢驗的方法應針對不同研究目的、設(shè)計及資料的類型選定,并計算相應的檢驗統(tǒng)計量。如在總體方差已知的情況下,進行兩均數(shù)的比較用Z檢驗或U檢驗;在總體方差未知情況下,進行兩均數(shù)的比較用T檢驗等。,3確定P值、作出推論根據(jù)計算的檢驗統(tǒng)計量,確定P值,P值是在H0成立的情況下隨機抽樣,獲得大于及等于或和小于及等于現(xiàn)有樣本資料求得的檢驗統(tǒng)計量的概率。,假設(shè)檢驗的分類,根據(jù)是否正態(tài)分布分參數(shù)檢驗和非參數(shù)檢驗根據(jù)處理因素分單因素分析和多因素分析根據(jù)比較類型分優(yōu)效性、等效性和非劣效性。,常用假設(shè)檢驗方法的選擇(1),,,,,,,中華醫(yī)學雜志對來稿統(tǒng)計學處理的有關(guān)要求,,,,,中華醫(yī)學雜志對來稿統(tǒng)計學處理的有關(guān)要求,,,T檢驗樣本均數(shù)與總體均數(shù)比較的T檢驗配對設(shè)計資料比較的T檢驗兩獨立樣本均數(shù)比較的T檢驗方差分析完全隨機設(shè)計的單因素方差分析多個樣本均數(shù)間的多重比較,單因素均數(shù)比較,,T檢驗樣本均數(shù)與總體均數(shù)比較的T檢驗配對設(shè)計資料比較的T檢驗兩獨立樣本均數(shù)比較的T檢驗方差分析完全隨機設(shè)計的單因素方差分析多個樣本均數(shù)間的多重比較,T檢驗TTEST是以T分布為理論基礎(chǔ),對一個或兩個樣本的數(shù)值變量資料進行假設(shè)檢驗常用的方法,屬于參數(shù)檢驗。,,正態(tài)分布的公式,Μ和Σ是正態(tài)分布的兩個參數(shù),Μ和Σ決定了X的概率分布;習慣上用NΜ,Σ2表示均數(shù)為Μ,標準差為Σ的正態(tài)分布。,當Σ固定不變時,Μ越大,曲線沿橫軸越向右移動;反之,Μ越小,則曲線沿橫軸越向左移動,所以Μ叫正態(tài)曲線N(Μ,Σ2)的位置參數(shù),。,1位置參數(shù)Μ,正態(tài)分布位置隨參數(shù)Μ變換示意圖,2形狀參數(shù)Σ,正態(tài)分布形態(tài)隨參數(shù)Σ變換示意圖,當Μ固定不變時,Σ越大,曲線越平闊;Σ越小,曲線越尖峭,Σ叫正態(tài)曲線N(Μ,Σ2)的形狀參數(shù)。,,,196,258,T分布,T檢驗和U檢驗應用條件T檢驗1單因素設(shè)計的小樣本(N<50)計量資料2樣本來自正態(tài)近似正態(tài)分布總體3總體標準差未知4兩樣本均數(shù)比較時,要求兩樣本相應的總體方差相等(方差齊性)U檢驗1大樣本2樣本小,但總體標準差已知,,T檢驗樣本均數(shù)與總體均數(shù)比較的T檢驗配對設(shè)計資料比較的T檢驗兩獨立樣本均數(shù)比較的T檢驗方差分析完全隨機設(shè)計的單因素方差分析多個樣本均數(shù)間的多重比較,樣本均數(shù)與總體均數(shù)的比較的T檢驗,亦稱單樣本T檢驗ONESAMPLETTEST。用于從正態(tài)總體中獲得含量為N的樣本,算得均數(shù)和標準差,判斷其總體均數(shù)Μ是否與某個已知總體均數(shù)Μ0相同。,已知的總體均數(shù)一般為公認的理論數(shù)值、經(jīng)驗數(shù)值、期望數(shù)值或經(jīng)過大量觀察所得的穩(wěn)定值,如人的正常生理指標紅細胞數(shù)、身高、血壓等。樣本均數(shù)與總體均數(shù)比較的T檢驗,其應用條件是資料服從正態(tài)分布或近似正態(tài)分布。,T檢驗(N較小時)的計算公式,U檢驗(N較大時)的計算公式,【例1】已知一般無肝腎疾患的健康人群血尿素氮均值為4882MMOL/L,10名脂肪肝患者的血尿素氮MMOL/L測定值為624,426,536,813,696,118,574,437,518,868。問脂肪肝患者血尿素氮含量是否不同于健康人,查表,T與自由度為9(101)時的T界值進行比較,得到001196,P258,P005。,,T檢驗樣本均數(shù)與總體均數(shù)比較的T檢驗配對設(shè)計資料比較的T檢驗兩獨立樣本均數(shù)比較的T檢驗方差分析完全隨機設(shè)計的單因素方差分析多個樣本均數(shù)間的多重比較,在醫(yī)學研究中,為了減少誤差,提高統(tǒng)計檢驗效率,控制非實驗因素對結(jié)果的影響,常常采用配對設(shè)計的方法。配對設(shè)計,是指先根據(jù)配對的要求將試驗對象兩兩配對,然后將配成對子的兩個試驗對象隨機地分配到不同處理組中。配對的要求是,配成對子的兩個試驗對象條件盡量一致,不同對子間試驗對象的條件允許有差異。,配對設(shè)計主要有兩種情況1、同體配對研究①處理前后配對研究。②同體左右配對研究。2、異體配對研究①動物種系、性別、胎次相同,體重±10。②人群種族、性別、病種相同,病情或并發(fā)癥相似,年齡±5歲。,配對T檢驗的公式,【例3】為了驗證腎上腺素有無降低呼吸道阻力的作用,用豚鼠12只進行支氣管灌流法實驗,在注入定量腎上腺素前后,測得豚鼠支氣管功能反映在儀器上的灌流速度每分鐘灌流滴數(shù),結(jié)果見下表。問腎上腺素能否降低豚鼠呼吸道阻力,直接計算,查表,T與自由度為11(121)時的T界值進行比較,得到001005方差相等,T檢驗結(jié)果選第一行。,,,結(jié)果解讀3,T統(tǒng)計量T3351SIG(雙側(cè))P值0004,P196,P258,P005。,【例6】某中醫(yī)研究類風濕關(guān)節(jié)炎的治療,62例類風濕關(guān)節(jié)炎患者隨機分組,分別采用中成藥風濕寒痛片和西藥治療,測得患者血清EBVVCALGG抗體滴度結(jié)果見下表,比較兩組療效有無差別,幾何均數(shù)比較的直接計算公式,數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)轉(zhuǎn)換DATACONVERSION是將數(shù)據(jù)從一種表現(xiàn)形式變?yōu)榱硪环N表現(xiàn)形式的過程,目的都是為了使數(shù)據(jù)符合統(tǒng)計檢驗方法的應用條件。常用的數(shù)據(jù)轉(zhuǎn)換方法如下1對數(shù)變換IOGARITHMICTRANSFORMATION將原始數(shù)據(jù)變量X的對數(shù)值作為新的分析變量,適用于對數(shù)正態(tài)分布資料。常用于①使服從對數(shù)正態(tài)分布的資料正態(tài)化。②使資料達到方差齊性要求,特別是各樣本的變異系數(shù)比較接近時。③使曲線直線化。,,X1LG10X,2平方根變換將原始數(shù)據(jù)變量X的平方根作為新的分析變量。常用于①輕度偏態(tài)資料正態(tài)化。②觀察值服從POISSON分布的計數(shù)資料。當各樣本的方差與均數(shù)呈正相關(guān)時,均數(shù)大,方差也大,用此變換可使資料達到方差齊的要求。,X1SQRTX,3平方根反正弦變換,X1SQRTARSINX,4倒數(shù)變換,X11/X,【例6】某中醫(yī)研究類風濕關(guān)節(jié)炎的治療,62例類風濕關(guān)節(jié)炎患者隨機分組,分別采用中成藥風濕寒痛片和西藥治療,測得患者血清EBVVCALGG抗體滴度結(jié)果見下表,比較兩組療效有無差別,SPSS軟件操作,第一步建立“抗體滴度的倒數(shù)”、“人數(shù)”、“組別”三個變量,第二步將相關(guān)數(shù)據(jù)依次錄入SPSS,形成16行3列的數(shù)據(jù)集。,第三步數(shù)據(jù)轉(zhuǎn)換轉(zhuǎn)換→計算變量。目標變量抗體滴度倒數(shù)對數(shù);數(shù)字表達式LG10抗體滴度倒數(shù),第四步頻數(shù)加權(quán)數(shù)據(jù)→加權(quán)個案。頻率變量人數(shù),,第五步選擇分析→比較均值→獨立樣本T檢驗,第六步在獨立樣本T檢驗對話框中,檢驗變量處移入抗體滴度倒數(shù)對數(shù)。第七步定義組別。在組1和組2處輸入1和2。,,第八步點確定后產(chǎn)生結(jié)果,結(jié)果解讀。,結(jié)果解讀1,N組1、組2的樣本例數(shù)分別為30、32例;均值組1、組2的均值分別為18730、19972;標準差組1、組2的標準差分別為056095、058451;均值的標準誤組1、組2的標準誤分別為010242、010333。,結(jié)果解讀2,方差齊性檢驗F0283,P0597,P005T檢驗結(jié)果選第一行(假設(shè)方差相等),,,結(jié)果解讀3,T統(tǒng)計量T0852;SIG(雙側(cè))P值0397,P005;均值差值兩個均數(shù)的差值012417;差值的95CI041558016723。,,,,T檢驗樣本均數(shù)與總體均數(shù)比較的T檢驗配對設(shè)計資料比較的T檢驗兩獨立樣本均數(shù)比較的T檢驗方差分析完全隨機設(shè)計的單因素方差分析多個樣本均數(shù)間的多重比較,方差分析的基本思想,,方差分析的基本思想就是把全部觀察值間的變異總變異按設(shè)計和需要分解成兩個組成部分,再作分析。,方差分析的基本思想,總變異,處理效應,試驗誤差,方差分析的目的,確定各種原因在總變異中所占的重要程度。,,處理效應,試驗誤差,相差不大,說明試驗處理對指標影響不大。,相差較大,即處理效應比試驗誤差大得多,說明試驗處理影響是很大的,不可忽視。,方差分析的應用條件為①通過做好研究設(shè)計和實驗觀察來確保各樣本是相互獨立的隨機樣本。②各樣本來自正態(tài)總體,資料是否滿足此條件,需要分別對各組進行正態(tài)性檢驗或根據(jù)專業(yè)知識判斷,當各組樣本例數(shù)較少時根據(jù)專業(yè)知識判斷正態(tài)性尤為重要。③各總體方差相等,即方差齊性。若資料不滿足上述條件,則需對資料作變量轉(zhuǎn)換,且對變換后的數(shù)據(jù)進行正態(tài)性和方差齊性檢驗或確認,如果仍不滿足上述條件,則不能用方差分析,需改用非參數(shù)檢驗,如秩和檢驗等。,要明確不同處理平均數(shù)兩兩間差異的顯著性,每個處理的平均數(shù)都要與其他的處理進行比較,這種差異顯著性的檢驗就叫多重比較。,多重比較,1多個實驗組與一個對照組間兩兩比較的方法LSD–T檢驗最小顯著差法DUNNETTT檢驗DUNCAN檢驗新復極差法2多個樣本均數(shù)間兩兩比較的方法SNK法TUKEY法BONFERRONI法修正最小顯著差異法,常用的多重比較的方法,【例7】研究單味中藥對小白鼠細胞免疫機能的影響,把40只小白鼠隨機分成四組,每組10只,雌雄各半,用藥15天后,進行E玫瑰花結(jié)形成率ESFC測定,結(jié)果見下表,試比較三種單味中藥的免疫作用是否一樣,SPSS軟件操作,第一步建立變量“ESFC”、“組別”兩個變量。對組別進行定義。,第二步將40個數(shù)據(jù)及伴隨的組別依次錄入SPSS,形成40行2列的數(shù)據(jù)集。,第三步選擇分析→比較均值→單因素ANOVA,第四步在單因素方差分析對話框中,因變量列表處移入“ESFC”,因子處移入“組別”。,,,第五步設(shè)置選項。,,第六步設(shè)置兩兩比較。,,,,第七步完成,解讀結(jié)果,LSD最小顯著差異法SNK又稱Q檢驗DUNNETT又稱Q’檢驗,結(jié)果解讀1,描述了4組分別的和總的均值、標準差、標準誤、95CI、最小、最大值。,結(jié)果解讀2,進行了方差齊性檢驗,P0048,P005,表示方差齊。,結(jié)果解讀3,總的組間差異比較,F(xiàn)15515,P0000,P001,表明組間差異有統(tǒng)計學意義。,結(jié)果解讀4組間兩兩比較結(jié)果,,,結(jié)果解讀5,SNK檢驗結(jié)果將無統(tǒng)計學意義的比較組列在同一列中。即樣本均數(shù)顯示在同一列時,表示兩組總體均數(shù)差別無統(tǒng)計學意義。,謝謝,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 114
大?。?2.4(MB)
子文件數(shù):
-
簡介:,,,“統(tǒng)計學是現(xiàn)代醫(yī)學大廈的一個重要支柱”。美國醫(yī)學會雜志(JAMA)主編,試驗設(shè)計五原則?隨機原則?對照原則?盲法原則?重復原則?均衡原則試驗設(shè)計三要素?試驗對象?處理因素?樣本含量,二、計數(shù)資料分析方法的常見錯誤,三、計量資料分析常見錯誤,2,3,,論文常見中醫(yī)學統(tǒng)計學錯誤匯報,,參考文獻陳寧勇,周英,董勤,周春祥針刺治療高血壓病的療效觀察J針刺研究,2010,06462466,【錯誤一】作者對上表采用的統(tǒng)計學方法是X2檢驗,這是錯誤的。該資料屬于單項有序的RXC表,屬于等級資料,對于等級資料科采用RIDIT分析或秩和檢驗,而不應用RXC的X2檢驗,RXC表的X2檢驗只能兩組內(nèi)部構(gòu)成是否相同或頻數(shù)的分布是否相同,不能檢驗療效有無差別。所以對上表采用的正確方法應該是RIDIT分析或秩和檢驗。【正確做法】單項有序行列表應使用秩和檢驗。(1)建立假設(shè)H0兩組臨床療效分布相同;H1兩組臨床療效分布不同。取Α005。(2)計算1)編秩將兩組數(shù)據(jù)按等級順序由小到大統(tǒng)一編制。2)求各組秩和3)得出結(jié)論,參考文獻陳寧勇,周英,董勤,周春祥針刺治療高血壓病的療效觀察J針刺研究,2010,06462466【錯誤二】只是簡單提到“差異均無統(tǒng)計學意義”,并沒有詳細說明組間基線資料的均衡性檢驗如何操作?!菊_做法】詳細說明組間基線資料的均衡性檢驗,給出具體的統(tǒng)計量以及P值。,參考文獻張海榮,趙紅醒腦開竅針刺法治療高血壓合并中風臨床觀察J上海針灸雜志,2012,08550552,【錯誤三】對計量資料應當根據(jù)是否符合正態(tài)分布而采用不同的描述方法,符合者一般采用“均數(shù)±標準差”或“均數(shù)±標準誤”表示,而不符合者則采用中位數(shù)和四分位間距來進行表示,不按上述規(guī)定進行描述者均屬于錯誤描述。文中對于平均年齡,平均病程等計量資料未經(jīng)正態(tài)性檢驗而直接將數(shù)據(jù)描述成“均數(shù)±標準差”或“均數(shù)±標準誤”?!菊_做法】將實際測得的年齡,病程等計量資料進行正態(tài)性檢查,如數(shù)據(jù)服從正態(tài)分布,則可將數(shù)據(jù)描述成“均數(shù)±標準差”或“均數(shù)±標準誤”;如果不服從正態(tài)分布,則應列出所有數(shù)據(jù)。,參考文獻孫遠征,耿智馨針刺風池對高血壓患者椎基底動脈血流速度的影響J上海針灸雜志,2013,06459460,【錯誤四】只說隨機分組,并沒有說明具體分組方法?!菊_做法】具體說明隨機分組的方法。如采用隨機數(shù)字表法。,參考文獻王愛珍,蔡治賓,吳羅杰原發(fā)性高血壓病中醫(yī)辯證分型與腎素、血管緊張素初探J中國現(xiàn)代醫(yī)學雜志,1998,054344,【錯誤五】數(shù)據(jù)分布不屬于正態(tài)分布該資料通過對比腎素、血管緊張素Ⅱ以評價實驗的療效但數(shù)據(jù)顯示,表中肝腎陰虛型腎素不符合正態(tài)分布的原則,即平均數(shù)大于2倍的標準差,因此統(tǒng)計學處理結(jié)果不可信?!菊_做法】該統(tǒng)計學分析應對重復統(tǒng)計的評分數(shù)據(jù)進行方差分析,再利用配對T檢驗的方法分別對兩組的腎素和血管緊張素Ⅱ進行T檢驗,計算P<005,差異有統(tǒng)計學意義;再用成對T檢驗的方法處理兩組的腎素和血管緊張素Ⅱ,P<005,差異有統(tǒng)計學意義。,謝謝,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 16
大?。?0.89(MB)
子文件數(shù):
-
簡介:方差分析四川大學華西公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學系張強QIANGZHANGSCUEDUCN,在試驗研究中,將全部觀察對象隨機分為K個組,每個組給予不同的處理。當K=2時,兩組總體均數(shù)是否相等的假設(shè)檢驗可采用前面介紹的T檢驗或Z檢驗;當K2時,即檢驗兩組以上總體均數(shù)是否相等時,T檢驗已不能滿足要求,需采用本章介紹的方差分析ANALYSISOFVARIANCE,簡稱ANOVA。,方差分析的基本思想,例91為研究大豆對缺鐵性貧血的恢復作用,某研究者進行了如下實驗選取已做成貧血模型的大鼠36只,隨機等分為3組,每組12只,分別用三種不同的飼料喂養(yǎng)不含大豆的普通飼料、含10大豆飼料和含15大豆飼料。喂養(yǎng)一周后,測定大鼠紅細胞數(shù)1012/L,試分析喂養(yǎng)三種不同飼料的大鼠貧血恢復情況是否不同,表91喂養(yǎng)三種不同飼料的大鼠紅細胞數(shù)1012/L,總變異組間變異組內(nèi)變異,,,,,,,,,,,,完全隨機設(shè)計的單因素方差分析,1建立檢驗假設(shè),確定檢驗水準,3個總體均數(shù)相等,即喂養(yǎng)三種不同飼料的大鼠紅細胞數(shù)相同,3個總體均數(shù)不全相等,即喂養(yǎng)三種不同飼料的大鼠紅細胞數(shù)不全相同,2計算檢驗統(tǒng)計量,,,,,,,,,,,,表93例91資料的方差分析表,隨機區(qū)組設(shè)計的兩因素方差分析,例92利用隨機區(qū)組設(shè)計研究不同溫度對家兔血糖濃度的影響,某研究者進行了如下實驗將24只家兔按窩別配成6個區(qū)組,每組4只,分別隨機分配到溫度15℃、20℃、25℃、30℃的4個處理組中,測量家兔的血糖濃度值MMOL/L,結(jié)果如下表94所示,分析4種溫度下測量家兔的血糖濃度值是否不同,表94四種溫度下測量家兔的血糖濃度值MMOL/L,,1建立檢驗假設(shè),確定檢驗水準處理組,4個總體均數(shù)全相等,即4種溫度下家兔血糖濃度值相同,4個總體均數(shù)不全相等,即4種溫度下家兔血糖濃度值不全相同區(qū)組,6個總體均數(shù)全相等,即不同窩別家兔血糖濃度相同,6個總體均數(shù)不全相等,即不同窩別家兔血糖濃度不全相同,2計算檢驗統(tǒng)計量,,,,,,,,,,,,,,,,,表96例92資料的方差分析表,多個樣本均數(shù)間的多重比較,方差分析的結(jié)果提供了各組均數(shù)間差別的總的信息,但尚未提供各組間差別的具體信息,即尚未指出哪幾個組均數(shù)之間的差別具有或不具有統(tǒng)計學意義。為得到這方面的信息,可進行多個樣本均數(shù)間的兩兩比較,它又稱為樣本均數(shù)間的多重比較MULTIPLECOMPARISON。,在檢驗多組均數(shù)差別的無效假設(shè)H0時,常見的有以下兩種情況檢驗某幾個特定的總體均數(shù)是否相等,其無效假設(shè)稱為部分無效假設(shè),即部分組所對應的總體均數(shù)相等,H0?I?JI?J。,2檢驗全部K個總體均數(shù)是否相等,其無效假設(shè)稱為完全無效假設(shè),即所有各組所對應的總體均數(shù)都相等,H0?1?2==?K。,1SNKQ檢驗SNK為STUDENTNEWMANKEULS三人姓氏的縮寫,檢驗統(tǒng)計量為Q值,又常稱為Q檢驗。一般在方差分析結(jié)果拒絕H0?1?2==?K時,再用SNKQ檢驗進行多重比較。,,例93對例91資料三組總體均數(shù)進行兩兩比較。1建立檢驗假設(shè),確定檢驗水準,任意兩對比組的總體均數(shù)相等,任意兩對比組的總體均數(shù)不等,2計算檢驗統(tǒng)計量,首先將3個樣本均數(shù)由大到小排列,并編組次,表99例91資料的SNK法檢驗計算表,在設(shè)計階段就根據(jù)研究目的或?qū)I(yè)知識而計劃好的某些均數(shù)間的兩兩比較,它常用于事先有明確假設(shè)的證實性研究,如多個處理組與對照組的比較,某一對或某幾對在專業(yè)上有特殊意義的均數(shù)間的比較等,這時可采用DUNNETT,檢驗。其公式為,,檢驗。,2DUNNETT,檢驗,,,例94對例92資料,問20℃、25℃和30℃均為實驗組分別與15℃對照組的總體均數(shù)是否不同1建立檢驗假設(shè),確定檢驗水準,任一實驗組與對照組的總體均數(shù)相同,任一實驗組與對照組的總體均數(shù)不同,2計算檢驗統(tǒng)計量,,,,表910例92資料的DUNNETT,,檢驗計算表,交叉設(shè)計的方差分析,交叉設(shè)計CROSSOVERDESIGN可分為兩階段交叉設(shè)計和多階段交叉設(shè)計,醫(yī)學實際工作中應用較多的是前者。,交叉設(shè)計CROSSOVERDESIGN是一種特殊的自身對照設(shè)計。它克服了實驗前后自身對照由于觀察期間各種非實驗因素對實驗結(jié)果的影響所造成的偏倚。,在進行設(shè)計時,最好將條件相近的觀察對象配對,再用隨機分配的方法決定其中之一先采用處理方式A,再用處理方式B;另一研究對象則先用B再用A。結(jié)果使得一半對象先接受A,再接受B;另一半對象先接受B,再接受A;兩種處理方式在研究過程中交叉進行。,由于A、B兩種處理方式先后實驗的機會均等,因而平衡了實驗順序的影響,并且可以通過假設(shè)檢驗,對處理方式之間和時間先后之間的差別分別進行分析。,可見,交叉設(shè)計要求樣本含量為偶數(shù),最好并將條件相近的配對,隨機分配決定進行處理方式A和B的順序。,交叉設(shè)計的優(yōu)點是1節(jié)約樣本含量;2能夠控制時間因素及個體差異對處理方式的影響因而它優(yōu)于一般的自身對照實驗;3每一個實驗對象同時接受實驗因素和對照如安慰劑,從醫(yī)德的觀點出發(fā),均等地考慮了每一個患者的利益。,使用交叉設(shè)計時應當注意該設(shè)計的基本前提是兩種處理方式不能相互影響,即首先進行的處理方式不應對后者的效應有所影響。因此兩次實驗之間應當有必要的間隔,間隔時間的長短決定于藥物從體內(nèi)的排除時間WASHOUTTIME。研究者可以參照藥典或預備實驗中藥物在血清中的衰減程度,決定其間隔期限。,2交叉設(shè)計不適用于病程較短的急性病治療效果的研究,如大葉肺炎、急性扁桃腺炎等,因為在第一階段給予實驗措施該病便已治愈,第二階段的措施則不可能反映出來。因此,交叉設(shè)計只適用于某些病程相對較長的疾病。,3交叉設(shè)計實驗應盡可能采用盲法,使研究者和患者都不知道有效藥物在哪一階段使用,以免產(chǎn)生偏倚。特別是容易使患者在第一階段使用有效的藥物后,便退出實驗,這將會嚴重的影響研究結(jié)果。因此應注意控制患者退出實驗的比例,盡可能使其降低到最低程度。,例95某醫(yī)師研究A、B兩種藥物對失眠患者改善睡眠的效果,將12名患者按交叉設(shè)計方案隨機分為兩組,觀察兩種藥物、兩個階段睡眠時間增加量H,每個階段治療兩周,間隔兩周。第一組患者為A→B順序,即第一階段服用A藥,第二階段服用B藥;第二組為B→A順序,即第一階段服用B藥,第二階段服用A藥。結(jié)果見表911。,表911失眠患者睡眠時間增加量H,,,2計算檢驗統(tǒng)計量,,,,,,,,,,,,,,,,,,,表913表911資料的方差分析表,析因設(shè)計的方差分析,析因設(shè)計FACTORIALDESIGN中最簡單的是兩因素方差分析。此時觀察兩個因素分別記為A與B,每個因素兩個水平,共有224種不同的因素水平組合。,在臨床研究中,許多試驗因素之間往往是相互聯(lián)系、相互制約的,有時當一種因素的質(zhì)和量改變時另一種現(xiàn)象的質(zhì)和量也隨之改變。例如,當同時研究兩種試驗因素如兩種藥物的效果,每種因素又有兩個水平如用藥和不用藥時,某種藥物的水平變化有可能使另一種藥物的水平也隨之發(fā)生變化,此時析因設(shè)計FACTORIALDESIGN是一種十分有用的設(shè)計。,它不僅可以檢驗兩因素各水平之間的差異有無統(tǒng)計學意義,而且可以檢驗兩因素間的交互作用。若兩因素間存在交互作用,甲因素的水平改變時,乙因素的效應也相應有所改變;若無交互作用,兩者是相互獨立的。,析因設(shè)計的優(yōu)點還在于可以節(jié)約樣本含量,若將兩種藥物分別進行隨機對照試驗,析因設(shè)計將節(jié)約樣本含量的1/2,若用兩種藥物相互對比的設(shè)計,可節(jié)約1/3的樣本含量。,例96為研究某降血糖藥物對糖尿病及正常大鼠心肌磺脲類藥物受體SUR1的MRNA的影響,某研究者進行了如下實驗將24只大鼠隨機等分成4組兩組正常大鼠,另兩組制成糖尿病模型,糖尿病模型的兩組分別進行給藥物和不給藥物處理,剩余兩組正常大鼠也分別進行給藥物和不給藥物處理,測得各組MRNA吸光度的值結(jié)果見表914。,表9144種不同處理情況下吸光度的值,單獨效應、主效應和交互效應,表915例96資料吸光度均數(shù)的差別,AB兩因素的交互效應的計算公式為,,例96中,,圖9122析因設(shè)計交互作用示意圖,,,表91622析因設(shè)計方差分析計算表,2計算檢驗統(tǒng)計量,,,,,,,,,,,,,,,,,,,,,,,,表917例96資料方差分析表,如果交互作用無統(tǒng)計學意義,可直接采用表917對A、B兩因素的假設(shè)檢驗結(jié)果。,重復測量資料的方差分析,重復測量REPEATEDMEASURE是指對同一觀察對象的同一觀察指標在不同時間點上進行多次測量,用于分析該觀察指標在不同時間上的變化規(guī)律。這類資料在臨床和流行病學研究中比較常見,例如,藥效研究中常常要觀察給藥后不同時間點的血藥濃度。,其主要特點是同一受試對象在不同時點的觀察值之間彼此不獨立,往往存在某種程度上的相關(guān)性。因此,這類資料的方差分析具有一定的特殊性。,例97臨床上為指導腦?;颊叩闹委熀皖A后,某研究人員對不同類型腦?;颊咚嵝粤字珹P在不同時間點的變化,進行了如下觀察隨機選取三種不同類型的腦梗TIA、腦血栓形成、腔隙性腦梗塞患者各8例,分別于腦梗發(fā)生的第24小時、48小時、72小時、7天分別采血,測量血中AP的值,結(jié)果見表918。,表918不同類型腦梗患者AP的值ΜMOL/L,,表919重復測量設(shè)計方差分析的計算表,2計算檢驗統(tǒng)計量,表920三組患者在不同時間點上AP值比較的方差分析表,3確定P值,作出統(tǒng)計推斷,根據(jù)表920的P值,時間與處理因素的交互項有統(tǒng)計學意義,可認為三種不同類型的腦?;颊叩腁P值在不同時間點上的變化是不同的。若想進一步了解三種不同類型的腦?;颊吆退膫€時間點之間的差別,可固定某一因素的水平分析另一因素的效應。,重復測量資料方差分析的前提條件,進行重復測量資料的方差分析,除需滿足一般方差分析的條件外,還需特別滿足協(xié)方差陣COVARIANCEMATRIX的球形性SPHERICITY/CIRCULARITY或復合對稱性COMPOUNDSYMMETRY。若球形對稱性質(zhì)不能滿足,方差分析的結(jié)果會增大I型錯誤的概率。球?qū)ΨQ性通常采用MAUCHLY檢驗MAUCHLY’STEST來判斷,由于MAUCHLY檢驗的統(tǒng)計量的表達式較復雜,計算繁瑣,通常是運用統(tǒng)計軟件完成。,,如果一個協(xié)方差陣主對角線的元素都相等而其他元素均為零,則稱這個協(xié)方差陣具有球性。采用MAUCHLY球性檢驗,可以作出是否拒絕“H0總體協(xié)方差陣具有球性”的結(jié)論。,表921MAUCHLY檢驗和球?qū)ΨQ系數(shù),表922自由度調(diào)整值,表923三組患者在不同時間點上AP值比較的方差分析表GG校正,方差分析對數(shù)據(jù)的基本假設(shè)是①各次觀察獨立,即任何兩個觀察值之間均不相關(guān);②每一水平下的觀察值XIJ分別服從總體均數(shù)為的正態(tài)分布;③各總體的方差相等,即具有方差齊性HOMOGENEITYOFVARIANCE。概括地表達為任何觀察值XIJ都是獨立地來自具有等方差的正態(tài)總體。,,多個方差的齊性檢驗,方差分析要求各樣本的總體方差齊同。因此,在進行方差分析之前,有必要對各樣本的總體方差進行齊性檢驗。檢驗假設(shè)為H0K個總體方差相等,即H1K個總體方差不等或不全相等,LEVENE檢驗法既可用于檢驗兩總體方差齊性,也可用于檢驗多個總體的方差齊性。用于多樣本方差齊性檢驗時,所分析的資料可不具有正態(tài)性。,,例98對例91作方差齊性的LEVENE檢驗。,1建立檢驗假設(shè),確定檢驗水準,三個總體方差全相等,三個總體方差不全相等,010,2計算檢驗統(tǒng)計量,表924例91的LEVENE方差齊性檢驗結(jié)果,表925幾種設(shè)計方案中,和,的分解,變量變換,,變量轉(zhuǎn)換是通過數(shù)學函數(shù)將原數(shù)據(jù)轉(zhuǎn)換成新數(shù)據(jù)。其目的是①改善方差齊性;②使得轉(zhuǎn)換后的資料接近正態(tài)分布;③使得曲線關(guān)系直線化。經(jīng)過轉(zhuǎn)換的數(shù)據(jù)有可能滿足方差分析、T檢驗或直線相關(guān)等統(tǒng)計學方法的應用條件。常用的數(shù)據(jù)轉(zhuǎn)換方法有,變量變換的類型1.對數(shù)變換2.平方根變換3.倒數(shù)變換4.平方根反正弦變換,1對數(shù)變換LOGARITHMICTRANSFORMATION即將原始數(shù)據(jù)X的對數(shù)值作為新的分析數(shù)據(jù)。,對數(shù)變換常用于①使服從對數(shù)正態(tài)分布的數(shù)據(jù)正態(tài)化。如環(huán)境中某些污染物的分布,人體中某些微量元素的分布等,可用對數(shù)變換改善其正態(tài)性。②使數(shù)據(jù)達到方差齊性,特別是各樣本的標準差與均數(shù)成比例或變異系數(shù)CV接近于一個常數(shù)時。,2平方根變換SQUAREROOTTRANSFORMATION即將原始數(shù)據(jù)X的平方根作為新的分析數(shù)據(jù)。,平方根變換常用于①使服從POISSON分布的計數(shù)資料或輕度偏態(tài)的資料正態(tài)化,例如放射性物質(zhì)在單位時間內(nèi)的放射次數(shù),某些發(fā)病率較低的疾病在時間或地域上的發(fā)病例數(shù)分布等,可用平方根變換使其正態(tài)化。②當各樣本的方差與均數(shù)呈正相關(guān)時,可使資料達到方差齊性。,3倒數(shù)變換RECIPROCALTRANSFORMATION即將原始數(shù)據(jù)X的倒數(shù)作為新的分析數(shù)據(jù)X’=1/X,倒數(shù)變換常用于數(shù)據(jù)兩端波動較大的資料,可使極端值的影響減小。,4平方根反正弦變換ARCSINETRANSFORMATION即將原始數(shù)據(jù)X的平方根反正弦值作為新的分析數(shù)據(jù)。變換公式有兩種1用角度表示X=SIN12用弧度表示,平方根反正弦變換常用于服從二項分布的率或百分比的資料,如流行病學研究中疾病的發(fā)病率、患病率,實驗研究中白細胞分類計數(shù)、淋巴細胞轉(zhuǎn)變率。一般認為,當總體率較小如<30%或較大如>70%時,偏離正態(tài)較為明顯,通過樣本率的平方根反正弦變換,可使資料接近正態(tài)分布,達到方差齊性的要求。,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 133
大小: 2.64(MB)
子文件數(shù):
-
簡介:第六章幾種常見離散型變量的分布和應用,寧夏醫(yī)科大學公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學系主講人李吳萍教授,DISTRIBUTIONANDAPPLICATIONOFDISCRETEDATA,,一、二項分布條件與性質(zhì)(二分類變量)一)、BERNOULLI試驗在醫(yī)學科研中,很多情況可歸納為觀察隨機試驗中某事件是否發(fā)生。如觀察某藥物是否有效;觀察某指標的化驗結(jié)果是否為陽性。這些試驗的共同的特征是一次試驗只有兩種獨立的結(jié)果事件發(fā)生或事件不發(fā)生,這種試驗稱為BERNOULLI試驗(或成敗試驗)。,第一節(jié)二項分布,BERNOULLI試驗序列滿足以下三個條件的N次試驗構(gòu)成的序列稱為BERNOULLI試驗序列。1)各觀察單位只能是具有相互對立的一種結(jié)果,如陽性或陰性,生存和死亡等。2)已知發(fā)生某一結(jié)果(如陽性)的概率為?,其對立結(jié)果的概率為1?。實際工作中要求?是從大量觀察中獲取的比較穩(wěn)定的數(shù)值。3)N個觀察單位結(jié)果互相獨立,即每個觀察結(jié)果不會影響到其它觀察單位結(jié)果。,,例61設(shè)小白鼠接受某種毒物一定劑量時,其死亡率為80,對于每只小白鼠來說,其死亡概率為08,生存概率為02?,F(xiàn)對3只小白鼠進行實驗觀察。結(jié)果見下表滿足BERNOULLI試驗序列三個條件一、二分類資料;二、因每次實驗條件不變,每只動物的死亡概率是相同的;三、每只動物的生與死不影響其它動物。,,,互不相容事件的加法定理,,,其中X0,1,2,N。N,Π是二項分布的兩個參數(shù)。,對于任何二項分布,總有,,構(gòu)成BERNOULLI試驗序列的N次實驗中,事件A出現(xiàn)的次數(shù)X的概率分布為,二項式展開各項就是每種組合的概率其一般表達式為由于各觀察單位是獨立的,則從該總體中隨機抽取N例,其中恰有X例是陽性的概率為二項式展開,記作,稱為二項分布的概率函數(shù),即,,,兩種累計方式最多有K例陽性概率最少有K例陽性的概率,二項分布的累計概率(CUMULATIVEPROBABILITY,例62已知某地玉米的黃曲霉污染率近年為20。若抽取10個樣品作檢查,求(1)污染樣品數(shù)不超過一個的概率。(2)污染樣品數(shù)在8個以上的概率。解,,二二項分布的適用條件1每次試驗只會發(fā)生兩種對立的可能結(jié)果之一,即分別發(fā)生兩種結(jié)果的概率之和恒等于1;2每次試驗產(chǎn)生某種結(jié)果(如“陽性”)的概率Π固定不變;3重復試驗是相互獨立的,即任何一次試驗結(jié)果的出現(xiàn)不會影響其它試驗結(jié)果出現(xiàn)的概率。,在上面的例61中,對這10名非傳染性疾病患者的治療,可看作10次獨立的重復試驗,其療效分為有效與無效,且每一名患者治療有效的概率(Π070)是恒定的。這樣,10人中發(fā)生有效的人數(shù)X~B10,070。,1、二項分布的均數(shù)與方差若X服從二項分布,它的概率為Π,樣本例數(shù)為N,可簡記為X~B(N,?)則X的均數(shù)X的方差X的標準差,三二項分布的性質(zhì),若以率表示,則樣本率P的總體均數(shù)為則樣本率P的總體方差為則樣本率P的總體標準差為,樣本率的標準差也稱為率的標準誤,可用來描述樣本率的抽樣誤差,率的標準誤越小,則率的抽樣誤差就越小。在一般情形下,總體率Π往往并不知道。此時若用樣本資料計算樣本率PX/N作為Π的估計值,則的估計為,例63在觀測一種藥物對某種非傳染性疾病的治療效果時,用該藥治療了此種非傳染性疾病患者100人,發(fā)現(xiàn)55人有效,計算率的抽樣誤差。,2、二項分布的圖形特征,二項分布圖形由參數(shù)N和Π決定,當Π05時,分布是對稱的,見圖61,2、二項分布的圖形特征,當Π≠05時,分布是偏態(tài)的,但隨著N的增大,分布趨于對稱。當N~∞時,只要Π不太靠近0或1,二項分布則接近正態(tài)分布,見圖62。,,圖62,二、二項分布的應用,一總體率的區(qū)間估計1查表法2正態(tài)近似法,二、二項分布的應用,1查表法對于N≤50的小樣本資料,直接查附表6百分率的95或99可信區(qū)間表,即可得到其總體率的可信區(qū)間。例62在對13名輸卵管結(jié)扎的育齡婦女經(jīng)壺腹部壺腹部吻合術(shù)后,觀察其受孕情況,發(fā)現(xiàn)有6人受孕,據(jù)此資料估計該吻合術(shù)婦女受孕率的95可信區(qū)間。,二、二項分布的應用,附表6只列出的部分。當時,可先按“陰性”數(shù)NX查得總體陰性率的1Α可信區(qū)間QL~QU,再用下面的公式轉(zhuǎn)換成所需的陽性率的1Α可信區(qū)間。PL1QU,PU1QL例62在對13名輸卵管結(jié)扎的育齡婦女經(jīng)壺腹部壺腹部吻合術(shù)后,觀察其受孕情況,發(fā)現(xiàn)有7人受孕,據(jù)此資料估計該吻合術(shù)婦女受孕率的95可信區(qū)間。,二、二項分布的應用,2正態(tài)近似法根據(jù)數(shù)理統(tǒng)計學的中心極限定理可得,當N較大、Π不接近0或1時,二項分布BN,Π近似正態(tài)分布,而相應的樣本率P的分布也近似正態(tài)分布。為此,當N較大、P和1P均不太小,如NP和N1P均大于5時,可利用樣本率P的分布近似正態(tài)分布來估計總體率的可信區(qū)間。,的可信區(qū)間為如的95可信區(qū)間為的99可信區(qū)間為,,例在某鎮(zhèn)按人口的1/20隨機抽取329人,作血清登革熱血凝抑制擴抗體反應檢驗,得陽性率為881,求此陽性率的抽樣誤差SP及總體陽性率的95可信區(qū)間。本例N329,P881,則其抽樣誤差為則其總體率的95可信區(qū)間為,二樣本率與總體率的比較1直接法在諸如療效評價中,利用二項分布直接計算有關(guān)概率,對樣本率與總體率的差異進行有無統(tǒng)計學意義的比較。比較時,經(jīng)常遇到單側(cè)檢驗,即“優(yōu)”或“劣”的問題。那么,在總體陽性率為Π的N次獨立重復試驗中,下面兩種情形的概率計算是不可少的。,(1)出現(xiàn)“陽性”的次數(shù)至多為K次的概率為(2)出現(xiàn)“陽性”的次數(shù)至少為K次的概率為,例64據(jù)報道,對輸卵管結(jié)扎了的育齡婦女實施壺腹部壺腹部吻合術(shù)后,受孕率為055。今對10名輸卵管結(jié)扎了的育齡婦女實施峽部峽部吻合術(shù),結(jié)果有9人受孕。問實施峽部峽部吻合術(shù)婦女的受孕率是否高于壺腹部壺腹部吻合術(shù)顯然,這是單側(cè)檢驗的問題,其假設(shè)檢驗為H0Π055H1Π055005,,對這10名實施峽部峽部吻合術(shù)的婦女,按055的受孕率,若出現(xiàn)至少9人受孕的概率大于005,則不拒絕H0;否則,拒絕H0,接受H1。本例N10,Π055,K9。按公式(612),按Α005水準,拒絕H0,接受H1,即認為實施峽部峽部吻合術(shù)婦女的受孕率要高于壺腹部壺腹部吻合術(shù)。,2正態(tài)近似法當N較大、P和1P均不太小,如NP和N1P均大于5時,利用樣本率的分布近似正態(tài)分布的原理,可作樣本率P與已知總體率Π0的比較。檢驗統(tǒng)計量U值的計算公式為,例66對某疾病采用常規(guī)治療,其治愈率為45。現(xiàn)改用新的治療方法,并隨機抽取180名該疾病患者進行了新療法的治療,治愈117人。問新治療方法是否比常規(guī)療法的效果好本例是單側(cè)檢驗,記新治療方法的治愈率為Π,而Π0045。其假設(shè)檢驗為H0Π045H1Π045Α005,本例N180,P117/180065查U界值表(T界值表中V為∞的一行)得單側(cè)P1時,隨X取值的變大,PX值先增大而后變小。如若是整數(shù),則PX在X和X1位置取得最大值。,二、POISSON分布的應用一總體均數(shù)的區(qū)間估計利用服從POISSON分布的樣本資料可估計其總體均數(shù)的可信區(qū)間。估計方法如下1查表法對于獲得的樣本計數(shù)X,當X≤50時,直接查附表7的POISSON分布可信區(qū)間表,即可得到其總體均數(shù)的95或99可信區(qū)間。,例610某工廠在環(huán)境監(jiān)測中,對一實施了技術(shù)改造的生產(chǎn)車間作空氣中粉塵濃度的檢測,1立升空氣中測得粉塵粒子數(shù)為21。假定車間空氣中的粉塵分布均勻,試估計該車間平均每立升空氣中所含粉塵顆粒數(shù)的95和99可信區(qū)間。本例,X21,查查附表7,該車間平均每立升空氣所含粉塵顆粒數(shù)的95可信區(qū)間為130~320;99可信區(qū)間為110~359。,2正態(tài)近似法當X50時,可采用正態(tài)近似法估計總體均數(shù)的可信區(qū)間,計算公式為如的95可信區(qū)間為,例611某研究者對某社區(qū)12000名居民進行了健康檢查,發(fā)現(xiàn)其中有68名胃癌患者。估計該社區(qū)胃癌患病數(shù)的95和99可信區(qū)間。,二樣本均數(shù)與總體均數(shù)的比較對于POISSON分布資料而言,進行樣本均數(shù)與總體均數(shù)的比較有兩種方法。1直接法當總體均數(shù)20時,可采用直接計算概率的方式對樣本均數(shù)與已知總體均數(shù)間的差別進行有無統(tǒng)計學意義的比較,這實質(zhì)上是對以樣本計數(shù)X為代表的總體率Π與已知的總體率Π0是否有差別進行推斷。,例612一般人群先天性心臟病的發(fā)病率為8‰,某研究者為探討母親吸煙是否會增大其小孩的先天性心臟病的發(fā)病危險,對一群20~25歲有吸煙嗜好的孕婦進行了生育觀察,在她們生育的120名小孩中,經(jīng)篩查有4人患了先天性心臟病。試作統(tǒng)計推斷。,2、正態(tài)近似法根據(jù)POISSION分布的性質(zhì),當Λ≥20時,可用正態(tài)分布來近似。樣本計數(shù)X與已知均數(shù)Λ的比較,采用下式計算標準正態(tài)檢驗統(tǒng)計量。,例613有研究表明,一般人群精神發(fā)育不全的發(fā)生率為3‰,今調(diào)查了有親緣血統(tǒng)婚配關(guān)系的后代25000人,發(fā)現(xiàn)123人精神發(fā)育不全,問有親緣血統(tǒng)婚配關(guān)系的后代其精神發(fā)育不全的發(fā)生率是否要高于一般人群可以認為人群中精神發(fā)育不全的發(fā)生數(shù)服從POISSON分布。本例N25000,X123,Π00003,NΠ025000000375。,三兩個樣本均數(shù)的比較對服從POISSON分布的樣本,其樣本計數(shù)可看作是樣本均數(shù)。兩個樣本均數(shù)的比較,目的在于推斷兩樣本所代表的兩總體均數(shù)是否有差別。設(shè)兩個樣本計數(shù)分別為X1和X2,可利用正態(tài)近似法進行比較。,1兩個樣本的觀察單位數(shù)相等,即N1N2。,2兩個樣本的觀察單位數(shù)不相等,即N1≠N2。,例614某衛(wèi)生檢疫機構(gòu)對兩種純凈水各抽驗了1ML水樣,分別培養(yǎng)出大腸桿菌4個和7個,試比較這兩種純凈水中平均每毫升所含大腸桿菌數(shù)有無差別本例水樣中的大腸桿菌數(shù)服從POISSON分布,兩種水樣的觀察單位數(shù)相等,即均為1ML。兩樣本計數(shù)分別記為X14和X27,X1X27411。選擇公式(621)來計算檢驗統(tǒng)計量。,例615某研究者為了分析一種罕見的非傳染性疾病發(fā)病的地域差異,對甲地區(qū)連續(xù)觀察了四年,發(fā)現(xiàn)有32人發(fā)??;對乙地區(qū)連續(xù)觀察了三年,發(fā)現(xiàn)有12人發(fā)病。假定甲、乙兩地區(qū)在觀察期內(nèi)的人口構(gòu)成相同,人口基數(shù)相近且基本不變,試作統(tǒng)計推斷。,本例中疾病的發(fā)病人數(shù)服從POISSON分布,但對甲地區(qū)連續(xù)觀察了四年(N14),而對乙地區(qū)只連續(xù)觀察了三年(N23),即兩個樣本的觀察時間單位數(shù)不相等。甲、乙兩地區(qū)在觀察期內(nèi)的發(fā)病人數(shù)分別記為X132和X212,X1X2321244。選擇公式(622)來計算檢驗統(tǒng)計量。,總結(jié)1二項分布常用于描述變量的結(jié)果只有兩種的出現(xiàn)規(guī)律,2泊松分布可看成是二項分布的特例,用于小概率事件的發(fā)生規(guī)律,當然泊松分布專用于空間散點試驗模型的出現(xiàn)規(guī)律。,二項分布、泊松分布與正態(tài)分布的漸進關(guān)系,,正態(tài)分布,二項分布,泊松分布,N很大而Π很小,,,,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 81
大小: 1.77(MB)
子文件數(shù):