眾賞文庫
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認知 防護手冊 復工復產(chǎn) 應急預案 防控方案 英雄事跡 院務(wù)工作
  • 成品畢設(shè) >
    成品畢設(shè)
    外文翻譯 畢業(yè)設(shè)計 畢業(yè)論文 開題報告 文獻綜述 任務(wù)書 課程設(shè)計 相關(guān)資料 大學生活 期刊論文 實習報告
  • 項目策劃 >
    項目策劃
    土地準備 規(guī)劃設(shè)計 開工開盤 項目綜合 竣工移交 售后移交 智慧方案 安全專項 環(huán)境影響評估報告 可行性研究報告 項目建議書 商業(yè)計劃書 危害評估防治 招投標文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學 基礎(chǔ)建設(shè) 能源化工 農(nóng)林牧畜 綜合待分類 教育經(jīng)驗 行政人力 企業(yè)管理 醫(yī)學衛(wèi)生 IT技術(shù) 土木建筑 考研專題 財會稅務(wù) 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結(jié)匯報 調(diào)研報告 工作計劃 述職報告 講話發(fā)言 心得體會 思想?yún)R報 事務(wù)文書 合同協(xié)議 活動策劃 代理加盟 技術(shù)服務(wù) 求職簡歷 辦公軟件 ppt模板 表格模板 融資協(xié)議 發(fā)言演講 黨團工作 民主生活
  • 學術(shù)文檔 >
    學術(shù)文檔
    自然科學 生物科學 天文科學 醫(yī)學衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學、安全科學 軍事 政學 文化、科學、教育、 交通運輸 經(jīng)濟 語言、文字 文學 農(nóng)業(yè)科學 社會科學總論 藝術(shù) 歷史、地理 哲學 數(shù)理科學和化學 綜合性圖書 哲學宗教
  • 經(jīng)營營銷 >
    經(jīng)營營銷
    綜合文檔 經(jīng)濟財稅 人力資源 運營管理 企業(yè)管理 內(nèi)控風控 地產(chǎn)策劃
  • 教學課件 >
    教學課件
    幼兒教育 小學教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習題 課后答案 綜合教學
  • 土木建筑 >
    土木建筑
    專項施工 應急預案 建筑規(guī)范 工藝方案 技術(shù)交底 施工表格 圖片圖集
  • 課程導學 >
    課程導學
    醫(yī)學綜合 中醫(yī)養(yǎng)生 醫(yī)學研究 身心發(fā)展 醫(yī)學試題 影像醫(yī)學 醫(yī)院辦公 外科醫(yī)學 老年醫(yī)學 內(nèi)科醫(yī)學 婦產(chǎn)科 神經(jīng)科 醫(yī)學課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學 康復醫(yī)學 全科醫(yī)學 護理學科 針灸學科 重癥學科 病毒學科 獸醫(yī) 藥學
  • 資源分類:
    全部 抗擊疫情 成品畢設(shè) 項目策劃 專業(yè)資料 共享辦公 學術(shù)文檔 經(jīng)營營銷 教學課件 土木建筑 課程導學
    二級分類:
    全部 自然科學 生物科學 天文科學 醫(yī)學衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學、安全科學 軍事 政學 文化、科學、教育、體育 交通運輸 經(jīng)濟 語言、文字 文學 農(nóng)業(yè)科學 社會科學總論 藝術(shù) 歷史、地理 哲學 數(shù)理科學和化學 綜合性圖書 哲學宗教
    三級分類:
    全部 哲學、宗教 工業(yè)技術(shù) 語言、文字 哲學 藝術(shù) 農(nóng)業(yè)科學 天文學、地球科學 文化、科學、教育、體育 航空、航天 綜合性圖書 生物科學 軍事 交通運輸 政學 經(jīng)濟 醫(yī)學、衛(wèi)生 文學 數(shù)理科學和化學 環(huán)境科學、安全科學 歷史、地理 自然科學總論 社會科學總論
    四級分類:
    全部 社會科學理論與方法論 社會科學研究方法 社會科學機構(gòu)、團體、會議 統(tǒng)計學
    上傳類型:
    全部 互聯(lián)網(wǎng)共享 作者原創(chuàng) 獨家資料
    資源格式:
    不限 doc ppt pdf 圖片 flash 視頻 音頻 壓縮包
    上架時間:
    不限 三天內(nèi) 一周內(nèi) 一個月內(nèi) 一年內(nèi)
    特色搜索:
    不限 文件包巨大 瀏覽量超巨 購買量排行 子文件超多好評如潮
    • 簡介:衛(wèi)生統(tǒng)計學案例分析,201505,中藥治療再生障礙性貧血,治療前后血紅蛋白結(jié)果見下面數(shù)據(jù)。某醫(yī)生計算出治療前后的差值,均數(shù)為35,故認為治療后血紅蛋白含量高于治療前?;颊呔幪?23456789治療前686555755070766572治療后12882801121251108580105(1)該資料屬于什么資料類型(2)該資料屬于何種設(shè)計方案(3)比較治療前后血紅蛋白是否有差別可采用什么統(tǒng)計方法用這些方法的條件是什么(4)該醫(yī)生的結(jié)論是否正確為什么(5)請比較治療前后血紅蛋白是否有差別,寫出分析步驟,并下結(jié)論。,案例一,,定量資料自身配對設(shè)計差值服從正態(tài)分布,配對T檢驗;不服從正態(tài)分布,配對設(shè)計秩和檢驗;應用條件略錯誤,沒有進行統(tǒng)計推斷,直接用樣本信息下結(jié)論。該資料首先檢驗差值是否服從正態(tài)分布,然后選擇合適檢驗方法進行統(tǒng)計推斷本題差值服從正態(tài)分布,用配對T檢驗吧,T478,P0001,治療前后血紅蛋白差別有統(tǒng)計學意義。,案例二,研究2種單味中藥對小鼠細胞免疫功能的影響,并設(shè)一個空白對照組,將30只小鼠隨機分為3組,每組10只,雌雄各半,用藥15天后,測定E玫瑰結(jié)形成率(),結(jié)果如下。研究者對該資料采用了兩樣本均數(shù)的T檢驗進行兩兩比較,得結(jié)論為除黨參與黃芪兩組差異沒有統(tǒng)計學意義(P>005),其余兩組間差異有統(tǒng)計學意義(P<005)。對照組1410121613141210139黨參組21241817221918232018黃芪組24202218172118221923(1)這是什么資料該資料屬于何種設(shè)計方案(2)擬比較三組小鼠細胞免疫功能是否有差異,可以采用哪些統(tǒng)計方法用該方法的條件是什么思想是什么請寫出三組小鼠細胞免疫功能比較的分析步驟,并下結(jié)論。(3)如果想知道黨參組和黃芪組小鼠細胞免疫功能是否有差異,可以采用哪些統(tǒng)計方法(4)該研究者的統(tǒng)計處理方法是否正確為什么,定量資料,完全隨機設(shè)計完全隨機設(shè)計方差分析,多個獨立樣本秩和檢驗。應用條件略。思想略。經(jīng)檢驗服從正態(tài)分布,方差齊,F(xiàn)2549,P0000多個樣本均數(shù)的兩兩比較,LSD,SNK不正確,方法錯誤。三組均數(shù)比較用T檢驗增大犯一類錯誤概率。,案例三,分別測得13名健康人和13名Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量G/L如下表。某研究者根據(jù)此資料先計算差值并進行正態(tài)性檢驗,服從統(tǒng)計后應用配對T檢驗T5276,P0000,故認為Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量高于健康人。表213名健康人和13名Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量G/L,(1)請計算健康人和Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量的均數(shù)和標準差(請注明步驟)。(2)欲比較兩組抗胰蛋白酶含量是否有差異,可以采用哪些統(tǒng)計方法用這些方法的條件是什么(3)該研究者的統(tǒng)計處理方法是否正確為什么(4)比較兩組抗胰蛋白酶含量是否有差異,請寫出分析步驟,并下結(jié)論。,健康人均數(shù)215,標準差106;Ⅲ度肺氣腫病人均數(shù)432,標準差111兩獨立樣本T檢驗、兩獨立樣本秩和檢驗,應用條件略該研究者結(jié)論錯誤,首先應該做正態(tài)及方差齊性檢驗。滿足正態(tài)方差齊,可用兩獨立樣本T檢驗做統(tǒng)計推斷。服從正態(tài)、方差齊,用兩獨立樣本T檢驗做統(tǒng)計推斷。T509,P0000,差異有統(tǒng)計學意義。,案例四,已知正常成年男子血紅蛋白均值為140G/L,今隨機調(diào)查某廠成年男子60人,測其血紅蛋白均值為125G/L,標準差15G/L。故認為該廠成年男子血紅蛋白均值低于一般成年男子。(1)該結(jié)論是否正確為什么(2)有研究者根據(jù)該資料估計該地成年男子血紅蛋白均值為125G/L,該結(jié)論是否正確為什么(3)解決此類問題可采用哪些統(tǒng)計分析方法這些方法有什么區(qū)別和聯(lián)系(4)擬比較該廠成年男子血紅蛋白均值與一般成年男子是否有差異,請寫出分析步驟,并下結(jié)論。,不正確,案例五,某地隨機抽樣調(diào)查了部分健康成人的血紅蛋白含量(G/L),結(jié)果見表1表1某地健康成人的血紅蛋白含量(G/L),(1)有人認為該地男女性血紅蛋白含量均低于上表的標準值(若測定方法相同)且男性血紅蛋白含量低于女性,你是否同意該結(jié)論(2)可采用什么方法比較男和女血紅蛋白含量是否有差異如果男和女血紅蛋白含量有差異,是否有實際意義(3)請制定該人群的參考值范圍制定參考值范圍需要注意什么總體均數(shù)的置信區(qū)間和參考值范圍有何區(qū)別,結(jié)論不完全正確,研究者想通過抽樣調(diào)查了解總體特征,但是沒有考慮抽樣誤差,直接用樣本均數(shù)作為總體的估計值,用單樣本T檢驗或通過置信區(qū)間回答。假設(shè)檢驗、兩組大樣本均數(shù)比較,用U檢驗,假設(shè)檢驗只能說明有無統(tǒng)計學意義,不能說明實際意義。制定參考值范圍需要注意1、所謂正常人指的是排除了影響所研究指標的疾病和有關(guān)因素的同質(zhì)人群。2、選擇有足夠大的人群作為調(diào)查對象樣本數(shù)理足夠大3、確定單側(cè)還是雙側(cè)正常值范圍;選擇適當?shù)陌俜纸缦?,選擇正確的方法(百分位數(shù)或近似正態(tài)法,,,案例六,,案例七,,,,謝謝,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 17
      28人已閱讀
      ( 4 星級)
    • 簡介:1,第十章多個樣本均數(shù)比較方差分析ANALYSISOFVARIANCE,學習目的和要求1、掌握方差分析的基本思想和應用條件2、掌握完全隨機設(shè)計方差分析的計算過程。3、熟悉隨機區(qū)組設(shè)計方差分析的設(shè)計方法和總變異和自由度的組成情況,4、熟悉方差齊性檢驗的作用。,2,,用途比較某實驗處理因素不同水平樣本均數(shù)間差別有無統(tǒng)計學意義,從而說明該實驗因素某水平是否有作用的方法。,種類根據(jù)實驗因素的數(shù)量分為單因素方差分析多因素兩因素及以上方差分析,方差分析由RAFISHER英首創(chuàng),又稱F檢驗縮寫ANOVA,3,第一節(jié)方差分析的基本思想和應用條件,4,一、名詞解釋,處理因素和水平研究者對研究對象人為地施加某種干預措施,稱為處理因素FACTOR或?qū)嶒炓蛩?;處理因素所處的不同狀態(tài)稱為水平LEVEL。處理因素的水平數(shù)≥2,即實驗的組數(shù)。,5,三組戰(zhàn)士行軍后體溫增加數(shù)℃不飲水定量飲水不限量飲水191409181207161109171411151109161309131108141010161209,處理因素飲水方式水平數(shù)3,6,單因素實驗實驗中的處理因素只有一個,這個處理因素包括CC≥2個水平,分析不同水平實驗結(jié)果的差別是否有統(tǒng)計學意義。,多因素實驗實驗中的處理因素≥2,各處理因素的水平≥2,分析各處理因素各水平的實驗結(jié)果有無差別、有無交互作用。,7,,1、完全隨機設(shè)計的單因素方差分析用途用于完全隨機設(shè)計的多個樣本均數(shù)間的比較,其統(tǒng)計推斷是推斷各樣本所代表的各總體均數(shù)是否相等。2、隨機區(qū)組設(shè)計的兩因素方差分析用途用于隨機區(qū)組設(shè)計的多個樣本均數(shù)比較,其統(tǒng)計推斷是推斷各樣本所代表的各總體均數(shù)是否相等。,8,,組間變異,總變異,組內(nèi)變異,,,,二、方差分析的基本思想單因素重點,9,,首先按照設(shè)計類型將全部觀察值的總變異按影響實驗結(jié)果的諸因素分解為若干部分變異,每部分都與特定的因素(處理因素或隨機因素)相聯(lián)系,然后以某處理因素與隨機因素之比構(gòu)造檢驗統(tǒng)計量F,通過比較F值與臨界值的大小做出對總體均數(shù)的推斷,10,完全隨機設(shè)計的數(shù)據(jù)結(jié)構(gòu),處理因素的分組水平合計12CX11X21XC1X12X22XC2X1N1X2N2XCNCNIN1N2NC,,,,,,11,,用II1,2,3,C)表示C個不同的處理分組(即水平組)的第I組,第I組的樣本含量為NI(各NI可以不相等)總樣本含量為N=N1+N2++NCXIJ表示第I組第J個值J1,2,3,NI)表示第I組的均值。表示總均值,12,三組戰(zhàn)士行軍后體溫增加數(shù)℃不飲水定量飲水不限量飲水191409181207161109171411151109161309131108141010161209,,,,,,,C=3,N1=N2=N3=8,13,組間變異SS組間(SSTR不同處理組樣本均數(shù)之間的差異用組間離均差平方和處理因素隨機誤差,,組內(nèi)變異SS組內(nèi)(SS誤差或SSE組內(nèi)離均差平方和隨機誤差,總變異SS總(SST總離均差平方和(所有觀察值與總均值之差的平方和),離均差平方和SS,14,,重點,15,如果每個處理組的觀察值XIJ分別服從相同方差Σ2的正態(tài)分布N(Μ1,Σ2),N(Μ2,Σ2),┄,N(ΜC,Σ2),那么MEANSQUARE,MS(均方),16,,(非常重要,不要記反),17,,如果處理因素無作用組間變異=組內(nèi)變異F1如果處理因素有作用組間變異>組內(nèi)變異F>1,18,19,三、應用條件(重點),1各樣本是相互獨立的隨機樣本;2各樣本數(shù)據(jù)均服從正態(tài)分布;3相互比較的各樣本的總體方差相等,即方差齊性HOMOGENEITYOFVARIANCE。,20,,,,,,,,21,第二節(jié)完全隨機設(shè)計資料的方差分析,22,一、完全隨機設(shè)計COMPLETELYRANDOMDESIGN,,各組例數(shù)可以相等或不等,,甲處理(N1),乙處理(N2),丙處理(N3),?,試驗對象(N),隨機化分組,23,完全隨機設(shè)計的數(shù)據(jù)結(jié)構(gòu),處理因素的分組水平合計12CX11X21XC1X12X22XC2X1N1X2N2XCNCNIN1N2NC,,,,,,24,二、變異分解,25,完全隨機設(shè)計資料方差分析公式,變異來源SS?MSF值,校正數(shù),,,,N-1,總變異,組間,C-1,組內(nèi),N-C,26,表1033組大鼠腎組織中NO水平/ΜMOLL1,正常對照組腎缺血腎缺血60分鐘合計60分鐘組再灌注組437983227528404285754645119490???309602887621972338833866714317NI1212123641067839434331170011167211436935866613292755339883943821836501552223,,,,,27,,,三、分析步驟,1、建立假設(shè)H0?1?2?3(各組大鼠NO含量總體均值相等)H1?I不等或不全相等?0052、計算統(tǒng)計量,28,,29,,30,表104方差分析表,變異來源SS?MSFF001總18608357835組間469259502234629755564532組內(nèi)139157628334216898,,,,(3)求P值作出結(jié)論附表3,結(jié)論按?005水平,拒絕H0,接受H1,認為3組NO水平不同。但只能說明3組NO水平有差異,不能認為任何兩組之間有差別,31,注意當拒絕H0,接受H1,不能說明各組總體均數(shù)兩兩間都有差別,要進行多個均數(shù)間多重比較。,32,第三節(jié)隨機區(qū)組設(shè)計資料的方差分析,33,隨機區(qū)組設(shè)計,將全部受試對象按某種或某些特性分為若干個區(qū)組,使每個區(qū)組內(nèi)的觀察對象與研究對象的水平盡可能相近,減少了個體間差異對研究結(jié)果的影響,比成組設(shè)計更容易檢驗出處理因素(因素A)間的差別,提高了研究效率。(復習配對資料)是配對資料的擴充。,34,隨機選擇9窩中年大鼠,每窩中取兩只雌性大鼠隨機地分入甲、乙兩組,甲組大鼠不接受任何處理即空白對照,乙組中的每只大鼠接受3MG/KG的內(nèi)毒素。分別測得兩組大鼠的肌酐MG/L測定結(jié)果如下。,窩別編號123456789甲對照組623758273961677838乙處理組753863435373567972,,,,配對設(shè)計計量資料,35,按性別相同、年齡相近、病情相近把33例某病患者配成11個區(qū)組,每區(qū)組3個患者,分別給予A藥、B藥和C藥治療。治療后患者血漿中的IGA含量見表。問經(jīng)三種不同藥物治療后該病患者血漿中IGA含量有無差別,隨機區(qū)組設(shè)計計量資料,36,又稱配伍組設(shè)計是配對設(shè)計的擴大,因素A為處理因素,因素B為區(qū)組因素,是影響實驗結(jié)果的主要非處理因素先按影響實驗結(jié)果的非處理因素(如性別、體重、年齡、職業(yè)、病情、病程等將受試對象配成區(qū)組,再分別將區(qū)組內(nèi)的受試對象隨機分配到各處理組或?qū)φ战M。,一、隨機區(qū)組設(shè)計RANDOMIZEDBLOCKDESIGN,將因素B產(chǎn)生的變異從組內(nèi)變異中分離出來,減少了組內(nèi)變異,達到分析因素A的作用時排除因素B的干擾作用提高了統(tǒng)計檢驗效率。,37,例比較不同產(chǎn)地石棉毒性的大小,處理因素不同產(chǎn)地的石棉(甲、乙、丙)實驗對象及例數(shù)雌性WISTAR大鼠36只實驗效應肺泡巨噬細胞存活率()控制因素WISTAR大鼠月齡、體重實驗設(shè)計隨機區(qū)組設(shè)計方法將月齡體重相近的3只大鼠配為一個區(qū)組,共12個區(qū)組;在區(qū)組內(nèi)隨機分配處理因素。,38,表106不同產(chǎn)地石棉處理后大鼠的肺泡巨噬細胞存活率()石棉產(chǎn)地(因素A)C,,,,,,合計,?,,39,二、變異分解,40,重點掌握,41,隨機區(qū)組設(shè)計資料方差分析公式,變異來源SS?MSF值,,,,N-1,總變異,處理,C-1,誤差,R1C1,區(qū)組,R-1,42,,校正數(shù)C∑X2/N。C為因素A的水平數(shù)R為因素B的水平數(shù)(因素A每個水平觀察例數(shù))隨機區(qū)組設(shè)計中因素A每個水平觀察例數(shù)等于因素B的水平數(shù)R;因素B每個水平觀察例數(shù)等于因素A的水平數(shù)C,43,表106不同產(chǎn)地石棉處理后大鼠的肺泡巨噬細胞存活率()R石棉產(chǎn)地(因素A)C,,,,,,合計,?,,44,,,三、分析步驟,H0?1?2?3H1?I不等或不全相等?005本例C3,R12N36,45,,46,,47,,48,方差分析表,變異來源SS?MSFP總377737535處理間24413862122069331588<001區(qū)組間48581211441651143005誤差8501772238644,,,,49,,對于不同產(chǎn)地石棉間,按查附表12方差分析F界值表,1143則P005,按?005水平,不拒絕H0,尚不能認為不同區(qū)組大鼠的肺泡巨噬細胞存活率不同,50,第六節(jié)多個樣本均數(shù)間的多重比較,51,當方差分析結(jié)果的處理因素間有統(tǒng)計學意義,只說明各總體均數(shù)不全相等;若了解各總體均數(shù)兩兩之間差別情況,需作多個樣本均數(shù)間多重比較。目的方法1一對或幾對在專業(yè)上有LSDT檢驗特殊意義樣本均數(shù)比較2各實驗組與一個對照組DUNNETTT檢驗樣本均數(shù)多重比較3多個樣本均數(shù)兩兩間的SNKQ檢驗全面比較,,,,52,多個樣本均數(shù)間比較不能采用T檢驗,否則將增大犯1類錯誤概率。,對某一資料中3組數(shù)據(jù)用T檢驗作兩兩比較比較組別檢驗水準不犯1型錯誤概率A組與B組?005(1?005)A組與C組?005(1?005)B組與C組?005(1?005)3次均不犯1型錯誤概率為1?0053總的檢驗水準為Α1?1?0053014,,,,53,一、SNKQ檢驗,,SNKSTUDENTNEWMANKEULS檢驗,亦稱Q檢驗。,和分別為兩個對比組的樣本均數(shù),MS誤差為算得的誤差均方(組內(nèi)均方),NA,NB分別為兩對比組的樣本例數(shù)。V誤差為誤差均方的自由度,54,表106不同產(chǎn)地石棉處理后大鼠的肺泡巨噬細胞存活率()石棉產(chǎn)地(因素A)C,,,,,,合計,?,,55,例103三組大鼠的的肺泡巨噬細胞存活率均值兩兩之間有無差別,,,不同產(chǎn)地甲地乙地丙地肺泡巨噬細胞存活率均值485557136865從大到小序次321應用Q檢驗進行兩兩比較,計算如下,列在表108中,,56,,57,三種藥物抑瘤效果比較,比較組AQQ005,22Q001,22P丙-甲201031120358464SS組內(nèi)DMS組間MS組內(nèi)EΝ組間Ν組內(nèi),71,方差分析與T檢驗的聯(lián)系,一、方差分析與T檢驗的聯(lián)系完全隨機設(shè)計的兩個樣本均數(shù)比較的T檢驗,可以用完全水機設(shè)計的方差分析代替。兩者的計算結(jié)果有如下關(guān)系,72,,二、方差分析與T檢驗的區(qū)別完全隨機設(shè)計的兩樣本均數(shù)比較的T檢驗,可以用完全隨機設(shè)計的方差分析代替;反之,則不成立,即多個樣本均數(shù)比較的方法,應該用方差分析,而不能用兩個樣本均數(shù)比較的T檢驗代替,否則增大了犯Ⅰ型錯誤的概率,即可能會錯誤得出兩個總體均數(shù)有差別的結(jié)論。,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 72
      22人已閱讀
      ( 4 星級)
    • 簡介:醫(yī)學統(tǒng)計學(MEDICALSTATISTICS),“不明于計數(shù),而欲舉大事,猶無舟楫而欲經(jīng)于水險也?!?管仲,“統(tǒng)計學是追求科學的人從荊棘叢生的困難阻擋中,開辟出道路的最好的工具?!?FRANCISGALTON,“統(tǒng)計根據(jù)科學方法,以繁賾事實,列記之,整理之;從大量,得共相;由已知,測未知;使樊然者,呈整齊之相;棼如者,有跡可循;復雜變量,燭照無遺;紛紜事態(tài),一目了然,此其功也。”,陳善林,第一章緒論CHARPTER1INTRODUCTION,“數(shù)字雖然枯燥,但卻能說明問題”統(tǒng)計學是一門與數(shù)據(jù)有關(guān)或研究數(shù)據(jù)的學科。,統(tǒng)計學是一門收集、分析、解釋與呈現(xiàn)數(shù)據(jù)資料的科學。,STATISTICS“ASCIENCEDEALINGWITHTHECOLLECTION,ANALYSIS,INTERPRETATIONANDPRESENTATIONOFMASSESOFNUMERICALDATA”WEBSTER國際大辭典,一、統(tǒng)計學與醫(yī)學統(tǒng)計學方法,統(tǒng)計學(STATISTICS),運用概率論、數(shù)理統(tǒng)計的原理和方法,研究數(shù)據(jù)的收集、整理、分析和推斷的科學。,醫(yī)學統(tǒng)計學(MEDICALSTATISTICS),用統(tǒng)計學原理和方法研究生物醫(yī)學問題的一門學科。,生物統(tǒng)計學(BIOSTATISTICS),應用于整個生物學范疇,側(cè)重于人的生物方面。,衛(wèi)生統(tǒng)計學(HEALTHSTATISTICS),用于醫(yī)學和衛(wèi)生學領(lǐng)域,側(cè)重于人的社會方面,如健康狀況統(tǒng)計和衛(wèi)生服務(wù)統(tǒng)計。,,1計數(shù)資料2計量資料3等級資料,二、醫(yī)學統(tǒng)計學中常用的數(shù)據(jù)類型,計數(shù)資料COUNTDATA,變量值表現(xiàn)為按某屬性劃分的定性類別,清點各類別個數(shù)后得到的資料。,數(shù)據(jù)表現(xiàn)兩分類陽性或陰性;存活或死亡;有效或無效;男性或女性多分類如血型O,A,B,AB計數(shù)資料(血型)100527832,計量資料MEASUREMENTDATA,1連續(xù)變量身高值CM165,170158,體重值KG52,55,61,2比率變量腦電圖波形變化率29,37,,用儀器、工具或其他定量方法準確獲得的定量結(jié)果,一般帶有計量單位。,等級資料ORDINALDATA,例病情分級X1Ⅰ,Ⅱ,Ⅲ療效X2痊愈、顯效、有效、無效病人滿意度X3好、中、差人數(shù)50255,變量值按變化程度大小劃分分類,清點各分類的個數(shù)后得到的資料。,,MEASUREMENTDATA計量資料,,COUNTDATA計數(shù)資料,,ORDINALDATA等級資料,,實例數(shù)據(jù)1,實例數(shù)據(jù)2,100例高血壓患者治療后臨床記錄,患者年齡性別治療組舒張壓體溫療效編號X1X2X3X4X5X6137男A1127375顯效245女B1253370有效343男A1093365有效459女B1467378無效10054男B1680376無效,,,,實例數(shù)據(jù)3,三類數(shù)據(jù)類型間的轉(zhuǎn)換,例一組20?40歲成年人的血壓,以12KPA為界分為正常與異常兩組,統(tǒng)計每組例數(shù),8低血壓8?正常血壓12?輕度高血壓15?中度高血壓17?重度高血壓,簡稱變量VARIABLE,統(tǒng)計上習慣用大寫拉丁字母表示,如X、Y、Z、。變量值習慣用小寫拉丁字母表示,如性別X1=1男、X2=1男、X3=0女、。,三、統(tǒng)計學基本概念,(一)隨機變量RANDOMVARIABLE,隨機變量的分類,離散型變量DISCRETEVARIABLE,在一定區(qū)間變量取值為有限個,相當于計數(shù)資料連續(xù)性變量CONTINUOUSVARIABLE,在一定區(qū)間變量取值為無限個,相當于計量資料有序變量ORDINALVARIABLE,相當于等級資料,(二)同質(zhì)與變異HOMOGENEITYANDVARIATION,同質(zhì)指事物的性質(zhì)、影響條件或背景相同或非常相近。變異指同質(zhì)的個體之間的差異。,同質(zhì)與變異的例子,例1調(diào)查2004年上海市7歲男童的身高和體重同質(zhì)2004年、上海市、7歲男童變異身高和體重各不相同例2研究某降壓藥的療效同質(zhì)高血壓患者、用某藥治療變異療效各不相同,120名正常成年男子紅細胞計數(shù)值1012/L,(三)總體與樣本POPULATIONANDSAMPLE,總體根據(jù)研究目的確定的同質(zhì)研究對象的全體集合。分有限總體與無限總體。,有限總體總體中的所有研究對象事先可確定而且有限時,為一個確定的總體。,無限總體總體中的所有研究對象事先無法全部獲得而且無限時,為一個假設(shè)的總體。,樣本從總體中隨機抽取有代表性的部分觀察單位,(三)總體與樣本POPULATIONANDSAMPLE,隨機抽樣RANDOMSAMPLING為了保證樣本的可靠性和代表性,需要采用隨機的抽樣方法(在總體中每個個體具有相同的機會被抽到)。,抽樣研究目的樣本觀察值結(jié)論推論總體的情況,,從總體中隨機抽取樣本,根據(jù)樣本信息來推斷總體特征的方法,即抽樣研究。,抽樣研究SAMPLINGRESEARCH,參數(shù)總體的統(tǒng)計指標,如總體均數(shù)、標準差,采用希臘字母分別記為Μ、Σ。固定的常數(shù)。,推斷,統(tǒng)計量樣本的統(tǒng)計指標,如樣本均數(shù)、標準差,采用拉丁字母分別記為。參數(shù)附近波動的隨機變量。,(四)參數(shù)與統(tǒng)計量PARAMETERANDSTATISTIC,(五)誤差,,誤差ERROR指實測值與真值之差、樣本指標與總體指標之差。,誤差的類型,1隨機誤差2非隨機誤差,,反映數(shù)據(jù)的質(zhì)量,隨機誤差,非隨機誤差,,,過失誤差如記錄、操作等人為因素。,系統(tǒng)誤差病例選擇、儀器、方法的不一致,原因,誤差(ERROR),多種尚無法控制的因素所引起的數(shù)據(jù)變異,醫(yī)學中主要是個體差異和測量誤差,,可避免否,不能,可控制而縮小或消除,由于樣本的隨機性引起的統(tǒng)計量與參數(shù)的差別,或同一總體的相同統(tǒng)計量之間的差別。,抽樣誤差SAMPLINGERROR,確定性現(xiàn)象在一定條件下,一定會發(fā)生或一定不會發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。,隨機現(xiàn)象在同樣條件下可能會出現(xiàn)兩種或多種結(jié)果,究竟會發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨機事件。隨機事件的特征①隨機性;②規(guī)律性每次發(fā)生的可能性的大小是確定的。,概率隨機事件發(fā)生的可能性大小,用大寫的P表示;取值0,1。,(六)頻率與概率FREQUENCYANDPROBABILITY,必然事件P1不可能事件P0隨機事件0P1P≤005(5%)稱為小概率事件習慣,統(tǒng)計學上認為不大可能發(fā)生。,,小概率事件,頻率FREQUENCY樣本的實際發(fā)生率稱為頻率。設(shè)在相同條件下,獨立重復進行N次試驗,事件A出現(xiàn)F次,則事件A出現(xiàn)的頻率為F/N。,用途醫(yī)學中常用頻率作為某事件概率的估計值。統(tǒng)計推斷結(jié)論是基于一定可信程度下的概率推斷。,頻率與概率間的關(guān)系樣本頻率總是圍繞概率上下波動樣本含量N越大,波動幅度越小,頻率越接近概率。,根據(jù)研究目的,1研究設(shè)計,2收集資料,3整理資料,4分析資料,研究對象、指標、例數(shù)、如何準確得到數(shù)據(jù)。,日常工作記錄、病歷。專門的調(diào)查和實驗。,使資料系統(tǒng)化,便于進一步統(tǒng)計分析,用統(tǒng)計方法分析資料,闡述規(guī)律性,得出結(jié)論。,,,,,四、統(tǒng)計工作的基本步驟,五、統(tǒng)計在醫(yī)學中的應用,(一)變異的描述,數(shù)據(jù)的變異特征1數(shù)據(jù)的分布范圍2數(shù)據(jù)的分布規(guī)律,102名7歲男童坐高分布,(二)觀察對比,FARR發(fā)現(xiàn)地勢與霍亂的關(guān)系,當18481849年倫敦地區(qū)霍亂流行時,統(tǒng)計學家FARR對觀察結(jié)果進行數(shù)據(jù)分析,發(fā)現(xiàn)居民居住的地勢越高,霍亂的死亡率越低“瘴氣”學說混濁空氣致病。,(二)觀察對比,SNOW發(fā)現(xiàn)自來水污染與霍亂死亡人數(shù)的關(guān)系,,(二)觀察對比,DOLL與HILL發(fā)現(xiàn)的吸煙與肺癌的關(guān)系,1964年DOLL和HILL將接受調(diào)查的4萬名英國注冊醫(yī)生分為吸煙和不吸煙兩組,通過以后的腫瘤統(tǒng)計發(fā)現(xiàn),吸煙組和不吸煙組肺癌的年平均發(fā)病率分別為166和007,相對危險度RR166/007237,強烈提示吸煙的致癌作用,為吸煙致癌更深入的研究提供了形成研究假說的基礎(chǔ)。,兩組人群發(fā)病率比較,(三)實驗性研究,英國海軍軍醫(yī)LIND治療牙齦潰爛的研究,1747年5月20日,LIND醫(yī)生將12名病情相似的患者帶到一艘船上?;颊叩闹饕Y狀是牙齦潰爛,皮膚有出血點,雙膝無力。LIND將12名患者分為6組,分別給予A、B、C、D、E、F組干預。6月16日船返回英國時,所有患者的病情都有好轉(zhuǎn),其中E組恢復的最快、最好,其中一人到第6天就可以工作了。B組也有一人比登船時健康。,(三)實驗性研究,法國醫(yī)生LOUIS對放血療法治療肺炎的研究,1835年,LOUIS對當時流行的“放血”療法治療肺炎的效果進行了比較,發(fā)現(xiàn)“放血”的療效不如預期的那么好,而且早期“放血”和晚期“放血”組比較,患者的診斷、病情、病程、年齡等方面的差異很大,比較平均治愈時間意義不大。因為晚期“放血”組的平均治愈時間長,但該組患者病情重、病程長、年齡大。,(三)實驗性研究,英國評價鏈霉素治療肺結(jié)核療效的隨機對照試驗,1948年,英國首次采用隨機對照試驗評價鏈霉素治療肺結(jié)核療效。研究對象是1530歲肺雙側(cè)進行性肺結(jié)核患者,共抽取了107例患者。試驗時將患者隨機分為兩組,分到試驗組的55例患者用鏈霉素治療,分到對照組的52例患者用常規(guī)方法。治療6個月后,試驗組、對照組的生存率分別為93、73。,六、醫(yī)學論文中的統(tǒng)計,錯誤統(tǒng)計方法產(chǎn)生的嚴重后果,胃冰凍療法治療胃潰瘍,“非常痛心地看到,因為數(shù)據(jù)分析的缺陷和錯誤,那么多好的生物研究工作面臨著被葬送的危險”。,--YATES和HEALY,統(tǒng)計方法的應用情況,國外6080年代調(diào)查顯示,不同醫(yī)學雜志發(fā)表論文有統(tǒng)計錯誤的最高達72,最低也有20。,1966年,據(jù)對美國醫(yī)師協(xié)會雜志(JAMA)等醫(yī)學雜志的來稿的統(tǒng)計顯示,149篇投稿論文中,僅有28可以接受,67有統(tǒng)計缺陷但尚可以糾正,5不可救藥。,“調(diào)查結(jié)果反映了醫(yī)學論文作者統(tǒng)計知識和統(tǒng)計水平的低下,也再次強調(diào)了生物統(tǒng)計學者不是令人生畏的檢查官。恰恰相反,生物統(tǒng)計學者是我們的可貴盟友。生物統(tǒng)計學不是遠離我們的數(shù)學,而是現(xiàn)代醫(yī)學的一門基本學科,就像大廈中的一個支柱”。,--美國醫(yī)師協(xié)會雜志編輯,統(tǒng)計數(shù)據(jù)造假問題,1976年NEWSCIENCE雜志關(guān)于科研舞弊行為的調(diào)查,74的調(diào)查表反映有不正當修改數(shù)據(jù)的情況。其中,17拼湊實驗結(jié)果,7憑空捏造數(shù)據(jù),2故意曲解結(jié)果。,舍恩SCHON事件貝爾實驗室兩種超重元素發(fā)現(xiàn)造假事件勞倫斯伯克利實驗室,統(tǒng)計學的未來,社會需要生物統(tǒng)計學“統(tǒng)計學的年輕人有足夠的就業(yè)機會,學術(shù)界、工業(yè)部門、政府機構(gòu)”?!霸诿绹?,很高比例的統(tǒng)計研究生出生于外國,畢業(yè)后留在美國”。NATIONALSCIENCEFOUNDATION1998REPORT9895,統(tǒng)計學的未來,“對生物統(tǒng)計學的需求從來沒有象今天這樣大,特別是美國。美國NATIONALRESEARCHCOUNCIL研究結(jié)論在所有的衛(wèi)生科研行業(yè),最最缺乏生物統(tǒng)計學和流行病學人才”。(ZELEN,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 48
      24人已閱讀
      ( 4 星級)
    • 簡介:單因素方差分析的SPSS操作,2,,SPSS單因素方差分析過程,3,,1完全隨機設(shè)計資料的方差分析ONEWAYANOVA,,例某高原研究組將籍貫相同、年齡相同、身高體重接近的30名新戰(zhàn)士隨機分為三組,甲組為對照組,按常規(guī)訓練,乙組為鍛煉組,每天除常規(guī)訓練外,接受中速長跑與健身操鍛煉,丙組為藥物組,除常規(guī)訓練外,服用抗疲勞藥物,一月后測定第一秒用力肺活量L,結(jié)果見表。試比較三組第一秒用力肺活量有無差別。,4,5,N行2列(指標變量、分組變量),數(shù)據(jù)格式,6,ANALYZE→COMPAREMEANS→ONEWAYANOVA,檢驗步驟,,7,ONEWAYANOVA對話框,200701,8,,POSTHOCMULTIPLECOMPARISONS對話框,,9,OPTION對話框,,10,點擊“OK”,運行結(jié)果,,200701,11,,結(jié)果輸出,,12,基本統(tǒng)計描述,,13,方差齊性檢驗,,14,方差分析表,,15,多重比較(LSD法),,16,多重比較(SNK法),,,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 16
      20人已閱讀
      ( 4 星級)
    • 簡介:第十章統(tǒng)計表與統(tǒng)計圖STATISTICALTABLEB縱軸為對數(shù)尺度。,4.直方圖HISTOGRAM,以直方面積描述各組頻數(shù)的多少,面積的總和相當于各組頻數(shù)之和,適合表示數(shù)值變量的頻數(shù)分布。直方圖的橫軸尺度是數(shù)值變量值,縱軸是頻數(shù)。注意如各組的組距不等時,要折合成等距后再繪圖,即將頻數(shù)除以組距得到單位組距的頻數(shù)作為直方的高度,組距為直方的寬度。另一種表示數(shù)值變量資料頻數(shù)分布的方式是將各組段觀察頻數(shù)除以總觀察頻數(shù)得到各組段的頻率,以各組段頻率除以組距得到的頻率密度作為直方圖高度,繪制的直方圖稱為頻率直方圖,它以各直方面積表示各組頻率,其面積的總和為1。,例1091997年某地共報告乙型病毒性腦炎104例,其年齡分布如表106。,,圖1061997年某地乙型病毒性腦膜炎病例的年齡分布,箱式圖BOXPLOT,使用5個統(tǒng)計量反映原始數(shù)據(jù)的分布特征,即數(shù)據(jù)分布中心位置、分布、偏度、變異范圍和異常值。箱式圖的箱子兩端分別是上四分位數(shù)和下四分位數(shù),中間橫線是中位數(shù),兩端連線分別是除異常值外的最小值和最大值。另外標記可能的異常值。,顯然箱子越長,數(shù)據(jù)變異程度越大。中間橫線在箱子中點表明分布對稱,否則不對稱。,例1011某地調(diào)查不同類型化妝品廠車間內(nèi)粉塵數(shù),結(jié)果繪制成圖108。圖中顯示粉塵數(shù)的分布呈偏態(tài)分布,凈化廠粉塵數(shù)較少,非凈化廠粉塵數(shù)較多。,,圖108某地不同類型化妝品廠車間粉塵數(shù)分布箱式圖,謝謝大家,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 61
      15人已閱讀
      ( 4 星級)
    • 簡介:1,【例71】某研究人員為研究不同地區(qū)的人群血型分類構(gòu)成是否一樣,收集了亞洲,歐洲和北美洲人的A,B,O,AB的血型資料。,2,第七章列聯(lián)表資料分析,,列聯(lián)表由兩個或兩個以上的變量進行交叉分類的頻數(shù)分布表。,3,列聯(lián)表(行列表)資料模式,橫向變量R類,縱向變量C類,簡稱R?C表,4,教學目的與要求,掌握Χ2檢驗的基本思想和用途四格表獨立性檢驗配對四格表獨立性檢驗了解FISHER精確概率法的計算單變量擬合度檢驗頻數(shù)分布的擬合度檢驗,5,教學內(nèi)容提要,重點講解Χ2檢驗的基本思想四格表獨立性檢驗配對四格表獨立性檢驗介紹FISHER精確概率法的計算擬合度檢驗,6,第一節(jié)列聯(lián)表?2檢驗,?2檢驗及原理四格表資料的?2檢驗雙向無序行?列表的?2檢驗配對計數(shù)資料的?2檢驗四格表確切概率法,7,雙向無序列聯(lián)表資料單向有序列聯(lián)表資料雙向有序且屬性相同列聯(lián)表資料雙向有序且屬性不同列聯(lián)表資料,一、列聯(lián)表(行列表)資料類型,8,三組消化性潰瘍住院病人四種證型的構(gòu)成,,1雙向無序列聯(lián)表資料,9,2單向有序列聯(lián)表資料,10,,3雙向有序且屬性不同列聯(lián)表資料,11,4雙向有序且屬性相同列聯(lián)表資料,12,四格表資料,13,二、四格表資料的?2檢驗,?2檢驗是一種檢驗實際頻數(shù)(ACTUALFREQUECY)與理論頻數(shù)(THEORETICALFREQUECY)之間偏離度的方法。偏離度用?2值(統(tǒng)計量)表示。,?2?(AT)2/T,1?2檢驗的基本思想,14,2四格表資料的?2檢驗,比較兩個樣本率、兩種治療方法之間的差異有無顯著性。這類資料由4個基本數(shù)據(jù)構(gòu)成兩種治療方法的有效例數(shù)和無效例數(shù),統(tǒng)計學稱這類資料為四格表資料。,15,2四格表資料的?2檢驗,四格表資料的模式,16,【例72】為了解鉛中毒病人是否有尿棕色素增加現(xiàn)象,分別對病人組和對照組的尿液作尿棕色素定性檢查,結(jié)果如下,問鉛中毒病人和對照人群的尿棕色素陽性率有無差別兩組人群尿棕色素陽性率比較,①建立檢驗假設(shè)和確定檢驗水準H0總體陽性率Π1Π2H1Π1≠Π2Α005②計算檢驗統(tǒng)計量,其中為AI實際頻數(shù),TI為理論頻數(shù),NR是行合計,NC是列合計,N是四格之和。,【例72】假設(shè)檢驗步驟,理論頻數(shù)是在H0成立的條件下每個格子理論上的數(shù)據(jù)。(Π1Π2兩樣本合計率)若H0成立,則合計的陽性率為38/735205則鉛中毒病人呈陽性的理論上應有T113638/731874人,?2值的大小決定于(1)AT的差值;(2)格子數(shù)(嚴格地說是DF)的多少。,T121726T211926T2217742312③確定P值ΝR1C11,查?2界值表(附表6)得P40,T值?24125?確定P值?作推論,【例74】某礦石粉廠當生產(chǎn)一種礦石粉石時,在數(shù)天內(nèi)即有部分工人患職業(yè)性皮膚炎,在生產(chǎn)季節(jié)開始,隨機抽取15名車間工人穿上新防護服,其余仍穿原用的防護服,生產(chǎn)進行一個月后,檢查兩組工人的皮膚炎患病率,結(jié)果如下,穿新舊兩種防護服工人的皮膚炎患病率比較,,問兩組工人的皮膚炎患病率有無差別,①H0Π1Π2;H1Π1≠Π2。Α005②計算最小的理論頻數(shù)T111511/43384,140,所以宜用?2值的校正公式294③查?2界值表,得005<P<010④按Α005水平不拒絕H0,尚不能認為穿不同防護服的皮膚炎患病率有差別。若不校正,?2433P005,【例75】研究復方哌唑嗪對高血壓病治療效果的臨床試驗并與復方降壓片和安慰劑作對照,結(jié)果如下表,問三種藥物效果有無差別,,三種藥物治療高血壓病的有效率比較,27,【例76】某省為了解花生黃曲霉素污染,隨機觀察了三個地區(qū)的花生受黃曲霉素B1污染的情況,結(jié)果見下表。請問這三個地區(qū)花生的黃曲霉素B1污染率是否不同某省三個地區(qū)花生的黃曲霉素B1污染率,28,三、雙向無序列聯(lián)表的?2檢驗,1列聯(lián)表的?2值計算?2ΝR1C1,29,【例75】三種藥物治療高血壓病有效率比較,2多個率的比較,,H0三種藥物的總體有效率相等,即Π1Π2Π3H1Π1、Π2、Π3不相等或不全相等Α005,?2Ν21312查?2界值表得P0005,按Α005水平拒絕H0,認為三種藥物的治療效果不相同或不全相同。,31,【例77】1979年某地爆發(fā)松毛蟲病,333例患者按年齡以14歲為界分成2組,資料如表,試考察兩組病人病變類型的構(gòu)成比有無差別,某地兩組松毛蟲病患者型別構(gòu)成比較,3構(gòu)成比的比較,32,AH0兩組患者中患各型松毛蟲病的構(gòu)成比相同H1兩組患者中患各型松毛蟲病的構(gòu)成比不同Α005B?27014C查表得P0005D按Α005水平拒絕H0,認為兩組患者中患各型松毛蟲病的構(gòu)成比不同。,3構(gòu)成比的比較,△行列表的?2檢驗要求理論頻數(shù)T不宜太小,要求不宜有1/5以上的格子的T<5,或有一個T<1?!魅绻陨蠗l件不能滿足,可采用◇增加樣本含量◇刪去某行或某列◇合理地合并部分行或列◇用精確概率法△多個率或構(gòu)成比比較的?2檢驗,結(jié)論為拒絕H0時,僅表示幾組有差別,并非任2組之間都有差別。若要了解之,可進行多個率之間的兩兩比較如?2表的分割法。,4行列表的?2檢驗注意事項*,34,5多個率構(gòu)成比兩兩比較行列表的分割(略),【例75】三種藥物治療高血壓病的有效率比較,?2,35,分割表1分割表2,210583?2221873,【例78】(續(xù))哌唑嗪組與降壓片組的有效率接近,將此2組合并,再與另一個樣本比較,得到2個分割表,?2005,1384,36,可以得出?21?2222456約等于原來的?22236,兩者不相等是由于分割表中理論頻數(shù)的數(shù)值與總表中理論頻數(shù)不同所致。結(jié)論哌唑嗪與降壓片總體有效率相同,但與安慰劑的有效率不相同。,37,例題考察一種新型透析療法的效果,,四、22列聯(lián)表資料的?2檢驗,,,,38,【例78】用兩種檢驗方法對某食品作沙門氏菌檢驗,結(jié)果如下,試比較兩種方法的陽性結(jié)果是否有差別配對設(shè)計兩種方法結(jié)果比較,,39,配對設(shè)計的計量資料(觀察值)比較,比較兩總體均數(shù)的差異,用配對T檢驗配對設(shè)計的計數(shù)資料,我們用22列聯(lián)表資料的?2檢驗,40,122列聯(lián)表資料的?2檢驗,配對四格表資料分析略(1)獨立性檢驗(是否有關(guān)聯(lián))用四格表?2檢驗法(2)優(yōu)勢性檢驗(是否相同)用MCNEMAR檢驗法(3)一致性檢驗用KAPPA檢驗法,41,【例78】用兩種檢驗方法對某食品作沙門氏菌檢驗,結(jié)果如下,試比較兩種方法的陽性結(jié)果是否有差別配對設(shè)計兩種方法結(jié)果比較,,著眼于兩法結(jié)果不一致的部分。,42,兩法結(jié)果不一致的部分H0總體BC;H1總體B≠C檢驗統(tǒng)計量,當BC≥40時?2當BC40時?2Ν1樣本例數(shù)較少時還可以用精確概率法,原理同配對設(shè)計的符號檢驗。,43,H0甲法陽性乙法陰性例數(shù)與甲法陰性乙法陽性例數(shù)相同,即總體BC;H1總體B≠CΑ005?21290查?2界值表P0005,拒絕H0,認為兩法檢驗結(jié)果不一樣,熒光抗體法陽性結(jié)果高于常規(guī)培養(yǎng)法。,,44,配對(列聯(lián)表)資料的?2檢驗,【例79】有93份咽喉涂抹標本,每份標本分別接種在甲乙兩種白喉桿菌培養(yǎng)基上,觀察其生長情況,結(jié)果如下表,試分析兩種培養(yǎng)基的效果是否不同表5甲乙兩種培養(yǎng)基的生長情況,45,1建立假設(shè)H0BC;H1B≠C確定顯著性水平?0052計算統(tǒng)計量BC101929?40,校正公式?2(|BC|1)2/(BC)2207?(21)(21)13確定P值4作推斷,46,五、四格表的確切概率法,【例710】在某牧區(qū)觀察慢性布魯氏病患者植物血凝素皮膚試驗反應,資料如下,問活動型與穩(wěn)定型布氏患者反應陽性率有無差別,47,五、四格表的確切概率法,★適用條件四格表資料N<40時;四格表中有A0時;四格表中有T<1時;用其它檢驗方法所得概率接近檢驗水準時。,48,五、四格表的確切概率法,【例710】在某牧區(qū)觀察慢性布魯氏病患者植物血凝素皮膚試驗反應,資料如下,問活動型與穩(wěn)定型布氏患者反應陽性率有無差別,49,五、四格表的確切概率法,基本思想,,,,,,,50,H0兩型陽性率相等,即Π1Π2H1Π1≠Π2在將原四格表周邊數(shù)字(行和與列和)不變的情況下,變動A值,以得到不同情況,51,P為|AT|大于等于原來表中的|AT|值(014)的情況下的PI的和,即PP0P1P402668按Α005水準接受H0,認為兩型陽性率相等。,計算每種情況下的|AT|和|AT|大于等于原來表中的|AT|值(014)的PI值,PI值按下列公式來計算,52,【例711】某醫(yī)師為研究乙肝免疫球蛋白預防胎兒宮內(nèi)感染HBV的效果,將33例HBSAG陽性孕婦隨機分為預防注射組和非預防組,結(jié)果見下表。問兩組新生兒的HBV總體感染率有無差別,53,,2211,T116AT20,54,第二節(jié)分類資料的擬合優(yōu)度檢驗,此例只有兩種分類。因此應有理論次數(shù)總數(shù)/分類項數(shù),即700535(人),,,,【例712】隨機抽取70名學生,調(diào)查他們對高中分文理科的意見,回答贊成的有42人,反對的有28人。問對分科的意見有無差異,一、單變量擬合優(yōu)度檢驗,55,二、頻數(shù)分布的擬合優(yōu)度檢驗,1建立假設(shè),確定檢驗水準H0評定結(jié)果服從正態(tài)分布,H1評定結(jié)果不服從正態(tài)分布?005,,【例713】今對某校100名學生進行操行評定,分優(yōu)、良、中、差四等,評定結(jié)果為優(yōu)19人、良39人、中35人、差7人。試檢驗其分布的形式是否屬于正態(tài)分布,2計算值,第一等分(優(yōu))15Σ~3Σ之間的面積比率為04987-0433200655,即7。第二等分(良)0~15Σ之間面積比率為04332,即43。第三等分(中)0~-15Σ之間面積比率為04332。第四等分(差)位于-3Σ~-15Σ之間的面積比率為04987-0433200655,即7。,1首先需求出理論次數(shù)??蓪⒄龖B(tài)分布底線長度從-3Σ至+3Σ分為四個等分,每等分為15Σ,其面積比率為,57,3統(tǒng)計推斷DF413。781,>以?=005水準拒絕,認為此評定結(jié)果不服從正態(tài)分布。,,,2根據(jù)各等分的面積比率,乘以總?cè)藬?shù),即可得出理論次數(shù)。如優(yōu)的人數(shù)為71007。3計算,58,完,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 58
      13人已閱讀
      ( 4 星級)
    • 簡介:基本內(nèi)容,,相關(guān)與回歸,第九章,用于研究和解釋變量之間相互關(guān)系的,掌握積差相關(guān)等級相關(guān)線性回歸的概念線性回歸方程的計算回歸系數(shù)的假設(shè)檢驗相關(guān)與回歸的區(qū)別與聯(lián)系了解曲線擬合,教學目的和要求,重點講解積差相關(guān)等級相關(guān)線性回歸的概念回歸系數(shù)的假設(shè)檢驗相關(guān)與回歸的區(qū)別與聯(lián)系介紹曲線擬合,教學內(nèi)容提要,第一節(jié)兩變量相關(guān),,相關(guān)分析是研究客觀事物或現(xiàn)象之間關(guān)系的密切程度(不存在函數(shù)關(guān)系)。,線性相關(guān)是研究兩變量之間是否存在線性關(guān)系。,為研究父親與成年兒子身高之間的關(guān)系,皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標上。X上的數(shù)代表父親身高,Y上的數(shù)代表兒子的身高。1078個點形成圖形是一個散點圖。,一、積差相關(guān),1、散點圖,一、積差相關(guān)1、散點圖,2、積差相關(guān)系數(shù),定量描述X與Y兩變量間直線相關(guān)方向和相關(guān)密切程度的統(tǒng)計指標。,PEARSON相關(guān)系數(shù),簡稱相關(guān)系數(shù),適用于X、Y都服從正態(tài)分布(稱為雙變量正態(tài)分布)的資料。,積差相關(guān)系數(shù)的計算,,R沒有單位取值范圍1≤R≤1,LXY∑XY∑X∑Y/NLXX∑X2∑X2/NLYY∑Y2∑Y2/N,R的特點沒有單位1≤R≤1R1完全負相關(guān),1≤R<0負相關(guān)R1完全正相關(guān),0<R≤1正相關(guān)R0零相關(guān),散點圖,【例91】一個產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān)。于是設(shè)想,通過測量待產(chǎn)婦尿中雌三醇含量,可以預測產(chǎn)兒體重,以便對低出生體重進行預防。因此收集了31例待產(chǎn)婦24小時的尿,測量其中的雌三醇含量,同時記錄產(chǎn)兒的體重。問尿中雌三醇含量與產(chǎn)兒體重之間是否存在相關(guān)關(guān)系是正相關(guān)還是負相關(guān),,3、積差相關(guān)分析,13,待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系,,,,1繪制散點圖,2積差相關(guān)系數(shù)的計算,∑X534;∑Y992;∑X29876∑Y23248;∑XY1750;,3相關(guān)系數(shù)的假設(shè)檢驗,上例中R061,說明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個樣本,由此得到的相關(guān)系數(shù)會存在抽樣誤差。?0時,由于抽樣誤差,可能導致R≠0。對R進行假設(shè)檢驗,判斷R≠0是由于抽樣誤差所致,還是兩個變量之間確實存在相關(guān)關(guān)系。,3相關(guān)系數(shù)的假設(shè)檢驗,,總體相關(guān)系數(shù)Ρ0表示總體中兩變量X和Y無直線相關(guān)關(guān)系,,R的標準誤為SR=,,,用R和自由度V=N2,查附表18,相關(guān)系數(shù)界值表,H0Ρ0H1Ρ≠0ΝN231229查附表7,T00005/2,2839351,T00002/2,2842754,00002<P<00005,拒絕H0,接受H1,認為待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間有正相關(guān)關(guān)系。,第二節(jié)直線回歸,一、回歸方程二、回歸系數(shù)三、回歸系數(shù)的假設(shè)檢驗四、直線回歸的應用,一個人的快樂,不是因為他擁有的多,而是因為他計較的少,休息,二、等級相關(guān)(秩相關(guān)),①不服從正態(tài)分布的資料;②總體分布類型不知的資料;③用等級或相對數(shù)表示的資料;④數(shù)據(jù)一端或兩端有不確定值的資料用等級相關(guān)(或稱秩相關(guān))分析(屬非參數(shù)統(tǒng)計法)。,秩相關(guān)系數(shù),SPEARMAN相關(guān)系數(shù)(RS)KENDALL相關(guān)系數(shù)(RK),,用等級相關(guān)系數(shù)表示兩個變量間直線關(guān)系密切程度和方向。,先分別將兩個變量按原始數(shù)值由小到大編秩(遇相同觀察值時取平均秩),計算每對觀察值的秩之差D。,N為對子數(shù);D為配對秩次之差;TX(或TY)=ΣTJ3-TJ/12;TJ為X(或Y)中第J個相同秩次的個數(shù)。查附表19確定P的大小。,1)SPEARMAN相關(guān)系數(shù)(RS),【例92】12名27歲急性白血病患兒的血小板數(shù)與出血癥狀資料見下表,分析兩者之間有無直線關(guān)系,H0Ρ=0,H1Ρ≠0,查統(tǒng)計用附表19,R005/212=0587,P>005不能以?=005水準拒絕H0,不能認為2~7歲急性白血病患兒的血小板數(shù)與出血癥狀之間有直線相關(guān)關(guān)系。,2)KENDALL相關(guān)系數(shù),在X的秩從小到大排列后,計算配對的Y每個秩下面更大者的個數(shù),合計值記為S,計算RK并在相同秩次較多時校正,,其中,N為對子數(shù),UX或UY=∑TJ2-TJ/2,TJ為第J個相同秩次的個數(shù)。查附表20確定P的大小。,三、相關(guān)系數(shù)應用注意事項有實際意義在兩個變量的變化范圍內(nèi)進行相關(guān)不是因果關(guān)系,但可做為進一步考證有無因果關(guān)系的基礎(chǔ),四、直線相關(guān)的應用,一般說來,當N100,并對R進行假設(shè)檢驗,有統(tǒng)計學意義時∣R∣>07,則表示兩個變量高度相關(guān);04<∣R∣≤07時,則表示兩個變量之間中度相關(guān);02<∣R∣≤04時,則兩個變量低度相關(guān)。,,待產(chǎn)婦尿中雌三醇含量和產(chǎn)兒體重之間成正相關(guān)。那么,如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能推斷出產(chǎn)兒的體重嗎或產(chǎn)兒的體重可能在什么范圍內(nèi)呢身高與體重之間也成正相關(guān)關(guān)系。那么,身高每增加1厘米,體重增加多少克呢上面的相關(guān)關(guān)系分析不能提供給我們需要的答案。這些要用直線回歸的方法來解決。,某保險公司承保汽車5萬量,平均每量保費收入為1000元,則該保險公司汽車承??偸杖霝?000萬元。承??偸杖隮承保汽車量數(shù)XY1000XX與Y兩個變量間完全表現(xiàn)為一種確定性關(guān)系,即函數(shù)關(guān)系。,第二節(jié)一元回歸,銀行的1年期存款利息年息為225,存入的本金用X表示,到期的本息用Y表示,則YX225X這里Y與X仍表現(xiàn)為一種線性函數(shù)關(guān)系。,另外一種情況兩事物之間有著密切的聯(lián)系,但密切的程度并沒有達到由一個可以完全確定另一個的程度。例如生長發(fā)育階段動物體重增量與食量廣告費支出與商品銷售額,由于其它因素的干擾,許多雙變量之間的關(guān)系并不是嚴格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱這種關(guān)系式為一元回歸方程,這種關(guān)系為一元回歸。,第二節(jié)一元回歸,一、直線回歸分析,繪制散點圖求直線回歸方程繪制回歸直線回歸系數(shù)的假設(shè)檢驗,用直線方程描述兩個變量間的數(shù)量依存關(guān)系。,①一般形式A截距B回歸系數(shù)(回歸直線斜率),1直線回歸方程的求法,B0X↑Y↑;B0X↑Y↓B意義為X每變化一個單位,Y變化的平均值X自變量,要求容易測定、容易控制Y的估計值,Y稱因變量,要求在不同的X的時候其分布為正態(tài)分布,②A、B的計算(用最小二乘法原理估計BN對子數(shù)(數(shù)據(jù)對),剩余誤差,殘差各實測值Y至回歸直線縱向距離。剩余平方和或殘差平方和最小。,SSE=ΣY2,SS總SSRSSE,決定系數(shù)(DETERMININGCOEFFICIENT,R2)回歸平方和在總平方和中所占的比例。,R2SS回/SS總,R2是評價回歸強度的一個重要指標。0≤R2≤1,→1,回歸效果越好,強度↑。臨床研究中,R2≥07認為回歸效果不錯。,2回歸方程擬合效果評價(決定系數(shù)),,,1繪制散點圖2求直線回歸方程,3繪制回歸直線,在自變量的變化范圍內(nèi)選兩點做直線(0,A)(X,Y)這兩點可以用來核對圖線繪制是否正確。,,,例題中得到的直線回歸方程一定經(jīng)過(0,215)(1723,32)兩點。,直線回歸方程從樣本資料計算而得,有抽樣誤差。需要對樣本的回歸系數(shù)B進行假設(shè)檢驗,以判斷B是否從回歸系數(shù)為零的總體中抽得??傮w的回歸系數(shù)一般用Β表示。,是否能說明雌三醇與產(chǎn)兒體重之間一定存在回歸關(guān)系,T檢驗H0Β0(直線回歸方程不成立)H1Β≠0(直線回歸方程成立),進行Β0的假設(shè)檢驗(即X與Y間無直線回歸關(guān)系)T檢驗或F檢驗相關(guān)系數(shù)的檢驗代替,4回歸系數(shù)的假設(shè)檢驗,ΥN2,H0Β0H1Β≠0Α005,,Υ31229,查表T00005/2,2839351,P<00005拒絕H0,接受H1,認為待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間存在直線回歸關(guān)系。,二、直線回歸方程的應用,估計描述兩變量間的依存關(guān)系通過回歸系數(shù)的假設(shè)檢驗,若認為兩變量之間存在直線回歸關(guān)系,則可用直線回歸來描述。利用回歸方程進行預測把自變量代入回歸方程,對應變量進行估計。例如,已知某待產(chǎn)婦的尿雌三醇濃度,估計產(chǎn)兒的體重范圍。利用回歸方程進行統(tǒng)計控制胰島素與血糖制定正常值范圍血細胞,血紅蛋白等,三、曲線擬合,對呈曲線關(guān)系的資料,可用散點圖分析曲線的類型,建立曲線回歸方程。常用曲線的類型對數(shù)=A+BLNX指數(shù)LN=A+BX冪函數(shù)LN=A+BLNXLOGISTIC,,四、相關(guān)與回歸分析注意事項,1實際意義進行相關(guān)回歸分析要有實際意義,不可把毫無關(guān)系的兩個事物或現(xiàn)象用來作相關(guān)回歸分析。2相關(guān)關(guān)系相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系。例如,同一父母生的兄弟,往往哥高弟也高,這主要與遺傳因素及生活條件相關(guān),而不能說哥高是弟高的原因。但如果事物之間存在因果關(guān)系,則兩者必然是相關(guān)的。,3利用散點圖對于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點圖,在圖上看它們有無關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負相關(guān),然后再進行相關(guān)回歸分析。4變量范圍相關(guān)分析和回歸方程僅適用于樣本的原始數(shù)據(jù)范圍之內(nèi),出了這個范圍,我們不能得出兩變量的相關(guān)關(guān)系和原來的回歸關(guān)系。,資料要求直線回歸要求應變量Y是服從正態(tài)分布的隨機變量,X是可以精確測量和嚴格控制的變量,一般稱為I型回歸;直線相關(guān)要求X和Y服從雙變量正態(tài)分布,二者間若進行回歸分析,則稱為II型回歸。參與相關(guān)分析的兩個變量無主次之分,參與回歸分析的兩個變量則有自變量和應變量之分。,★五、相關(guān)與回歸的區(qū)別,應用說明兩變量間的關(guān)聯(lián)關(guān)系用相關(guān)分析;說明兩者數(shù)量上的依存關(guān)系則用回歸分析。意義B表示X每改變一個單位,Y平均改變B個單位;R說明具有線性關(guān)聯(lián)的兩個變量間關(guān)系的密切程度和相關(guān)方向。R的絕對值越大,散點圖中的點越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。B的絕對值越大,回歸直線越陡,說明當X變化一個單位時,Y的平均變化就越大。,★五、相關(guān)與回歸的區(qū)別,計算方法取值范圍單位R無量綱;B有量綱。,★五、相關(guān)與回歸的區(qū)別,六、相關(guān)與回歸的聯(lián)系,關(guān)系能進行回歸分析的變量之間存在相關(guān)關(guān)系。所以,對于兩組新數(shù)據(jù)(兩個變量)可先做散點圖,求出它們的相關(guān)系數(shù),對于確有相關(guān)關(guān)系的變量再進行回歸分析,求出回歸方程。,六、相關(guān)與回歸的聯(lián)系,相關(guān)系數(shù)R與回歸系數(shù)B1)R與B的符號一致。R為正時,B也為正,表示兩變量是正相關(guān),是同向變化。R為負時,B也為負,表示兩變量是負相關(guān),是反向變化。2)R與B的假設(shè)檢驗結(jié)果一致,可用R的顯著檢驗代替B的顯著性檢驗。3)已知X、Y的標準差SX、SY時,積差相關(guān)系數(shù)R與回歸系數(shù)B可以相互推算。,RBSX/SY,BRSY/SX,回歸強度和相關(guān)強度可以互相解釋決定系數(shù)R2,【習題】查醫(yī)宗金鑒中治積聚處方,得下表資料,用建立回歸方程方法得到19670735X具有統(tǒng)計學意義,R209996。擬合度達9996??梢姡没貧w方程描述名醫(yī)治病用藥的配伍規(guī)律準確有效。,,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 58
      4人已閱讀
      ( 4 星級)
    • 簡介:第五章假設(shè)檢驗,統(tǒng)計推斷,隨機抽樣,,參數(shù),統(tǒng)計量,(?、?、?),(X、S、P),參數(shù)估計假設(shè)檢驗,,通過樣本統(tǒng)計量推斷總體參數(shù)之間是否存在差異,其推斷過程稱為假設(shè)檢驗。,教學目的與要求,掌握假設(shè)檢驗原理單樣本正態(tài)資料的假設(shè)檢驗兩樣本正態(tài)資料的假設(shè)檢驗二項分布與POISSON分布資料的Z檢驗假設(shè)檢驗應注意的問題了解置信區(qū)間與假設(shè)檢驗的關(guān)系,教學內(nèi)容提要,重點講解假設(shè)檢驗原理單樣本正態(tài)資料的假設(shè)檢驗兩樣本正態(tài)資料的假設(shè)檢驗Z檢驗假設(shè)檢驗應注意的問題介紹置信區(qū)間與假設(shè)檢驗的關(guān)系,假設(shè)檢驗的基本任務(wù)事先對總體分布或總體參數(shù)作出假設(shè),利用樣本信息判斷原假設(shè)是否合理,從而決定是否拒絕或接受原假設(shè)。參數(shù)檢驗PARAMETRICTEST若總體分布類型已知,需要對總體的未知參數(shù)進行假設(shè)檢驗。非參數(shù)檢驗若總體分布類型未知,需要對未知分布函數(shù)的總體的分布類型或其中的某些未知參數(shù)進行假設(shè)檢驗。,假設(shè)檢驗(HYPOTHESISTEST)的基本思想,亦稱顯著性檢驗(SIGNIFICANCETEST)是先對總體的特征(如總體的參數(shù)或分布、位置)提出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值、總體均數(shù)(或總體率)相等、總體服從某種分布、兩總體分布位置相同等等,然后根據(jù)隨機樣本提供的信息,運用“小概率原理”推斷假設(shè)是否成立。,“概率很?。ń咏诹悖┑氖录谝淮纬闃又胁惶赡艹霈F(xiàn),故可以認為小概率事件在一次隨機抽樣中是不會發(fā)生的”。,“小概率原理”,例如在2000粒中藥丸中只有一粒是蟲蛀過的,現(xiàn)從中隨機取一粒,則取得“蟲蛀過的藥丸”的概率是1/2000,這個概率是很小的,因此也可以將這一事件看作在一次抽樣中是不會發(fā)生的。若從中隨機抽取一粒,恰好是蟲蛀過的,這種情況發(fā)生了,我們自然可以認為“假設(shè)”有問題,即蟲蛀率P不是1/2000,從而否定了假設(shè)。否定假設(shè)的依據(jù)就是小概率事件原理。由此我們得到一個推理方法如果在某假設(shè)(記為H0)成立的條件下,事件A是一個小概率事件,現(xiàn)在只進行一次試驗,事件A就發(fā)生了,我們就認為原來的假設(shè)(H0)是不成立的。,例如,根據(jù)大量調(diào)查,已知正常成年男性平均脈搏數(shù)為72次/分,現(xiàn)隨機抽查了20名肝陽上亢成年男性病人,其平均脈搏為84次/分,標準差為64次/分。問肝陽上亢男病人的平均脈搏數(shù)是否較正常人快以上兩個均數(shù)不等有兩種可能第一,由于抽樣誤差所致;第二,由于肝陽上亢的影響。,例如,已知正常成年男子脈搏平均為72次/分,現(xiàn)隨機檢查20名慢性胃炎所致脾虛男病人,其脈搏均數(shù)為75次/分,標準差為64次/分,問此類脾虛男病人的脈搏快于健康成年男子的脈搏抽樣誤差脾虛,假設(shè)檢驗1、原因2、目的3、原理4、過程(步驟)5、結(jié)果,第一節(jié)假設(shè)檢驗原理,某事發(fā)生了是由于碰巧還是由于必然的原因統(tǒng)計學家運用顯著性檢驗來處理這類問題。,1、假設(shè)檢驗的原因,由于總體不同或因個體差異的存在,在研究中進行隨機抽樣獲得的樣本均數(shù),X1、X2、X3、X4,不同。樣本均數(shù)不同有兩種(而且只有兩種)可能(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性(差別無統(tǒng)計學意義)(2)分別所代表的總體均數(shù)不同。差別有顯著性(差別有統(tǒng)計學意義),,,,,2、假設(shè)檢驗的目的判斷是由于何種原因造成的不同,以做出決策。,,反證法當一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實A,這時否定另一種可能B,則間接的肯定了A。概率論(小概率)如果一件事情發(fā)生的概率很小,那么在進行一次試驗時,我們說這個事件是“不會發(fā)生的”。從一般的常識可知,這句話在大多數(shù)情況下是正確的,但是它一定有犯錯誤的時候,因為概率再小也是有可能發(fā)生的。,3、假設(shè)檢驗的原理,4、假設(shè)檢驗的步驟,▲建立假設(shè)(反證法),確定顯著性水平(?)▲計算統(tǒng)計量U,T,?2▲確定概率P值▲做出推論,【例51】,已知正常成年男子脈搏平均為72次/分,現(xiàn)隨機檢查20名慢性胃炎所致脾虛男病人,其脈搏均數(shù)為75次/分,標準差為64次/分,推斷此類脾虛男病人的脈搏是否不同于健康成年男子的脈搏。,(1)建立假設(shè),選定檢驗水準假設(shè)兩種一種是檢驗假設(shè),假設(shè)差異完全由抽樣誤差造成,常稱無效假設(shè),用H0表示。另一種是和H0相對立的備擇假設(shè),用H1表示。假設(shè)檢驗是針對H0進行的。,確定雙側(cè)或單側(cè)檢驗,H0此類脾虛病對脈搏數(shù)無影響,H0Μ72次/分H1脾虛病人的脈搏數(shù)不同于正常人,H1Μ≠72次/分,選定檢驗水準Α005Α是在統(tǒng)計推斷時,預先設(shè)定的一個小概率值,是當H0為真時,允許錯誤地拒絕H0的概率。,,雙側(cè)與單側(cè)檢驗界值比較,,2選定適當?shù)臋z驗方法,計算檢驗統(tǒng)計量值,T檢驗Z檢驗,設(shè)計類型資料的類型和分布統(tǒng)計推斷的目的N的大小如完全隨機設(shè)計實驗中,已知樣本均數(shù)與總體均數(shù)比較,N又不大,可用T檢驗,計算統(tǒng)計量T值。,3計算P值,P值是在H0成立時,取得大于或等于現(xiàn)有檢驗統(tǒng)計量值的概率。,(3)計算概率值(P)將計算得到的Z值或T值與查表得到Z?或T?,Ν,比較,得到P值的大小。根據(jù)U分布和T分布我們知道,如果|Z|Z?或|T|T?,則P?。,當P≤Α時,統(tǒng)計學結(jié)論為按所取Α檢驗水準拒絕H0,接受H1,稱“差異有顯著性”(“差異有統(tǒng)計學意義”)。當PΑ時,沒有理由懷疑H0的真實性,統(tǒng)計學結(jié)論為按所取Α檢驗水準不拒絕H0,稱“差異無顯著性”(“差異無統(tǒng)計學意義”)。,4作出推斷結(jié)論,Α與P異同,相同Α與P都是用檢驗統(tǒng)計量分布的尾部面積大小表示。不同Α是在統(tǒng)計推斷時,預先設(shè)定的一個小概率值,是當H0為真時,允許錯誤地拒絕H0的概率,是檢驗水準。P值是由實際樣本決定的,是指從由H0所規(guī)定的總體中隨機抽樣,獲得大于及等于(或小于)現(xiàn)有樣本檢驗統(tǒng)計量值的概率。,5、兩類錯誤(I型錯誤與Ⅱ型錯誤),統(tǒng)計推斷可能出現(xiàn)的4種結(jié)果,I型錯誤(?。?推斷正確(1-?。?推斷正確(1-Β),Ⅱ型錯誤(Β),(假陽性錯誤),(假陰性錯誤),(檢驗效能、把握度),(可信度),無效假設(shè)(H0)備擇假設(shè)(H1),兩類錯誤Ⅰ型錯誤與Ⅱ型錯誤Ⅰ型錯誤H0原本是正確的拒絕H0棄真假陽性錯誤誤診用Α表示Ⅱ型錯誤H0原本是錯誤的不拒絕H0存?zhèn)渭訇幮藻e誤漏診用Β表示,,,,,,,,,兩均數(shù)的假設(shè)檢驗,樣本均數(shù)與總體均數(shù)的比較成對資料均數(shù)的T檢驗成組資料兩樣本均數(shù)的比較方差不齊時兩小樣本均數(shù)的比較,第二節(jié)單樣本正態(tài)資料的假設(shè)檢驗,,,不,滿足,,不,滿足,,滿足,,滿足,,,,Σ,已知,,,,正態(tài)性,,,,非參數(shù),檢驗,,,,變量替換,,,,,結(jié)論,,,,,不,滿足,,,,大樣本,,,,U,檢驗,,,,T,檢驗,,滿足,,,,,,,,,Z,思路,一、正態(tài)總體均數(shù)的假設(shè)檢驗,方法,1、大樣本【例52】一般女性平均身高1601CM。某大學隨機抽取100名女大學生,測量其身高,身高的均數(shù)是16374CM,標準差是380CM。請問某大學18歲女大學生身高是否與一般女性不同。,▲目的比較樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)有無差別▲計算公式Z統(tǒng)計量,▲適用條件1已知一個總體均數(shù);2可得到一個樣本均數(shù);3可得到該樣本標準誤;4樣本量不小于100。,,,假設(shè)檢驗▲建立假設(shè),確定顯著性水平(?)檢驗假設(shè)某校女大學生身高均數(shù)與一般女子身高均數(shù)相同,H0ΜΜ0;備擇假設(shè)某校女大學生身高均數(shù)與一般女子身高均數(shù)不同,H1Μ≠Μ0?005,▲做出推論Z958196,PT00515,P00482。??=005N=5,=1414,S=00882,DF=N-1=4,查統(tǒng)計用表6得單側(cè)概率PT0059PΜ0Μ的上側(cè)95%置信區(qū)間為T005,DFS/如例43,H0Μ=Μ0(Μ072次/分);H1ΜΜ0。?。?05。-T005(DF)S/=75172964/=7252Μ的上側(cè)95%置信區(qū)間為Μ7252,現(xiàn)Μ0=72次/分不在此區(qū)間范圍內(nèi),故按Α=005水準拒絕H0,接受H1,結(jié)論與前述T檢驗結(jié)果一致。(2)若關(guān)心的是ΜΜ0Μ的下側(cè)95%置信區(qū)間為T005(DF)S/,二、置信區(qū)間比假設(shè)檢驗有可提供更多信息之處,,三、置信區(qū)間不能完全取代假設(shè)檢驗,置信區(qū)間用作假設(shè)檢驗只能在規(guī)定的Α水準上揭示差異有無統(tǒng)計學意義。假設(shè)檢驗可得到的P值,可以精確地說明結(jié)論的概率保證,可以估計假陰性率Β。,最好同時給出假設(shè)檢驗的檢驗統(tǒng)計量值、P值和置信區(qū)間,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 72
      13人已閱讀
      ( 4 星級)
    • 簡介:醫(yī)學統(tǒng)計學2,方法的類型,研究和應用程度,統(tǒng)計學,理論統(tǒng)計學,應用統(tǒng)計學,描述統(tǒng)計學,推斷統(tǒng)計學,,在中醫(yī)藥科研實踐中通過觀察、調(diào)查、實驗等方式搜集到的各種資料含有大量信息,由此揭示或表達樣本信息特征,不僅需要依據(jù)相關(guān)專業(yè)知識,還需借助適當?shù)慕y(tǒng)計學方法和手段。統(tǒng)計描述又稱描述性統(tǒng)計,是運用適宜的統(tǒng)計指標、統(tǒng)計表、統(tǒng)計圖等方法,對研究對象變量的分布類型和數(shù)量特征進行展示的過程。通過統(tǒng)計描述,可了解研究對象的基本特征,便于對樣本資料作進一步的統(tǒng)計分析。,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計描述分類變量的統(tǒng)計描述統(tǒng)計表統(tǒng)計圖,頻數(shù)表及頻數(shù)圖是統(tǒng)計描述的基本內(nèi)容,也是揭示樣本數(shù)據(jù)分布特征的基本手段。,頻數(shù)表又稱頻數(shù)分布表,是將某變量各組段及其相應的頻數(shù)按一定順序排列而成的表格形式,主要用于描述數(shù)據(jù)的分布特征,是對樣本含量較大的資料進行統(tǒng)計描述的常用方法。,【例21】隨機抽取某年某地120例正常人血清銅的含量,見表21,試編制頻數(shù)表。,1數(shù)值資料頻數(shù)表的編制,1找出120例血清鐵數(shù)據(jù)的最小值923)與最大值(1984)。2計算全距(RANGE,R),也稱為極差。R最大值一最小值1984-923=10613確定組段數(shù)K組段數(shù)應根據(jù)研究目的和觀察值多少而定,當N100時,通常取1015組,不宜過粗或過細。本例N120,可先將原始資料粗略定為11組。4確定組距I組距等于全距比組數(shù),一般等距分組。IR/K本例中I1061/110965≈1,頻數(shù)表的手工編制方法,5確定組段第一組段應包括最小值,最后一個組段應包括最大值。每一組段的起始值稱為下限,終點值稱為上限即下一組段的下限,為避免匯總時的重復,組段不包括本組段的“上限”,但最后一個組段應同時寫出下限和上限。如本例最小值為923,為計算方便,第一組段的下限取900,然后每隔一個組距列一個組段,直至最后一個組段19002000。6列表并統(tǒng)計頻數(shù),還可計算頻率、累計頻數(shù)和累計頻率,見表22。,表中組中值上組段下限值下組段下限值/2;頻數(shù)即各組段內(nèi)觀察值的個數(shù);頻率即各組段頻數(shù)與總觀察值個數(shù)之比,一般用百分數(shù)表示;累計頻數(shù)是由上至下將頻數(shù)累加;累計頻率是由上至下將頻率累加。從本例的分布可見以第六組段1400分布的數(shù)據(jù)最多,22例,占183,且以該組段為中心呈對稱分布,小于1500UMOL/L的數(shù)據(jù)占591。,SPSS軟件繪制頻數(shù)表,對【例21】資料進行統(tǒng)計描述,,,,,,,2分類資料頻數(shù)表的編制,1一維頻數(shù)表用分類資料的分類水平代替上述數(shù)值資料頻數(shù)表的組段,然后通過分類計數(shù)便可編制其頻數(shù)表,見表23。,(2)二維頻數(shù)表分類資料的二維頻數(shù)表在各種醫(yī)學雜志中較為常見。按分類資料的分類水平特征,可組合成各種不同的二維表,不同二維表名稱見表24。,(3)配對設(shè)計分類資料的頻數(shù)表同一研究對象同時接受兩種不同的處理,觀測的結(jié)果為屬性相同的分類資料時,這樣就形成了配對設(shè)計的分類資料,可用行數(shù)與列數(shù)相同的方形表歸納其頻數(shù)分布,見表25。,頻數(shù)圖是在頻數(shù)表基礎(chǔ)上,以直方或直條的面積大小表示頻數(shù)的多少或頻率的大小的圖形,可直觀顯示數(shù)據(jù)的分布類型和特征。,1數(shù)值資料頻數(shù)圖直方圖的繪制,1等距分組橫軸表示隨機變量,縱軸表示頻數(shù)或頻率。表21資料的頻數(shù)圖,見圖21。,SPSS繪制頻數(shù)圖,,,(2)不等距分組橫軸表示變量,縱軸是每個橫軸單位的頻數(shù)。表26資料的頻數(shù)圖,見圖22。,2分類資料頻數(shù)圖直條圖的繪制,頻數(shù)表和頻數(shù)圖的用途,1描述頻數(shù)分布的類型資料的頻數(shù)分布類型有對稱分布和偏態(tài)分布兩種。如果頻數(shù)分布集中位置單峰最高處在中間,左右兩側(cè)頻數(shù)大體對稱,稱為對稱分布。如果頻數(shù)分布不對稱,集中位置偏向一側(cè),則稱為偏態(tài)分布。若集中位置偏向觀察值小的一側(cè),稱為正偏態(tài),又稱右偏態(tài)。若集中位置偏向觀察值大的一側(cè),稱為負偏態(tài),又稱左偏態(tài)。不同資料的頻數(shù)分布類型,見圖24。對于不同頻數(shù)分布類型的資料,應選用不同的統(tǒng)計方法進行分析。,描述頻數(shù)分布形態(tài)的統(tǒng)計量有兩個峰度系數(shù)和偏度系數(shù)。理論上總體偏度系數(shù)為0時,分布是對稱的;取正值時,分布為負偏態(tài);取負值時,分布為正偏態(tài)。正態(tài)分布的總體峰度系數(shù)為0;取負值時,分布為平闊峰;取正值時,分布為尖峭峰。正態(tài)分布是一種特殊的以集中性、對稱性和均勻變動性為特點的對稱分布,故無論尖峭峰或平闊峰,均為非正態(tài)分布。,2展示頻數(shù)分布的特征頻數(shù)分布有兩個重要特征一是集中趨勢,反映一組觀察值的中心位置或平均水平;二是離散趨勢,反映觀察值之間參差不齊的程度。對數(shù)值變量資料作統(tǒng)計描述,就是用統(tǒng)計指標將這兩個重要特征數(shù)量化。3便于發(fā)現(xiàn)某些特大或特小的異常值對資料中出現(xiàn)的異常值應謹慎對待,必要時對原始資料進行核實,并再次進行觀察或測量。若條件不允許再次觀察或測量,在有充分依據(jù)的前提下,可將異常值予以剔除,然后再做統(tǒng)計描述和分析。4有利于進一步計算有關(guān)指標和統(tǒng)計分析處理,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計描述分類變量的統(tǒng)計描述統(tǒng)計表統(tǒng)計圖,正態(tài)分布是生物醫(yī)學和統(tǒng)計學上極其重要的一種分布,醫(yī)學研究的很多指標都服從或近似服從正態(tài)分布。在統(tǒng)計學上,很多分布都是由正態(tài)分布導出,同時正態(tài)分布又是多種分布的極限分布。,正態(tài)分布NORMALDISTRIBUTION是描述連續(xù)型隨機變量最重要的分布。其分布曲線叫正態(tài)分布曲線,呈中間高,兩邊低,左右基本對稱的“鐘型”曲線,又稱高斯分布。,正態(tài)分布由德國數(shù)學家GAUSS在描述誤差分布時所發(fā)現(xiàn),并加以推廣,所以通常稱為高斯分布GAUSSDISTRIBUTION。,高斯,10馬克的錢幣,,正態(tài)分布的公式,Μ和Σ是正態(tài)分布的兩個參數(shù),Μ和Σ決定了X的概率分布;習慣上用NΜ,Σ2表示均數(shù)為Μ,標準差為Σ的正態(tài)分布。,,正態(tài)分布的特征,1集中性正態(tài)分布是一條單峰分布,高峰位置在均數(shù)處。2對稱性正態(tài)分布以均數(shù)為中心,左右完全對稱。3正態(tài)分布曲線的形態(tài)取決于兩個參數(shù),即總體均數(shù)Μ和總體標準差Σ。4正態(tài)分布曲線下的面積分布具有一定的規(guī)律性。,當Σ固定不變時,Μ越大,曲線沿橫軸越向右移動;反之,Μ越小,則曲線沿橫軸越向左移動,所以Μ叫正態(tài)曲線N(Μ,Σ2)的位置參數(shù),。,1位置參數(shù)Μ,正態(tài)分布位置隨參數(shù)Μ變換示意圖,2形狀參數(shù)Σ,正態(tài)分布形態(tài)隨參數(shù)Σ變換示意圖,當Μ固定不變時,Σ越大,曲線越平闊;Σ越小,曲線越尖峭,Σ叫正態(tài)曲線N(Μ,Σ2)的形狀參數(shù)。,正態(tài)分布面積分布規(guī)律,(1)正態(tài)分布曲線與橫軸所夾面積為1。(2)區(qū)間在(ΜΣ,ΜΣ)內(nèi)的面積或概率為0683,此區(qū)間之外概率為0317,左右兩側(cè)各01585。(3)區(qū)間在(Μ196Σ,Μ196Σ)內(nèi)的面積或概率為095,此區(qū)間之外概率為005,左右兩側(cè)各0025。(4)區(qū)間在(Μ258Σ,Μ258Σ)內(nèi)的面積或概率為099,此區(qū)間之外概率為001,左右兩側(cè)各0005。,正態(tài)分布應用于以下3個方面1制定醫(yī)學參考值范圍2質(zhì)量控制3統(tǒng)計方法的理論基礎(chǔ),正態(tài)分布的應用,1制定醫(yī)學參考值范圍,參考值范圍(REFERENCERANGE指所謂“正常人”的解剖、生理、生化等指標的波動范圍。,制定方法制定參考值范圍時,首先要確定一批樣本含量足夠大的“正常人”。測量樣本人群相應指標的值,測量的過程中要嚴格控制各種誤差。而后根據(jù)指標的實際用途確定單側(cè)或雙側(cè)界值,根據(jù)研究目的和使用要求選定適當?shù)陌俜纸缰?,常?5。,單側(cè)臨界值標準正態(tài)分布單側(cè)尾部面積等于Α時所對應的正側(cè)變量值,記作ZΑ。,雙側(cè)臨界值標準正態(tài)分布雙側(cè)尾部面積之和等于Α時所對應的正側(cè)變量值,記作ZΑ/2。,以不同的方法計算參考值范圍,舉例1調(diào)查某地120名健康女性血紅蛋白,直方圖顯示其分布近似正態(tài),均數(shù)X1174,標準差S102,試估計該地健康女性血紅蛋白的95參考值范圍。,解析,1分布近似正態(tài),2過高過低均為異常,3求上、下界值,上界,下界,所以,該地健康女性血紅蛋白的95參考值范圍是(9741,13739)G/L。,,舉例2某地調(diào)查120名健康成年男性的第一秒肺通氣量得均數(shù)X42L,標準差S07L,試據(jù)此估計其第一秒肺通氣量的95參考值范圍。,解析,1分布近似正態(tài),2僅過低為異常,3求下界值,下界,所以,該地健康成年男子第一秒肺通氣量的95參考值范圍為不低于305(L)。,,2質(zhì)量控制,基本原理許多臨床檢驗指標,當影響某一指標的隨機因素很多,而每個因素所起的作用均不太大時,這個指標的隨機波動屬于隨機誤差,則往往服從正態(tài)分布。,質(zhì)量控制領(lǐng)域的“3Σ原則”其意義是指正常情況下檢測誤差服從正態(tài)分布,根據(jù)正態(tài)分布的曲線面積或概率分布理論可知,3Σ之外的觀察值出現(xiàn)的概率不到3‰,如果超過這一值,則提示測量或產(chǎn)品質(zhì)量有問題。統(tǒng)計學規(guī)定以X為中心線,X±2S為警戒線,X±3S為控制線,根據(jù)以上的規(guī)定還可以繪制出質(zhì)量控制圖。,,,中心線,警戒線,控制線,控制線,警戒線,3統(tǒng)計方法的理論基礎(chǔ)T分布、F分布、X2分布都是在正態(tài)分布的基礎(chǔ)上推導出來的,U檢驗也是以正態(tài)分布為基礎(chǔ)的。二項分布、POISSON分布的極限為正態(tài)分布,在一定條件下,可以按正態(tài)分布原理來處理。,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計描述分類變量的統(tǒng)計描述統(tǒng)計表統(tǒng)計圖,從數(shù)值資料的頻數(shù)表和頻數(shù)圖中雖可以看出觀察值的分布情況,但為了揭示數(shù)據(jù)的基本特征,還需用可量化指標作進一步的統(tǒng)計描述分析。數(shù)值資料的統(tǒng)計描述,它包括集中趨勢和離散趨勢的統(tǒng)計描述。,(一)集中趨勢的統(tǒng)計描述,描述數(shù)值資料集中趨勢的代表性指標為平均數(shù)。平均數(shù)是反映一組觀察值變量值集中趨勢、中心位置或平均水平的重要統(tǒng)計指標,其主要作用包括①作為一組觀察值的代表值,表明該組觀察值集中趨勢的特征。②便于對同類研究對象進行對比分析。,按使用條件和計算方法不同,平均數(shù)分為許多種。常用的有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)等。1算術(shù)均數(shù)ARITHMETICMEAN,簡稱均數(shù)MEAN,它等于所有觀察值之和除以觀察值的個數(shù)。表示一組性質(zhì)相同的觀察值在數(shù)量上的平均水平,適用于呈對稱分布,尤其是正態(tài)分布的數(shù)值資料的集中趨勢描述。如正常人生理、生化的大多數(shù)指標,如身高、體重、血紅蛋白含量、白細胞計數(shù)等均適合用均數(shù)描述其集中趨勢。總體均數(shù)用希臘字母Μ表示,樣本均數(shù)用X讀作XBAR表示。,,計算方法有兩種,,2幾何均數(shù)GEOMETRICMEAN,是N個數(shù)值乘積的N次方根,表示一組資料在比例或倍數(shù)上的平均,用G表示。適用于對數(shù)正態(tài)分布資料有些數(shù)值資料,原始數(shù)據(jù)不服從正態(tài)分布,若將數(shù)據(jù)轉(zhuǎn)換成對數(shù)后的資料服從正態(tài)分布和觀察值之間呈等比關(guān)系的資料。如某些疾病的潛伏期、抗體滴度或平均效價等。,SPSS計算幾何均數(shù),,,,,3中位數(shù)MEDIAN,將一組觀察值從小到大按順序排列,位次居中的觀察值就是中位數(shù),用M表示。它表示位次上的平均,不受兩端極值的影響。中位數(shù)適用于任何一種分布的數(shù)值變量資料,一般多用于描述偏態(tài)分布或數(shù)據(jù)一端或兩端無確切值的開口資料如N60的集中趨勢。,百分位數(shù)PERCENTILE是一個位置指標,用PX表示。把一組變量值由小到大依次排列,將位次平均分成100等份,與第X百分位數(shù)相應的變量值稱為第X百分位數(shù)。一個百分位數(shù)可將一組變量值分為兩部分,理論上有NX個變量值比它小,有N1X個變量值比它大。所以百分位數(shù)是一個界值或分割值。百分位數(shù)常用于描述一組偏態(tài)分布的大樣本資料在某個百分位置上的水平及確定偏態(tài)分布資料的醫(yī)學正常值范圍。中位數(shù)是一個特定的百分位數(shù),即P50。計算百分位數(shù)的公式為,,,,百分位數(shù)示意圖,,,,,運用平均數(shù)的注意事項,1了解各醫(yī)學專業(yè)平均數(shù)的習慣用法。例如,兒童齲齒個數(shù)雖然呈偏態(tài)分布,但在口腔預防保健統(tǒng)計中,習慣上計算算術(shù)均數(shù)。2同一資料有時可能同時滿足幾個平均數(shù)指標的應用條件。例如,對于某些偏態(tài)分布的資料,幾何均數(shù)和中位數(shù)比較接近。出現(xiàn)這種情況時,除了專業(yè)上的習慣用法外,統(tǒng)計上的處理原則是如果均數(shù)與中位數(shù)接近、幾何均數(shù)與中位數(shù)接近,最終采用均數(shù)或幾何均數(shù)作為平均數(shù)指標。反之,則采用中位數(shù)作為平均數(shù)指標。3計算和運用平均數(shù)時,要注意極端值的影響,如算術(shù)平均數(shù)受極端值的影響較大。為了正確反映觀察值的特征,當存在過大或過小的極端值時,應予以剔除,然后將其余數(shù)值計算平均數(shù)。通常稱這種去除極端值再平均的方法為切尾平均法。該法在文藝、體育比賽評分時應用較多。4平均數(shù)只反映變量的集中趨勢,只有把平均指標與變異指標相結(jié)合,才能全面反映研究對象的數(shù)量特征。,(二)離散趨勢的統(tǒng)計描述,離散趨勢是反映一組觀察值之間參差不齊的程度,即變異度?!纠?9】有三組同齡男孩的身高值CM如下,其平均身高均為100CM,試分析其離散程度。甲組9095100105110甲的平均值100CM乙組9698100102104乙的平均值100CM丙組9699100101104丙的平均值100CM由資料可見,雖然三組的均數(shù)相同,即集中趨勢相同,但各組數(shù)據(jù)參差不齊的程度并不相同,即離散趨勢不同。所以要反映數(shù)值資料的整體特征,既要考慮集中趨勢,還要考慮離散趨勢。常用的離散趨勢指標有極差、四分位數(shù)間距、方差和標準差、變異系數(shù)等。,1極差RANGE,R,又稱全距,是一組觀察值中最大值與最小值之差。適用于任何分布類型的資料(開口資料除外)。極差越大,說明變異程度越大。計算公式見式21用極差描述資料的離散趨勢雖然計算簡單,但除了最大值和最小值,不能反映組內(nèi)其他數(shù)據(jù)的變異,且易受極端值和樣本含量的影響,所以常用于資料的粗略估計和小樣本數(shù)據(jù)。,2四分位數(shù)間距,將全部觀察值按其位次分為四等份,有三個分點第一個分點是下四分位數(shù)即P25,常用QL表示;第二個分點即中位數(shù)M,記為P50,第三個分點也稱上四分位數(shù),即P75,常用QU表示。四分位數(shù)間距QUARTILCINTERVAL,Q即指上、下四分位數(shù)之差,用Q表示。四分位數(shù)間距示意圖,見圖25。,四分位數(shù)間距適用于任何分布類型的資料,尤其是呈偏態(tài)分布的大樣本資料,常與中位數(shù)一起描述偏態(tài)分布資料的分布特征。它作為描述數(shù)據(jù)分布離散程度的指標,比極差穩(wěn)定,但仍未考慮到每個數(shù)據(jù)的大小。,3方差和標準差,為了全面考察每個觀察值的變異情況,克服極差和四分位數(shù)間距的缺點,需要計算總體中每個觀察值X與總體均數(shù)Μ的差值(XΜ),稱為離均差。由于?(XΜ)0時,不能反映變異度大小,需將離均差平方后再求和,即?(XΜ)2,稱為離均差平方和。同時考慮到觀察值個數(shù)N的影響,取其均數(shù),稱為總體方差,用?2表示,計算公式為,由于在實際研究中很難得到總體均數(shù)和總例數(shù),只能用樣本均數(shù)和樣本例數(shù)來代替,計算出樣本方差S2作為總體方差的估計值。為了克服S2對?2的有偏估計,統(tǒng)計學家提出用N1代替N來校正,計算公式為,式中,N1稱為自由度DEGREEOFFREEDOM,統(tǒng)計符號為Ν,表示在計算某一統(tǒng)計量時可以自由取值的變量個數(shù)或觀察值個數(shù)。設(shè)某統(tǒng)計量的變量X共有N個取值,則VN;若它們受到K個條件限制K005表示符合正態(tài)分布,,,箱圖顯示最小值、最大值、第75、50、25百分位數(shù),及異常值。,4、統(tǒng)計分析時的描述輸出,描述統(tǒng)計是統(tǒng)計檢驗的基礎(chǔ),所以任何統(tǒng)計分析方法,輸出統(tǒng)計推斷結(jié)論,輸出結(jié)果的同時,軟件系統(tǒng)自動會輸出主要的統(tǒng)計指標。,,,,(四)數(shù)值變量的報告規(guī)范,,X±S算術(shù)均數(shù)±標準差,算術(shù)均數(shù)是一組呈正態(tài)分布的變量值的平均水平,代表集中趨勢,標準差代表離散趨勢。通過均數(shù)和標準差的大小關(guān)系,可以大致看出是否符合正態(tài)分布,進而判斷出使用統(tǒng)計方法是否正確。,,(四)數(shù)值變量的報告規(guī)范,,,如何在WORD中寫出X,1、輸入英文小寫字母X,并將其改為斜體X,,,,如何在WORD中寫出X,2、選中X后,單擊菜單欄中的【格式】→【中文版式】→【拼音指南】,,如何在WORD中寫出X,3、在【拼音指南】對話框的【基準文字】項可以看到X,在【拼音文字】項下第一行輸入“_”。,,,,如何在WORD中寫出X,,,G±GSD幾何均數(shù)±標準差,幾何均數(shù)可反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈正態(tài)分布的變量值在數(shù)量上的平均水平,在醫(yī)學研究中常適用于免疫指標。,,MIN,MAX,最小、最大值相當于報告數(shù)值的區(qū)間,如年齡1870歲。最小18,最大70。有助于發(fā)現(xiàn)離群值,或異常值。,M中位數(shù)QLQU(Q1Q3)四分位間距,中位數(shù)是將N個變量從小到大排序,位置居中的那個數(shù),適用于偏態(tài)和一端或兩端無確切值的資料。與之相適應的統(tǒng)計圖為箱式圖,,,,,,MIN,MEDIAN,P75,MAX,P25,QL,QU,,,,,,,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計描述分類變量的統(tǒng)計描述統(tǒng)計表統(tǒng)計圖,分類資料是按研究對象的名義、類別或性質(zhì)清點數(shù)目而得,常見的數(shù)據(jù)形式是絕對數(shù)ABSOLUTENUMBER。絕對數(shù)指標又稱總量指標,表示被描述對象的規(guī)模。廣義的絕對數(shù)指標指總體變量值或標志值之和;狹義的絕對數(shù)指標通常指數(shù)值資料的合計值或分類資料的合計頻數(shù)。絕對數(shù)指標的缺點是缺乏可比性。例如,甲、乙兩個醫(yī)院某病住院人數(shù)不同時,比較兩醫(yī)院該病的死亡人數(shù)沒有意義,需要在絕對數(shù)的基礎(chǔ)上計算相對數(shù)。相對數(shù)RELATIVENUMBER指標是兩個有聯(lián)系的絕對數(shù)指標數(shù)值之比形式表示。相對數(shù)指標從數(shù)量上反映兩個相互關(guān)聯(lián)現(xiàn)象之間的對比關(guān)系或聯(lián)系強度,有助于分析和闡明研究現(xiàn)象的規(guī)律性。相對數(shù)的意義是將絕對數(shù)指標轉(zhuǎn)換成基數(shù)相同的相對數(shù)指標如每千人發(fā)病人數(shù)、每百例患者死亡人數(shù)等,以便相互比較。常用的相對數(shù)有率、構(gòu)成比和相對比等比例指標。,一率率RATE是反映某現(xiàn)象的強度、密度和普遍程度的指標,特點是比例基數(shù)較靈活。,比例基數(shù)的選擇一是根據(jù)習慣用法,如患病率通常用百分率、嬰兒死亡率用千分率、腫瘤死亡率以十萬分率表示等;二是使計算的結(jié)果能保留12位整數(shù),以便閱讀。注意計算率時,分子必須是分母的一部分,而且通常先確定分母作為觀察對象,然后再在一定條件下清點某現(xiàn)象的實際發(fā)生數(shù),如陽性檢出率、治愈率、病死率等。當分母較大時,比率近似等于概率。,【例215】某醫(yī)院2005年在某社區(qū)調(diào)查全部成年居民1379例,體檢發(fā)現(xiàn)高血脂癥患者為341例,則該社區(qū)成年居民高血脂癥患病率為341/1379X1002473。,1發(fā)病率INCIDENCERATE,IR,即在一定時期內(nèi),可能發(fā)生某病的人群中新發(fā)生某病的強度,可表示發(fā)病危險,常用于疾病危險因素的探討和疾病防治效果的評價。計算公式為,特殊情況下,要注意分母中“可能發(fā)生某病”的含義,是指對某種疾病具有發(fā)病風險者,而不包括不可能發(fā)生某病者。以計算麻疹發(fā)病率為例,由于麻疹基本為終生免疫,故在計算分母時,應除去已患過麻疹者。,2患病率PREVALENCERATE,PR,又稱為現(xiàn)患率,是指某時點上受檢人數(shù)中現(xiàn)患某種疾病的頻率,分為時點患病率POINTPREVALENCERATE和期間患病率PERIODPREVALENCERATE。計算公式為,與發(fā)病率分子的計算方法不同,患病率的分子中不僅包括某種疾病的新發(fā)病例“新病例”,還包括原有病例“舊病例”。,3死因別死亡率CAUSESPECIFLCDEATHRATE,CSDR,又稱某死因死亡率,是指由某種原因或疾病所導致的死亡率,主要用于死因分析,可反映各種病傷損害對居民生命健康的危害程度。計算公式為,4某病病死率(CASEFATALITYRATE,CFR,是在特定時間內(nèi)通常為1年某病患者中因該病而死亡者所占的百分比,亦用于死因分析,一方面反映某種疾病的嚴重程度,另一方面反映醫(yī)療質(zhì)量和水平。計算公式為,二構(gòu)成比,構(gòu)成比PROPORTION又稱百分比PERCENTAGE,用來說明事物內(nèi)部各構(gòu)成部分在整體中所占的比重。特點是以100為比例基數(shù),分子是分母的一部分,取值范圍為01。計算公式為,注意構(gòu)成比不能說明事物發(fā)生的頻率或強度。,【例216】辨證治療高血壓病176例,其中肝陽上亢型45例,肝陽上亢型占高血壓病5種中醫(yī)辨證分型的構(gòu)成比為45/1762557。,率與構(gòu)成比的區(qū)別,9/227,9/1045,三相對比,相對比RELATIVERATIO是兩個有關(guān)聯(lián)的指標之比,特點是常以倍數(shù)或百分數(shù)表示。計算公式為,式中,A、B分別表示兩個總量指標。A和B可以是絕對數(shù)、相對數(shù)和平均數(shù),其量綱可以相同,也可不同,但A和B互不包含(如某人群中男女性別比)?!纠?17】某醫(yī)院用中西醫(yī)結(jié)合療法及西藥療法治療腦梗死的病死率分別為743和1621。則西藥療法的病死率為中西醫(yī)結(jié)合療法的218倍1621/743;或中西醫(yī)結(jié)合療法的病死率是西藥療法的4584。,四應用注意事項,1計算相對數(shù)應有足夠數(shù)量即分母不宜過小,一般來說,樣本數(shù)量較多,計算的相對數(shù)可靠性也較大。當觀察例數(shù)很少時N30例會使相對數(shù)波動較大,不宜計算率。在臨床試驗中,各種偶然因素都可能導致計算結(jié)果的較大變化,因此例數(shù)很少的情況下最好用絕對數(shù)直接表示;否則,應同時寫出其置信區(qū)間。,2正確區(qū)分率和構(gòu)成比構(gòu)成比只能說明某事物內(nèi)部各組成部分的比重或分布,不能說明該事物某一部分發(fā)生的強度與頻率。構(gòu)成比與率的區(qū)別在于①構(gòu)成比是對已有的觀察結(jié)果分類。例如,某醫(yī)院對胃潰瘍住院病人的職業(yè)按工人、農(nóng)民、干部和軍人進行分析,得出工人患病率高、干部患病率低的結(jié)論是錯誤的,因為此時只能得出職業(yè)所占的構(gòu)成比。②率則是在未知觀察結(jié)果的情況下先確定觀察對象。例如,將觀察對象先按職業(yè)分組,然后統(tǒng)計有無胃潰瘍,計算出工人的患病率、農(nóng)民患病率、干部的患病率、軍人的患病率。,3正確計算合計率對分組資料計算合計率或稱平均率時,不能簡單地由各組率相加或平均而得,而應是各組分子之和與各組分母之和的比。例如,用某療法治療肝炎,甲醫(yī)院治療150例,治愈30例,治愈率為20。乙醫(yī)院治療100例,治愈30例,治愈率為30。兩個醫(yī)院合計治愈率應該是3030/150100X10024。若計算為203050或(2030/225,則是錯的。,4資料的可比性在比較相對數(shù)時,除了要對比的因素如不同的藥物,其余的影響因素應盡可能相同或相近。遵循均衡和隨機原則是資料可比性的重要保證。下列因素可能影響對比組之間的可比性L觀察對象是否同質(zhì)研究方法是否相同,觀察時間是否相等,地區(qū)、周圍環(huán)境、風俗習慣和經(jīng)濟條件是否一致或相近等。,2觀察對象內(nèi)部結(jié)構(gòu)是否相同若兩組資料的年齡、性別等構(gòu)成不同,可以分別進行同年齡別、同性別的小組率比較或?qū)偮屎嫌嬄蔬M行標準化后再作比較。3不同時期的資料客觀條件是否相同例如,在比較兩組病人的治愈率時,應檢查各病例診斷標準是否一致等;居民因醫(yī)療普及,就診機會增加,或診斷技術(shù)提高,也會引起發(fā)病率“升高”。因此在分析討論時,應根據(jù)各方面情形全面考慮,慎重對待。,5樣本率或構(gòu)成比的抽樣誤差不能僅憑數(shù)字表面相差大小下結(jié)論,應進行樣本率或構(gòu)成比差別的假設(shè)檢驗。,N例數(shù),例數(shù),表示研究對象的數(shù)量。每一項研究,只要涉及到研究對象,例數(shù)是必不可少的、必須報告的統(tǒng)計指標。,五分類資料的報告規(guī)范,頻數(shù),百分比,頻數(shù),表示分類資料各類別的例數(shù)。百分比,表示分類資料各類別的例數(shù)占總例數(shù)的百分比。當小樣本資料時,不適宜計算百分比,而需用相對頻數(shù)來表示。,,,頻數(shù),百分比,,,,頻數(shù),百分比,,頻數(shù)分布正態(tài)分布數(shù)值變量的統(tǒng)計描述分類變量的統(tǒng)計描述統(tǒng)計表統(tǒng)計圖,統(tǒng)計表,在科研或臨床工作中,將統(tǒng)計分析的事物及指標用表格的形式列出稱為統(tǒng)計表。廣義上的統(tǒng)計表包括原始資料調(diào)查表、整理資料表、統(tǒng)計資料計算用表及表達結(jié)果的統(tǒng)計表。狹義上的統(tǒng)計表特指表達統(tǒng)計結(jié)果的報告表。,1、統(tǒng)計表的意義統(tǒng)計表用簡明的表格形式,有條理地羅列數(shù)據(jù)和統(tǒng)計量,方便閱讀、比較和計算。在統(tǒng)計描述過程中,統(tǒng)計表展示統(tǒng)計數(shù)據(jù)的結(jié)構(gòu)、分布和主要特征,便于在進一步分析中選擇和計算統(tǒng)計量。在學術(shù)報告和論文中常用統(tǒng)計表代替冗長的文字敘述,表達主要研究結(jié)果、數(shù)據(jù)、指標和統(tǒng)計量,方便讀者作比較和掌握主要研究結(jié)果。,2統(tǒng)計表的基本格式統(tǒng)計表的基本格式為三條線頂線、標目線、底線、三部分標題、標目、數(shù)字,具有如此基本格式的表格通常簡稱為“三線”表格。,3統(tǒng)計表的基本結(jié)構(gòu)包括①表號②標題③標目④線條⑤數(shù)字⑥備注,4統(tǒng)計表的種類可分為簡單表和組合表。1簡單表SIMPLETABLE只按一個標志或特征分組。,2組合表(COMBINATIVETABLE)又稱復合表,是按兩個或兩個以上的標志或特征結(jié)合分組。表215是按性別、病程、年齡、突出部
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 192
      4人已閱讀
      ( 4 星級)
    • 簡介:,,醫(yī)學統(tǒng)計學MEDICALSTATISTICS,醫(yī)學統(tǒng)計學講授內(nèi)容第一章緒論第二章計量資料的統(tǒng)計描述第三章總體均數(shù)的估計與假設(shè)檢驗第四章多個樣本均數(shù)比較的方差分析第五章計數(shù)資料的統(tǒng)計描述第六章幾種離散型變量的分布及其應用第七章檢驗第八章秩轉(zhuǎn)換的非參數(shù)檢驗第九章雙變量回歸與相關(guān)第十章統(tǒng)計表與統(tǒng)計圖,第十一章多因素試驗資料的方差分析第十二章重復測量設(shè)計資料的方差分析第十五章多元線性回歸分析第十六章LOGISTIC回歸分析第十七章生存分析第十八章判別分析第十九章聚類分析第二十三章常用綜合評價方法第二十四章量表研制與量表資料的統(tǒng)計分析方法,“非常痛心地看到,因為數(shù)據(jù)分析的缺陷和錯誤,那么多好的生物研究工作面臨著被葬送的危險”。FYATES,MJRHEALY,統(tǒng)計知識的運用,撰寫論文報告自己觀察或?qū)嶒灥难芯拷Y(jié)果。,閱讀論文吸收新知識,了解學術(shù)進展。,為什么要學醫(yī)學統(tǒng)計學,60年代到80年代,國外醫(yī)學雜志調(diào)查表明2072的論文有統(tǒng)計錯誤。1984年對中華醫(yī)學雜志、中華內(nèi)科雜志、中華外科雜志、中華婦產(chǎn)科雜志、中華兒科雜志595篇論文的調(diào)查結(jié)果為相對數(shù)誤用占112,抽樣方法誤用占159,統(tǒng)計圖表誤用占1171996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志占69),數(shù)據(jù)分析方法誤用達557。2001年中華預防醫(yī)學雜志中華醫(yī)學會系列雜志誤用約54(1995)。,1996年,有機構(gòu)對申報科技成果的4586篇科研論文分析,統(tǒng)計方法使用率為76。醫(yī)學論文中統(tǒng)計運用錯誤,除了影響論文的科學性,還可能導致嚴重的倫理學問題。,為什么要學醫(yī)學統(tǒng)計學,英國統(tǒng)計學家RAFISHER(18901962)對遺傳學家MENDEL(18221884)雜交試驗結(jié)果的評價,MENDEL的豌豆雜交試驗父本母本第一代YGYG第二代Y/YY/GG/YG/G,雜交試驗結(jié)果綠色種子的頻率2001/8023期望值8023?0252006,標準差39PROP2001520115011,結(jié)合MENDEL歷次報告的其它實驗結(jié)果,每次都有如此好的吻合的概率約10萬分之4。,為什么要學醫(yī)學統(tǒng)計學,緒論INTRODUCTION,講授內(nèi)容一、醫(yī)學統(tǒng)計學的意義二、統(tǒng)計學中的幾個基本概念三、統(tǒng)計資料的類型四、醫(yī)學統(tǒng)計工作的基本步驟五、學習醫(yī)學統(tǒng)計學應注意的問題,一、醫(yī)學統(tǒng)計學的意義,1統(tǒng)計學(STATISTICS)應用數(shù)學的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學,對不確定性數(shù)據(jù)作出科學的推斷。2醫(yī)學統(tǒng)計學(STATISTICSOFMEDICINE)統(tǒng)計學的原理與方法應用于醫(yī)學科研與實踐。,一、醫(yī)學統(tǒng)計學的意義,3統(tǒng)計學方法的特點1用數(shù)量反映質(zhì)量1體格檢查量血壓、脈搏)→個體健康質(zhì)量2)考試分數(shù)→個體學習質(zhì)量3期望壽命反映人群健康狀況的指標4嬰兒死亡率反映衛(wèi)生服務(wù)質(zhì)量的指標,一、醫(yī)學統(tǒng)計學的意義,2用群體歸納個體請同學們回答2002年長沙市7歲男孩有多高,17歲男孩身高有高有矮2N100,平均身高1195CM95的長沙市7歲男孩的身高在11020CM12920CM之間,二、統(tǒng)計學中的幾個基本概念,1、研究單位(觀察單位、UNIT)和變量VARIABLE)、變量值(VALUEOFVARIABLE)(1)、研究單位(UNIT)研究中的個體(INDIVIDUAL),是根據(jù)研究目的確定的。,二、統(tǒng)計學中的幾個基本概念,例如研究7歲男孩身高的正常值范圍一個人研究大學生視力一只眼睛研究水污染情況一毫升水研究細胞變性一個細胞研究肝癌的地區(qū)分布一個地區(qū),二、統(tǒng)計學中的幾個基本概念,(2)變量VARIABLE)研究單位的研究特征。例如研究7歲男孩身高的正常值范圍變量身高(3)變量值(VALUEOFVARIABLE),二、統(tǒng)計學中的幾個基本概念,變量值(VALUEOFVARIABLE)變量的觀察結(jié)果。例如研究7歲男孩身高變量值測得的身高值(1202CM,1186CM,1218CM,研究某人群性別構(gòu)成變量值男、女。,二、統(tǒng)計學中的幾個基本概念,2、同質(zhì)(HOMOGENEITY)和變異(VARIATION)(1)、同質(zhì)(HOMOGENEITY)根據(jù)研究目的給研究單位確定的相同性質(zhì)。研究長沙市2004年7歲男孩身高的正常值范圍同質(zhì)同長沙市、同7歲、同男孩、同無影響身高的疾病。,二、統(tǒng)計學中的幾個基本概念,(2)、變異(VARIATION)變異(VARIATION)同質(zhì)研究單位中變量值間的差異。例如1)長沙市2004年7歲男孩身高有高有矮2)相同的藥方治療相同的疾病的病人,療效有好有壞,二、統(tǒng)計學中的幾個基本概念,3、總體(POPULATION)和樣本(SAMPLE)(1)、總體(POPULATION)是根據(jù)研究目的確定的同質(zhì)研究單位的全體。更確切地說是同質(zhì)研究單位某種變量值的集合。例如調(diào)查某地2002年正常成年男子的紅細胞數(shù)的正常值范圍,二、統(tǒng)計學中的幾個基本概念,研究單位一個人變量紅細胞數(shù)同質(zhì)同某地、同2002年、同成年男子、同正常??傮w1)某地所有的正常成年男子2)某地所有的正常成年男子的紅細胞數(shù),二、統(tǒng)計學中的幾個基本概念,1)有限總體(FINITEPOPULATION)研究單位數(shù)是有限的例如調(diào)查某地2002年正常成年男子的紅細胞數(shù)的正常值范圍2)無限總體(INFINITEPOPULATION)研究單位數(shù)是無限的例如高血壓患者←無時間、空間限制。,二、統(tǒng)計學中的幾個基本概念,(2)樣本(SAMPLE)是總體中抽取的有代表性的一部分。注意隨機抽樣(無主觀性)樣本含量(SAMPLESIZE)樣本中包含的研究單位數(shù)。例如某藥治療高血壓患者30名樣本含量(N)為30,二、統(tǒng)計學中的幾個基本概念,4、參數(shù)(PARAMETER)和統(tǒng)計量(STATISTIC)(1)參數(shù)(PARAMETER)根據(jù)總體個體值統(tǒng)計計算出來的描述總體的特征量。一般用希臘字母表示(2)、統(tǒng)計量(STATISTIC)根據(jù)樣本個體值統(tǒng)計計算出來的描述樣本的特征量。一般用拉丁字母表示,二、統(tǒng)計學中的幾個基本概念,總體參數(shù)一般是不知道的統(tǒng)計學抽樣研究的目的就是樣本統(tǒng)計量→總體參數(shù),二、統(tǒng)計學中的幾個基本概念,5、系統(tǒng)誤差(SYSTEMATICERROR)、非系統(tǒng)誤差(NONSYSTEMATICERROR)、抽樣誤差(SAMPLINGERROR)誤差(ERROR)是指實際觀察值與觀察真值之差、樣本指標與總體指標之差。,二、統(tǒng)計學中的幾個基本概念,(1)、系統(tǒng)誤差(SYSTEMATICERROR)由于儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標準偏高或偏低等原因,使觀察值不是分散在真值兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。例如測量血糖,有斑氏法和葡萄糖氧化法,斑氏法的測量結(jié)果偏高←易受體內(nèi)還原性物質(zhì)的影響。,二、統(tǒng)計學中的幾個基本概念,這類誤差可以通過實驗設(shè)計和技術(shù)措施來消除或使之減少。觀察性研究由于組間不可比性產(chǎn)生的系統(tǒng)誤差稱為偏倚(BIAS),如吸煙組的平均年齡大于吸煙組,兩組死亡率的差異包含年齡偏倚。,二、統(tǒng)計學中的幾個基本概念,(2)、非系統(tǒng)誤差(NONSYSTEMATICERROR)由于研究者偶然失誤而造成的誤差。例如儀器失靈、抄錯數(shù)據(jù)、點錯小數(shù)點、寫錯單位等,亦稱過失誤差(GROSSERROR)這類誤差應當通過認真檢查核對予以清除,否則將會影響研究結(jié)果的準確性。,二、統(tǒng)計學中的幾個基本概念,(3)、抽樣誤差(SAMPLINGERROR)由于抽樣所造成的樣本統(tǒng)計量與總體參數(shù)的差別。例如?1200CMN100N5萬→1186CM特點1不可避免性2有統(tǒng)計規(guī)律性,二、統(tǒng)計學中的幾個基本概念,產(chǎn)生原因個體差異生物變異,二、統(tǒng)計學中的幾個基本概念,6、頻率(RELATIVEFREQUENCY)、概率(PROBABILITY)、小概率事件.(1)、頻率(RELATIVEFREGUENCY)一次隨機試驗有幾種可能結(jié)果,在重復進行試驗時,個別結(jié)果看來是偶然發(fā)生的,但當重復試驗次數(shù)相當多時,將顯現(xiàn)某種規(guī)律性。例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種,現(xiàn)在,我們看一擲幣模擬試驗,二、統(tǒng)計學中的幾個基本概念,實驗者投擲次數(shù)出現(xiàn)“正面”次數(shù)頻率HUPINGCHENG1110000HUPINGCHENG2000000HUPINGCHENG3206667HUPINGCHENG4307500HUPINGCHENG5306000HUPINGCHENG6204000HUPINGCHENG7405714BUFFON4040204805069KPEARSON12000601905016KPEARSON240001201205005,二、統(tǒng)計學中的幾個基本概念,可見,在相同條件下重復試驗,試驗結(jié)果為“正面”或“反面”雖不能事先斷定,但我們知道試驗的所有可能結(jié)果只有兩種。在重復多次后,出現(xiàn)“正面”或“反面”這個結(jié)果的比例稱之為頻率。,二、統(tǒng)計學中的幾個基本概念,.2、概率(PROBABILITY)概率是度量隨機事件發(fā)生可能性大小的一個數(shù)值。設(shè)在相同條件下,獨立地重復N次試驗,隨機事件A出現(xiàn)次,則稱為隨機事件A出現(xiàn)的頻率。當N逐漸增大時,頻率趨向于一個常數(shù),則稱該常數(shù)為隨機事件A的概率,可記為P(A),簡記為。0≤P(A)≤1,二、統(tǒng)計學中的幾個基本概念,0<P(A)<1隨機事件P(A)1必然事件P(A)0不可能事件。,二、統(tǒng)計學中的幾個基本概念,頻率是就樣本而言的,而概率從總體的意義上說的,M/N是概率P(A)的估計值。試驗次數(shù)越多,估計越可靠。,二、統(tǒng)計學中的幾個基本概念,(3)小概率事件統(tǒng)計分析中的很多結(jié)論都基于一定置信程度下的概率推斷,習慣上將稱為小概率事件,我們認為小概率事件在一次試驗中不可能發(fā)生。,二、統(tǒng)計學中的幾個基本概念,湖南風采中獎概率大約為1/671萬交通事故發(fā)生概率為1/20萬,三、統(tǒng)計資料的類型,變量與統(tǒng)計資料的分類方法1概述2數(shù)值變量NUMERICALVARIABLE和計量資料MEASUREMENTDATA3無序分類變量UNORDEREDCATEGORIESVARIABLE和計數(shù)資料ENUMERATIONDATA4有序分類變量ORDINALCATEGORIESVARIABLE和等級資料RANKEDDATA,三、統(tǒng)計資料的類型,1概述數(shù)值變量構(gòu)成計量資料分類變量無序分類變量構(gòu)成計數(shù)資料有序分類變量構(gòu)成等級資料,,,三、統(tǒng)計資料的類型,2數(shù)值變量與計量資料1數(shù)值變量NUMERICALVARIABLE變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如身高CM、體重KG、血壓PA、坐高/身高。2計量資料MEASUREMENTDATA由一群個體的數(shù)值變量值構(gòu)成的資料,即一群變量值。如長沙市99年7歲男孩身高值(1202CM,1186CM,1218CM,三、統(tǒng)計資料的類型,3無序分類變量與計數(shù)資料1無序分類變量UNORDEREDCATEGORIESVARIABLE變量值是定性的,有類別。特點類別是客觀存在的,各類無秩序,可任意排列;類與類之間界限清楚,(理論上不會錯判。如性別男、女。血型O、A、B、AB。2計數(shù)資料ENUMERATIONDATA一群個體按無序分類變量的類別清點每類有多少個個體,即分類個體數(shù)。如衛(wèi)生統(tǒng)計學教研室教師性別構(gòu)成男6,女7。某人群血型構(gòu)成O20A35B30AB10,三、統(tǒng)計資料的類型,4有序分類變量與等級資料1有序分類變量ORDINALCATEGORIESVARIABLE變量值是定性的、分等級。特點等級是主觀劃分的,各級沒有大小但有秩序,必須從低到高或由高到低;級和級之間界限模糊,可能錯判。如療效無效、好轉(zhuǎn)、顯效、治愈。血清反應–、、、2等級資料RANKEDDATA一群個體按有序分類變量的級別清點每級有多少個個體,即分級個體數(shù)。如某地某人群EB病毒抗體反應–65231,四、醫(yī)學統(tǒng)計工作的基本步驟,1、設(shè)計(DESIGN)專業(yè)設(shè)計統(tǒng)計設(shè)計調(diào)查設(shè)計醫(yī)學科研設(shè)計實驗設(shè)計臨床實驗設(shè)計,,,醫(yī)學科研設(shè)計的程序,科研選題選題又叫立題,確定所要研究的問題。選題是科研的起點,也是關(guān)系到成敗的關(guān)鍵。(1)題意產(chǎn)生綜述背景材料來源個人經(jīng)驗的積累;向有關(guān)專家請教;文獻檢索等,專業(yè)設(shè)計,文獻檢索的要點,1)有助于認識本課題的重要性(2)了解有關(guān)的既往研究工作情況(3)了解有關(guān)研究現(xiàn)狀(4)尋找可借鑒的研究方法(5)注意有關(guān)的不同見解與爭論。如與商榷類文章,專業(yè)設(shè)計,文獻檢索的幾種查法,(1)先查國內(nèi)文獻,再查國外文獻(2)先查綜述性文章,后原始文章。(3)先近期后遠期(4)先核心期刊后一般期刊。,專業(yè)設(shè)計,綜述性文章是收集大量文獻資料經(jīng)過分析綜合,結(jié)合自己的工作和體會整理成的文章。它是對某一課題或新進展作出的總結(jié),并指明發(fā)展方向,有較大的參考價值,是專題性文獻資料最集中的表現(xiàn)形式。,專業(yè)設(shè)計,科研選題的原則,(1)創(chuàng)新性包括探索和創(chuàng)新兩個連續(xù)的過程,創(chuàng)新就是選擇前人沒有解決或沒有完全解決的問題。是本學科的空白點,或者將會在理論上或應用上有新的發(fā)展和補充。(2)科學性以科學理論為指導,符合客觀規(guī)律。(3)先進性先進性是相對的,有國際先進和國內(nèi)先進。更重要的是結(jié)合實際條件選擇適合的先進技術(shù)。(4)可行性研究課題的主要技術(shù)指標實現(xiàn)的可能性。它包括人、財、物的支持和工作基礎(chǔ)。,專業(yè)設(shè)計,選題方法,(1)從招標范圍中選題。(2)從碰到的問題中選題(3)從文獻的空白點選題(4)從已有的課題延伸中選題(5)從改變研究內(nèi)容組合中選題(6)從其他學科移植中選題。,專業(yè)設(shè)計,四、醫(yī)學統(tǒng)計工作的基本步驟,統(tǒng)計設(shè)計的內(nèi)容要包括資料的收集、整理和分析全過和的設(shè)想和安排。例如研究目的和假說研究對象和研究單位研究因素(變量)收集哪些原始資料用什么方式和方法取得這些原始資料怎樣整理匯總和計算統(tǒng)計指標如何控制誤差預期會得到什么結(jié)果需要多少經(jīng)費,統(tǒng),統(tǒng)計設(shè)計,四、醫(yī)學統(tǒng)計工作的基本步驟,在研究者對統(tǒng)計設(shè)計的構(gòu)思過程中,有以下幾個問題最為關(guān)鍵如何進行抽樣如何安排設(shè)計所規(guī)定的干預措施或稱處理(TREATMENT)。要達到研究目的應抽取多少個觀察單位如何在諸多的影響因素中,分離出研究同素對結(jié)果的效應,統(tǒng)計設(shè)計,四、醫(yī)學統(tǒng)計工作的基本步驟,(1)、對照的原則對照(CONTROL)原則,即在均衡條件下實現(xiàn)實驗組與對照組間科學對比的原則,它回答如何從諸多影響因素中,分離出研究因素對實驗結(jié)果的效應問題。所謂均衡性,即可比性,是指在對比組中,除研究因素不同外,或施加的處理不同外,其他影響實驗結(jié)果的非研究因素,包括實驗過程中的實驗條件和輔助措施,都應相同。,統(tǒng)計設(shè)計,無對照的研究夸大了門腔分流手術(shù)的作用表12關(guān)于門腔分流手術(shù)的51次研究結(jié)果對照方式門腔分流手術(shù)的價值小計非常支持支持不支持無對照247132非隨機對照103215隨機對照0134合計3411651,統(tǒng)計設(shè)計,,統(tǒng)計學家STUDENT1930年2月至6月主持的牛奶營養(yǎng)試驗的現(xiàn)場觀察研究對照組(1萬兒童)飲奶組(1萬兒童),,對照組飲奶組,年齡(歲),體重(磅),結(jié)論對照組體重>飲奶組,統(tǒng)計設(shè)計,四、醫(yī)學統(tǒng)計工作的基本步驟,(2)、重復(REPETITION)的原則重復(REPETITION)原則,即確定樣本含量的原則,它回答至少應抽取多少個觀察單位的問題。,統(tǒng)計設(shè)計,四、醫(yī)學統(tǒng)計工作的基本步驟,(3)、隨機化(RANDOMIZATION)的原則1)、隨機抽樣(RANDOMIZEDSAMPLING)指總體中的每一個觀察單位都有同等機會進入樣本;2)、隨機分配(RANDOMIZEDALLOCATION)指本次研究所選定的實驗受試對象都有同等機會進入根據(jù)研究目的而設(shè)定的處理組和對照組。,統(tǒng)計設(shè)計,四、醫(yī)學統(tǒng)計工作的基本步驟,2、收集資料(COLLECTIONOFDATA)(1)資料來源第一手資料1)經(jīng)常性統(tǒng)計報表(傳染病報表、職業(yè)病報表、醫(yī)院工作報表、死亡登記、疫情報告等),工作記錄(衛(wèi)生監(jiān)督記錄、健康檢查記錄、病歷等);2)一時性專題調(diào)查、實驗或臨床試驗。第二手資料已公布的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計資料。,四、醫(yī)學統(tǒng)計工作的基本步驟,(2)、資料要求1).完整觀察單位及觀察項目完整。2)準確即真實、可靠。真實是統(tǒng)計學的靈魂。3).及時即時限性。如人口普查規(guī)定調(diào)查開始日期和截止日期。,四、醫(yī)學統(tǒng)計工作的基本步驟,3、整理(SORTINGDATA)資料整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過程。,DATACOLLECTION,DATAANALYSIS,THEISSUESSHOULDBECONCERNEDINDATASCREENING,THEACCURACYOFTHEDATAMISSINGDATAOUTLIERSTHEFITBETWEENYOURDATAANDTHEASSUMPTIONSPERFECTORNEARPERFECTCORRELATIONSAMONGVARIABLES,四、醫(yī)學統(tǒng)計工作的基本步驟,4、分析(ANALYSISOFDATA)資料任務(wù)計算有關(guān)指標,反映數(shù)據(jù)的綜合特征、闡明事物的內(nèi)在聯(lián)系和規(guī)律。工具1)FOXBASE數(shù)據(jù)庫2)SPSSFORWINDOWS1103)SAS,四、醫(yī)學統(tǒng)計工作的基本步驟,統(tǒng)計描述統(tǒng)計分析統(tǒng)計推斷參數(shù)估計假設(shè)檢驗,,,五、學習醫(yī)學統(tǒng)計學應注意的問題,1、醫(yī)學統(tǒng)計學研究的是群體的數(shù)量特征↑適當?shù)慕y(tǒng)計指標2、學會統(tǒng)計學的思維方法抽樣研究→抽樣誤差→結(jié)論具有概率性↑醫(yī)學專業(yè)知識解釋,五、學習醫(yī)學統(tǒng)計學應注意的問題,3、正確選用統(tǒng)計學方法(1)資料類型不同→統(tǒng)計學方法不同(2)設(shè)計類型不同→統(tǒng)計學方法不同(3)研究目的不同→統(tǒng)計學方法不同,五、學習醫(yī)學統(tǒng)計學應注意的問題,4、不管公式來源、推導,只要求了解其意義、用途和應用條件。舉例1)看電視,知道開、關(guān)就行。2)牛吃的是草,擠出來的是牛奶?!鼣?shù)據(jù)結(jié)果,THANKYOU,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 67
      16人已閱讀
      ( 4 星級)
    • 簡介:第十六章LOGISTIC回歸分析,暨南大學醫(yī)學院醫(yī)學統(tǒng)計教研室林漢生,內(nèi)容,LOGISTIC回歸的概念應用舉例預備知識OR值與RR值LOGISTIC回歸對資料的要求模型的建立與變量篩選LOGISTIC回歸分析的結(jié)果表達LOGISTIC回歸應用的注意事項LOGISTIC回歸的應用LOGISTIC回歸的種類LOGISTIC回歸分析資料主要來源,一、LOGISTIC回歸的概念,在醫(yī)學研究中經(jīng)常遇到應變量為二項分類的資料,如治愈與未愈、生存與死亡、發(fā)病與未發(fā)病等,可以概括為陽性與陰性兩種互斥的結(jié)果,同時可能存在對分類結(jié)果發(fā)生概率產(chǎn)生影響的因素即自變量。研究1個二分類觀察結(jié)果與多個影響因素之間關(guān)系的多變量分析方法。,二、應用舉例,探討疾病發(fā)生的危險因素、篩選與疾病預后有關(guān)的因素、綜合多個指標進行診斷試驗,等。如非胰島素依賴型糖尿病的危險因素分析301例急性心肌梗死病人急性期預后因素的LOGISTIC模型分析運動試驗LOGISTIC回歸分析對冠心病的診斷價值,三、預備知識OR值與RR值,預備知識OR值,OR值(ODDSRATIO)比值比或優(yōu)勢比比值(ODDS)是指某事物發(fā)生的概率與不發(fā)生的概率之比。病例組和對照組有暴露史與無暴露史的概率分別為A/AB,B/ABA/BC/CD,D/CDC/DOR(A/B)/(C/D)(AD)/(BC)(76?44)/(10?40)836出生時有窒息缺氧史兒童,發(fā)生低智的危險是對照兒童的836倍(要經(jīng)過假設(shè)檢驗)。,OR值與RR值,RR(RELATIVERISK)暴露人群發(fā)病率P1與非暴露人群發(fā)病率P0之比。當P1和P0都很小時,OR值接近RR值。RR1說明暴露越多,發(fā)病越多,可能是致病因素;RR1說明暴露越少,發(fā)病越少,可能是抑制發(fā)病因素。,四、LOGISTIC回歸對資料的要求,Y取值0,1X1,X2,X3,,XM的取值計數(shù)、計量和等級資料。,五、模型的建立與變量篩選,將回歸效果顯著的自變量選入模型,不顯著的自變量則排除在模型外,使建立的模型比較穩(wěn)定和便于解釋。,,,實習指導例題,例某研究人員在探討腎細胞癌轉(zhuǎn)移的有關(guān)臨床病理因素研究中,收集了一批行根治性腎切除患者的腎癌標本資料,現(xiàn)從中抽取26例資料作為示例進行LOGISTIC回歸分析。,有關(guān)符號意義說明如下,I標本序號X1確診時患者年齡X2腎細胞血管內(nèi)皮生長因子,分3個等級X3腎細胞癌組織內(nèi)微血管數(shù)X4腎癌細胞核組織學分級,分4級X5腎細胞癌分期,分4期Y腎細胞癌轉(zhuǎn)移情況(1轉(zhuǎn)移;0無轉(zhuǎn)移),1SPSS的數(shù)據(jù)工作表,2SPSS的操作步驟ANALYZE?REGRESSION?BINARYLOGISTIC,LOGISTICREGRESSION對話框,將Y選入DEPENDENT欄,X1X5選入COVARIATE欄,選擇FORWARDLR法。單擊OPTIONS按鈕。,OPTIONS對話框,單擊CONTINUE按鈕,單擊OK按鈕,3SPSS的結(jié)果與分析(1)數(shù)據(jù)基本情況,數(shù)據(jù)基本情況為26例納入分析,沒有缺失值,,(2)0步時的分析結(jié)果,,變量篩選第0步的SCORE檢驗結(jié)果,可作為單變量LOGISTIC回歸分析的結(jié)果。如進行單變量LOGISTIC回歸分析,在?005水準,變量X2、X4和X5有統(tǒng)計學意義。,,,,(3)擬合優(yōu)度用決定系數(shù)R2描述,(4)分類表只有1個分錯類,即觀察值為0類,而預測值為1類,Y的觀察值和預測值的符合情況觀測值為0時(腎癌未轉(zhuǎn)移),預測的準確率為941;觀測值為1時(腎癌轉(zhuǎn)移),預測的準確率為1000;總的預測準確率為962。該指標可以評價LOGISTIC模型的擬合優(yōu)度。,(5)模型中的變量,B回歸系數(shù)。當其他變量保持不變時,XJ每增加或減少1個單位時,OR值自然對數(shù)的平均變化量。EXPBOR值(經(jīng)校正的,或調(diào)整的OR值,ADJUSTEDODDSRATIO)SE回歸系數(shù)的標準誤WALD值對回歸系數(shù)進行假設(shè)檢驗的統(tǒng)計量,最重要的結(jié)果,選入模型的變量X2和X4的OR值都大于1,故等級越高,腎癌轉(zhuǎn)移的風險越大。總體OR值的95可信區(qū)間太寬,提示例數(shù)太少??梢詫2和X4的取值代入下式,計算腎癌轉(zhuǎn)移的可能性。判斷的截斷點默認為050,大于050,則預測為腎癌轉(zhuǎn)移(分類表中的結(jié)果)。,(6)未引入模型的變量,沒有引入模型的變量,最小的P值為0197。即使將引入變量的檢驗水準放寬到010,也不能引入新變量。,,多因素LOGISTIC回歸分析結(jié)果,該表可以改進嗎,表1腎細胞癌轉(zhuǎn)移的多因素LOGISTIC回歸分析,表1腎細胞癌轉(zhuǎn)移的多因素LOGISTIC回歸分析,小結(jié),用多因素LOGISTIC回歸分析的似然比前進法篩選變量,引入變量的檢驗水準為?010。在所研究的5個有關(guān)臨床病理因素中,入選模型的因素有2個腎細胞血管內(nèi)皮生長因子表達等級是腎細胞癌轉(zhuǎn)移的危險因素(經(jīng)校正的OR值為1117,95CI為10711645,P0044);腎癌細胞核組織學分級也是腎細胞癌轉(zhuǎn)移的危險因素(經(jīng)校正的OR值為814,95CI為0976862,P0054)。,六、LOGISTIC回歸分析的結(jié)果表達,賦值表單因素分析多因素分析,例162(P339),為了探討冠心病發(fā)生的有關(guān)危險因素,對26例冠心病病人和28例對照者進行病例對照研究,各因素的說明及資料見表。試用LOGISTIC回歸分析方法篩選危險因素。,冠心病危險因素的病例-對照調(diào)查資料,表1冠心病的相關(guān)因素與賦值,(一)相關(guān)因素與賦值,(二)單因素分析,單獨分析每個自變量X與應變量Y是否有關(guān)聯(lián)。檢驗水準可以放寬到010。對單因素有統(tǒng)計學意義的變量,進行多因素LOGISTIC回歸分析。當某個自變量有缺失值時,不影響對其它自變量進行分析。可以分析每個自變量與應變量的關(guān)聯(lián)對自變量進行初步篩選,為多因素分析做準備。當例數(shù)較少,而自變量較多,缺失值較多時,初步篩選更有必要。,單因素分析方法,無序分類資料卡方檢驗有序分類資料卡方檢驗中的線性趨勢檢驗計量資料T檢驗每次引入1個自變量進行LOGISTIC回歸分析(任意類型資料)當缺失值沒有或很少時,逐步多因素LOGISTIC回歸0步時的分析結(jié)果(任意類型資料),1卡方檢驗,Y?COLUMNS,CHISQUARE?卡方檢驗RISK?求OR值或RR值,列聯(lián)表及行百分數(shù),8個變量,例數(shù)54,無缺失值,年齡等級資料;病例組與對照組的年齡構(gòu)成,線性趨勢檢驗年齡與冠心病的發(fā)病呈線性關(guān)系(?2=568,P=0017)等級資料,不能計算OR值,A型性格與冠心病OR2115/13521/13/5/15485,,?2=682,P=0009OR485142,1651,表中的因素都是2分類變量,如果是計量資料,則百分率改為,?2改為T,2每次引入1個自變量進行LOGISTIC回歸分析,OR為485,95CI為142~1651,P0012,SCORE統(tǒng)計量的結(jié)果與卡方檢驗一致WALD統(tǒng)計量的結(jié)果與卡方檢驗很接近,3當缺失值沒有或很少時,逐步多因素LOGISTIC回歸0步時的分析結(jié)果,結(jié)果,沒有缺失值,SCORE統(tǒng)計量的結(jié)果與卡方檢驗一致(無缺失值的情況下),(三)多因素分析,篩選獨立的自變量進入模型例如,動物脂肪攝入和體重指數(shù)在單因素分析都有統(tǒng)計學意義,但多因素分析時,只有動物脂肪攝入這個因素被引入模型。說明動物脂肪攝入與體重指數(shù)可能有聯(lián)系,動物脂肪攝入提供的信息取代了體重指數(shù)。,,多因素LOGISTIC回歸分析結(jié)果,,結(jié)果簡潔清楚,七、LOGISTIC回歸應用的注意事項,危險因素分析時,將計量指標轉(zhuǎn)變?yōu)榈燃壔蚨诸愔笜耍ㄈ缒挲g,腫瘤轉(zhuǎn)移的淋巴結(jié)個數(shù)),使OR值的實際意義明確。無序分類變量的賦值方法啞變量樣本含量經(jīng)驗上,病例和對照的人數(shù)應至少各有30~50例。,SPSS中啞變量的設(shè)置,CATEGORICAL按鈕的使用,例(P352),1352名少年兒童肥胖癥危險因素調(diào)查資料肥胖癥無;有(根據(jù)體重指數(shù)BMI劃分)性別男;女年齡組79歲;1012歲;1315歲;16歲及以上膽固醇低;高甘油三脂低;高,數(shù)據(jù)文件,多因素LOGISTIC回歸分析,年齡的OR值為0782,什么含義,,CROSSTAB肥胖發(fā)生風險并非隨年齡增加而減少。可以7~9歲年齡組為參照,7~9歲年齡組為參照單擊CATEGORICAL,選擇FIRST17~9歲年齡組,單擊CHANGE,單擊CONTINUE,單擊OK,啞變量自動生成FREQUENCY是分層的數(shù)目,總共有64層,其中有7層的例數(shù)為0,,,,,,,結(jié)果解釋,年齡的參照組為7~9歲年齡組1的OR值為253,P=0001。即在校正了其它因素后,10~12歲兒童患肥胖癥的風險是7~9歲兒童的252倍。13~15歲和16歲及以上兒童患肥胖癥的風險與7~9歲兒童比較,差異無統(tǒng)計學意義。性別的OR值為0607(1男性;2女性)甘油三酯的OR值為202(1低;2高),是每個年齡組都是男性肥胖率高于女性嗎,,八、LOGISTIC回歸的應用,篩選疾病預后或發(fā)生的有關(guān)因素診斷模型的建立校正混雜因素如臨床試驗數(shù)據(jù)分析當評價指標為二值變量(有效,無效),非處理因素在試驗組和對照組中分布可能不均衡時??梢岳肔OGISTIC回歸分析得到調(diào)整后的藥物評價結(jié)果。YGROUP年齡病情(0無效;1有效)1常規(guī)療法;2新療法)(不均衡),九、LOGISTIC回歸的種類,非條件LOGISTIC回歸分析簡稱LOGISTIC回歸分析,即前面介紹的內(nèi)容,應用最廣泛。條件LOGISTIC回歸分析為消除混雜因素對研究結(jié)果的影響,對每1例病人選擇1至數(shù)例在混雜因素的暴露水平上相一致的,合乎研究條件的,未患病的人作為對照,共同組成一個匹配組。統(tǒng)計分析按匹配組進行。多項分類LOGISTIC回歸分析有序多分類LOGISTIC回歸分析,十、LOGISTIC回歸分析資料主要來源,回顧性資料(研究開始前病歷等資料已經(jīng)存在,但可能不完整)前瞻性資料(可按設(shè)計要求收集臨床和實驗室數(shù)據(jù))現(xiàn)況研究(橫斷面研究在某一特定人群中,調(diào)查收集特定時間內(nèi)某種疾病的患病情況及其有關(guān)因素)如“醫(yī)學高校知識分子高血壓及相關(guān)危險因素LOGISTIC分析”;“山西省居民高血壓患病情況及危險因素調(diào)查”病例對照研究如“山東省大腸癌影響因素病例對照研究”,“宮頸癌危險因素的病例對照研究”(罕見疾病的病因研究),作業(yè),簡答題P3501,2,3,4,5上機練習實習十八LOGISTIC回歸P339例162,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 77
      17人已閱讀
      ( 4 星級)
    • 簡介:醫(yī)學統(tǒng)計學(7),,兩個獨立樣本比較的非參數(shù)檢驗多個獨立樣本比較的非參數(shù)檢驗配對樣本比較的非參數(shù)檢驗隨機區(qū)組設(shè)計多個樣本比較的非參數(shù)檢驗,診斷試驗ROC曲線分析,基于秩次的非參數(shù)檢驗,非參數(shù)檢驗又稱為任意分布檢驗,這類方法并不依賴總體分布的具體形式,應用時可以不考慮研究變量為何種分布以及分布是否已知,進行的不是參數(shù)之間的檢驗,故稱非參數(shù)檢驗。,基本特點與分布無關(guān)基本方法Χ2檢驗基于秩等級,RANK的方法基于特定參照點(如中位數(shù))的方法,非參數(shù)檢驗的優(yōu)點,①適用范圍廣②受限條件少。參數(shù)檢驗對總體分布等有特別限定,而非參數(shù)檢驗的假定條件少,也不受總體分布的限制,更適合一般的情況。③具有穩(wěn)健性。參數(shù)檢驗是建立在嚴格的假設(shè)條件基礎(chǔ)之上的,一旦不符合假設(shè)條件,其推斷的正確性將受到懷疑;而非參數(shù)檢驗都是帶有最弱的假定,所受的限制很少,穩(wěn)健性好。,①對符合用參數(shù)檢驗的資料,如用非參數(shù)檢驗,會丟失部分信息。②雖然非參數(shù)檢驗計算簡便,但有些問題的計算仍顯繁冗。,非參數(shù)檢驗的缺點,已知總體分布類型,對未知參數(shù)進行統(tǒng)計推斷,,依賴于特定分布類型,比較的是參數(shù),,參數(shù)檢驗(PARAMETRICTEST),非參數(shù)檢驗(NONPARAMETRICTEST),對總體的分布類型不作嚴格要求,,不受分布類型的影響,比較的是總體分布位置,,優(yōu)點方法簡便、易學易用,易于推廣使用、應用范圍廣;可用于參數(shù)檢驗難以處理的資料如等級資料,或含數(shù)值“50MG”等,,缺點方法比較粗糙,對于符合參數(shù)檢驗條件者,采用非參數(shù)檢驗會損失部分信息,其檢驗效能較低;樣本含量較大時,兩者結(jié)論常相同,,應用非參數(shù)檢驗的情況,1不滿足正態(tài)和方差齊性條件的小樣本資料;2總體分布類型不明的小樣本資料;3一端或兩端是不確定數(shù)值(如<0002、>65等)的資料(必選);4單向(雙向)有序列聯(lián)表資料;5各種資料的初步分析。,方法的起點--排隊與秩次,統(tǒng)計描述中排秩思想的成功應用百分位數(shù)、中位數(shù)排隊的優(yōu)點廣泛適用于多種分布排隊的結(jié)果將原始數(shù)據(jù)的比較轉(zhuǎn)化為秩次的比較,秩次RANK將數(shù)值變量值從小到大,或等級變量值從弱到強所排列的序號。例111只大鼠存活天數(shù)存活天數(shù)4,10,7,50,3,15,2,9,13,60,60例29名肺炎病人的治療結(jié)果療效治愈治愈死亡無效治愈有效治愈有效無效,秩次3649281571011105105,平均秩次25259752555255575,秩次129735468,,SPSS中的菜單位置,,兩個獨立樣本比較的非參數(shù)檢驗多個獨立樣本比較的非參數(shù)檢驗配對樣本比較的非參數(shù)檢驗隨機區(qū)組設(shè)計多個樣本比較的非參數(shù)檢驗,診斷試驗ROC曲線分析,基于秩次的非參數(shù)檢驗,1.建立檢驗假設(shè),確定檢驗水準ΑH0兩總體分布相同H1兩總體分布不同Α005。,2.編秩按數(shù)值由小到大排列,若有相同數(shù)據(jù),取平均秩。,分析步驟,基本思想,兩樣本來自同一總體,任一組秩和不應太大或太小,,假定兩組樣本的總體分布形狀相同,T與平均秩和應相差不大,,3.計算秩和,確定檢驗統(tǒng)計量秩和T值,當N110或(N2N1)10時,則可采用正態(tài)近似法求U(Z)值來確定P值,其公式如下,4.確定P值和作出推斷結(jié)論當N1146,PΑT在界值范圍外P3或NI5時,H值的分布近似于自由度為K1的Χ2分布,此時可查Χ2界值表得到P值。最后按P值作出推斷結(jié)論。,分析步驟,【例3】比較小白鼠接種三種不同菌型傷寒桿菌9D、11C和DSC1后存活日數(shù),結(jié)果見表。問小白鼠接種三種不同菌型傷寒桿菌的存活日數(shù)有無差別,P1CDFCHISQ997,2,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步非參數(shù)檢驗,,第四步結(jié)果解讀,結(jié)果解讀X29940,P0007,,,【例4】四種疾病患者痰液內(nèi)嗜酸性白細胞的檢查結(jié)果見表。問四種疾病患者痰液內(nèi)的嗜酸性白細胞有無差別,P1CDFCHISQ1552,3,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步加權(quán)個案,第四步非參數(shù)檢驗,,第五步結(jié)果解讀,結(jié)果解讀X215506,P0001,,,【例5】某臨床藥理基地觀察5組接受不同治療的婦科病人,結(jié)果見表。問5組療效有無差別,P1CDFCHISQ19550,4,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步加權(quán)個案,第四步非參數(shù)檢驗,,第五步結(jié)果解讀,結(jié)果解讀X2195504,P0000,,,,兩個獨立樣本比較的非參數(shù)檢驗多個獨立樣本比較的非參數(shù)檢驗配對樣本比較的非參數(shù)檢驗隨機區(qū)組設(shè)計多個樣本比較的非參數(shù)檢驗,診斷試驗ROC曲線分析,基于秩次的非參數(shù)檢驗,配對設(shè)計差值比較的符號秩和檢驗由WILCOXON1945年提出,又稱WILCOXON符號秩和檢驗,常用于檢驗差值的總體中位數(shù)是否等于零。,(1)建立檢驗假設(shè),確定檢驗水準HO差值總體中位數(shù)MD0H1差值總體中位數(shù)MD≠0Α005,分析步驟,(2)編秩求差值編秩方法依差值的絕對值從小到大編秩。編秩時注意兩點遇差值為0者,舍去不計,N相應減少差值的絕對值相等,符號不同者應取平均秩次編秩后,按差值的正負給秩次冠上符號。,(3)求差值為正或負的秩和差值為正的秩和以T表示差值為負的秩和以T表示。TTNN1/2TMIN(T,T)(4)確定P值和作出推斷結(jié)論當N≤50時,查T界值表T在界值范圍內(nèi)PΑT在界值范圍外P50,可采用正態(tài)近似法,計算U值。,正態(tài)近似法,若相同秩次較多,應作校正計算。Z或式中,TJ為第J(J1,2,)個相同差值的個數(shù)。,正態(tài)近似法,【例6】對10名患者分別用甲法與乙法,測得血汞值。問兩種方法的結(jié)果有無差別,,N1019,TMIN265,185185N9P005,,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步非參數(shù)檢驗(1),第三步非參數(shù)檢驗(2),第四步結(jié)果解讀(1),結(jié)果解讀例數(shù)、均數(shù)、標準差、中位數(shù)、四分位間距等。標準差較大,第四步結(jié)果解讀(2),結(jié)果解讀Z0474,P0635,,,【例7】對12份血清分別用原方法(檢測時間20分鐘)和新方法(檢測時間10分鐘)測谷丙轉(zhuǎn)氨酶,結(jié)果見表。問兩法所得結(jié)果有無差別,,,TMIN545,115115N11P005,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步非參數(shù)檢驗(1),第三步非參數(shù)檢驗(2),第四步結(jié)果解讀(1),結(jié)果解讀例數(shù)、均數(shù)、標準差、中位數(shù)、四分位間距等。標準差較大,第四步結(jié)果解讀(2),結(jié)果解讀Z1913,P0056,,,,兩個獨立樣本比較的非參數(shù)檢驗多個獨立樣本比較的非參數(shù)檢驗配對樣本比較的非參數(shù)檢驗隨機區(qū)組設(shè)計多個樣本比較的非參數(shù)檢驗,診斷試驗ROC曲線分析,基于秩次的非參數(shù)檢驗,隨機區(qū)組設(shè)計資料比較,如果觀察結(jié)果不滿足方差分析條件,可用FRIEDMAN檢驗(FRIEDMANTEST)。,1建立檢驗假設(shè)和確定檢驗水準2編秩先在每一配伍組內(nèi)將數(shù)據(jù)從小到大編秩,如有相同數(shù)據(jù),取平均秩次;再求各處理組秩和RI,I1,2,,G。,分析步驟,3計算檢驗統(tǒng)計量M值(1)查表法N≤15,G≤15MΣ(RJR)2(RΣRJ/G)M界值表基于Χ2分布近似法得到Χ2值查有關(guān)的Χ2界值表(2)Χ2分布近似法,分析步驟,,自由度為(G1),當各區(qū)組間出現(xiàn)相同秩次時,需進行校正,校正公式為,,,B為區(qū)組個數(shù),K為處理組個數(shù),4.確定P值和作出推斷結(jié)論,【例8】8名受試對象在相同實驗條件下分別接受4種不同頻率聲音的刺激,他們的反應率()資料見表。問4種頻率聲音刺激的反應率是否有差別,,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步非參數(shù)檢驗(1),第三步非參數(shù)檢驗(2),第四步結(jié)果解讀(1),結(jié)果解讀例數(shù)、均數(shù)、標準差、中位數(shù)、四分位間距等。,第四步結(jié)果解讀(2),結(jié)果解讀X215152,P0002,,,一個討論案例,【例9】某中醫(yī)醫(yī)院采用中西醫(yī)結(jié)合方法治療228例不同病情的腦卒中患者,療效情況如下表。,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步加權(quán)個案,1、不同病情的腦卒中患者,療效有無差別,第三步秩和檢驗,,第四步結(jié)果解讀,結(jié)果解讀X224319,P0000,,,2、腦卒中患者病情與療效有無相關(guān),第三步等級相關(guān)分析,,,第四步結(jié)果解讀,結(jié)果解讀RS0311,P0000,,3、腦卒中患者病情與療效變化趨勢如何,第三步線性趨勢檢驗(1),第三步線性趨勢檢驗(2),輸出4種卡方檢驗結(jié)果1、PEARSON卡方2、卡方值的校正值3、似然比卡方,一般用于對數(shù)線性模型。4、FISHER的精確檢驗,,線性趨勢檢驗,第四步結(jié)果解讀,結(jié)果解讀X221797,P0000,,線性趨勢檢驗,計量資料線性回歸等級有序資料線性趨勢檢驗基本原則將X2值進行分解,將總變異分為線性回歸分量和偏離線性回歸分量。,,,總變異,線性回歸分量,,兩個獨立樣本比較的非參數(shù)檢驗多個獨立樣本比較的非參數(shù)檢驗配對樣本比較的非參數(shù)檢驗隨機區(qū)組設(shè)計多個樣本比較的非參數(shù)檢驗,診斷試驗ROC曲線分析,基于秩次的非參數(shù)檢驗,診斷試驗的概念,評價某種疾病診斷方法的臨床試驗。診斷試驗的用途診斷疾病篩選無癥狀的病人判斷疾病的嚴重程度估計疾病臨床過程及預后估計對治療的反應判斷治療效果,,,金標準,目標人群,,病人,非病人,,,,,,,,,,,,,,,待評價診斷方法,,,,,評價指標,診斷試驗原理,+,-,+,-,確定金標準,當前醫(yī)學界公認的診斷某疾病最可靠、準確度最高的診斷方法。常用的金標準包括病理學診斷(活檢、尸檢)外科手術(shù)或診斷性操作特殊的影像學診斷權(quán)威機構(gòu)頒布的綜合診斷標準,選擇研究對象,要求代表性好、盲法試驗組經(jīng)金標準確診為某疾病的患者,具有反應該疾病的全部特征,如病情、病程、癥狀體征、并發(fā)癥、治療或未治療等。對照組經(jīng)金標準證實未患該疾病的患者(可患其它疾病)或正常人。,診斷試驗結(jié)果表,診斷試驗的評價指標,基本指標靈敏度、特異度、誤診率、漏診率預測值陽性預測值、陰性預測值綜合評價指標正確率、約登指數(shù)、優(yōu)勢比、似然比陽性似然比、陰性似然比,靈敏度(SENSITIVITY,SE)計算公式SEA/AC又稱真陽性率將實際有病的人正確判斷為患者的能力漏診率(OMISSIONDIAGNOSTIC,?)計算公式?C/AC又稱假陰性率將實際有病的人錯誤判斷為非患者的比例,高靈敏度試驗的適用范圍漏診可能造成嚴重后果排除某病的其他診斷篩檢無癥狀病人而且該病發(fā)病率較低,特異度(SPECIFICITY,SP)計算公式SPD/BD又稱真陰性率將實際無病的人正確判斷為非患者的能力誤診率(MISTAKEDIAGNOSTICRATE,?)計算公式?B/BD又稱假陽性率將實際無病的人錯誤判斷為患者的比例,高特異度試驗的適用范圍假陽性會使病人受到嚴重危害確診某病,靈敏度和特異度的關(guān)系,都是反映診斷試驗準確性的最基本指標提高一方面水平,會降低另一方面水平一般選擇敏感度和特異度都較高的試驗作為診斷依據(jù)根據(jù)研究目的,調(diào)整靈敏度和特異度來確定臨界值以產(chǎn)生漏診和誤診之和最小時的數(shù)據(jù)確定臨界值,ROC曲線評價方法,受試者工作特征曲線(RECEIVEROPERATORCHARACTERISTICCURVE,簡稱ROC曲線)表示一個特定的診斷方法對區(qū)別特定的患者組與非患者組樣本的檢測性能。表示不同診斷水平的真陽性率對假陽性率的函數(shù)關(guān)系。,受試者工作特征曲線RECEIVEROPERATINGCHARACTERISTICCURVE,ROC,1080604020020406081,,,,,,,,,,,,,,,,完全無價值的診斷試驗其ROC曲線與機會線重合,而ROC曲線越偏離機會線,ROC曲線下面積就越大,則診斷試驗的真實性也就越好。,ROC曲線評價方法,以靈敏度和假陽性率為兩個軸的取值作的圖性;通常用于測定值為連續(xù)或等級數(shù)據(jù);常用于確定最佳臨界值,也可用于比較兩種和兩種以上診斷試驗的診斷價值。以試驗靈敏度為Y軸,以假陽性率為X軸,由不同決策界值產(chǎn)生圖中各個點,采用線段連接圖中所有的點,繪制而成的線圖。圖中反映了隨著靈敏度的增加,假陽性率也隨之增加。,ROC曲線的特點,綜合了靈敏度和特異度兩個指標;不受患病率的影響;考慮了所有可能的診斷臨界值的影響;全面客觀地評價診斷試驗的準確性;描述了診斷試驗區(qū)分事件發(fā)生與不發(fā)生的固有能力。,ROC曲線下的面積,AREAUNDERCURVE,簡稱AUC以點0,0、1,0、0、1和1,1圍成的面積做為1或100%。ROC曲線和X軸圍成的面積占總面積的百分比作為曲線面積的估計值。ROC曲線下面積的取值在0~1之間。,曲線越接近左上角,面積越接近1,說明試驗的準確度越高;越接近對角線,越接近05,則說明試驗的準確度越差;一般認為面積在05~07之間時診斷價值較低,在07~09之間時診斷價值中等,在09以上時診斷價值較高。,ROC曲線下的面積,最佳診斷界值的確定,ROC曲線上最靠近左上角的點所對應的靈敏度和特異度都是較大的,該點為ROC曲線的正切線與曲線相交的點,常以此點所對應的診斷界值作為最佳診斷界值。靈敏度特異度最大的點就是最佳診斷界值。通過解擬合ROC曲線的方程尋找該點。,,A.理想的正常人群與糖尿病病人血糖水平分布B.現(xiàn)實的正常人群與糖尿病病人血糖水平分布,采用不同血糖陽性界值所致假陽性和假陰性,,病人與非病人某項診斷指標數(shù)值分布示意圖,,ROC分析,ROC分析主要做三件事計算ROC曲線下面積及其95CI繪制ROC曲線圖尋找截斷點(CUTOFF),【例10】為評價紅細胞平均容積(MCV)對缺鐵性貧血患者的診斷價值,以100例可疑為缺鐵性貧血患者作診斷,并以骨髓診斷作為金標準。將金標準確診為缺鐵性貧血的34例作為病例組,其余66例作為對照組。然后對每組的每一例測量紅細胞平均容積(MCV)。,SPSS軟件操作,第一步建立變量。,第二步輸入原始數(shù)據(jù),第三步ROC分析(1),,,,第四步初步結(jié)果,第五步ROC分析(2),,第六步結(jié)果解讀(1),結(jié)果解讀基本的例數(shù)描述,第六步結(jié)果解讀(2),結(jié)果解讀ROC曲線圖,第六步結(jié)果解讀(3),結(jié)果解讀ROC曲線下面積大小及統(tǒng)計學意義,,,,ROC曲線下面積的臨床意義,小于07,表示診斷準確度較低;0709,表示診斷準確度為中等;大于09,表示診斷準確度較高。,第六步結(jié)果解讀(4),結(jié)果解讀給出不同截斷點的靈敏度和1特異度大小。,截斷點(CUTOFF)的選擇,在該截斷點下作的診斷誤診率與漏診率之和為最??;或靈敏度與特異度之和最大。,第七步尋找截斷點(1),將SPSS結(jié)果復制到EXCEL中,,第七步尋找截斷點(2),利用EXCEL的函數(shù)功能進行計算(靈敏度特異度)的值,,第七步尋找截斷點(3),按照(靈敏度特異度)由大到小排序,,第七步尋找截斷點(4),按照(靈敏度特異度)由大到小排序。(靈敏度特異度)值最大的點所對應的MCV結(jié)果值就是截斷點值。本例815就是所要找的截斷點。,,兩條ROC曲線的比較,可信區(qū)間法計算兩條曲線AUC的可信區(qū)間如果兩個可信區(qū)間有重合部分,則表示兩種方法診斷價值的差異無統(tǒng)計學意義;反之則AUC值大的那種方法的價值更高。,謝謝,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 155
      5人已閱讀
      ( 4 星級)
    • 簡介:醫(yī)學統(tǒng)計學(11),META分析,第二部分,,生存分析,第一部分,,,,生存分析,第一部分,在醫(yī)學研究中,常常用追蹤的方式來研究事物發(fā)展的規(guī)律。如了解某藥物的療效,了解手術(shù)的存活時間,了解某醫(yī)療儀器設(shè)備使用壽命等等。,生存資料的特點,1包含有結(jié)局和時間兩個方面的信息。2結(jié)局資料一般為二分類資料,即結(jié)局是兩對立相互排斥的事件,如生存與死亡、有效與無效等。3生存資料一般需經(jīng)過前瞻性隨訪觀察才能獲得,隨訪往往從某統(tǒng)一的時點開始,到某規(guī)定的時點結(jié)束,所以生存資料有時也稱為隨訪資料。4由于失訪等原因使一些研究對象的生存時間難判斷,導致部分生存時間數(shù)據(jù)不完整。,生存資料的數(shù)據(jù)類型,按觀察對象生存時間的完整性可分為兩種類型。1完全數(shù)據(jù)指觀察起點到發(fā)生結(jié)局事件的時間明確、完整的資料,即具有明確完整生存時間的數(shù)據(jù)。2截尾數(shù)據(jù)指由于其他因素非研究因素導致觀察對象的生存時間難以明確判斷,這種生存時間數(shù)據(jù)稱為截尾數(shù)據(jù)。也稱為截尾值、刪失值或終檢值。不論截尾數(shù)據(jù)的產(chǎn)生原因為何,截尾生存時間的計算均為觀察起點至截尾點所經(jīng)歷的時間,而且一般情況下其準確的生存時間要長于截尾時間,常在此類數(shù)據(jù)的右上角標記“”。,生存分析基本概念,起始事件是反映生存時間起始特征的事件,如疾病確診、某種疾病治療開始、接觸毒物等。在生存分析隨防研究過程中,一部分研究對象可觀察到死亡,可以得到準確的生存時間,它提供的信息是完全;這種事件稱為失效事件,也稱之為死亡事件、終點事件。,生存時間(SURVIVALTIME是指任何兩個有聯(lián)系事件之間的時間間隔,常用T表示。狹義的生存時間指患某疾病的病人從發(fā)病到死亡所經(jīng)歷的時間跨度,廣義的生存時間定義為從某種起始事件到終點事件所經(jīng)歷的時間跨度。,如急性白血病病人從治療開始到復發(fā)為止之間的緩解期,冠心病病人兩次發(fā)作之間的時間間隔,戒煙開始到重新吸煙之間的時間間隔,接觸危險因素到發(fā)病的時間間隔等。生存分析中最基本的問題就是計算生存時間,要明確規(guī)定事件的起點、終點及時間的測度單位,否則就無法分析比較。,中位生存時間是指壽命中位數(shù),表示有且只有50的觀察對象還可以活這么長時間。由于截尾數(shù)據(jù)的存在,中位生存期的計算不同于普通的中位數(shù),它可以利用生存函數(shù)公式或生存曲線圖,令生存率為50時,推算出生存時間。,生存函數(shù)生存概率又稱為生存率或生存函數(shù),它表示一個病人的生存時間長于時間T的概率,用ST表示。以時間T為橫坐標,ST為縱坐標所作的曲線稱為生存率曲線,它是一條下降的曲線,下降的坡度越陡,表示生存率越低或生存時間越短,其斜率表示死亡速率。,死亡函數(shù)表示死亡速率的大小。如以T為橫坐,F(xiàn)T為縱坐標作出的曲線稱為密度曲線,由曲線上可看出不同時間的死亡速率及死亡高峰時間??v坐標越大,其死亡速率越高,如曲線呈現(xiàn)單調(diào)下降,則死亡速率越來越小,如呈現(xiàn)峰值,則為死亡高峰。,生存分析的主要內(nèi)容1描述生存過程(估計生存函數(shù))2比較生存過程(比較生存函數(shù))3影響生存時間的因素分析,SPSS中的菜單位置,生存率的估計方法有參數(shù)法和非參數(shù)法。常用非參數(shù)法,非參數(shù)法主要有二個,即乘積極限法與壽命表法。乘積極限法,又稱KAPLANMEIER法,主要用于觀察例數(shù)較少(N1,危險因素X4為緩解出院后的鞏固治療(0無,1有),RR|T|95CONFINTERVALSLOPE|4270146286694149019730995581163985BIAS|0547229947982006095623821432491589,META分析,,系統(tǒng)綜述和META分析的基本概念系統(tǒng)綜述的基本步驟介紹META分析,軟件操作REVMAN,REVMAN軟件是COCHRANE國際協(xié)作網(wǎng)制作和保存COCHRANE系統(tǒng)評價的一個程序,由北歐COCHRANE中心制作和更新,是COCHRANE系統(tǒng)評價的一體化、標準化軟件。該軟件的主要特點可制作和保存COCHRANE系統(tǒng)評價的計劃書和全文;可對錄入的數(shù)據(jù)進行META分析并將森林圖的分析結(jié)果以圖表形式展示;可對COCHRANE系統(tǒng)評價進行更新。,HTTP//IMSCOCHRANEORG/REVMAN/DOWNLOAD,,也可以在OA上下載安裝后使用,,賬號密碼,1熟悉界面(1),,1熟悉界面(2),,,干預評價,,診斷試驗評價,,方法學評價,,同類系統(tǒng)評價,,1熟悉界面(3),1熟悉界面(3),菜單欄,工具欄,文章結(jié)構(gòu),正文,,摘要,,,概要,語言更通俗,可供免費下載,,背景和目的,,研究方法,,研究結(jié)果,,討論,2撰寫正文標題,,2撰寫正文作者,,雙擊,1若已經(jīng)注冊,則登錄ARCHIE作者數(shù)據(jù)庫調(diào)出信息;2還沒注冊,則手動輸入信息,2撰寫正文作者,,,2撰寫正文時間,2撰寫正文摘要、方法、結(jié)果、討論,3從NE數(shù)據(jù)庫中導出文獻,,4導入文獻到REVMAN,,4導入文獻到REVMAN,,,,,4畫流程圖,,,4畫流程圖,5META分析1,,,5META分析1,5META分析2,,二分類變量RR/OR/HR/RD,,,,期望方差法,一般倒方差法,連續(xù)型變量加權(quán)均數(shù)WMD、標準化均差SMD,5META分析2,,,,分類資料,小概率事件、實驗組和對照組樣本量嚴重不平衡,分類資料,較為穩(wěn)健,應用廣泛,,連續(xù)型變量資料,,,5META分析3,,,,,,5META分析4,,,5META分析5,,LOWORUNCLEARRISK,HIGHRISK,,5META分析5,,,,5META分析5,,,5META分析5,5META分析5,,,,5META分析5,5META分析5,,,,,謝謝,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 178
      4人已閱讀
      ( 4 星級)
    • 簡介:MEDICALSTATISTICS醫(yī)學統(tǒng)計學,童新元中國人民解放軍總醫(yī)院2005年10月12日,供臨床醫(yī)學碩士研究生教學用,面對復雜的醫(yī)學問題怎樣處理,“當人類科學探索者在問題的叢林中遇到難以逾越的障礙時,唯有統(tǒng)計工具可為其開辟一條前進的通道”。英國著名遺傳學家GALTON18221911,為何開設(shè)醫(yī)學統(tǒng)計課,講課的內(nèi)容,統(tǒng)計學學科發(fā)展概論醫(yī)學統(tǒng)計學課程按排醫(yī)學統(tǒng)計學學習方法醫(yī)學統(tǒng)計學基礎(chǔ)知識,一、統(tǒng)計學概論漫談”統(tǒng)計”,1什么是統(tǒng)計,日常生活中,我們常聽到很多關(guān)于“統(tǒng)計”的詞匯例如國家統(tǒng)計局公布,2004年全國GDP增長9國家氣象局預報,明天北京天氣陰,降水概率40,報刊統(tǒng)計信息文摘,2003年,北京市人平壽命7793歲,嬰兒死亡率為556‰,兒童計劃免疫接種率98這些主要健康指標已接近或超過中等發(fā)達國家的水平北京日報京報網(wǎng),2003年11月20,常遇見的統(tǒng)計問題,癌癥病人不做手術(shù)或做術(shù)后能生存多久新藥的用量、用法如何,療效怎樣判定吸煙對人類的危害到底多大我考取醫(yī)學研究生的機會多大考試合格的可能性多大,典型統(tǒng)計案例1,,時間2004年11月2日,總統(tǒng)大選中的統(tǒng)計學從2004年美國總統(tǒng)大選談“統(tǒng)計”,總統(tǒng)大選記事,2004年總統(tǒng)角逐已作為一場耗時最長、花錢最多的總統(tǒng)選戰(zhàn)而載入歷史。,時間從9月30日至11月2日費用50億美元,誰會當總統(tǒng),主要候選人共和黨布什,民主黨克里和獨立候選人納德爾,誰當總統(tǒng)由選民投票決定參加投票選民12億,在投票前很多人和集團想知道,誰會當總統(tǒng),以便支持誰,民調(diào)許多公司在選舉開始前進行調(diào)查,“民調(diào)”有多準,在美國總統(tǒng)大選中,決定民調(diào)可靠程度的關(guān)鍵是抽樣調(diào)查的人數(shù)和對象。,在美國一個可靠的全國性調(diào)查將對1000名至3000名可能投票的選民進行調(diào)查,抽樣誤差不超過3。,,2004年美國總統(tǒng)大選,CNN的選民信息是采取科學的統(tǒng)計抽樣方法,深入全國每一個縣(州取得。盡量保證統(tǒng)計模型與真實情況吻合。,2004年美國總統(tǒng)大選三人角逐2004年10月31日,選舉最后結(jié)果,候選人選舉人票百分比布什286票53克里252票47,大選中四種主要人物,候選人總統(tǒng)與副總統(tǒng)合格選民參加投票新聞記者文字描寫與推測統(tǒng)計學家數(shù)據(jù)管理與分析,大選及民調(diào)中的統(tǒng)計學問題,一、統(tǒng)計設(shè)計總體與樣本、樣本的大小怎樣抽樣、抽樣誤差二、數(shù)據(jù)管理和質(zhì)量控制如何搜集數(shù)據(jù)、整理數(shù)據(jù)、系統(tǒng)誤差、過失誤差、質(zhì)量控制方法三、數(shù)據(jù)分析數(shù)據(jù)描述(投票率)、統(tǒng)計推斷、決策(大選的有效性、誰勝誰負),現(xiàn)代社會中,大到國家重大政策的制定,小到人們的日常生活,幾乎都離不開統(tǒng)計學提供的信息。,,統(tǒng)計學的知識已滲透到自然科學、社會科學以及人類生活的各個領(lǐng)域。,(2)三類現(xiàn)象,自然界和人類社會活動中,普遍存在三類現(xiàn)象。確定性現(xiàn)象在相同的條件下出現(xiàn)相同的結(jié)果,稱為確定性現(xiàn)象或必然現(xiàn)象。如自由落體。隨機性現(xiàn)象在相同的條件下出現(xiàn)不同的結(jié)果,但結(jié)果是確定的,稱為隨機性現(xiàn)象。如擲硬幣。模糊性現(xiàn)象在相同的條件下出現(xiàn)不確定的結(jié)果,稱為模糊性現(xiàn)象。如美人與丑人。,不同現(xiàn)象與研究方法,現(xiàn)象研究方法確定性現(xiàn)象---經(jīng)典數(shù)學隨機性現(xiàn)象---概率統(tǒng)計學模糊性現(xiàn)象---模糊數(shù)學,(3)什么是統(tǒng)計學,統(tǒng)計學的英語單詞是STATISTICS,來源于STATE,即指政府,官方所要求的信息。統(tǒng)計學是研究隨機現(xiàn)象規(guī)律性的方法學。統(tǒng)計學是一門關(guān)于如何收集、分析、解釋和表達數(shù)據(jù)的科學。WEBSTER’SINTERNATIONALDICTIONARY,統(tǒng)計學是“對令人困惑費解的問題做出數(shù)字設(shè)想的藝術(shù)?!泵绹鳧AVIDFREEDMAN統(tǒng)計學是一門處理數(shù)據(jù)中變異性的科學和藝術(shù)。JOHNMLASTADICTIONARYOFEPIDEMIOLOGY,(4)常見的統(tǒng)計學試驗,奧運會比賽中,各項球運動誰先開球,體操、跳水運動員出場的順序怎樣決定的,經(jīng)典統(tǒng)計試驗擲硬幣、抽簽、骰子,,為什么采用這樣“統(tǒng)計試驗”方式?jīng)Q定呢,“公正、公平、公開”,自由經(jīng)濟或市場經(jīng)濟社會倡導的三公原則其內(nèi)部蘊藏著統(tǒng)計學的思想。體育彩票、球足彩票、福利彩票、抽獎等博彩活動中,都運用了統(tǒng)計學的知識。“由賭局引的一門學問,居然會為人類知最重要的研究對象,這實在令人非常驚奇。”法國數(shù)學家LAPLACE17451827,在現(xiàn)實生活中,經(jīng)常會遇到各種不確定性的問題,人們常常憑直覺和經(jīng)驗來處理問題。直覺,經(jīng)驗對于人們的審美生活、觀察研究很重要。,(5)直覺經(jīng)驗與統(tǒng)計,直覺與統(tǒng)計,1某商場調(diào)查100名顧客,詢問她們對A,B,C三種化妝品的喜好,結(jié)果如下有2/3的顧客喜歡A而不喜歡B,有2/3的顧客喜歡B而不喜歡C問是否喜歡A而不喜歡選C的最多,,A對B不對,這個問題來源于著名的阿諾悖論,肯尼思阿諾由此證明,一個十全十美的民主選舉系統(tǒng)是不可能實現(xiàn)的,1972年獲諾貝爾經(jīng)濟學獎,直覺與統(tǒng)計,2一家有兩個小孩,問已知一個是女孩,另一個也女孩的可能性多大,A1/2B1/3C1/4D1/5,直覺與統(tǒng)計,3一個班有100同學,問至少有兩個同學生日相同的可能性多大,A5B50C95D99,,直覺雖重要,但有時直覺會產(chǎn)生錯覺。直覺經(jīng)驗≠規(guī)律進行科學研究活動時,需要直覺來發(fā)現(xiàn)問題,產(chǎn)生靈感,但必須采用科學的方法進行實驗,經(jīng)過嚴格的驗證后,才能得出事物內(nèi)在的客觀規(guī)律。,6統(tǒng)計學的應用,統(tǒng)計學的理論是隨著人類社會生產(chǎn)的需要而產(chǎn)生,同時也隨著人類社會生產(chǎn)的發(fā)展而更新,特別是近二十年來,統(tǒng)計學的理論方法和應用方面得到迅速的發(fā)展。統(tǒng)計學與各個專業(yè)結(jié)合形成數(shù)十個學科分支,如人口統(tǒng)計學、心理統(tǒng)計學、遺傳統(tǒng)計學、社會統(tǒng)計學、經(jīng)濟統(tǒng)計學、衛(wèi)生統(tǒng)計學、醫(yī)學統(tǒng)計學、生物統(tǒng)計學等。,第2節(jié),醫(yī)學統(tǒng)計學是統(tǒng)計學與醫(yī)學結(jié)合形成的一門學科,是統(tǒng)計學在醫(yī)學中的應用。衛(wèi)生部定為醫(yī)學專業(yè)碩士研究生必修課。生物統(tǒng)計學是統(tǒng)計與生物醫(yī)學結(jié)合形成的一門學科,(7)統(tǒng)計學的重要性,1983年12月8日第六屆全國人民代表大會常務(wù)委員會第三次會議通過了中華人民共和國統(tǒng)計法。對發(fā)揮統(tǒng)計信息、咨詢、監(jiān)督的作用提供了重要的法律保障,對發(fā)展我國統(tǒng)計事業(yè)具有重要意義和作用。1998年9月國家教育部頒布的普通高等學校本科專業(yè)目錄和專業(yè)介紹將統(tǒng)計學列為理學類一級學科。,,2001年,中國國家教育部為推進基礎(chǔ)教育改革而推出新課程標準,將統(tǒng)計學納入新的小學數(shù)學課程。要求小學生要“經(jīng)歷運用數(shù)據(jù)描述信息、作出推理的過程,發(fā)展統(tǒng)計觀念”。法國政府已將統(tǒng)計學列入二十一世紀影響法國社會發(fā)展的十個重大領(lǐng)域之一。,據(jù)調(diào)查,新英格蘭醫(yī)學雜志(NEWENGLANDJMEDICAL)、美國醫(yī)學雜志(JAMA、英國醫(yī)學雜志(BRITISHJMEDICAL)和LANCETT等著名醫(yī)學雜志發(fā)表的文章中,有70應用了統(tǒng)計學,而且雜志有統(tǒng)計學的常務(wù)編審。一些著名醫(yī)科大學和醫(yī)院中,要求碩士和博士畢業(yè)論文的開題報告有統(tǒng)計方面的思考和統(tǒng)計學家參加,畢業(yè)論文答辯前要求請統(tǒng)計學家進行審閱。,“統(tǒng)計學是現(xiàn)代醫(yī)學大廈的一個重要支柱”。美國醫(yī)學會雜志(JAMA)主編,(8)醫(yī)學統(tǒng)計學發(fā)展簡史,19世紀初,現(xiàn)代科學思想和科學方法在醫(yī)學研究中的應用初見端倪。代表性人物法國醫(yī)生PCALOUIS。典型統(tǒng)計案例2代表性研究“放血”療法治療肺炎的效果,,1835年,LOUIS對當時流行的“放血”療法治療肺炎的效果進行了比較發(fā)現(xiàn)“放血”的療效不象預期的那么好。而且早期“放血”和晚期“放血”組比較,患者的診斷、病情、病程、年齡等方面的差異很大,比較平均治愈時間意義不大。因為晚期“放血”組的平均治愈時間長,但該組患者病情重、病程長、年齡大。,,LOUIS的研究雖然沒有徹底否定“放血”療法,使在西方延續(xù)了2000余年的“放血”療法一直持續(xù)到20世紀初。但他對醫(yī)學研究的方法學作出了很大貢獻用數(shù)字的方法表示疾病的特征和預后;提出了臨床療效對比的前瞻性原則;提出抽樣誤差和混雜(CONFOUNDING)概念。其中前瞻性研究和減少混雜,分別成為當今臨床試驗和流行病學研究的基本研究方法。,世界第一部醫(yī)學統(tǒng)計學教科書,在著名法國數(shù)字家SDPOISSON(17811840)的學生JGAVARRET的協(xié)助下,LOUIS的數(shù)字方法發(fā)展為“概率框架”,GAVARRET于1840年在巴黎出版了世界第一部醫(yī)學統(tǒng)計學教科書。,現(xiàn)代生物統(tǒng)計的產(chǎn)生,20世紀20年代,英國統(tǒng)計學家RAFISHER爵士(18901962)在倫敦附近的ROTHAMSTED農(nóng)業(yè)實驗站,創(chuàng)立了實驗設(shè)計方法和統(tǒng)計分析技術(shù),奠定現(xiàn)代生物統(tǒng)計的基礎(chǔ)。1948年,英國發(fā)表了評價鏈霉素治療肺結(jié)核療效的隨機對照臨床試驗報告,第一次采用生物統(tǒng)計方法進行臨床干預試驗。,我國第一部醫(yī)學統(tǒng)計的教科書,生物統(tǒng)計方法在我國醫(yī)學界的傳播與運用也始于20世紀初。1945年,郭祖超教授(19121999)編著的醫(yī)學與生物統(tǒng)計方法,是我國第一部醫(yī)學統(tǒng)計方法的教科書?,F(xiàn)在醫(yī)學統(tǒng)計的教科書很多,但適合臨床醫(yī)學的比較少。,二、醫(yī)學統(tǒng)計學課程按排與要求,課程名<醫(yī)學統(tǒng)計學>碩士研究生必修課授課單位解放軍總醫(yī)院醫(yī)學統(tǒng)計教研室授課教員童新元、張高魁醫(yī)學統(tǒng)計教研室簡介承擔任務(wù)教學碩士必修課碩士選修課博士必修課以及統(tǒng)計學思想的普及和統(tǒng)計培訓工作咨詢醫(yī)學及科研工作者的統(tǒng)計咨詢科研醫(yī)學統(tǒng)計學專業(yè)的研究地點301醫(yī)院門診樓740#電話937716,授課課時共33次課128學時其中大課講授18次課72學時)上機12次課48學時)復習1次課4學時)考試2次課8學時)授課學分3學分授課時間2005年10月12日至2006年1月19日授課地點科學文化中心實習地點計算機中心三層實習教室,(1)教師授課說明,大課講授18次課72學時統(tǒng)計方法典型統(tǒng)計案例,目的講授醫(yī)學統(tǒng)計學的基本理論“三基”“基本概念、基本原理和方法”培養(yǎng)統(tǒng)計思維與邏輯思維的能力培養(yǎng)討論、跨學科交流協(xié)作的精神,(2)計算機上機實習說明,共12次課(48學時)分4批進行每個同學上機6次,每次15小時分批由老師與班長商定上機嚴格按批按座位進行。,目的統(tǒng)計理論與實驗相結(jié)合為科研和畢業(yè)論文提供分析工具,(3)考試說明,考試分兩部分筆試考試閉卷50分上機考試開卷50分,目的檢驗醫(yī)學統(tǒng)計學掌握的程度檢驗醫(yī)學統(tǒng)計學的教學效果,2004級碩士醫(yī)學統(tǒng)計學成績情況,2004級碩士醫(yī)學統(tǒng)計學成績講評,考試70分以上合格,85分以上方能提前轉(zhuǎn)博優(yōu)秀率37,合格率967人不極格4,下一年重學一次進行補考其中4人因有兩門不及格退學,(4)教學期間要求,遵守軍隊和醫(yī)院的規(guī)章制度,遵守課堂紀律。特別提示如下嚴禁上課接打手機;嚴禁計算機實習時做與統(tǒng)計無關(guān)的其它事;嚴禁遲到和早退,有事須向授課教師報告。教學過程中若發(fā)現(xiàn)問題,請及時同教研室聯(lián)系聯(lián)系電話937716,三、醫(yī)學統(tǒng)計學學習方法,,發(fā)現(xiàn)不少醫(yī)務(wù)工作者曾多次學習統(tǒng)計學課程,但仍然對統(tǒng)計學知識理解很模糊。有的學員統(tǒng)計知識學習成績很好,但是遇到很簡單的實際問題也不會解決。,怎樣學好醫(yī)學統(tǒng)計學,思想觀念學習方法學習時間,(1)思想觀念,統(tǒng)計學不神秘,不可怕,不難學好,統(tǒng)計學既很有用,也很有趣。熱愛是最好的老師,歷史上很多非統(tǒng)計專業(yè)人員,通過對統(tǒng)計學的學習和研究,在專業(yè)和統(tǒng)計學取得有很深的造詣。物理學家愛因斯坦學習和研究統(tǒng)計,將統(tǒng)計學思想應用于他的物理學和哲學研究中。生物學家達爾文學習和研究統(tǒng)計,進化論方面的工作在本質(zhì)而言是屬于生物統(tǒng)計學。護理學的奠基人NIGHTINGALE學習和研究統(tǒng)計,出版世界上第一部醫(yī)院統(tǒng)計的專著醫(yī)院統(tǒng)計與醫(yī)院規(guī)劃。,(2)學習方法,2重視典型案例的系統(tǒng)學習,重點掌握“三基”“基本概念、基本原理和方法”不需要記公式和公式推導,3重視理論與實踐上機實習相結(jié)合,,(3)學習時間,必須花足夠的時間認真學習建議授課與自學時間比例13,四統(tǒng)計學基礎(chǔ)知識,,(1)統(tǒng)計學的基本內(nèi)容,一、試驗設(shè)計二、數(shù)據(jù)管理和質(zhì)量控制三、數(shù)據(jù)分析,2同質(zhì)和變異,同質(zhì)(HOMOGENEITY)就是性質(zhì)相同,它是進行統(tǒng)計分析的前提變異研究對象之間的差異,3總體、個體與樣本,總體(POPULATION)是根據(jù)研究目的性質(zhì)相同的所有觀察單位集合個體(INDIVIDUAL)是總體中的基本觀察單位(OBSERVATIONUNIT),可以是一個人、一個動物、一個家庭、一個地區(qū)、一份樣品等,樣本SAMPLE是從總體中隨機抽取的部分觀察單位的集合。,4統(tǒng)計量和參數(shù),統(tǒng)計量(STATISTIC)是反映樣本特征的數(shù)量參數(shù)(PARAMETER)是反映總體特征的數(shù)量,5頻率和概率,頻率的定義在N次相同試驗中,事件A發(fā)生的次數(shù)占試驗總數(shù)的比例,稱為事件A發(fā)生的頻率(FREQUENCY),記為F。頻率的大小反映了事件A發(fā)生的頻繁程度,頻率大,則事件A發(fā)生就頻繁,這意味著A在一次試驗中發(fā)生的可能性就大。,,概率(PROBABILITY)是隨機事件發(fā)生可能性大小的度量,簡記為P。試求,擲一個硬幣出現(xiàn)正面的概率為多少擲一個骰子出現(xiàn)小于5的概率為多少,概率的計算,擲一個硬幣出現(xiàn)正面的概率為1/2擲一個骰子出現(xiàn)小于5的概率為4/6實際應用中,很多事件的概率P是很難得到的,如某癌癥的發(fā)病率,頻率與概率的關(guān)系,拋擲硬幣的試驗,試驗結(jié)果如下表,━━━━━━━━━━━━━━━━━━━━━試驗者拋擲次數(shù)N出現(xiàn)正面次數(shù)K頻率K/N─────────────────────TONGXY5408010303020703530110374016040502104210052052━━━━━━━━━━━━━━━━━━━━━━,歷史上許多名家做過拋擲硬幣的試驗,拋擲硬幣試驗結(jié)果如表,━━━━━━━━━━━━━━━━━━━━━試驗者拋擲次數(shù)N出現(xiàn)正面次數(shù)K頻率K/N─────────────────────DEMORGAN2,0481,0610518BUFFON4,0402,04805069PEARSON12,0006,01905016PEARSON24,00012,01205005━━━━━━━━━━━━━━━━━━━━━,大量實事表明,并可以證明若當試驗次數(shù)N充分大以后,頻率K/N穩(wěn)定地在概率P的附近擺動。,實際工作中,可用頻率作為概率的近似值PA≈FAK/N,頻率與概率的關(guān)系,6隨機變量及其概率分布,隨機變量出現(xiàn)變異性的量稱為隨機變量,簡稱為變量。例如,用X表示擲硬幣出現(xiàn)的結(jié)果,1表示出現(xiàn)正面,0表示出現(xiàn)反面。X稱為隨機變量1,0稱為變量X的取值。,拋擲硬幣的試驗,試驗結(jié)果的概率分布,━━━━━━━━━━━━━━━━━━━━━變量X01─────────────────────概率PX0505━━━━━━━━━━━━━━━━━━━━━,概率分布一個隨機變量的所有取值與其出現(xiàn)概率的排列稱為變量的概率分布例如,,拋擲兩個骰子的試驗,試驗結(jié)果的概率分布,━━━━━━━━━━━━━━━━━━━━━概率PX─────────────────────X2345......━━━━━━━━━━━━━━━━━━━━━,思考題拋擲兩個骰子的隨機試驗中,試問1)其和可能的結(jié)果有多少種2)哪種可能性最小,哪種可能性最大3)列出試驗結(jié)果的概率分布表.,統(tǒng)計課堂教學形式,提倡獨立思考與自由討論,交流,信息交流,1、教師信息發(fā)布,網(wǎng)址HTTP//WEBMAIL301HOSPITALCOMCN。共公郵箱STATEDU301HOSPITALCOMCN,秘碼STAT網(wǎng)址HTTP//MAILCHISSCN共公郵箱STATCHISSCN,秘碼STAT2、問題咨詢發(fā)給STATDEPT301HOSPITALCOMCN,TONGXYCHISSCN兩個信箱。3、網(wǎng)上討論HTTP//WWWCHISSCN奇思論壇生物醫(yī)學與統(tǒng)計欄進行統(tǒng)計學交流和討論。,謝謝,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 74
      4人已閱讀
      ( 4 星級)
    • 簡介:中醫(yī)藥統(tǒng)計學,第一章緒論,引子概率應用示例,隨機50個人聚在一起,其中有兩個人生日是同一天的概率在97以上,幾乎可以說50個人中一定有兩個人是同一天的生日。神奇吧計算如下,統(tǒng)計應用示例,李穎同學的中醫(yī)基礎(chǔ)理論與傷寒論成績分別為87分與80分,李穎同學所在班的這兩門課程的平均成績分別為80分和65分,標準差分別為7分和10分。那么,在班里,李穎同學擅長中醫(yī)基礎(chǔ)理論還是傷寒論的學習標準正態(tài)分布下,,李穎同學在班里中醫(yī)基礎(chǔ)理論成績排在前16,傷寒論成績排在前7,可見李穎同學比較擅長傷寒論的學習。耐人尋味吧,醫(yī)藥統(tǒng)計應用示例,小兒麻痹癥在沒有研制出疫苗之前是一種癱瘓或死亡率很高的疾病。在疫苗人體試驗的過程中,科學家隨機抽取了400000名兒童并隨機分成兩組,試驗組注射疫苗,對照組注射安慰劑。結(jié)果發(fā)現(xiàn)試驗組和對照組分別有56、138名兒童患上該病。56與138的差別是由隨機抽樣造成的,還是由疫苗的免疫作用所致的統(tǒng)計推斷分析結(jié)論是二者的差別超出了隨機性本身所能解釋的范圍,疫苗有效。從此以后,這種疫苗普遍接種,在許多國家根除了小兒麻痹癥。這是統(tǒng)計學為醫(yī)學研究提供有力支持的代表實例之一。,,脊髓灰質(zhì)炎病毒是引起脊髓灰質(zhì)炎的病毒。該疾病傳播廣泛,是一種急性傳染病。病毒常侵犯中樞神經(jīng)系統(tǒng),損害脊髓前角運動神經(jīng)細胞,導致肢體松弛性麻痹,多見于兒童,故又名小兒麻痹癥。,,統(tǒng)計思維總有一天會像讀與寫一樣成為一個有效率公民的必備能力。至理名言HGWELLS赫伯特喬治威爾斯HERBERTGEORGEWELLS18661946,英國著名小說家,尤以科幻小說創(chuàng)作聞名于世。1895年出版時間機器一舉成名,隨后又發(fā)表了莫洛博士島、隱身人、星際戰(zhàn)爭等多部科幻小說。謹與同學們共享共勉,第一節(jié)概述,中醫(yī)藥統(tǒng)計學的概念統(tǒng)計學的發(fā)展簡史統(tǒng)計學的研究對象中醫(yī)藥統(tǒng)計學的主要內(nèi)容統(tǒng)計學的特點和基本思想,三類現(xiàn)象,,數(shù)學研究方法,,,,統(tǒng)計學STATISTICS,是研究隨機現(xiàn)象數(shù)量規(guī)律性的應用數(shù)學,是從隨機現(xiàn)象數(shù)據(jù)中提取信息、知識的一門科學與藝術(shù),是一門方法性學科。它分為理論統(tǒng)計學和應用統(tǒng)計學兩大類。,理論統(tǒng)計學THEORETICALSTATISTICS,即數(shù)理統(tǒng)計學MATHEMATICALSTATISTICS,是以概率論為基礎(chǔ),從純理論的角度,對統(tǒng)計方法加以推導論證,中心的內(nèi)容是統(tǒng)計推斷問題,實質(zhì)是以歸納方法研究隨機現(xiàn)象的一般規(guī)律。,應用統(tǒng)計學APPLIEDSTATISTICS,是數(shù)理統(tǒng)計學的原理方法在不同學科領(lǐng)域的具體應用。數(shù)理統(tǒng)計學在生物學中的應用形成了生物統(tǒng)計學BIOSTATISTICS;在醫(yī)學中的應用形成醫(yī)學統(tǒng)計學(MEDICALSTATISTICS、衛(wèi)生統(tǒng)計學HEALTHSTATISTICS和中醫(yī)藥統(tǒng)計學STATISTICSFORTRADITIONALCHINESEMEDICINE等。,中醫(yī)藥統(tǒng)計學(STATISTICSFORTRADITIONALCHINESEMEDICINE,是研究中醫(yī)藥領(lǐng)域中隨機現(xiàn)象客觀規(guī)律的一門方法性學科,它運用數(shù)理統(tǒng)計學的基本原理與方法,結(jié)合醫(yī)藥實際,闡述中醫(yī)藥領(lǐng)域研究設(shè)計、收集資料、整理資料、分析資料、結(jié)果報告與結(jié)論表達。它屬于應用統(tǒng)計學,是醫(yī)藥科學研究的重要工具與手段。,,,統(tǒng)計學的發(fā)展簡史,人類實踐是統(tǒng)計學產(chǎn)生的源泉,人類認識是統(tǒng)計學發(fā)展的動力。遠古時代,人類利用手指、石子、貝殼、小木棍以及繩索等工具進行的計數(shù)活動就蘊藏著統(tǒng)計萌芽,但是,人類由統(tǒng)計實踐上升到統(tǒng)計學,卻只有300多年的歷史。,,17世紀中葉至18世紀初期為古典統(tǒng)計學的發(fā)展時期。統(tǒng)計學一詞源于STATE,統(tǒng)計學意指國家國情的敘述,其研究方法主要采用文字記述和形式邏輯比較法,用于人口、國力等情況的統(tǒng)計和分析。,,18世紀后葉至20世紀初期為近代統(tǒng)計學的發(fā)展時期。誤差理論和大數(shù)法則得到了應用和發(fā)展,其研究方法主要是建立在大樣本上的大量觀察法,重視運用統(tǒng)計指標和統(tǒng)計圖表對數(shù)字資料進行統(tǒng)計描述。,,20世紀初期至今為現(xiàn)代統(tǒng)計學的發(fā)展時期。1908年,英國統(tǒng)計學家戈賽特(WSGOSSET,18761937)在生物統(tǒng)計雜志“BIOMETRIKA”上以筆名STUDENT發(fā)表了T分布,開創(chuàng)了小樣本的研究,從而使統(tǒng)計學由“描述統(tǒng)計”向“推斷統(tǒng)計”發(fā)展,開創(chuàng)了現(xiàn)代統(tǒng)計學的新紀元。20世紀50年代,電子計算機技術(shù)的發(fā)展和應用,促進了統(tǒng)計方法的應用與發(fā)展。,,當今,現(xiàn)代統(tǒng)計學的發(fā)展有如下幾個明顯趨勢隨著數(shù)學的發(fā)展,統(tǒng)計學依賴和吸收的數(shù)學方法越來越多;統(tǒng)計方法與計算機技術(shù)相結(jié)合,已滲透到了所有學科部門,以統(tǒng)計學為基礎(chǔ)的邊緣學科不斷形成;統(tǒng)計與實質(zhì)性學科(如社會、經(jīng)濟、生物、醫(yī)學等)、統(tǒng)計軟件、現(xiàn)代信息相結(jié)合,所發(fā)揮的功效日益增強;統(tǒng)計學的作用與功能已從描述事物現(xiàn)狀、反映事物規(guī)律,向抽樣推斷、預測未來變化方向發(fā)展,已成為具有方法論性質(zhì)的綜合性學科。,統(tǒng)計學的研究對象,統(tǒng)計學所研究的對象是具有變異的事物,其變異為同質(zhì)基礎(chǔ)上的變異。同質(zhì)(HOMOGENEITY)指觀察單位間被研究指標的影響因素相同。(可控因素)變異(VARIATION)指在同質(zhì)基礎(chǔ)上各觀察單位間某觀察指標的差異。統(tǒng)計學是處理變異數(shù)據(jù)的科學,沒有變異就無需統(tǒng)計學。,,醫(yī)藥事物(現(xiàn)象)大多數(shù)都是具有變異的事物(現(xiàn)象),概率論稱具有變異的事物(現(xiàn)象)為隨機事件。中醫(yī)藥統(tǒng)計學可將醫(yī)藥隨機事件通過一定數(shù)量的觀察、對比、分析與推斷,由偶然性(不確定性)現(xiàn)象的剖析,發(fā)現(xiàn)事物內(nèi)在的必然性(確定性)規(guī)律。,中醫(yī)藥統(tǒng)計學的主要內(nèi)容,中醫(yī)藥統(tǒng)計學以研究統(tǒng)計設(shè)計和統(tǒng)計方法為主要內(nèi)容。研究統(tǒng)計設(shè)計實驗設(shè)計、臨床試驗設(shè)計以及調(diào)查設(shè)計等統(tǒng)計方法包括統(tǒng)計描述、統(tǒng)計推斷和關(guān)系分析等。,統(tǒng)計學的特點和基本思想,統(tǒng)計學認識事物現(xiàn)象有如下特點數(shù)量性、群體性、具體性和概率性等。統(tǒng)計學的基本思想可歸納為變異、隨機抽樣研究和概率的思想。統(tǒng)計結(jié)論中沒有“證明”,只有在一定概率水平上的推論。,第二節(jié)統(tǒng)計學幾個基本概念,總體與樣本參數(shù)與統(tǒng)計量誤差概率,總體與樣本,總體(POPULATION)是根據(jù)研究目的所確定的同質(zhì)觀察單位的全體。有限總體與無限總體樣本(SAMPLE)是從總體中隨機抽取的具有代表性的個體的集合。抽樣研究(SAMPLINGSTUDY)是從總體中抽取樣本,通過對樣本的定量或定性測量結(jié)果來推斷總體。,,抽樣研究的目的是用樣本的特征正確可靠地推斷總體的特征,所以樣本必須對總體具有良好的代表性,抽樣研究應注意如下幾點樣本含量足夠大遵循隨機抽樣原則樣本的構(gòu)成分布應基本上與總體構(gòu)成分布保持一致,參數(shù)與統(tǒng)計量,反映總體的統(tǒng)計指標稱為參數(shù)(PARAMETER),用希臘字母表示,如反映樣本的統(tǒng)計指標稱為統(tǒng)計量STATISTICS,用拉丁字母或英文字母表示,如,,對某一事物而言,總體參數(shù)是該事物本身固有的、不變的,而統(tǒng)計量則隨著實驗不同而不同,但統(tǒng)計量的分布是有規(guī)律的,如小樣本均數(shù)服從T分布,大樣本均數(shù)服從正態(tài)分布等,這些規(guī)律是統(tǒng)計推斷的理論基礎(chǔ)。,誤差,誤差(ERROR)泛指觀測值與真實值之差以及樣本統(tǒng)計量與總體參數(shù)之差。主要分為非隨機誤差與隨機誤差,非隨機誤差包括系統(tǒng)誤差和過失誤差,隨機誤差包括隨機測量誤差和隨機抽樣誤差。,,系統(tǒng)誤差(SYSTEMATICERROR)是指在實際觀測過程中,由受試對象、研究者、儀器設(shè)備、研究方法、非實驗因素影響等原因造成的有一定傾向性或規(guī)律性的誤差。如儀器初始狀態(tài)未調(diào)整到零、標準試劑未經(jīng)校正所致誤差。其特點為觀察值有系統(tǒng)性、方向性、周期性的偏離真值。這類錯誤可以通過嚴格的實驗設(shè)計和技術(shù)措施消除。,,過失誤差(GROSSERROR)由于觀察過程中不仔細造成的錯誤判斷或記錄。應認真檢查核對,否則將會影響研究結(jié)果的準確性。,,隨機測量誤差(RANDOMMEASUREMENTERROR)是指各種偶然因素(如電壓、環(huán)境溫度等)的影響造成對同一對象多次測定的結(jié)果不完全一樣,或同一樣品不同觀察者之間的差異。該誤差不可避免,但要控制在容許范圍內(nèi)。提高操作者熟練程度可以減少這種誤差。,,隨機抽樣誤差(RANDOMSAMPLINGERROR)簡稱抽樣誤差(SAMPLINGERROR),是由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數(shù)間的差異以及各樣本統(tǒng)計量之間的差異。醫(yī)學現(xiàn)象的變異總是客觀存在的,因而在抽樣研究中,抽樣誤差總是不可避免的,它雖無方向性,但有一定的分布規(guī)律,是可估計、可控制的,其大小可通過計算標準誤間接地反映出來。樣本對總體的代表性越好,抽樣誤差越小,反之,抽樣誤差越大。抽樣誤差揭示樣本距總體的實際值可能有多遠。,準確度、精確度、效度、信度,,,,概率,頻率(FREQUENCY)概率(PROBABILITY)在概率論上稱頻率收斂于概率。概率是反映隨機事件發(fā)生的可能性大小的度量,用P表示,取值范圍為0,1。隨機事件的概率為01;必然事件的概率等于1;不可能事件的概率等于0。,,統(tǒng)計學通常把等于小于005或001的隨機事件稱為小概率事件。(人為規(guī)定)一般認為小概率事件在一次試驗中是不大可能發(fā)生的,這就是小概率原理,它是統(tǒng)計推斷的重要原理。,第三節(jié)資料類型,數(shù)值資料分類資料相互轉(zhuǎn)換,,資料(DATA)又稱數(shù)據(jù),由變量及其變量值組成。資料類型與變量類型相對應。變量(VARIABLE)是指觀察單位的某種特征或?qū)傩裕囱芯康捻椖炕蛑笜?。變量的測定結(jié)果稱為變量值(VALUEOFVARIABLE)或觀察值(OBSERVEDVALUE)。,,數(shù)值資料(NUMERICALDATA)又稱定量資料(QUANTITATIVEDATA)或計量資料(MEASUREMENTDATA),是由儀器、工具或其它定量方法測定的某項指標量的大小所得到的資料。例如測量100名男大學生的身高所獲得的資料就是數(shù)值資料。,,分類資料(CATEGORICALDATA)又稱定性資料QUALITATIVEDATA或計數(shù)資料(COUNTDATA),是將事物按不同的屬性歸類,清點每一類的數(shù)量多少所得到的資料。根據(jù)類別數(shù)的不同,計數(shù)資料分為二分類資料(BINARYDATA)、無序多分類資料(UNORDEREDCATEGORICALDATA)和有序多分類資料(ORDEREDCATEGORICALDATA),后者也稱等級資料。例如將100名大學生按性別分組男53例,女47例,此資料就是二分類資料;按ABO血型分組A型39例、B型20例、O型17例、AB型24例,此資料就是無序多分類資料。,,等級資料ORDINALDATA又稱半定量資料(SEMIQUANTITATIVEDATA)或有序多分類資料(ORDEREDCATEGORICALDATA),是將事物屬性按組別之間有程度或等級差別進行歸類所得到的資料。例如用某中藥治療某種疾病患者50名,按臨床療效等級分為痊愈26例、顯效12例、好轉(zhuǎn)7例、無效5例,此資料就為等級資料或有序多分類資料。,,根據(jù)分析的需要,各種資料可進行相互轉(zhuǎn)化??蓪?shù)值資料轉(zhuǎn)化為分類資料或等級資料,反過來,分類資料和等級資料可通過數(shù)字編碼或賦值,即數(shù)值化方式,轉(zhuǎn)化為數(shù)值資料。需要注意的是數(shù)值資料變?yōu)榉诸愘Y料或等級資料時信息量將減少,因此在收集數(shù)據(jù)階段應盡量收集數(shù)值數(shù)據(jù),并用原始數(shù)值資料建立數(shù)據(jù)集。,,連續(xù)型隨機變量是指在某一區(qū)間可取任何值的變量,如身高(CM)、體重(KG)、血壓(KPA)等;離散型隨機變量是指在某一區(qū)間只可取有限的幾個值的變量如家庭人口數(shù)、脈搏(次/分)等。數(shù)值資料對應的數(shù)值變量可以是連續(xù)型隨機變量,也可以是離散型隨機變量;分類資料和等級資料對應的分類變量和等級變量只能是離散型隨機變量。,,無序多分類變量又稱名義變量(NOMINALVARIABLE),意指各種被命好的分類,在各種分類中沒有隱含的順序,這與等級變量不同。但是,等級變量中各分類之間的差異不能被認為是相等的。,第四節(jié)基本步驟,研究設(shè)計收集資料整理資料分析資料結(jié)果報告與結(jié)論表達,第四節(jié)基本步驟,醫(yī)藥研究中的統(tǒng)計工作步驟包括研究設(shè)計、收集資料、整理資料、分析資料、結(jié)果報告與結(jié)論表達等。這幾個步驟是密切聯(lián)系不可分割的,任何一個環(huán)節(jié)發(fā)生缺陷都會影響研究結(jié)果的質(zhì)量和認證。,研究設(shè)計,研究設(shè)計(RESEARCHDESIGN)就是擬訂一份合理的實驗計劃,將有關(guān)的研究方法與步驟的綱目擬訂出來,用以保證取得一個較為客觀的研究結(jié)果。根據(jù)對研究對象是否施加干預措施,可將研究分為觀察研究和實驗研究兩大類。,,專業(yè)設(shè)計SPECIALIZEDDESIGN是指用什么方式、方法驗證假說或回答有關(guān)專業(yè)問題。目的在于保證成果的實用性、可行性和創(chuàng)新性。做好專業(yè)設(shè)計一般需要具有過硬的專業(yè)知識、較強的查閱文獻能力和善于多學科交流與合作的能力。,,統(tǒng)計設(shè)計STATISTICALDESIGN是指如何合理地安排實驗內(nèi)容,選擇實驗對象,計算樣本含量,對實驗結(jié)果進行有效的分析。目的在于保證結(jié)果的經(jīng)濟性、重復性、可靠性和科學性。實驗統(tǒng)計設(shè)計,應遵循隨機、對照、重復和均衡四個基本原則。臨床試驗研究還要遵從盲法的原則。,,研究者一定要樹立“設(shè)計優(yōu)先”的思想,只有縝密完善的研究設(shè)計,才能獲得真實可靠的研究結(jié)果。中醫(yī)藥統(tǒng)計學用于醫(yī)藥科學研究,應從研究設(shè)計階段開始,而不是在需要數(shù)據(jù)處理時。實驗完成后再找統(tǒng)計學家無異于請統(tǒng)計學家為實驗進行“尸體解剖”,統(tǒng)計學家或許只能告訴你失敗的原因。,收集資料,收集資料DATACOLLECTION是指根據(jù)研究目的,按照設(shè)計要求去準確、及時和完整地收集原始資料。醫(yī)藥研究資料來源大致有日常醫(yī)療工作記錄和報告卡,統(tǒng)計報表,專題調(diào)查與實驗或試驗研究資料,公共或共享的其它資料。,,收集資料的過程實際上是具體調(diào)查或?qū)嶒瀸嵤┑倪^程,要有科學的態(tài)度,實事求是的精神,如實收集資料,并應用通用或共享的數(shù)據(jù)庫軟件(如EXCEL,ACCESS,SQL,EPIDATA等)將收集到的資料及時建立電子數(shù)據(jù)庫。,整理資料,整理資料SORTINGDATA是把收集到的原始資料,有目的、有計劃地進行科學的加工(如分組或匯總),使其系統(tǒng)化、條理化,以便更好地揭示所研究事物的規(guī)律性,有利于統(tǒng)計分析。整理資料包括資料核查和設(shè)計分組與匯總等。首先檢查原始記錄,及時糾錯補漏;其次是標記可疑值,必要時對可疑值重新觀測。根據(jù)資料的性質(zhì)或數(shù)量特征,對資料進行分組,需要時按不同組段對原始資料進行歸納計數(shù)。,分析資料,分析資料(ANALYSISDATA)就是對資料進行統(tǒng)計分析。主要包括統(tǒng)計描述STATISTICALDESCRIPTION與統(tǒng)計推斷STATISTICALINFERENCE。統(tǒng)計描述是指用適合資料性質(zhì)的統(tǒng)計指標、統(tǒng)計圖表等,對資料的數(shù)量特征及其分布規(guī)律進行表達,以反映變量值的水平、頻率、聯(lián)系強度。統(tǒng)計推斷是通過抽樣研究,根據(jù)樣本資料所提供的信息,對未知總體做出具有一定概率性的估計和推斷,它包括參數(shù)估計和假設(shè)檢驗兩方面。,結(jié)果報告與結(jié)論表達,信息時代,醫(yī)藥科研設(shè)計、資料數(shù)據(jù)庫的建立與管理、統(tǒng)計分析的大多數(shù)任務(wù)可以交給計算機完成,正確領(lǐng)悟統(tǒng)計思想以及統(tǒng)計軟件所輸出的結(jié)果,并在研究報告和論文中作出適當?shù)慕忉屌c表達顯得越來越重要。,,統(tǒng)計學既是一門科學又是一門藝術(shù),其藝術(shù)性是通過表達來體現(xiàn)的。醫(yī)學研究性論文主要由摘要、引言、材料與方法、結(jié)果和討論5個部分組成,而每一部分或多或少都涉及統(tǒng)計表達,需要明確指出所使用的統(tǒng)計設(shè)計與分析方法,觀察對象的納入與剔除標準,是否隨機抽樣與隨機分組,使用的何種統(tǒng)計軟件及其版本,樣本統(tǒng)計量、總體參數(shù)可信區(qū)間,檢驗統(tǒng)計量、值,并結(jié)合各學科專業(yè)知識對統(tǒng)計分析結(jié)果作出合理的解釋,進而得出可信賴的專業(yè)結(jié)論。另外,可借助統(tǒng)計圖表直觀、形象表達統(tǒng)計結(jié)果。統(tǒng)計結(jié)果的規(guī)范化報告和結(jié)論的正確表達,能提高研究的認證度,也便于各層次的學術(shù)交流與研究。,第五節(jié)作用與學習方法,中醫(yī)藥統(tǒng)計學的作用學習方法,中醫(yī)藥統(tǒng)計學的作用,醫(yī)學統(tǒng)計學是醫(yī)學科學研究的重要工具與手段,為醫(yī)學科學研究提供統(tǒng)計思維、統(tǒng)計設(shè)計和統(tǒng)計分析方法。其思維和方法已滲透到醫(yī)藥研究和管理決策的方方面面。,,①中醫(yī)學基礎(chǔ)研究氣、血、營、衛(wèi)的研究,經(jīng)絡(luò)的研究指標的選擇與比較,證指標的客觀化。②臨床方面臨床經(jīng)驗的總結(jié),藥物的配伍和最佳劑量等用藥規(guī)律的探索,各種致病因素對某疾病的影響程度比較分析。③新藥的開發(fā)研制動物實驗、有效成分確定、質(zhì)量標準制定、工藝篩選等。我國藥品注冊管理辦法規(guī)定,新藥臨床試驗必須自始至終有統(tǒng)計學人員參與,生物醫(yī)藥實驗室研究、臨床研究、流行病學探索和醫(yī)藥公共事業(yè)管理均需統(tǒng)計學的支持。④在醫(yī)藥雜志上發(fā)表科研論文涉及數(shù)據(jù)分析都需要統(tǒng)計學處理。醫(yī)藥領(lǐng)域的抽樣研究數(shù)據(jù)不經(jīng)過統(tǒng)計學分析處理而得出的結(jié)論是不科學的,是不可信的。,,醫(yī)學統(tǒng)計學的全部功能僅在于幫助我們認識醫(yī)學研究客觀上存在的規(guī)律而不能“創(chuàng)造”規(guī)律。重視原始資料的完整性和準確性,對數(shù)據(jù)處理持嚴肅、認真、實事求是的科學態(tài)度,反對偽造和篡改統(tǒng)計數(shù)據(jù),要防止利用統(tǒng)計軟件進行資料分析“垃圾進,垃圾出”的現(xiàn)象發(fā)生。,學習方法,醫(yī)學生學習中醫(yī)藥統(tǒng)計學的目的并非要使自己成為統(tǒng)計專業(yè)人員,而是使自己樹立統(tǒng)計思想,學會統(tǒng)計思維,從不確定性和概率的角度去考慮問題,能結(jié)合醫(yī)學問題合理設(shè)計,認真觀察,準確收集資料,有效整理資料,正確運用統(tǒng)計方法分析資料,恰如其分解釋統(tǒng)計結(jié)果,得出可信賴的結(jié)論,寫出具有一定學術(shù)水平的研究報告或科學論文,從而提高自身科學素養(yǎng)和研究能力。,,,,在學習中醫(yī)藥統(tǒng)計學的過程中,醫(yī)學生要重視對統(tǒng)計基本概念、基本原理、基本方法的理解,對統(tǒng)計公式主要了解其意義、用途和應用條件,不必深究其數(shù)學推導,也不需要死記硬背。,,統(tǒng)計工作貫穿醫(yī)學研究的全過程,要本著“設(shè)計優(yōu)先”的原則,弄清資料來自何種統(tǒng)計設(shè)計,資料的屬性是什么,是否滿足參數(shù)檢驗的條件,用何種統(tǒng)計方法分析比較適宜等。要理論聯(lián)系實際,重視理論學習與上機練習的有機統(tǒng)一。總之思想重視、觀念正確、方法得當,兩個堅持(認真聽課、及時上機實驗練習。),學以致用就能學好本課程。,小結(jié),,
      下載積分: 6 賞幣
      上傳時間:2024-01-05
      頁數(shù): 68
      3人已閱讀
      ( 4 星級)
    關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服客服 - 聯(lián)系我們

    機械圖紙源碼,實習報告等文檔下載

    備案號:浙ICP備20018660號