第一章 醫(yī)學統(tǒng)計中的幾個基本概念
作者:徐榮祥 出版社:中國科學技術(shù)出版社 發(fā)行日期:2009年7月第一節(jié) 總體與樣本
在醫(yī)學研究中,經(jīng)常通過對一定數(shù)量的人或動物進行科學研究,從中推論出同一性質(zhì)中的全體對象的某些情況,其中被觀察者稱為樣本(sample),而樣本所代表的全體被稱為總體(population)。因此,可以給總體下這樣一個概念:總體是根據(jù)研究目的確定的同質(zhì)研究總體,更確切地說,是性質(zhì)相同的所有觀察單位某種變量值的集合。譬如,研究某地、某年、正常成人的血壓值,其研究對象是該地該年的正常成年人,觀察單位是每個人,變量是血壓,變量值是測得的血壓值,該地該年全部正常成人的血壓值就構(gòu)成了一個總體。這個總體的同質(zhì)基礎(chǔ)是同一地區(qū)、同一年份、同為正常成年人。
總體分為有限總體(finite sample)和無限總體(infinite sample)。上述例子屬于有限總體,因為所觀察的單位是有限的,即某個單位。無限總體是所設(shè)想的所有高血壓病人,這個研究單位是龐大的,觀察人數(shù)是不確定的,無限的。在燒傷臨床研究中,所研究的結(jié)果很多情況都能代表無限總體,如觀察某藥治療深Ⅱ度燒傷病人創(chuàng)面的療效,因為我們不可能同時對所有燒傷病人的深Ⅱ度創(chuàng)面進行直接治療和觀察,故常在實驗性治療中只觀察其中一部分深Ⅱ度病人的創(chuàng)面。臨床所研究的這一部分深Ⅱ度創(chuàng)面就是我們要研究的那個龐大總體,即凡是有深Ⅱ度創(chuàng)面的病人,或者說所有病人的深Ⅱ度創(chuàng)面都是我們研究的總體。
科學研究的目的是要闡明總體特征和規(guī)律,然而,在實際工作中的多數(shù)情況下沒有必要或不可能對總體中的每一個個體進行研究。對有限總體來說,若觀察的單位過多,直接研究總體耗費人力、物力也很大,這也是不可能和不必要的。打個比方,國家食品檢驗機構(gòu)要檢查某種食品的質(zhì)量,不可能將所有的這種食品一一檢查,而常常是從某些樣本的信息中抽取部分來推斷總體的性質(zhì)。
二、樣本(sample)
在總體中已提到,科學研究的目的是要闡明總體的特征和規(guī)律,具體方法是進行抽樣(sam-pling)研究,從總體中抽取一部分有代表性的個體。這些個體的觀察值就構(gòu)成樣本,即樣本就是燒傷臨床資料歸納與“示例”統(tǒng)計分析從總體中隨機抽?。ǎ颍幔睿洌铮?samping)的部分觀察單位,所測定的某指標變量實測值便構(gòu)成樣本,而對樣本性質(zhì)的研究就是推斷總體性質(zhì)的基礎(chǔ)。例如,只觀察用某藥治療100 例(處)燒傷創(chuàng)面的療效,則這100 例(處)創(chuàng)面即為樣本。但是,研究的目的不僅只是限于說明這100 例(處)創(chuàng)面的療效,而是要說明這種藥物能夠治療所有的深Ⅱ度燒傷創(chuàng)面。進而說明所有深Ⅱ度創(chuàng)面都是我們研究的總體,并為今后在臨床相同條件下用此藥治療其他病人的深Ⅱ度創(chuàng)創(chuàng)提供依據(jù)。為了使樣本對總體具有足夠的代表性,要求樣本必須是從總體中隨機抽取的,且樣本中的個體要足夠多。統(tǒng)計學上把刻畫總體特征的指標稱為參數(shù)(parametic),把刻畫樣本特征的指標稱為統(tǒng)計量(statistic)。上例應(yīng)用某藥治療全部深Ⅱ度燒傷創(chuàng)面的效果水平,如果觀察的是愈合天數(shù)的平均值,總體均數(shù)就是參數(shù);而樣本的平均水平(均數(shù))就是統(tǒng)計量。
三、燒傷樣本的特性
燒傷是一種全身性疾病,但變異性較大,有的病人燒傷面積可能小到不足1% (TBSA)體表面積,有的可達到100%體表面積,有的為Ⅱ度燒傷,有的為Ⅲ度燒傷。在臨床研究時一定要充分考慮到這些因素,如果把1% TBSA 燒傷患者和100% TBSA 燒傷患者放在一起研究,則失去了樣本的同質(zhì)性,當然也就失去了代表性。故在樣本選擇上必須注意以下兩點:
1 樣本的同質(zhì)性
在課題設(shè)計時,首先應(yīng)當考慮的是總體的同質(zhì)性(homogeneity),也就是確定被研究對象的同質(zhì)基礎(chǔ),包括時間、空間、條件等。如觀察某藥治療深Ⅱ度燒傷創(chuàng)面的效果,首先確定被研究對象必須是深Ⅱ度燒傷創(chuàng)面,而且應(yīng)當把深Ⅱ度燒傷創(chuàng)面的面積控制在相同或相近的范圍內(nèi),其他因素如患病年齡、燒傷原因、傷后接受治療時間、院外治療情況等都應(yīng)控制在相近范圍內(nèi)??傊?,被研究對象的各種因素均應(yīng)具有一定的同質(zhì)性。然而,同質(zhì)是個相對的概念,如深Ⅱ度燒傷創(chuàng)面的診斷本身就是一個估計值,再說,燒傷創(chuàng)面(包括深Ⅱ度創(chuàng)面)屬于立體式損傷,上下都有一個界面,被研究的創(chuàng)面一定會有深有淺。故對深Ⅱ度創(chuàng)面與其上下相鄰的淺Ⅱ度與淺Ⅲ度創(chuàng)面比較時,它們既有各自的特點,也存在一些相似的表現(xiàn)。所以,在進行研究時要充分考慮到這一點,無論臨床研究還是實驗研究,其被試樣本的各個受試條件都應(yīng)在一個層面上。如創(chuàng)面都是深Ⅱ度創(chuàng)面,相似的燒傷面積,統(tǒng)一的傷因,統(tǒng)一的年齡段,統(tǒng)一的治療與觀察方法等,這就是科研設(shè)計的總體概念。在觀察“某藥治療深Ⅱ度燒傷創(chuàng)面的療效”時,如把淺Ⅱ度創(chuàng)面也混在其內(nèi),勢必會夸大該藥的治療效果;相反,若把Ⅲ度創(chuàng)面混在其內(nèi),則會縮小治療效果,更重要的一點是不能正確地表露該藥對深Ⅱ度燒傷創(chuàng)面的總體治療效果。
2 樣本的代表性
如前所述,總體是根據(jù)研究目的而確定的、全部同質(zhì)個體(indivdual)的某個(或某些)變量值,它代表被研究對象的全體;而樣本就是從總體中隨機抽取的某些個體(一部分),這樣的樣本才具有代表性。研究深Ⅱ度燒傷創(chuàng)面時,必須從眾多的深Ⅱ度燒傷創(chuàng)面中隨機抽取某些個體作為被試對象,所得結(jié)果才能說明總體。假如我們要研究深Ⅱ度創(chuàng)面的愈合時間,選擇的樣本有些是糖尿病合并燒傷的燒傷創(chuàng)面,必然會影響到研究結(jié)果的可靠性,因為糖尿病本身愈合能力差,所得出的結(jié)果就沒有代表性,更不能說明欲要研究的總體。研究其他病變也是一樣,褥瘡按損傷程度分為四個等級,如把四個等級的創(chuàng)面放在一起研究,所得結(jié)果既不能說明褥瘡這個總體情況,也不能說明哪一級褥瘡的真實情況。由此可見,樣本是個十分復雜和多變的指標,尤其在燒傷醫(yī)醫(yī)學統(tǒng)計中的幾個基本概念學中,故在研究或統(tǒng)計時要充分考慮這些問題。
3 燒傷樣本的確定
根據(jù)“樣本是從總體內(nèi)隨機抽取一部分”的含義,燒傷樣本應(yīng)視兩種情況而定:作為局部研究來說,病損處是被研究的對象,病損個數(shù)就是樣本;作為全身研究來說,如觀察全身性癥狀體征,觀察單位應(yīng)為病人,病人就是樣本。如果研究的是創(chuàng)面變化,應(yīng)以創(chuàng)面?zhèn)€數(shù)為單位表示,不能以例數(shù)為單位表示。因為同一病人往往不止有一個創(chuàng)面,尤其是在大宗資料中。通常的表述方法為× ×例× ×個創(chuàng)面,如30 例病人120 個創(chuàng)面。全身有兩個對稱器官被燒傷者,除了注明左右外,還應(yīng)注明單側(cè)或雙側(cè),如40 例60 只耳燒傷,讀者一定會知道40 例中有20 例為雙側(cè)耳燒傷。在此順便介紹與此有關(guān)的兩個資料概念,一是封頂資料,二是保底資料。40 例病人最多為80只耳,80 即為封頂資料,40 則為保底資料,否則不屬于正常人的情況。體表燒傷面積最大為100% ,這是封頂資料,因為事先人們已把人體的體表面積作為100% ?;疾∧挲g不能封頂,它屬于開口資料,假如今年收治了一位百歲燒傷老人,將來可能會收治大于百歲的燒傷患者。同理,一個病人可能有許多創(chuàng)面,創(chuàng)面也可視為開口資料。