時間:2022-09-21 05:37:48
序論:在您撰寫醫(yī)學統(tǒng)計學論文時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導您走向新的創(chuàng)作高度。
1.1單因素方差分析(ANOVA)兩兩比較誤用獨立樣本t檢驗單因素方差分析設計3組以上的均數比較,如果總體比較有差異,需進行兩兩比較,一般用SNK法或LSD法。但部分研究者卻將資料進行拆分,應用獨立樣本t檢驗進行兩兩比較,導致第Ⅰ類統(tǒng)計學錯誤發(fā)生率(假陽性率)增加,從而掉進了一個常見的“統(tǒng)計陷阱”,使所得結論可信度大大降低甚至得出錯誤結論。SNK法與LSD法雖然并非等價,實質是一致的。SNK法一般用于經方差分析結果具有統(tǒng)計學意義時才決定進行的兩兩事后比較,而LSD法可用于方差分析不足以具有統(tǒng)計學意義時也能進行兩兩比較[1]。比較兩種方法在SPSS的輸出結果形式,SNK是“分堆”比較,一目了然,對于組別數較多的研究更為好用,但沒有具體P值,而LSD是在進行“兩兩”比較時,能給出具體的P值。
1.2兩兩比較時檢驗水準的重新調定χ2檢驗或秩和檢驗3組以上整體比較有差異時,需應用分割法進行兩兩比較,這時檢驗水準應由原0.05調定為0.0167,否則會增加第Ⅰ類統(tǒng)計學錯誤的發(fā)生率。特別當P值處于0.0167~0.05時,按照P<0.0167的標準,差異無統(tǒng)計學意義,而按照P<0.05的標準,卻有意義,與事實相悖,出現(xiàn)假陽性,很容易得出錯誤結論。這種分割法有時很保守,當行列表資料分組多且為有序時可用Mantel-Haenszel卡方檢驗,也稱線性趨勢檢驗(testforlineartrend)或定序檢驗(Linear-by-Lineartest)[2]。統(tǒng)計路徑:用SPSS進行計數資料的趨勢檢驗,在輸出結果中讀取線性關聯(lián)檢驗統(tǒng)計量(Linear-by-LinearAssociation,LLA),如P<0.05可得出隨著病種級別的升高,檢測指標逐漸升高的趨勢。
1.3臨床診斷試驗中的統(tǒng)計學方法應用在臨床診斷試驗研究中,經常選取單項計量指標或者聯(lián)合計量指標以診斷某種疾病,若僅用初級統(tǒng)計學方法如t檢驗、單因素方差分析等往往不能有效挖掘信息,此時應采用受試者工作特征曲線(ROC)對檢測結果進行分析評價。ROC曲線分析基本原理是通過診斷界點的移動[3],獲得多對靈敏度和誤診率(1-特異度),以靈敏度為縱軸、誤診率為橫軸,連接各點繪制曲線,然后計算曲線下的面積,面積越大診斷價值越高。ROC曲線很直觀,能根據敏感性與特異性之和最大化原則自動產生最有效的診斷臨界點。具體路徑可以參考相關統(tǒng)計專著[3]。統(tǒng)計學處理一般描述為:采用SPSS(版次)統(tǒng)計軟件分析數據,對單項及聯(lián)合檢測結果作圖繪成ROC曲線,計算曲線下面積(AUC)和標準誤,其中聯(lián)合檢測結果變量即預測概率由Logistic回歸產生(也可以用判別分析得出)。計量資料應用-x±s表示,運用獨立樣本t檢驗及單因素方差分析,兩兩比較采用SNK及LSD法,計數資料采用χ2檢驗。檢驗水準為0.05。具體內容可據情而定。
1.4重復測量資料的方差分析誤用拆分文件的t檢驗或方差分析如研究共設3組,每位患者在3個時間點均查某項血指標,部分作者在處理此類數據時,常誤將縱向(同一時間點3組的比較)與橫向(同組3個時間點的比較)數據均應用拆分文件的t檢驗或單因素方差分析來處理,結果導致統(tǒng)計學第Ⅰ類錯誤發(fā)生。此組數據實質是重復測量資料,應采用重復測量資料的方差分析。SPSS中的統(tǒng)計路徑:數據-分析-一般線性模型-重復度量。研究者可以參考相關書籍進行處理[3]。
1.52×2析因設計及析因方差分析實驗是2×2析因設計時,分組有兩個因素,A與B,故分組為A、B、O、A+B,這個設計在析因設計研究中很常用,但常會出現(xiàn)分組設計正確,卻沒有用析因設計方差分析。析因設計與單因素方差分析不同[4],它不但能分析治療效果中處理因素的單獨效應和主效應,還能分析因素間的交互效應,并能提高檢驗效能。非統(tǒng)計專業(yè)的研究者進行析因分析可能稍有難度,可參考相關統(tǒng)計學書籍提供的統(tǒng)計步驟進行此類分析[3]。
1.6Meta分析Meta分析是循證醫(yī)學系統(tǒng)評價常用的方法[5],應用時需注意統(tǒng)計學處理中計數資料采用比值比(OR)作為效應變量。具體路徑:先進行異質性檢驗,當P>0.05時,認為同質,選擇固定模型;P≤0.05時,不同質,此時可采用敏感性分析或分層分析等異質性處理,使之達到同質后再選擇固定模型;若采用異質性處理仍未達到同質,則采用隨機模型,以上統(tǒng)計路徑均需交代清楚。Meta分析的結果是以“森林樹”體現(xiàn)的,審校中我們經常遇到作者繪制的“森林樹”左上角“文獻、對比、結果名稱”等內容顯示為“?”,這是由于部分版本的RevMan軟件不能輸入中文,此時可以考慮省去,或用Photo-shop軟件添加相應中文。Meta分析作為一種高級統(tǒng)計方法,專業(yè)性要求較高,作者可參考循證醫(yī)學類權威雜志上的文章格式,如《中國循證醫(yī)學雜志》中“論著•二次研究”欄目的循證文章。
2科技論文中統(tǒng)計學處理的相關表述
2.1資料與方法中具體統(tǒng)計路徑的描述“統(tǒng)計學處理”的內容常位于論文資料與方法的最后一段,一般來說包括統(tǒng)計軟件名稱及版次、統(tǒng)計描述、統(tǒng)計方法、檢驗標準等內容,亦可細致交待每個表格的具體統(tǒng)計方法。經典例子如下,“統(tǒng)計學處理:采用SPSS(版次)統(tǒng)計軟件分析數據。計量資料用均數±標準差表示,采用單因素方差分析,兩兩比較采用SNK法及LSD法。檢驗水準為0.05”。上述內容包括了大致的統(tǒng)計方法,即具體的統(tǒng)計路徑。此部分內容,沒有絕對統(tǒng)一的規(guī)定[6]。常見的問題有:統(tǒng)計學方法描述不全、內容過于簡單、存在粘貼抄寫痕跡等。如部分論文的統(tǒng)計學處理中提及“以α=0.05為檢驗水準,P<0.05為差異有統(tǒng)計學意義”這句話,這在統(tǒng)計學上實質是一個重復句,保留其一即可。
在各種醫(yī)學期刊中,半數以上是療效觀察方面的論著。現(xiàn)擇其較普遍存在的統(tǒng)計學問題,結合實驗設計基本原則加以討論。
(一)對照與均衡性測定
國內醫(yī)學期刊有關臨床療效觀察的文章甚多,不少雜志刊登了一些事先未設計對照的文章,其結論難以令人信服。如《用柴葛解肌湯治療上呼吸感染》一文,報道治愈好轉率為97.7%,因無對照,無法斷定其效果如何,因此,治愈好轉率中含有假像。
對照的方法雖有多種,但對照的基本原則是與實驗組齊同可比,最好作均衡性測定。
(二)安慰劑與盲法試驗
安慰劑與盲法試驗是醫(yī)研(主要是比較性研究)中常用的科研方法,結果準確、誤差性小。安慰劑在形、量、色、味等要與實驗藥物一樣,不能給受試者和執(zhí)行者任何暗示。這種試驗就是雙盲法試驗。但近年來,尚有人用改良的雙盲法,此法分兩期:第一期(公開期)試驗有效者留,無效者棄。有效者進入第二期(雙盲試驗),以確定療效是否系安慰劑的作用。在預防效果觀察時可采用該法,臨床上應用諸多困難,應視具體情況而定。
(三)樣本含量與重復原則
沒有足夠樣本的研究結果,是經不起重復試驗的,有的論文憑少數病例觀實的結果下結論,是不慎重的。如《重癥肺炎并發(fā)DIC29例》一文,作者觀察腦型患者3例,其中死亡一例,就得出“一般腦型病死率高達57%,本組腦型病死率較低,看來及早用肝素阻斷DIC過程,對降低腦型病死率可能具有重要意義”的結論。因無對照,結論不可靠。
(四)隨機分組與實驗設計類型
隨機化分組即每個實驗對象有同等機會被抽樣(分配)到各組去,而不受任何系統(tǒng)因素的影響。常用的實驗設計類型有完全隨機設計、自身對照設計、交義設計、配偶設計、隨機區(qū)組設計、拉丁方設計、正文(析因)設計、序貫設計、半數效量實驗設計(動物試驗),回顧性與前贍性調查研究設計等。科研設計時應根據研究目的要求選擇不同類型的實驗設計方法,進行相應的統(tǒng)計處理。
概率分布(probabilitydistribution)是醫(yī)學統(tǒng)計學中多種統(tǒng)計分析方法的理論基礎。授課內容一般包括:二項分布、Possion分布、正態(tài)分布、t分布、F分布等。
借助概率分布常常可以幫助我們了解生命指標的特征、醫(yī)學現(xiàn)象的發(fā)生規(guī)律等等。例如,臨床檢驗中計量實驗室指標的參考值范圍就是依據正態(tài)分布和t分布的原理計算得到;許多醫(yī)學試驗的“陽性”結果服從二項分布,因此它被廣泛用于化學毒性的生物鑒定、樣本中某疾病陽性率的區(qū)間估計等;而一定人群中諸如遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病患病數或死亡數的分布,單位面積(或容積)內細菌數的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現(xiàn)象進行研究。
在生物信息學中概率分布也有一定應用。例如,Poisson分布可以用于基因(蛋白質)序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(或DNA)數據與公開數據庫進行相似性序列比對。對于序列a和b,BLAST發(fā)現(xiàn)的高得分匹配區(qū)稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據Poisson分布的性質計算得到。
二、假設檢驗
假設檢驗(hypothesis)是醫(yī)學統(tǒng)計學中統(tǒng)計推斷部分的重要內容。假設檢驗根據反證法和小概率原理,首先依據資料性質和所需解決的問題,建立檢驗假設;在假設該檢驗假設成立的前提下,采用適當的檢驗方法,根據樣本算得相應的檢驗統(tǒng)計量;最后,依據概率分布的特點和算得的檢驗統(tǒng)計量的大小來判斷是否支持所建立的檢驗假設,進而推斷總體上該假設是否成立。其基本方法包括:u檢驗、t檢驗、方差分析(ANOVA)和非參數檢驗方法。
假設檢驗為醫(yī)學研究提供了一種很好的由樣本推斷總體的方法。例如,隨機抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數)與該年齡段兒童應有的標準平均身高(總體均數)做u檢驗,其檢驗結果可以幫助我們推斷出該市該年齡段兒童身高是否與標準身高一致,為了解該市該年齡段兒童的生長發(fā)育水平提供參考。又如,醫(yī)學中常常可以采用t檢驗、秩和檢驗比較兩種藥物的療效有無差別;用2檢驗比較不同治療方法的有效率是否相同等等。
這些假設檢驗的方法在生物實驗資料的分析前期應用較多,但由于研究目的和資料性質不同,一般會對某些方法進行適當調整和結合。
例如,基于基因芯片實驗數據尋找差異表達基因的問題。基因芯片(genechip)是近年來實驗分子生物學的技術突破之一,它允許研究者在一次實驗中獲得成千上萬條基因在設定實驗條件下的表達數據。為了從這海量的數據中尋找有意義的信息,在對基因表達數據進行分析的過程中,找到那些在若干實驗組中表達水平有明顯差異的基因是比較基礎和前期的方法。這些基因常常被稱為“差異表達基因”,或者“顯著性基因”。如果將不同實驗條件下某條基因表達水平的重復測量數據看作一個樣本,尋找差異表達基因的問題其實就可以采用假設檢驗方法加以解決。
如果表達數據服從正態(tài)分布,可以采用t-檢驗(或者方差分析)比較兩樣本(或多樣本)平均表達水平的差異。
但是,由于表達數據很難滿足正態(tài)性假定,目前常用的方法基于非參數檢驗的思想,并對其進行了改進。該方法分為兩步:首先,選擇一個統(tǒng)計量對基因排秩,用秩代替表達值本身;其次,為排秩統(tǒng)計量選擇一個判別值,在其之上的值判定為差異顯著。常用的排秩統(tǒng)計量有:任一特定基因在重復序列中表達水平M值的均值;考慮到基因在不同序列上變異程度的統(tǒng)計量,其中,s是M的標準差;以及用經驗Bayes方法修正后的t-統(tǒng)計量:,修正值a由M的方差s2的均數和標準差估計得到。三、一些高級統(tǒng)計方法在基因研究中的應用
(一)聚類分析
聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據聚類對象的某些性質與特征,運用統(tǒng)計分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內的差異相對較小,類與類間的差異相對較大1。聚類分析作為一種探索性的統(tǒng)計分析方法,其基本內容包括:相似性度量方法、系統(tǒng)聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。
聚類分析可以幫助我們解決醫(yī)學中諸如:人的體型分類,某種疾病從發(fā)生、發(fā)展到治愈不同階段的劃分,青少年生長發(fā)育分期的確定等問題。
近年來隨著基因表達譜數據的不斷積累,聚類分析已成為發(fā)掘基因信息的有效工具。在基因表達研究中,一項主要的任務是從基因表達數據中識別出基因的共同表達模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關聯(lián)性。這種探索完全未知的數據特征的方法就是聚類分析,生物信息學中又稱為無監(jiān)督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達數據對基因(樣本)進行聚類,將具有相同表達模式的基因(樣本)聚為一類,根據聚類結果通過已知基因(樣本)的功能去認識那些未知功能的基因。對于基因表達數據而言,系統(tǒng)聚類法易于使用、應用廣泛,其結果——系統(tǒng)樹圖能提供一個可視化的數據結構,直觀具體,便于理解。而在幾種相似性的計算方法中,平均聯(lián)接法(AverageLinkageClustering)一般能給出較為合理的聚類結果2。
(二)判別分析
判別分析(discriminantanalysis)是根據觀測到的某些指標的數據對所研究的對象建立判別函數,并進行分類的一種多元統(tǒng)計分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經網絡(ANNs)和支持向量機(SVMs)。
判別分析常用于臨床輔助鑒別診斷,計量診斷學就是以判別分析為主要基礎迅速發(fā)展起來的一門科學。如臨床醫(yī)生根據患者的主訴、體征及檢查結果作出診斷;根據各種癥狀的嚴重程度預測病人的預后或進行某些治療方法的療效評估;以及流行病學中某些疾病的早期預報,環(huán)境污染程度的堅定及環(huán)保措施、勞保措施的效果評估等。
在生物信息學針對基因的研究工作中,由于借助了精確的生物實驗,研究者通常能得到基因(樣本)的準確分類,如,基因的功能類、樣本歸結于疾病(正常)狀態(tài)等等。當利用了這些分類信息時,就可以采用判別分析的方法對基因進行分類,生物信息學中又稱為有監(jiān)督的分析(SupervisedAnalysis)。例如,基因表達數據分析中,對于已經過濾的基因,前三種方法的應用較為簡單。而支持向量機(SVMs)和人工神經網絡(ANNs)是兩種較新,但很有應用前景的方法。
(三)相關分析
相關分析(correlationanalysis)是醫(yī)學統(tǒng)計學中研究兩變量間關系的重要方法。它借助相關系數來衡量兩變量之間的關系是否存在、關系的強弱,以及相互影響的方向。其基本內容包括:線性相關系數、秩相關系數、相關系數的檢驗、典型相關分析等。
我們常常可以借助相關分析判斷研究者所感興趣的兩個醫(yī)學現(xiàn)象之間是否存在聯(lián)系。例如,采用秩相關分析我們發(fā)現(xiàn)某種食物中黃曲霉毒素相對含量與肝癌死亡率間存在正相關關系;采用線性相關方法發(fā)現(xiàn)中年女性體重與血壓之間具有非常密切的正相關關系等等。
生物信息學中可以利用相關分析建立基因調控網絡。如果將兩個不同的基因在不同實驗條件下的表達看作是兩個變量,相關分析所研究的正是兩者之間的調控關系。如采用線性相關系數進行兩基因關系的分析時,其大小反應了基因調控關系的強弱,符號則反應了兩基因是協(xié)同關系(相關系數為正),還是抑制關系(相關系數為負)。
四、意義
生物信息學不僅是醫(yī)學統(tǒng)計學的研究前沿,更是醫(yī)學研究由宏觀向微觀拓展的重要領域,其研究內容已逐漸為多數醫(yī)學院校的學員了解和熟悉。而如何對新技術產生的生物實驗數據進行準確合理的分析,卻成為生物信息學研究的主要瓶頸之一。
在醫(yī)學統(tǒng)計學課堂教學中引入生物信息學實例,而不僅僅局限于常見的醫(yī)學、衛(wèi)生領域的例子,將難以理解的統(tǒng)計理論和方法與前沿的生物實例相結合,拓寬了學員的視野,提高了學員的學習興趣,更可以加深對所學知識的理解;與此同時,使學員掌握了生物實驗數據的先進分析方法,擴大了學員的知識面,提高了他們今后開展醫(yī)學科研工作的能力。
醫(yī)學統(tǒng)計學的教學應以提高研究生解決實際科研問題的能力為目標,使研究生形成正確的和嚴謹的統(tǒng)計學思維方法和技能,幫助醫(yī)學研究生在今后的科研工作中正確運用醫(yī)學統(tǒng)計學方法,順利完成研究生學業(yè)以及將來在工作中的科研任務。然而,筆者在教學實踐中發(fā)現(xiàn)有一些需要改進的問題。
一、研究生醫(yī)學統(tǒng)計學教學中遇到的主要問題
(一)研究生統(tǒng)計學基礎知識較為薄弱
雖然大部分學生在大學本科期間學習過統(tǒng)計學,但多數人僅學習過較簡單的統(tǒng)計學基礎知識,進入研究生階段醫(yī)學統(tǒng)計學學習后,學習比較吃力,并且由于總學時數的限制,教師在理論課的教學中對單個統(tǒng)計學方法的使用講解較多,而對一些研究生在完成學位論文期間或將來畢業(yè)后較為實用的統(tǒng)計學方法卻沒有時間講解,這就造成了研究生對學過的統(tǒng)計學方法一知半解,而將來可能用得上的統(tǒng)計學方法卻沒有學會。筆者在解答一些已經畢業(yè)參加工作的研究生的問題時,發(fā)現(xiàn)有些問題十分基礎,本應該在研究生學習階段掌握而沒有掌握。
(二)課題設計統(tǒng)計學缺陷較常見
目前,國內大部分高校研究生醫(yī)學統(tǒng)計學課程一般安排在研一上學期,而研究生應用統(tǒng)計學知識進行課題設計要到研究生二年級才啟動。許多研究生在課堂學習階段對統(tǒng)計學知識本來就沒有徹底學透,又要再經過一年多才進入課題設計有實驗研究,對學習過的統(tǒng)計學知識已經有一些遺忘,所以在進行課題設計時不能正確運用學過的相關知識,造成課題設計中有較多的統(tǒng)計學缺陷。而課題設計如果不正確,無法保證后續(xù)的研究結果的科學性和可信性。
(三)學位論文統(tǒng)計學錯誤普遍存在
國內外期刊對論文中的統(tǒng)計學方法要求都很高,因此研究生的科研論文需要正確運用統(tǒng)計學知識對研究數據進行分析、整理。但與此形成鮮明對比的是,很多研究生不能把學習過的統(tǒng)計學知識正確運用到研究論文中。尤其是學習臨床專業(yè)的醫(yī)學研究生,很多研究資料和數據來源于人群研究,涉及樣本量、對照組的選擇等基本的統(tǒng)計學常識,這些基礎性錯誤卻在研究生的論文中大量存在。這些問題與現(xiàn)在對高素質人才的培養(yǎng)已經不相適應,需要加以改進。
二、對策與建議
(一)強化課堂教學,鞏固醫(yī)學統(tǒng)計學知識基礎
鞏固基本統(tǒng)計方法和知識是醫(yī)學統(tǒng)計學的基礎,通過課堂教學,使學生掌握基本的統(tǒng)計方法原理、計算過程和結果解釋。在教學中既要注重基本原理和基本概念的講解,使研究生切實掌握基本的統(tǒng)計學知識,在論文寫作中不出現(xiàn)低級的統(tǒng)計學錯誤。在此基礎上,老師在課堂上應該由簡到繁,深入淺出,逐步增加難度和深度,講解一些研究生在學習階段和將來工作中有用的、較為高級的統(tǒng)計學方法。目前,科學技術更新速度很快,同樣統(tǒng)計學的重要工具——統(tǒng)計軟件也更新很快,因此,老師要及時更新自己的知識,并向學生介紹最新、最先進的統(tǒng)計方法和軟件。
(二)注重學用銜接,提升研究生課題設計的科學性
研究生的課題設計是科學研究成敗的關鍵之一,教師在教學過程中要向學生強調其重要性,讓學生帶著課題設計中的問題進入課程學習,讓學生結合自己的專業(yè),做好論文前期的準備工作,完成科研選題,為畢業(yè)論文開題做好準備。要指出課題設計中應當注意的統(tǒng)計學問題,如樣本量、對照組選擇等,使學生意識到統(tǒng)計學的基本知識是保證自己課題設計科學性的關鍵,在今后的課題設計中自覺以正確的統(tǒng)計學方法作為指導,從而保證課題設計的科學性,為其成長為高層次的醫(yī)學科研人才打下良好的基礎。
(三)采用實例分析,減少研究論文中的統(tǒng)計學錯誤
在課堂上以一些已經發(fā)表的高水平論文為例,詳細講解醫(yī)學統(tǒng)計學方法的具體應用,使研究生在撰寫論文時,減少論文中的統(tǒng)計學錯誤,減少文章因為統(tǒng)計學問題而被拒稿;教師在課堂上也可以用一些已經發(fā)表的、但是有明顯統(tǒng)計學錯誤的論文作為反面教材,給學生進行分析、講解,使學生從正反兩個方面知道避免論文中的統(tǒng)計學錯誤的重要性。另外,要注意提醒學生,在數據處理和論文撰寫過程中,運用統(tǒng)計學方法時要注意其使用條件,切不可誤用,對審稿人指出的統(tǒng)計學錯誤要認真進行修改或答復。
利用現(xiàn)代化學習工具學習當今社會發(fā)展所需要的知識是時代的要求,因此應轉變教育思想和更新教育觀念,改變以往的教學方式、學習方式和學習內容,探索適應現(xiàn)代社會、經濟、科技及文化發(fā)展的教育觀念和人才培養(yǎng)模式,形成培養(yǎng)適合21世紀所需要人才的教學體系.醫(yī)藥院校的數學應以應用為主要目的,應改變以掌握基本知識、基本理論及基本方法為目的的方式,把教學重點轉移到講解數理統(tǒng)計學概念、思考方法、形成及應用背景等,引導學生思考數理統(tǒng)計學的思維特征,理解數理統(tǒng)計學思想,引導學生應用數理統(tǒng)計學方法解決實際問題,以達到學以致用的目的.學好和用好醫(yī)藥數理統(tǒng)計學并不需要高深的數學知識,而是要促使學生在學習數理統(tǒng)計學的時候改變思維模式,使學生從醫(yī)藥學的形象思維模式向數理統(tǒng)計學的抽象思維和邏輯推斷模式轉變,并結合教材中例題的講解、學生自身實例資料的分析及作業(yè)的批閱使學生理解和掌握統(tǒng)計學中的基本概念、基本方法、統(tǒng)計符號及公式等.
2精簡和更新教學內容
在教學內容方面做到突出實用性,適當地減少或減弱概率論部分的理論性和難度,以直觀、趣味和易于理解的方式把概率論作為數理統(tǒng)計的基礎知識加以介紹.在假設檢驗部分注意闡述數理統(tǒng)計方法的思想、應用的背景及應用中所需的條件,重點講解假設檢驗應該如何選取原假設和備擇假設,如何對得出的結論進行合理的解釋;在參數估計部分著重地講解參數估計在實際應用中的重要性、合理性及應用中應注意的問題,區(qū)間估計中置信區(qū)間的理解及單側置信限在應用中的意義等;在方差分析部分講清楚引進方差分析的意義、假設檢驗的方法對多個總體進行多次t檢驗時的缺點、方差分析應用的條件及合理解釋檢驗結果等;在回歸分析部分注意闡述量與量之間的關系、回歸方程的理論意義及對回歸方程結果在應用中的解釋等.目前SPSS軟件是國際醫(yī)學論文中應用最廣泛的統(tǒng)計軟件[2],國內的大部分醫(yī)學期刊也要求論文數據統(tǒng)計分析要應用統(tǒng)計軟件處理,統(tǒng)計檢驗結果要用P值來表示,更要求學生了解統(tǒng)計軟件的使用方法,做到正確使用統(tǒng)計軟件.
3互動式的教學方法培養(yǎng)應用、創(chuàng)新型人才
傳統(tǒng)的教學方式是知識傳授型教學,即教師在課堂上灌輸知識,在有限的時間內按教學大綱要求把大量的教學內容盡可能地講授完畢,不能有效地調動學生對學習的主動性,忽視學生應用能力的發(fā)展,結果導致學生把主要精力投入到統(tǒng)計計算上,很難有時間去深入分析統(tǒng)計結果.互動式教學方法要求教師在教學中充分發(fā)揮教師的主導作用,同時讓學生處于教學的中心,在加強課堂討論的同時,由教員歸納總結,充分調動學生的學習興趣,提高學生的主動性和創(chuàng)造性.統(tǒng)計學應用能力的培養(yǎng)主要指可正確選擇和應用統(tǒng)計分析方法解決醫(yī)藥學科學研究和醫(yī)藥工作中的實際問題[3].為了避免學生濫用及錯用統(tǒng)計方法,教師要重點講清各種方法的適用條件及特點.在考試方法上亦采用開卷考試,使學生不再花大量時間去推敲和死記那些復雜的公式,不再難于分清和理解符號及公式.通過幾年來的改革實踐,發(fā)現(xiàn)上述教學內容、方法及手段的改革增強了學生的學習興趣,使學生真正體會到數理統(tǒng)計學的內容在醫(yī)藥及日常生活中的應用價值,激發(fā)學生的創(chuàng)造性思維,取得了良好的效果.
[參考文獻]
[1]劉定遠.醫(yī)藥數理統(tǒng)計方法[M].第3版.北京:人民衛(wèi)生出版社,1999.20.
[2]王銳,陳長生,徐勇勇,等.統(tǒng)計軟件SPSS教學的經驗與體會[J].西北醫(yī)學教育,2004,12(5):425.
[關鍵詞]醫(yī)學期刊;隊列研究;統(tǒng)計學問題;對策
[中圖分類號] R181.2+3 [文獻標識碼] A [文章編號] 1674-4721(2016)08(b)-0152-03
隊列研究又稱前瞻性研究、隨訪研究及縱向研究,是將一個范圍明確的人群按是否暴露于某可疑因素及暴露程度分為不同的亞組,追蹤其各自的結局,比較亞組之間結局的差異,從而判定暴露因子與結局之間有無因果關聯(lián)以及關聯(lián)大小的一種觀察性研究方法[1]。這里暴露是指研究對象接觸過某種待研究的物質(如重金屬等)、具備某種待研究的特征(如年齡、性別及遺傳因素等)或行為(如吸煙等)[2]。觀察的結局主要是與暴露因子可能有關的結局。隊列研究中先因后果的時間順序相對明確,受一些偏倚的影響小,是觀察性研究方法中驗證病因能力最強的研究方法[3],其證據等級僅次于嚴格設計的隨機對照試驗。盡管我國的前瞻性隊列研究起步較晚,但自20世紀八九十年代起也陸續(xù)開展了一些隊列研究[4]。如果這些研究未能正確使用該研究方法,不但不能有效驗證病因假設,還有可能得出錯誤的結論。本文收集并分析了近年國內公開發(fā)表的隊列研究論文,發(fā)現(xiàn)其中存在的統(tǒng)計學問題并提出改進意見和建議,旨在引起作者、編者和審稿專家的重視,提高期刊論文的質量。
1隊列研究文獻的檢索
以“隊列研究”“前瞻性研究”“隨訪研究”“縱向研究”為關鍵詞,在中國知網(CNKI)和萬方數據庫中檢索2014~2015年公開發(fā)表的隊列研究文獻共1874篇,剔除重復文獻和非研究性文獻后,獲得研究性文獻929篇(表1)。
2 載文量及統(tǒng)計學方法應用情況
根據李康等[5]主編的《醫(yī)學統(tǒng)計學》和Cochrane推薦的Newcastle-Ottawa-Scale(NOS)工具[6]對檢索到的文獻進行統(tǒng)計學方法應用情況評判,評判結果在文獻評價表中登記并復核,采用Excel管理和分析數據。結果發(fā)現(xiàn),絕大多數隊列研究采用χ2檢驗和Logistic回歸方法進行統(tǒng)計推斷,約占82.0%;而使用了生存分析及Cox比例風險回歸模型的僅占13.0%(表2)。
3常見統(tǒng)計學問題
3.1研究對象描述不清楚或不確切
研究對象的選擇是隨訪研究的首要問題,因此文中關于研究對象的描述必須準確清楚,根據研究屬于總體研究或是抽樣研究,對研究對象的描述應加以區(qū)別[7]。目前我國隊列研究中關于研究對象的描述主要存在的問題為:描述中對總體研究或抽樣研究未加以明確說明;抽樣研究中的描寫模棱兩可,未說明具體抽樣方法。從統(tǒng)計學上講,總體研究的研究對象是根據研究目的所確定的同質觀察單位的全體,而抽樣研究的研究對象是總體中隨機抽取的部分觀察單位。
例如,就“某高校教師肥胖率及其對糖尿病發(fā)病影響的研究”而言,首先要制定相應的納入標準與排除標準,研究的納入標準為“某高校在編、在職且未患糖尿病的教師”,排除標準為“妊娠期、哺乳期女教工”。如果研究為總體研究,其研究對象應是該高校的所有在編、在職且未患糖尿病的非孕(哺乳)教師;如果研究為抽樣研究,則其研究對象是該高校所有在編、在職且未患糖尿病的非孕(哺乳)教師的一個隨機樣本,研究對象描述中還應具體說明所使用的抽樣方法,如單純隨機抽樣、系統(tǒng)抽樣、整群抽樣或分層抽樣等,同時寫明隨機抽樣的具體實施方法。
3.2結局事件及其判斷標準描述不全面
隨訪研究的另一個重要因素是結局事件,其指隨訪觀察中將出現(xiàn)的預期結果事件,研究中既要記錄是否發(fā)生了結局事件,還應記錄是否存在失訪及失訪原因(失去聯(lián)系、因其他疾病死亡、研究終止)。分析我國2014~2015年已發(fā)表的隊列研究文章發(fā)現(xiàn),大多數研究均未描述是否存在失訪,部分研究對結局事件的判斷標準描述不全面。按照隊列研究的設計要求,結局事件要有明確統(tǒng)一的判斷標準。例如,2型糖尿病結局的判斷標準[8-9]:確診糖尿病,即自我報告醫(yī)生診斷糖尿病和(或)正在使用胰島素和(或)口服降糖藥治療者;未確診糖尿病,即未診斷糖尿病但空腹血漿葡萄糖水平≥7.0 mmol/L者;對于隨訪期發(fā)生死亡者,如果其死亡原因中含有糖尿病也認為是隨訪期發(fā)生2型糖尿病。
3.3統(tǒng)計分析不充分或錯誤
3.3.1基線特征描述不全面 隊列研究中暴露組與非暴露組基線特征是否存在差異以及差異的方向直接影響研究結果的解釋,因此基線特征的描述是隊列研究資料分析必不可少的內容。而目前國內的隊列研究文獻中存在較嚴重的不按暴露有無分組描述基線特征的現(xiàn)象。此外,如隨訪過程中存在失訪,則失訪者與隨訪者基線特征的比較也直接影響研究結果的解釋。在查閱的929篇研究性隊列研究文獻中無失訪情況描述,無失訪者與隨訪者基線特征比較者達90%以上。
因此,隊列研究的資料分析應首先比較暴露組與非暴露組基線特征的一致性,以分析基線特征的差異對研究結果是否有影響以及影響方向,同時也可確定多因素分析中需要調整的混雜因素。如果研究中有失訪,還應比較失訪者與隨訪者的基線特征是否一致,以判斷失訪對研究結果是否有影響以及影響方向。
3.3.2統(tǒng)計推斷方法選擇不當 統(tǒng)計學方法的選擇一向是醫(yī)學科學研究中的難點問題。隊列研究中主要涉及的統(tǒng)計推斷方法包括χ2檢驗、Logistic回歸以及Cox比例風險回歸模型,此三種方法的誤用和混用在隊列研究文獻中較嚴重,包括誤用χ2檢驗代替Logistic回歸、誤用Logistic回歸代替Cox回歸等。由表2可知,929篇研究性隊列研究文獻中應用了Cox回歸的僅占13.0%,且2015年的比例與2014年基本相同(13.1% vs 13.0%),可見這一方法的正確應用近兩年內并未引起作者以及編輯足夠的重視。
隊列研究中統(tǒng)計學方法選擇的正確思路為[10]:若暴露組與非暴露組的基線特征一致,則可以直接應用χ2檢驗比較暴露組與非暴露組結局事件發(fā)生率的差異,以判斷暴露因素與結局事件是否有關聯(lián),同時計算相對危險度(relative risk,RR)及其95%置信區(qū)間,進一步說明兩者的關聯(lián)強度。相反,若暴露組與非暴露組的基線特征存在差異,應采用多因素的回歸分析對混雜因素進行控制。如果數據資料中無時間變量,可采用Logistic回歸,并在模型中調整組間存在差異的基線特征變量;如果有時間變量,則應采用Cox回歸,并在模型中調整組間存在差異的基線特征。
3.4其他問題
國內公開發(fā)表的隊列研究文獻存在的其他問題:①應用Logistic回歸或Cox回歸時,分類變量或等級變量無賦值說明,造成結果解釋的混亂。例如,只有在明確“男性=1,女性=0”或者相反的情況下,才能正確解釋暴露因素與研究結局之間的關系。②誤用χ2檢驗公式:應該使用校正公式時,卻應用了非校正的通用公式或專用公式;不能應用χ2檢驗時,卻計算了χ2值。例如,兩組率比較時,只有滿足總例數n≥40且理論頻數T≥5的條件下,才能采用非校正的四格表χ2檢驗的通用公式或專用公式;如果n≥40且1≤T
4隊列研究醫(yī)學論文作者及編輯應注意的問題
分析結果表明,隊列研究醫(yī)學論文的統(tǒng)計學方法應用基本正確,編輯人員也比較重視統(tǒng)計學方法的使用情況,但是仍有部分論文在研究設計和統(tǒng)計分析方法的應用上存在一些問題,導致的研究結果缺乏科學性和可信性。為使作者、編輯和審稿者高度重視統(tǒng)計學的正確應用,進一步提高隊列研究醫(yī)學論文的質量,筆者認為還應做好以下工作。
4.1提高對統(tǒng)計學知識的認識,強化統(tǒng)計學意識
目前,國內醫(yī)學科研工作者未認識到醫(yī)學統(tǒng)計學的重要性,對醫(yī)學統(tǒng)計學的重視程度還不夠。因此,要加大“醫(yī)學統(tǒng)計學在醫(yī)學科研中重要性”的宣傳力度,提高科研工作者對醫(yī)學統(tǒng)計學的認識;在醫(yī)學科研工作中普及醫(yī)學統(tǒng)計學知識,強化醫(yī)學統(tǒng)計學意識,促使其在科研設計、數據分析和論文撰寫中正確應用醫(yī)學統(tǒng)計學方法[11]。
4.2加強流行病學與醫(yī)學統(tǒng)計學專家審稿工作
醫(yī)學研究,包括隊列研究,其統(tǒng)計分析都是以科學研究設計為基礎的。研究設計不科學、有缺陷,即使應用了高級的統(tǒng)計學方法也于事無補。所以,審稿專家在具備豐富的專業(yè)知識的同時,還應具備一定的醫(yī)學統(tǒng)計學和流行病學知識,能夠做到從研究設計到統(tǒng)計分析,系統(tǒng)地審核研究結果的科學性、可靠性,確保論文質量[12]。此外,如果條件允許,所有稿件應先通過流行病學與醫(yī)學統(tǒng)計學專家的審核,然后再由各專業(yè)學科專家審稿,以確保研究成果的真實可靠[13]。因此,醫(yī)學期刊編委會應增設流行病學與醫(yī)學統(tǒng)計學專業(yè)的專家委員,嚴格審核論文的研究設計和統(tǒng)計分析,不合格的論文堅決不發(fā)表,這樣才能不斷提高稿件質量和水平。
有計劃地定期聘請流行病學與醫(yī)學統(tǒng)計學專家對期刊編輯人員進行流行病學與醫(yī)學統(tǒng)計學知識培訓[14]。通過定期舉辦專業(yè)知識講座、選派編輯人員參加專題培訓班、定期組織考核、根據考核結果給予適當獎勵等措施,以提高編輯人員學習流行病學與醫(yī)學統(tǒng)計學知識的積極性,不斷提高其相關知識水平,最終達到提高論文質量的目的。
[參考文獻]
[1]張嘯飛.前瞻性隊列研究及生存分析[A]//2014浙江省臨床流行病學與循證醫(yī)學學術年會論文匯編[C].浙江,2014: 15.
[2]李立明.流行病學[M].5版.北京:人民衛(wèi)生出版社,2003:58-59.
[3]李立明,呂筠.大型前瞻性人群隊列研究進展[J].中華流行病學雜志,2015,36(11):1187-1189.
[4]王慧,陳培戰(zhàn),張作文,等.我國人群隊列研究的現(xiàn)狀、機遇與挑戰(zhàn)[J].中華預防醫(yī)學雜志,2014,48(11):1016-1021.
[5]李康,賀佳.醫(yī)學統(tǒng)計學[M].6版.北京:人民衛(wèi)生出版社,2013:84-150.
[6]何瓊,黃淵秀,康文婧,等.2001-2010年我國傷害預防病例對照研究及隊列研究文獻質量評價[J].中華疾病控制雜志,2014,18(10):913-916.
[7]王芳,戴國華,婁昊.循證中醫(yī)藥隊列研究的隨訪設計[J].山東中醫(yī)雜志,2016,(1):14-17.
[8]樊森,陳紀春,黃建鳳,等.中國成人看電視時間與2型糖尿病發(fā)病關系的前瞻性隊列研究[J].中國循環(huán)雜志,2014, 29(5):372-376.
[9]李衛(wèi)東,傅坤發(fā),連燕舒,等.成人非酒精性脂肪肝與2型糖尿病發(fā)病關系的前瞻性隊列研究[J].中國全科醫(yī)學,2015, 18(28):3426-3429.
[10]韓梅,陳薇,曹卉娟,等.比較效果研究常用方法之二:隊列研究設計[J].現(xiàn)代中醫(yī)臨床,2015,22(3):20-23.
[11]沈洪兵.重視大型隊列研究的人才梯隊建設和技術儲備[J].中華預防醫(yī)學雜志,2014,48(7):547-548.
[12]高永,張中文,石德文,等.基于Excel的統(tǒng)計分析系統(tǒng)在期刊編輯部審稿中的應用[J].編輯學報,2013,25(5):478.
[13]黃晨,袁平戈,張大志.醫(yī)學期刊來稿中有關統(tǒng)計學錯誤分析[J].現(xiàn)代醫(yī)藥衛(wèi)生,2013,29(15):2268.
健康網訊: 南京鐵道醫(yī)學院衛(wèi)生系 周達生 二、統(tǒng)計指標與統(tǒng)計處理方法要合理運用
在各種醫(yī)學期刊論文中,對統(tǒng)計學處理與統(tǒng)計指標的合理運用問題,已比過去有所重視,但尚存在不少問題。
(一)均數與標準差、標準誤的合理運用問題
在醫(yī)學論文中運用均數(表示各變量值平均水平與集中趨勢)、標準差(表示變量值個體問離散情況與程度)和標準誤(表示樣本群體間差異程度,衡量抽樣誤差大小)的地方是很常見的,而達到合理運用尚存在一些問題。例如,在比較兩樣本統(tǒng)計量時只考慮平均水平(均值),而忽視了離散情況(標準差)和抽樣誤差(標準誤);在正常值研究時,如資料近似正態(tài)分布,應當用均值加減K倍標準差(X±KS)來確定95%的正常值范圍(K根據樣本大小查K值表而定),應當標明標準誤,而錯用了標準差等。如《正常小兒三種不同劑量及正常成人50微克PHA皮試反應強度研究》一文中寫道:“正常值范圍為均值±2×標準誤”。井寫道:“小兒50微克組:均值±2×標準誤=2.01~18.1毫米”。顯然是錯誤地把標準誤當成標準差用作估計正常值了。
(二)正常值研究中的幾個問題
臨床正常值確定方法依資料頻數分布類型而定,主要有兩種:一是均值加減標準差法適用于近似正態(tài)分布資料,二是百分位數法,適用任意分布資料。此外,角度資料(如腦血流圖、心電圖等的角度數據)運用圓形分布法,Poisson分布資料用Poisson分布法,正偏態(tài)分布資料用對數正態(tài)分布法等來處理。現(xiàn)今全國發(fā)表的一些醫(yī)學論文中,正常值方面的問題也較多。引一些實例加以研究。
如在《遷延性、慢性肝炎患者植物血凝素皮試應用價值的探討》一文中寫道:“正常人甲組156人…平均值±標準誤為15.4±0.4mm(平均值上標準差為15.4±5.6mm)。”那么,正常值是角標準誤與標準差咖個統(tǒng)釬量來計算的呢?是加減1倍還是2倍標準差(或標準誤)呢?作者均來說明。
又如《正常兒童尿游離α氨基酸氮的測定》一文,對1~13歲(分四個年齡組)125名正常兒進行研究,在正常值研究設計及分析時存在三個問題:(1)樣本含量不足:如不同性別、不同年齡組的測定值僅據15人的結果而定正常值,顯然是不妥的。作者針對各組結果矛盾現(xiàn)象,在討論中兩八提到“可能因例數太少,不能切實反映客觀規(guī)律的緣故。”若按不同性別、年齡組確定正常值,一般要求每組100~12O人方能悅明問題。(2)錯把標準誤當作標準差用作估計正常值范圍:文中說:“1~13歲正常兒童的游離α氮基酸氮/總氮%的均值可信限為:1.30±3×0.036,即1.19~1.41”。這里將標準誤0.036當作標準差用作估計正常值了。正確的應是:“游離α氨基酸氮×l00/總氮%的95%正常值范圍為1.30±2×0.4=0.~2.3。這里0.4是標準差。正常值范圍在正態(tài)分布資料時,如考慮到樣本大小及把握度,最好表達為單側:+KS或-KS;雙側±KS。式中K值表(見周達生:醫(yī)學問答,中華兒科雜志(4):245,1980)。(3)按性別、年齡組制訂正常值問題:當研究對象有多個年齡組時,兩組均數間比較用t檢驗,多組均數間比較可用F-Q檢驗,若差異顯著,則需按不同性別、年齡組分別制訂正常值。
(三)聯(lián)系與因果
在臨床實驗研究中,經某種處理(如治療)后受試對象出現(xiàn)某種反應(如治愈),并不能肯定是因果關系。有時比較兩變量之間關系時,雖明顯相關,但也不能斷言其間有因果關系,只能說有一定統(tǒng)計聯(lián)系(蘇德隆:聯(lián)系與因果。中華預防醫(yī)學雜志13:106,1979)。在醫(yī)學論文中甚至有不作相關回歸分析就胃然下類似結論的。要了解有無因果關系,有時可進一步作回歸分析(當然因果可表現(xiàn)為回歸關系,但呈回歸關系不一定是因果關系)。
(四)多組多級小值頻數處理問題
在臨床及動物實驗研究中常遇到多組多級(R×C表)小值頻數的比較,論文中大多忽視此類數據的合理統(tǒng)計處理,主要問題有:(1)未加適當統(tǒng)計處理,不考慮抽樣誤差而憑表面數字差別就輕易下結論。(2)處理方法不恰當。對此類數據可采用超幾何概率計算法(見周達生:醫(yī)學科研中鄉(xiāng)組小值頻數統(tǒng)計處理方法探討。中華預防醫(yī)學雜志(4):211,1980)、薛仲三氏X3檢驗公式(見薛仲三,醫(yī)學統(tǒng)計方法和原理。366頁,人民衛(wèi)生出版社,北京1978)和秩和檢驗與等級指數法(黃鎮(zhèn)南:等級型資料的三種統(tǒng)計分析方法,湖南醫(yī)學院,長沙,1980)等。
(五)零反應的統(tǒng)計處理
兩組計數比較,若一組有零反應,即出現(xiàn)0%或100%情況時,可用零反應公式處理。
如《病毒性肝炎中醫(yī)辯證與機體免疫狀態(tài)的初步探討》一文,作者對19例遷延件肝炎中醫(yī)辨證與淋轉測定結果作了分析(原文表3)。由于作者對數據未作處理而下結論,不少信息失落,有些矛盾現(xiàn)象難以解釋。原表3中有三處出現(xiàn)有零反應,宜分割后列出三個四格表,用零反應檢驗法處理。本例為雙側檢驗,差異顯著性水平定力0.25和0.005。從三個四格表分析結果看,僅氣虛與陰虛淋轉測定值之間差異顯著(P<0.005),而正不虛與氣虛和陰虛問差異均不顯著(P>0.025)。從而提示在虛證中還要區(qū)別對待,只有氣虛者免疫功能才顯著地低下。這樣可使文中矛盾現(xiàn)象找到合理解釋。