医学科技论文统计学误用分析
1统计学应用中存在的常见问题
1.1单因素方差分析(ANOVA)两两比较误用独立样本t检验单因素方差分析设计3组以上的均数比较,如果总体比较有差异,需进行两两比较,一般用SNK法或LSD法。但部分研究者却将资料进行拆分,应用独立样本t检验进行两两比较,导致第Ⅰ类统计学错误发生率(假阳性率)增加,从而掉进了一个常见的“统计陷阱”,使所得结论可信度大大降低甚至得出错误结论。SNK法与LSD法虽然并非等价,实质是一致的。SNK法一般用于经方差分析结果具有统计学意义时才决定进行的两两事后比较,而LSD法可用于方差分析不足以具有统计学意义时也能进行两两比较[1]。比较两种方法在SPSS的输出结果形式,SNK是“分堆”比较,一目了然,对于组别数较多的研究更为好用,但没有具体P值,而LSD是在进行“两两”比较时,能给出具体的P值。
1.2两两比较时检验水准的重新调定χ2检验或秩和检验3组以上整体比较有差异时,需应用分割法进行两两比较,这时检验水准应由原0.05调定为0.0167,否则会增加第Ⅰ类统计学错误的发生率。特别当P值处于0.0167~0.05时,按照P<0.0167的标准,差异无统计学意义,而按照P<0.05的标准,却有意义,与事实相悖,出现假阳性,很容易得出错误结论。这种分割法有时很保守,当行列表资料分组多且为有序时可用Mantel-Haenszel卡方检验,也称线性趋势检验(testforlineartrend)或定序检验(Linear-by-Lineartest)[2]。统计路径:用SPSS进行计数资料的趋势检验,在输出结果中读取线性关联检验统计量(Linear-by-LinearAssociation,LLA),如P<0.05可得出随着病种级别的升高,检测指标逐渐升高的趋势。
1.3临床诊断试验中的统计学方法应用在临床诊断试验研究中,经常选取单项计量指标或者联合计量指标以诊断某种疾病,若仅用初级统计学方法如t检验、单因素方差分析等往往不能有效挖掘信息,此时应采用受试者工作特征曲线(ROC)对检测结果进行分析评价。ROC曲线分析基本原理是通过诊断界点的移动[3],获得多对灵敏度和误诊率(1-特异度),以灵敏度为纵轴、误诊率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大诊断价值越高。ROC曲线很直观,能根据敏感性与特异性之和最大化原则自动产生最有效的诊断临界点。具体路径可以参考相关统计专著[3]。统计学处理一般描述为:采用SPSS(版次)统计软件分析数据,对单项及联合检测结果作图绘成ROC曲线,计算曲线下面积(AUC)和标准误,其中联合检测结果变量即预测概率由Logistic回归产生(也可以用判别分析得出)。计量资料应用-x±s表示,运用独立样本t检验及单因素方差分析,两两比较采用SNK及LSD法,计数资料采用χ2检验。检验水准为0.05。具体内容可据情而定。
1.4重复测量资料的方差分析误用拆分文件的t检验或方差分析如研究共设3组,每位患者在3个时间点均查某项血指标,部分作者在处理此类数据时,常误将纵向(同一时间点3组的比较)与横向(同组3个时间点的比较)数据均应用拆分文件的t检验或单因素方差分析来处理,结果导致统计学第Ⅰ类错误发生。此组数据实质是重复测量资料,应采用重复测量资料的方差分析。SPSS中的统计路径:数据-分析-一般线性模型-重复度量。研究者可以参考相关书籍进行处理[3]。
1.52×2析因设计及析因方差分析实验是2×2析因设计时,分组有两个因素,A与B,故分组为A、B、O、A+B,这个设计在析因设计研究中很常用,但常会出现分组设计正确,却没有用析因设计方差分析。析因设计与单因素方差分析不同[4],它不但能分析治疗效果中处理因素的单独效应和主效应,还能分析因素间的交互效应,并能提高检验效能。非统计专业的研究者进行析因分析可能稍有难度,可参考相关统计学书籍提供的统计步骤进行此类分析[3]。
1.6Meta分析Meta分析是循证医学系统评价常用的方法[5],应用时需注意统计学处理中计数资料采用比值比(OR)作为效应变量。具体路径:先进行异质性检验,当P>0.05时,认为同质,选择固定模型;P≤0.05时,不同质,此时可采用敏感性分析或分层分析等异质性处理,使之达到同质后再选择固定模型;若采用异质性处理仍未达到同质,则采用随机模型,以上统计路径均需交代清楚。Meta分析的结果是以“森林树”体现的,审校中我们经常遇到作者绘制的“森林树”左上角“文献、对比、结果名称”等内容显示为“?”,这是由于部分版本的RevMan软件不能输入中文,此时可以考虑省去,或用Photo-shop软件添加相应中文。Meta分析作为一种高级统计方法,专业性要求较高,作者可参考循证医学类权威杂志上的文章格式,如《中国循证医学杂志》中“论著•二次研究”栏目的循证文章。
2科技论文中统计学处理的相关表述
2.1资料与方法中具体统计路径的描述“统计学处理”的内容常位于论文资料与方法的最后一段,一般来说包括统计软件名称及版次、统计描述、统计方法、检验标准等内容,亦可细致交待每个表格的具体统计方法。经典例子如下,“统计学处理:采用SPSS(版次)统计软件分析数据。计量资料用均数±标准差表示,采用单因素方差分析,两两比较采用SNK法及LSD法。检验水准为0.05”。上述内容包括了大致的统计方法,即具体的统计路径。此部分内容,没有绝对统一的规定[6]。常见的问题有:统计学方法描述不全、内容过于简单、存在粘贴抄写痕迹等。如部分论文的统计学处理中提及“以α=0.05为检验水准,P<0.05为差异有统计学意义”这句话,这在统计学上实质是一个重复句,保留其一即可。
2.2结果中具体P值的标注现在的统计学处理手工计算的较少,一般均应用统计软件,最常用的软件如SPSS、SAS均能给出具体P值。但部分论文的结果表述中却未标明具体P值,作为科技论文是不够严谨的,建议作者在表述研究结果时注明具体P值,增加论文可信度的同时,可用于再次分析。
2.3表格制作统计表设计需规范,应体现统计设计内容。部分表格存在内容割裂、组别名称违反表格简洁化原则、表下注释繁琐、横标目与纵标目颠倒等情况。建议作者写作论文时参阅相关统计学教程及杂志稿约。医学统计学教学在中国的医学教育特别是高层次教育中举足轻重。一项课题从一个好的创意开始到实施、结题,统计学方法始终贯彻其中。不管是临床试验研究、实验性研究、观察性研究,还是临床测量误差与诊断试验,如果没有规范性的统计设计、精确的统计分析、科学的统计学解释与表述,很难获得学术上的认可[1]。目前在统计学的具体应用中,研究课题开始设计时就有统计学专家参与已成为较流行的趋势。许多专业统计学专家或研究者在不停的进行“统计基础”的研究,以创造更多的数理统计方法。对于非统计专业的研究者来说,统计学的学习主要侧重于应用。在应用统计学教学中,一般分为4个档次或阶段来进行,首先通过学习医学统计学课本获取统计学思想、原理和方法,其次学习统计软件相关书籍掌握数据到统计结果的转化,再学习统计表达与描述书籍达到书写统计学报告能力,最后可以学习如何出具统计审阅报告。医学科技工作者亦可按照这个顺序学习以提高统计能力。
本文html链接: http://www.istpei.com/qkh/22093.html