统计分析过程的常见七宗罪,你可曾犯其中几条?

随着统计教育的普及,对于科研工作者来说,统计分析看起来慢慢变得不再是问题了,统计描述、t检验、方差分析,乃至多重比较、卡方检验貌似都可以通过SPSS统计软件分析快速形成。但统计分析有一些问题还是容易犯错,有些是原则性的问题、有些则是小细节问题,我列举基本统计研究的几个问题,称之为七宗罪。

1、项目与论文研究设计,没有考虑样本量的计算

之所以把这个问题摆在第一位,是因为这个问题基本上十之八九就没有很好考虑,无论是一个项目的申报书、还是一个毕业论文的开题、一篇论文分析,均没有考虑好样本量的多少?经常采用304060例这样齐整的样本量,怎么来得?自己想想的。更不要说动物试验了!其实动物试验也需要估算样本量,不能因为动物不值钱,动物也有伦理的!
比如有下文,没有样本量计算方法,怎么设定60例呢?为什么就是60例呢?即便60例足够,也不严谨!
统计分析过程的常见七宗罪,你可曾犯其中几条?

2、所有定量数据,统计描述都用均数±标准差

你见过什么时候中文的学术论文,定量数据采用中位数和四分位数描述了?太少太少了!大家都喜欢用均数±标准差。但你没有考虑,均数能否代表着这一堆数据吗?你没有发现有些时候标准差远远大于均数?有时候数据有好一些异常值?固定思维模式要改改了,很多时候中位数和四分位数间距反而能够更好体现数据的特征。
一般情况下,判断数据是不是正态分布的简易方法是,当指标只能取正值或只能取负值时,“标准差接近或大于均值时数据不是正态分布成立”。
一旦出现现象,就不能用均数±标准差了,否则论文发表会被审稿人发现。
比如下文,用均数±标准差,显然不合适。
统计分析过程的常见七宗罪,你可曾犯其中几条?

3、所有定量数据的比较,都采用t检验

早些年这一现象非常普遍,现在随着统计思维的普及,很多人知道了偏态数据差异性比较时候采用非参数秩和检验来代替。但总的来说,基本上采用t检验来进行两组定量数据的差异性比较仍然是固定思维?如果没有你数据分析之前没有考虑数据正态性的问题,没有考虑两组数据方差是否相似,那么就容易犯错。再次强调:严重偏态分布的数据用秩和!秩和!秩和!
 

4、无论什么样的分类数据的比较,一直都是卡方检验

卡方检验是用来毕竟不同组数据之间率或者构成比有无统计学差异。没有错,率的比较是采用卡方。但有没有考虑过你的卡方条件是否符合呢?当样本量较小,或者某一行或者一列数据太少的时候,卡方检验不好使用,应该是用Fisher
这里说一下,建议以后少用卡方,多用Fisher,因为Fisher才是最准确的!哪一种场景下都没有错!
比如:下列表格,属于样本量较少的情况,应该用FIsher确切概率法
统计分析过程的常见七宗罪,你可曾犯其中几条?
又比如:试验组和对照组的癌症特征比较,也应该用Fisher确切概率法
统计分析过程的常见七宗罪,你可曾犯其中几条?
这里强力建议: 多分类数据差异性比较,Fisher确切概率法才是首选,不要过于依赖卡方检验

5、方差分析多重比较,用t检验

这宗罪早些年很多,如今已经被死死遏制在较低的犯罪水平,凡事讲到方差分析都要提到,两两比较不要用t检验!你现在还犯错?那不应该呀!两两比较要采用类似于LSD, BonfferonitukeySNK的方法,推荐使用Bonfferoni方法,相对保守的一种方法。
 

6、P值小于0.05,被认为有显著性差异,P值小于0.01,被认为有极其显著性差异

P<0.05英文名字是statistical significance 没有错,但是由于显著性差异给人带来误导(感觉组别与组被之间的差异很大),现在医学研究不再强调显著性差异,P<0.01更不能说差异极其显著。无论   P<0.05还是P<0.01,只能说,差异具有统计学意义或者具有统计学差异。
比如下文,其统计文字描述是不妥当的
 统计分析过程的常见七宗罪,你可曾犯其中几条?
又例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“P<0.001”,则认为甲药极显著地优于乙药;若得到“P<0.01”,则认为甲药非常显著地优于乙药;若得到“P<0.05”,则认为甲药显著地优于乙药。

7、没有遵循随机化、对照、重复原则评价处理因素的作用

无论是t检验、卡方、秩和、方差分析的分析结果,其结论是否可靠均需要严谨的设计。只有在随机化设计、合理均衡对照、一定样本量的基础上,通过假设检验的方法得到的结果,才能够被认为是处理因素发挥作用。而随意分组、自身前后配对研究、甚至空白对照,都没法证明处理因素的作用。观察性研究比如调查研究,差异性的统计分析方法更说明不了什么问题,只能说组与组有差别!
例如:
这是一项回顾性队列研究,所有180病例为医院手足口病的住院患者。按患者是否应用中药治疗分为常规治疗组(对照组)与中药治疗组(治疗组)。比较中、西医治疗的效果。结果方面,两组患者的有效情况采用卡方检验,差异有统计学意义(P<0.01),该论文认为中医药治疗效果较好。显然这样的结论不妥当,不够严谨。 统计分析过程的常见七宗罪,你可曾犯其中几条?
好了,基本统计方法,你犯了几宗罪?


-本文结束-
--广而告之--
公众号主持者:郑老师,浙江中医药大学医学统计学教研室主任。这里不妨广而告之,如果您有一个临床项目,正处于设计或分析阶段,不妨联系郑老师统计团队,我们可以帮助您更好地推动临床项目的数据分析。微信号ZZ566665(务必请注明“统计服务”)。
--学习资源免费送--
本公众号作为医学数据分析公众号,提供一些更多原创、免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.医学研究样本量如何计算?原创高清教程视频来了,完全免费下载!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
如果您觉得文章不错,
为我们打“call”,
点击“分享”
生物医学科研方法

期刊介绍: 影响因子7.246

2020-12-31 19:55:58

生物医学科研方法

2020⇋2021

2020-12-31 21:55:10