那些年,收到的让人无法回答的审稿人意见

内容来自:“小白学统计”微信公众号,感谢作者授权。
写文章投稿,审稿人给出的建议是五花八门。林子大了,什么鸟都有。同样,审稿意见多了,什么内容都有。虽然我们尊重审稿人及其意见,然而,总有一些审稿意见让人真的无法回答,又难以反驳。本文聊一下我个人遇到的一些让人真的难以回答的审稿意见,看看各位朋友有没有同感。

一、logistic回归只能

发病和不发病的分析

这是10多年前的一位审稿人给的意见,当时我还在读研究生。帮别人分析了一篇文章,分析护士满意度的影响因素,利用问卷调查,结局分为满意和不满意。分析方法采用了logistic回归进行多因素分析。投稿后,被审稿人拒稿,拒稿意见是:
logistic回归只能用于“发病”和“不发病”的分析,不能用于“满意”和“不满意”的分析。
看到这个审稿意见,第一反应是错愕、惊讶,然后才是无奈、无语。实在不明白审稿人怎么会有这种想法。当时作为一所三流医学院学生的我,第一次感到,原来我心目中觉得遥不可及的杂志,也并不是那么完美无瑕。
如果logistic回归只能用于“发病”和“不发病”的分析,那我实在想不出在经济学领域和社会学领域、心理学领域等为什么还要讲logistic回归?难道不怕被人质疑吗?

二:你用spss做,不要用R做

这是去年的一个审稿意见,也不是我的文章。一个朋友的文章,他用R做了数据分析,我也看了这个文章,中规中矩,没什么特别创新,但也没什么大的漏洞。
然而最后审稿意见中其中一条真的让我大跌眼镜,审稿人建议用spss做,不要用R做
我真的怀疑,难道这位老师只能看懂spss给出的结果,看不懂R给出的结果?对于常规方法,你用什么软件,其实差别并不大,结果都是一致的。我这也是第一次遇到有人建议重新换个软件,重新给结果。然而你不敢说这句话,最后还得在回复里写:谢谢审稿老师的宝贵建议,我们已经改成了spss的结果。虽然其实并没改,因为结果完全一样。
我个人一直认为,用什么软件看自己习惯。虽然我个人习惯用SAS(毕竟用了十多年,都有感情了),然而我也会用SAS jmp、R、Stata,或者一些小众软件,如LISREL,MLwin等。没有人规定某种结果必须用某种软件,除了临床试验中,FDA会推荐某种软件。

三:不要用logistic回归,

要换一种更高级的方法

一个朋友写一篇预测类文章,帮朋友建了一个预测模型,方法用了logistic回归,预测效果还不错,训练集、预测集的ROC基本都在90%以上。兴冲冲投稿,然后被审稿人一句话泼了一头凉水:你不要用logistic回归,换一种高级的统计方法
心里很凉,不是因为文章没接受,而是因为这句话。我一直认为:统计学方法没有低级和高级之分。因为我一直想不通什么算是高级?线性回归比t检验高级吗?logistic回归比卡方检验高级吗?神经网络比logistic回归高级吗?劳动不分贵贱,方法竟然要分高低?
统计方法更多的是适用与否,不同数据、不同目的都需要考虑相应的不同方法。尽管近几年机器学习、深度学习这些充斥着我们的学术领域,感觉好像在讲座上不提点人工智能都不好意思发言,似乎传统的这些回归方法都已经羞的应该躲到地缝里去。
然而我还是想说,方法始终是方法,软件始终也只是软件,所有的统计分析中,人才是第一位的。不要盲目相信方法、相信软件,更重要的是,要相信自己。
logistic回归是有自身的缺点,但所谓换种更高级的方法,我个人认为,不应该出自一个专业统计学家之口。也许,审稿人认为,像这些机器学习方法是高级方法,应该用这些,然而这些方法也并非尽善尽美。作为文章来说,结果和专业解释都没有问题,却让换种所谓“高级”的方法,确实有点匪夷所思。

四:计数和等级资料的关系应该

用秩和检验,不能用卡方检验

某文章中,我做了一个分析,分了三组:小剂量、中剂量、大剂量,比较三组的一些指标,如性别、是否远处转移等,基本都是一些分类资料。如下图所示:
那些年,收到的让人无法回答的审稿人意见
然后一位统计学家就不同意了:你这个数据,一个是等级资料(估计说的是分组变量),一个是计数资料(估计是指性别、年龄等分类资料),不能用卡方,这种数据应该用秩和检验。
我看了意见,不由得长叹一口气。都已经2020年了,竟然还有统计学家提这种意见(事实上,审稿人是不是统计学家我还真不确定)。我翻遍了所有的统计学课本,也没有人规定说:一个等级资料、一个计数资料(实际上是分类资料),要用秩和检验。
即便是一个等级资料、一个(无序)分类资料,也需要根据实际情况来考虑所用的方法。如果(无序)分类资料是分组变量,等级资料是结局变量,一般使用秩和检验;但如果等级资料是分组变量,(无序)分类资料是结局变量,那用秩和检验就严重错误了。实在搞不清审稿人为什么要逼良为娼,逼对改错。

五:你的回归分析的表格要转置过来

某文章中,我帮一个朋友做了一个回归分析,大致样式如下(只显示了其中的3个变量,而且把具体的变量名改成了x1-x3):
那些年,收到的让人无法回答的审稿人意见
然后就是这个表格,审稿人提出了意见:这种表格有必要列吗?如果列的话,注意主谓倒置过来
我看完这个意见,只觉得胸口一阵发闷,差点眼前一黑。我不知道审稿人到底有没有见过回归分析的结果,如果要转置过来,那就是下面这种样式:
那些年,收到的让人无法回答的审稿人意见
说实话,这种样子的回归分析结果我还真的没在文章里见过。到底什么是主谓?我倒是想根据审稿人意见修改,然而真的下不了手。最后只能各种委婉解释,说明我们才疏学浅,能不能放我们一马。
我想实际中这种情况可能并不在少数,一旦遇到这种情况,我也会很郁闷,尤其是朋友把这些审稿意见给我,让我帮忙看看怎么回复。说实话,其实真的不知道怎么回复。真的很为难,这种为难的程度,借用friends里一个场景:
有个人批评monica在饭店做的汤很难喝,monica直接带着刚做好的一碗汤,和joey一起去找他,当场让那个人喝。那个人不想喝,joey说:
那些年,收到的让人无法回答的审稿人意见
吃完后,monica问自己做的汤到底怎么样。那个人回答恰反映了收到某些审稿意见后的为难心情:
那些年,收到的让人无法回答的审稿人意见
那些年,收到的让人无法回答的审稿人意见

那些年,收到的让人无法回答的审稿人意见

医咖会面向医生个人、医院/单位、企业提供各种科研服务,包括研究设计、统计分析、EDC系统、科研培训等,详情查看:医咖会可为你提供这些科研服务,助你解决各种科研难题!。快加小咖微信(xys2019ykh)或扫描以下二维码加小咖微信咨询吧。

那些年,收到的让人无法回答的审稿人意见

生物医学科研方法

【8文合集】彻底搞清楚单因素分析和多因素分析

2021-1-1 1:34:49

生物医学科研方法

最新发布丨国家卫生健康委关于印发三级医院评审标准(2020年版)的通知​

2021-1-1 1:45:14