在北欧的满月期间,冬季年轻女性的自杀风险增加。 神器还是新发现?

在我们基于瑞典死因登记的研究中,我们无法复制 MR 发现冬季满月期间绝经前妇女自杀率增加的结果。 [6]. 相比之下,我们发现,在完整样本中、男性和女性以及绝经前女性中,冬季观察到的自杀百分比非常接近于满月季度的预期 25%。 贝叶斯分析表明,与替代假设(一些变化)相比,证据更支持零假设(冬季满月期间自杀人数没有变化)。 我们还探索了夜间的纬度和人工亮度,这两个调节变量已被提出来解释芬兰研究与 PH 之前的奥地利复制研究之间的差异 [11],这也未能复制 MR 的发现。 我们在北部和南部城市以及人工夜间亮度更暗和更亮的两个城市都发现了无效结果。 对北部城市绝经前妇女的回归分析有一个异常显着的结果,表明 最低限度 满月期间的自杀率,但在调整多次测试的 alpha 显着性水平后失去了显着性。 最后,我们在三个敏感性分析中发现了无效结果,其中数据被限制在与 MR 样本中相同的纬度(甚至更北),使用与 MR 相同的时间框架,并且八级月球使用了相。

因此,根据我们的研究结果,以及之前失败的奥地利复制研究,可以安全地得出结论,自杀率不会因冬月(或其他季节)的不同而不同,绝经前妇女和所有年龄段。 在男性中。 亚组分析表明,纬度和人工夜间亮度等中等变量不会影响月相与自杀率之间的关联。 此外,当前的研究和之前的奥地利研究是预先选择的复制研究,可以防止网络黑客攻击,例如通过定义任意子组或目的后结果测量。 当前研究和奥地利研究的统计功效均显着高于 MR 研究,从而增加了检测到较小影响的机会。

有许多值得讨论的含义。 我们的瑞典研究以及之前的奥地利转录组研究发现了接近完整的结果,因为在满月期间观察到的自杀比例非常接近预期的 25%。 这些结果,连同文献中报道的主要无效结果,强烈表明 MR 的结果是假阳性。 这并不奇怪,因为意外发表的研究结果通常是误报 [8]. 我们相信 MR 研究是与“产生”误报相关的动态以及科学界和出版系统如何处理它的一个例子。

我们只能推测 MR 发现最有可能的异常假阳性结果的原因。 众所周知,在数据集中创建太多子组会增加由于样本方差而导致结果偶然具有统计显着性的风险,即使在基组中存在完美的零相关性时也是如此。 [19]. 这就是为什么显着性水平校正通常用于防止子组中的误报。 此外,不清楚为什么他们的一些亚组和结果变量的 MR 以他们的方式定义,因为论文中没有提供任何理由。 例如,他们对冬季的定义是有问题的,因为它包括 11 月、12 月和 1 月。 占星学上,北半球的冬天从12月21日开始,所以冬天也可能从12月到2月来确定,这也是按照冬天的月份来定的。 相反,MR 可以使用从 12 月 21 日 +/ 45.7 天(11 月 5 日到 2 月 4 日)的确切范围。 类似地,不是将月相划分为四个象限(以及月亏/上蜡的月相合并为一个),而是可以使用更准确的划分,甚至可以使用最小信息损失的连续测量,正如 PH 在附加中使用的那样分析 [11]. 另一个批评点是更年期的停止,平均而言,更年期开始于 49 至 52 岁之间 [20],而 MR 将 44 岁或以下的女性归类为绝经前女性。 此外,MR 没有在论文中明确说明这些亚组是提前计划好的,还是包括探索性策略。 探索性分析没有错。 但是,如果异常检测仅发生在特定子集且没有合理的因果机制,则可能需要进行敏感性分析以验证稳健性。 至少,正如 PH 所指出的,这些结果应该明确声明为探索性的,并且可能是假阳性,需要重复,以避免产生分析正在测试预先存在的假设的错觉。 无论有意还是无意,未能参考探索性策略并报告后续分析,就好像它们是预先计划好的一样构成“网络黑客”和“意义搜寻” [7, 9, 17],或“HARKing”(在知道结果后假设) [21, 22].

众所周知,上面讨论的有问题的研究和发表实践导致了科学界的复制危机,因为许多研究结果无法复制,并且在复制和先前记录的研究中,零结果的百分比急剧增加。 [23] 和独立研究人员 [24]. 在这方面,尽管月球可能对自杀行为没有影响,但很少有出版物报道月相与心理健康问题之间的重要关联,这并不奇怪。 这些结果可能是假阳性的想法得到了以下事实的支持:关联主要存在于某些亚组中,并且这些研究以前没有注册过。 此外,据我们所知,这些研究都没有成功复制,或者失败的复制可能已经发表。 这些非凡的发现也与主流研究形成鲜明对比,主流研究发现月相与自杀风险之间没有关联。 但是,即使没有选择性传播和电子黑客攻击,抽样方差也应该仅凭偶然性导致一部分具有统计意义的结果,即使基本人群之间没有真正的关联,因为这是抽样和零假设检验的本质。 . 在假设正确的先验概率较低的情况下,显着结果为假阳性的风险较高 [8]月相与自杀之间的关联当然就是这种情况。 即使没有这些考虑,MR 发现 IRR = 1.35 (1.01-1.80) 在绝经前妇女中的影响应该引起怀疑,因为点估计具有显着的自杀性,并且最小影响非常接近于零效应。

有时,产生额外的假设来解释失败的复制不仅是为了改进科学过程,而且是为了防止假设被拒绝。 总是可以声称任何迭代都在某种程度上与原始研究不同,因此总是被认为是不充分的。 然后需要多少次失败的迭代才能将结果视为误报? 尽管先前研究中普遍存在无效发现,奥地利研究中普遍存在无效发现,但 MR 建议“有必要防止有充分记录的不愿接受超出规范的新颖建议、想法和发现”(Semmelweis -反射) [12]. 我们不否认月球对某些物种的某些生物学机制的影响 [25]. 我们也同意我们应该对新的和意想不到的结果持开放态度。 根据 Munafo 等人的说法,“然而,科学家面临的一个主要挑战是开放新的重要见解,同时避免误导我们以随机方式看待结构的倾向。随机数据)和确认偏差(倾向于关注与我们的期望或偏好解释一致的证据)和滞后偏差(仅在事件发生后才将其视为可预测的趋势)很容易导致我们得出错误的结论。 [22]. 在这项研究中,我们都试图解决 Mayer Rochus 提出的批评和其他假设。 [12] PH 的同行评审员,以及明显需要重复检测假阳性结果。 因此,我们希望我们的研究不仅能阐明月球对自杀行为的假定影响(这种影响通常不存在),而且还能揭示与科学中新的和意想不到的发现相关的动态。

#在北欧的满月期间冬季年轻女性的自杀风险增加 #神器还是新发现

Leave a Comment

Your email address will not be published. Required fields are marked *