当神经心理学家、《恢复性神经病学和神经科学》杂志主编BernhardSabel使用他的可疑论文检测器投入工作时,他被后者的发现“震惊”了。在筛选了大约5000篇论文后,他估计,2020年发表的神经科学论文中,有34%可能是编造或抄袭的;而在医学论文中,这一数字是24%。5月8日,他和同事在论文预印本平台medRxiv上发布了相关报告。这两个数字远高于他们计算的2010年的水平,也远高于2022年出版商集团报告估计的2%的基线。
新的发现凸显了人们普遍怀疑的事实,即期刊上充斥着越来越多的来自论文工厂的内容。5月2日,出版商Hindawi在一份声明中强调了这一威胁:Hindawi关闭了4本被论文工厂文章“严重损害”的期刊。
(资料图)
Sabel的工具依赖两个指标——使用私人、非机构电子邮件地址的作者,以及指明与医院有联系的作者。这并不是一个完美的解决方案,因为假阳性率很高。其他可疑论文检测器也面临着类似问题,但开发人员很少透露他们的工具是如何工作的。
尽管如此,这些检测器还是给人们带来了战胜论文工厂的希望。论文工厂大量炮制伪造的论文,其中包含部分或全部剽窃、捏造的文本、数据和图像,通常由“论文枪手”进行润色。一些论文得到了作者邀请的不严谨审稿人的认可。最近出现的人工智能工具(如ChatGPT等),增加了这种情况出现的可能性。
为了反击,代表120家出版商的国际科学技术与医学出版商协会(STM)日前推出了一项名为“诚信中心”的服务,以开发新的工具。STM没有透露太多有关检测方法的信息,以免向论文工厂“通风报信”。
“这有点像一场军备竞赛。”“诚信中心”产品总监JorisvanRossum说,伪造论文的一个可靠线索是引用了许多撤回的论文,另一个线索是通过精心设计的、看起来像合法机构地址的互联网地址发送论文和评论。
包括爱思唯尔、施普林格·自然和威利等在内的20家出版商正在帮助开发“诚信中心”工具,其中10家出版商预计将使用该组织4月推出的一个论文工厂检测器。STM还希望在今年试行另一个工具,以检测一稿多投的稿件。一稿多投被认为是不道德的,这类文章有可能来自论文工厂。vanRossum说,这种大规模合作旨在改善出版商各自为战的情况,并在整个出版业共享工具。
但他同时强调,“这永远不会是一个(完全)自动的过程”。相反,这些工具就像“垃圾邮件过滤器”,你仍然需要定期查看这些工具,以检查被错误标记的合法内容。
由于该服务刚刚推出,STM尚未生成准确率或假阳性率的数据。但是,尽可能多地“捕捉”可疑论文通常会产生更多的误报。在测试样本中,Sabel的工具正确标记了近90%的伪造或撤稿论文。然而,它同时将44%的“真“论文标记为伪造论文,因此检查结果仍需要熟练的审稿人确认。
审查可疑论文可能很耗时。施普林格·自然负责研究诚信的主管ChrisGraf透露,2021年,施普林格·自然对大约3000篇疑似来自论文工厂的论文进行了发表后审查,完成这项工作需要10名兼职和全职工作人员。
4月发布的最新期刊指南可能有助于减轻工作量。由出版商资助的非营利组织出版伦理委员会说,即使证据是间接的,他们也可能会决定拒绝或撤回疑似来自论文工厂的论文。它之前的指导方针鼓励期刊向每篇可疑论文的作者询问更多信息,这可能会引发反复交锋和冗长讨论。
一些外部人士怀疑期刊是否会兑现打击造假的承诺。出版商采用金色开放获取模式,即期刊向作者收取费用,而论文发表后所有人可立即免费阅读。这种模式下,出版商有经济动机发表更多而不是更少的论文。
科研机构对科学家施加的发论文压力也是一个障碍。van Rossum表示:“我们希望与机构合作,探讨如何取消一些可能产生有害影响的(专业)激励措施。”Sabel补充说,这种压力可能会迫使没有研究经验的临床医生转向论文工厂,这就是为什么医院附属机构可能是一个危险信号的原因。
一些观察人士担心,论文工厂生产的论文会转移到影响力较低的期刊上,因为这些期刊用于检测的资源更少。但如果许多期刊集体行动,整个论文代写行业的生存能力可能会萎缩。