炼数成金 门户 科学探索 学术 查看内容

有些学者,每5天就能发一篇论文

2018-9-25 10:19| 发布者: 炼数成金_小数| 查看: 15832| 评论: 0|来自: Nature自然科研

摘要: 如果说论文的署名是学术界的货币——那么有些研究者堪比印钞机。我们在Scopus数据库中搜索了在2000年-2016年间任何一个自然年里发表论文超过72篇(相当于每五天一篇)的作者——如此高产令人难以置信。我们尽可能地 ...

网络 数据库 学术 超级计算 科学探索

原文作者:John P. A. Ioannidis(斯坦福大学医学教授), Richard Klavans & Kevin W. Boyack( SciTech Strategies公司研究者)

如果说论文的署名是学术界的货币——那么有些研究者堪比印钞机。我们在Scopus数据库中搜索了在2000年-2016年间任何一个自然年里发表论文超过72篇(相当于每五天一篇)的作者——如此高产令人难以置信。

我们尽可能地将论文限定为“完全论文”——期刊论文、会议论文、实质性评论和综述,而不包括社论和读者来信等,结果搜到了9000多人。我们希望这样做能帮助理解科研署名的含义。

插图:David Parkins
要提前说明一下:我们没有证据证明以上作者有任何不当行为。一些大型研究所里的科学家是有可能有这么多的署名论文的。我们的发现表明,某些领域或研究团队对论文署名已经有了可操作的定义。

绝大多数高产作者(7888名,占86%)发表的是物理论文。在高能物理和粒子物理领域,有一些项目是由超过一千人的大型国际团队进行的。所有成员都会署名为作者,表示他们是团队的一员,但并不意味着他们撰写或修改了论文。因此,我们排除掉了物理领域的作者。

在剩余的作者里,有909人有着像中国人或韩国人的名字。因为Scopus无法精准区分这两种名字,因此有可能错把几个不同人的论文归入一起了。

如果仅限于2016年的话(这一年对中国人和韩国人名字的辨识算法改进了),有至少12名,也可能是20名以上的高产作者来自中国,在当年居于所有国家之首。我们认为这可能和中国对发表论文给予现金奖励的政策有关,也可能有某种腐败。

考虑到人名辨识所存在的问题,我们在后续的分析里也排除掉了这些人。除此之外,我们还排除了团队署名、错误(例如期刊新闻误被分类为完全论文)、重复的论文条目、或是被误归入会议组织者名下的会议论文。

这样就剩下265名作者。在排除掉各种不适用情况之后,高产作者的数目从2001年到2014年增加了20倍,之后就没有继续增长(见图“高产作者数量激增”)。与此同时,论文作者的总数只增加了2.5倍。

来源:J. P. A. Ioannidis, R. Klavans & K. W. Boyack
我们给所有265名作者发了电子邮件,询问他们为何能如此高产。最后收到了81份回复,回答的主要内容不外乎刻苦工作、热爱科研、指导大量青年科学家、带领研究团队甚至多个研究团队、广泛合作、同时进行多个领域或核心服务的研究、能够获取大量合适的资源或数据、大型项目的累积、慷慨或乐于分享等个人性格、成长经历、以及每天只睡几个小时。

有一半高产作者都来自医学和生命科学领域(医学101人,健康科学11人,脑科学17人,生物学6人,传染病学3人)。如果不算会议论文的话,将近三分之二(86/131)都属于这一领域。在这265人里,有154名作者在至少两个自然年里每五天发表一篇论文;69人在至少四个自然年里每五天发表一篇论文。一篇论文包含10-100名作者很常见,特别是在医学和生命科学领域。但是粒子物理领域这种论文署名超过100人的情况就不常见了。

保持较高产记录的是材料科学家井上明久(Akihisa Inoue)。他曾任日本东北大学校长,是多所知名学术机构的成员。他在2000年-2016年间有12年达到了我们的高产标准。从1976年起,他的名字出现在了2566篇Scopus收录的完全论文中。他因为自我重复发表过往研究而撤回7篇论文。我们又用谷歌搜索了排名在他之后的20名高产作者的撤回记录,只有一人(Jeroen Bax)撤回了一篇论文。

这265名高产 作者来自37个国家,排名第一的是美国(50人),其次是德国(28人)和日本(27人)。美国所占的比例(19%)大致等同于美国所发表的科研论文数比例,而德国和日本高于其所发表论文占比。马来西亚(13人)和沙特阿拉伯(7人)的高产作者占比异常的高——这两个国家都对发表论文给予现金奖励。

在某些研究机构,高产作者比较集中,他们通常是同一个项目里的成员。例如,荷兰鹿特丹伊拉斯姆斯大学有9名高产 作者,比其它任何研究机构都多。其中7人共同署名的大多数是关于鹿特丹项目(Rotterdam study)及其后续第R代项目(Generation R study)的论文。鹿特丹项目是一个接近30年之久的流行病学研究,而第R代项目跟踪了数千名年龄较大的成年人的多个健康参数,并发表了数千篇论文。

5名来自哈佛大学的高产作者也经常共同发表队列研究相关的论文。有11名所属机构不同的高产作者都属于同一个大型队列研究项目组:欧洲癌症与营养前瞻性调查(European Prospective Investigation on Cancer and Nutrition)。其它大型流行病学研究也榜上有名。心脏病学和晶体学领域也有很多高产作者。

生物和医学领域里的高产作者展现出了和粒子物理与高能物理领域不同的模式。在瑞士日内瓦的欧洲粒子物理学实验室CERN里有数千科学家共同工作,有数百到上千作者署名的论文是非常常见的。在晶体学领域,论文只有不多的几个作者署名。在流行病学和心脏病学领域,长长的作者列表只出现在某些似乎有此传统的研究团队里。

这就引出了一个问题,即署名到底意味着什么。例如,美国国立卫生研究院就规定了做了哪些工作后有资格在论文上署名:积极指导,设计并做实验,除“非常基础的”工作之外的数据收集和分析,以及起草论文。申请资金或远程指导不算在内。最近有一项问卷调查了分处各个地区和学科领域的6000余名作者,其中大多数人认为起草论文、解读结果和分析数据应当有署名资格,但依据地区和学科不同,观点也有所不同。

署名标准
可能更为广泛接受的署名条件是国际医学期刊编辑委员会于1988年订立的温哥华标准。其中指出作者必须做了以下全部四件事才可以署名:参与设计实验、开展实验或分析结果;帮助撰写或修改论文;审核出版时的论文版本;为论文内容负责。

国际医学期刊编辑委员会认为监督、指导或申请资金并不够署名资格。我们观察到一些作者在成为正教授、院长或正教授兼院长后才变得高产的。很常见,或者说可能是意料之中的现象是,科学家在大型研究中心担任领导职务后产量就变高了。例如,临床心脏病学家在担任领导职务之后发表的论文更多了(尽管还有繁重的临床和行政管理任务)。

有时产量增长非常惊人:有些心脏病学家在效率较高的时候一年发表的论文数是35岁-42岁时平均一年发表论文数的10-80倍。而卸任之后论文数量又会大幅降低。二十年前的另一项研究注意到了类似的模式。

一个意外的发现是,很多高产作者将许多论文发表在了同一本期刊上,比较明显的有《结晶学报,E辑:结构报告网络版》(2014年重启为《E辑:晶体通讯》,并在IuCrData上发布简短的结构数据报告)和《结晶学期刊-新晶体结构》。

有三名作者分别在前一本期刊上发表了600多篇论文(Hoong-Kun Fun、Seik Weng Ng和Edward Tiekink);也有三名作者分别在后一本期刊上发表了400多篇论文(Karl Peters、Eva Maria Peters和Edward Tiekink)。还有三名作者(Anne Marie Api、Charlene Letizia和Sneha Bhatia)在《食品与化学毒理学》增刊上发表了很多篇关于香味材料的综述。

Scopus所收录的期刊通常被认为是高质量期刊。高产作者的引用数通常很高,但不同作者间相差很大。中位数是每个作者被引19805次(最少380次,最多200439次)。2000-2016年高产作者的完全论文中位数是677篇。在所有高产作者里,署名最末的有42.5%,第一作者的占7.1%,单独署名的占1.4%。署名居中的(即:非第一、最末或单独署名)有51%,但是不同作者之间从最少的2.1%到最多的98.5%都有。

无可否认,我们为识别高产作者所做的工作还显粗糙。但其主要目的是提出更高层次的问题,即署名意味着什么。

无可避免的是,署名是否合理与何为合理对每个作者和每篇论文都有所不同,而不同领域里的标准也不一样。很可能有人通过作弊、胁迫或人情获得署名。我们不可能在数据中评估这些情况。我们也没有阅读论文的贡献声明——未包括在Scopus数据库内。无论如何,即使是贡献声明也可能有人作弊,或者不甚准确。

目前而言,还需要进一步的工作来使这些数据达到较佳的标准化水平。例如,根据学科、研究方向或特定的研究团队进行调整。

作者怎么说
为了更好地理解署名规范,我们向2016年的81名高产作者发送了电子邮件问卷,询问他们是否符合所有四条温哥华标准。在作答的27人里,大多数说自己不符合(见“问卷调查”)。几乎所有回答者都来自于美国或欧洲的研究机构。唯二来自于其它地区的作答者都说自己在大多数论文里都不符合温哥华标准。问卷可能低估了不符合温哥华标准的占比。

问卷调查
问题:你有多少署名论文满足医学领域的四条署名标准?

2016年的81位高产作者中有三分之一的人作了回答。在这27人里,19人承认他们逾25%的论文至少不满足其中一条标准。11人说他们逾25%的论文至少不满足其中两条或更多的标准。

• 标准一:对研究的设想或设计做出了重要贡献;或是收集、分析或解读了论文中的数据(27人里有9人承认仅有不到75%的论文满足这一标准)。

• 标准二:起草论文,或对其中的重要知识内容进行了关键修订(27人里有9人承认仅有不到75%的论文满足这一标准)。

• 标准三:审核最终发表的论文版本(27人里有3人承认仅有不到75%的论文满足这一标准)。

• 标准四:同意为论文的所有内容负责(27人里有14人承认仅有不到75%的论文满足这一标准)。

不是所有作者都审核了自己论文的最终版本,但是都认为这么做是署名所必须的条件。59%的回答者(27人中有16人)说自己在2016年发表的论文里,自己的贡献比其他署名作者贡献都高的论文占25%以上。

问题:用你自己的话说,你认为署名的标准应该为何?
对于这个问题的回答基本可以总结为“做出重要贡献”,但是也反映出了关于署名权归属的不满之处。一位科学家说:“我个人不会把这些论文认为是‘我的论文’,也不会写到我的简历里,因为‘署名作者’和‘团队全员署名’之间还是有区别的。”另一位作者指出,署名经常和资历挂钩。也有作者认为应当有更清楚的区分:“我认为署名应该分等级——而不是通过署名顺序默认出的等级!”

一个有趣的观察方向是,标注贡献的新方式对署名标准会有什么样的影响,例如数据引用或正式的作者贡献分类。署名标准在同一领域内甚至同一团队内都会有区别。例如,传染病学和心脏病学的一些团队显然在署名上就更大方,其他团队就采用更严格(可能也更合适)的署名标准。

对于同样的任务和贡献,某个队列研究可能会给20人署名权,而另一项研究就只给3个人,甚至一个人都不给。例如,全基因组研究通常会包含几十名作者。但有一个惊人的反例,最近有一篇全基因组论文只有一个作者,看起来这名研究员做的工作量放到其他团队发表的类似论文里能让十几个人拿到署名权。一些证据显示,平均每篇论文的作者数量出现增长,其中体现的并不是团队里需要更多科学家做工作,更多的只是“不发表就出局”的压力所致。

常用的引用数和影响力指标都应当做出相应的调整。例如,如果增加更多作者会使每个作者的贡献度缩水,那么不必要的多人署名就会减少。我们发现,在似是通过共同署名获得好处的30名高产作者里,有6名心脏病学家和24名流行病学家(其中包括研究群体遗传学的)。(这些科学家的H指数相对于按共同署名调整过的H_m指数的比值较高。)

总体而言,这些高产作者可能包括了一些更为活跃和优秀的科学家。但是,这种发表论文的模式也可能反映了学科中的特殊规范,甚至更为严重的现象。对署名权的定义过松,以及将对研究者的评价简化为数论文都会影响到论文的署名。我们仍然需要根据各学科的规范,具体考察每个科学家的总出版产出。当然了,最有效的还是去读读这些论文,理解作者到底做了什么。

声明:文章收集于网络,如有侵权,请联系小编及时处理,谢谢!

欢迎加入本站公开兴趣群
高性能计算群
兴趣范围包括:并行计算,GPU计算,CUDA,MPI,OpenMP等各种流行计算框架,超级计算机,超级计算在气象,军事,航空,汽车设计,科学探索,生物,医药等各个领域里的应用
QQ群:326600878

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-10-21 03:34 , Processed in 0.202190 second(s), 25 queries .