新数据库揭示了数百名极端自引用科学家

根据最新发布的数据,世界上被引用最多的研究人员是一个折衷的人。诺贝尔奖获得者和著名的数学家都以不太熟悉的名字来称呼,例如印度钦奈的Sundarapandian Vaidyanathan。关于Vaidyanathan和其他数百名研究人员的突破之处是,对他们的工作的许多引用来自他们自己的论文或来自他们的合著者。

私营机构Vel Tech研发技术学院的计算机科学家Vaidyanathan就是一个极端的例子:根据PLoS Biology的一项研究,截至2017年,他已收到他本人或其合著者94%的引文这个月1。他并不孤单。该数据集列出了大约100,000名研究人员,显示至少有250位科学家从自己或合著者那里收集了超过50%的引用,而自我引用的中位数为12.7%。

从未被引用过的科学

这项研究可能有助于标记潜在的极端自我促进者,甚至可能是“养鸡场”。研究人员说,其中大量的科学家互相引用。加州斯坦福大学的医师约翰·约阿尼迪斯(John Ioannidis)专门研究元科学,他认为“引证农场比我们想象的要普遍得多。”工作。他说:“被引用率超过25%的人不一定从事不道德的行为,但可能需要更严格的审查。”

数据是迄今为止已发布的最大的自引用度量标准集合。正是在这些时候,资助机构,期刊和其他机构将更多的精力集中在过度引用自己引起的潜在问题上。7月,伦敦的出版商咨询机构出版道德委员会(COPE)强调,极端自我引文是引文操纵的主要形式之一。对于过度依赖引用指标来制定招聘,晋升和研究经费决策,这一问题引起了广泛的关注。

俄勒冈大学尤金分校的心理学家桑杰·斯里瓦斯塔瓦(Sanjay Srivastava)说:“当我们将专业发展与对基于引文的指标联系在一起时,我们就会激发自我引文。”

尽管许多科学家都认为过度引文是一个问题,但对于多少问题或如何解决问题却几乎没有共识。在某种程度上,这是因为研究人员有很多合理的理由来引用他们自己或同事的工作。约阿尼迪斯(Ioannidis)告诫说,他的研究不应导致特定研究人员的自我引用率受到侮辱,尤其是因为这些因学科和职业阶段而异。只是提供完整,透明的信息。他不应该将其用于诸如判定太高的自引等同于一个坏科学家的判决。

数据驱动

约阿尼迪斯(Ioannidis)和他的合著者没有发表他们的数据来关注自我引用。这只是他们研究的一部分,其中包括大量标准化的,基于引文的指标,这些指标针对过去20年中176个科学领域中被引用最多的100,000名左右的研究人员。他与位于新墨西哥州阿尔伯克基的分析公司SciTech Strategies的Richard Klavans和Kevin Boyack以及位于阿姆斯特丹的出版商Elsevier的分析总监Jeroen Baas一起编辑了数据。数据全部来自Elsevier专有的Scopus数据库。该小组希望其工作将使识别可能引起引用的因素成为可能。

但是,数据集中最引人注目的部分是自引用指标。通过在Scopus和Web of Science等订阅数据库中查找引文记录,已经可以看到作者引用了自己的著作的次数。但是,如果没有跨研究领域和职业阶段的看法,就很难将这些数据放到上下文中并把一个研究人员与另一个研究人员进行比较。

巴西的引文计划过时了

Vaidyanathan记录是最极端的记录之一,并且带来了一定的回报。去年,印度政治家普拉卡什·贾瓦德卡(Prakash Javadekar)目前是国家环境部长,但当时负责高等教育。他凭借在生产力和生产力方面的研究,跻身美国顶级研究人员之列,为瓦伊迪亚坦(Vaidyanathan)赢得了20,000卢比(280美元)的奖励。引用指标。Vaidyanathan并未回复《自然》杂志的评论请求,但他之前曾为自己的引用记录辩护,以回答在线问答平台Quora上发布的有关Vel Tech的问题。他在2017年写道,由于研究是一个连续的过程,因此“如果不参考先前的工作就无法进行下一步的工作”?自我引用并不是为了误导他人。

数学家西奥多·西莫斯(Theodore Simos)是另外两名获得称赞并大肆称赞的研究人员,他的网站列出了利雅得金沙特大学,俄罗斯叶卡捷琳堡的乌拉尔联邦大学和希腊科莫蒂尼的色雷斯德cri克利特大学。意大利佛罗伦萨大学的化学药剂师Claudiu Supuran也列出了沙特国王大学的从属关系。Simos和Supuran(62%)去年都被他本人或他的合著者所引用的书摘占76%,而Supuran(62%)则入选了由该公司出品的6,000名“因其出色的研究表现而被选为世界一流的研究人员”名单。 Clarivate Analytics,一家位于宾夕法尼亚州费城的信息服务公司,拥有Web of Science。Simos和Supuran均未回复Nature的置评请求。 Clarivate说,它已经意识到不寻常的自我引用模式的问题,并且用于计算其列表的方法可能会发生变化。

自我引用该怎么办?

在过去的几年中,研究人员一直在密切关注自引用。例如,2016年的预印本建议,男性学者引用自己的论文的平均水平比女性学者高25%,尽管去年的重复分析表明,这可能是任何作者的高产自引用的结果。性别,还有很多以前的工作可以引用3。2017年的一项研究表明,在有争议的2010年政策出台之后,意大利的科学家开始更多地自夸自己,这项政策要求学者达到生产率门槛才有资格晋升4。去年,印度尼西亚研究部采用了基于引文的公式来分配研究和奖学金的资金。该部表示,一些研究人员使用不道德的作法来打分,其中包括过度的自我引用和一群互相引荐的学者。该部表示,它已停止资助15名研究人员,并计划从其公式中排除自我引用,尽管研究人员告诉《自然》杂志,这尚未发生。

但是,公开列出个人的自引用率,或根据校正自引用的指标对其进行评估的想法极富争议。例如,在上个月发布的一份讨论文件中,COPE反对将自我引用从指标中排除,因为它说,这种“感觉”允许人们对自我引用何时具有良好的学术意义进行细致的理解。

前100篇论文

2017年,当时瑞士苏黎世大学的生物学家贾斯汀·弗拉特(Justin Flatt)呼吁对科学家的自引记录进行更多的澄清6。如今在赫尔辛基大学就读的弗拉特建议按照许多研究人员使用的h指数生产率指标发布自引指数或s指数。h指数为20表示研究人员发表了20篇至少被引用20篇的论文;同样,s指数为10意味着研究人员发表了10篇论文,每篇论文至少收到10篇自我引用。

接受了整理s-index数据的补助的Flatt同意Ioannidis的观点,这类工作的重点不应是建立可接受分数的阈值,或者命名和羞辱高自我的引用者。他说:“从来没有将自己的引用定为犯罪。”他认为,但只要学者们继续使用h指数来提升自己,就有必要将s指数纳入背景之中。

上下文很重要

约阿尼迪斯研究的一个不寻常特征是它对引文的定义很宽泛,其中包括合着者的引文。这是为了捕捉可能的引文农业实例;比利时根特大学的社会学家马可·西伯(Marco Seeber)说,但是,这确实会增加自引用分数。例如,粒子物理学和天文学的论文经常有成百上千甚至数千位合著者,这提高了整个领域的自引平均值。

约阿尼迪斯说,有可能通过将研究人员与他们所在国家,职业阶段和学科的平均值进行比较来解决一些系统性差异。他说,但更普遍的是,这份清单正在引起人们对那些值得仔细研究的案件的关注。还有另一种发现问题的方法,方法是检查收到的引文与出现这些引文的论文数之比。例如,西莫斯(Simos)仅从1,029篇论文中获得了10,458篇被引文,这意味着,平均而言,他在每篇论文中都提到他的工作时被引用超过10篇。约阿尼迪斯(Ioannidis)表示,与自我引用指标结合使用时,该指标是潜在的过度自我推广的好标志。

在未发表的著作中,爱思唯尔·贝斯(Elsevier Baas)说,他已经对700万名科学家的更大数据集进行了类似的分析:也就是说,在Scopus中列出的所有作者均发表了5篇以上的论文。Baas说,在这个数据集中,中位自引率是15.5%,但是多达7%的作者的自引率都超过40%。这个比例比被引用最多的科学家要高得多,因为在700万研究人员中,许多人总体上还是被引用很少,或者只是在其职业生涯的开始。从事早期职业的科学家往往具有较高的自引率,因为他们的论文“没有时间积累来自他人的许多引证(见“青年效应”)。

根据巴斯(Baas)的数据,俄罗斯和乌克兰的中位自引用率很高(参见“按国家划分的国家”)。他的分析还表明,由于它们的多篇论文(见“ Hysics Envy”),一些领域仍然很突出,例如“核和粒子物理学,天文学和天体物理学”。Baas说他没有计划发布他的数据集。

对科学不好吗?

尽管PLoS Biology研究确定了一些极端的自我引诱者并提出了寻找其他自我引诱者的方法,但一些研究人员表示,他们并不相信自引引数据集将有所帮助,部分原因是该度量标准因研究学科和职业阶段。加拿大蒙特利尔大学的信息科学家Vincent Larivi猫re说:“被自动引用比看起来要复杂得多。”

Srivastava补充说,解决过度自我引用和其他基于引用指标的博弈的最佳方法不一定是发布更加详细的标准化表格和综合指标,以将研究人员进行相互比较。他说,这些可能都有其自身的缺陷,而这种方法有可能使科学家进一步被个人水平的评估所吸引,这首先是激励游戏的问题。

Srivastava说:“应要求编辑和审稿人注意不合理的自我引文。”也许这些粗略指标中的一些有用,可以作为更仔细查看位置的标志。但是,最终,解决方案必须是使专业评估与专家同行的判断相一致,而不是将指标加倍。印第安纳大学布卢明顿分校的信息科学家卡西迪Sugimoto同意,更多的指标可能不是答案:“凌驾于科学家不利于科学。”?/ p>

约阿尼迪斯说,他的工作是必要的。无论如何,人们已经严重依赖个人级别的指标了。他说,问题是如何确保信息尽可能准确,仔细,系统地编辑。引诱指标不能也不应消失。我们应该充分利用它们,充分认识到它们的许多局限性。

自然572,578-579(2019)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。