论文查重 | 论文文献库 | 学术不端文献的发表追溯及防范对策——基于185篇疑似学术不端文献的实证分析

学术不端文献的发表追溯及防范对策——基于185篇疑似学术不端文献的实证分析

来源:论文查重 时间:2019-07-27 11:01:50

近年来, 学术不端现象在学术期刊中频频发 生,社会各界纷纷对此现象把脉问诊, 大多将学术 不端事件泛滥成灾的因素归结为制度的缺失、评价 体系的不合理、法规的缺位、道德的失范等。学术 不端行为的严重性也引起了我国政府、高等院校和 科研机构的高度重视。2015 年 11 ~ 12 月, 中国科 协、教育部等多部门联合发布《关于准确把握科技 期刊在学术评价中作用的若干意见》[1]《发表学术 论文“五不准”》[2] ,2016 年 1 月 13 日, 国务院办公 厅发布《关于优化学术环境的指导意见 ( 国办发 〔2015〕94 号) 》[3] ,均提出要严惩学术不端行为, 构 建防控学术不端行为的责任体系和诚信制度, 以维 护风清气正的良好学术生态环境。不可否认的是, 学术不端现象在学术期刊频繁出现, 学术期刊本身 也负有不可推卸的责任[4] 。中国知网、万方数据、 重庆维普三大数据库论文查重检测系统的投入使用, 为学术 期刊编辑初审稿件的创新性和筛查学术不端行为 提供了便利条件。然而采用论文查重检测系统后, 仍有个别 学术不端稿件发表出来, 学术不端行为已不是简单 地表现为复制和拼凑, 而是已经演化为隐式的深层 次学术不端,因学术不端行为而撤稿的例子也屡屡 发生,这给期刊带来了一定的负面影响。在防范学 术不端行为方面, 除了作者的文责自负外, 很多人 认为编辑需要承担更多的责任, 在刊发前应严格控 制稿件的处理流程, 责任人需要分工合作、沟通协 调,共同承担起相应的防范学术不端的职责, 将学 术不端行为最小化[5] 。而这方面的研究大多是基 于作者经验从理论上进行分析[6 - 9] , 或只是粗略分 析某刊在统计年限内疑似自抄、一稿多发、疑似抄 袭等 3 类文献的数量或不端文献的重合度[10 - 11] , 鲜有研究从实证分析的角度深入调查不端文献的 重合度、疑似源文献及重合内容、作者所在机构及 身份等综合信息, 进而提出更加行之有效的针对性 措施。鉴于此, 本文通过对《广东农业科学》( 以下 简称《广东农科》) 2007—2013 年刊发的疑似学术不 端文献进行统计与分析, 结合编辑日常工作中发现 的各种学术不端进行剖析, 旨在为广大学术期刊编 辑及时、准确地辨别各种学术不端行为提供现实依据,充分发挥学术期刊编辑在防范和打击学术不端 行为工作中的作用。
1 研究对象与方法
2015 年 3 ~ 6 月,根据《中国学术期刊影响因子 年报》个刊影响力统计分析数据库数据( 截至 2014 年 11 月 25 日) ,以“稿件质量分析”为评价内容, 首 先,导出《广东农科》2007—2013 年已刊发的学术不 端文献明细表, 保存为 Excel 数据, 逐篇排查, 将重 复统计文献删除并最终按 1 篇统计, 调查该刊疑似 学术不端文献的实际篇数、类型、年际变化和疑似 源文献( 指发表在先的文献) 特征。然后, 逐篇下载 2012—2013 年疑似学术不端文献, 调查重合度、疑 似源文献及重合内容、作者所在机构及身份等, 分 析这些学术不端文献的产生历程以及作者特征。 在此基础上,深入剖析使用科技期刊学术不端文献 检测系统( AMLC) 以来仍发表在库的 10 篇疑似学 术不端文献,比较疑似源文献和本刊文献投稿日期 和刊发期数, 同时对这 10 篇文献的原稿及其重合 度、专家审稿意见、已刊发样稿及其重合度进行溯 源比对,分析以上文献的“漏网”原因。
依据《< 中国学术期刊影响因子年报( 自然科 学与工程技术) > 引证数据统计规范》[12],“疑似学 术不端文献”指全文文字重合度大于 40% 且发表在 后的文献, 包括下列三种情况: ( 1) 一稿多发, 指同 一作者发表 2 篇文献全文重合度 90% 以上; ( 2) 疑 似自抄, 指同一作者发表 2 篇文献全文重合度为 40% ~ 90% ; ( 3) 疑似抄袭, 指不同作者发表 2 篇文 献全文重合度 40% 以上[13] 。
2 结果与分析
2. 1 2007—2013 年《广东农科》疑似学术不端文献 发表情况
2. 1. 1 疑似学术不端文献数量变化分析
从表 1 可以看出,2007—2013 年《广东农科》刊 登的疑似学术不端文献共 185 篇, 占 7 年总发文量 的 1. 96% ,其中一稿多发 2 篇( 分别出现在 2010、 2011 年) ,疑似自抄 90 篇,疑似抄袭 93 篇。在 2012 年未使用 AMLC 前,每年刊登学术不端文献数量均 占当年总发文量的 1. 7% 以上,2010 年达到顶峰 60 篇、占全年发文量的 4. 0% 。使用该系统后, 本刊疑 似学术不端文献的发表数量逐年下降。
2. 1. 2 疑似源文献特征分析
对 185 篇疑似学术不端文献分析发现, 这类 文章抄袭的疑似源文献数量从最初的 1 篇到后来 的 2 ~ 3 篇 甚 至 6 ~ 7 篇 以 上, 具 体 表 现 形 式 有:
( 1) 同一作者以基本相同( 重合度 60% 以上) 的内 容发表在 2 个以上期刊。例如, 某作者于 2011 年 在本刊发表《******果胶的研究》, 此前他 已将相似内容( 重合度在 60% ~ 70% ) 于 2010 年 发表 在《山 西 化 工》《河 南 化 工》等 7 个 期 刊。
( 2) 不同作者抄袭基本相同( 重合度 60% 以上) 的 内容发表在多个期刊。例如, 某作者于 2007 年在 本刊发表《******防护中的应用》, 此前这 些基 本 相 同 ( 60% ~ 77% ) 的 内 容 已 于 1998— 2006 年间被 8 个不同作者发表在 8 个不同期刊, 其中 5 篇文题完全相同。
表 1 显示, 近年来疑似源文献的类型越来越多 样化,在本刊发表的疑似学术不端文献中, 2010 年 之前仅表现为引用、抄袭期刊,2011 年开始出现抄袭学位论文及会议论文的情况,2012 年的 28 篇疑 似学术不端文献中有 1 篇抄袭博士学位论文、2 篇 抄袭硕士学位论文、1 篇抄袭会议论文。这可能与 中国知网对期刊的收集较为全面、引用期刊的文献 更容易被 AMLC 检测出来有关, 部分作者开始寻找 其它捷径,或者是个别作者( 尤其是在读研究生) 过 度引用导师其他学生的学位论文[10] 。
2. 2 2012—2013 年《广东农科》疑似学术不端文献 产生原因分析
从理论上来说, AMLC 的采用应该能基本上杜 绝学术不端文献的对外传播, 但事实并非如此,《广 东农科》自 2012 年 2 月 10 日采用该系统后仍刊登 了多篇学术不端文献( 表 2) , 下面将对这些文献的 具体情况进行深入分析。
2. 2. 1 重合度、疑似源文献作者及作者主观意愿 分析
从表 2 可以看出, 32 篇不端文献中, 重合度在 40% ~ 49% 的 18 篇, 50% ~ 59% 的 6 篇, 60% ~ 79% 的 5 篇,80% 以上的 3 篇; 与作者本人论文重合 的 12 篇,与同一团队成员重合的 8 篇, 与他人重合 的 12 篇。根据重合度和重合内容,可在一定程度上 推断作者抄袭的主观意愿。我们将重合度在 60% 以上的 8 篇文献以及个别特殊文献与疑似源文献比 对,发现主要有以下 4 种情况:
( 1) 主体内容相同, 实属一稿一人两发。据了 解,目前一些作者为尽快得到录用答复往往会一稿 同时多投,但有些期刊在未通知作者情况下抢先发 表,导致作者又接受另一期刊的录用发表。文献 8 中 81% 的主体内容与作者本人之前发表文章重合, 甚至文题都完全相同, 应归入“一稿多发”的范畴。 然而,这两篇文章发表时间很接近, 作者可能不是 有意为之。文献 30 则是隐蔽的一稿一人两发,虽然 重合度仅 40% ,但该文的数据图与同一作者发表于 2011 年《吉林农业》的《******变化规律研 究》完全相同,但供试茶树品种却不相同。
( 2) 主体内容相同, 同一团队, 实属一稿两人多 发。文献 10 的作者将通讯作者团队另一成员 4 年 前已发表论文的文题、试验年份、参考文献进行了 修改,将折线图改成柱形图, 其他内容几乎一字不 改。文献 13 的作者在同一团队成员已发表论文的 基础上,修改了摘要,增加了“根径”指标, 其他内容 完全照搬。进一步挖掘发现, 文献 13 和文献 30 作 者所在研究团队近年来在国内期刊甚至国家一级 学报发表了很多篇论文。比对发现, 仅仅一稿一人 两发、一稿两人两发情况就至少有 3 对共 6 篇文章, 有些甚至一稿三人三发。经过分析可知, 这两个团 队逃避学术不端检测的伎俩如下: 一个实验结束 后,以同样的几组数据为基础, 经过不同人员或者 同一人员采用不同表达方式撰写, 以不同的第一作 者在短期内分别投往不同期刊, 由于投稿时间相 近,大多能逃避检测。
( 3) 主体内容相同, 不同团队, 实属将他人论文 窃为己有重复发表。文献 25 的文题和主体内容与 《乡镇经济》2008 年某期发表论文完全相同, 前者只 是将统计数据更新到 2010 年, 其他内容完全照搬。 文献 22 的作者甚至直接将他人硕士学位论文据为 己有。
( 4) 主体内容不同, 但表述完全参照本人或他 人论文。文献 6 重合度高达 85% , 原来是作者照搬 本人已发表的同研究系列论文的表述, 包括材料与 方法、结果与分析等, 但实际上这是同一系列的两 个不同研究, 有其客观原因: 对于“材料与方法”部 分,由于有些测定指标是常用指标, 很多试验方法 也是成型的规范化的常用方法, 有些作者未采用参 考文献标注的方式, 容易导致高重合度; 对于“结果 与分析”部分,很多作者都有其固定的表达习惯, 再 次发表类似题材文章时更倾向于引用本人或他人 已发表文献,而不愿重新组织文字。文献 9、11、15、 16、17、19、24、31 都属于品种选育及栽培技术类文 章,因为这类文章通常都有其固定表述, 且同一种 类农作物不同品种间的栽培要点大同小异, 作者大 多倾向于“拿来主义”, 但由于报道的是新品种, 编 辑部对这类文章的重合度放得较宽。
2. 2. 2 作者所在机构及身份
由表 2 可知, 在 32 篇学术不端文献中, 来自学 院或地市级科研机构的 18 篇,普通大学或省级科研 机构 8 篇,211 /985 大学或中科院 6 篇。可见, 来自 于学院或地市级科研机构以下的科研人员, 由于单 位科研力量较薄弱、学术资源有限, 其做出高水平 研究和写出高水平论文的概率较低, 但迫于职称晋 升和考核所需,不顾学术道德铤而走险的概率相对 较大。
以作者职称或身份而言, 这些学术不端文献中 有 2 篇出自研究员( 均为品种选育及栽培技术类文 章) , 3 篇出自副教授, 20 篇出自讲师或助理研究 员,2 篇在读博士生或博士,6 篇在读硕士生或本科 生。可见,本刊疑似学术不端文献的作者不少是中 级科研人员或在读研究生, 他们对著作权的意识较 为淡薄,加上迫于科研考核、职称评定、毕业就业等 压力,所在单位或导师也没有对此进行规范管理, 使得部分青年科研人员或在读研究生引用过度的 现象较多。
2. 3 使用 AMLC 后学术不端文献产生原因分析 本刊编辑部使用 AMLC 后, 仍有一些稿件成为 “漏网之鱼”顺利发表, 包括文献 14 ~ 17、27 ~ 32 共 10 篇,本文进一步剖析了《广东农科》编辑部工作上 的漏洞,这些学术不端文献之所以能够发表, 可能 存在以下一种或几种情况。
( 1) 检测方法有误。在采用检测系统一年内, 未能充分理解掌握 AMLC 的检测方法, 检测稿件为 整篇上传,包括中英文摘要、关键词、参考文献和正 文等所有内容,而中国知网对已刊发论文学术不端 的检测仅仅是对正文文字重合度的对比情况, 因此 前者的检测结果势必低于后者而被判定为通过第 一关,这是本刊已刊发论文被检测出学术不端的一 个重要原因, 如文献 14。还有一种情况是, 有些作 者未严格按照本刊投稿模板格式规范全文, 责任编 辑后期加工稿件时会删除一些不相关内容, 导致收 稿重合度低于发表后重合度。
( 2) 未进行出版前二次检测。有些作者在稿件录用后还会做较大幅度修改, 或补充内容、调整原 文表达时引用已报道文献, 或大量精简原文冗余文 字; 在编修过程中, 责任编辑也会按照本刊格式规 范进行编辑加工或删减。这些操作都可能造成修 改后稿件重合度的增加, 但编辑部在论文出版前未 进行二次检测,导致中国知网对已刊发论文检测时 重合度大幅升高,如文献 31 和 32。
( 3) 检测标准尺度未把握好。统计发现, 有些 文献在收稿时重合度较高, 可以判定为疑似学术不 端,但却仍被发表出来, 这与本刊使用该系统时间 较短、尺 度 把 握 不 准 有 关。本 刊 在 刚 开 始 使 用 AMLC 时审稿尺度放得较宽, 尤其是在疑似自抄文 献中,认为引用、摘抄本人及其团队的部分研究成 果或文字表述是被允许的。从表 2 也可以看出, 在 使用 AMLC 后仍出现学术不端的 10 篇文献中,有 7 篇与本人或其团队成果重合度较高。
( 4) 发表时间与上网时间存在一定的时间差。 目前国内多数期刊发表周期都在 6 个月以上, 而本 刊 2012— 2013 年为半月刊,发表周期多在 4 ~ 6 个 月。有些研究团队将属于同一系列研究内容的稿 件同时或不同时投出, 但当进行学术不端检测时, 疑似源文献仍未上传至中国知网, 即文章在纸质版 发表和上网之间存在 一 定 的 时 间 差, 如文献 29。 2013 年后,本刊严格按照中国知网的规定只对正文 进行检测,文献 29 在收稿时的重合度为 23. 2% , 但 发表后却与同一团队成员论文的重合达 58% 。追 踪两篇文章发现, 疑似源文献于 2012 年 3 月 16 日 被投出、同年 12 月 5 日纸质发表、2013 年 1 月 17 日 上网,而本刊作者于 2013 年 1 月 8 日投稿, 此时疑 似源文献已发表但还未被上传至中国知网, 避开了 检测。还有一种情况是, 作者为得到快速审稿回复 往往一稿多投,但其中一刊在未通知作者情况下抢 先发表,导致作者又接受另一个期刊的录用发表。
( 5) 编辑未能深入研究比对。文献 30 其实是 一稿多发,这在 2. 2. 1( 1) 部分已有详述, 但是收稿 检测时发现是不同茶树品种, 重合度并未超过 40% 就没再深究, 而系统对图片的重合暂不能比对, 编 辑没有一查到底, 并未下载疑似源文献仔细比对, 否则一定能查出端倪。
3 对策建议
学术不端现象是一个社会问题, 涉及主体众 多,包括政府部门、体制机制、社会环境、作者、学术 共同体、出版机构等。作为学术期刊编辑, 应认真 履行好科学“守门人”的职责, 严厉惩治和防范科技 期刊中的各种学术不端行为。根据《广东农科》近 年刊发的疑似学术不端文献的表现情况, 我们仅从 编辑的角度提出以下防范措施:
3. 1 严格规范审稿流程,提高录用前查重标准
低重合度是稿件录用最基本的底线, 因此编辑 部应严格规范审稿流程, 杜绝不经三审就发表的论 文,即便是特约稿件也需进行初始检测。初始检测 文字重合度的控制应更严格, 视刊物来稿情况可以 控制在 15% 甚至更低,有些稿件在送审前就存在一 定的文字重复问题, 虽未达到不予接收的程度但已 很接近,一旦返修稿中再增加一些重复文字, 那么 其重复率将超过规定数值[14] ,对于这类稿件一定不 能“带病提拔”。稿件经三审通过后, 每个期刊刊发 论文前都应知会作者并得到其授权和允许后方能 发表,不能抢先发表, 以避免作者在不知情的情况 下“被一稿多发”。
3. 2 强化责任编辑的学术把关职责
目前大部分学术期刊都在“投稿须知”中告知 作者“文责自负”,但“文责自负”只是强调作者需严 谨科研、认真书写校对文稿、对发表内容和观点负 责,并没有否定责任编辑和审稿专家在论文发表过 程中所持有的编辑权和审阅权, 尤其是责任编辑需 要审查作品的独创性和真实性、对论文进行编辑加 工、规范内容和格式[4] 。因此, 作为责任编辑, 一方 面,对一些重合度较高的论文不搞“一刀切”, 应深 入分析疑似源文献以及重合内容, 有些作者将本人 学位论文整理后发表导致重合度很高, 笔者认为这 不属于学术不端行为; 另外对与作者本人会议论文 重合的文章是否纳入学术不端行为目前也未有定 论,对于这些稿件, 责任编辑都应耐心地向作者了 解情况。再如, 一篇稿件重合度超过 30% , 但如果 大部分重合都出现在引言或试验方法中, 且标注了 参考文献, 那么对于这种稿件还是应该谨慎对待。 另一方面, 对一些重合度低于查重标准的稿件, 也 不能掉以轻心, 随着检测系统的普及, 作者容易提 前进行检测修改, 这对责任编辑的识别能力提出了 更高要求。一些论文的造假手段非常隐蔽, 如刻意 修改供试材料数量、修改试验地点、调换文字表达、 方法不同而部分数据相同等情况, 查重时难以察 觉,需要责任编辑认真核对结果及数据后才能发 现[15] 。因此,责任编辑应转变“文责自负”的观念,承担文责共负之责。 另外,在编辑加工中, 如遇作者提出添加或删 除作者、更改作者顺序等要求, 责任编辑除应请作 者阐明原因并提交一份新的作者承诺书外, 还应对 初审查重结果进行重新评估, 判断其是否符合著作 权法的规定。
3. 3 执行收稿时查重 + 发表前二次检测以及双系 统检测
大多数学术期刊编辑部认可 AMLC 对稿件的 初审效果,只有文字重合度符合编辑部的规定才予 以接收,但较少编辑部对录用稿进行刊前检测, 这 是采用检测系统后仍出现重合度较高文献的主要 原因。因此, 除了初审检测外, 编辑部有必要对修 回稿件进行刊前的二次检测, 如果重合度仍超过标 准,那么必须退回作者重新修改。但不能将查重报 告发给作者, 以免作者为了逃避查重进行反复修 改,而不管语句是否通顺, 最终却被录用。在不影 响及时出版的情况下, 查重日期距出版日期越近, 越有可能防范不端文献的发表。
为了垄断数据资源, 近年来中国知网、万方数 据两大数据库纷纷与学术期刊出版单位签署“独家 协议”,目前以上两大数据库已经分别与 1000 多家 出版单位签署了“独家协议”[7] , 这种商业竞争人为 地造成数据库资源的割裂和不完整。鉴于此, 建议 编辑部进行中国知网 AMLC 和万方数据论文相似 性系统两大系统的双向检测, 将双系统检测结果进 行科学分析后再决定是否送审。
3. 4 建立学术不端问题共享数据库,联合抵制学术 不端行为
目前, 我国各期刊出版机构合作甚少, 一个期 刊对学术不端论文退稿后, 缺乏有效的资源共享, 难以防范“问题”稿件再次投向其他期刊。建议根 据学科方向,建成全国性的学术不端问题共享数据 库,并在同类期刊编辑同行中共享,或者通过 qq 群、 微信 APP 等平台发布相关信息。如有编辑发现此 类问题,将其放入各专业问题数据库, 并说明其问 题所在, 以供其他编辑部参考, 避免重复劳动。例 如,某作者有多次“造假嫌疑”, 但都不能自证其清 白,即使作者单位没有最终给出学术造假的定论, 但期刊社或编辑部也可推断, 这些“造假嫌疑”应可 以认定为“学术造假”, 并在其之后投稿时格外注 意,以更好地防范学术不端行为。
此外, 由于国内论文代写代发的现象非常严重,而代写代发的论文数据大多为虚构、杜撰, 导致 很多科研人员因此上当受骗。对于这类中介组织, 同类编辑部更应共享信息, 联合抵制封杀, 严厉打 击这种不正之风,让投机者无机可乘。
3. 5 注重刊后学术不端文献的撤销处理
抄袭、剽窃他人研究成果等均是损害他人著作 权的行为, 如果没有撤稿声明, 即使作者以非法手 段获取他人研究成果作为自己的成果发表而获得 荣誉,其仍享有著作权, 这是对原作者著作权的极 大侵犯[16] 。国际上通行的做法是登载撤销该文的 声明,而在我国, 被撤销的问题论文仅占学术不端 论文总量的一小部分。因此, 作为学术期刊配合打 假的重要手段的撤稿声明, 需得到期刊编辑的进一 步重视,编辑部应在搜集齐全不端证据并警告作者 后,坚决在期刊上针对该文发布正式撤销声明, 同 时在各大数据库撤销该文献, 以免作者凭借不端文 献获取相关利益, 严格防范这类研究被作为有价值 成果而被继续引用。

相关文章:我国学术不端问题的现状与治理路径——基于媒体报道的64起学术不端典型案例的分析