学术不端检测中的隐性重复现象分析
来源:论文查重 时间:2019-07-27 09:59:19
由清华同方研制的学术不端文献论文查重检测系统极 大地方便了编辑的初审工作, 将编辑从浩如烟海的 信息搜集与价值判断中解放出来, 使编辑有精力投 入到审查文章的创新性以及编校等方面。随着学 术不端论文查重检测系统的普遍运用以及作者对学术不端 现象的了解,使得作者的投稿也出现了一些新的动 向,如作者为了避免文字复制比高的情况出现, 并 且又能达到发表的目的, 一部分作者将文章提前通 过其他系统对所要发表文章进行初步检测, 然后针 对与他人重复部分进行适当地修改, 有的作者将已 发表的文章采用改头换面、掐头去尾、颠倒叙述顺 序、重新组合等手段, 对文章进行修饰来规避检测, 从而达到通过检测和初审的目的。在一般情况下, 编辑部使用学术不端文献论文查重检测系统, 仅仅根据文字 重复率的高低来大致判断文章是否存在学术不端 行为,且大部分关于学术不端行为防范的研究也是 基于这一点,并根据文字重复率的高低提出一些相 应的对策[1 - 9] ,而对于重复率为零或者重复率很低 (小于 15% )但又有学术不端行为的文章编辑如何 判断以及怎样把关进行探讨分析的文献很少[10 - 11] , 也仅仅认为编辑要通过小同行审稿来把握, 对编辑 如何把握没有太多的探讨。本文针对文字复制率 较低但又有学术不端行为的情况进行初步分析, 探 讨编辑把关的方法。 笔者在运用清华同方的学术不端文献检测系 统时曾遇到这样的问题:将作者的文章输入该系统 进行学术不端检测时, 发现文章的重复率较低甚至 为零,但运用其他方法审稿时发现该文章在观点、 论证等方面仍然存在不端行为。因此, 笔者将检测 重复率低但仍存在与他人观点相同、论证基本一 致、所得结论相似、表述方式与他人不同但表述的 意思一致的情况认定为隐性重复。 隐性重复是相对于显性重复而言的, 它是一种 隐藏在文章背后的抄袭现象, 其特点表现在:(1) 隐 蔽性强。就是作者所论问题完全采用他人的观点, 在材料和论证方式上以及结论等方面与他人基本 一致,最主要的是在句型上和表达方式上运用调换 词语、变换描述次序、改变句式 ( 将原句改为倒装 句、被 动 句 等 )、长 句 变 短 句, 短 句 合 成 长 句 等[12 - 15] ;在段落上颠倒表述顺序、拆分段落等,甚至 改变描述方法,将文章的叙述形式由文字改为图表 形式,或将图表形式改成文字表述形式, 或将汉语 翻译成英语后然后再翻译回来, 从而改变了句式结 构,但意思没有改变, 如此等等, 这样就使其抄袭现 象更加隐蔽精明, 不易被系统检测到, 此时, 编辑不 仔细阅读文章和查找相似的文章进行比较, 就很难 发现作者的学术不端行为。(2) 检测重复率低。当 编辑运用不端文献检测系统检测时, 仅从检测结果 来看,文字复制比很低, 如果编辑不下工夫阅读和查找比对相应的文献, 就发现不了作者的抄袭现 象。因此,作为责任编辑, 对于文字重复率低的文 章特别是一些公式、图表较多的文章, 在用学术不 端文献检测系统检测后, 要通过查找相应文章的方 法来进行比对判断, 从而判断文章的创新性和科学 性,避免有隐性重复的文章投机钻营。 对于文字重复率较低甚至重复率为零的文章 来说,一部分文章仍然存在学术不端的行为, 作为 编辑在初审时无论检测结果如何, 都要对文章进行 初步的价值判断, 要 判 断 文 章 的 创 新 性、科学性 等[16] 。那么编辑怎样才能尽到自己的职责, 把好初 审关,不至于使存在抄袭严重的文章通过初审。笔 者认为, 编辑首先要在检测的基础上认真通读全 文,对文章的观点、论证、论据、结论等方面有一个 全面的了解,并且要把握好文章的结构。在此基础 上,编辑再通过查找相应的文献, 从文章的摘要、引 言、论证过程、图表以及所得结论等方面进行比对, 以此来判断文章是否存在学术不端行为。 作者所著录的参考文献一方面说明了作者对 他人劳动成果的尊重;另一方面也为编辑初审提供 了便利。编辑在阅读全文的基础上, 通过查阅作者 文后标注的参考文献, 然后和作者的文章内容进行 比对,以此来判断作者的稿件是否存在隐性重复的 情况。如笔者曾检测一篇关于新课改条件下教学 评价方面的文章, 用中国知网所提供的学术不端检 测系统检测时, 检测的结果是文字重复率为零, 但 笔者在阅读文章后, 觉得文章的观点、结构、论证都 有一定的创新点, 并且文笔流畅, 而作者研究方向 与此文的研究内容又相去甚远。因此, 笔者在深入 阅读的基础上,通过网络查询作者所提供的参考文 献,发现文章和其中标注的一篇参考文献的内容非 常相近,通过仔细阅读比对, 发现作者的写作方法、 文章内容、结构与参考文献基本一致, 并且各级标 题所表述的思想与已发文章并无二致, 文章内容的 表述仅仅是替换一些词语和转换一下表述的方法, 甚至是颠倒语句的顺序。由此笔者认为, 作者这篇 文章的观点、方法、结论并没有创新之处, 完全重复 了他人的观点, 并且属于隐性重复, 因此文章也就 没有任何新意和发表价值,所以直接退稿。 从研究的角度来看, 大部分作者都有自己的研究方向,所发表的文章基本属于系列研究。但在现 实大环境下, 有的作者为了追求某种利益, 此时就 会将以前发表的文章进行改头换面或者东拼西凑, 伪造数据, 然后再投给刊物。从这个角度来看, 对 于存在隐性重复的文章, 编辑就可以采用查找作者 以前所发表文章的方法来比对。此时编辑可以将 作者的姓名作为检索词输入, 在结果中查找作者所 发表的其他与此文类似的文章, 以便从中找到一些 蛛丝马迹, 从而判断所投文章的科学性和新颖性, 判断文章是否存在隐性重复现象。如笔者曾初审 一篇用数学模型解决经济问题的文章, 仅从文章的 内容来看, 作者的解决方法有一定的新意, 并且从 检测的结果来看, 重复率也较低, 观点和方法基本 没有问题。为了证实编辑的判断, 笔者上网查找作 者以前发表的文章, 结果是作者所投文章是将已经 发表的文章在叙述方式方面从头到尾做了适当的 改变,将所用方法的次序也作了适当调整, 研究方 法还是以前所发表文章的方法, 所得结论与已发文 章一致。根据这种情况,编辑也迅速做了退稿处理。 通过这篇文章的检测结果和编辑查询来看, 一 些文章的文字重合率低的原因是文章使用了大量 的数学公式, 而数学公式在检测时又不能显现出 来,从而导致文字重合率低, 编辑从检测结果也看 不出此文与已发表文章的重复情况, 只有将作者姓 名作为检索词进行检索比对时, 才找到了答案。因 此,编辑要想能够查找隐性重复的情况, 根据作者 的姓名来查找相似的文章进行比对也不失为一种 好的方法。 用学术不端检测软件检测文章, 在检测结果中 都会给出一些与文章重复率有关的文献, 此时编辑 可根据学术不端检测结果中所给的相似文献, 再结 合编辑对所审文章的内容, 判断作者的文章可能会 与哪些文献重复, 然后查找相关文献并与所审文章 进行比对,根据比对结果判断文章与已有文献的相 似程度,从而对文章做出创新度的判断。如笔者在 初审一篇关于用小波变换方法去除图像噪声使图 像信息增强方面的文章, 首先对文章进行了学术不 端检测,从检测结果看, 文字复制比较低, 但从笔者 掌握的关于小波变换研究的信息来看, 用小波变换 方法去噪的研究文章较多, 于是笔者就根据文章的 内容结合检测结果中所提供的文献找到了与作者 文章内容相近的文献, 通过比对发现文章作者在文字叙述时同样采用了调换顺序和变换词语的方法 对他人的成果进行了重新整理, 从而使检测结果的 重复率较低, 但文章并没有自己的创新点。此时, 编辑如果仅仅根据检测结果就下结论, 不进一步查 阅相关文献, 编辑就很难发现隐性重复的情况, 从 而使文章通过初审。 用此种方法进行查找学术不端中的隐性重复, 主要是根据编辑所掌握的研究信息以及文章的内 容,根据检测结果所提供的文献顺藤摸瓜, 查找相 似的文献进行比对。由此也可以看出, 编辑在平时 的工作中要善于积累和了解责编学科的研究热点 问题和前沿问题,这样编辑在初审时就能够查找到 相应的文章,发现所投文章疑似学术不端的问题。 在一些用实验数据来论证的研究性文章中, 常 常附有大量的图表, 这些图表附带有较多的信息, 通过图表就可以看出作者的研究状况, 然而有的作 者为了达到发表的目的, 在不进行认真调查研究和 实验的基础上,往往采取将他人的成果数据照搬过 来,套用他人的格式论证自己观点的作法, 或者是 根据他人研究状况捏造数据。如果文章存在这种 情况,对其进行不端检测时, 就会出现与他人发表 文章相同的表题、图题或相似数据等现象, 此时, 编 辑可以图表内容为线索上网查找与此文相似的文 章进行比对, 从中也可发现作者的隐性重复内容。 这种隐性重复主要是改变了表格中的一些数据, 但 所得结果与他人研究成果一致, 或者将表格的内 容、图表所表示的结果转换成文字叙述, 这仅仅是 改变了表述的方式, 而实质内容并没有改变, 最终 结果是方法、结果和结论与已发表文章一致, 也同 样没有作者自己的创新点。如笔者在初审一篇关 于用集对理论对绿色建筑进行优化考评的文章时, 发现作者文章中有两个表题与他人文章相同, 其他 基本没有显性的重复, 可是在阅读已发表的文章 时,发现作者文章的主要内容与他人已发表的文章 非常相似, 经过反复地查找比对, 最终认为该文章 作者采用了他人研究的主要数据和结果, 鉴于此, 对此文作了退稿处理。 对于图题相同的文章也可以运用这种方法来 查找类似的文章, 因为检测系统对图不能够显示, 查找相同的图就会稍微麻烦一些, 编辑只要积极阅 读认真思考还是能找到相关文献进行比对的。 这里所说的从关键词入手查找相应的文献, 并 不是仅通过关键词就能够判断文章是否存在隐性 重复。用关键词来判断, 这就要求编辑在仔细阅 读全文之后, 根据文章的主要内容选择适当的关 键词, 然后上网查找相应的文献, 通过相关的文献 与所审文章进行比对, 以此来发现文章的隐性重 复。如一篇关于用数学模型对应急物流系统评价 的文章, 从文章所建立的数学模型以及所给出的 数据表格来看, 文章所建立的模型能够解决实际 问题, 检测结果的文字复制比也较低, 但通过输入 “绩效评价”以及“应急物流系统”等关键词, 结果 找到了与此文章非常相似的文章, 通过阅读比对, 文章作者完全是照搬了他人的文章, 仅将他人文 章的描述方法进行了简单的改变, 其他方面几乎 与文献一致, 并没有自己独到的方法和观点, 这样 根据检测结果和编辑查阅文献的情况, 给予退稿 处理。用关键词查找相应文章也是编辑初审时常 用的方法, 此时最关键的就是编辑选择关键词要 准确, 这样才能找到相应的文献。运用这种方法, 主要是针对那些公式较多的文章进行, 因公式在 检测系统中不能显示, 此时编辑就要根据自身的 知识和掌握的信息来查找相关文献, 通过仔细阅 读和比对来判断文章的隐性重复程度以及文章的 创新性和科学性。 总之,编辑部对于收到的文章, 首先要借助于 中国知网的学术不端文献检测系统对论文进行上 传检测,然后根据检测结果中文字复制比的高低情 况再作处理。编辑对于文字复制比较低的文章进 行通读,在通读掌握文章内容结构的基础上, 再依 据编辑的知识结构和编辑所掌握的具体信息对文 章按照上述的方法查阅文献进行比对, 从而对文章 作出创新性判断,以此来把好初审关。 结语 检测学术不端和限制学术不端行为是编辑的 一项长期工作, 编辑必须不辱使命, 守住学术道德 的底线。编辑要判断文章的隐性重复, 发现作者的 学术不端行为, 这不仅要求编辑具有强烈的责任 心,而且还需要编辑在日常的工作中处处留心, 掌 握所责编学科的研究热点信息, 注意浏览相关学科 的学术研究文章, 注意积累审稿经验, 在较短的时 间内能够利用自己的直觉对文章做出判断, 并且编 辑在对文章做出是否隐性重复的判断前一定要仔 细阅读全文,把握文章内容的主要方面, 只有这样,编辑才能对学术不端中的隐性重复做出准确判断。 另外,作为责任编辑在初审时, 对于文章隐性重复 的判断,不仅要在学术期刊网上查找相应的文章, 还可以通过百度、Google 等其他网站的相关内容来 查找相似文献进行比对, 这样对文章隐性重复情况 的判断就会更全面准确。 相关文章:文档复制检测技术在学监管中的应用研究