论文查重  | 论文文献库  | 学术不端检测中的隐性重复现象分析

学术不端检测中的隐性重复现象分析

来源：论文查重时间：2019-07-27 09:59:19

由清华同方研制的学术不端文献论文查重检测系统极大地方便了编辑的初审工作，将编辑从浩如烟海的信息搜集与价值判断中解放出来，使编辑有精力投入到审查文章的创新性以及编校等方面。随着学术不端论文查重检测系统的普遍运用以及作者对学术不端现象的了解，使得作者的投稿也出现了一些新的动向，如作者为了避免文字复制比高的情况出现，并且又能达到发表的目的，一部分作者将文章提前通过其他系统对所要发表文章进行初步检测，然后针对与他人重复部分进行适当地修改，有的作者将已发表的文章采用改头换面、掐头去尾、颠倒叙述顺序、重新组合等手段，对文章进行修饰来规避检测，从而达到通过检测和初审的目的。在一般情况下，编辑部使用学术不端文献论文查重检测系统，仅仅根据文字重复率的高低来大致判断文章是否存在学术不端行为，且大部分关于学术不端行为防范的研究也是基于这一点，并根据文字重复率的高低提出一些相应的对策［1 － 9］，而对于重复率为零或者重复率很低 (小于 15% )但又有学术不端行为的文章编辑如何判断以及怎样把关进行探讨分析的文献很少［10 － 11］，也仅仅认为编辑要通过小同行审稿来把握，对编辑如何把握没有太多的探讨。本文针对文字复制率较低但又有学术不端行为的情况进行初步分析，探讨编辑把关的方法。
笔者在运用清华同方的学术不端文献检测系统时曾遇到这样的问题:将作者的文章输入该系统进行学术不端检测时，发现文章的重复率较低甚至为零，但运用其他方法审稿时发现该文章在观点、论证等方面仍然存在不端行为。因此，笔者将检测重复率低但仍存在与他人观点相同、论证基本一致、所得结论相似、表述方式与他人不同但表述的意思一致的情况认定为隐性重复。
隐性重复是相对于显性重复而言的，它是一种隐藏在文章背后的抄袭现象，其特点表现在:(1) 隐蔽性强。就是作者所论问题完全采用他人的观点，在材料和论证方式上以及结论等方面与他人基本一致，最主要的是在句型上和表达方式上运用调换词语、变换描述次序、改变句式 ( 将原句改为倒装句、被动句等 )、长句变短句，短句合成长句等［12 － 15］ ;在段落上颠倒表述顺序、拆分段落等，甚至改变描述方法，将文章的叙述形式由文字改为图表形式，或将图表形式改成文字表述形式，或将汉语翻译成英语后然后再翻译回来，从而改变了句式结构，但意思没有改变，如此等等，这样就使其抄袭现象更加隐蔽精明，不易被系统检测到，此时，编辑不仔细阅读文章和查找相似的文章进行比较，就很难发现作者的学术不端行为。(2) 检测重复率低。当编辑运用不端文献检测系统检测时，仅从检测结果来看，文字复制比很低，如果编辑不下工夫阅读和查找比对相应的文献，就发现不了作者的抄袭现象。因此，作为责任编辑，对于文字重复率低的文章特别是一些公式、图表较多的文章，在用学术不端文献检测系统检测后，要通过查找相应文章的方法来进行比对判断，从而判断文章的创新性和科学性，避免有隐性重复的文章投机钻营。
对于文字重复率较低甚至重复率为零的文章来说，一部分文章仍然存在学术不端的行为，作为编辑在初审时无论检测结果如何，都要对文章进行初步的价值判断，要判断文章的创新性、科学性等［16］。那么编辑怎样才能尽到自己的职责，把好初审关，不至于使存在抄袭严重的文章通过初审。笔者认为，编辑首先要在检测的基础上认真通读全文，对文章的观点、论证、论据、结论等方面有一个全面的了解，并且要把握好文章的结构。在此基础上，编辑再通过查找相应的文献，从文章的摘要、引言、论证过程、图表以及所得结论等方面进行比对，以此来判断文章是否存在学术不端行为。
作者所著录的参考文献一方面说明了作者对他人劳动成果的尊重;另一方面也为编辑初审提供了便利。编辑在阅读全文的基础上，通过查阅作者文后标注的参考文献，然后和作者的文章内容进行比对，以此来判断作者的稿件是否存在隐性重复的情况。如笔者曾检测一篇关于新课改条件下教学评价方面的文章，用中国知网所提供的学术不端检测系统检测时，检测的结果是文字重复率为零，但笔者在阅读文章后，觉得文章的观点、结构、论证都有一定的创新点，并且文笔流畅，而作者研究方向与此文的研究内容又相去甚远。因此，笔者在深入阅读的基础上，通过网络查询作者所提供的参考文献，发现文章和其中标注的一篇参考文献的内容非常相近，通过仔细阅读比对，发现作者的写作方法、文章内容、结构与参考文献基本一致，并且各级标题所表述的思想与已发文章并无二致，文章内容的表述仅仅是替换一些词语和转换一下表述的方法，甚至是颠倒语句的顺序。由此笔者认为，作者这篇文章的观点、方法、结论并没有创新之处，完全重复了他人的观点，并且属于隐性重复，因此文章也就没有任何新意和发表价值，所以直接退稿。
从研究的角度来看，大部分作者都有自己的研究方向，所发表的文章基本属于系列研究。但在现实大环境下，有的作者为了追求某种利益，此时就会将以前发表的文章进行改头换面或者东拼西凑，伪造数据，然后再投给刊物。从这个角度来看，对于存在隐性重复的文章，编辑就可以采用查找作者以前所发表文章的方法来比对。此时编辑可以将作者的姓名作为检索词输入，在结果中查找作者所发表的其他与此文类似的文章，以便从中找到一些蛛丝马迹，从而判断所投文章的科学性和新颖性，判断文章是否存在隐性重复现象。如笔者曾初审一篇用数学模型解决经济问题的文章，仅从文章的内容来看，作者的解决方法有一定的新意，并且从检测的结果来看，重复率也较低，观点和方法基本没有问题。为了证实编辑的判断，笔者上网查找作者以前发表的文章，结果是作者所投文章是将已经发表的文章在叙述方式方面从头到尾做了适当的改变，将所用方法的次序也作了适当调整，研究方法还是以前所发表文章的方法，所得结论与已发文章一致。根据这种情况，编辑也迅速做了退稿处理。通过这篇文章的检测结果和编辑查询来看，一些文章的文字重合率低的原因是文章使用了大量的数学公式，而数学公式在检测时又不能显现出来，从而导致文字重合率低，编辑从检测结果也看不出此文与已发表文章的重复情况，只有将作者姓名作为检索词进行检索比对时，才找到了答案。因此，编辑要想能够查找隐性重复的情况，根据作者的姓名来查找相似的文章进行比对也不失为一种好的方法。
用学术不端检测软件检测文章，在检测结果中都会给出一些与文章重复率有关的文献，此时编辑可根据学术不端检测结果中所给的相似文献，再结合编辑对所审文章的内容，判断作者的文章可能会与哪些文献重复，然后查找相关文献并与所审文章进行比对，根据比对结果判断文章与已有文献的相似程度，从而对文章做出创新度的判断。如笔者在初审一篇关于用小波变换方法去除图像噪声使图像信息增强方面的文章，首先对文章进行了学术不端检测，从检测结果看，文字复制比较低，但从笔者掌握的关于小波变换研究的信息来看，用小波变换方法去噪的研究文章较多，于是笔者就根据文章的内容结合检测结果中所提供的文献找到了与作者文章内容相近的文献，通过比对发现文章作者在文字叙述时同样采用了调换顺序和变换词语的方法对他人的成果进行了重新整理，从而使检测结果的重复率较低，但文章并没有自己的创新点。此时，编辑如果仅仅根据检测结果就下结论，不进一步查阅相关文献，编辑就很难发现隐性重复的情况，从而使文章通过初审。
用此种方法进行查找学术不端中的隐性重复，主要是根据编辑所掌握的研究信息以及文章的内容，根据检测结果所提供的文献顺藤摸瓜，查找相似的文献进行比对。由此也可以看出，编辑在平时的工作中要善于积累和了解责编学科的研究热点问题和前沿问题，这样编辑在初审时就能够查找到相应的文章，发现所投文章疑似学术不端的问题。
在一些用实验数据来论证的研究性文章中，常常附有大量的图表，这些图表附带有较多的信息，通过图表就可以看出作者的研究状况，然而有的作者为了达到发表的目的，在不进行认真调查研究和实验的基础上，往往采取将他人的成果数据照搬过来，套用他人的格式论证自己观点的作法，或者是根据他人研究状况捏造数据。如果文章存在这种情况，对其进行不端检测时，就会出现与他人发表文章相同的表题、图题或相似数据等现象，此时，编辑可以图表内容为线索上网查找与此文相似的文章进行比对，从中也可发现作者的隐性重复内容。这种隐性重复主要是改变了表格中的一些数据，但所得结果与他人研究成果一致，或者将表格的内容、图表所表示的结果转换成文字叙述，这仅仅是改变了表述的方式，而实质内容并没有改变，最终结果是方法、结果和结论与已发表文章一致，也同样没有作者自己的创新点。如笔者在初审一篇关于用集对理论对绿色建筑进行优化考评的文章时，发现作者文章中有两个表题与他人文章相同，其他基本没有显性的重复，可是在阅读已发表的文章时，发现作者文章的主要内容与他人已发表的文章非常相似，经过反复地查找比对，最终认为该文章作者采用了他人研究的主要数据和结果，鉴于此，对此文作了退稿处理。
对于图题相同的文章也可以运用这种方法来查找类似的文章，因为检测系统对图不能够显示，查找相同的图就会稍微麻烦一些，编辑只要积极阅读认真思考还是能找到相关文献进行比对的。
这里所说的从关键词入手查找相应的文献，并不是仅通过关键词就能够判断文章是否存在隐性重复。用关键词来判断，这就要求编辑在仔细阅读全文之后，根据文章的主要内容选择适当的关键词，然后上网查找相应的文献，通过相关的文献与所审文章进行比对，以此来发现文章的隐性重复。如一篇关于用数学模型对应急物流系统评价的文章，从文章所建立的数学模型以及所给出的数据表格来看，文章所建立的模型能够解决实际问题，检测结果的文字复制比也较低，但通过输入 “绩效评价”以及“应急物流系统”等关键词，结果找到了与此文章非常相似的文章，通过阅读比对，文章作者完全是照搬了他人的文章，仅将他人文章的描述方法进行了简单的改变，其他方面几乎与文献一致，并没有自己独到的方法和观点，这样根据检测结果和编辑查阅文献的情况，给予退稿处理。用关键词查找相应文章也是编辑初审时常用的方法，此时最关键的就是编辑选择关键词要准确，这样才能找到相应的文献。运用这种方法，主要是针对那些公式较多的文章进行，因公式在检测系统中不能显示，此时编辑就要根据自身的知识和掌握的信息来查找相关文献，通过仔细阅读和比对来判断文章的隐性重复程度以及文章的创新性和科学性。
总之，编辑部对于收到的文章，首先要借助于中国知网的学术不端文献检测系统对论文进行上传检测，然后根据检测结果中文字复制比的高低情况再作处理。编辑对于文字复制比较低的文章进行通读，在通读掌握文章内容结构的基础上，再依据编辑的知识结构和编辑所掌握的具体信息对文章按照上述的方法查阅文献进行比对，从而对文章作出创新性判断，以此来把好初审关。
结语
检测学术不端和限制学术不端行为是编辑的一项长期工作，编辑必须不辱使命，守住学术道德的底线。编辑要判断文章的隐性重复，发现作者的学术不端行为，这不仅要求编辑具有强烈的责任心，而且还需要编辑在日常的工作中处处留心，掌握所责编学科的研究热点信息，注意浏览相关学科的学术研究文章，注意积累审稿经验，在较短的时间内能够利用自己的直觉对文章做出判断，并且编辑在对文章做出是否隐性重复的判断前一定要仔细阅读全文，把握文章内容的主要方面，只有这样，编辑才能对学术不端中的隐性重复做出准确判断。另外，作为责任编辑在初审时，对于文章隐性重复的判断，不仅要在学术期刊网上查找相应的文章，还可以通过百度、Google 等其他网站的相关内容来查找相似文献进行比对，这样对文章隐性重复情况的判断就会更全面准确。

相关文章：文档复制检测技术在学监管中的应用研究

关于我们: CheckBao是中文学术论文相似度查重检测系统，是权威、可信赖的中文学术剽窃检查的在线网站。CheckBao论文查重检测系统专注中文学术检测抄袭，基于亿级学术期刊、学位论文和互联网数据，采用大数据中文语义识别比对技术，为学术原创保驾护航。

联系我们: 客服QQ：1436706507