学术失范、不端检测软件的功能、局限与对策 ——以学术研究规范为视角-论文文献库-知识狗

论文查重  | 论文文献库  | 学术失范、不端检测软件的功能、局限与对策 ——以学术研究规范为视角

引言
近年来学术规范一直受到学界、教育界和管理界的重视，国家也已出台了一些治理学术失范和不端的相关文件，但回望现实，学术不正之风尚未得到根本的扭转，有关我国学术不端现象的新闻报道屡见不鲜，学术论文抄袭事件更是层出不穷。为此，行政管理机构、高等教育机构及科研机构等部门相继出台了各种防治学术不端的文件，学术界也发起了抵制学术不端的倡议，商业机构也研发了遏制学术不端行为的软件。这些防治措施虽在一定程度上扼制了学术不端行为的蔓延，但尚未达到“治本” 的目的，且一些学术失范、不端检测软件(以下简称“不端检测软件” 或 “检测软件论文查重” )本身也存在不少设计上的问题。为了更好地达到治理效果，改进和完善检测软件功能，本文采用文献调查法、比较研究法，归纳和分析国内主要检测软件的功能、算法、使用范围和存在的问题，从学术研究规范的角度，将学术研究规范，尤其是论文形式规范贯穿到检测软件中，为学术不端检测及防范提供新思路。
1 学术不端检测的起源与发展
1.1 学术不端的起源
20 世纪 40 年代后期，美国学术界开始出现文字抄袭、编造实验数据、篡改实验结果等学术不端现象，当时并未引起足够重视，直到 1987 年匹兹堡大学助理教授布鲁宁的学术造假事件发生，学术不端行为才逐渐被学界关注和研究。 1992 年，美国公共卫生局对学术不端行为正式定义为“在进行或报告研究时发生的捏造、篡改、剽窃行为，或严重背离科学共同体公认规则的其他行为”[1]。我国对学术不端行为的关注也差不多在同一时间， 1996 年专注于揭发我国学术不端行为的“新语丝” 网站创办，之后我国学术界开始出现对学术不端现象的相关解释性研究[2]。曹树基认为“学术不端主要指学者涉及抄袭、剽窃等不良行为，也指学者恶意的一稿多投行为”[3]，此是“学术不端行为” 概念初步形成。 2016 年中华人民共和国教育部发布《高等学校预防与处理学术不端行为办法》，明确了学术不端行为的定义、具体行为表现及处理方式，指出学术不端行为是高等学校及其教学科研人员、管理人员和学生在科学研究及相关活动中发生的违反公认的学术准则、违背学术诚信的行为。这是我国第一份针对高校学术不端行为的规章性文件，标志着教育部对依法治理学术不端行为重视程度的提升，也引发了公众和学界对当前我国高校学术不端行为的激烈讨论。
1.2 学术不端检测的兴起
以信息技术为支撑的学术不端检测软件，在一定程度上有助于发现抄袭、拼凑论文等学术不端行为，从而起到威慑作用。国外学术不端检测软件起步较早，又由于语言文字等方面的差异，其反抄袭技术较国内成熟。成立较早的 Turnitin论文查重软件是全球最权威的英文检测系统[4]， 1998 年作为同行评议的申请由四位大学生创立， 2000 年开始开展防抄袭服务，现支持英文、中文、阿拉伯文等 30 多种语言的检测，被 90 多个国家 7000 多所高校采用[5]。我国学术不端检测软件最早于 2008 年研制成功并投入使用，包括武汉大学信息管理学院的“ROST 论文查重系统”、同方知网的“学术不端文献检测系统” 和北京智齿数汇科技有限公司的 PaperPass 论文查重检测系统，紧接着其他几大数据库商和信息服务机构都相继推出了学术不端检测软件，国内的学术不端检测技术研究进入繁荣时期，详见表 1。
2 学术不端检测软件相关研究
2.1 学术不端检测软件研究的文献
国内相关学术不端检测软件的研究是从2008 年同方知网的“学术不端文献检测系统” 上线运行后开始的。本文以 CNKI 中国学术期刊网络出版总库、中国重要会议论文全文数据库为统计源，以 CNKI 的高级检索为检索途径，检索1998-2017 年时段内主题包含“学术不端检测系统”“相似度检测软件”“相似度分析软件”“论文检测” 等关键词的文献，去除非学术文献和不相关文献，最终得到 204 篇文献。对 204 篇文献的年度分布、来源分布和作者所属机构进行定量统计分析，结果见图 1、图 2 和表 2。
在 Turnitin 诞生至“CNKI 学术不端文献检测系统” 诞生的 10 年间，我国并无学术不端文献检测软件的相关研究，自“学术不端文献检测系统” 诞生起，有关学术不端文献检测软件的研究逐渐兴起，总体呈上升趋势，但文献数量不多， 2011-2014 年是该领域的研究高峰期， 2014 年之后研究文献数量略有下降，但趋于平稳。有关学术不端文献检测软件的研究文献在《编辑学报》发表的数量最多，其次是《中国科技期刊研究》，这两种期刊均为 CSSCI 来源期刊；发表相关文献 4 篇以上的共 6 种期刊，合计发表文献 27 篇(占 13%)。从发表论文的期刊层次上看，学术不端检测软件相关研究文献具有一定的质量。在文献作者所属机构方面，共有 107 篇文献的作者来自学术期刊编辑部，其中发表文献数量最多的为《阴山学刊》编辑部，可见学术期刊编辑对学术不端检测软件的关注度比其他任何一个职业都高。
在研究内容方面，较集中在检测软件使用评价、检测平台比较分析、软件局限性分析、缺陷防范措施等方面，例如王宇[6]认为检测软件在数据来源方面存在检测盲区，在检索结果方面存在检测效果不理想、无法甄别合理引用的问题。肖骏等[7]测试了文献内容篡改和字序变更对检测软件检测结果的影响，发现字序更改和是否“触媒” 都能极大地影响学术不端检测软件的检测结果。徐仲[8]、王福军等[9]在对万方论文相似性检测系统(PSDS)和知网学术不端文献检测系统 (AMLC)进行比较后，认为两者在检测范围、文献引证检测和图表相似性检测上存在差异，并且这两种检测软件都存在一定的问题。王文福[10]认为仅依靠技术手段来清除学术不端行为是行不通的，应构建以人为主导、网络为主体，“人机合一” 的防范体系。这 205 篇文献对检测软件的讨论主要是围绕道德规范、法律、制度和技术扼制等几个方面展开的，尚未见从学术研究规范的角度来讨论检测软件局限和对策的文献，道德规范、法律、制度建设固然是必不可少，但本文认为从检测软件的功能出发，从学术研究规范的视角来讨论其局限、分析对策并展开实施，是当下学术不端防治严峻形势下的一条有效路径。
2.2 国内主要学术不端检测软件功能点比较目前国内提供学术不端检测服务的机构有10 余家，软件各具所长，如表 3 所示。这些学术不端检测软件的特点主要有如下几方面：
(1)检测软件功能重合率高。大部分软件仅具备论文检测一项功能，除了检测算法细节不一致、比对数据覆盖量不同之外，并无其他异处。所有检测软件均已实现了在海量数据的基础上的语义级别检测技术，包括指纹特征检测技术、知识挖掘技术、自然语言处理技术等，部分软件已经能够智能识别文字图片、智能抓取公式内容并自动检测观点剽窃。比对数据库文献量均以亿计，内容覆盖了期刊论文、会议论文、学位论文、图书、网页、报纸等资源。多数软件能够针对不同的使用对象开发了相应的检测版本，如博硕文论版、本科论文版、职称论文版、图书专著版等。
(2)学术研究规范应用简单。除了学术不端检测之外，部分检测软件拓展了软件功能，尝试将学术研究规范应用到检测软件中来。 Gocheck 论文引用检测系统 3.1 版本提供一个“导师指导” 功能，该功能使指导老师和学生能够在线互动并记录下互动内容，为导师指导贯穿毕业论文撰写过程提供途径。同方知网提供了一款名为 Writeaid 论文写作助手的论文辅助写作软件，该软件渗透到论文写作的过程，即能在论文写作之前根据不同高校或期刊的论文写作要求设定模板并自动校对文本，使得论文的格式能符合形式规范。大雅相似度分析系统可将研究思路、成果主要内容在中文图书中作全面的比对，从而协助找到相同或相似研究方向的课题和相关团队。这些功能的扩展，丰富了检测软件的应用场景，扩大了使用范围，然而这些应用仅利用了学术研究规范的部分条例，还不成体系。
(3)学术不端行为更加“隐秘”。学术不端检测软件引入的初衷是为了防范学术不端，然而技术进步并不能阻止学术不端行为的发生，比如检测算法的升级很快就被发现有“漏洞”，而被不法分子所利用，如今社会上出现的支持被检测者实施学术不端行为的“帮凶”[6]，帮助被检测者实施“一种升级版的造假[17]” 的行为愈来愈猖狂，使得检测成为了一场所谓“降重技巧” 的比拼，失去了学术不端检测应有的意义。笔者在百度中输入“降重”，立即跳出“降重软件”“论文降重” 等关键词，相关检索结果多达 927 万余条，各种所谓“自动降重软件”“论文降重助手” 比比皆是，在淘宝网中搜索“论文降重” 也得到 400 余条检索结果，并显示有大量成功交易。这种做法助长了学术不端风气，严重阻碍了相关学术研究的进步。
3 学术不端行为及防治局限
3.1 学术不端行为的主要表现
违反学术规范行为涉及到所有参加学术研究行为的主体，其行为纷繁复杂，在学术研究各个环节均有所表现。根据学术活动涉及到的人员可分为在校学生、学术期刊编辑、专门科研人员、评审专家、管理单位等，根据不端行为本身的性质可分为伪造类、剽窃类、赞誉类等[18]。本文根据已有研究成果，总结了不同的人员在学术研究程序各环节内可能发生的违反学术规范行为见表 4。
由表 4 可以看出，在学术研究的研究选题、数据分析、总结研究成果和研究成果发表这四个阶段最易发生违反学术规范行为，包括学术失范、学术不端和学术腐败等。学术失范行为在大多数情况下可能是科学工作者在不经意间的失误，并不是刻意的行为，是一种轻微的违反学术规则而造成的失误。学术腐败主要表现为学术组织的权力拥有者利用手中的权力侵占他人学术成果，其危害性更大。学术不端行为介于二者之间，界定在包括剽窃、数据篡改和捏造等情形中，不仅作者本人会产生学术不端行为，期刊编辑的不当转载、互惠引用等行为也会使作者产生学术不端行为。
3.2 学术不端行为治理的局限
从 20 世纪 80 年代学术不端初露端倪开始，政府、学界和社会为规范学术行为开始了漫长的治理之路，其治理途径主要包括道德规范建设、制度建设、法律建设和技术遏制[19]等几个方面，所付出的努力有目共睹。本文总结学术不端治理路径依据其可操作性认为学术不端防治可分为易操作、一般操作和难操作 3 个层次，如表 5 所示。
我国学术不端行为的治理之所以一直并没有达到所期望的效果，是因为在这过程中存在配套机制缺失和执行力度不够等问题，比如匿名评审制度，由于学术研究的专门化，小同行之间相互熟悉，匿名评审专家很容易判断出作者是谁，专家库的缺失、遴选机制的不透明等都使得匿名评审制度在学界存在异议。学术单位和管理部门在惩戒违反学术规范、追究相关责任人、完善项目申请和评审制度方面有着非常严格的制度[20]，但是执行的力度往往却碍于名声、熟人等原因而有所折扣，且“问题” 往往跟着“制度” 相继出现，甚至出现来不及堵漏洞的现象。全面、系统的学术规范教育、完善学术评价机制、加强学术立法等手段无法立竿见影且不易操作，比如学术规范道德建设就容易被操作成泛泛意义上的道德说教，学术评价容易被操作成重量不重质。
3.3 学术不端检测软件的功能局限
学术不端检测是最易操作、也是当前最流行的一种基于计算机技术的学术不端防治手段，学术论文要想公开发表就必须通过检测审核。经过 10 年的发展，检测软件在实践中不断进步，算法、操作、服务等方面均有所改进，但仍然存在一定的功能局限：第一，存在时间上的检测盲区。收集论文存在一定程度的滞后性，无法检测未及时上传的、未能公开发表的或仅在一定范围内公开发表的抄袭源文献；第二，存在技术上的检测盲区。检测算法不够智能，无法检测翻译的外文文献，无法检测表述方式变动、语序调整、同义词替换等深层学术不端行为，只能避免“文字” 抄袭而不能防止“思想” 抄袭[21]；第三，存在相似度判定盲区。不能区分必要自引、合理他引和抄袭，对作者正常、必要的自引一律判定为 “重复”，会将引用权威著作、历史材料、法律法规等情况判定为抄袭，将统一格式的医学论文的前言、资料与方法、结果、讨论等内容判定为抄袭[22]，如此修改后有损论文整体内容结构，也浪费作者宝贵的时间和精力；第四，检测软件功能单一。检测软件只具备文本相似度检测的功能，被检测者有若干手段可绕过相似度检测，缺乏论文选题、师生互动、学术积累等其他功能对学术行为的佐证；第五，检测软件只检测结果，不检测过程。对于篡改、伪造、剽窃数据、伪造辅证、实验违规、提前发表不成熟的成果、不当署名、学术泄密这一类学术不端行为无能为力。
4 学术不端检测软件的功能对策
学术不端防治的道德规范、制度、法律和技术遏制等四种路径在措施上存在不妥之处，且未能达成学术治理的良性互动，应用较为广泛的学术不端检测软件也有着存在检测盲区、检测功能单一等局限，因此，学术不端行为得不到有效遏制。 2018 年 5 月，中共中央办公厅、国务院办公厅印发了《关于进一步加强科研诚信建设的若干意见》 (以下简称《意见》)，对进一步推进科研诚信制度化建设等方面做出部署。本文认为，升级技术遏制手段，全面系统地融入学术研究规范条例，延展检测软件的功能和使用范围，在检测前开展学术规范教育、检测中增加检测软件的实用功能、检测后建立学术信用数据库，同时利用学术制度和学术立法来约束学术研究参与者在学术研究过程中的行为，是短期内防治学术不端行为的一个有效措施。
4.1 利用文献检测结果，防范利用时间盲区的不端行为
期刊编辑部应将已录用未发表论文纳入学术不端检测源，甚至可进一步将该部分文献提供给软件公司或检测机构，同时检测软件应在法律允许范围内尽可能收集更多的灰色文献资源作为检测源，扩大比对数据量。对于科研院所、期刊编辑部等用户来说，应利用多种检测软件分时段多次检测，以避免单一检测软件数据收录不全面的漏洞。此外，检测软件记录了学者检测过的学术成果以及检测结果，学术成果可进一步扩充检测数据源，检测结果则可累积进而建立学者学术信用数据库。《意见》第七条指出“科技部会同中国社科院建立完善覆盖全国的自然科学和哲学社会科学科研诚信信息系统，对科研人员、相关机构、组织等的科研诚信状况进行记录”。我国至今仍未建立学术信用信息系统，相比欧美等发达国家差距较大。尽管建立学术信用数据库需要有规范的学术信用评估标准和制度规范的信息收集及传播途径等前提条件保障[23]，但就检测软件来说，其记录的检测结果数据可为一定范围内的学术信用监管和学术评价活动提供依据。
4.2 应用人工智能技术，防范利用技术盲区的不端行为所谓的“降重技巧” 往往随着检测软件的升级而“升级”，它们试图通过翻译、替换同义词、调整语序等方式来逃避检测软件的检测，严重扰乱了学术秩序。检测软件的这种“不强大” 也成为了一些人抵制学术不端软件的理由。打铁还需自身硬，检测软件应积极利用近年来蓬勃发展的人工智能技术来壮大自己，其中的跨语言检测技术和语义识别技术等可帮助检测软件有效解决 “思想抄袭” 的问题。跨语言检测通过语言规范化、候选文档检索、分类器训练、剽窃行为分析等几个步骤来进行跨语言相似性分析，该技术刚刚起步不久，国内外都正处于研究快速发展阶段[24]。语义识别技术是通过对文献的词语解析、信息抽取、时间因果、情绪判断等技术处理实现对文献的语篇理解，能较好地识别替换同义词、调整语序等学术不端行为。
4.3 人工智能与专家判定相结合，防止误判“抄袭” 学术不端检测软件的使用范围越来越广，涉及到学生毕业、学者论文发表、职称评定、评奖评优等学术活动的方方面面，因误判而带来的风险越来越大。检测软件应积极利用大数据技术，建立语料库，充分进行数据训练，提高相似度判定的准确率。首先，检测软件要能够智能区分待检测论文的学科并根据学科特点来判定待检测论文的引用情况，疑似抄袭文字是否为权威著作、历史材料、法律法规或名人名言，若有如此情况应不可判定为抄袭。其次，检测软件还可根据文献类型对待检测论文的文体特征进行分析，智能判定学术论文中是否提供研究的学术背景、前沿动态，真实报道研究方法、研究步骤、研究结果、研究结论等内容，是否遵守包括题名、署名、摘要等在内的内容格式规范，以确保检测论文符合学术形式规范要求。需要说明的是，人工智能的判定结果应再交予专家进一步鉴定，例如在学位论文检测时，检测软件应提供文字复制比由导师介入判定是否存在学术不端行为；期刊编辑部检测待发表论文时如发现论文相似度比例过高，应由编辑或审稿专家人工介入判定是否为抄袭行为。
4.4 贯穿学术规范升级软件功能，介入学术研究过程
《意见》第三条指出要“加强科研活动全流程诚信管理”。作为当前使用最为广泛的学术治理软件，如果将学术规范的相关规范条例贯穿到学术不端检测软件中去，学术不端检测软件深入到学术研究的各个环节，不仅可以检测学术研究结果，还可以监督学术研究过程，研究成果和研究过程可以相互印证，相关学术评价活动也能够依此开展过程评价而不再把预期目标和研究成果作为唯一的评价依据，可在一定程度上防止篡改、伪造、剽窃数据、不当署名等学术不端行为的发生。
在研究选题阶段，可根据科研人员的公开发表论文和论文被引情况得到学术信息、科研能力和学术影响力，开发学术前沿发现功能，可协助学术新人进行研究选题；在文献调研阶段提供文献管理功能，科研人员可将其搜集到的与待检测论文相关的文献分类标注存储起来，一方面作为研究笔记；另一方面可为检测提供参考依据；在研究方法选择阶段提供研究方法记录功能，记录下科研人员的研究方法，研究方法不同则研究步骤就不同，如研究方法与研究步骤不相匹配，则该论文必有瑕疵；在资料数据分析阶段提供数据记录功能，详细记录实验过程及其数据，为其他研究人员验证论文结果提供依据；在总结研究成果阶段提供自动校对论文格式功能，能够根据前期文献积累和研究记录、实验数据等情况自动生成并校验论文相关内容，同时根据论文参与人员的贡献程度生成署名；在研究成果发表阶段增加互动功能，记录每一次的检测记录和作者修改记录；在学术评价阶段提供形式评价功能，根据成果的类型和形式制定评价标准并开展初步评价，为专家评审提供初步意见。
4.5 利用检测软件开展学术规范教育，培养学术规范意识
加强学术规范教育和学术规范意识养成是防范学术不端行为的重要手段。《意见》第五条提出要“切实加强科研诚信的教育和宣传”。由于种种原因限制，过往的多数科研诚信和学术规范教育多为口头传达，学生对于学术规范仅理解为 “引文格式”“写作规范”“规范标注” 等，期刊编辑部大都要求与作者签署版权协议和责任声明，其中包含作者杜绝学术不端行为的承诺，但实际上大多数流于形式，没有真正起到防范作用[25]。学术不端检测软件是所有学生和学者在学术成果发表之前必须使用的软件，可在检测软件的访问界面上提供学术规范自主学习平台，内容包括科研诚信、道德修养、政策法规、研究规范、写作规范等，提供在线阅读、视频观看、案例分析、在线练习等功能，作者需完成一定时长的学术规范学习或通过学术规范测试后方可使用检测软件。
5 结语
学术规范是每一位科研人员所必须进行的 “规定动作”，科研人员遵守学术规范，所进行的学术研究才有价值，才能与国内外同行进行有效的交流，才能促进学术创新和知识增长[26]。尽管目前国内相关学术不端检测软件存在各种缺点，但作为学术不端治理的技术遏制手段之一，也发挥了其应有的作用。本文分析了学术不端检测软件的功能和局限以及学术研究规范在学术不端防治技术手段中的有限应用，探讨如何将学术不端检测软件深入到学术研究过程中去，提出学术不端行为防治规范化和流程化措施建议，为我国学术不端行为的防范与治理提供思路借鉴。

相关文章：基于著作权法探讨洗稿的法律性质

关于我们: CheckBao是中文学术论文相似度查重检测系统，是权威、可信赖的中文学术剽窃检查的在线网站。CheckBao论文查重检测系统专注中文学术检测抄袭，基于亿级学术期刊、学位论文和互联网数据，采用大数据中文语义识别比对技术，为学术原创保驾护航。

联系我们: 客服QQ：1436706507