论文查重 | 论文文献库 | 学术失范、不端检测软件的功能、局限与对策 ——以学术研究规范为视角

引言
近年来学术规范一直受到学界、 教育界和管 理界的重视, 国家也已出台了一些治理学术失范 和不端的相关文件, 但回望现实, 学术不正之风 尚未得到根本的扭转, 有关我国学术不端现象的新闻报道屡见不鲜, 学术论文抄袭事件更是层出 不穷。 为此, 行政管理机构、 高等教育机构及科 研机构等部门相继出台了各种防治学术不端的文 件, 学术界也发起了抵制学术不端的倡议, 商业 机构也研发了遏制学术不端行为的软件。 这些防 治措施虽在一定程度上扼制了学术不端行为的蔓 延, 但尚未达到“治本” 的目的, 且一些学术失 范、 不端检测软件(以下简称“不端检测软件” 或 “检测软件论文查重” )本身也存在不少设计上的问题。 为 了更好地达到治理效果, 改进和完善检测软件功 能, 本文采用文献调查法、 比较研究法, 归纳和 分析国内主要检测软件的功能、 算法、 使用范围 和存在的问题, 从学术研究规范的角度, 将学术 研究规范, 尤其是论文形式规范贯穿到检测软件 中, 为学术不端检测及防范提供新思路。
1 学术不端检测的起源与发展
1.1 学术不端的起源
20 世纪 40 年代后期, 美国学术界开始出现 文字抄袭、 编造实验数据、 篡改实验结果等学术 不端现象, 当时并未引起足够重视, 直到 1987 年匹兹堡大学助理教授布鲁宁的学术造假事件发 生, 学术不端行为才逐渐被学界关注和研究。 1992 年, 美国公共卫生局对学术不端行为正式 定义为“在进行或报告研究时发生的捏造、 篡 改、 剽窃行为, 或严重背离科学共同体公认规则 的其他行为”[1]。 我国对学术不端行为的关注也差 不多在同一时间, 1996 年专注于揭发我国学术 不端行为的“新语丝” 网站创办, 之后我国学术 界开始出现对学术不端现象的相关解释性研究[2]。 曹树基认为“学术不端主要指学者涉及抄袭、 剽 窃等不良行为, 也指学者恶意的一稿多投行为”[3], 此是“学术不端行为” 概念初步形成。 2016 年 中华人民共和国教育部发布 《高等学校预防与处 理学术不端行为办法》, 明确了学术不端行为的 定义、 具体行为表现及处理方式, 指出学术不端 行为是高等学校及其教学科研人员、 管理人员和 学生在科学研究及相关活动中发生的违反公认的 学术准则、 违背学术诚信的行为。 这是我国第一份针对高校学术不端行为的规章性文件, 标志着 教育部对依法治理学术不端行为重视程度的提 升, 也引发了公众和学界对当前我国高校学术不 端行为的激烈讨论。
1.2 学术不端检测的兴起
以信息技术为支撑的学术不端检测软件, 在 一定程度上有助于发现抄袭、 拼凑论文等学术不 端行为, 从而起到威慑作用。 国外学术不端检测 软件起步较早, 又由于语言文字等方面的差异, 其反抄袭技术较国内成熟。 成立较早的 Turnitin论文查重 软件是全球最权威的英文检测系统[4], 1998 年作 为同行评议的申请由四位大学生创立, 2000 年 开始开展防抄袭服务, 现支持英文、 中文、 阿拉 伯文等 30 多种语言的检测, 被 90 多个国家 7000 多所高校采用[5]。 我国学术不端检测软件最早于 2008 年研制成功并投入使用, 包括武汉大学信 息管理学院的“ROST 论文查重系统”、 同方 知网的“学术不端文献检测系统” 和北京智齿数 汇科技有限公司的 PaperPass 论文查重检测系统, 紧接着 其他几大数据库商和信息服务机构都相继推出了 学术不端检测软件, 国内的学术不端检测技术研 究进入繁荣时期, 详见表 1。
2 学术不端检测软件相关研究
2.1 学术不端检测软件研究的文献
国内相关学术不端检测软件的研究是从2008 年同方知网的“学术不端文献检测系统” 上线运行 后开始的。 本文以 CNKI 中国学术期刊网络出版 总库、 中国重要会议论文全文数据库为统计源, 以 CNKI 的高级检索为检索途径, 检索1998-2017 年时段内主题包含“学术不端检测系统”“相似度检 测软件”“相似度分析软件”“论文检测” 等关键词 的文献, 去除非学术文献和不相关文献, 最终得 到 204 篇文献。 对 204 篇文献的年度分布、 来 源分布和作者所属机构进行定量统计分析, 结果 见图 1、 图 2 和表 2。
在 Turnitin 诞生至“CNKI 学术不端文献检 测系统” 诞生的 10 年间, 我国并无学术不端文 献检测软件的相关研究, 自“学术不端文献检测 系统” 诞生起, 有关学术不端文献检测软件的研 究逐渐兴起, 总体呈上升趋势, 但文献数量不多, 2011-2014 年是该领域的研究高峰期, 2014 年之后研究文献数量略有下降, 但趋于平 稳。 有关学术不端文献检测软件的研究文献在 《编辑学报》 发表的数量最多, 其次是 《中国科 技期刊研究》, 这两种期刊均为 CSSCI 来源期 刊; 发表相关文献 4 篇以上的共 6 种期刊, 合计 发表文献 27 篇(占 13%)。 从发表论文的期刊层 次上看, 学术不端检测软件相关研究文献具有一 定的质量。 在文献作者所属机构方面, 共有 107 篇文献的作者来自学术期刊编辑部, 其中发表文 献数量最多的为 《阴山学刊》 编辑部, 可见学术 期刊编辑对学术不端检测软件的关注度比其他任 何一个职业都高。
在研究内容方面, 较集中在检测软件使用评 价、 检测平台比较分析、 软件局限性分析、 缺陷 防范措施等方面, 例如王宇[6]认为检测软件在数 据来源方面存在检测盲区, 在检索结果方面存在 检测效果不理想、 无法甄别合理引用的问题。 肖 骏等[7]测试了文献内容篡改和字序变更对检测软 件检测结果的影响, 发现字序更改和是否“触 媒” 都能极大地影响学术不端检测软件的检测 结果。 徐仲[8]、 王福军等[9]在对万方论文相似性检 测系统(PSDS)和知网学术不端文献检测系统 (AMLC)进行比较后, 认为两者在检测范围、 文 献引证检测和图表相似性检测上存在差异, 并且 这两种检测软件都存在一定的问题。 王文福[10]认 为仅依靠技术手段来清除学术不端行为是行不通 的, 应构建以人为主导、 网络为主体,“人机合 一” 的防范体系。 这 205 篇文献对检测软件的讨 论主要是围绕道德规范、 法律、 制度和技术扼制 等几个方面展开的, 尚未见从学术研究规范的角 度来讨论检测软件局限和对策的文献, 道德规 范、 法律、 制度建设固然是必不可少, 但本文认 为从检测软件的功能出发, 从学术研究规范的视 角来讨论其局限、 分析对策并展开实施, 是当下 学术不端防治严峻形势下的一条有效路径。
2.2 国内主要学术不端检测软件功能点比较 目前国内提供学术不端检测服务的机构有10 余家, 软件各具所长, 如表 3 所示。 这些学术不端检测软件的特点主要有如下几 方面:
(1)检测软件功能重合率高。 大部分软件仅具 备论文检测一项功能, 除了检测算法细节不一 致、 比对数据覆盖量不同之外, 并无其他异处。 所有检测软件均已实现了在海量数据的基础上的 语义级别检测技术, 包括指纹特征检测技术、 知 识挖掘技术、 自然语言处理技术等, 部分软件已 经能够智能识别文字图片、 智能抓取公式内容并 自动检测观点剽窃。 比对数据库文献量均以亿 计, 内容覆盖了期刊论文、 会议论文、 学位论文、 图书、 网页、 报纸等资源。 多数软件能够针对不 同的使用对象开发了相应的检测版本, 如博硕文 论版、 本科论文版、 职称论文版、 图书专著版等。
(2)学术研究规范应用简单。 除了学术不端检 测之外, 部分检测软件拓展了软件功能, 尝试将学 术研究规范应用到检测软件中来。 Gocheck 论文 引用检测系统 3.1 版本提供一个“导师指导” 功 能, 该功能使指导老师和学生能够在线互动并记 录下互动内容, 为导师指导贯穿毕业论文撰写过 程提供途径。 同方知网提供了一款名为 Writeaid 论 文写作助手的论文辅助写作软件, 该软件渗透到 论文写作的过程, 即能在论文写作之前根据不同高校或期刊的论文写作要求设定模板并自动校对 文本, 使得论文的格式能符合形式规范。 大雅相 似度分析系统可将研究思路、 成果主要内容在中 文图书中作全面的比对, 从而协助找到相同或相 似研究方向的课题和相关团队。 这些功能的扩 展, 丰富了检测软件的应用场景, 扩大了使用范 围, 然而这些应用仅利用了学术研究规范的部分 条例, 还不成体系。
(3)学术不端行为更加“隐秘”。 学术不端检 测软件引入的初衷是为了防范学术不端, 然而技 术进步并不能阻止学术不端行为的发生, 比如检 测算法的升级很快就被发现有“漏洞”, 而被不 法分子所利用, 如今社会上出现的支持被检测者 实施学术不端行为的“帮凶”[6], 帮助被检测者实 施“一种升级版的造假[17]” 的行为愈来愈猖狂, 使得检测成为了一场所谓“降重技巧” 的比拼, 失去了学术不端检测应有的意义。 笔者在百度中 输入“降重”, 立即跳出“降重软件”“论文降重” 等 关键词, 相关检索结果多达 927 万余条, 各种所 谓“自动降重软件”“论文降重助手” 比比皆是, 在淘宝网中搜索“论文降重” 也得到 400 余条检 索结果, 并显示有大量成功交易。 这种做法助长 了学术不端风气, 严重阻碍了相关学术研究的进步。
3 学术不端行为及防治局限
3.1 学术不端行为的主要表现
违反学术规范行为涉及到所有参加学术研究 行为的主体, 其行为纷繁复杂, 在学术研究各个 环节均有所表现。 根据学术活动涉及到的人员可 分为在校学生、 学术期刊编辑、 专门科研人员、 评审专家、 管理单位等, 根据不端行为本身的 性质可分为伪造类、 剽窃类、 赞誉类等[18]。 本文 根据已有研究成果, 总结了不同的人员在学术研 究程序各环节内可能发生的违反学术规范行为见 表 4。
由表 4 可以看出, 在学术研究的研究选题、 数据分析、 总结研究成果和研究成果发表这四个 阶段最易发生违反学术规范行为, 包括学术失 范、 学术不端和学术腐败等。 学术失范行为在大 多数情况下可能是科学工作者在不经意间的失 误, 并不是刻意的行为, 是一种轻微的违反学术 规则而造成的失误。 学术腐败主要表现为学术组 织的权力拥有者利用手中的权力侵占他人学术成 果, 其危害性更大。 学术不端行为介于二者之 间, 界定在包括剽窃、 数据篡改和捏造等情形 中, 不仅作者本人会产生学术不端行为, 期刊编 辑的不当转载、 互惠引用等行为也会使作者产生 学术不端行为。
3.2 学术不端行为治理的局限
从 20 世纪 80 年代学术不端初露端倪开始, 政府、 学界和社会为规范学术行为开始了漫长 的治理之路, 其治理途径主要包括道德规范建 设、 制度建设、 法律建设和技术遏制[19]等几个方 面, 所付出的努力有目共睹。 本文总结学术不端 治理路径依据其可操作性认为学术不端防治可分 为易操作、 一般操作和难操作 3 个层次, 如表 5 所示。
我国学术不端行为的治理之所以一直并没有 达到所期望的效果, 是因为在这过程中存在配套 机制缺失和执行力度不够等问题, 比如匿名评审 制度, 由于学术研究的专门化, 小同行之间相互 熟悉, 匿名评审专家很容易判断出作者是谁, 专 家库的缺失、 遴选机制的不透明等都使得匿名评 审制度在学界存在异议。 学术单位和管理部门在 惩戒违反学术规范、 追究相关责任人、 完善项目申请和评审制度方面有着非常严格的制度[20], 但 是执行的力度往往却碍于名声、 熟人等原因而有 所折扣, 且“问题” 往往跟着“制度” 相继出 现, 甚至出现来不及堵漏洞的现象。 全面、 系统 的学术规范教育、 完善学术评价机制、 加强学术 立法等手段无法立竿见影且不易操作, 比如学术 规范道德建设就容易被操作成泛泛意义上的道德 说教, 学术评价容易被操作成重量不重质。
3.3 学术不端检测软件的功能局限
学术不端检测是最易操作、 也是当前最流行 的一种基于计算机技术的学术不端防治手段, 学 术论文要想公开发表就必须通过检测审核。 经过 10 年的发展, 检测软件在实践中不断进步, 算 法、 操作、 服务等方面均有所改进, 但仍然存在 一定的功能局限: 第一, 存在时间上的检测盲 区。 收集论文存在一定程度的滞后性, 无法检测 未及时上传的、 未能公开发表的或仅在一定范围 内公开发表的抄袭源文献; 第二, 存在技术上的 检测盲区。 检测算法不够智能, 无法检测翻译的 外文文献, 无法检测表述方式变动、 语序调整、 同义词替换等深层学术不端行为, 只能避免“文 字” 抄袭而不能防止“思想” 抄袭[21]; 第三, 存 在相似度判定盲区。 不能区分必要自引、 合理他 引和抄袭, 对作者正常、 必要的自引一律判定为 “重复”, 会将引用权威著作、 历史材料、 法律法 规等情况判定为抄袭, 将统一格式的医学论文的 前言、 资料与方法、 结果、 讨论等内容判定为抄 袭[22], 如此修改后有损论文整体内容结构, 也浪 费作者宝贵的时间和精力; 第四, 检测软件功能 单一。 检测软件只具备文本相似度检测的功能, 被检测者有若干手段可绕过相似度检测, 缺乏论 文选题、 师生互动、 学术积累等其他功能对学术 行为的佐证; 第五, 检测软件只检测结果, 不检 测过程。 对于篡改、 伪造、 剽窃数据、 伪造辅 证、 实验违规、 提前发表不成熟的成果、 不当署 名、 学术泄密这一类学术不端行为无能为力。
4 学术不端检测软件的功能对策
学术不端防治的道德规范、 制度、 法律和技 术遏制等四种路径在措施上存在不妥之处, 且未 能达成学术治理的良性互动, 应用较为广泛的学 术不端检测软件也有着存在检测盲区、 检测功能 单一等局限, 因此, 学术不端行为得不到有效遏 制。 2018 年 5 月, 中共中央办公厅、 国务院办 公厅印发了 《关于进一步加强科研诚信建设的若 干意见》 (以下简称《意见》), 对进一步推进科研 诚信制度化建设等方面做出部署。 本文认为, 升 级技术遏制手段, 全面系统地融入学术研究规范 条例, 延展检测软件的功能和使用范围, 在检测 前开展学术规范教育、 检测中增加检测软件的实 用功能、 检测后建立学术信用数据库, 同时利用 学术制度和学术立法来约束学术研究参与者在学 术研究过程中的行为, 是短期内防治学术不端行 为的一个有效措施。
4.1 利用文献检测结果, 防范利用时间盲区的 不端行为
期刊编辑部应将已录用未发表论文纳入学术 不端检测源, 甚至可进一步将该部分文献提供给 软件公司或检测机构, 同时检测软件应在法律允 许范围内尽可能收集更多的灰色文献资源作为检 测源, 扩大比对数据量。 对于科研院所、 期刊编 辑部等用户来说, 应利用多种检测软件分时段多 次检测, 以避免单一检测软件数据收录不全面的 漏洞。 此外, 检测软件记录了学者检测过的学术 成果以及检测结果, 学术成果可进一步扩充检测 数据源, 检测结果则可累积进而建立学者学术信 用数据库。《意见》 第七条指出“科技部会同中国 社科院建立完善覆盖全国的自然科学和哲学社会 科学科研诚信信息系统, 对科研人员、 相关机 构、 组织等的科研诚信状况进行记录”。 我国至 今仍未建立学术信用信息系统, 相比欧美等发达 国家差距较大。 尽管建立学术信用数据库需要有 规范的学术信用评估标准和制度规范的信息收集 及传播途径等前提条件保障[23], 但就检测软件来 说, 其记录的检测结果数据可为一定范围内的学 术信用监管和学术评价活动提供依据。
4.2 应用人工智能技术, 防范利用技术盲区的不端行为 所谓的“降重技巧” 往往随着检测软件的升级而“升级”, 它们试图通过翻译、 替换同义词、 调整语序等方式来逃避检测软件的检测, 严重扰 乱了学术秩序。 检测软件的这种“不强大” 也成 为了一些人抵制学术不端软件的理由。 打铁还需 自身硬, 检测软件应积极利用近年来蓬勃发展的 人工智能技术来壮大自己, 其中的跨语言检测技 术和语义识别技术等可帮助检测软件有效解决 “思想抄袭” 的问题。 跨语言检测通过语言规范 化、 候选文档检索、 分类器训练、 剽窃行为分析 等几个步骤来进行跨语言相似性分析, 该技术刚 刚起步不久, 国内外都正处于研究快速发展阶 段[24]。 语义识别技术是通过对文献的词语解析、 信息抽取、 时间因果、 情绪判断等技术处理实现 对文献的语篇理解, 能较好地识别替换同义词、 调整语序等学术不端行为。
4.3 人工智能与专家判定相结合, 防止误判“抄袭” 学术不端检测软件的使用范围越来越广, 涉 及到学生毕业、 学者论文发表、 职称评定、 评奖 评优等学术活动的方方面面, 因误判而带来的风 险越来越大。 检测软件应积极利用大数据技术, 建立语料库, 充分进行数据训练, 提高相似度判 定的准确率。 首先, 检测软件要能够智能区分待 检测论文的学科并根据学科特点来判定待检测论 文的引用情况, 疑似抄袭文字是否为权威著作、 历史材料、 法律法规或名人名言, 若有如此情况 应不可判定为抄袭。 其次, 检测软件还可根据文 献类型对待检测论文的文体特征进行分析, 智能 判定学术论文中是否提供研究的学术背景、 前沿 动态, 真实报道研究方法、 研究步骤、 研究结果、 研究结论等内容, 是否遵守包括题名、 署名、 摘 要等在内的内容格式规范, 以确保检测论文符合 学术形式规范要求。 需要说明的是, 人工智能的 判定结果应再交予专家进一步鉴定, 例如在学位 论文检测时, 检测软件应提供文字复制比由导师 介入判定是否存在学术不端行为; 期刊编辑部检 测待发表论文时如发现论文相似度比例过高, 应 由编辑或审稿专家人工介入判定是否为抄袭行为。
4.4 贯穿学术规范升级软件功能, 介入学术研究 过程
《意见》 第三条指出要“加强科研活动全流 程诚信管理”。 作为当前使用最为广泛的学术治 理软件, 如果将学术规范的相关规范条例贯穿到 学术不端检测软件中去, 学术不端检测软件深入 到学术研究的各个环节, 不仅可以检测学术研究 结果, 还可以监督学术研究过程, 研究成果和研 究过程可以相互印证, 相关学术评价活动也能够 依此开展过程评价而不再把预期目标和研究成果 作为唯一的评价依据, 可在一定程度上防止篡 改、 伪造、 剽窃数据、 不当署名等学术不端行为 的发生。
在研究选题阶段, 可根据科研人员的公开发 表论文和论文被引情况得到学术信息、 科研能力 和学术影响力, 开发学术前沿发现功能, 可协助 学术新人进行研究选题; 在文献调研阶段提供文 献管理功能, 科研人员可将其搜集到的与待检测 论文相关的文献分类标注存储起来, 一方面作为 研究笔记; 另一方面可为检测提供参考依据; 在 研究方法选择阶段提供研究方法记录功能, 记录 下科研人员的研究方法, 研究方法不同则研究步 骤就不同, 如研究方法与研究步骤不相匹配, 则 该论文必有瑕疵; 在资料数据分析阶段提供数据 记录功能, 详细记录实验过程及其数据, 为其他 研究人员验证论文结果提供依据; 在总结研究成 果阶段提供自动校对论文格式功能, 能够根据前 期文献积累和研究记录、 实验数据等情况自动生 成并校验论文相关内容, 同时根据论文参与人员 的贡献程度生成署名; 在研究成果发表阶段增加 互动功能, 记录每一次的检测记录和作者修改记 录; 在学术评价阶段提供形式评价功能, 根据成 果的类型和形式制定评价标准并开展初步评价, 为专家评审提供初步意见。
4.5 利用检测软件开展学术规范教育, 培养学术 规范意识
加强学术规范教育和学术规范意识养成是防 范学术不端行为的重要手段。《意见》 第五条提出 要“切实加强科研诚信的教育和宣传”。 由于种 种原因限制, 过往的多数科研诚信和学术规范教 育多为口头传达, 学生对于学术规范仅理解为 “引文格式”“写作规范”“规范标注” 等, 期刊编 辑部大都要求与作者签署版权协议和责任声明,其中包含作者杜绝学术不端行为的承诺, 但实际 上大多数流于形式, 没有真正起到防范作用[25]。 学术不端检测软件是所有学生和学者在学术成果 发表之前必须使用的软件, 可在检测软件的访问 界面上提供学术规范自主学习平台, 内容包括科 研诚信、 道德修养、 政策法规、 研究规范、 写作 规范等, 提供在线阅读、 视频观看、 案例分析、 在线练习等功能, 作者需完成一定时长的学术规范 学习或通过学术规范测试后方可使用检测软件。
5 结语
学术规范是每一位科研人员所必须进行的 “规定动作”, 科研人员遵守学术规范, 所进行的 学术研究才有价值, 才能与国内外同行进行有效 的交流, 才能促进学术创新和知识增长[26]。 尽管 目前国内相关学术不端检测软件存在各种缺点, 但作为学术不端治理的技术遏制手段之一, 也发 挥了其应有的作用。 本文分析了学术不端检测软 件的功能和局限以及学术研究规范在学术不端防 治技术手段中的有限应用, 探讨如何将学术不端 检测软件深入到学术研究过程中去, 提出学术不 端行为防治规范化和流程化措施建议, 为我国学 术不端行为的防范与治理提供思路借鉴。

相关文章:基于著作权法探讨洗稿的法律性质