首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

论文重复率检测算法分析

作者:新风学术网

 1.论文的段落与格式

论文检测基本都是整篇文章上传,上传后,论文检测软件首先进行部分划分,上交的最终稿件格式对抄袭率有很大影响。不同段落的划分可能造成几十个字的小段落检测不出来。因此,我们可以通过划分多的小段落来降低抄袭率。

2.数据库

论文检测,多半是针对已发表的毕业论文,期刊文章,还有会议论文进行匹配的,有的数据库也包含了网络的一些文章。这里给大家透露下,很多书籍是没有包含在检测数据库中的。之前朋友从一本研究性的着作中摘抄了大量文字,也没被查出来。就能看出,这个方法还是有效果的。

3.章节变换

很多同学改变了章节的顺序,或者从不同的文章中抽取不同的章节拼接而成的文章,对查重的结果影响几乎为零。所以论文查重建议大家不要以为借鉴几篇文章,或者几十篇文章就能过关。

4.标注参考文献

参考别人的文章和抄袭别人的文章在检测软件中是如何界定的。其实很简单,我们的论文中加了参考文献的引用符号,但是在抄袭检测软件中,都是同样的。

查重阈值一般设定为1%,例如一篇文章有5000字,文章的1%就是50字,如果抄袭了多于50,即使加了参考文献,也会被判定为抄袭。

5.字数匹配

论文抄袭检测系统相对比较严格,只要多于13单位的字数匹配一致,就被认定为抄袭,但是前提是满足第4点,参考文献的标注。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200919A05FJS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券