了解知网查重原理,重复率3%以下其实很简单!
对于论文原创度的合格标准,有些学校定的标准线稍为宽松一些,重复率在30%或20%以下就算合格;而有些学校规定要在10%甚至5%以下才算合格。5%的要求真的是极度严格了,因为常用字就这么三千多个,专业领域的词汇也都是通用的,随便写点什么都可以查找到相似的句段。
国内应用最广泛,最权威的是知网系的检测系统,也是目前高校普遍采用的系统,今天,主页君以知网检测系统来作为案例来做一些具体的分析。
1
在知网查重报告中,标黄色的文字代表这段话被判断为“引用”,标红色的文字代表这段话被判断为“涉嫌剽窃”
2
在知网查重进行中,检测系统只能识别文字部分,论文中的图片、word域代码、mathtype编辑的公式、是不检测的,因为检测系统尚无法识别这些复杂的内容格式。你可以通过[全选]——[复制]——[选择性粘贴]——[只保留文字]这样步骤的操作来查看具体的查重部分。另外,在编辑公式时,建议使用用mathtype,不要用word自带的公式编辑器。
3
论文中的表格内容数据是可以识别的。如果表格的内容有很大的重复度,可以把表格截图保存,再放到论文中去。
4
论文中引用的参考文献部分也是会计算相似度的,所以引用的时候,最好的方式就是先理解内容,再用自己的话写出来。
5
知网检测系统对论文的分节是以“章”作为判断分节的。每一个片段都计算出一个相似度,再通过这样每章的相似度来计算出整篇论文的总重复率。
6
在知网查重系统中,是以“连续多个个字重复”做为识别标准。如果你能让你的论文任意一句话都找不到连续多字与别人的文章相同,这样就检测不到。
7
当知网查重系统识别到你论文中有某句话涉嫌抄袭的时候,它就会对这句话的前面后面部分都重点进行模糊识别,仅仅加一些副词或虚词(比如“的”、“然后”、“但是”、“所以”此类词语)是能够识别出来的。
8
网络上的某些内容也是在知网的数据库里的。比如:“百度文库”、“道客巴巴”、“豆丁网”、“东方财富网博客”、“人大经济论坛”等等。所以,大家在网上搜索资料的时候,也不要直接引用。
9
可以多参考一些国外的资料,在知网的对比文库中,外文资料相对比较少,而且用自己的理解翻译成中文,几乎不会检测到重复。
10
知网官方检测系统不对个人开放,学生自己是无法自行到知网去检测论文的,只能通过第三方检测平台进行,除了知网之外,国内应用比较广泛的论文查重系统还有“万方数据”、“checkpass”、“paperpass检测”,“paperrater检测”这几个。总的来说,万方是最松的,paperrater这两个最严。checkpass检测算法最先进,价格适中,知网的最贵。
推荐/四川大学经济学院研分会组织部
领取专属 10元无门槛券
私享最新 技术干货