首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

论文查重的原理是什么?知网、万方哪个更准确?更权威?

作为这个行业的曾经的从业人员我来客观回答一下,从以下几个方面说明(可以直接阅读第三项结果):

一、论文查重的逻辑和问题

论文查重实际上和查毒软件的逻辑一样,不管是知网、万方、维普等数据库,还是paperpass一类的专用软件,查重逻辑都是以被检测文章(相当于比对样本)与数据库文献(相当于病毒库)进行比对,当然是有比对算法的,不然以知网亿级文献量的规模做全文比对不知道要到何年何月;然后以软件定制的版式化输出结果检测报告。

这个过程中第一步文献比对主要是看比对结果是否全面、准确、速度快,影响因素主要是资料库是否全面完善和算法;第二步看检测报告是否客观,其实很多时候大家的痛苦在于有些重复是不可避免的,比如绪论、参考文献、正常引用等(尤其是理论研究型的文章),就取决于检测报告的输出逻辑是否客观把抄袭和引用的区分开来,还有就是执掌检测大权的人,因为软件只能傻傻的比对输出结果而是否属于剽窃抄袭需要人的定性,很多老师其实就是嫌麻烦看一下检测结果超过多少百分比(学校制定的一般在15%-30%)就直接判刑了,这样是武断的,毕竟搞马列主义的论文说破大天你也不能让他跑出那几本理论去,要不然不是那啥反X反XX了吗?

其实论文查重这个方向只是知网、万方一类数据库的附属品,它们本质上是做文献数据库服务的,当海量资料储备之后,论文查重只是作为软件应用的一个方向,等同于大数据分析、情报挖掘、趋势分析、统计评价等;国内论文查重的始作俑者应该是知网,于2009年推出并机构试用,2010年起各高校开始推广并逐步强加在毕业论文答辩程序中,之后万方、维普跟进,至于paperpass之类那是论文检测火了之后才有的,最早只是一个私人程序,从这个历程讲知网算是发明者、推广者和目前市场最大的占有者。

 二、为什么有区别,有多大区别

1、比对库不一样

比对库主要是期刊、学位论文、会议论文、年鉴、报纸、外文数据库、互联网文献等;上面解释了文献比对的影响因素主要是资料库是否全面完善,知网是目前文献库最大最全的中文数据库,比对源是最全的;万方主要是学位论文比较全;维普只有期刊;paperpass比对源是互联网公开资源并不稳定;这是导致区别的最大因素,区别的大小与要检测文献的内容领域相关。自从各数据库厂商开始独家版权的抢夺之后,这种区别更为明显,因知网的资源全面性和大量的独家版权,它的检测结果更准确和被用户机构认可。

2、比对权限不一样

实际上不同用户的检测权限是不一样,如果你登陆过后台检测页面就可以知道,比对范围是可以根据内容领域、文献类型、时间和排除资源等因素设定的,因为账号本身的权限不一样或者账号操作人的设定不一样,导致同一篇文献在同一个数据库的检测结果也略有不同。

3、检测报告的输出逻辑不一样

第一项所解释的检测报告的输出逻辑,实际上这个对学生的影响更为直接重要,因为它是辅助定性的,如果输出逻辑不合理再加上人的惰性思维,好好的一篇文章就要打回冷宫重写,在这个方面通过长期的使用经验对比,也是知网做的最为合理,可能是跟它对长文献的版面分析和知网节技术有关,可以准确地识别正常引用、公共绪论等内容块,不计入重复比例。

 三、哪个更权威

综上所述,从技术角度上讲,此类产品知网做的最好,而所谓的权威实际上是市场的认可度,杂志社、高校、研究单位对他认可度、依赖度越高它的权威度越高。目前市场情况是,机构用户必用知网,有经费的知网万方都有,经费有限的就是知网唯一,而paperpass一类的除了某宝上见过我在真正的机构用户群里从未见过,呵呵。所以知网算是技术和市场度最高的一个,如果是学生党想做预检测,想办法做个知网就可以了,一般逻辑是知网没问题其他就基本能过也没有问题,反之不一定。

题外话:知网本身是不向除研究教育机构外的用户提供账号的,包括企业和个人。某宝上为什么没有卖账号的只有提供报告的,因为账号不能卖也卖不掉,可想而知这些提供检测服务的卖家或合作人的是从哪里来的,学生们真是两头受堵被逼付费检测啊,可怜的一代代学弟学妹们,哈哈。

码字不易,赠人玫瑰,手有余香。壹点经验,更多的知识收纳和经验分享持续更新。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20210321A084YS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券