坑钱!每逢毕业季,高校学生的钱就这样被坑了

每逢临近毕业季

为防止学术不端行为

毕业生的毕业论文通常需要交给学校进行查重

我们学校在论文答辩之前

会有一次预查重操作

记得当年学校规定

预查重结果的重复率

大于8%会被要求大幅修改

而大于15%直接判定论文不通过

不能申请论文答辩

这也就意味着,如果论文查重结果大于15%

将直接导致延期毕业

这是明晃晃地划了一道红线在那告诉你

小心啊!别跳!

学校的初衷当然是好的

警醒学生

不可有抄袭论文等行为的侥幸心理

然而「直接判定论文不通过」这个后果

就很严重了

问题在于

就算是自己一笔一划写出来的论文

也不能百分之百地确定不重复啊

查重算法一直是个黑盒

谁也不知道其中的原理

犹记得当年毕业时,

一开始大家还挺淡定的

可是有几位同学花钱提前购买了论文查重服务

有人的结果挺低

有人说结果高达17%

对应修改完,再查能够降到2%

这在人群中造成了一些恐慌

一传十,十传百

毕竟中是辛辛苦苦写了那么久的毕业论文

谁知道会不会万一与古人暗合了呢

谁也不愿意自己成为不幸的那一个啊

最后许多同学都决定

自己花钱预先查重一次

确保解除危机

大多数人是在淘宝上购买

价格30元-300元不等

比较便宜的据说是知网数据库

比较贵的是高校数据库

便宜的查一次通常需要30-50元

记得我第一次花了39元

查了一次第1章和第2章相关工作

因为这部分内容最有可能产生重复

最后时刻还是不放心

买了份同学推荐的

所谓「和学校一样数据库」的查重服务

278元就这样打了水漂

现在回过头来

看着这些商品的评论

感觉好讽刺啊

居然还有为店家打call的??

真是自己都被卖了

还帮对方数钱啊

可以想象

这是一个几乎无风险的买卖

如果学生自知论文是七拼八凑的

最后学校的查重出了事

怪不到淘宝店家头上

如果学生的论文是自己写的

最后学校的查重肯定能过

既然都过了

都忙着毕业去了

谁还纠结这花掉的几百块钱呢?

当年的我也是这样

不过

可能只有像我这样

已经毕业了

却还念念不忘、耿耿于怀的(穷)人

才会认真写下这篇文字吧

这些淘宝商家

就是利用这种花钱保平安的心态

让高校学生花了一笔又一笔冤枉钱

问题来了

这些所谓「与学校同官方相同数据库」的商家

数据库资源到底是从哪来的?

根据有些客服的说法

每个高校数据库会开放一定数量的查重服务名额

如果名称用不完

就拿来卖

什么?名额多出来就可以卖?

这些淘宝商家的背后

隐藏着怎样的利益链条

高校里的相关管理者

就因为拥有查重所用的数据库资源

就可以肆无忌惮地这样囤货居奇

发学生的财?

众所周知

论文查重是边际成本为零的操作

所谓的名额

不过是政策规定上一纸空文罢了

可就是这种操作

却能卖出200-300元的价格

2017年全国应届毕业生795万人,

如果有10%的学生选择花钱买安心的话

购买人群达到79万

若以每人花费200元

被坑的钱就是1.5亿

多么大的一个利益蛋糕

真是厚道无耻

更令人气愤的是

这类查重算法的计算方式相当诡异

举当时作者的查重结果为例

重复结果令人啼笑皆非

论文中的语句是「半监督学习」

在查重结果中

对应匹配的语句是「无监督学习」

只因为这两句话有4个字是一样的

就判定了45%的相似度?

还有上面这种相似的判定结果

「随着xxx的增加,xxx的分类精度下降」

大多数实验得出这样的结论并不奇怪吧?

试问

实验结论不这么写

还能怎么写?

如果知道了是这种ZZ算法在进行查重

谁敢放心自己一字一句写出来的论文?

就是上述这些因素

导致最讽刺的事情出现了

不认真写论文的学生

想购买这种查重服务试探底线也就罢了

认认真真写的学生

反而也更担心自己查重出问题

因为付出了太多

如果出问题太不值得了

老实人也要花钱确保自己不会受难

真是没有道理

总结一下

针对这项灰色产业

最需要解释的问题有三

1. 查重算法合法性、合理性保证

这个问题始终没有定论

向教务老师咨询的回答往往是

只要是自己写的

就不用担心

或许因为他们也不知道标准

那么掌握这核心资源的管理者

为什么不愿意公布相关信息

即使不愿意彻底公开算法

也必须要有一个合理的监管体系

确保查重算法的合理性

如果每年的查重结果

能够证明其精确度是可信的

即在论文查重中判定为重复的样例

百分之一百是抄袭导致

或许可以减轻学生们的担忧

2. 一次否定的查得惩罚机制

诚然

一次否定机制是为了防止学生有抄袭的侥幸心理

然而由于问题1的缘故

正常人在一字一句写出论文的前提下

依然要担心查重结果

就是因为过程不可控

而后果太严重

在现在的计算资源条件下

想不出有什么限制

能够成为查重算法运行多次的瓶颈因素

如果能够更加合理地制定查重规则

和惩罚措施

将有效地避免

学生将钱浪费在这种

无意义的事情上

3. 灰色交易的源头

如果那些淘宝上的商家

所谓「与学校相同数据库」的噱头是真的么

如果是真

那么到底是谁掌握着这些资源?

谁能够把这些名额轻易地用于贩卖?

这是不是以权谋私?

以上

- END -

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180506G192I800?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

同媒体快讯

扫码关注腾讯云开发者

领取腾讯云代金券