首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AJE科研数据可视化系列之五:论文图片查重

学术期刊不仅要对每篇已投稿学术论文的研究内容和创新性进行严格的评审和把关,还要在学术道德和科研诚信方面对其进行一定程度的审视。AJE特别提醒:一旦涉嫌学术不端,即使已被发表的论文也有可能被撤稿。学术不端涉及的范畴较广,其中包括抄袭、剽窃,这也是很多学术期刊在对论文进行学术不端排查时重点关注的问题之一。

目前,针对论文文字内容的查重软件已相对成熟,然而我们都知道,文本只是科研论文的一部分,研究性论文还需要通过相当数量的图片和表格来更加直观、形象地呈现其实验结果。由于目前尚缺乏有效、精准的针对各种格式图像内容的查重软件,导致图片重复使用、盗用他人图片等问题层出不穷且防不胜防。

尽管各大出版商都在致力于构建和完善针对图片的审查程序,但尚未形成可观的规模和国际通用的模式;当然,诸如国际学术打假知名人士Elisabeth Bik在甄别图片重复使用、剽窃等学术不端行为方面着实功不可没,但毕竟只依靠人力和肉眼的判断,能发现的问题图片数量有限,也需要花费大量的时间和精力。

令人振奋的是,有研究人员一直致力于开发图片自动查重软件。来自美国纽约雪城大学(Syracuse University)的Daniel Acuna及其同事,自2015年初,就开始研究能从成千上万篇文献中自动提取并识别重复图片的算法。由于COVID-19疫情的爆发,相关领域的研究开展得如火如荼,预印本稿件也前所未有的火爆,或许是出于对这些预印本稿件质量是否鱼龙混杂的担忧,Daniel用他的这套算法测试、比较了来自千余篇预印本文稿的共计两万余个图片,并公布了一些由此发现的稿件图片的潜在问题,引起了一阵轰动。

值得指出的是,这套算法能够筛选和识别的重复图片包括被翻转、旋转、缩放,甚至改变对比度或颜色的图片,并对其所发现的可能的重复图片问题进行标记。也就是说,即便是部分截取他人或自己已使用过的图片并通过一定“技术处理手段”再加工而得的图片,依然有可能被“揪”出来。

尽管目前来看,对于这套算法能否被推广使用尚存在一定争议,其在提取、识别重复图片的准确性方面亦有待提高,但相信后续其各项功能将不断得以完善,亦有可能作为一种有效的辅助工具,帮助审稿专家和期刊编辑在其图片自动识别结果的基础上,再进行更专业、更准确且更有针对性的比较和判断,相对省时又省力。总之,有了文本查重软件,文字抄袭现象得以被有效杜绝;而随着图片查重软件的日趋完善,一图多用、剽窃图片乃至图片造假,亦将无所遁形。

处理图片时,哪些该做,哪些不该做?

一图多用情况的出现,有些可能是研究人员在撰写论文和整理、呈现实验结果时的疏忽和错漏之处,需要及时加以更正;而有些则可能属于图片造假,一经证实,往往以撤稿收场。除此之外,对图片进行一些看似无害的改动,在学术期刊看来可能也是具有欺骗性的。故意盗用或篡改图片结果自然是不可取的,但有时也需小心谨防不经意间掉进图片造假的陷阱。因此,懂得处理图像时应该避免什么非常重要。这里提供一些主要基于Journal of Cell Biology有关不恰当图像处理指导准则的建议,供大家参考。

首先,要保证原始图像里所包含的所有图像特征,在经过图像处理和调节后依然清晰可见,不可过多调节图像以致某些部分消失,否则将有可能难以排除是否有意隐藏、篡改了部分实验结果的嫌疑。例如,对于Western Blot等凝胶印迹图片,不管是否经过图像去色处理,都不要过多地调节背景,更不可为了盲目追求背景的所谓干净美观,而导致某些印迹较淡的条带或其他图像特征消失不见。

此外,对于凝胶图片中各条电泳泳道的裁剪和拼接也宜慎重。若干泳道裁剪并重新拼接出的图片,不仅不美观,而且显得十分不严谨。一个解决方案是在做实验时或准备跑胶伊始,就对各凝胶胶孔的上样顺序进行合理的计划和安排,做到既充分利用各胶孔,又不遗漏重要样品、Marker以及阳性、阴性对照;如果确实需要在处理图片时切掉某一凝胶泳道中的不相关信息,则建议采用一条黑色或白色的线条清楚并如实地标出凝胶在哪里被切开。

一般来说,在不隐藏或消除任何原图中所包含的信息的前提下,适当调节亮度、平衡或对比度是可以接受的,但必须是对整个图像进行统一调节才行,且每个像素应该进行线性调节;非线性调节(例如,伽马设置的改变)则必须在图例或图注中披露。如果一个完整的实验结果中包含多个图片(例如,一个被处理过的实验组细胞图片和一个与之相应的对照组细胞图片),则无论是在前期进行实验图片拍摄时,还是在后期进行图片处理时,都一定要确保这两个小图的亮度和对比度相同,且进行了同步的调节——只对其中一组进行调节而不同步调节另一组图片,是不够严谨的,还可能具有一定的误导性。

最后,AJE再一次提醒作者,要始终记得保留原始的、未经任何改动的图片文件以便期刊有要求时可以提供。如果届时无法拿出图像的原始文件,那么期刊将有可能拒绝稿件。同时,您也应能够对图像做了哪些改动给出清楚、准确的解释,包括使用了哪些软件或特定工具等信息。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230423A02OXE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券