如何优雅的抄袭代码?天下代码一大抄,这才是正确的姿势

你们知道程序员最熟悉,最熟练,最常用的两个快捷键是哪两个吗?没错,估计你现在心中所想的就是:ctrl+c 和 ctrl+v ,俗名为:复制和粘贴。对于大部分程序员来说:复制和粘贴就是他敲代码,写程序员创造伟大产品的左膀和右臂,而复制和粘贴更是形影不离的好兄弟。

所谓,天下代码一大抄,亦不过在程序员心中就是复制和粘贴。更何况我们是身处在一个热爱开源的世界,而程序员更是创造和开创开源世界的积极分子呢。目前,我们身处在共享经济当中,可是殊不知我们这是一个伪共享的时代。共享单车,共享汽车,乃至共享充电宝都不是真正的共享,所谓共享就是把闲置和剩余资源利用起来,进行分享,以达到资源利用,资源价值的最大化。现在的共享经济,都不是把闲置和剩余资源的重复再利用,而是花钱买好的,每天,每月正在造成更大的资源浪费。

但是,代码的开源,技术的开源可以说是真正的共享,但是还不属于经济,毕竟开源太多都是免费的,所以,我们技术开源才是真正的共享鼻祖。有点扯远了,我尽量拉回来。之所以谈这个话题是因为近日加州大学欧文分校、捷克技术大学、微软研究院和美国东北大学的研究人员组成的一个团队开展了一项调查,结果发现,GitHub 上托管的大多数源代码文件实际上是以前所创建的文件的复制版

八名研究人员组成的这个国际团队起初倒不是想研究 GitHub 的重复现象。最初的目标是试图定义代码复制的 “精细度”(即不同的复制版之间多少文件发生了变化),但后来他们发现了 “高得惊人的文件重复率”,于是他们改变了研究方向。 研究人员查看了 450 万个原创(非分支)的 GitHub 项目,这些项目共有 4.28 亿个不同的文件。他们发现,只有 8500 万个文件是独特的,在所有分析的文件中约占 17.63%。

其实 GitHub 的一个使命就是共享代码,所以在 GitHub 平台上发现代码重复率高并不是一个令人吃惊的事情。但是有一点是非常让你警醒的,那就是:

用来构建 GitHub 的源代码控制系统 Git 鼓励项目分支(forking)。然而,GitHub 中出现了大量的代码重复现象,这些代码并没有经历过 fork 机制,而是通过复制粘贴文件、甚至复制粘贴整个库进入的。

很多研究人员也表示了疑问,明明可以 fork 或者依赖使用的,现在大部分人都是复制粘贴文件、甚至复制粘贴整个库到自己的项目,再共享出来,真的是让人有点吃惊。

开源库的正确用法

由此,我们应该得感觉和意识到一些开源许可证的使用,应该正确使用开源库以及开源代码才可以。不知道有多少开发者意识到了开源库的正确使用方法?我相信现在几乎每个程序员开发的项目中都使用了 GitHub 上的开源库,但是你们尊重开源和版权了吗?一般在应用中应该声明一下使用了哪些开源库,以开源许可证等信息。我发现支付宝在这方面做的就挺好的。比如人家就在应用中有个版权信息模块,专门声明使用了哪些开源库。例如:

看到了吗?支付宝这个应用程序用到的开源库是不是很多,大家也可以研究一下,支付宝用的这些开源库应该都是非常不错,有保证的,以后说不定你也能够用到,这就是学习。我相信大家都没有正确使用和声明开源库这种做法和行为。

总结

其实通过研究其实我们可以发现:首先,GitHub 本身似乎可以大幅压缩代码库,不至于现在这么庞大。其次,如今在使用从 GitHub 唾手可得的一大批开源项目,开展越来越多的研究工作。但是我们在研究和使用的时候,应该正确使用,而不是乱用

你们知道哪种语言在 GitHub 上代码重复率最高吗?JavaScript 项目含有的重复文件最多,研究团队只查看了用 C++、Java、JavaScript 和 Python 编写的源代码项目。在这四种项目中,JavaScript 项目所含的重复代码最多,94% 的文件是与 GitHub 上托管的另一个文件百分之百相同的克隆版(基于文件哈希)。C++ 排名第二,所有文件中 73% 是其他文件的复制版,而 Python 的代码重用率也有 71%, Java 只有 40%。其实JavaScript 包含最多的重用代码示例,原因很容易解释,那就是 NPM,这是所有客户端和服务器端 JavaScript 项目的事实上的软件包管理器。

所谓天下代码一大抄,但是抄也应该正确的抄,也应该正确的用,在规则和许可下玩才行。不要在没声明的情况下,整体的复制粘贴到你的代码库里,不尊重作者,感觉是你做的似的。

原文发布于微信公众号 - 非著名程序员(non-famous-coder)

原文发表时间:2017-12-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏无原型不设计

UX术语详解:任务流,用户流,流程图以及其它全新术语

以下内容由Mockplus(摹客)团队翻译整理,仅供学习交流,Mockplus是更快更简单的原型设计工具。

1.9K11
来自专栏SAP最佳业务实践

SAP最佳业务实践:MM–组件收费的委外加工(251)-4采购

4.3 ME59N创建采购订单 采购订单按照采购请求自动创建。 在供应商,物料主数据中,自动建立采购订单的复选框设置标识,以及创建货源清单与MRP相关。 ? ?...

3754
来自专栏知晓程序

微信小程序 6 大新能力全面解读!附个人开发者注册教程

微信小程序在 3 月 27 日晚 10 点突然爆出大新闻。微信为小程序开放了 6 大新能力,在知晓程序的这篇文章中,你将看到小程序 6 大新能力的最靠谱解读。

1113
来自专栏云计算D1net

如何架构企业内部的存储云

存储即服务在近年来得到长足发展,越来越多的用户开始接受这种服务交付模式。今天的公有云服务商,如Amazon Web Services和Microsoft Azu...

4544
来自专栏ytkah

微信公众平台搜索文章会调用搜狗百科内容?

  早上ytkah进行微信公众平台开发时想找那个“公众平台测试帐号”,在手机端订阅号列表上端的“搜索文章”框中输入测试二字,如下图所示,在搜索结果列表中,有一个...

2693
来自专栏即时通讯技术

微信技术分享:微信的海量IM聊天消息序列号生成实践(算法原理篇)

对于IM系统来说,如何做到IM聊天消息离线差异拉取(差异拉取是为了节省流量)、消息多端同步、消息顺序保证等,是典型的IM技术难点。

1942
来自专栏知晓程序

新能力连发!微信广告组件开放内测,还有 50 多个接口更新等你发现

1173
来自专栏IT派

11个Python爱好者最爱访问的站点

学习一门编程语言,除了语法,最重要的是学习解决问题。很多时候单凭自己的能力确实无法做到完美解决,所以无论是搜索引擎、社区、文档还是博客,都是我们解决问题的利器。...

782
来自专栏知晓程序

小程序上手体验:我们做了一款,让你极速查公交

1723
来自专栏互联网数据官iCDO

【经典文章】运营优化的秘密武器:重新认识热图的力量!

主编注:这篇文章获得业内很高的关注。是宋星老师的另一篇讲述如何优化网站页面尤其是着陆页的经典文章。 引言   之前发布的文章:《优化高跳出率着陆...

3314

扫码关注云+社区

领取腾讯云代金券