首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【建议收藏】Git基本原理介绍

https://www.escapelife.site/posts/da89563c.html

纸上得来终觉浅,绝知此事要躬行。

简单地说,Git 究竟是怎样的一个系统呢?请注意接下来的内容非常重要,若你理解了 Git 的思想和基本工作原理,用起来就会知其所以然,游刃有余。在学习 Git 时,请尽量理清你对其它版本管理系统已有的认识,如 CVS、Subversion 或 Perforce, 这样能帮助你使用工具时避免发生混淆。尽管 Git 用起来与其它的版本控制系统非常相似, 但它在对信息的存储和认知方式上却有很大差异,理解这些差异将有助于避免使用中的困惑。

1. Git 初始化代码仓库

执行完成了命令,究竟做了什么呢?

执行完成如下命令之后,我们可以得到下图所示的内容,右侧的就是  为我们创建的代码仓库,其中包含了用于版本管理所需要的内容。

我们这里可以一起看下生成的  目录的结构如何:

[1]  - 当前代码仓库本地的配置文件

本地配置文件()和全局配置文件()

通过执行如下命令,可以将用户配置记录到本地代码仓库的配置文件中去

[2]  - 当前代码仓库代码的存储位置

类型

类型

类型

[3]  - 当前仓库的排除等信息

[4]  - 当前代码仓库默认钩子脚本

[5]  - 当前代码仓库的分支指针

[6]  - 当前代码仓库的头指针

[7]  - 当前代码仓库的描述信息

2. add 之后发生了什么

执行完成了  命令,究竟做了什么呢?

执行完成如下命令之后,我们可以得到下图所示的内容,我们发现右侧新增了一个文件,但是  目录里面的内容丝毫没有变化。这是因为,我们现在执行的修改默认是放在工作区的,而工作区里面的修改不归  目录去管理。

而当我们执行  命令的时候, 又可以识别出来现在工作区新增了一个文件,这里怎么做到的呢?——详见3.理解 blob 对象和 SHA1]部分,而当我们执行  命令让  帮助我们管理文件的时候,发现右侧新增了一个目录和两个文件,分别是  目录、 和  文件。

我们这里重点看下,生成的  这个目录以及下面的文件。而其名称的由来是因为  对其进行了一个叫做  的  算法,用于将文件内容或者字符串变成这么一串加密的字符。

现在我们就知道了,执行  命令将文件从工作区添加到暂存区里面, 会把帮助我们生成一些  的对象,它存储的是文件的内容和文件类型并不存储文件名称。

为了验证我们上述的说法,我们可以添加同样的内容到另一个文件,然后进行提交,来观察  目录的变化。我们发现,右侧的  目录并没有新增目录和文件。这就可以证明, 类型的  只存储的是文件的内容,如果两个文件的内容一致的话,则只需要存储一个  即可。

话说这里  为什么没有存储文件名称呢?这里因为  的  算法计算哈希的时候,本身就不包括文件名称,所以取什么名称都是无所谓的。那问题来了,就是文件名的信息都存储到哪里去了呢?——详见3.理解 blob 对象和 SHA1]部分

3. 理解 blob 对象和 SHA1

了解 Git 的 blob 对象和 SHA1 之前的关系和对应计算!

算法是把任意长度的输入通过散列算法变化成固定长度的输出,根据算法的不同,生成的长度也有所不同。

Hash 算法

-  - 不安全 - 文件校验

-  - 不安全 - 存储

-  - 安全 - 镜像

-  - 安全

但是,当我们使用工具对上述文件内容进行  计算的时候,会发现并没有我们在  目录里面看到的那样,这是为什么呢?

这里因为  工具的计算方式,是使用类型 长度\0 内容的方式进行计算的。这里,我们算了下文件内容只有九位,但是这里是十位,这里因为内容里面有换行符的存在导致的。现在我们就可以使用  命令来拼装  工具存储的完整内容了。

当我们使用  命令来查看  对象里面的内容的时候,发现看着像是一串乱码。其实这是  工具将文件的原始内容进行一个压缩,然后再存储到  对象里面。奇怪的是,我们发现压缩之后的内容反而比原始内容还大!这是因为其进行了压缩,存储了一些压缩相关的信息。上例所示的比原始文件大,是因为我们创建的内容实在是太小了。当我们遇见一个比较大的文件时,就会看到压缩之后的文件大小远小于原始文件的。

其实,我们这里也是可以通过  代码来获取二进制  对象的内容的。

4. 聊聊工作区和暂存区

聊聊工作区和暂存区,以及文件如何在工作区和缓存区之间同步的问题。

之前的章节我们也聊到了,当我们执行  命令的时候, 工具怎么知道我们有一个文件没有追踪,以及文件名的信息都存储到哪里去了?

这一切的答案,都要从工作区和索引区讲起。 根据其存储的状态不同,将对应状态的“空间”分为工作区暂存区(也可称为索引区)和版本区三类。具体示例,可以参考下图。

而更加深层次的理解,就要从执行  命令后生成相关的  对象,但是其存储的是文件的类型、大小和内容,并不包含文件名称的信息。而文件名称相关的信息就包含在生成的  文件(索引文件)里面。

当我们直接查看  文件里面的内容,发现是我们无法理解的乱码,但是通过基本的输出,我们可以看到其文件名称。要想查看  文件的内容,可以通过  提供的相关命令进行查看。

当添加文件的时候,文件或目录会从工作区流向暂存区,加之一些其他操作,会导致工作区和暂存区是会有一定差别的。这就会导致,当我们执行  的结果就是两者的差别。

经过如下操作,会使工作区和暂存区的内容不一致了,通过命令我们也是可以查看区别的。当我们使用  命令将新文件添加到暂存区的时候,会发现这下就一致了。

如果我们这里去修改一个文件的话,很显然这个时候我们的工作区和暂存区又不一致了。当我们使用命令去查看文件状态的时候,发现一个文件被修改了,而  是怎么知道的呢?咳咳,就是通过查找  文件的内容,找到对应文件名称以及其内部引用的  对象,与工作区的文件内容进行对比而来的。

而这个时候,我们再使用  命令将其修改内容保存至暂存区的话,会发现对应文件的  的  对象的引用值发生改变了。这时可以发现, 目录下面有三个对象了,其中  占了两个,但是文件却只有两个。通过命令查看对应  对象的内容,发现各有不同。

5. 理解 commit 提交原理

执行完成了命令,究竟做了什么呢?

仓库中的提交记录保存的是你的目录下所有文件的快照,就像是把整个目录复制,然后再粘贴一样,但比复制粘贴优雅许多! 希望提交记录尽可能地轻量,因此在你每次进行提交时,它并不会盲目地复制整个目录。条件允许的情况下,它会将当前版本与仓库中的上一个版本进行对比,并把所有的差异打包到一起作为一个提交记录。 还保存了提交的历史记录。这也是为什么大多数提交记录的上面都有父节点的原因。

当我们使用  命令将工作区提交到暂存区,而暂存区其实保存的是当前文件的一个状态,其中包括有哪些目录和文件,以及其对应的大小和内容等信息。但是我们最终是需要将其提交到代码仓库(本地)的,而其命令就是  了。

而当我们执行  命令的时候,究竟都发生了什么呢?可以看到当提交之后, 目录中生成了两个信息的  对象,其  和  目录都有新的文件生成。通过如下操作,我们可以查看到其提交的类型和对应内容。

这样我们就理解了,当我们执行  命令之后,会生成一个  对象和一个  对象。 对象内容里面包含了一个  对象和相关提交信息,而  对象里面则包含了这次我们提交版本里面的文件状态(文件名称和  对象),这样我们就知道了这次提交的变动了。

我们这次提交之后,处理  目录发生变动之外,还有一些其他的变化。比如  和  的目录有所变化。我们查看  目录里面的内容,发现其指向了  这个  对象,即当前  分支上面最新的提交就是这个  了。

而这个  这个  对象,有一个  的指向,就是  目录下的  文件。其实质就是一个指针,其永远指向我们当前工作的分支,即这里我们工作在  分支上。当我们切换分支的时候,这个文件的指向也会随机改变的。

6. 加深理解 commit 提交

执行完成了命令,究竟做了什么呢?

当我们再次对  文件的内容进行变更、添加以及提交之后,发现在提交的时候,查看的  对象的内容时,其包含有父节点的  信息。而对于理解的话,可以看看下面的这个提交流程图。

在  中空文件夹是不算在追踪范围内的,而且添加文件夹并不会增加  对象。当我们查看  内容的时候,会发现文件名称是包含相对路径的。

而当我们通过  命令提交之后,会发现生成了三个  对象,因为  操作不会生成  对象,所以分别是一个  对象和两个  对象。可以发现, 对象里面又包含了一个目录的 ,其里面包含对象文件内容。

下图所示的文件状态,可以体会到  中版本的概念。即  对象指向一个该版本中的文件目录树的根(),然后  再指向  对象(文件)和  对象(目录),这样就可以无限的往复下去形成一个完整的版本。

7. 文件的生命周期状态

总结一下,Git 里面的文件状态和如何切换。

现在,我们已经基本理解了文件如何在工作区、暂存区以及代码仓库之间进行状态的跟踪和同步。在的操作中,文件的可能状态有哪些,以及如何进行状态切换的,我们这里一起总结一下!

8. Branch 和 HEAD 的意义

执行完成了命令,究竟做了什么呢?

到底什么是分支?分支切换又是怎么一回事?我们通过查看  的官方文档,就可以得到,分支就是一个有名字的(/)指向  对象的一个指针。

我们在初始化仓库的时候,提供会默认给我们分配一个叫做  的分支(在最新的版本默认仓库已经变更为了),而  分支就是指向最新的一次提交。为什么需要给分支起名字呢?就是为了方便我们使用和记忆,可以简单理解为  命令的意义一致。

有了上述基础,我们就需要考虑下,分支到底是如何实现和工作的。要实现一个分支,我们最基本需要解决两个问题,第一个就是需要存储每一个分支指向的 ,第二个问题就是在切换分支的时候帮助我们标识当前分支。

在  中,它有一个非常特殊的  文件。而  文件是一个指针,其有一个特性就是总会指向当前分支的最新的一个  对象。而这个  文件正好,解决了我们上面提出的两个问题。

当我们从  切换分支到  的时候, 文件也会随机切换,即指向  这个指针。设计就是这么美丽,不愧是鬼才,好脑袋。

9. 分支操作的背后逻辑

执行完成了命令,究竟做了什么呢?

这里我们可以看到分支切换之后,指向发生变动了。

这里需要注意的是,即使我们删除了分支,但是该分支上一些特有的对象并不会被删除的。这些对象其实就是我们俗称的垃圾对象,还有我们多次使用  命令所产生的也有垃圾对象,而这些垃圾对象怎么清除和回收呢?后续,我们会涉及到的。

10. checkout 和 commit 操作

我们一起聊一聊,checkout 和 commit 的操作!

我们执行  命令的时候,其不光可以切换分支,而且可以切换到指定的  上面,即  文件会指向某个  对象。在  里面,将  文件没有指向  的这个现象称之为 。这里不管  文件指向的是分支名称也好,是  对象也罢,其实本质都是一样的,因为分支名称也是指向某个  对象的。

当我们切换到指定的  的时候,如果需要在对应的  上继续修改代码提交的话,可以使用上述图片中提及的  命令创建新分支,再进行提交。但是,通常我们都不会着玩,都会使用  命令来创建新分支的。

即使可以这样操作,我们也很少使用。还记得我们上一章节创建的  分支吗?我们创建了该分支并有了一个新的提交,但是没有合并到  分支就直接删除了。现在再使用  命令查看的话,是看不到了。

实际,真的看不到了吗?大家要记住,在  里面任何的操作,比如分支的删除。它只是删除了指向某个特定  的指针引用而已,而那个  本身并不会被删除,即  分支的那个  提交还是在的。那我们怎么找到这个  呢?找到之后,我们就可以在上面继续工作,或者找到之前的文件数据等。

第一种方法

[费劲不太好,下下策]

在  目录下面,自己一个一个看,然后切换过去。

第二种方法

[推荐的操作方式]

使用  提供的  专用命令来查找。

该命令的作用就是用于将我们之前的所有操作都记录下来。

11. 聊聊 diff 的执行逻辑

当我们执行 diff 命令之后,Git 的逻辑它们是怎么对比出来的呢?

就在本节中中,我们使用上节的仓库,修改文件内容之后,看看命令都输出了哪些内容呢?我们这里一起来看看,研究研究!

12. Git 如何添加远程仓库

如何将我们本地的仓库和远程服务器上面的仓库关联起来呢?

[1] 初始化仓库

[2] 关联远程仓库

当我们使用上述命令来关联远程服务器仓库的时候,我们本地  目录也是会发生改变的。通过命令查看  文件的话,可以看到配置文件中出现了  字段。

[3] 推送本地分支

当我们执行如下命令,将本地  分支推送到远程  仓库的  分支。之后,我们登陆  就可以看到推送的文件及目录内容了。推送分支内容的时候,会列举推送的  数量,并将其内容进行压缩,之后推送到我们远程的  仓库,并且创建了一个远程的  分支( 仓库)。

推送之后,我们可以发现,本地的  生成了一些文件和目录,它们都是什么呢?如下所示,会新增四个目录和两个文件,皆为远程仓库的信息。当我们通过命令查看  这个文件的内容时,会发现其也是一个  对象。此时与我们本地  分支所指向的一致。而其用于表示远程仓库的当前版本,用于和本地进行区别和校对的。

13. 远程仓库存储代码

使用 GitLab 来了解远程仓库的服务器到底是如何存储,我们的代码的!

当我们编写完代码之后,将其提交到对应的远程服务器上面,其存储结构和我们地址是一模一样的。如果我们仔细想想的话,不一样的话才见怪了。

本来就是代码的分发平台,无中心节点,即每个节点都是主节点,所以其存储的目录结构都是一致的。这样,不管哪一个节点的内容发生丢失或缺失的话,我们都可以通过其他节点来找到。而  服务器就是一个可以帮助我们,实时都可以找到的节点,而已。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230323A036DK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券