0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文解析Git文件的三种状态

张康康 来源:陈翠 2019-07-29 18:27 次阅读

Git作为大家熟悉的,深受欢迎的版本控制工具,和其他同类工具有很多不同之处:

Git始终保存快照而不是文件差异。

任何数据存储前始终使用SHA-1计算校验和,保证内容完整性。

使用分布式仓库设计,让大多数操作都在本地进行,保证了使用效率。

几乎所有操作都是向数据库增加数据,提交之后就很难丢失数据。

它的本质更像一个内容寻址(content-addressable)文件系统,并在此之上提供了一个版本控制系统的用户界面。

Git 有三种状态,你的文件可能处于其中之一:已修改(modified)、已暂存(staged)、已提交(committed)。由此引出三个逻辑区域,他们和文件状态以及部分对应操作的关系如下图。

高层命令和底层命令:Git 最初是一套面向版本控制系统的工具集,它包含很多用于完成底层工作的命令。这些命令被设计成能以UNIX 命令行的风格连接,或由脚本调用来完成更复杂的工作。这部分一般被称作“底层(plumbing)”命令,那些对用户更友好的命令则被称作“高层(porcelain)”命令。

下面新建两个空仓库A 和B,来观察隐藏在Git常见命令下的实际执行过程。

1.git init

此命令初始化一个新本地仓库,它在工作目录下生成一个名为.git的隐藏文件夹。

查看该文件夹结构:

config//文件- 包含一些配置选项

objects//目录- 存储所有Git的数据对象

HEAD//文件- 指定当前分支

info //目录- 存放项目信息,默认包含一个全局exclude文件, 用来放置不希望记录在.gitignore 中的忽略模式

deion//文件- 仅供GitWeb 程序使用

hooks //目录- 存放可在某些指令前后触发运行的钩子脚本(hook s),默认包含一些脚本样例

refs//目录- 存储各个分支指向的目标提交

branches //目录- 还没发现有什么用处

.git 目录下可能还会包含其他文件,不过对于一个全新的仓库,这将是你看到的默认结构。

其中有四个条目很重要:HEAD 文件、(尚未创建的)index 文件,和 objects 目录、refs 目录。这些条目是Git 的核心组成部分。

本地仓库刚刚新建,Git的三个区域都为空。

2.git add

在A仓库的工作目录创建一个文件file.txt,写入内容version 1,模拟需要管理的代码文件。

执行git add,使用git status查看此时的状态。

然后另外初始化一个空仓库B,尝试用底层命令来实现以上效果。

创建相同内容的file.txt,执行 git hash-object,计算文件头部信息+文件内容的SHA-1编码,执行后显示出40位的编码结果。-w参数表示将内容写入数据目录。

查看写入到数据目录的Git对象文件:

Git以SHA1编码前两位作为子目录名,剩余位数作为文件名,存储压缩后的头部信息和原文内容。

可以通过 cat-file 命令查看原始数据。为 cat-file 指定 -p 选项可使该命令自动判断源文件类型。

这种存储了数据原文的文件在Git对象中属于blob (Binary Large Object)类型。

此时Git的区域状态如下:

使用git update-index 命令可以修改暂存区,也就是.git/index文件。

由于此文件在暂存区没有记录,需要--add参数。

使用--cacheinfo参数,直接写入数据文本。如果不加此参数,仅使用git update-index --add file.txt 的方式,则与add命令效果完全相同。

本例中,我们指定的文件模式为100644,表明这是一个普通文件。其他选择包括:100755,表示一个可执行文件;120000,表示一个符号链接。Git的文件模式参考了常见的UNIX 文件模式,但比真正的文件系统简单许多。

此时暂存区index文件已经生成,直接打开会看到二进制字符,可以用 ls-files 命令解析查看。

显示出刚刚写入的内容。

此时Git的区域状态如下:

使用git status 查看,此时和A仓库状态相同。

另外,由于 update-index --cacheinfo是直接写入文本,我们也可以添加完全不存在的对象名和文件名。

此时B仓库的状态:

3.git commit

回到A仓库,在git add 的基础上调用commit生成一个提交。

再查看暂存区:

与status的提示不同,提交操作并不会实际清空暂存区,其中始终保存着工作目录的文件结构。

再查看对象文件夹,发现两个新增文件。

接下来我们在另一个仓库重现这个操作。

回到B仓库,继续执行 git write-tree。

git 会在此时检查暂存区内容和数据目录中对象的对应关系,刚刚添加的不存在的文件导致失败。

git update-index --remove 命令可以从暂存区删除这条信息,只有在工作目录中不存在此文件时,才允许从暂存区直接删除相关信息。

write-tree 执行成功后同样返回40位哈希值,此命令将暂存区内容写入数据目录,生成一个 tree类型的对象。此对象也可以使用cat-file 命令查看。

使用刚刚生成的tree 对象来继续生成commit 对象,查看内容。

其中用户信息使用 git config user.name 和 git config user.email 设置,仅对当前仓库生效,如未指定则使用全局配置。

查看对象目录:

和A仓库直接git commit生成的文件对比,发现其中一个文件名不同。这是由于commit对象中包含执行时间信息,导致生成了不同的哈希编码。

使用log命令可以看到一个普通的commit信息。

此时Git工作区域的状态:

继续使用唯一的tree对象创建另一个提交。-p参数指定继承关系,作为标识符的hash值冲突概率较低,在git命令中通常使用前几位简写表示。

有继承关系的commit对象多出一条parent信息:

4.refs和HEAD

回到A仓库,使用commit 增加C1提交。

检查到暂存区并未修改,提交失败。可以使用 --allow-empty 参数放弃检查。生成以下log。

可以发现,打印的log信息和B仓库略有不同,并且B 仓库查看log时必须指定commit对象编码。如果不指定就会出现以下错误。

原因是之前用底层命令生成的提交链并不属于任何分支。分支的本质是指向commit对象的指针,hash编码无意义难以记忆,分支名更方便灵活管理。

而HEAD 文件中保存着当前工作目录所在的分支,可以看到在B 仓库中,HEAD 指向默认分支master,而 master 文件还不存在。

可以手动生成 master文件,并指向最新提交。

虽然可以直接修改分支文件的内容,但这是一种不安全的做法,可以使用git update-ref 命令来达成同一效果。

此时B仓库和A仓库的状态就完全一致了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据存储
    +关注

    关注

    5

    文章

    970

    浏览量

    50894
  • Git
    Git
    +关注

    关注

    0

    文章

    198

    浏览量

    15755
收藏 人收藏

    评论

    相关推荐

    进程类型及三种状态

    进程类型进程的三种状态
    发表于 04-02 07:06

    介绍下引脚的三种状态

    介绍下引脚的三种状态
    发表于 01-14 07:12

    功放管的三种工作状态

    功放管的三种工作状态低频功率输出级按功放管的工作状态为甲类、乙类、丙类三种。它们
    发表于 04-17 23:21 3456次阅读

    功放极管的三种工作状态工作状态

    功放极管的三种工作状态工作状态 低频功率输出级按功放管的工作状态为甲类、乙类、丙类三种
    发表于 09-17 08:29 1.4w次阅读
    功放<b class='flag-5'>三</b>极管的<b class='flag-5'>三种</b>工作<b class='flag-5'>状态</b>工作<b class='flag-5'>状态</b>

    功放管的三种工作状态

    功放管的三种工作状态 低频功率输出级按功放管的工作状态为甲类、乙类、丙类三种。 它们各有特点:
    发表于 12-02 11:05 2557次阅读

    极管三种工作状态特点分析及判断

    极管有放大、饱和、截止三种工作状态,放大电路中的极管是否处于放大状态或处于何种工作状态,对于
    的头像 发表于 09-28 09:11 18.8w次阅读
    <b class='flag-5'>三</b>极管<b class='flag-5'>三种</b>工作<b class='flag-5'>状态</b>特点分析及判断

    态门输出的三种状态

    态指其输出既可以是般二值逻辑电路,即正常的高电平(逻辑1)或低电平(逻辑0),又可以保持特有的高阻抗状态,那么态门输出的三种
    的头像 发表于 02-21 16:45 7.2w次阅读

    电路的三种工作状态分别是什么

    在学电子电路中,要学会分析电路,就从了解电路的三种状态开始。电路有哪三种状态:通路(负载)、短路、开路(空载)三种
    的头像 发表于 09-13 09:54 10w次阅读

    解析Vivado的三种封装IP的方式

    Vivado提供了三种封装IP的方式:(1)将当前工程封装为IP;(2)将当前工程中的BD(IPI 设计)封装为IP;(3)将指定的文件目录封装为IP。 IP Packager支持的输入文件HDL
    的头像 发表于 08-10 18:09 6961次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>解析</b>Vivado的<b class='flag-5'>三种</b>封装IP的方式

    晶体管的三种工作状态

    晶体管是一种重要的电子元件,广泛应用于现代电子设备中。它的工作状态可以分为三种,包括截止状态、放大状态和饱和
    发表于 08-04 09:46 1827次阅读

    电路的三种状态

    ,再回到电源另端的电路称为外电路。 3、电路的三种状态 电路有三种状态:通路、开路和短路。通路就是电路中的开关闭合,电路中有电流流过;开路
    的头像 发表于 09-18 10:12 3975次阅读

    继电保护的三种状态解析

    继电保护的三种状态解析  继电保护系统是电力系统中非常重要的个组成部分,其具有三种状态,包括:
    的头像 发表于 09-27 16:00 2803次阅读

    Git是如何存储文件的?Git的工作原理解析

    我以为我已经对 Git 的工作方式了如指掌,但我以前从未真正涉及过打包文件,所以这次探索很有趣。我也很少思考当我让 git log 跟踪文件
    的头像 发表于 10-31 15:36 575次阅读

    晶体管的三种工作状态

    晶体管作为现代电子技术的基石,其工作状态直接影响电子设备的性能和功能。晶体管通常具备三种基本的工作状态:截止状态、放大状态和饱和
    的头像 发表于 05-28 14:53 1420次阅读

    mosfet的三种工作状态及工作条件是什么

    的工作状态及工作条件对于理解和设计相关电路至关重要。以下是MOSFET的三种主要工作状态及其工作条件的介绍。 、MOSFET的三种工作
    的头像 发表于 10-06 16:51 1693次阅读