0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Linux中的索引节点、软链接、硬链接是什么?

微云疏影 来源:道哥分享 作者:道哥分享 2022-04-18 10:52 次阅读

最近,看到很多文章都在介绍 Linux 中的文件系统,其中就包括:inode 节点、软链接、硬链接等重要的概念。

于是就有小伙伴私信问我:这些概念我都懂,但是我能利用他们来完成什么工作呢?

或者说,在哪些情况下,软链接和硬链接能够提供提供更好的解决方案呢?

这篇文章我们就来简单梳理一下,软链接和硬链接的几个使用场景。

什么是索引节点

什么是硬链接

什么是软链接

软链接应用之:灵活切换不同版本的目标程序

软链接应用之:动态库版本管理

软链接应用之:快捷方式

硬链接之应用:从不同角度对文件进行分类

硬链接应用之:文件多人共享

硬链接之应用:文件备份

文件和索引节点 inode

pYYBAGJc0n6Aet01AAGkksufJ_4484.jpg

在 Linux 系统中,我们可以把一个文件看做 3 个组成部分:

文件名:从用户角度来描述一个文件;

文件内容:也就是文件中存储的那些数据;

文件的描述信息:文件的类型、所有者、创建时间等等,可以称之为元信息;

poYBAGJc0n-AVFthAAJ6p2sZU7c193.jpg

可以简单的做一个类比:

文件本身的内容,可以看做一个实实在在的人。

文件的描述信息,可以看做是派出所里的户籍卡。



户籍卡上记录了一个人的姓名、年龄、住址等信息,警察叔叔通过这个户籍卡,就知道这个人的一切描述信息,除了你脑袋里的知识。

回到计算机中,文件的所有信息都需要存储在硬盘上,因此就要对硬盘进行区域划分:不同的区域存储不同类型的数据,这就是文件系统的重要作用。

在 Linux 系统使用的 ext2/ext3 文件系统中,从硬盘上划分一块区域,用来存放文件本身的内容(数据),这块区域按照一个最小单位:块(block)来进行划分。

然后从硬盘上划分出另一块区域,专门用来存放所有文件的描述信息。

每一个文件的描述信息,都用一个名为索引节点(inode)的数据结构来表示,所有文件的 inode 就统一放在这块硬盘区域中。

poYBAGJc0oCASVShAAFC529ev2o325.jpg

就像户籍卡上记录了一个人的住址一样,一个文件的索引节点(inode)中,也记录了这个文件的所有描述信息,包括:文件类型、所有者、创建时间等待,当然也包括文件内容存储在硬盘的哪些块(block)中。

当我们调用打开文件 API 函数的时候,操作系统首先根据传入的文件路径,找到这个文件的 inode,然后进行一系列的权限检查操作,最后从 inode 中获得这个文件的内容存储在哪些块(block)中,从而可以对文件的内容进行读取、写入操作。

pYYBAGJc0oCAX9XQAAEI2TuG328928.jpg

文件名称只是给我们用户来使用的,操作系统只是通过 inode 节点,来对文件进行管理的。

当我们创建一个新文件的时候,就同时创建了这个文件对应的 inode 节点。

当我们删除一个文件的时候,就同时删除了这个文件对应的 inode 节点。

此时,文件本身内容所在的那个块中,数据并不会被抹除掉,因此有些数据恢复软件就是利用这个特点来进行数据找回。

一句话总结:索引节点(inode)就像户籍卡,操作系统通过 inode 来管理所有的文件。

硬链接

刚才已经说到,每一个文件都对应一个 inode 节点。

例如有一个文件 a.txt,文件内容长度是 1024 个字节,存放在硬盘上的某个块(block)中,假设就是第 10000 个块吧。

那么这个文件对应的 inode 节点中,就会把 10000 这个块记录下来。

同时,它还有一个 links 字段,表示:当前这个 inode 对应一个文件,此时 inode.links 的值为 1。

此时,如果我们用另一个文件名 a_hard_link.txt,也来表示 a.txt 这个文件。

也就是说:虽然我们用了 2 个文件名称,但是本质上指向同一个文件,内容都指向第 10000 个块中存储的文件内容。

Linux 系统中提供了硬链接来支持这样的目的,它仅仅是把 inode 节点中的 links 字段的值 加1 即可,也就是 inode.links 的值变成了 2。

poYBAGJc0oCADy81AADJT0aM3NU244.jpg

硬链接的操作指令是:

$ ln a.txt b.txt

基于硬链接,用户就可以用不同的文件名来访问同一个文件,所有的操作最终修改的都是同一个文件。

如果仅仅从用户的角度来看,好像我们是在操作不同的文件,但是这些文件具有自动同步的功能。

这个行为有点类似于网盘:

pYYBAGJc0oGAc9pjAAFoE84OoH8031.jpg

在云存储中有一个文件 hello.txt,然后我有两台电脑 A 和 B,这两台电脑会把云端的文件 hello.txt 都创建一个镜像文件在本地,就好像这个文件就在自己的硬盘上一样。

当我在电脑 A 上操作 hello.txt 时,电脑 B 中的同名文件会自动更新。

因此,从行为上来看,硬链接就相当于是:文件拷贝 + 自动同步。

再来看一下硬链接文件的删除操作。

在执行 $ ln a.txt a_hard_link.txt 指令之后,该文件对应的 inode 节点中,links 的值为 2。

如果我们删除 a.txt,操作系统会把该文件对应的 inode 中的 links 值减1,结果为 1,操作系统发现不为 0,因此并不会删掉这个 inode。

poYBAGJc0oGANei-AAC6Cb2ZNyA268.jpg

如果我们再删除 a_hard_link.txt,操作系统再次执行 inode.links 减1 动作,发现值变成了 0,于是就把这个 inode 删除了,于是这个文件就彻底不存在了。

这就相当于把一个人的户籍卡给注销掉了,从户籍管理角度看,这个人就不存在了。即使存在,也是一个黑户。

pYYBAGJc0oKAVjTxAABxjITJChA991.jpg

硬链接存在 2 个限制:

不允许用户给目录创建硬链接,即:用户不可以,操作系统可以(想一下每个目录下的 . 和 ..);

只有在同一个文件系统中的文件,才能创建硬链接,也就是说:不能跨文件系统;

软链接

为了克服硬链接的 2 个限制,软链接被引入进来了。

软链接也叫符号链接,它是一个独立的文件。

软链接文件的内容是一个文本字符串,存储的是目标文件(即:链接到的文件)的路径名。

这个路径名可以指向任意一个文件系统的任意文件或者目录,甚至可以指向一个不存在的文件。

与创建硬链接不同的是:当我们创建了一个软链接之后,操作系统会创建一个新的 inode 来表示这个软链接文件。

例如有一个文件 a.txt,我们创建一个软链接 a_soft_link.txt 来指向它:

$ ln -s a.txt a_soft_link.txt

此时,a.txt 和 a_soft_link.txt 各自都有自己的 inode 节点。

poYBAGJc0oKAYpFqAAEdY4-mlj4509.jpg

图中的绿色虚线,就表示软链接文件中的文件路径。

正因为软链接文件中存储的仅仅是目标文件的路径字符串,所以可以表示任意一个文件系统中的文件,或者是目录。

当我们打开文件软链接 a_soft_link.txt 时,操作系统从 a_soft_link.txt 对应的 inode 数据结构中发现:这是一个软链接文件。

于是操作系统就根据其中的路径信息,找到 a.txt 的 inode 节点,从而对最终的目标文件进行操作。

再来看一下软链接文件的删除操作。

如果我们把目标文件 a.txt 删除掉之后,inode 节点会被删除掉,就相当于它的户籍卡被注销掉了。

poYBAGJc0oOAXrflAAEIB5bLmK0579.jpg

此时再次打开软链接 a_soft_link.txt 时,虽然其中的路径信息仍然存在,但是系统此时却找不到 a.txt 对应的 inode 节点了。

因此,软链接就类似于与 Windows 系统中的快捷方式。

当真正的目标文件被删除之后,快捷方式也就没有存在的意义了。

软链接应用之:灵活切换不同版本的目标程序

在开发的过程中,对于同一个工具软件,可能要安装多个不同的版本,例如:Python2 和 Python3, JDK8 和 JDK9 等等。

此时就可以通过软链接来指定当前使用哪个版本。例如在我的电脑中:

$ ll -l /usr/bin/python*

lrwxrwxrwx 1 root root 9 12月 31 08:19 /usr/bin/python -> python2.7*

lrwxrwxrwx 1 root root 9 12月 31 08:19 /usr/bin/python2 -> python2.7*

-rwxr-xr-x 1 root root 3492624 3月 2 04:47 /usr/bin/python2.7*

lrwxrwxrwx 1 root root 9 12月 31 08:19 /usr/bin/python3 -> python3.5*

-rwxr-xr-x 2 root root 4456208 1月 27 02:48 /usr/bin/python3.5*

当在终端窗口中输入:python 时,启动的是 python2.7 版本。

如果有一天我需要使用 python3.5 版本,只需要把软链接 python 指向 python3.5 即可。

软链接应用之:动态库版本管理

在 Linux 系统的动态库版本管理中,有一个 SONAME 的概念。

我们在编译一个动态链接库时,一般使用如下编译命令:

$ gcc -fPIC -shared -o libhello.so hello.c

在使用这个动态库时,需要链接这个库:-llibhello。

简单的 demo 可以这么来写,但是如果遇到一些比较大的项目,需要执行严格的版本管理,那应该怎么来操作呢?

Linux 系统已经为我们想到了问题的解决方案,利用 SO-NAME。

首先,在编译动态链接库文件时,就指定产生 SO-NAME,它会被存储在动态链接库 ELF 文件中。

我们来直接看一个优秀的开源工具 libevent 的例子:

$ ll /usr/lib/libevent-2.1.so*

lrwxrwxrwx 1 root root 17 Jul 27 2020 /usr/lib/libevent-2.1.so -> libevent-2.1.so.7

lrwxrwxrwx 1 root root 21 Jul 27 2020 /usr/lib/libevent-2.1.so.7 -> libevent-2.1.so.7.0.1

-rw-r--r-- 1 root root 412016 Jul 27 2020 /usr/lib/libevent-2.1.so.7.0.1

此时使用 readelf 命令来查看生成的动态库文件 libevent-2.1.so.7.0.1:

$ readelf -a libevent-2.1.so.7.0.1 | grep SONAME

0x000000000000000e (SONAME) Library soname: [libevent-2.1.so.7]

它这么做有什么好处呢?

Linux 系统在查找动态链接库文件时,会到下面这 3 个默认目录下查找(当然然还有其他目录,比如:当前目录,LD_LIBRARY_PATH 指定的目录)

/lib: 存放操作系统最关键和基础的库文件;

/usr/lib: 存放一些非系统运行时所需要的关键库文件;

/usr/local/lib: 存放用户自己安装的一些第三方库文件;

系统中安装的所有动态链接库,借助 ldconfig 这个程序,会自动的创建、更新或者删除对应的 SONAME(它是一个软链接,链接到 实际的库文件),并把这些 SONAME 汇总到一个文件 /etc/ld.so.cache 中缓存起来。

这样,当动态库加载器查找动态库文件时,就可以直接在这个缓存文件中进行查找,加快了动态库的查找速度。

软链接应用之:快捷方式

利用软链接的快捷方式功能就比较好理解了,想一想:我们为什么在 Windows 的桌面上创建很多软件的快捷方式啊?

在 Linux 中同样如此!

比如:最近一段时间的工作,每次都要打开一个路径很深的文件。

如果在资源管理器中,一层一层的点击鼠标,是不是比较浪费时间。

此时,就可以在桌面上创建一个软链接,每次直接双击就打开所链接的目标文件了。

硬链接之应用:从不同角度对文件进行分类

比如我有一个文件夹,存储了10 个G的照片。

这些照片中的人物、拍照地点、拍照时间都是不一样的。

现在,我既想根据照片中的人物进行分类,也想根据拍照地点进行分类,还想根据拍照时间进行分类,那该怎么办?

因为一张照片可能同时属于多个不同的分类,难道每个分类中都复制一张照片?这样也太浪费硬盘空间了!

解决方案是:

所有的照片仍旧放在一个总的文件夹中,然后创建不同的分类文件夹,在每个分类文件夹中,创建硬链接到目标照片文件。

这样的话,不仅对照片进行了分类,而且一点都不占用硬盘空间。

硬链接应用之:文件多人共享

pYYBAGJc0oSAerJEAACWHrBbXMU275.jpg

当很多人同时对同一个文件进行维护的时候,如果大家都直接操作这个文件,万一不小心把文件删除了,大家就都玩完了!

此时,可以在每个人自己的私人目录中,创建一个硬链接。

每次只需要对这个硬链接文件进行操作,所有的改动会自动同步到目标文件中。

由于每个人都是操作硬链接文件,即使不小心删除了,也不会导致文件的丢失。

因为删除硬链接文件,仅仅是把该文件的 inode 节点中的 links 值减 1 而已,只要不为 0,就不会真正的删除文件。

硬链接之应用:文件备份

一些小伙伴有定期备份文件、清理文件的好习惯。

在备份的时候,如果是实实在在的拷贝一份,那真的是太浪费磁盘空间,特别是对于我这种只有 256G 硬盘空间的笔记本。

此时,就可以利用硬链接功能,既实现文件备份的目的,又节省了大量的硬盘空间,一举两得!

很多备份工具利用的就是硬链接的功能,包括 git 工具,当克隆本地的一个仓库时,执行 clone 指令:

git clone --reference <repository>

git 并不会把仓库中的所有文件拷贝到本地,而仅仅是创建文件的硬链接,几乎是零拷贝!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    11296

    浏览量

    209353
  • 索引
    +关注

    关注

    0

    文章

    59

    浏览量

    10468
  • 软链接
    +关注

    关注

    0

    文章

    8

    浏览量

    2220
收藏 人收藏

    评论

    相关推荐

    一文弄懂Linux链接链接

    Linux系统下,有两种链接文件:一种是链接(Hard Link);另一种是链接,也称为符
    发表于 10-21 14:26 1345次阅读

    Linux系统如何删除链接

    Linux,符号链接(symbolic link,或者symlink)也称为链接,是一种特殊类型的文件,用作指向另一个文件的快捷方式。
    发表于 10-28 09:14 7460次阅读

    Linux链接的区别

    不同。   4: 若想复制时日期相同,可以通过命令:cp –p /etc/inittab /test/inittab2   5:链接的同步更新   连接类似于快捷方式,访问的就是源文件,所有肯定是跟
    发表于 02-04 16:34

    Linux索引节点连接和连接计数

    ,一种被称为链接(Hard Link),另一种被称为符号链接(Symbolic Link)。默认情况下,ln命令产生硬链接 连接指通过
    发表于 08-20 10:38

    Linux文件系统的链接链接

    ,它读取链接文件找到真正要访问的文件。当然链接也有链接没有的缺点:因为链接文件包含有原文件的
    发表于 12-06 10:55

    Linux文件系统的链接链接

    转帖Linux 系统中有链接链接两种特殊的“文件”。
    发表于 12-06 13:34

    Linux基础】Linux链接简介

      一、Linux链接简介  Linux下的文件是通过索引节点(Inode)来识别文件的,
    发表于 09-20 15:47

    Linux基础】Linux链接简介

    Linux链接要系统分配额外的空间用于建立新的索引节点和保存原文件的路径。  五、Linux
    发表于 09-20 15:50

    linux链接链接的区别

    linux系统链接分两种 :一种被称为链接(Hard Link),另一种被称为符号链接
    发表于 11-15 16:26

    链接链接的区别在哪

    链接链接的区别  链接(hard link):A是B的
    发表于 12-21 07:21

    你知道Linux连接和链接

    Linux链接分两种,一种被称为链接(Hard Link),另一种被称为符号链接(Symbolic Link)。默认情况下,ln命令产生硬
    发表于 04-25 18:00 1685次阅读

    需要了解Linux链接链接

    链接链接Linux 文件系统的一个重要概念,其涉及文件系统
    发表于 04-28 17:01 786次阅读
    需要了解<b class='flag-5'>Linux</b>的<b class='flag-5'>硬</b><b class='flag-5'>链接</b>与<b class='flag-5'>软</b><b class='flag-5'>链接</b>

    Linux链接链接都用在哪些场合?

    最近,看到很多文章都在介绍 Linux 的文件系统,其中就包括:inode 节点链接
    的头像 发表于 06-21 16:33 1668次阅读

    Linux索引节点链接链接是什么?

     回到计算机,文件的所有信息都需要存储在硬盘上,因此就要对硬盘进行区域划分:不同的区域存储不同类型的数据,这就是文件系统的重要作用。
    的头像 发表于 04-11 15:34 4498次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>中</b>的<b class='flag-5'>索引</b><b class='flag-5'>节点</b>、<b class='flag-5'>软</b><b class='flag-5'>链接</b>、<b class='flag-5'>硬</b><b class='flag-5'>链接</b>是什么?

    链接PK链接

    链接PK链接
    的头像 发表于 10-12 18:16 1150次阅读