unix 软连接与硬连接以及inode知识-ubuntuer-ChinaUnix博客

人生如逆旅，我亦是行人！江湖人称wsjjeremy.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

ubuntuer

博客访问： 4900442
博文数量： 930
博客积分： 12070
博客等级：上将
技术积分： 11448
用户组：普通用户
注册时间： 2008-08-15 16:57

文章分类

全部博文（930）

html5（0）
python（1）
google_gnu fans（8）
高品位（2）
perl（4）
mobile_dev（2）
openssl（1）
libcurl（2）
windows内核安全（5）
自己的C_LIB（5）
高性能MySQL学习（94）
多线程（4）
ldd学习笔记（3）
netfilter（3）
笔试题（5）
师徒之言传身教（1）
转载（15）
work（146）
introduction to （9）
debug（3）

intern（3）
mobile ip（0）
毕业设计（2）
linux防火墙（10）
c++（16）
database（13）
CentOS（11）
data structure（5）
kernel（50）
DIY（4）
酷软（19）
iptables（9）
linux c（105）

string（19）
APUE学习笔记（7）
facetea（13）
shell（68）
tcp_ip（23）
apache（3）
linux（258）

正则表达式（5）
未分配的博文（1）

文章存档

2011年（60）

2010年（220）

2009年（371）

2008年（279）

我的朋友

相关博文

unix 软连接与硬连接以及inode知识

分类： LINUX

2009-12-07 18:12:50

引子

目前，UNIX的文件系统有很多种实现，例如UFS（基于BSD的UNIX文件系统）、ext3、ext4、ZFS和Reiserfs等等。

不论哪一种文件系统，总是需要存储数据。硬盘的最小存储单位是扇区，数据所存储的最小单位则不是扇区，因为用扇区来存储效率就太低了。一个扇区只有512字节，而磁头是一个扇区一个扇区地读取，也就是说，如果文件是10MB，那么为了读这个文件，磁头必须要进行读取20480次。这样效率是极其低下的。

逻辑块

为了提高效率，就有了逻辑块（Block）的概念，也可以叫做数据块。逻辑块是在分区进行文件系统的格式化时所指定的“最小存储单位”，这个最小存储单位是以扇区为基础的，所以逻辑块的大小总是扇区的2的n次方倍。此时，磁头可以一次读取一个块，这样效率可就高了！

逻辑块的规划是很有学问的，并不是越大越好，因为一个逻辑块最多也只能容纳一个文件（在Linux的ext2中），所以如果逻辑块被规划的太大，那么会很浪费磁盘空间。举个例子，如果一个逻辑块为4KB，而有一个文件只有0.1KB大小，而这个小文件仍然要占用一个逻辑块，因此就会浪费3.9KB的空间。

所以，在规划磁盘时，需要考虑到主机的用途。比如BBS主机，由于文章短小，文件较小，那么逻辑块分配的小一点好。如果主机主要用在存储大容量的文件，那么考虑到使用效率，还是逻辑块大一点好！

磁盘的组成

我们可以把一个磁盘分成一个或多个分区。每个分区可以包含一个文件系统。

我们下面要描述一个分层细化的过程，请您集中精力来随我思考：

1 磁盘是由一个一个分区组成的，即磁盘＝分区+分区+分区…

2 每一个分区内都有一个文件系统，且一个分区内有且仅有一个文件系统。

3 每个分区内都依次包含这些内容：自举块（也叫引导块），超级块，柱面组0，柱面组1，…柱面组n。即分区＝自举块+超级块+柱面组（若干）

4 每个柱面组又包括了这些内容：超级块副本，配置信息，i节点图（记录哪些i节点可用），块位图（记录哪些块是否可用），i节点（许多），数据块（也叫逻辑块）

好了，你应该可以根据1,2,3,4在脑海里构造出一张分层图了，如果你把它画出来，对你记忆i节点的概念会更有好处。

超级块

超级块（superblock）的作用是存储文件系统的大小、空的和填满的块，以及它们各自的总数和其他诸如此类的信息。要使用一个分区来进行数据访问，那么第一个要访问的就是超级块。所以，如果超级块坏了，那磁盘也就基本没救了。

i节点

下面要讲到i节点，就不能不提提Linux的安全性。由于Linux操作系统是一个多用户、多任务的环境，为了保护每个用户所拥有数据的隐密性，就将每个文件分成了两个部分来存储：一个是文件的属性，另一个则是文件的内容。

i节点（iinode）就是用来存储文件的属性的；而数据块（逻辑块）是用来存储文件的内容的！

如果要格式化一个分区，就要指定inode的大小和块的大小才行！更通俗的说，一个ext2文件系统是一定要包括inode表与块区域这两个部分的！

至于块，我在前面提到过，它也叫逻辑块，还叫数据块，它是数据存储的最小单位。

而inode“记录文件属性以及文件内容放置在哪一个块内”的信息，更通俗的说，inode除了包含文件的属性之外，还包括一个指针，这个指针就指向文件内容放置的数据块的位置，好让操作系统可以方便的去读取文件内容。

在inode中一般包括了这样一些文件属性信息：

文件的拥有者和所属用户组；
文件的访问权限设定；
文件的类型；
文件的访问、修改等时间
文件的大小；
文件的各种标志，如SUID和SGID等；
指向文件内容数据块的指针。

一个inode的大小通常为128字节。（在ext4中这个知识将被颠覆，ext4中的inode大小将扩展到256字节）

好，下面就来看看到底我们怎么利用inode来管理文件呢？

先来看看有关目录操作的细节：

如果我们建立了一个目录，那么系统会分配给该目录一个inode和至少一个块。这个inode就记录该目录的相关属性，并将其中的指针指向分配的那个数据块。而所分配的块内则记录了这个目录下的相关文件（和子目录）的关联性，更通俗的说，目录块中存储了一个包括三列的表，三列分别为：inode，文件名或目录名，指向数据块的指针。

我们用vi命令来查看一下一个目录的内容到底是什么：（当然这只是用户看到的，和文件系统的底层实现是不同的。）

" ============================================================================
" Netrw Directory Listing                                        (netrw v109)
"   /rocrocket/PSB/home/git27
"   Sorted by      name
"   Sort sequence: [\/]$,\.h$,\.c$,\.cpp$,\.[a-np-z]$,*,\.info$,\.swp$,\.o$\.obj$,\.bak$
"   Quick Help: :help  -:go up dir  D:delete  R:rename  s:sort-by  x:exec
" ============================================================================
../
./
.git/
roc.c

双引号开头的是注释部分，而后紧跟着四个项，前两个是任何目录都固有的“上级目录”和“当前目录”，而后是一个隐藏目录.git，最后是一个当前目录下的文件roc.c。可见，一个目录其实也是一个文件，只不过它其中不存储用户数据，而是存储目录下的文件和子目录列表。

如果在Linux中新建一个普通文件，则系统会为该文件分配至少一个inode与相对于该文件大小的块数量。例如，假设一个块为4KB，要建一个100KB的文件，则Linux将分配一个inode与25个块来存储该文件。

有一点要特别！特别！特别！提醒的是：inode本身并不记录文件名，而是记录文件的相关的属性（在上文提到过的那些属性），文件名则记录在目录所属的块区域。正因为这个原因，使得如果Linux读取一个文件的内容，就要先由根目录/获取该文件的上层目录所在的inode，再由该目录所记录的的文件关联性获取该文件的inode，最后通过inode内提供的块指针来获取最终的文件内容。

链接计数

而当谈到链接数的时候，这里我还要提出一些概念和几个规律性的结论：

每个i节点中都存有一个链接计数，其值是指向该i节点的目录项数。

只有当链接技术减少到0时，才可删除该文件（也就是释放该文件占有的数据块）

能够增加链接数的链接为硬链接。

软链接也叫符号链接，它的inode的文件类型是S_IFLNK。它只是存储了另一个文件的路径和名称而已。

任何一个叶目录（不包含任何其他目录的目录）的链接计数总是2，数值2来自于命名该目录的目录项以及在该目录中的.项。

父目录中的每一个子目录都会使该父目录的链接计数增1。

精彩引文

最后给出csdn网上qxp网友的一段关于软链接和硬链接的评论，很不错：

我们知道unix文件大致可以分为这样三部分：目录（文件名），inode 和数据区。

对于复制来说，不仅仅创建了新的目录项（文件名），新的inode，还复制了该文件的所有数据；

而硬连结则仅仅创建了新的目录项，并且在目录项中相应的inode编号被连结到相应的文件的inode编号，同时，该文件的inode引用计数加1；

这样，你删除原来的文件时候，文件数据并不会被删除，因为inode结点引用计数>0,所以，通过硬连结还能继续访问。

换句话说，硬连接使得该文件存在另外一个别名，也就是另外一个入口。

顺便说一下软连结，就是符号连结，其实就相当于是windows下的快捷方式。

创建了一个新的目录项，一个新的inode，只不过数据区里放的是被引用的文件路径和名称。

结尾PS

ps:其实写这篇文章的目的，是为了在另一篇文章中更好的讲解ln命令，到时会给出大家那篇文章的一个链接。

ps2:关于inode和目录的一点优秀评论：一个文件系统维护了一个索引节点的数组，每个文件或目录都与索引节点数组中的唯一的元素对应。每个索引节点在数组中的索引号，称为索引节点号。linux文件系统将文件索引节点号和文件名同时保存在目录中，所以，目录只是将文件的名称和它的索引节点号结合在一起的一张表，目录中每一对文件名称和索引节点号称为一个连接。

参考文献

本文参考《鸟哥的Linux私房菜》和《UNIX高级环境编程》；

更多信息可以查看和http://security.zdnet.com.cn/security_zone/2008/1218/1284126.shtml以及上述资料。

over~

软连接有自己的inode 和数据块，他的数据块当中的内容为所要连接的文件的绝对或者相对路径。而硬连接和他所要连接的文件共有同一个inode 和数据块。

这两个连接不同之处主要体现在访问权限上，建立的软连接的访问权限是777，但是这不是他的实际访问权限，他的实际访问权限还是以它所连接的文件的访问权限为准。而硬连接建立的时候的访问权限就是它所连接的访问权限，因为他们共用一个inode，而inode当中所存储的就是此文件的访问权限。

需要补充的是，软连接可以跨文件系统，而硬连接不能跨文件系统。

阅读(1085) | 评论(0) | 转发(0) |

上一篇：Printk的loglevel和日志记录分析

下一篇：程序生成过程预处理，编译，优化，汇编，链接

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6