Chinaunix首页 | 论坛 | 博客
  • 博客访问: 6923448
  • 博文数量: 700
  • 博客积分: 10821
  • 博客等级: 上将
  • 技术积分: 12011
  • 用 户 组: 普通用户
  • 注册时间: 2005-12-02 10:41
个人简介

大数据、ML、AI、云计算openstack、Linux、SpringCloud。

文章分类

全部博文(700)

分类: LINUX

2015-06-23 17:15:11

在Linux下查看磁盘空间使用情况,最常使用的就是du和df了。然而两者还是有很大区别的,有时候其输出结果甚至非常悬殊。
1. 如何记忆这两个命令
du   -Disk Usage
df   -Disk Free
2. df 和du 的工作原理
2.1 du的工作原理
du命令会对待统计文件逐个调用fstat这个系统调用,获取文件大小。它的数据是基于文件获取的,所以有很大的灵活性,不一定非要针对一个分区,可以跨越多个分区操作。如果针对的目录中文件很多,du速度就会很慢了。
2.2 df的工作原理
df命令使用的事statfs这个系统调用,直接读取分区的超级块信息获取分区使用情况。它的数据是基于分区元数据的,所以只能针对整个分区。由于df直接读取超级块,所以运行速度不受文件多少影响。
3 du和df不一致情况模拟
常见的df和du不一致情况就是文件删除的问题。当一个文件被删除后,在文件系统目录中已经不可见了,所以du就不会再统计它了。然而如果此时还有运行的进程持有这个已经被删除了的文件的句柄,那么这个文件就不会真正在磁盘中被删除,分区超级块中的信息也就不会更改。这样df仍旧会统计这个被删除了的文件。
(1)当前分区sda1的使用情况
[plain] view plaincopy

    [root@debian8 testdu]# df -h /dev/sda1  
    文件系统          容量  已用  可用 已用%% 挂载点  
    /dev/sda1              49G  776M   45G   2% /var  

(2)新建一个1GB的大文件
[plain] view plaincopy

    [root@debian8 var]# dd if=/dev/zero of=myfile.iso bs=1024k count=1000  
    记录了1000+0 的读入  
    记录了1000+0 的写出  
    1048576000字节(1.0 GB)已复制,24.0954 秒,43.5 MB/秒  

(3)此时的分区sda1使用情况
df结果:
[plain] view plaincopy

    [root@debian8 var]# df -h /dev/sda1  
    文件系统        容量  已用  可用 已用%% 挂载点  
    /dev/sda1              49G  1.8G   44G   4% /var  

du结果:
[plain] view plaincopy

    [root@debian8 var]# du -sh /var/  
    1.6G    /var/  

此时两者结果基本相同。

(4)模拟一个进程打开这个大文件,然后删除这个大文件
[plain] view plaincopy

    [root@debian8 var]# tail -f myfile.iso &  
    [1] 23277  
    [root@debian8 var]# rm -f myfile.iso   


(5)此时,再对比du和df的结果
首先确认有进程持有myfile.iso句柄。
[plain] view plaincopy

    [root@debian8 var]# lsof | grep myfile.iso  
    tail      23955      root    3r      REG                8,1 1048576000       7999 /var/myfile.iso (deleted)  


[plain] view plaincopy

    [root@debian8 var]# du -sh /var/  
    596M    /var/  
    [root@debian8 var]# df -h /dev/sda1  
    文件系统          容量  已用  可用 已用%% 挂载点  
    /dev/sda1              49G  1.8G   44G   4% /var  

可以看出,df结果没有变化,而du则不再统计被删除了的文件myfile.iso。

(6)停止模拟进程,再对比du和df结果
首先确认没有进程持有myfile.iso句柄。
[plain] view plaincopy

    [root@debian8 var]# lsof | grep myfile.iso  
    [root@debian8 var]#   


[plain] view plaincopy

    [root@debian8 var]# du -sh /var/; df -h /dev/sda1  
    596M    /var/  
    文件系统          容量  已用  可用 已用%% 挂载点  
    /dev/sda1              49G  776M   45G   2% /var  

此时,myfile.iso已经没有进程占有它了,也就从磁盘上删除了,分区的超级块信息已经更改,df也就显示正常了。

4 工作中需要注意的地方
(1)当出现du和df差距很大的情况时,考虑是否是有删除文件未完成造成的,方法是lsof命令,然后停止相关进程即可。
(2)可以使用清空文件的方式来代替删除文件,方式是:echo > myfile.iso。
(3)对于经常发生删除问题的日志文件,以改名、清空、删除的顺序操作。
(4)除了rm外,有些命令会间接的删除文件,如gzip命令完成后会删除原来的文件,为了避免删除问题,压缩前先确认没有进程打开该文件。


阅读(7350) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~