磁盘满引发的core-zyd_cu-ChinaUnix博客

YunNotesydzhang.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zyd_cu

博客访问： 4111649
博文数量： 251
博客积分： 11197
博客等级：上将
技术积分： 6862
用户组：普通用户
注册时间： 2008-12-05 14:41

个人简介

@HUST张友东 work@taobao zyd_com@126.com

文章分类

全部博文（251）

互联网（8）
课程笔记（7）
技术交流（5）
KV存储（8）
搜索引擎（5）
系统管理（14）
网络编程（22）
程序设计（14）
文件系统（15）
C/C++（18）
Linux内核（29）
Linux编程（27）
FUSE专辑（10）
分布式系统（19）
工作杂记（17）
TFS开发（33）
未分配的博文（0）

文章存档

2014年（10）

2013年（20）

2012年（22）

2011年（74）

2010年（98）

2009年（27）

我的朋友

相关博文

磁盘满引发的core

分类：服务器与存储

2012-05-27 19:56:48

TFS数据服务器的block是在DS第一次启动前格式化的，所有block的空间是预先分配好的，而物理块对应的index文件，则是block被分配使用时创建的。Index文件的大小是根据block中文件数目增加而增长的，为了提高性能，将整个index文件都mmap到内存直接访问。

在初次mmap index文件时，会计算block中预期的文件数，计算出index文件的理论大小index_size，然后调用ftruncate将index文件的大小改为index_size（保证后面的mmap能成功），然后将0~index_size的内容映射到内存。

由于ftruncate只会改变文件大小，而不会实际分配磁盘空间（man ftruncate），所以index文件的存储空间都是在index文件写的时候动态分配的，当向mmap某个未分配空间的地址写数据时，如果磁盘满，则空间分配会失败，接下来对该地址的写操作将会core掉。下面通过一个实例模拟一下出core的过程。

1. 创建一个1G的文件的普通文件

2. 在该文件上创建文件系统，并以loop形式挂载

# sudo mkfs.ext4 loop_device
sudo mount –t ext4 –o loop loop_device /mnt/loop

3. 在挂载目录下，创建一个文件testfile，并调用ftruncate将其大小改为2G

4. 再向挂载目录中下写入一个1g的文件realfile，由于文件系统空间总共只有983M，故dd时提示磁盘空间不足，只能成功写入983M；可以看出，ftruncate并没有实际的分配磁盘空间。

5. 最后mmap映射testfile的前面一部分文件数据（前10M），并直接向映射的地址写数据。

运行以上程序，会core掉，Program terminated with signal 7, Bus error. 原因是testfile只是个空文件，当需要为其分配磁盘空间时，磁盘已经满了，接下来对testfile映射的地址的访问就会出core，但为什么是SIGBUS，而不是SIGSEGV，我也不得而知，求高人指点。

Block对应的Index的空间是根据平均文件大小的配置项计算出理论值大小，并在格式化前会为index预留对应的存储空间，之后创建的index都只有这部分存储空间，造成index无法分配到空间（磁盘满）主要有以下几个原因：

DataServer挂载大小配置高于文件系统实际可用空间，这时预留给index的空间比实际计算出来的小，这个问题可以通过在代码上加以检查来避免。
Block中大量小文件，index条数量严重偏离预期，该问题目前没有想到好的办法解决。
大量删除block时产生的延时删文件没有正常被回收，占用大量空间，导致正常的index文件分配不到空间，可通过对延时删机制进行改进来避免。

阅读(3998) | 评论(1) | 转发(1) |

上一篇：HDFS RAID实现方案

下一篇：使用脚本构建分布式文件系统

给主人留下些什么吧！~~

cwr4598390772012-05-28 20:56:30

在初次mmap index文件时，会计算block中预期的文件数
http://www.xiaoyatv.com

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6