分类: DB2/Informix
2012-05-28 22:56:33
MongoDB对国内用户来说比较新, 它就像是一个黑盒子,但是如果对于它内部的数据存储了解多一些的话,那么将会很快的理解和驾驭MongoDB,让它发挥它更大的作用。
MongoDB的默认数据目录是/data/db,它负责存储所有的MongoDB的数据文件。在MongoDB内部,每个数据库都包含一个.ns文件和一些数据文件,而且这些数据文件会随着数据量的增加而变得越来越多。所以如果系统中有一个叫做foo的数据库,那么构成foo这个数据库的文件就会由foo.ns,foo.0,foo.1,foo.2 等等组成,具体如下:
[root@localhost db]# ll /data/db/ 总计 196844 -rw------- 1 root root 16777216 04-15 16:33 admin.0 -rw------- 1 root root 33554432 04-15 16:33 admin.1 -rw------- 1 root root 16777216 04-15 16:33 admin.ns -rw------- 1 root root 16777216 04-21 17:30 foo.0 -rw------- 1 root root 33554432 04-21 17:30 foo.1 -rw------- 1 root root 67108864 04-21 17:30 foo.2 -rw------- 1 root root 16777216 04-21 17:30 foo.ns -rwxr-xr-x 1 root root 6 04-21 17:16 mongod.lock -rw------- 1 root root 16777216 04-15 16:30 test.0 -rw------- 1 root root 33554432 04-15 16:30 test.1 -rw------- 1 root root 16777216 04-15 16:30 test.ns drwxr-xr-x 2 root root 4096 04-21 17:30 _tmp |
MongoDB内部有预分配空间的机制,每个预分配的文件都用0进行填充,由于有了这个机制, MongoDB始终保持额外的空间和空余的数据文件,从而有效避免了由于数据暴增而带来的磁盘压力过大的问题。
由于表中数据量的增加,数据文件每新分配一次,它的大小都会是上一个数据文件大小的2倍,每个数据文件最大2G。这样的机制有利于防止较小的数据库浪费过多的磁盘空间,同时又能保证较大的数据库有相应的预留空间使用。
数据库的每张表都对应一个命名空间,每个索引也有对应的命名空间。这些命名空间的元数据都集中在*.ns文件中。
在下图中,foo这个数据库包含3个文件用于存储表和索引数据,foo.2文件属于预分配的空文件。foo.0和foo.1这两个数据文件被分为了相应的盘区对应不同的名字空间。
上图显示了命名空间和盘区的关系。每个命名空间可以包含多个不同的盘区,这些盘区并不是连续的。与数据文件的增长相同,每一个命名空间对应的盘区大小的也是随着分配的次数不断增长的。这样做的目的是为了平衡命名空间浪费的空间与保持某一个命名空间中数据的连续性。上图中还有一个需要注意的命名空间:$freelist,这个命名空间用于记录不再使用的盘区(被删除的Collection或索引)。每当命名空间需要分配新的盘区的时候,都会先查看$freelist是否有大小合适的盘区可以使用,这样就回收空闲的磁盘空间。