说起数据库就不能不说数据库的存储,说存储就不能不说数据库对空间的管理。这里我们主要谈的是IDS对空间的管理的相关问题。 从物理上来说,IDS管理的主要是page,chunk;从逻辑上来说主要是extent,tablespace,dbsapce。连续的page组成extent,多个extent组成tablespace,dbspace用来逻辑的管理chunk,而每个tablespace又是建立在dbsapce上的。 Chunk:一个单位的物理磁盘空间,在9.4版本之前不应许超过2G。一个chunk由path,offset,size三部分组成。因此我们在使用onspaces命令来加chunk的时候这三个参数是必不可少的。理论上一个数据库服务器上最多有2048个存储块,但是实际上由UNIX内核规定的一个进程所能打开的文件数来确定的。如果是使用cooked file来做为存储,那么offset可以设置为0,如果使用raw device来做为存储,那偏移量不能为0,至少第一个CHUNK的offset不能为0。 Page:是一最基本的I/O单位。一个page的大小是由OS来决定的,有2K的,也有4K的。我们拿2K的来举例说明。一个page有2048个bit,页头由24bit组成,页尾有一个4bit的时间戳,也就是说每一个page剩余的空间只有2020个bit,另外在每一个page上还有一个槽表,一个槽表4bit,一条记录对应一个槽表,这样在每一个page上存放的记录数就可以定下来。说这些的目的是为了说明在我们建表的时候尽量表不要建的太大,有的表一条记录的大小就超过了一个page,这样在读取的效率上并不是太高。另外还有一个FILLFACTOR的参数决定了数据页的填充程度,如果此值设置的不是太合理,经常上现节点分裂的情况,那对表的读取效率肯定是有影响的。 Extent:是磁盘上连续page的一组集合。在每个extent内的page都是连续的,在表中默认的extent的大小是16K,extent&的大小决定了表中数据存放的集中程度。如果数据存放的过与分散在做磁盘I/O的时间肯定会变长,一般的情况下每个表的extent的大小建议不要超过50,如果太大,就需要做合理的调整。另外不能不提的是在随着extent数目的增长,每次分出的空间的大小是不不一样的,在每到16的时候,就翻倍。例如第一个extent是16K,第17个extent就是32K,第33个就是64K了,在翻倍的增长。 Tablespace:是extent的逻辑集合。各个extent在物理上不一定是连续的。 Dbspace:是一组chunk的逻辑集合。一般是把裸设备的chunk放在一个dbspace中,或者把一组熟文件放在一组chunk中,也有的把裸设备和熟文件放在一组dbspace中,但不建议这么做。 其实在dbsapce中又有三类,一类就是一般的存放数据的dbsapce,另一类就是tempdbspace,还有一种是blobspace。第一种我就不说了。我们先说blobsapce. Blobspace:blobspace是一组逻辑组织的chunk,但是是用来存储byte和text类型的数据。Blobspace中不能存放行或索引,只能存放存储了blob的页面和存储了关于BLOB的系统信息页面。因为blobspace中的BLOB页面的大小是在创建的时候指定的,所有一个blobspace中的所有BLOB页面大小相同。对BLOB的写,是没有在缓冲池中缓冲的,因此BLOB的值不写逻辑日志文件。当修改了BLOB的值之后,应该在磁盘上流出足够的空间以放BLOB的初始值和修改值。 Tempdbspace:是一组临时的dbspace。他在DBSPACETEMP参数中指定。需要在onspaces创建的时候加上-t的参数。对tempsaces的操作是不写逻辑日志的。在创建临时表和做group by ,order by,使用join语句,创建index的时候都是需要临时空间的。一般的情况下所有的tempspace的大小为正常业务数据的10%。如果太小了很大的操作就会出问题。 Select * from tab_a insert into temp tab_b是不写到tempdbspace的。 Select * from tab_a insert into temp tab_b with no log才写到tempdbspace。