Just a blog
分类: 数据库开发技术
2011-06-01 16:16:13
1、正确认识日志文件。
一个Sql Server数据库最少要包含一个mdf数据文件和一个ldf日志文件。mdf文件中包含了所有的数据库对象和数据,例如表、存储过程、用户信息等等。ldf文件中包含(或者曾经包含)了数据库的所有事务日志,但是不要指望仅仅通过ldf日志文件来恢复数据库。例如,想通过ldf文件和以前的完全备份将数据恢复到某个时间点,或者由于某些原因只剩下了ldf日志文件,想通过ldf日志文还原出mdf文件等等,这些都是行不通的。当然,必须承认通过一些三方工具或特殊的手段的确可能可以通过ldf文件恢复部分的数据。即便是这样,一般情况下通过ldf文件恢复出你想要的数据的情况也是少之又少。
ldf日志文件的真正作用应该是以下几个:
2、关于活动日志
活动日志就是指当前正在运行中的事务的日志记录。举个例子,例如下面的一断代码:
上面的代码开始了一个事务,然后进行了一些删除操作,但是还没有提交或者回滚。这个未提交事务的日志就是活动日志的一部分,它包含这个事务的开始和这些删除操作。活动日志不能被截断的,因为活动的事务对数据的修改没有最终反映到数据文件上,所以如果此时出现宕机、用户的显示回滚或者其它异常情况,则需要通过日志来对数据修改进行回滚或者重做,因此未提交事务的日志不能被截断。
3、关于虚拟日志
虚拟日志是日志存放的逻辑单位,Sql Server会把ldf日志文件空间逻辑上划分为几个块,每一个块就是一个虚拟日志。我们可以通过DBCC LogInfo命令来查看数据库的虚拟日志的个数和大小。我们可以创建一个新的数据库来查看一下:
在我的虚机的Sql Server 2000下,显示的结果如下:
下面的语句查看我机器上Master数据库的虚拟日志情况:
Use Master
DBCC loginfo
显示结果如下:
新创建的Test数据库有两个虚拟日志,而master数据库一共有9个虚拟日志。虚拟日志的个数不是固定的,ldf日志文件增大时虚拟日志文件的个数会增加,对数据库进行收缩操作时,虚拟日志的个数可能会减少,这里不详细做讨论了。
显示结果表中的FileSize字段就是指的虚拟日志的大小,StartOffset指的是虚拟日志的起始位置相对于ldf日志文件的起始位置的偏移量。注意第一个虚拟日志文件的StartOffset的大小是8192字节,正好是一个页的大小,这个页也就是ldf日志文件的日志信息页,包含了一些诸如ldf日志文件的大小等信息。
这里重点注意一下Status字段的含义:
最后用图来描述一下活动日志和虚拟日志。
下面图中的每个方块代表了一条事务日志,下面描述了两个事务,日志LSN141中记录了Tran1开始启动,并在LSN146中提交,由于事务Tran1已经提交,那么它的日志就不是活动日志了。在图中还有两条叫做“检查点”的日志,这里简单解释一下,每到一个检查点,Sql Server会把内存中的数据页和日志页写入磁盘。
注意看Tran2,LSN142记录了它的启动日志,并在LSN148中Tran2有做一些操作,但是还没有Tran2提交的日志,只要这个事务不提交,它的日志就是活动日志,包含有活动日志的虚拟日志不能被截断。
再看虚拟日志中的情况,如果Tran2启动的日志记录在虚拟日志3中,如果它不提交,那么虚拟日志3以及它以后的所有被使用的虚拟日志都不能被截断。在下图中,即使是虚拟日志4中没有Tran2的日志信息,但是为了保证事务的连续性,在虚拟日志4的空间使用完后,只要Tran2不提交,Sql Server就不会截断虚拟日志4。
4、 日志截断,简单一点的理解就是删除以前的日志,仅仅只是截断日志并不会缩小ldf日志文件的物理空间,因为截断仅仅只是把以前日志所占用的空间标记为可重用。要把日志截断说清楚,要先解释下两个概念——活动日志和虚拟日志:
5、几种恢复模式和备份方式。
数据库有三种恢复模式,简单恢复模式、完全恢复模式,大批量操作恢复模式,我们在创建数据时默认使用的就是完全恢复模式。这里简单说下几个恢复模式的区别,重点要说的完全恢复模式,因为这个最常用也最适用于大部分情况。
这里再对完整恢复模式做一下补充。一般情况,在完整恢复下Sql Server 不会去自动截断日志,如果日志空间满了并且有指定了日志文件自动增长,那么日志文件会自动增大。但是如果在数据库创建后没有做过任何的完整备份,那么在日志空间满了后,Sql Server 会截断日志来重新利用日志空间,而不会增长日志文件。并且如果自数据库创建以来没有做过任何的完全备份,如果直接备份事务日志的话还是会对日志进行截断,但是备份出来的日志备份文件不含有任何日志信息,即使此时ldf文件的确是有日志信息的。之所以这样,估计是因为没有一个完全备份,所以即使是备份了日志也没有任何用途可言,因为没有完全备份的话仅有日志备份也无法恢复数据。
我做了一下试验,创建一个新的数据库,向里面逐渐插入数据,然后查看数据库日志空间和虚拟日志的变化。可以用DBCC SqlPerf('LogSpace')来查看日志文件空间的使用情况,用DBCC LogInfo来查看虚拟日志的情况,DBCC LogInfo需要在当前数据库下使用。
下面是用上面的脚本向TestTable表里面分别插入100条~10000后,日志空间和虚拟日志的变化情况。
▲ 刚创建好数据和表的时候,日志文件的初始状态如下,日志大小为0.48437M,空间利用率为41%左右(这里说明一下,为什么刚创建日志空间就有41%已经被用掉了,因为Sql Server 会保留200K~300K的预留空间,这部分空间一直都会被标记为已经被使用的状态,如果对这部分预留空间有兴趣的可以参考下这篇)。
有两个虚拟日志文件,一个status为2,说明正在使用中。一个FSeqNo为0,更本就还没有使用过,是一个还没有使用过的虚拟日志。
▲ 接下来用前面的脚本插入100条记录,此时由于数据量不大,FSeqNo为5的虚拟日志文件还有空间,所以第二个虚拟日志文件仍然是空闲,此时很明显日志空间的利用率开始有所增加,达到了52%左右。
▲ 接下来再插入200条,此时总记录数为300了。日志的使用率已经很高了,为81%左右,也就是已经使用了大概0.39M。这里强调一下:在完全恢复模式下,如果没有进行过完整备份并且数据库的日志空间使用率高于70%,那么Sql Server只要要可能就会进行日志截断。
但是这里的情况很特殊,因为虽然日志空间的使用率已经高于了70%,Sql Server确无法进行日志截断来让日志的使用率降低,因为现在只有两个虚拟日志文件,一个正在使用,一个还没被使用。必须有一个虚拟日志的状态为使用中,所以当前被使用的虚拟日志是不能被截断的,而另一个虚拟日志文件本身就是可用的。导致这个情况的主要原因就是Sql Server 保留的200K~300K预留空间,这个空间在虚拟日志中无法体现出来,但是在Sql Server在计算日志空间的使用率的时候确算上了这一部分的空间。如果继续写入日志,日志的使用率继续增加,而又无法截断虚拟日志来让空间使用率降低,这个时候Sql Server就不得不增加日志文件的大小了。
▲ 继续插入100条,总记录数为400。正入上面所说的,Sql Server 不得不增加ldf日志文件的物理空间了。这个时候日志已经增大为0.7421875,使用率为62.63158%,使用的空间大小为0.464844。
这里的情况是非常特殊的,如果我们在创建数据库时把日志文件的大小指定大一些,例如5M,这样Sql Server所预留的这部分空间所占比例就小了,这样Sql Server会先使用第一个虚拟日志文件,第一个使用完之后再使用第二个,同时截断第一个虚拟日志让第一个虚拟日志的空间可以重新被利用,不会受到这部分预留空间的影响导致需要增大ldf日志文件的物理大小。
最后的的那个虚拟日志就是新增加的空间,它当前就正在使用中,状态Status理所当然为2。
注意看此时的状态,由于日志空间的利用率低于70%,此时Sql Server还不会去截断日志。所以虽然第一个虚拟日志(StartOffset为8192的那个)的空间已经满了,但是他的Status还是为2。直到日志空间的利用率高于70%,Sql Server才会对它进行截断,它的Status会变为0。
▲ 这里继续插入100条记录,总记录数为500条。注意观察,有上面400条记录的时候,日志空间使用率已经达到62%左右,如果再插入100条的话日志空间的使用率就会超过70%,所以Sql Server就会对日志进行截断,并重新计算日志空间的使用率。对日志进行截断后,第一个虚拟日志状态变为0,被认为可以重新利用,因此日志空间的使用率就又降低为了46.97%。
▲ 再插入500条,总记录数为1000。注意,虽然一下子插入了这么多记录,但是日志空间的大小没有任何变化,因为每当日志空间使用率超过70%的时候Sql Server都会截断虚拟日志来重新利用日志空间。另外可以看到FSeqNo的变化,每次当一个虚拟日志重新被使用(包括第一次被使用的情况),他的FSeqNo变为当前最大FSeqNo加上1。
▲ 再插入2000条,总记录数为3000。可以看到日志空间仍然没有变化,但是FSeqNo在逐渐增加,因为每次一个虚拟日志重新被使用,它的FSeqNo都会在当前最大FSeqNo的基础上加1,所以FSeqNo会不断增长。
▲ 再插入2000条,总记录数为5000。和上面一样,日志空间没有任何变化,FSeqNo会有一些增加。
▲ 这里我们做一件事情,因为从我们创建数据库以来一直都没有对数据库做过任何的完整备份。可以看到在日志文件增大为0.74MB后日志文件就不再增大,一直都是在循环使用三个虚拟日志空间。这里我们来对数据库做一次完整备份,然后再插入3000条。
在做过一次完整备份后,Sql Server就会认为你以后会进行相应的日志备份来进行数据恢复,因此它就不会对日志进行截断,它会一直保留这些日志(除非你显示的告诉Sql Server去截断日志,例如备份日志之类的操作),当日志文件快用完时,Sql Server会增加日志文件的大小,当然虚拟日志的个数也就会随之增加。
下面是在对数据库做了一次完整备份后,再插入3000条记录后的结果。日志文件大小显著增加,虚拟日志文件的个数自然也增加了。因为Sql Server不会主动去截断日志,所以会发现绝大多数的虚拟日志的Status都是2,不能被重新使用。
▲ 接着再插入2000条,总共 10000条记录。可以看到和上面类似,日志文件在继续增大。虚拟日志文件的个数也在增加。
▲ 现在我们备份一下日志,因为默认的日志备份选项是会截断日志的,我们可以看到,在备份日志后,日志文件的大小没有任何变化。但是由于截断,当前使用的虚拟日志也就是FSeqNo为26的那个虚拟日志之前并且空间已经用完的虚拟日志都被截断,它们的状态Status都由2变为0,如下图:
4、总结