中科院架构师,专注企业数字化各个方面,MES/ERP/CRM/OA、物联网、传感器、大数据、ML、AI、云计算openstack、Linux、SpringCloud。
分类: 架构设计与优化
2014-06-13 20:45:26
做项目时由于业务逻辑的需要,必须对数据表的一行或多行加入行锁,举个最简单的例子,图书借阅系统。假设id=1的这本书库存为1,但是有2个人同时来借这本书,此处的逻辑为
SELECT restnum FROM book WHERE id =1 ; --如果restnum大于0,执行update UPDATE book SET restnum=restnum-1 WHERE id=1; |
问题就来了,当2个人同时来借的时候,有可能第一个人执行select语句的时候,第二个人插了进来,在第一个人没来得及更新book表的时候,第二个人查到数据了,其实是脏数据,因为第一个人会把restnum值减1,因此第二个人本来应该是查到id=1的书restnum为0了,因此不会执行update,而会告诉它id=1的书没有库存 了,可是数据库哪懂这些,数据库只负责执行一条条SQL语句,它才不管中间有没有其他sql语句插进来,它也不知道要把一个session的sql语句执行完再执行另一个session的。因此会导致并发的时候restnum最后的结果为-1,显然这是不合理的,所以,才出现锁的概念,Mysql使用innodb引擎可以通过索引对数据行加锁。以上借书的语句变为:
BEGIN; SELECT restnum FROM book WHERE id =1 FOR UPDATE ; -- 给id=1的行加上排它锁且id有索引 UPDATE book SET restnum=restnum-1 WHERE ; Commit; |
这样,第二个人执行到select语句的时候就会处于等待状态直到第一个人执行commit。从而保证了第二个人不会读到第一个人修改前的数据。 那这样是不是万无一失了呢,答案是否定的。看下面的例子。
跟我一步一步来,先建立表
CREATE TABLE 'book' ( 'id' INT(11) NOT NULL AUTO_INCREMENT, 'num' INT(11) DEFAULT NULL, 'name' VARCHAR(0) DEFAULT NULL, PRIMARY KEY ('id'), KEY 'asd' ('num') ) ENGINE=InnoDB DEFAULT CHARSET=gbk |
其中num字段加了索引
然后插入数据,运行,
INSERT INTO book(num) VALUES(11),(11),(11),(11),(11); INSERT INTO book(num) VALUES(22),(22),(22),(22),(22); |
然后打开2个mysql控制台窗口,其实就是建立2个session做并发操作
━━━━━━━━━━━━━━━━
在第一个session里运行:
BEGIN; SELECT * FROM book WHERE num=11 FOR UPDATE; |
出现结果:
| id | num | name| | 11 | 11 | NULL | | 12 | 11 | NULL | | 13 | 11 | NULL | | 14 | 11 | NULL | | 15 | 11 | NULL | 5 rows in set |
然后在第二个session里运行:
BEGIN; SELECT * FROM book WHERE num=22 FOR UPDATE; |
出现结果:
| id| num | name | | 16 | 22 | NULL | | 17 | 22 | NULL | | 18 | 22 | NULL | | 19 | 22 | NULL | | 20 | 22 | NULL | 5 rows in set |
好了,到这里什么问题都没有,是吧,可是接下来问题就来了,大家请看: 回到第一个session,运行:
UPDATE book SET name='abc' WHERE num=11; |
━━━━━━━━━━━━━━━━
问题来了,session竟然处于等待状态,可是num=11的行不是被第一个session自己锁住的么,为什么不能更新呢?好了,打这里大家也许有自己的答案,先别急,再请看一下操作。
把2个session都关闭,然后运行:
DELETE FROM book WHERE num=11 LIMIT 3; DELETE FROM book WHERE num=22 LIMIT 3; |
其实就是把num=11和22的记录各删去3行, 然后重复“━━━━━━━━”之间的操作 竟然发现,运行update book set name=’abc’ where num=11;后,有结果出现了,说明没有被锁住, 这是为什么呢,难道2行数据和5行数据,对MySQL来说,会产生锁行和锁表两种情况吗。经过跟网友讨论和翻阅资料,仔细分析后发现: 在以上实验数据作为测试数据的情况下,由于num字段重复率太高,只有2个值,分别是11和12.而数据量相对于这两个值来说却是比较大的,是10条,5倍的关系。 那么mysql在解释sql的时候,会忽略索引,因为它的优化器发现:即使使用了索引,还是要做全表扫描,故而放弃了索引,也就没有使用行锁,却使用了表锁。简单的讲,就是MYSQL无视了你的索引,它觉得与其行锁,还不如直接表锁,毕竟它觉得表锁所花的代价比行锁来的小。以上问题即便你使用了force index强制索引,结果还是一样,永远都是表锁。 所以mysql 的行锁用起来并不是那么随心所欲的,必须要考虑索引。再看下面的例子。
SELECT id FROM items WHERE id IN (SELECT id FROM items WHERE id < 6) FOR UPDATE; --id字段加了索引 SELECT id FROM items WHERE id IN (1,2,3,4,5) FOR UPDATE; |
大部分会认为结果一样没什么区别,其实差别大了,区别就是第一条sql语句会产生表锁,而第二个sql语句是行锁,为什么呢?因为第一个sql语句用了子查询外围查询故而没使用索引,导致表锁。
好了,回到借书的例子,由于id是唯一的,所以没什么问题,但是如果有些表出现了索引有重复值,并且mysql会强制使用表锁的情况,那怎么办呢?一般来说只有重新设计表结构和用新的SQL语句实现业务逻辑,但是其实上面借书的例子还有一种办法。请看下面代码:
SET sql_mode= 'STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION'; BEGIN; SELECT restnum FROM book WHERE id =1 ; --取消排它锁, 设置restnum为unsigned UPDATE book SET restnum=restnum-1 WHERE ; IF(UPDATE执行成功) commit; ELSE ROLLBACK; |
上面是个小技巧,通过把数据库模式临时设置为严格模式,当restnum被更新为-1的时候,由于restnum是unsigned类型的,因此update会执行失败,无论第二个session做了什么数据库操作,都会被回滚,从而确保了数据的正确性,这个目的只是为了防止并发的时候极小概率出现的2个session的sql语句嵌套执行导致数据脏读。当然最好的办法还是修改表结构和sql语句,让MYSQL通过索引来加行锁。