线程安全性的概念

　　概述

　　当对一个复杂对象进行某种操作时，从操作开始到操作结束，被操作的对象往往会经历若干非法的中间状态。这跟外科医生做手术有点象，尽管手术的目的是改善患者的健康，但医生把手术过程分成了几个步骤，每个步骤如果不是完全结束的话，都会严重损害患者的健康。想想看，如果一个医生切开患者的胸腔后要休三周假会怎么样？与此类似，调用一个函数（假设该函数是正确的）操作某对象常常会使该对象暂时陷入不可用的状态（通常称为不稳定状态），等到操作完全结束，该对象才会重新回到完全可用的状态。如果其他线程企图访问一个处于不可用状态的对象，该对象将不能正确响应从而产生无法预料的结果，如何避免这种情况发生是线程安全性的核心问题。单线程的程序中是不存在这种问题的，因为在一个线程更新某对象的时候不会有其他线程也去操作同一个对象。（除非其中有异常，异常是可能导致上述问题的。当一个正在更新某对象的线程因异常而中断更新过程后，再去访问没有完全更新的对象，会出现同样的问题）

　　线程安全性的级别

　　就线程安全性进行讨论的时候存在这样一个问题：线程的安全性是存在多种级别的，每个人谈论的级别其实并不相同，仅仅说某段代码不具备线程安全性并不能说明全部问题。然而许多人对线程的安全性有一些想当然的预期，有些时候这些预期是合理而合法的，但有些时候不是。下面给出一些此类的预期：

　　通常认为多个线程读某对象时不会产生问题，问题只会在更新对象的时候出现，因为只有那时对象才会被修改，从而有进入不稳定状态的危险。然而，某些对象具有内部状态，即使在读的时候内部状态也会被改变（比如某些对象有内部缓冲）。假如两个线程去读取这种对象，问题仍然会产生，除非该对象的读操作设计已经采用了合适的多线程处理方法。

　　通常认为更新两个相互独立的对象时，即使它们的类型相同也不会有问题。一般假设相互独立的对象之间是互不相关的，一个对象的不稳定状态并不会对另一个对象产生影响。然而，一些对象在内部是存在数据共享的（如静态的类数据，全局数据等），这使它们即使看上去没有什么逻辑上的关系，内部却依然存在联系。这种情况下，修改两个“相互独立”的对象怎么都会产生问题。考虑下面的情况：

　　void f( ) { std::string x; // Modify x. }

　　void g( ) { std::string y; // Modify y. }

　　如果一个线程运行函数f()修改x，另一个线程运行函数g()修改y，这种情况下会出现问题吗？大部分人认为这是两个明显独立的对象，可以被同时改动而不会导致任何问题。但是，有一种可能性就是，两个对象内部存在共享数据，这完全依赖于std::string的实现，如果那样的话，同时改动便是有问题的了。实际上，如果两个对象内部存在共享数据的话，即使一个函数仅仅是读取对象，问题依然存在，因为改动另一个对象的函数可能触及内部的共享数据。

　　通常认为即便使用一个通用的资源池，获取资源的函数也不存在线程安全性的问题。例如：

　　void f() { char *p = new char[512]; // use the array p }

　　void g() { char *p = new char[512]; // use the array p }

　　如果一个线程执行函数f()，另一个线程执行函数g()，两个线程可能同时使用操作符new去分配内存。在多线程环境中，只有假设new操作符的实现已经考虑到这种情况，从同一个内存池中获取内存也设计了正确的处理方法，才可以认为安全性得到保证。实际中，new操作符在内部确实会同步这些线程，因而每次调用都能够得到独立的内存分配而不损坏共享的内存池。与此类似的操作还有文件的打开、网络连接的发起以及其他资源的分配。

　　人们一般认为会引起问题的情形是一个线程要访问（读或更新）某对象时另一个线程正在更新它。全局对象尤其易于出现这种问题，局部对象出现问题的情况则少的多。比如：

　　std::string x;

　　void f() { std::string y; // modify x and y. }

　　如果两个线程同时进入函数f()，它们拿到的对象y是不相同的，这是由于不同的线程拥有各自不同的栈，局部变量都在线程自己的栈上分配，因而每个线程都会拿到自己独立的局部变量副本。所以说，在f()中对y进行操作不会产生问题（假定操作独立的对象有安全保证），然而，全局对象x仅有一份两个线程都会触及的拷贝，对x的如上操作便会产生问题。局部变量也不是完全不会产生问题，因为每个函数都能够启动新的线程并且把局部变量的指针作为该线程的一个输入参数，比如：

　　void f ( ) { std : : string x ; startthread (somefunction , &x); startthread (somefunction , &x); }

　　这里假设有一个名为startthread的库函数，它有两个参数，一个是线程入口函数的指针，一个是线程入口函数的参数的指针。在此情况下我们调用startthread启动两个线程，并且把x对象作为参数同时传给两个线程。如果somefunction()中会对x进行修改，则两个线程可能修改同一个对象，类似的问题便产生了。注意，这种情况是特别隐蔽的，因为somefunction()并没有什么特别的理由去考虑两次调用会传给它同一个对象，因而它不大可能做出应付这种情况的保护措施。

　　一般准则

　　如果一个函数在其文档中没有特别注明具备线程安全性，则应该认为它不具备。许多库大量使用了内部的静态数据，除非它是为多线程应用所设计，否则要牢记其内部数据可能没有利用互斥量进行适当的保护。类似，如果类的成员函数在其文档中没有特别注明对于多线程应用是安全的话，则认为它不安全。两个线程去操作相同的对象会引起问题，这是显而易见的，然而，即使两个线程去操作不同的物体依然会引起问题。出于多种原因，许多类使用了内部静态数据或者在多个看上去明显不同的对象间共享实现细则，

　　以下给出几个一般准则：

　　操作系统提供的API具备线程安全性

　　POSIX线程标准要求C标准库中的大多数函数具备线程安全性，少数例外会在C标准中注明。

　　对于Windows提供的C标准库，如果所使用的版本没有问题，而且进行了正确的初始化，他们都是安全的。

　　C++标准库的线程安全性不是很明确，它在很大程度上依赖于使用的编译器。标准模板库线程安全性的SGI准则作为实际中的标准取得很大进展，但并不是统一的标准。

阅读(1044) | 评论(1) | 转发(0) |

上一篇：Windows下重叠I/O模型

下一篇：DIP 依赖倒置原则

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6