2011年(18)
分类: C/C++
2011-05-11 14:33:48
C++0x是目前计划中的的新标准。它将取代现行的C++标准ISO/IEC 14882,公开于1998年并于2003年更新,通称C++98以及C++03。新的标准将会包含的新机能,而且会扩展,并入了大部分的程序库(数学的特殊函数可能除外)。因为此项标准尚未完成,记载于此条目的可能并不是C++0x最新的情况。最新的消息被公开在。国际标准草案()于2010年8月公开,2010年11月对该草案进行了修订()。
/ JTC1/SC22/WG21 C++ 标准委员会目前的计划是在2010年8月之前完成对最终委员会草案的投票,以及于2011年3月召开的标准会议完成国际标准的最终草案。然而,WG21 预期 将要花费六个月到一年的时间才能正式发布新的 C++ 标准。因此最快在2011年年底,我们才能见到新的 C++ 标准。为了能够如期完成,委员会决定致力于直至2006年为止的提案,忽略新的提案。
像C++这样的,通过一种演化的的过程来发展其定义。这个过程不可避免地将引发与现有代码的兼容问题,在C++的发展过程中偶尔会发生。不过根据(C++的创始人并且是委员会的一员)表示,新的标准将几乎100%兼容于现有标准。
目录
[]
|
C++的修订将包含核心语言以及标准程序库。
在发展新标准的每个机能上,委员会采取了几个方向:
C++委员会的主要焦点是在语言核心的发展上。因此C++0x的发表日期取决于这部份标准的作业进度。
核心语言的领域将被大幅改善,包括支持、 、统一的初始化,以及表现的加强。
在此分成4个区块来讨论核心语言的特色以及变更: 运行期表现强化、建构期表现强化、可用性强化,还有崭新的机能。某些特色可能会同时属于多个区块,但在此仅于其最具代表性的区块描述该特色。
[] 核心语言的运行期表现强化以下的语言机能主要用来提升某些性能表现,像是存储器或是速度上的表现。
[] 右值引用与move语义在标准C++,暂时性变量(称为右值"R-values",位于赋值操作符之右)可以传递给函数,但他们只能以像const &的类型接进来。如此一来,函数就无法判别真正的右值或是以 const &形式传进来的正规对象。 此外,因为是const &的形式,所以无法更改对象的内容。
C++0x将增加一个新的引用(reference)类型称作右值引用(R-value reference),标记为typename &&。他们能够以非常数(non-const)值的方式传入,允许对象去改动他们。这项修正允许特定对象创造出move语义。
举例而言,std::vector是内部保存了C-style数组的包装,如果一个暂时的vector被创建或是从函数传回,要将其存储只能通过生成新的vector并且把所有的右值数据复制进去。然后暂时的vector被摧毁,删除它保有的数据。
通过右值引用的话,一个std::vector的"move建构式"使用对某个vector的右值引用可以单纯地从右值复制其内部C-style数组的指针到新的vector,然后留下空的右值。这个操作不需要数组的复制,而且空的暂时对象的解构也不会摧毁存储器。传回vector暂时对象的函数只需要传回std::vector<>&&。如果vector没有move建构式,那么复制建构式将被唤起,以const std::vector<> &的正常形式。 如果它确实有move建构式,那么就会唤起move建构式,这能够免除大幅的存储器配置。
基于安全的理由,具名的变量将永远不被认定为右值,即使它是被如此声明的;为了获得右值必须使用程序库函数std::move()。
由于右值引用的用语特性以及对于左值引用(L-value references;regular references)的某些用语修正,右值引用允许开发者提供完全的函数转调用。当与结合,这项能力允许函数模板能够完美地转送引数给其他接受这些特定引数的函数。最大的用处在于转送建构式参数,创造出能够自动为这些特定引数调用正确建构式的工厂函数(factory function)。
[] 泛化的常数表示式C++ 本来就已具备常数表示式(constant expression)的概念。像是 3+4 总是会产生相同的结果并且没有任何的副作用。常数表示式对编译器来说是优化的机会,编译器时常在编译期运行它们并且将值存入程序中。同样地,在许多场合 下,C++ 规格要求使用常数表示式。例如在数组大小的定义上,以及枚举值(enumerator values)都要求必须是常数表示式。
然而,常数表示式总是在遇上了函数调用或是对象建构式时就终结。所以像是以下的例子是不合法的:
这不是合法的 C++,因为 GetFive() + 5 并不是常数表示式。编译器无从得知 GetFive 实际上在运行期是常数。理论上而言,这个函数可能会影响全局变量,或者调用其他的非运行期(non-runtime)常数函数等。
C++0x 将会引进关键字 constexpr 允许用户保证函数或是对象建构式是编译期常数。以上的例子可以被写成像是下面这样:
这使得编译器能够了解并去验证 GetFive 是个编译期常数。
对函数使用 constexpr 在函数可以做的事上面加上了非常严格的条件。首先,该函数的回返值类型不能为 void。第二点,函数的内容必须依照 "return expr" 的形式。第三点,在引数取代后,expr 必须是个常数表示式。这些常数表示式只能够调用其他被定义为 constexpr 的函数,或是其他常数表示式的数据变量。 最后一点,有着这样标签的函数直到在该编译单元内被定义之前是不能够被调用的。
变量也可以被定义为常数表示式值:
常数表示式的数据变量是隐式的常数。他们可以只存储常数表示式或常数表示式建构式的结果。
为了从用户自定类型(user-defined type)建构常数表示式的数据变量,建构式也可以被声明成 constexpr。与常数表示式函数一样,常数表示式的建构式必须在该编译单元内使用之前被定义。他必须有着空的函数本体。它必须用常数表示式初始化他的成员(member)。而这种类型的解构式应当是无意义的(trivial),什么事都不做。
复制 constexpr 建构起来的类型也应该被定义为 constexpr,这样可以让他们从常数表示式的函数以值传回。类的任何成员函数,像是复制建构式、重载的操作符等等,只要他们符合常数表示式函数的定义,都可以被声明成 constexpr。这使得编译器能够在编译期进行类的复制、对他们施行运算等等。
常数表示式函数或建构式,可以以非常数表示式(non-constexpr)参数唤起。就如同 constexpr 整数字面值能够指派给 non-constexpr 变量,constexpr 函数也可以接受 non-constexpr 参数,其结果存储于 non-constexpr 变量。constexpr 关键字只有当表示式的成员都是 constexpr,才允许编译期常数性的可能。
[] 对POD定义的修正在标准C++,一个结构(struct)为了能够被当成 (POD),必须遵守几条规则。有很好的理由使我们想让大量的类型符合这种定义,符合这种定义的类型能够允许产生与C兼容的对象布局(object layout)。然而,C++03的规则太严苛了。
C++0x将会放宽关于POD的定义。
当class/struct是极简的(trivial)、属于标准布局(standard-layout),以及他的所有非静态(non-static)成员都是POD时,会被视为POD。
一个极简的类或结构符合以下定义:
一个标准布局(standard-layout)的类或结构符合以下定义:
在标准C++中,只要在编译单元内遇到被完整定义的模板,编译器都必须将其实例化(instantiate)。这会大大增加编译时间,特别是模板在许多编译单元内使用相同的参数实例化。看起来没有办法告诉C++不要引发模板的实例化。
C++0x将会引入外部模板这一概念。C++已经有了强制编译器在特定位置开始实例化的语法:
而C++所缺乏的是阻止编译器在某个编译单元内实例化模板的能力。C++0x将简单地扩充前文语法如下:
这样就告诉编译器不要在该编译单元内将该模板实例化。
[] 核心语言使用性的加强这些特色存在的主要目的是为了使C++能够更容易使用。 举凡可以增进类型安全,减少代码重复,不易误用代码之类的。
[] 初始化列表标准C++从C带来了初始化列表(initializer list)的概念。这个构想是结构或是数组能够依据成员在该结构内定义的顺序通过给予的一串引数来产生。这些初始化列表是递归的,所以结构的数组或是包含 其他结构的结构可以使用它们。这对静态列表或是仅是把结构初始化为某值而言相当有用。C++有构造函数,能够重复对象的初始化。但单单只有那样并不足以取 代这项特色的所有机能。除了这些对象必须遵守POD的定义的限制条件,标准C++允许在结构或类上使用这项机能;非POD的类型不能使用,就连相当有用的 C++-style容器像是std::vector也不行。
C++0x将会把初始化列表的概念绑到类型上,称作std::initializer_list。这允许构造函数或其他函数像参数般地使用初始化列表。举例来说:
这将允许SequenceClass由一连串的整数构造,就像:
这个构造函数是种特殊的构造函数,称作初始化列表构造函数。有着这种构造函数的类在统一初始化的时候会被特别对待。
类std::initializer_list<>是个第一级的C++0x标准程序库类型。然而他们只能够经由C++0x编译器通过{}语法的使用被静态地构造 。这个列表一经构造便可复制,虽然这只是copy-by-reference。初始化列表是常数;一旦被创建,其成员均不能被改变,成员中的数据也不能够被变动。
因为初始化列表是真实类型,除了类构造式之外还能够被用在其他地方。正规的函数能够使用初始化列表作为引数。例如:
标准容器也能够以这种方式初始化:
标准 C++ 在初始化类型方面有着许多问题。初始化类型有数种方法,而且交换使用时不会都产生相同结果。传统的建构式语法,看起来像是函数声明,而且为了能使编译器不会弄错必须采取一些步骤。只有集合体和 POD 类型能够被集合式的初始化(使用 SomeType var = {/*stuff*/};).
C++0x 将会提供一种统一的语法初始化任意的对象,它扩充了初始化串行语法:
var1 的初始化的运作就如同 C-style 的初始化串行。每个公开的变量将被对应于初始化串行的值给初始化。隐式类型转换会在需要的时候被使用,这里的隐式类型转换不会产生范围缩限 (narrowing)。要是不能够转换,编译便会失败。(范围缩限 (narrowing):转换后的类型无法表示原类型。如将 32-bit 的整数转换为 16-bit 或 8-bit 整数,或是浮点数转换为整数。) var2 的初始化则是简单地调用建构式。
统一的初始化建构能够免除具体指定特定类型的必要:
该语法将会使用 const char * 参数初始化 std::string 。你也可以做像下面的事:
统一初始化不会取代建构式语法。仍然会有需要用到建构式语法的时候。如果一个类拥有初始化串行建构式(TypeName(initializer_list
这将会调用初始化串行建构式,而不是调用std::vector只接受一个尺寸参数产生相应尺寸 vector 的建构式。要使用这个建构式,用户必须直接使用标准的建构式语法。
[] 类型推导在标准 C++(和 C ),使用变量必须明确的指出其类型。然而,随着模版类型的出现以及的技巧,某物的类型,特别是函数定义明确的回返类型,就不容易表示。在这样的情况下,将中间结果存储于变量是件困难的事,可能会需要知道特定的超编程程序库的内部情况。
C++0x 提供两种方法缓解上述所遇到的困难。首先,有被明确初始化的变量可以使用 auto 关键字。这会依据该初始化子(initializer)的具体类型产生变量:
someStrangeCallableType 的类型就是模板函数 boost::bind 对特定引数所回返的类型。作为编译器语义分析责任的一部份,这个类型能够简单地被编译器决定,但用户要通过查看来判断类型就不是那么容易的一件事了。
otherVariable 的类型同样也是定义明确的,但用户很容易就能判别。它是个 int(整数),就和整数字面值的类型一样。
除此之外,decltype 能够被用来在编译期决定一个表示式的类型。举例:
decltype 和 auto 一起使用会更为有用,因为 auto 变量的类型只有编译器知道。然而 decltype 对于那些大量运用操作符重载和特化的类型的代码的表示也非常有用。
auto 对于减少冗赘的代码也很有用。举例而言,程序员不用写像下面这样:
而可以用更简短的
这项差异随着程序员开始嵌套容器而更为显著,虽然在这种情况下 typedef 是一个减少代码的好方法。
decltype 所表示的类型可以和 auto 推导出来的不同。
Boost C++ 定义了许多"范围 (range) "的概念。范围表现有如受控制的串行 (list),持有容器中的两点。有序容器是范围概念的超集 (superset),有序容器中的两个 (iterator) 也能定义一个范围。这些概念以及操作的算法,将被并入 C++0x 标准程序库。不过 C++0x 将会以语言层次的支持来提供范围概念的效用。
for 述句将允许简单的范围迭代:
上面 for 述句的第一部份定义被用来做范围迭代的变量,就像被声明在一般 for 循环的变量一样,其作用域仅只于循环的范围。而在":"之后的第二区块,代表将被迭代的范围。这样一来,就有了能够允许 C-style 数组被转换成范围概念的概念图。这可以是 std::vector,或是其他符合范围概念的对象。
函数声明语法对于C语言已经足够。 当演化自 C 的 C++ 变的更为复杂,除了 C 的基础语法外,在必要时必须加以扩充。 考虑到 template function 的声明,旧式 C 语言的函数声明语法曝露出许多限制。 下面的示例,不是合法的 C++03:
Ret 的类型由 LHS与RHS的和来决定。 即使使用 C++0x 新加入的 decltype 来声明 AddingFunc 的返回类型,依然不可行。
不合法的原因在于lhs 及 rhs 在定义前就出现了。 直到剖析器解析到函数原型的后半部,lhs 与 rhs 才是有意义的。
针对此问题,C++0x 引进一种新的函数定义与声明的语法:
这种语法也能套用到一般的函数定义与声明:
在标准 C++,特别是当使用 C++ 标准程序库算法函数诸如 sort 和 find,用户经常希望能够 在算法函数调用的附近定义一个临时的述部函数(又称谓词函数,predicate function)。由于语言本身允许在函数内部定义类,可以考虑使用函数对象,然而这通常既麻烦又冗赘,也阻碍了代码的流程。此外,标准 C++ 不允许定义于函数内部的类被用于模板,所以前述的作法是不可行的。
C++0x 对 的支持可以解决上述问题。
一个 lambda 函数可以用如下的方式定义:
这个不具名函数的回返类型是 decltype(x+y)。只有在 lambda 函数符合"return expression"的形式下,它的回返类型才能被忽略。在前述的情况下,lambda 函数仅能为一个述句。
在一个更为复杂的例子中,回返类型可以被明确的指定如下:
本例中,一个暂时的变量 z 被创建用来存储中间结果。如同一般的函数,z 的值不会保留到下一次该不具名函数再次被调用时。
如果 lambda 函数没有传回值(例如 void ),其回返类型可被完全忽略。 定义在与 lambda 函数相同作用域的变量参考也可以被使用。这种的变量集合一般被称作 closure ()。
closure 被定义与使用如下:
上例可计算 someList 元素的总和并将其印出。 变量 total 是 lambda 函数 closure 的一部分,同时它以引用方式被传递入谓词函数, 因此它的值可被 lambda 函数改变。
若不使用引用的符号&,则代表变量以传值的方式传入 lambda 函数。 让用户可以用这种表示法明确区分变量传递的方法:传值,或是传参考。 由于 lambda 函数可以不在被声明的地方就地使用(如置入 std::function 对象中); 这种情况下,若变量是以传参考的方式连结到 closure 中,是无意义甚至是危险的行为。
若 lambda 函数只在定义的作用域使用, 则可以用 [&] 声明 lambda 函数, 代表所有引用到 stack 中的变量,都是以参考的方式传入, 不必一一显式指明:
变量传入 lambda 函数的方式可能随实做有所变化,一般期望的方法是 lambda 函数能保留其作用域函数的 stack 指针,借此访问区域变量。
若使用 [=] 而非 [&],则代表所有的参考的变量都是传值使用。
对于不同的变量,传值或传参考可以混和使用。 比方说,用户可以让所有的变量都以传参考的方式使用,但带有一个传值使用的变量:
total 是传参考的方式传入 lambda 函数,而 value 则是传值。
若一个 lambda 函数被定义于某类的成员函数中,会被当作该类的 friend。像这样的 lambda 函数可以使用该类对象的参考,并且能够访问其内部的成员。
这只有当该 lambda 函数创建的作用域是在 SomeType 的成员函数内部时才能运作。
在成员函数中指涉对象的 this 指针,必须要显式的传入 lambda 函数, 否则成员函数中的 lambda 函数无法使用任何该对象的变量或函数。
若是 lambda 函数使用 [&] 或是 [=] 的形式,this在 lambda 函数即为可见。
lambda 函数是编译器从属类型的函数对象; 这种类型名称只有编译器自己能够使用。如果用户希望将 lambda 函数作为参数传入,该类型必须是模版类型,或是必须创建一个 std::function 去获取 lambda 的值。使用 auto 关键字让我们能够存储 lambda 函数:
但是,如果 lambda 函数是以参考的方式获取到它所有的 closure 变量,或者是没有 closure 变量,那么所产生的函数对象会被给予一个特殊的类型: std::reference_closure
在标准C++中,建构式不能调用其它的建构式;每个建构式必须自己初始化所有的成员或是调用一个共用的成员函数。基类的建构式不能够直接作为派生类 的建构式;就算基类的建构式已经足够,每个衍伸的类仍必须实做自己的建构式。类中non-constant的数据成员不能够在声明的地方被初始化,它们只 能在建构式中被初始化。 C++0x将会提供这些问题的解决方案。
C++0x允许建构式调用其他建构式,这种做法称作委托或转接()。 仅仅只需要加入少量的代码,就能让数个建构式之间达成功能复用(reuse)。 以及都有提供这种功能。C++0x 语法如下:
C++03中,建构式运行退出代表对象建构完成; 而允许使用转接建构式的 C++0x 则是以"任何"一个建构式退出代表建构完成。 使用转接的建构式,函数本体中的代码将于被转接的建构式完成后继续运行(如上例的 PostInit())。 若基底类使用了转接建构式,则派生类的建构式会在"所有"基底类的建构式都完成后, 才会开始运行。
C++0x 允许派生类手动继承基底类的建构式, 编译器可以使用基底类的建构式完成派生类的建构。 而将基类的建构式带入派生类的动作, 无法选择性地部分带入, 要不就是继承基类全部的建构式,要不就是一个都不继承(不手动带入)。 此外,若牵涉到多重继承,从多个基底类继承而来的建构式不可以有相同的函数签名(signature)。 而派生类的新加入的建构式也不可以和继承而来的基底建构式有相同的函数签名,因为这相当于重复声明。
语法如下:
此语法等同于 DerivedClass 声明一个DerivedClass(int) 的建构式。 同时也因为 DerivedClass 有了一个继承而来的建构式,所以不会有默认建构式。
另一方面,C++0x可以使用以下的语法完成成员初始化:
若是建构式中没有设置iValue的初始值,则会采用类定义中的成员初始化,令iValue初值为5。在上例中,无参数版本的建构式,iValue便采用默认所定义的值; 而带有一个整数参数的建构式则会以指定的值完成初始化。
成员初始化除了上例中的赋值形式(使用"=")外,也可以采用建构式以及统一形的初始化(uniform initialization,使用"{}")。
[] 显式虚函数重载在 C++ 里,在子类中容易意外的重载虚函数。举例来说:
Derived::some_func 的真实意图为何? 程序员真的试图重载该虚函数,或这只是意外? 这也可能是 base 的维护者在其中加入了一个与 Derived::some_func 同名且拥有相同签名的虚函数。
另一个可能的状况是,当基类中的虚函数的签名被改变,子类中拥有旧签名的函数就不再重载该虚函数。因此,如果程序员忘记修改所有子类,运行期将不会正确调用到该虚函数正确的实现。
C++0x 将加入支持用来防止上述情形产生,并在编译期而非运行期捕获此类错误。为保持向后兼容,此功能将是选择性的。其语法如下:
一个 class/struct 若带有 [[base_check]] 属性,则意谓著任何隐式重载将会导致编译期错误。所有的重载都必须加上 [[override]] 属性。[[hiding]] 意谓著新函数隐藏了基类的函数。
[] 空指针早在 1972 年,C语言诞生的初期,常数 带有常数及空指针的双重身分。 C 使用 preprocessor macro NULL 表示空指针, 让 NULL 及 0 分别代表空指针及常数 0。 NULL 可被定义为 ((void*)0) 或是 0。
C++ 并不采用 C 的规则,不允许将 void* 隐式转换为其他类型的指针。 为了使代码 char* c = NULL; 能通过编译,NULL 只能定义为 0。 这样的决定使得函数重载无法区分代码的语义:
C++ 建议 NULL 应当定义为 0,所以foo(NULL); 将会调用 foo(int), 这并不是程序员想要的行为,也违反了代码的直观性。0 的歧义在此处造成困扰。
C++0x 引入了新的关键字来代表空指针常数:nullptr,将空指针和整数 0 的概念拆开。 nullptr 的类型为nullptr_t,能隐式转换为任何指针或是成员指针的类型,也能和它们进行相等或不等的比较。 而nullptr不能隐式转换为整数,也不能和整数做比较。
为了向下兼容,0 仍可代表空指针常数。
在标准C++中,枚举类型不是类型安全的。枚举类型被视为整数,这使得两种不同的枚举类型之间可以进行比较。C++03 唯一提供的安全机制是一个整数或一个枚举型值不能隐式转换到另一个枚举别型。 此外,枚举所使用整数类型及其大小都由实现方法定义,皆无法明确指定。 最后,枚举的名称全数暴露于一般范围中,因此两个不同的枚举,不可以有相同的枚举名。 (好比 enum Side{ Right, Left }; 和 enum Thing{ Wrong, Right }; 不能一起使用。)
C++0x 引进了一种特别的 "枚举类",可以避免上述的问题。使用 enum class 的语法来声明:
此种枚举为类型安全的。枚举类不能隐式地转换为整数;也无法与整数数值做比较。 (表示式 Enumeration::Val4 == 101 会触发编译期错误)。
枚举类所使用类型必须显式指定。在上面的示例中,使用的是默认类型 int,但也可以指定其他类型:
枚举类的语汇范围(scoping)定义于枚举类的名称范围中。 使用枚举类的枚举名时,必须明确指定其所属范围。 由前述枚举类 Enum2 为例,Enum2::Val1是有意义的表示法, 而单独的 Val1 则否。
此外,C++0x 允许为传统的枚举指定使用类型:
枚举名 Val1 定义于 Enum3 的枚举范围中(Enum3::Val1),但为了兼容性, Val1 仍然可以于一般的范围中单独使用。
在 C++0x 中,枚举类的前置声明 (forward declaration) 也是可行的,只要使用可指定类型的新式枚举即可。 之前的 C++ 无法写出枚举的前置声明,是由于无法确定枚举变量所占的空间大小, C++0x 解决了这个问题:
标准 C++ 的剖析器一律将 ">>" 视为右移操作符。 但在样板定义式中,绝大多数的场合其实都代表两个连续右角括号。 为了避免剖析器误判,撰码时不能把右角括号连着写。
C++0x 变更了剖析器的解读规则;当遇到连续的右角括号时,优先解析右角括号为样板引数的退出符号。 如果解读过程中出现普通括号("(" 与 ")"),这条规则产生变化:
C++ 为了避免用户自定的单引数建构式被当成隐式类型转换子,引入了关键字 explicit 修饰字。 但是,在编译器对对象调用隐式类型转换的部分,则没有任何着墨。 比方说,一个 smart pointer 类具有一个operator bool(), 被定义成若该 smart pointer 保管任何资源或指针,则传回 true,反之传回 false。 遇到这样的代码时:if(smart_ptr_variable),编译器可以借由 operator bool() 隐式转换成布林值, 和测试本地指针的方法一样。 但是这类隐式转换同样也会发生在非预期之处。由于 C++ 的 bool 类型也是算数类型,能隐式换为整数甚至是浮点数。 拿对象转换出的布林值做布林运算以外的数学运算,往往不是程序员想要的。
在 C++0x 中,关键字 explicit 修饰符也能套用到类型转换子上。如同建构式一样,它能避免类型转换子被隐式转换调用。但 C++0x 特别针对布林值转换提出规范,在 if 条件式,循环,逻辑运算等需要布林值的地方,编译器能为符合规范的表示式调用用户自定的布林类型转换子。
[] 模板的别名在进入这个主题之前,各位应该先弄清楚“模板”和“类型”本质上的不同。class template (类模板,是模板)是用来产生 template class (模板类,是类型)。
在标准 C++,typedef 可定义模板类一个新的类型名称,但是不能够使用 typedef 来定义模板的别名。举例来说:
这不能够通过编译。
为了定义模板的别名,C++0x 将会增加以下的语法:
using 也能在 C++0x 中定义一般类型的别名,等同 typedef:
在标准 C++ 中,并非任意的类型都能做为 union 的成员。比方说,带有 non-trivial 构造函数的类型就不能是 union 的成员。在新的标准里,移除了所有对 union 的使用限制,除了其成员仍然不能是引用类型。 这一改变使得 union 更强大,更有用,也易于使用。
以下为 C++0x 中 union 使用的简单样例:
这一改变仅放宽 union 的使用限制,不会影响既有的旧代码。
[] 核心语言能力的提升这些机能提供了C++语言能够做一些事情是以前所不能达成的,或是在以前需要繁琐的写法、要求一些不可移植的程序库。
[] 变长参数模板在 C++0x 之前, 不论是模板类或是模板函数,都只能按其被声明时所指定的样子,接受一组固定数目的模板实参; C++0x 加入新的表示法,允许任意个数、任意类别的模板实参,不必在定义时将实参的个数固定。
模板类 tuple 的对象,能接受不限个数的 typename 作为它的模板形参:
实参的个数也可以是 0,所以 class tuple<> someInstanceName 这样的定义也是可以的。
若不希望产生实参个数为 0 的变长参数模板,则可以采用以下的定义:
变长参数模板也能运用到模板函数上。 传统 C 中的 printf 函数,虽然也能达成不定个数的形参的调用,但其并非类别安全。 以下的样例中,C++0x 除了能定义类别安全的变长参数函数外,还能让类似 printf 的函数能自然地处理非自带类别的对象。 除了在模板实参中能使用...表示不定长模板实参外,函数实参也使用同样的表示法代表不定长实参。
其中,Params 与 parameters 分别代表模板与函数的变长参数集合, 称之为实参包 (parameter pack)。实参包必须要和运算符"..."搭配使用,避免语法上的歧义。
变长参数模板中,变长参数包无法如同一般实参在类或函数中使用; 因此典型的手法是以递归的方法取出可用实参,参看以下的 C++0x printf 样例:
printf 会不断地递归调用自身:函数实参包 args... 在调用时, 会被模板类别匹配分离为 T value和 Args... args。 直到 args... 变为空实参,则会与简单的 printf(const char *s) 形成匹配,退出递归。
另一个例子为计算模板实参的个数,这里使用相似的技巧展开模板实参包 Args...:
虽然没有一个简洁的机制能够对中的值进行迭代,但使用运算符"..."还能在代码各处对实参包施以更复杂的展开操作。举例来说,一个模板类的定义:
BaseClasses... 会被展开成类 ClassName 的基底类; ClassName 的构造函数需要所有基类的左值引用,而每一个基类都是以传入的实参做初始化 (BaseClasses(baseClasses)...)。
在函数模板中,变长参数可以和左值引用搭配,达成形参的完美转送 (perfect forwarding):
实参包 parms 可展开为 TypeToConstruct 构造函数的形参。 表达式std::forward
此外,变长参数的数量可以藉以下的语法得知:
SomeStruct
标准C++提供了两种字符串字面值。第一种,包含有双引号,产生以空字符结尾的const char数组。第二种有着前标L,产生以空字符结尾的const wchar_t数组,其中wchar_t代表宽字符。对于编码的支持尚付阙如。
为了加强C++编译器对Unicode的支持,类别char的定义被修改为其大小至少能够存储的8位编码,并且能够容纳编译器的基本字符集的任何成员。
C++0x 将支持三种Unicode编码方式:,,和。除了上述char定义的变更, C++0x将增加两种新的字符类别:char16_t和char32_t。它们各自被设计用来存储UTF-16 以及UTF-32的字符。
以下展示如何产生使用这些编码的字符串字面值:
第一个字符串的类别是通常的const char[];第二个字符串的类别是const char16_t[];第三个字符串的类别是const char32_t[]。
当创建Unicode字符串字面值时,可以直接在字符串内插入Unicode codepoints。C++0x提供了以下的语法:
在'\u'之后的是16个位的十六进制数值;它不需要'0x'的前标。识别字'\u'代表了一个16位的Unicode codepoint;如果要输入32位的codepoint,使用'\U'和32个位的十六进制数值。只有有效的Unicode codepoints能够被输入。举例而言,codepoints在范围U+D800—U+DFFF之间是被禁止的,它们被保留给UTF-16编码的 surrogate pairs。
有时候避免手动将字符串换码也是很有用的,特别是在使用文件或是一些的字面值的时候。 C++0x将提供raw(未加工的)字符串字面值:
R"[The String Data \ Stuff " ]" R"delimiter[The String Data \ Stuff " ]delimiter"在第一个例子中,任何包含在[ ]括号当中的都是字符串的一部分。其中"和\字符不需要经过跳脱(escaped)。在第二个例子中,"delimiter[开始字符串,只有在遇到]delimiter"才代表退出。其中delimiter可以是任意的字符串,能够允许用户在未加工的字符串字面值中使用]字符。 未加工的字符串字面值能够和宽字面值或是Unicode字面值结合:
标准C++提供了数种字面值。字符"12.5"是能够被编译器解释为数值12.5的double类别字面值。然而,加上"f"的后置,像是"12.5f",则会产生数值为12.5的float类别字面值。在C++规范中字面值的后置是固定的,而且C++代码并不允许创立新的字面后置。
C++1x 开放用户定义新的字面修饰符(literal modifier),利用自定义的修饰符完成由字面值建构对象。
字面值转换可以区分为两个阶段:转换前与转换后 (raw 与 cooked)。 转换前的字面值指特定字符串行,而转换后的字面值则代表另一种类别。 如字面值1234,转换前的字面值代表 '1', '2', '3', '4' 的字符串行; 而转换后,字面值代表整数值1234。 另外,字面值0xA转换前是串行'0', 'x', 'A';转换后代表整数值 10。
[] 多任务存储器模型C++标准委员会计划统一对的支持。
这将涉及两个部分:第一、设计一个可以使多个线程在一个进程中共存的内存模型;第二、为线程之间的交互提供支持。第二部分将由程序库提供支持,更多请看。
在多个线程可能会访问相同内存的情形下,由一个内存模型对它们进行调度是非常有必要的。遵守模型规则的程序是被保证正确运行的,但违反规则的程序会发生不可预料的行为,这些行为依赖于和存储器一致性的问题。
[] thread-local的存储期限在多线程环境下,让各绪程拥有各自的变量是很普遍的。这已经存在于函数的区域变量,但是对于全局和静态变量都还不行。
新的thread_local存储期限(在现行的static、dynamic和automatic之外)被作为下个标准而提出。绪程区域的存储期限会借由存储指定字thread_local来表明。
static对象(生命周期为整个程序的运行期间)的存储期限可以被thread-local给替代。就如同其他使用static存储期的变量,thread-local对象能够以构造函数初始化并以解构式摧毁。
[] 使用或禁用对象的默认函数在传统C++中,若用户没有提供, 则编译器会自动为对象生成默认构造函数(default constructor)、 复制构造函数(copy constructor),赋值操作符(copy assignment operator operator=) 以及解构式(destructor)。另外,C++也为所有的类定义了数个全局运算符(如operator delete及operator new)。当用户有需要时,也可以提供自定义的版本改写上述的函数。
问题在于原先的c++无法精确地控制这些默认函数的生成。 比方说,要让类不能被拷贝,必须将复制构造函数与赋值操作符声明为private,并不去定义它们。 尝试使用这些未定义的函数会导致编译期或连结期的错误。 但这种手法并不是一个理想的解决方案。
此外,编译器产生的默认构造函数与用户定义的构造函数无法同时存在。 若用户定义了任何构造函数,编译器便不会生成默认构造函数; 但有时同时带有上述两者提供的构造函数也是很有用的。 目前并没有显式指定编译器产生默认构造函数的方法。
C++0x 允许显式地表明采用或拒用编译器提供的自带函数。例如要求类带有默认构造函数,可以用以下的语法:
另一方面,也可以禁止编译器自动产生某些函数。如下面的例子,类不可复制:
禁止类以operator new配置存储器:
此种对象只能生成于 stack 中或是当作其他类的成员,它无法直接配置于 heap 之中,除非使用了与平台相关,不可移植的手法。 (使用 placement new 运算符虽然可以在用户自配置的存储器上调用对象构造函数,但在此例中其他形式的 new 运算符一并被上述的定义 屏蔽("name hiding"),所以也不可行。)
= delete的声明(同时也是定义)也能适用于非自带函数, 禁止成员函数以特定的形参调用:
若尝试以 double 的形参调用 f(),将会引发编译期错误, 编译器不会自动将 double 形参转型为 int 再调用f()。 若要彻底的禁止以非int的形参调用f(),可以将= delete与模板相结合:
在 32 位系统上,一个 long long int 是保有至少 64 个有效位的整数类别。 将这个类别引入了标准 C 中,目前大多数的 C++ 编译器也支持这种类别。C++0x 将把这种类别添加到标准 C++ 中。
[] 静态assertionC++提供了两种方法测试assertion(声明):宏assert以及指令#error。但是这两者对于模版来说都不合用。宏在运行期测试assertion,而前处理器指令则在前置处理时测试assertion,这时候模版还未能实例化。所以它们都不适合来测试牵扯到模板实参的相关特性。
新的机能会引进新的方式可以在编译期测试assertion,只要使用新的关键字static_assert。 声明采取以下的形式:
static_assert( constant-expression, error-message ) ;这里有一些如何使用static_assert的例子:
当常数表达式值为false时,编译器会产生相应的错误消息。第一个例子是前处理器指令#error的替代方案;第二个例子会在每个模板类Check生成时检查assertion。
静态assertion在模板之外也是相当有用的。例如,某个算法的实现依赖于long long类别的大小比int还大,这是标准所不保证的。 这种假设在大多数的系统以及编译器上是有效的,但不是全部。
[] 允许sizeof操作符作用在类的数据成员上,无须明确的对象在标准C++,sizeof可以作用在对象以及类别上。但是不能够做以下的事:
这会传回OtherType的大小。C++03并不允许这样做,所以会引发编译错误。C++0x将会允许这种使用。
[] 垃圾回收机制是否会自动回收那些无法被使用到 (unreachable) 的动态分配对象由实现决定。
[] C++标准程序库的变更数个新机能将会引进至 C++0x 标准。其中许多可以在现行标准下实现,而另外一些则依赖于(或多或少)新的 C++0x 核心语言机能。
新的程序库的大部分被定义于 (称TR1),于2005年发布。各式 TR1 的完全或部分实现目前提供在 std::tr1。C++0x 会将其移置于命名空间 std 之下。"However, as TR1 features are brought into the
[] 标准库组件上的升级目前的标准库能受益于 C++0x 新增的一些语言特性。举例来说,对于大部份的标准库容器而言,像是搬移内含大量元素的容器,或是容器之内对元素的搬移,基于右值引用 (Rvalue reference) 的 move 建構子都能優化前述動作。在適當的情況下,標準庫元件將可利用 C++0x 的語言特性進行升級。這些語言特性包含但不局限以下所列:
此外,自 C++ 標準化之後已經過許多年。現有許多代碼利用到了標準庫; 這同時揭露了部份的標準庫可以做些改良。其中之一是標準庫的記憶體配置器 (allocator)。C++0x 將會加入一個基於作用域模型的記憶體配置器來支援現有的模型。
[] 緒程支援雖然 C++0x 將會在語言的定義上提供一個記憶體模型以支援緒程,但緒程的使用主要將以 C++0x 標準函式庫的方式呈現。
C++0x 標準函式庫將會提供類別 thread (std::thread)。若要執行一個緒程,可以建立一個類別 thread 的實體,其初始參數為一個函式物件,以及該函式物件所需要的參數。透過成員函式 std::thread::join() 對緒程會合的支援,一個緒程可以暫停直到其它緒程執行完畢。若有底層平台支援,成員函式 std::thread::native_handle() 將可提供對原生緒程物件執行平台特定的操作。
對於緒程間的同步,標準函式庫將會提供適當的互斥鎖 (像是 std::mutex,std::recursive_mutex 等等) 和條件變數 (std::condition_variable 和 std::condition_variable_any)。前述同步機制將會以 RAII 鎖 (std::lock_guard 和 std::unique_lock) 和鎖相關演算法的方式呈現,以方便程式員使用。
對於要求高效能,或是極底層的工作,有時或甚至是必須的,我們希望緒程間的通訊能避免互斥鎖使用上的開銷。以原子操作來存取記憶體可以達成此目的。針對不同情況,我們可以透過顯性的記憶體屏障改變該存取記憶體動作的可見性。
對於緒程間非同步的傳輸,C++0x 標準函式庫加入了 以及 std::packaged_task 用來包裝一個會傳回非同步結果的函式呼叫。 因為缺少結合數個 future 的功能,和無法判定一組 promise 集合中的某一個 promise 是否完成,futures 此一提案因此而受到了批評。
更高級的緒程支援,如緒程池,已經決定留待在未來的 Technical Report 加入此類支援。更高級的緒程支援不會是 C++0x 的一部份,但設想是其最終實現將建立在目前已有的緒程支援之上。
std::async 提供了一個簡便方法以用來執行緒程,並將緒程綁定在 std::future。使用者可以選擇一個工作是要多個緒程上非同步的執行,或是在一個緒程上執行並等待其所需要的資料。預設的情況,實作可以根據底層硬體選擇前面兩個選項的其中之一。另外在較簡單的使用情形下,實作也可以利用緒程池提供支援。
[] 多元組型別是一個內由數個異質物件以特定順序排列而成的資料結構。多元組可被視為是 struct 其資料成員的一般化。
由 TR1 演進而來的 C++0x 多元組型別將受益於 C++0x 某些特色像是。TR1 版本的多元組型別對所能容納的物件個數會因實作而有所限制,且實作上需要用到大量的巨集技巧。相反的,C++0x 版本的多元組型基本上於對其能容納的物件個數沒有限制。然而,編譯器對於模板實體化的遞迴深度上的限制仍舊影響了元組型別所能容納的物件個數 (這是無法避免的情況); C++0x 版本的多元組型不會把這個值讓使用者知道。
使用,多元組型別的宣告可以長得像下面這樣:
底下是一個多元組型別的定義和使用情況:
我們可以定義一個多元組型別物件 proof 而不指定其內容,前提是 proof 裡的元素其型別定義了預設建構子 (default constructor)。此外,以一個多元組型別物件賦值給另一個多元組型別物件是可能的,但只有在以下情況: 若這兩個多元組型別相同,則其內含的每一個元素其型別都要定義拷貝建構子 (copy constructor); 否則的話,賦值操作符右邊的多元組其內含元素的型別必須能轉換成左邊的多元組其對應的元素型別,又或者賦值操作符左邊的多元組其內含元素的型別必須定義適 當的建構子。
多元組類型物件的比較運算是可行的 (當它們擁有同樣數量的元素)。此外,C++0x 提供兩個表達式用來檢查多元組類型的一些特性 (僅在編譯期做此檢查)。
在过去,不断有要求想将散列表(无序关系式容器)引进标准库。只因为时间上的限制,散列表才没有被标准库所采纳。虽然,散列表在最糟情况下(如果出现许多冲突 (collision) 的话)在性能上比不过平衡树。但实际运用上,散列表的表现则较佳。
因为标准委员会还看不到有任何机会能将开放寻址法标准化,所以目前冲突仅能通过 的方式处理。为避免与第三方库发展的散列表发生名称上的冲突,前缀将采用 unordered 而非 hash。
库将引进四种散列表,其中差别在于底下两个特性: 是否接受具相同键值的项目 (Equivalent keys),以及是否会将键值映射到相对应的数据 (Associated values)。
散列表类型 | 有无关系值 | 接受相同键值 |
---|---|---|
std::unordered_set | 否 | 否 |
std::unordered_multiset | 否 | 是 |
std::unordered_map | 是 | 否 |
std::unordered_multimap | 是 | 是 |
上述的类将满足对一个容器类的要求,同时也提供访问其中元素的成员函数: insert, erase, begin, end。
散列表不需要对现有核心语言做扩展(虽然,散列表的实现将会利用到 C++0x 新的语言特性),只会对头文件
过去许多或多或少标准化的程序库被创建用来处理。有鉴于这些算法的使用非常普遍,因此标准程序库将会包含他们,并使用各种的潜力。
这个新的程序库,被定义于
函数 regex_search 是用来搜索样式; 若要搜索并取代,则要使用函数 regex_replace,该函数会回传一个新的字符串。算法regex_search 和 regex_replace 接受一个正则表达式(样式)和一个字符串,并将该样式匹配的情况存储在 struct match_results。
底下描述了 match_results 的使用情况:
注意双反斜线的使用,因为 C++ 将反斜线作为跳脱字符使用。但 C++0x 的可以用来避免此一问题。库
这些指针是由 TR1 智能指针演变而来。注意! 智能指针是类而非一般指针。
shared_ptr 是一引用計數 (reference-counted) 指針,其行為與一般 C++ 指針即為相似。在 TR1 的實作中,缺少了一些一般指針所擁有的特色,像是別名或是指針運算。C++0x 會將加進前述特色。
一個 shared_ptr 只有在已經沒有任何其它 shared_ptr 指向其原本所指向物件時,才會銷毀該物件。
一個 weak_ptr 指向的是一個被 shared_ptr 所指向的物件。該 weak_ptr 可以用來決定該物件是否已被銷毀。weak_ptr 不能被解參考; 想要存取其內部所保存的指針,只能透過 shared_ptr。有兩種方法可達成此目的。第一,類別 shared_ptr 有一個以 weak_ptr 為參數的建構子。第二,類別 weak_ptr 有一個名為 lock 的成員函式,其返回值為一個 shared_ptr。weak_ptr 並不擁有它所指向的物件,因此不影響該物件的銷毀與否。
底下是一個 shared_ptr 的使用範例:
auto_ptr 将会被 C++ 标准所废弃,取而代之的是 unique_ptr。 unique_ptr 提供 auto_ptr 大部份特性,唯一的例外是 auto_ptr 的不安全、隱性的左值搬移。不像 auto_ptr,unique_ptr 可以存放在 C++0x 提出的那些能察觉搬移动作的容器之中。
[] 可扩展的随机数功能C 标准库允许使用rand函数来生成。不过其算法则取决于各程序库开法者。 C++ 直接从 C 继承了这部份,但是 C++0x 将会提供产生伪乱数的新方法。
C++0x 的随机数功能分为两部分: 第一,一个乱数生成引擎,其中包含该生成引擎的状态,用来产生乱数。第二,一个分布,这可以用来决定产生乱数的范围,也可以决定以何种分布方式产生乱数。乱数生成对象即是由乱数生成引擎和分布所构成。
不同于 C 标准库的 rand; 針對產生亂數的機制,C++0x 將會提供三種演算法,每一種演算法都有其強項和弱項:
樣板類 | 整數/浮點數 | 品質 | 速度 | 狀態數* |
---|---|---|---|---|
linear_congruential | 整數 | 低 | 中等 | 1 |
subtract_with_carry | 兩者皆可 | 中等 | 快 | 25 |
mersenne_twister | 整數 | 佳 | 快 | 624 |
C++0x 將會提供一些標準分布: uniform_int_distribution (),bernoulli_distribution (),geometric_distribution (), poisson_distribution (),binomial_distribution (),uniform_real_distribution (), exponential_distribution (),normal_distribution () 和 gamma_distribution ()。
底下描述一個亂數生成物件如何由亂數生成引擎和分布構成:
我們可以透過實體化樣板類 reference_wrapper 得到一個包装引用 (wrapper reference)。包装引用類似於一般的引用。對於任意物件,我們可以透過模板類 ref 得到一個包装引用 (至於 constant reference 則可透過 cref 得到)。
當樣板函式需要形參的引用而非其拷貝,這時包装引用就能派上用場:
這項功能將加入標頭檔
针对函数对象的多态包装器(又称多态函数对象包装器)在语义和语法上和函数指针相似,但不像函数指针那么狭隘。只要能被调用,且其实参能与包装器兼容的都能以多态函数对象包装器称之(函数指针,成员函数指针或仿函数)。
通过以下例子,我们可以了解多态函数对象包装器的特性:
模板类 function 将定义在头文件
对于那些能自行创建或修改本身或其它程序的程序,我们称之为。这种行为可以发生在编译或运行期。C++ 标准委员会已经决定引进一组由实现的库,程序员可利用此一库于编译期进行元编程。
底下是一个以元编程来计算指数的例子:
许多算法能作用在不同的数据类别; C++ 模板支持,这使得代码能更紧凑和有用。然而,算法经常会需要目前作用的数据类别的信息。这种信息可以通过类别属性 (type traits) 於模板實體化時將該資訊萃取出來。
型別屬性能識別一個物件的種類和有關一個型別 (class) (或 struct) 的特徵。標頭檔
底下的例子说明了模板函数‘elaborate’是如何根据给定的数据类别,从而实体化某一特定的算法 (algorithm.do_it)。
通过定义在
此种编程技巧能写出优美、简洁的代码; 然而除错是此种编程技巧的弱处: 编译期的错误消息让人不知所云,运行期的除错更是困难。
[] 用于计算函数对象返回类型的统一方法要在编译期决定一个样板仿函数的回返值类别并不容易,特别是当回返值依赖于函数的实参时。举例来说:
实体化样板类 Calculus
企图实体化样板类 Calculus
模板 std::result_of 被TR1 引进且被 C++0x 所采纳,可允许我们决定和使用一个仿函数其回返值的类别。底下,CalculusVer2 对象使用 std::result_of 对象来推导其仿函数的回返值类别:
如此一来,在实体化 CalculusVer2
模板 std::result_of 在 TR1 和 C++0x 有一点不同。TR1 的版本允许实现在特殊情况下,可以无法决定一个函数调用其回返值类别。然而,因为 C++0x 支持了,实现被要求在所有情况下,皆能计算出回返值类别。
[] 已被移除或是不包含在 C++0x 标准的特色预计由 Technical Report 提供支持:
延后讨论: