条款6:当auto推导出非预期类型时应当使用显式的类型初始化
===============================================
条款5解释了使用`auto`关键字去声明变量,这样就比直接显示声明类型提供了一系列的技术优势,但是有时候`auto`的类型推导会和你想的南辕北辙。举一个例子,假设我有一个函数接受一个`Widget`返回一个`std::vector<bool>`,其中每个`bool`表征`Widget`是否接受一个特定的特性:
```cpp
std::vector<bool> features(const Widget& w);
```
进一步的,假设第五个bit表示`Widget`是否有高优先级。我们可以这样写代码:
```cpp
Widget w;
…
bool highPriority = features(w)[5]; // w是不是个高优先级的?
…
processWidget(w, highPriority); // 配合优先级处理w
```
这份代码没有任何问题。它工作正常。但是如果我们做一个看起来无伤大雅的修改,把`highPriority`的显式的类型换成`auto`:
```cpp
auto highPriority = features(w)[5]; // w是不是个高优先级的?
```
情况变了。所有的代码还是可以编译,但是他的行为变得不可预测:
```cpp
processWidget(w, highPriority); // 未定义行为
```
正如注释中所提到的,调用`processWidget`现在会导致未定义的行为。但是为什么呢?答案是非常的令人惊讶的。在使用`auto`的代码中,`highPriority`的类型已经不是`bool`了。尽管`std::vector<bool>`从概念上说是`bool`的容器,对`std::vector<bool>`的`operator[]`运算符并不一定是返回容器中的元素的引用(`std::vector::operator[]`对所有的类型都返回引用,就是除了`bool`)。事实上,他返回的是一个`std::vector<bool>::reference`对象(是一个在`std::vector<bool>`中内嵌的class)。
`std::vector<bool>::reference`存在是因为`std::vector<bool>`是对`bool`数据封装的模板特化,一个bit对应一个`bool`。这就给`std::vector::operator[]`带来了问题,因为`std::vector<T>`的`operator[]`应该返回一个`T&`,但是C++禁止bits的引用。没办法返回一个`bool&`,`std::vector<T>`的`operator[]`于是就返回了一个行为上和`bool&`相似的对象。想要这种行为成功,`std::vector<bool>::reference`对象必须能在`bool&`的能处的语境中使用。在`std::vector<bool>::reference`对象的特性中,是他隐式的转换成`bool`才使得这种操作得以成功。(不是转换成`bool&`,而是`bool`。去解释详细的`std::vector<bool>::reference`对象如何模拟一个`bool&`的行为有有些偏离主题,所以我们就只是简单的提一下这种隐式转换只是这种技术中的一部。)
在大脑中带上这种信息,再次阅读原先的代码:
```cpp
bool highPriority = features(w)[5]; // 直接显示highPriority的类型
```
这里,`features`返回了一个`std::vector<bool>`对象,在这里`operator[]`被调用。`operator[]`返回一个`std::vector<bool>::reference`对象,这个然后隐式的转换成`highPriority`需要用来初始化的`bool`类型。于是就以`features`返回的`std::vector<bool>`的第五个bit的数值来结束`highPriority`的数值,这也是我们所预期的。
和使用`auto`的`highPriority`声明进行对比:
```cpp
auto highPriority = features(w)[5]; // 推导highPriority的类型
```
这次,`features`返回一个`std::vector<bool>`对象,而且,`operator[]`再次被调用。`operator[]`继续返回一个`std::vector<bool>::reference`对象,但是现在有一个变化,因为`auto`推导`highPriority`的类型。`highPriority`根本并没有`features`返回的`std::vector<bool>`的第五个bit的数值。
数值和`std::vector<bool>::reference`是如何实现的是有关系的。一种实现是这样的对象包含一个指向包含bit引用的机器word的指针,在word上面加上偏移。考虑这个对`highPriority`的初始化的意义,假设`std::vector<bool>::reference`的实现是恰当的。
调用`features`会返回一个临时的`std::vector<bool>`对象。这个对象是没有名字的,但是对于这个讨论的目的,我会把它叫做`temp`,`operator[]`是在`temp`上调用的,`std::vector<bool>::reference`返回一个由`temp`管理的包含一个指向一个包含bits的数据结构的指针,在word上面加上偏移定位到第五个bit。`highPriority`也是一个`std::vector<bool>::reference`对象的一份拷贝,所以`highPriority`也在`temp`中包含一个指向word的指针,加上偏移定位到第五个bit。在这个声明的结尾,`temp`被销毁,因为它是个临时对象。因此,`highPriority`包含一个野指针,这也就是调用`processWidget`会造成未定义的行为的原因:
```cpp
processWidget(w, highPriority); // 未定义的行为,highPriority包含野指针
```
`std::vector<bool>::reference`是代理类的一个例子:一个类的存在是为了模拟和对外行为和另外一个类保持一致。代理类在各种各样的目的上被使用。`std::vector<bool>::reference`的存在是为了提供一个对`std::vector<bool>`的`operator[]`的错觉,让它返回一个对bit的引用,而且标准库的智能指针类型(参考第4章)也是一些对托管的资源的代理类,使得他们的资源管理类似于原始指针。代理类的功能是良好确定的。事实上,“代理”模式是软件设计模式中的最坚挺的成员之一。
一些代理类被设计用来隔离用户。这就是`std::shared_ptr`和`std::unique_ptr`的情况。另外一些代理类是为了一些或多或少的不可见性。`std::vector<bool>::reference`就是这样一个“不可见”的代理,和他类似的是`std::bitset`,对应的是`std::bitset::reference`。
同时在一些C++库里面的类存在一种被称作表达式模板的技术。这些库最开始是为了提高数值运算的效率。提供一个`Matrix`类和`Matrix`对象`m1, m2, m3 and m4`,举一个例子,下面的表达式:
```cpp
Matrix sum = m1 + m2 + m3 + m4;
```
可以计算的更快如果`Matrix`的`operator+`返回一个结果的代理而不是结果本身。这是因为,对于两个`Matrix`,`operator+`可能返回一个类似于`Sum<Matrix, Matrix>`的代理类而不是一个`Matrix`对象。和`std::vector<bool>::reference`一样,这里会有一个隐式的从代理类到`Matrix`的转换,这个可能允许`sum`从由`=`右边的表达式产生的代理对象进行初始化。(其中的对象可能会编码整个初始化表达式,也就是,变成一种类似于`Sum<Sum<Sum<Matrix, Matrix>, Matrix>, Matrix>`的类型。这是一个客户端需要屏蔽的类型。)
作为一个通用的法则,“不可见”的代理类不能和`auto`愉快的玩耍。这种类常常它的生命周期不会被设计成超过一个单个的语句,所以创造这样的类型的变量是会违反库的设计假定。这就是`std::vector<bool>::reference`的情况,而且我们可以看到这种违背约定的做法会导致未定义的行为。
因此你要避免使用下面的代码的形式:
```cpp
auto someVar = expression of "invisible" proxy class type;
```
但是你怎么能知道代理类被使用呢?软件使用它们的时候并不可能会告知它们的存在。它们是不可见的,至少在概念上!一旦你发现了他们,难道你就必须放弃使用`auto`加之条款5所声明的`auto`的各种好处吗?
我们先看看怎么解决如何发现它们的问题。尽管“不可见”的代理类被设计用来fly beneath programmer radar in day-to-day use,库使用它们的时候常常会撰写关于它们的文档来解释为什么这样做。你对你所使用的库的基础设计理念越熟悉,你就越不可能在这些库中被代理的使用搞得狼狈不堪。
当文档不够用的时候,头文件可以弥补空缺。很少有源码封装一个完全的代理类。它们常常从一些客户调用者期望调用的函数返回,所有函数签名常常可以表征它们的存在。这里是`std::vector<bool>::operator[]`的例子:
```cpp
namespace std { // from C++ Standards
template <class Allocator>
class vector<bool, Allocator> {
public:
…
class reference { … };
reference operator[](size_type n);
…
};
}
```
假设你知道对`std::vector<T>`的`operator[]`常常返回一个`T&`,在这个例子中的这种非常规的`operator[]`的返回类型一般就表征了代理类的使用。在你正在使用的这些接口之上加以关注常常可以发现代理类的存在。
在实践上,很多的开发者只会在尝试修复一些奇怪的编译问题或者是调试一些错误的单元测试结果中发现代理类的使用。不管你是如何发现它们,一旦`auto`被决定作为推导代理类的类型而不是它被代理的类型,它就不需要涉及到关于`auto`,`auto`自己本身没有问题。问题在于`auto`推导的类型不是所想让它推导出来的类型。解决方案就是强制一个不同的类型推导。我把这种方法叫做显式的类型初始化原则。
显式的类型初始化原则涉及到使用`auto`声明一个变量,但是转换初始化表达式到`auto`想要的类型。下面就是一个强制`highPriority`类型是`bool`的例子:
```cpp
auto highPriority = static_cast<bool>(features(w)[5]);
```
这里,`features(w)[5]`还是返回一个`std::vector<bool>::reference`的对象,就和它经常的表现一样,但是强制类型转换改变了表达式的类型成为`bool`,然后`auto`才推导其作为`highPriority`的类型。在运行的时候,从`std::vector<bool>::operator[]`返回的`std::vector<bool>::reference`对象支持执行转换到`bool`的行为,作为转换的一部分,从`features`返回的任然存活的指向`std::vector<bool>`的指针被间接引用。这样就在运行的开始避免了未定义行为。索引5然后放置在bits指针的偏移上,然后暴露的`bool`就作为`highPriority`的初始化数值。
针对于`Matrix`的例子,显示的类型初始化原则可能会看起来是这样的:
```cpp
auto sum = static_cast<Matrix>(m1 + m2 + m3 + m4);
```
关于这个原则下面的程序并不禁止初始化但是要排除代理类类型。强调你要谨慎地创建一个类型的变量,它和从初始化表达式生成的类型是不同的也是有帮助意义的。举一个例子,假设你有一个函数去计算一些方差:
```cpp
double calcEpsilon(); // 返回方差
```
`calcEpsilon`明确的返回一个`double`,但是假设你知道你的程序,`float`的精度就够了的时候,而且你要关注`double`和`float`的长度的区别。你可以声明一个`float`变量去存储`calcEpsilon`的结果:
```cpp
float ep = calcEpsilon(); // 隐式转换double到float
```
但是这个会很难表明“我故意减小函数返回值的精度”,一个使用显式的类型初始化原则是这样做的:
```cpp
auto ep = static_cast<float>(calcEpsilon());
```
- 出版者的忠告
- 致谢
- 简介
- 第一章 类型推导
- 条款1:理解模板类型推导
- 条款2:理解auto类型推导
- 条款3:理解decltype
- 条款4:知道如何查看类型推导
- 第二章 auto关键字
- 条款5:优先使用auto而非显式类型声明
- 条款6:当auto推导出非预期类型时应当使用显式的类型初始化
- 第三章 使用现代C++
- 条款7:创建对象时区分()和{}
- 条款8:优先使用nullptr而不是0或者NULL
- 条款9:优先使用声明别名而不是typedef
- 条款10:优先使用作用域限制的enmu而不是无作用域的enum
- 条款11:优先使用delete关键字删除函数而不是private却又不实现的函数
- 条款12:使用override关键字声明覆盖的函数
- 条款13:优先使用const_iterator而不是iterator
- 条款14:使用noexcept修饰不想抛出异常的函数
- 条款15:尽可能的使用constexpr
- 条款16:保证const成员函数线程安全
- 条款17:理解特殊成员函数的生成
- 第四章 智能指针
- 条款18:使用std::unique_ptr管理独占资源
- 条款19:使用std::shared_ptr管理共享资源
- 条款20:在std::shared_ptr类似指针可以悬挂时使用std::weak_ptr
- 条款21:优先使用std::make_unique和std::make_shared而不是直接使用new
- 条款22:当使用Pimpl的时候在实现文件中定义特殊的成员函数
- 第五章 右值引用、移动语义和完美转发
- 条款23:理解std::move和std::forward
- 条款24:区分通用引用和右值引用
- 条款25:在右值引用上使用std::move 在通用引用上使用std::forward
- 条款26:避免在通用引用上重定义函数
- 条款27:熟悉通用引用上重定义函数的其他选择
- 条款28:理解引用折叠
- 条款29:假定移动操作不存在,不廉价,不使用
- 条款30:熟悉完美转发和失败的情况
- 第六章 Lambda表达式
- 条款31:避免默认的参数捕捉
- 条款32:使用init捕捉来移动对象到闭包
- 条款33:在auto&&参数上使用decltype当std::forward auto&&参数
- 条款34:优先使用lambda而不是std::bind
- 第七章 并发API
- 条款35:优先使用task-based而不是thread-based
- 条款36:当异步是必要的时声明std::launch::async
- 条款37:使得std::thread在所有的路径下无法join
- 条款38:注意线程句柄析构的行为
- 条款39:考虑在一次性事件通信上void的特性
- 条款40:在并发时使用std::atomic 在特殊内存上使用volatile
- 第八章 改进
- 条款41:考虑对拷贝参数按值传递移动廉价,那就尽量拷贝
- 条款42:考虑使用emplace代替insert