C++ 异常 - 智能指针

April 8, 2022. A Friday

字数统计：3101 blog

之前的文章C++ 异常 - 类和异常讲述了 C++ 的异常机制，但是单纯学会异常处理的概念和语法是完全不够用的，大部分人对于异常的了解就止步于此了。认识的不足会导致对异常存在非常大的误解。本文从异常出发，讲述如何使用 C++11 引入的 std::unique_ptr 和 std::shared_ptr 两种智能指针如何解决一部分的异常安全问题。

智能指针基础

`std::unique_ptr`

顾名思义，std::unique_ptr 是一种独占所有权的指针容器，实际上就是一个异常安全的 Handle 类模板，独占效果实际上是使用移动来实现的。

由于 std::unique 具有有副作用的析构函数，所以可以保证发生异常时资源不泄露：

之前的文章 C++ 异常 - 类和异常提到了异常导致内存泄漏放的一个案例：

void foo(){
    int* a = new int{}; // 此对象在诱因发生时出现内存泄漏
    int* b = new int{};// 内存泄漏诱因
    delete a; // 若b的内存分配失败，则此语句不会被执行
    delete b;
}

而使用 std::unique_ptr 则不会发生内存泄漏：

#include<memory>

void foo(){
    std::unique_ptr<int> a(new int(5));
    std::unique_ptr<int> b(new int(6));
}

此时若 b 的构造抛出异常，则 a 能够被析构，也就没有内存泄漏。

std::unique_ptr 还能自定义删除器（默认使用 operator delete）：

void foo(){
    std::unique_ptr<int, void(*)(int*)> int_ptr(new int(1), [](int* p) {
        delete p;
    });
}

#include<functional>

void foo(){
    std::unique_ptr<int, std::function<void(int*)>> int_ptr(new int(1), [](int* p) {
        delete p;
    });
}

void(int*) 是一个函数类型，void(*)(int*) 是函数指针。

std::function 可以将一个函数类型包装成一个函数指针。

其中 void 是返回值，由于 unique_ptr 的删除器是放在析构函数里运行的，所以返回值无意义； int* 是函数参数，表示删除器接受一个 int 的指针。

此处使用了 lambda 作为删除器，[](int* p) { delete p; } 这个 lambda 能转换为函数类型为 void(int*) 的函数。

此前我们提到过，如果要保证异常安全，就不要在函数内使用 new，应该使用 std::unique_ptr。

std::unique_ptr 不能拷贝，只能移动：

void foo(){
    std::unique_ptr<int> ptr1(new int(5));
    // std::unique_ptr<int> ptr2 = ptr1; 拷贝构造和拷贝赋值被删除
    std::unique_ptr<int> ptr2 = std::move(ptr1); // 可以移动构造和移动赋值
}

可以以值或者右值引用的 std::unique_ptr 为参数（作用相同，不过建议使用右值引用，更清晰）：

std::unique_ptr<int> pass_unique(std::unique_ptr<int> p){
    std::cout << *p << std::endl;
    return p;
}

std::unique_ptr<int> pass_unique1(std::unique_ptr<int>&& p){
    std::cout << *p << std::endl;
    return p;
}

void foo(){
    std::unique_ptr<int> p(new int(1));
    auto p1 = pass_unique(std::move(p));
    auto p2 = pass_unique1(std::move(p1)); // 注意，不能两次移动 p
}

std::unique_ptr 也和容器兼容，可以将 std::unique_ptr 放入容器。

基于以上设计，我提出以下两点建议：

如果对象的数据成员复杂，可以使用 unique_ptr 间接管理
如果对象的数据成员简单，可以直接使用移动操作，避免麻烦

注意，就算不使用构造函数，也必须使用 RAII 的思想管理资源，释放操作和构造必须在一个模块内。

`std::shared_ptr`

std::unique_ptr 是独占型指针，且 std::unique_ptr 的实现非常简单，数据成员只有一个指针，若有自定义删除器时额外多一个删除器指针，所以开销非常小，构造和析构过程可以被轻松内联化，优化得当的情况下没有任何开销。但是 std::unique_ptr 在传递后，其原始对象的内容就被移动走了，只能通过返回值二次利用，而不能在原始对象上继续使用，所以编写的自由度上受到一定限制。

于是标准委员会设计了另一种智能指针 std::shared_ptr，顾名思义，是共享型指针。std::shared_ptr 使用引用计数实现，引用计数也是最简单的 GC(Garbage Collection) 算法之一。

引用计数的优点就是简单粗暴，加之 C++ 提供了 std::weak_ptr 作为辅助，很难遇到在其他使用引用计数实现 GC 的语言中的循环引用问题。如果实际需求非常复杂，也可也自行实现标记清除算法的局部 GC。

引用计数的思路非常简单，当指针被拷贝时，引用计数加 1，每次析构的时候不去真正的析构对象，而是将引用计数减 1，当引用计数减为 0 时才析构对象。

std::shared_ptr 的引用计数是线程安全的，但是读写操作不是线程安全的（标准库中大多数涉及到线程安全的模板/对象都如此设计）。

std::shared_ptr 的构造和 std::unique_ptr 类似：

int foo(){
    std::shared_ptr<int> p(new int(10));
}

还可以自定义删除器：

void foo(){
    std::shared_ptr<int, void(*)(int*)> int_ptr(new int(1), [](int* p) {
        delete p;
    });
}

但是由于 std::shared_ptr 内部的计数器和其他成员也在自由储存区中分配，所以如果自己去使用 new 申请内存，会有第二次动态内存分配，效率降低，最佳实践是使用 std::make_shared：

void foo(){
    auto p = std::make_shared<int>(10);
}

std::make_shared 会先申请出足够的内存，再进行 placement new，这样就可以只有一次动态内存分配。

std::shared_ptr 还支持移动拷贝和移动赋值，使用移动的优点是快速，因为不需要增加引用计数，但是需要注意，移动一个 std::shared_ptr 只代表将之前的 std::shared_ptr 让出来。移动一个 std::shared_ptr 和拷贝并无本质区别。

std::shared_ptr 将其他成员放入动态储存区中分配的原因是，其他成员可能包括强引用计数，弱引用计数和分配器（allocator），如果将这些成员放入栈中可能造成过多的栈分配开销（若放入自由储存区则共享这些成员），并且实际上 std::shared_ptr 使用了类型擦除技术，只要指针类型相同，就是相同类型的 std::shared_ptr<T>。

虽然 std::shared_ptr 和 std::unique_ptr 都有针对 C 风格数组的特化版本，但是仍然建议使用 std::array 或者 std::vector。

标准库模板还提供 std::allocate_shared，用于使用自定义的分配器。

异常安全

前面我们提到过，使用 std::unique_ptr 和 std::shared_ptr 能够保证最基础的异常安全（防止 delete 语句的执行被异常破坏），但是仅仅依赖这种性质是不够的，错误的使用 std::unique_ptr 和 std::shared_ptr 仍然可能出现异常安全问题。

std::make_unique

下面愚蠢的代码存在内存泄漏隐患：

foo(std::unique_ptr<X>(new X), std::unique_ptr<Y>(new Y));

这是一个函数调用表达式，问题在于，C++ 没有规定函数调用表达式中，以何种顺序计算调用过程中需要用到的值，所以 new X 和 new Y 可能发生在构造 unique_ptr<X> 之前，因为此时没有 unique_ptr<X> 被构造，所以第二个 new 表达式若抛出异常，则第一个 new 表达式发生内存泄漏。

改进的方法是使用 std::make_unique：

foo(std::make_unique<X>(), std::make_unique<Y>());

由于 std::make_unique 是一个函数调用，所以 C++ 确保一定先构造出一个 unique_ptr<X>，再构造出另一个 unique_ptr<X>。

若第二个 unique_ptr<X> 构造失败，则已经构造的 unique_ptr<X> 可以被自动析构。

所以使用 std::make_unique 起码有三点好处：

避免任何显式的 new
防止愚蠢的内存泄漏
节省一次类型的书写

第三点参考以下代码：

std::unique_ptr<int> a(new int); // 提到了 2 次 int
auto b = std::make_unique<int>(); // 只提到了一次 int
auto c{ std::make_unique<int>() }; // 激进地

对于 int 这种短的名称，似乎写两次还要更短，但这只是障眼法：如果一个类型名比较长，那么书写两次就是额外的负担，而且造成了维护的不便。由于 auto 的存在，使用 std::make_unique 就很轻松了。

`std::make_shared`

std::make_shared 最起码也具有 std::make_unique 的所有优点，对于以下函数调用：

foo(std::shared_ptr<X>(new X), otherfunc());

如果 otherfunc() 抛出了异常，就有可能发生内存泄漏。

为了让读者清楚这些共同的优点，允许我再重复一次：

避免任何显式的 new
防止愚蠢的内存泄漏
节省一次类型的书写
合并两次内存分配，加快速度

如果由于任何一个复杂的原因导致无法使用 std::make_shared，那么 std::shared_ptr 还支持通过 std::unique_ptr 构造：

void foo() {
    auto a = std::make_unique<int>(1);
    std::shared_ptr<int> b(std::move(a));
}

这样就可以避免任何显式的 new，保证异常安全。

参考：

N3588 std::make_unique std::shared_ptr std::unique_ptr C++ Primer 第五版 C++ 程序设计语言第四版