Non-Profit, International

Spirit unsterblich.

One exception to rule them all

字数统计:1354 blog

本文简单讨论了不同高级编程语言如何表达以及处理错误,并介绍了 C++ 中新的解决方案。

不同语言的错误处理

错误如何表达?

不同语言给出了不同答案:

  • 以 C 为代表的错误码或 errno 对象
  • 以 C++ 为代表的异常对象
  • 以 Scala 为代表的“函数式”结果对象

问题:不同库,不同开发者的喜好不一致,使得用户常常需要在不同的错误码和错误对象间转换

如何处理错误:不同开发者给出了不同答案:

  • 完整的保留全部信息
  • 终止程序,避免程序以不正确的状态运行
  • 收缩或者在合适的时机忽略

问题:用户必须写出繁琐的代码(错误和正常的逻辑掺杂)、被迫终止程序(非 bug 情况是不可接受的)、错误的收缩(产生 bug 或者丢失信息)

例子:A 库使用错误类型 A,B 库使用错误类型 B,而 C 库需要在一个函数内调用 A 库和 B 库的函数,如何准确的将 AB 传递给 C 库的调用者?

例子:互联网服务读取 JSON 中的值,当 JSON 中的值可能不合法时,如何编写代码处理?

主流语言都广泛使用以上两种或者三种方式,加上不同开发者存在不同的喜好,使得编写代码时时刻面临抉择

什么是理想的错误处理?

  • 不丢失信息及终止程序
  • 不需要调用者转换错误
  • 不强制调用者处理错误

C++ 异常的问题

  • 允许抛出任何类型,难以确定异常对象含义
  • 异常对象一定需要堆分配(支持跨线程传递),效率低
  • 捕获时类型匹配复杂,效率低

解决方案

标准错误码和错误对象

Niall Douglas 的 C++ 标准提案 status_code and standard error object 1 给出了一种统一的表示方法,旨在解决上述问题:如何表达错误

P1028 的核心设计是 std::status_code 和 std::status_code_domain

status_code 实际持有两个成员,一个是指向 status_domain 对象的指针,一个是 status_domain 中定义的 value_type 类型的错误对象。

status_domain 的作用是提供错误码的元数据以及提供错误之间转换的操作,这些元数据以及转换 API 被实现为虚函数。

status_domain 虽然有虚函数,但 status_domain 的所有特殊成员函数都是平凡的,这意味着 status_domain 满足字面类型的要求,可以有 constexpr 的对象。

每一个 status_code_domain 对象储存一个用户提供的唯一 ID,该 ID 用来区分不同的 domain,通常由随机数生成器生成,该 ID 的类型是不小于 64 位的无符号整数。

在处理错误(捕获时),不同 domain 之间通过该 ID 来识别。

status_code<void> 是不持有错误对象的特化,它持有一个指向 domain 的指针,并且它是平凡的。 template<typename DomainType> status_code<DomainType> 是持有错误码的主模板,它继承 status_code<void> 并额外储存一个 value_type 类型的对象。

Herbceptions

Herb Sutter 在 2018 年的时候提出了一种解决异常性能问题的新异常方案 Herbceptions,该方案保持现有异常的基本结构:throw 以及 try,catch 块,同时简化异常对象的传递以及消除对 RTTI 的依赖。

Herbceptions 的核心方案是以值的形式抛出一个小对象,该对象足够小,小到可以被储存在函数栈中向下传递,使抛出异常后不再依赖复杂的异常对象管理函数管理异常对象。同时,提供一种不需要 RTTI 的手段来区分来自不同库,不同功能的异常,也就是 std::status_code 的最终目的。

status_code 在 Dauglas 的提案中是允许任意大小的,但能用于 Herbceptions 的类型一定满足 value_type 的对象可以被储存到寄存器中,此时满足 Herbceptions 的要求。

在可以预见的未来,会有 3 种 value_type 类型被广泛使用:整数,指针以及 std::exception_ptr。

当 value_type 为整数类型时,代表该类(domain)的错误只表达错误本身,而不需要提供额外的信息,如标准库将提供 status_code<errno> 来表示 POSIX 错误,以及 status_code<DWORD> 来表示 Win32 错误。

当 value_type 为指针类型时,表示该类错误需要携带额外信息,在抛出时,用户负责申请动态内存储存 T 的对象,并将指针储存到 status_code 中。用户在捕获后可获得该指针,并从该指针中提取数据,以及释放内存。

当 value_type 为 std::exception_ptr 时,代表该异常是源自旧 C++ 异常(例如 std::exception),这是过渡方案。

捕获时,首先解引用捕获的期待对象的 domain 对象的指针,然后调用 domain 的比较函数判断期待和目标的 domain 是否相等,如果返回 true,即期待 domain 能处理目标 domain 的错误,进行第二步,判断期待和目标是否表示一个错误,如果是一个错误,那么进入当前 catch 块,如果不等,那么进入下一个 catch 块。

由于判断 domain 是否相等是独立的步骤,因此当一次判断返回 false 时,可以跳过所有期待 domain 是当前期待 domain 的 catch 块。

  1. 之所以叫 status_code 是因为 C++ 11 已经使用了 error_code 


若无特殊声明,本人原创文章以 CC BY-SA 3.0 许可协议 提供。